自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (7)
  • 收藏
  • 关注

原创 Python程序打包

使用PyInstaller将python打包成exe可执行程序。安装PyInstaller: pip install pyinstaller遇到的问题:打包完成后会因为No such file or directionary报错,其原因在于有一些依赖性或自己写的程序里面包含了绝对路径,比如with open XXX as f这种在linux下只能引入绝对路径。解决方法:在PyInstaller安装包下的hook目录中,新建一个hook-xxx.py文件,比如报错的原因在matplotlib,那么

2021-12-15 20:04:04 2010 1

原创 超参数优化

超参数优化,应该是所有机器学习模型都必须要经历的一个过程。很早以前训练模型,比如分类,认为精度达到90%或者自己觉得足够的精度就已经OK,但这其实是远远不够的。在Kaggle比赛中,寻找好的特征是一方面,有最佳的超参数也必不可少。尤其是现在使用集成学习比如随机森林、XGBoost等,超参数对模型的性能影响很大,必须要考虑。超参数优化超参数优化(Hyperparameter Optimization)主要存在两方面的困难:(1)超参数优化是一个组合优化问题,无法像一般参数那样通过梯度下降方法来优化

2021-07-02 22:08:06 5026 3

原创 模型评估

机器学习模型评估通常,我们需要对机器学习模型进行评估,量化其泛化能力,这里分为评估方法和评估指标。评估方法留出法(hold-out)直接将数据集划分为两个互斥的集合,划分时要尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。可以采用“分层采样”(stratified sampling)来保证数据的分布均匀。其次,留出法得到的结果往往不稳定,因此需要重复多次随机划分、独立实验,然后取平均值作为评估结果。交叉验证(cross validation)也是

2021-05-10 23:20:27 351

原创 VASP载流子有效质量计算

VASP载流子有效质量计算在计算完能带之后,可以对载流子(电子+空穴)的有效质量进行计算,考察其光电性质。以Si的能带结构为例,如图所示,其价带顶位于高对称点Gamma处,导带底大约位于X处。由图可知,此时会产生四个方向的载流子迁移:Gamma –> L,Gamma –> K,X –> W,X –> Gamma,因此需要计算这四个方向的电子及空穴载流子的有效质量。其具体计算步骤如下:第一步:准备VPKIT.in文件,其文件内容如下:注释:第1...

2021-04-30 11:13:23 7155 4

原创 VASP计算光学性质

VASP计算光学性质的INCAR是根据HSE06计算的自洽INCAR来改的SCF INCAR:SYSTEM = SystemISTART = 1ICHARG = 1PREC = NormalLREAL = .F.IBRION = -1ISIF = 3NSW = 0#POTIM = 0.5EDIFFG = -0.05ENCUT = 500 eVISPIN = 1NELM = 200EDIFF = 0.1E-04LCHARG = .T.LWAVE = .T.ISMEAR

2021-02-28 14:27:02 10825 4

原创 Shell生成随机数并输出文件对应行

很多时候我们需要生成随机数,且会进一步利用这个随机数处理事情。比如,现在要生成一个随机数A,并继续输出另一个文件的第A行,这个Shell程序如下:#!/bin/bashfunction rand(){ min=$1 max=$(($2-$min+1)) num=$(date +%s%N) echo $(($num%$max+$min))}for i in $( seq 1 NUM)do rnd=$(rand MIN MAX) echo $rnd echo $(s

2020-11-24 18:04:39 678 1

原创 VASP计算HSE06带隙INCAR

VASP-INCAR HSE06杂化泛函计算计算HSE06带隙往往是更精确的,这里提供了5个INCAR,分别是:str-opt,PBE-scf,HSE06-scf, PBE-dos,HSE06-dosstr-optSYSTEM = SystemISTART = 0ICHARG = 2PREC = NormalLREAL = .F.IBRION = 2ISIF = 3NSW = 100POTIM = 0.5EDIFFG = -0.05ENCUT = 500 eVISPIN

2020-10-31 18:14:41 8204 1

原创 SPSS 24安装教程详细步骤

SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,有Windows和Mac OS X等版本。下面是安装的具体步骤。第1步:下载安装包链接:https://pan.baidu.com/s/1dHdEVh3密码:6yl0解压后打开.exe文件进行安装。第2步:准备安装程序第3步:点击下一步

2020-09-03 09:17:46 92001 97

原创 pymatgen生成能带和态密度数据

用VASP计算好能带和态密度后,往往需要拖到windows中利用p4vasp来画图,或者用其导出能带和态密度图,这样做实在太麻烦了。这里介绍用Pymatgen程序生成能带和态密度的矩阵,直接放到origin中。只需要一个python程序,一个KPOINTS,一个vasprun.xml。目录1. 生成能带数据2. 生成态密度数据3. 运行脚本命令1. 生成能带数据import matplotlib.pyplot as pltimport matplotlib as mplmpl.

2020-08-11 20:20:56 2933

原创 变分自编码器VAE代码

VAE更倾向于数据生成。当我们训练好了decoder,就可以从标准正态分布生成数据作为解码器的输入,来生成类似但不同于训练数据的新样本,作用类似GAN,用来降维、生成数据。1.训练代码import kerasimport numpy as npfrom sklearn.preprocessing import StandardScalerfrom sklearn.preprocessing import MinMaxScalerimport numpy as npimport pan

2020-07-12 09:48:46 1437 5

原创 pymatgen读/写各种文件

pymatgen读/写各种文件1. pymatgen读取json文件,转化为Structure对象,并保存为CIF文件from pymatgen import Structure, Lattice, MPRester, Moleculeimport jsonfrom pymatgen.io.cif import CifWriter# 如果只有一个结构#data_file = open("../db-1.json", "r")#all_structures = data_file.re

2020-06-23 21:29:38 6610

原创 linux常用快捷命令(不断更新)

平常经常会用到一些linux下的小命令,这里就整理一下,以后会经常更新此贴。1. 给所有文件名加前缀for f in * ; do mv -- "$f" "XXX_$f" ; done2. 统计文件及子目录下文件的个数ls -lR | grep "^-" | wc -l3. 统计文件的个数ls -l | grep "^-" | wc -l4. 统计目录的个数ls -l | grep "^d" | wc -l5. vi中去点^M:1, $s/^M//g (^

2020-05-27 22:22:59 264

原创 pymatgen绘制能带态密度图(band+DOS)

现在做材料数据挖掘都应该用Pymatgen了吧,功能十分强大。我才刚入门,做做笔记。pymatgen是一个API包,可以连接materials project进行高通量计算。现在我用pymatgen画一下能带+DOS图,炒鸡好看。安装请见https://pypi.org/project/pymatgen/前提是需要有vasprun.xml,这是VASP运行时就会生成的文件,小程序:import matplotlib.pyplot as pltimport matplotlib as mpl

2020-05-24 21:26:41 16217 36

原创 sklearn解决回归问题

这里只是大致统计一下利用sklearn做回归的方法选择, 后续进行案例分析。方法:# 线性回归from sklearn.linear_model import LinearRegressionlinear_regression = LinearRegression()# 决策树回归from sklearn import treedecision_tree_regression...

2020-04-29 15:19:58 1091

原创 Amber计算MM能量

如果是需要计算蛋白质等体系的MM能量,不需要进行结构优化,即单点MM能量,在隐式环境中的输入脚本为:energy minimization &cntrl imin=1, ntb=0, maxcyc=1, cut=9999.0, /然后运行命令:sander -O -i min.in -o md1.out -p prmtop -c inpcrd1m...

2020-03-24 18:23:44 1158

原创 贝叶斯优化-matlab

当我们遇到的一个最优化问题,但是目标函数不知道,或者说目标函数是类似于黑盒子,很难用数学公式/程序写出来时,此时想要求得目标函数的极值,可以使用贝叶斯优化,其主要的适用的情景是维数不超过20维,目标是一个具体的数值时。这样的情景有很多,比如:我们想知道神经网络多少层、每层多少个节点时误差最小;支持向量机的数据集如何划分时交叉验证损失最小……这些就是超参数优化问题了。贝叶斯优化的...

2020-02-29 16:13:28 10171 1

原创 Discovery studio画蛋白质构象叠合图

1. 准备数据打开DS软件,对于一个蛋白质,这里使用三个不同的构象作为例子。2. 将蛋白质文件拖到DS中一定要把所有的蛋白质拖到同一个窗口中,不然不会显示在一起。Chart --- Ramachandran Plot可以画蛋白质拉式图,横坐标为phi,纵坐标为psi,分别对应与氨基酸单元的两个二面角(C-N-Cα-C)和(N-Cα-C-N)。对于第一个蛋白质...

2019-12-30 22:16:30 4028 6

原创 origin画密度直方分布图

这次介绍一下origin画直方分布图,以数据密度(频数)为Y轴1.数据准备这里有1000个数据,范围是-15到15用origin做出来的图像是2.设定样本的记录点另取一列,选择后1.0为步长,按升序从-15到153.选中Y,点击Statistics——Descriptive Statistics——Frequency Counts...在弹出...

2019-11-17 19:57:23 19862 1

原创 Amber18安装(非root用户)

这篇博客说一下动力学软件Amber18的安装方法,虽然只有几个步骤,但是过程还是比较周折的,安装过程中容易报错。1. 两个安装包Amber18.tar.bz2和AmberTools18.tar.bz2对这两个安装包解压:tar xjf Amber18.tar.bz2tar xjf AmberTools18.tar.bz2运行完成后,会在目录下生成amber18这个目...

2019-10-23 18:41:41 8161 5

原创 高斯混合模型GMM

这周突发兴致,拿起“西瓜书”啃了啃,没按照书上的目录来,结合目前正在做的,看到了高斯混合模型(Gaussian mixture model——GMM)。这个模型与原型聚类稍有区别,是采用概率模型来聚类。1.高斯分布既然有“高斯”两字,那就跟高斯分布有关吧~然而我连概率密度表达式都记不太清了,赶紧复习一下!一元高斯分布:多元高斯分布:我使用的是多元高斯分布,是均值...

2019-07-12 14:56:26 2290 1

原创 rdkit入门

Python中的RDkit包,是将化学与机器学习联系起来的、非常实用的库。可以在很多种化学文件如mol2,mol,Smiles,sdf等之间互相转化,并能将其展示成2D、3D等形式供开发人员使用。1.生成描述:2D分子from rdkit.Chem import AllChemimport rdkit.Chemfrom rdkit.Chem import Drawtempla...

2019-06-26 20:31:40 8412 6

原创 bazel源码编译Tensorflow

因为研究需求,要从Tensorflow源码编译libtensorflow_cc.so和libtensorflow_framwork.so两个库,工具是bazel。编译硬件需求:GCC4.8以上,bazel0.10.0以上,tensorflow r1.8。我的硬件需求:GCC7.3.0,bazel0.15.0,tensorflow r1.8。GCC安装就不用说了,一般Linux自带,gc...

2019-05-11 10:48:03 5172

原创 Factorization Machine

Factorization Machine1.训练模型# coding:UTF-8'''Date:20180426@author: zhilongwang'''import numpy as npfrom random import normalvariate # 正态分布def loadDataSet(data): '''导入训练数据 in...

2019-04-26 19:48:48 271

原创 Logistic Regression

Logistic Regression又称逻辑回归,分类算法中的二分类算法,属于监督学习的范畴,算法复杂度低。1.模型Logistic Regression模型是广义线性模型的一种,属于线性的分类模型。找到一条直线,将两类区分开来,这样的直线成为超平面。可以用线性函数来表示:其中,是权重,是偏置。在多维的情况下,它们都是向量。在算法中,还要用到阈值函数,一般这里用到的sig...

2019-03-30 15:57:31 591

原创 Materials Studio 做分子动力学MD(CO2为例)

1.新建CO2模型(1)首先在MS中新建一个项目,命名为MD,然后把CO2的.pdb文件拖进来,.pdb文件可以根据GaussianView得到,百度也搜得到。(2)然后建立块体。点击Modules➡Amorphous Cell➡Calculation。如图所示。(3)选择块体的大小,输入分子的个数,其他参数可以再具体设置。如图所示。(4)运行出来后出现下图所示的界...

2018-12-09 17:32:16 27512 4

原创 Keras搭建模型

同时训练两个网络“同时”!我的第一想法是用最底层的C / C ++编程实现神经网络。后来,在微信公众号上搜到了keras融合层!合并,真是太惊奇!可是大家不要使用合并,因为这个keras已经不支持了的赶脚。好了,上代码了。敲黑板!import kerasimport numpy as npfrom keras.utils import plot_modelimport matplo...

2018-11-24 19:04:11 1809 1

原创 水分子势能曲线

GaussianView5.0+Gaussian09,不得不说,这两个软件简直就是量化计算的神器!但是网上提供的教程并不多,一些专业知识我也是刚刚从论文中获得的。我现在用到了就是通过GaussianView5.0绘制分子结构,调整分子结构,编写脚本程序,扔到Gaussian软件中算。Step1:画分子初始结构在GaussianView软件中绘制水分子结构,百度有一些教程,首先选择成键的...

2018-10-20 17:10:33 3282

原创 GaussianView5对分子结构.gjf文件的解读

第一,在GaussianView中绘制了一个C02的分子,如图所示。第二,按下Ctrl+S后,保存为.gjf文件。第三,在GaussianView界面,Result3→View File,.gjf会被打开。第四,解读该文件:     ...

2018-10-20 14:09:04 5753

原创 数模有感

数模之旅考虑了很久,还是打算写一下这一段宝贵的经历——大学数模旅程。要说数学建模,那就从大一说起咯~军训结束社团招新时我就看到过,认为这是高智商同学“玩”的,不适合我,所以只是擦肩而过。再次听到数学建模是在高等数学课堂上,高数老师在课堂上用wolframalpha软件画了一个函数的图像,至于什么图像,我真想不起来了。。。然后老师说,要参加数学建模的同学要学很多数学软件,要学的东西很多...

2018-04-25 16:56:46 2170 6

原创 K-means聚类算法和模糊C-means聚类算法

K-means聚类算法和模糊C-means聚类算法1.K-means聚类算法K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。...

2018-02-05 21:16:47 41150 10

原创 多目标线性规划求解方法及matlab实现

求解多目标线性规划的基本思想是将多目标转化为单目标,常见的方法有理想点法、线性加权法、最大最小法、目标规划法、模糊数学解法等。这里就这几种方法进行举例说明,并用matlab实现。一、多目标线性规划模型多目标线性规划模型是有两个或两个以上的目标函数,且所有的目标函数和约束条件都是线性的,数学模型表示为:我们记则上述目标规划可简化为:...

2018-01-21 14:51:02 92284 8

原创 SPSS因子分析案例

一、SPSS中的因子分析。具体操作步骤:(1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7—农村用电量。(2)导入数据:file-open-data(3)变量标准化Analyze-Descriptive

2018-01-14 20:43:40 88759 22

原创 JAVA连接SQL Server数据库的端口配置操作步骤

首先,在连接数据库之前必须保证SQL Server 2012是采用SQL Server身份验证方式而不是windows身份验证方式。如果在安装时选用了后者,则重新设置如下:http://blog.163.com/jackie_howe/blog/static/19949134720122261121214/ 当你保证SQL Server 2012是采用SQL Server身

2018-01-11 11:16:05 4626 2

翻译 VS2015+openGL配置

转载:http://blog.csdn.net/Jacketinsysu/article/details/49563139参考资料:百度经验 CSDN的博客(里面的有错误,vs配置也太老了,不值得看) 看完上面两篇文章,再去看官方文档,发现他们都是翻译或抄别人的翻译而已,想看原汁原味的官方文档可以点这里:点我点我。 资源官网看这里:点我点我首先要明确的是,openGL是

2018-01-05 21:07:49 312

原创 win10系统搭建Tensorflow深度学习平台详细步骤

Anaconda是由Python提供支持的领先的开放数据科学平台。 Anaconda的开源版本是Python和R的高性能分发版本,包括超过100个用于数据科学的最流行的Python,R和Scala软件包。

2017-12-04 11:36:35 1317

高斯混合模型GMM源代码

高斯混合模型GMM的源代码,包含numpy实现和sklearn实现两个版本,不用安装其他依赖包。

2019-07-12

logistic regression源代码(含数据集)

压缩包里含有logistic regression逻辑回归的Python源代码,训练数据集和测试训练集,最后也用Python画了结构示意图。只需要有Numpy和Matplotlib两个包即可。

2019-04-04

数字图像处理实验报告

文档包含六个数字图像处理的实验,涉及到图像几何变换、分割、增强等,包括原理和matlab源代码。

2019-03-27

校园共享单车管理系统

软件工程做的课程设计,里面是JSP源码,后台连接数据库,可直接调试运行成功。

2018-06-21

jsp简易聊天室搭建

利用application和session实现公聊和私聊,界面美观,有完整代码,可直接运行。

2018-05-22

多目标规划的求解方法及matlab程序

有各类多目标规划问题,和相应得到求解理论方法,还有对应的matlab程序

2018-01-23

数据结构课程实验练习

这是我们老师上课给我们的实验集,平常上机实验就是做这个,可以很好的与课堂知识结合,做完这个基本上就掌握了数据结构的大部分知识。

2017-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除