2 bymaymay

尚未进行身份认证

不念过去,不惧未来!

等级
TA的排名 8w+

目录 ./ 和 ../ 和 ../..

./表示当前目录…/表示父级目录…/…表示祖父目录

2019-07-04 08:52:21

python函数调用参数问题

defexample(a,b,c=100):…a=1#noticehereIamassigning‘a’…b=2#andherethevalueof‘b’isbeingoverwritten…#Thevalueofcissetto100bydefault…print(a,b,c)...

2019-04-09 17:35:27

python pandas dataframe 数据筛选

importpandasaspdimportnumpyasnpdf=pd.DataFrame({‘a’:[1,2,np.nan,np.nan],‘b’:[4,np.nan,6,np.nan],‘c’:[np.nan,8,9,np.nan],‘d’:[np.nan,np.nan,np.nan,np.nan]})print(df.notnull().any(axis=...

2019-04-08 22:29:40

由字典dictionary或列表list创建dataframe

原文链接

2019-04-05 21:07:13

sklearn-CountVectorizer

CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数。fromsklearn.feature_extraction.textimportCountVectorizertexts=["dogcatfish","dogcatcat","fishbird",'bird']#“dogcatfish”为输入...

2019-04-04 01:54:21

dataframe常用数据处理

importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\xx1.csv")dfT=pd.read_csv(r"C:\Users\xx2.csv")df1=df.loc[:,['column1','column2']]#取给定两列的所有行df1['label']=int(0)df2=dfT.loc...

2019-01-10 19:01:47

信息熵、联合熵、条件熵、互信息

信息熵、联合熵、条件熵、互信息1.自信息量一个随机事件xxx的自信息量1定义为:I(x)=log⁡1p(x)I(x)=\log\frac{1}{p(x)}I(x)=logp(x)1​注意,在信息论中,log⁡\loglog函数的底通常设置为2,此时,自信息量的单位为比特(bit);在机器学习中,log⁡\loglog函数的底通常设置为自然常数e,此时,自信息量的单位为奈特(nat)。...

2018-12-18 03:24:17

anaconda安装第三方包scikit-multiflow

在conda库中没找到scikit-multiflow,在GitHub上下载压缩包,解压到C盘:第一次安装出错,出现MicrosoftVisualC++14.0isrequired的错误c++14.0下载地址https://964279924.ctfile.com/fs/1445568-239446865安装软件,重启电脑,再进行上述install命令,安装成功...

2018-12-16 21:00:09

vim及linux常用命令

在命令模式下:单行复制:将光标移动到将要复制的行处,按yy进行复制;多行复制:将光标移动到将要复制的首行处,按nyy复制n行;其中n为1、2、3……粘贴:将光标移动到将要粘贴的行处,按p进行粘贴显示行号::setnu移动光标到行尾:$,移动到第n行的行尾n$移动光标到行首:0...

2018-10-12 16:20:37

TensorFlow安装与使用

anaconda安装tensorflowpython--version:查看当前python版本,此处为3.6condacreate-ntensorflowpython=3.6:新建名为tensorflow的conda环境sourceactivatetensorflow:激活tensorflow环境pipinstalltensorflow:在tensorflow环境...

2018-10-12 12:59:08

csr_matrix的用法--shape, nnz, data, indices, indptr, toarray

fromscipy.sparseimportcsr_matrixarr=np.array([[0,1,0,2,0],[1,1,0,2,0],[2,0,5,0,0]])b=csr_matrix(arr)#print(b.shape)#(3,5)#print(b.nnz)#非零个数,7print(b.data)#非零值,[1211225]pri...

2018-08-03 16:15:02

python将字符串list写入excel和txt

docs=[‘icasspimprovedhumanfaceidentificationusingfrequencydomainrepresentationfacialasymmetry’,‘patternrecognitionunsupervisedmethodsclassificationhyperspectralimageslowspatialre...

2018-07-31 11:31:47

python用列表生成式写嵌套循环

将两个嵌套for循环写成一个列表生成式如,有一个嵌套列表,a=[[1,2],[3,4],[5,6]],要提取列表里的每一个元素用for循环处理:foriina:forjini:print(j)用列表生成式:b=[jforiinaforjini]#注意两个for的顺序print(b)b=[1,2,3,...

2018-07-30 15:47:27

nltk-提取词干-去除停用词

fromnltk.corpusimportstopwordsHereisthelist:set(stopwords.words(‘english’)){‘ourselves’,‘hers’,‘between’,‘yourself’,‘but’,‘again’,‘there’,‘about’,‘once’,‘duri...

2018-07-30 11:18:37

csr_matrix参数解析

压缩稀疏矩阵构造时的参数从官网看不明白,参考如下:indptr=np.array([0,2,3,6])indices=np.array([0,2,2,0,1,2])data=np.array([1,2,3,4,5,6])csr_matrix((data,indices,indptr),shape=(3,3)).toarray()a...

2018-06-28 14:12:00

vim配置-python版

下载Pydiction插件mkdir~/.vimmkdir~/.vim/bundlecd~/.vim/bundlegitclonehttps://github.com/rkulla/pydiction.git配置Pydiction#-UNIX/LINUX/OSX:Putpython_pydiction.vimin~/.vim/after/ftplugi...

2018-06-11 14:03:54

python中read(), readline(), readlines()

我们谈到“文本处理”时,我们通常是指处理的内容。Python将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法:.read()、.readline()和.readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。.read()每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而.read()生成文件内容...

2018-06-11 09:34:27

pandas Series合并add, value_counts

假设se1,se2是series类型,se1={computer,circuit,visualization,computer}se1.value_counts()Returnsobjectcontainingcountsofuniquevalues.也就是取序列中value的交集,并统计每个value出现的次数。value作为index,次数作为序列值。...

2018-06-06 18:35:59

pandas concat

dfTotal=pd.concat([dfTrain,dfTest],axis=0).fillna('')由于第一列‘name’比其他列长,pandas自动将‘name’列放在了最后一列,如果不想更改列的顺序,需要加入sort=False即dfTotal=pd.concat([dfTrain,dfTest],axis=0,sort=False).f...

2018-06-06 16:50:24

Pandas中DateFrame修改列名

importpandasaspda=pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]})aABC014712582369方法一:暴力方法(bmm:实践中只有此方法有效,rename方法无效)a.columns=['a','b','c']aa...

2018-06-06 16:46:57

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!