3 水...琥珀

尚未进行身份认证

数据挖掘,自然语言处理,如果恰巧你也是,同行!

等级
TA的排名 2w+

windows 安装pytorch 权限问题

环境说明:windows10 python3.6 anaconda31.按照进入pytorch官网https://pytorch.org/选择正确的命令它会自动为你选择一些配置,复制命令我选择的是:conda install pytorch torchvision cudatoolkit=10.1 -c pytorch2.安装出现报错:ERROR conda.core....

2019-11-12 08:02:30

逻辑回归算法梳理

【任务2 - 逻辑回归算法梳理】时长:2天1、逻辑回归与线性回归的联系与区别2、 逻辑回归的原理3、逻辑回归损失函数推导及优化4、 正则化与模型评估指标5、逻辑回归的优缺点6、样本不均衡问题解决办法7. sklearn参数参加了Datawhale的活动,虽然在机器学习有一定的实践和经验积累,不过总是有自己的漏洞,所以参加基础的机器学习任务。博客尽力的水到渠成,不过很多内容来自之前自...

2019-04-01 21:29:29

线性回归知识总览

博文内容为机器学习的一些概念有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证线性回归的原理线性回归损失函数、代价函数、目标函数优化方法(梯度下降法、牛顿法、拟牛顿法等)线性回归的评估指标sklearn参数详解机器学习的一些概念有监督、无监督统计学习包括监督学习、非监督学习、半监督学习及强化学习。监督学习(superv...

2019-03-29 18:13:35

CSDN Markdown编辑下插入公式

使用$将公式左右包括起来,键入的式子将以公式格式显示$公式$ 句中插入,这是一个演示y^\hat{y}y^​$换行居中插入换行居中插入换行居中插入$这是一个演示y^\hat{y}y^​原始语法如下:$公式$ 句中插入,这是一个演示$\hat{y}$ $$换行居中插入$$ 这是一个演示$$\hat{y}$$ ...

2019-03-28 18:14:30

Python小点dian儿: 读取一个目录下目录和文件

目录代码一: 输出文件目录相关内容代码二:输出一个目录下所有文件名字(第一层)代码三:返回当前路径下所有层的文件路径列表代码四:依次从内层到外层获取当前路径下文件(改造自代码三),也可直接代码一获取代码五:获取当前路径下一层指定后缀文件列表(多层可改造代码三)代码一: 输出文件目录相关内容os.walk(file_dir)从外到内获取多层# -*- cod...

2019-01-10 21:10:27

小点dian儿:pandas混淆矩阵

import pandas as pd pd.crosstab(y_Test,prediction, rownames=["lable"],colnames=["predict"])y_Test,真实值prediction,预测值rownames=["lable"],行名colnames=["predict"],列名

2018-12-28 10:13:01

小点dian儿:Python大文件读取、文件拆分,读取部分数据

目录pandas参数说明文件部分读取参数文件成块读取参数成块读入,并写入其他文件。官方文档pandas参数说明pandas在read_csv或read_table有几个个参数文件部分读取参数nrows :int,defaultNoneNumberofrowsoffiletoread.Usefulforreadingpieces...

2018-12-27 15:34:38

python 删除文件首行或指定行(修改文件)

网上的大多数答案也是,读入,写入的过程,总结如下python修改文件(fileinput)链接 https://blog.csdn.net/u013398398/article/details/53583596上网查了好多方法都是将文件一行一行都进来,然后新开一个文件指针,将文件再一行行写进新文件里。 感觉不是太好,看到这个fileinput的库,发现大同小异,不过有一点就是可以在原...

2018-12-26 15:33:20

python训练work2vec词向量实例(python gensim)

前期工作可参阅:1.pythonwork2vec词向量训练可参考 https://blog.csdn.net/shuihupo/article/details/85156544词向量训练2.word2vec词向量中文语料处理(pythongensimword2vec总结)可参考 https://mp.csdn.net/postedit/85162237汇总数种语料加载方式。之前的...

2018-12-23 21:03:12

python work2vec词向量应用方法汇总

目录前期工作可参阅:work2vec词向量应用汇总(词语相似度、集合相似度、词向量计算等)1.获取每个词的词向量2支持词语的加减运算。(实际中可能只有少数例子比较符合)3计算两个词之间的余弦距离4计算余弦距离最接近“word”的10个词,或topn个词5计算两个集合之间的余弦似度6.选出集合中不同类的词语看了很多资源,总感觉work2vec词向量应用总结得不全面...

2018-12-23 20:44:27

python 第三方包的安装位置

键盘win+R调出cmd在cmd中输入一个已经安装过的包的命令,它就会显示安装的位置。比如 pipinstallpandas 它就显示你的安装包目录了。 手动安装第三方详见教程python安装.whl、egg、zip、tar.gz安装包...

2018-12-21 20:58:20

python训练work2vec词向量(python gensim)

目录看了很多文章,对与word2vec语料的处理没有那么清晰,现在写下自己处理流程,方便入手的小伙伴,望大家使用的过程中,少走弯路。训练语料格式模型训练1.安装gensim2.模型训练3.模型保存3.1模型训练保存与加载1(模型可继续训练)3.1.1模型继续训练3.2模型训练保存与加载2(模型不可继续训练)模型使用汇总(词语相似度、集合相似度、词向量计算等)...

2018-12-21 17:59:10

word2vec词向量中文语料处理(python gensim word2vec总结)

目录中文语料处理法一:语料处理为列表法二:语料是文件(处理为迭代器)对一个目录下的所有文件生效(法1) 对一个目录下的所有文件生效(法2)class:gensim.models.word2vec.PathLineSentences对于单个文件语料,使用LineSentence语料库获取语料word2vec中文语料处理及模型训练实践pythongensi...

2018-12-21 15:41:45

python小点dian儿:去除txt/json重复行

目录去除重复行(法一:利用内置set)去除重复行(法二:建造list或set检查是否已存在)按行写入json/txt文件查看文件行数长度factfile_path  为json文件casefile_path 为txt文件去除重复行(法一:利用内置set)先了解Python splitlines()用法str.splitlines([keepends])按照行...

2018-12-20 22:12:52

python json

json.load(filename)json.loadds(string)

2018-12-20 17:22:05

python读取文件 \ufeff 问题

df_ID=pd.read_csv(IDfile_path,encoding='utf-8',sep=',',header=None)ID_list=list(df_ID.ix[:,0])print(ID_list)我的原始输出:['\ufeffee170175-35de-43b8-ad92-a70600b6da3a','266d79c7-4ca9...

2018-12-16 19:51:44

Python小点dian儿:sort疑问大全

遇到了就刨根问题,补补python基础吧。数据会清理,特征会派生,模型会跑,参数能调,但始终还是有漏洞,或者术语不可名状。python 去重,并保持列表原来顺序list_a = ['cc', 'bbb', 'dda','bbbb', 'cc', 'sss',  'fase']list_new = list(set(list_a))list_new.sort(key = list_a.i...

2018-12-04 17:55:14

解决xgboost异常AttributeError: 'DMatrix' object has no attribute 'handle'

xgboost异常AttributeError:'DMatrix'objecthasnoattribute'handle' sys:1:DtypeWarning:Columns(65)havemixedtypes.Specifydtypeoptiononimportorsetlow_memory=False.....xgboost异常Attribu...

2018-10-21 10:41:56

python小点dian儿:使用merge还是join

合并():要注意使用merge还是join#merge是因为两个合并的对象,有相同的列,merge以这些相同的列为索引进行合并,默认内连接('inner'join),可通过参数how来设置左连接,右连接,全连接其他链接方式。下面的栗子按照索引合并,就会出现两个sorce,不可以join#join实现按索引合并,而不管他们有么有相同的列,默认链接键上的左连接,同样可以通过参数how更改.同时可...

2018-10-20 16:42:17

日常操作测试(杂)

import pandas as pddf = pd.DataFrame({"key":['green','red', 'blue'], "data1":['a','b','c'],"sorce": [33,61,99],"sorce1": [33,61,99],"sorce2": [33,61,99]})data1 = pd.concat([df,df],ignor...

2018-10-17 17:28:47

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。