2 还是小小白

尚未进行身份认证

啦啦啦啦。。。

等级
TA的排名 37w+

python常用的小东西

防止忘记,在此做个记录目录:读取csv 筛选 排序1.读取csvimportpandasaspdfile=pd.read_csv(r'D:\projects\PycharmProjects\final_wangwei\final_news_all.csv',usecols=['entity_id','post_title','publish_year...

2019-06-05 09:08:37

R的一些操作

现在又用到R语言了,当年学习的时候,很多函数用的都很熟练,没想到现在竟然忘了一大截。。。写个笔记还是很有必要的。。持续更新……此处作目录连接mysql的操作 数据框的合并(merge) 数据框去重(news=news[!duplicated(news),]) 输出表格csv 删除某些列有na的行final_news=news[complete.cases(news[,'shouc...

2019-06-01 22:00:20

PYTHON+MYSQL插入数据遇到:1054, "Unknown column 'XXXXXXX' in 'field list'"错误

我原本的插入语句是insertintonews_detail(a,b,c,d,e)values(%s,%s,%s,%s,%s)"%(str(entity_ids[i]),post_title,shoucang,pinglun,dianzan)查了一下,发现python向mysql中添加数据时插入值需要用引号包起来即将:mydata=(str(entity_ids[...

2019-05-29 12:28:59

PYTHON+MYSQL遇到pymysql.err.InternalError: (1366, "Incorrect string value: '\\xF0\\x9报错

这是字符编码问题1.网上有一种解决方法是:直接将数据库的编码改为:utf8mb4_general_ci,同时Python代码里,连接数据库时用charset="utf8mb4"不过,,这种方法对我的程序不起作用。。2.另一种方法(有效):执行sql语句:ALTERTABLE表名CONVERTTOCHARACTERSETutf8mb4;再将P...

2019-05-26 19:35:01

如何让博客更容易被搜索引擎搜索到

假如不把你的博客提交到各大搜索引擎中,它们一般是不会收录你的博客的,你可以先尝试一下看看能不能在百度搜到你的博客吧:假如你搜不到的话说明你的博客还没有被百度收录,那么怎么才能被百度、google等各大搜索引擎收录你的博客呢?申请免费加入搜索引擎啦!一般百度在48小时内就会邮件答复你,假如申请成功的话,大家就能够随时随地找到你了(百度最晚一个月可以找到你博客,因为百度的搜索是每隔36天更新一次的)...

2019-04-27 10:06:12

R-数据挖掘-贝叶斯分类(五)

海林老师《数据挖掘》(韩佳炜书)课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:...

2019-04-27 09:23:18

R-数据挖掘-聚类DBSCAN(七)

海林老师《数据挖掘》(韩佳炜书)课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:...

2019-04-26 21:56:01

R-数据挖掘-聚类Kmeans(六)

海林老师《数据挖掘》(韩佳炜书)课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:...

2019-04-26 21:50:37

R-数据挖掘-决策树ID3(四)

海林老师《数据挖掘》课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:(读者可将所有代...

2019-04-26 21:43:38

R-数据挖掘-关联规则(三)

海林老师《数据挖掘》课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:(读者可将所有代...

2019-04-26 21:35:47

R-数据挖掘-主成分分析PCA(二)

海林老师《数据挖掘》课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:(读者可将所有代...

2019-04-26 21:29:50

R-数据挖掘-求混合型数据对象距离(一)

海林老师《数据挖掘》(韩佳炜书)课程作业系列要求:自己写R/Python代码、函数实现一系列算法其他参见:R-数据挖掘-求混合型数据对象距离(一)R-数据挖掘-主成分分析PCA(二)R-数据挖掘-关联规则(三)R-数据挖掘-决策树ID3(四)R-数据挖掘-贝叶斯分类(五)R-数据挖掘-聚类Kmeans(六)R-数据挖掘-聚类DBSCAN(七)全文逻辑:(读...

2019-04-26 21:22:34

R-一些小问题

1.Theshapepalettecandealwithamaximumof6discretevaluesbecausemorethan6becomesdifficulttodiscriminate;.....解决方法:http://www.sthda.com/english/wiki/ggplot2-point-shapes总结:ggplot2默认支...

2019-03-22 18:24:37

R—list

https://www.cnblogs.com/ljhdo/archive/2018/03/09/4907882.htmlhttps://blog.csdn.net/wa2003/article/details/45887055先令aa=NULL;再进行合并aa=c(aa,list(1));此时NULL会被填充

2018-11-01 18:44:57

mysql的一些操作

鉴于我经常性忘记一些知识点,于此记录一下!2018-09-24中秋节码代码篇~主要内容:复制表(复制表数据,复制表结构) 数据快速去重 对于大数据级别的表作查找删除时的技巧 在插入数据时遇到的bug(SQL:1265;;1166....) 将excel文件内容导入mysql中,出现invalidutf8characterstring错误的解决 heidisql...

2018-09-24 09:13:01

python3对mysql的增删改查操作

思路:1.python中下载库PyMySql2.打开MySQL,创建数据库py_test3.创建.py文件,代码:连接数据库,创建游标对象,创建表,对表进行增删改查,关闭游标对象,关闭数据库代码如下:importpymysql#数据库连接db=pymysql.connect(host="localhost",port=3306,user="root",password...

2018-09-20 19:28:44

装eclipse

1.http://www.eclipse.org/downloads/packages/选择合适的版本(我选的是eclipseideforjavaeedevelopers)2.下载后得到的文件夹中找到.exe文件即可打开运行3.下载tomcat4.在eclipse中配置tomcat  https://jingyan.baidu.com/article/fcb5aff74d7...

2018-07-27 16:40:35

R中排序函数总结:sort,order,rank,arrange,reorder

总结(区别):1、sort是直接对向量排序,返回原数值;2、order先对数值排序,然后返回排序后各数值的索引;3、rank返回原数据各项排名;4、arrange是plyr包中的,可对数据框按列排序,仍返回数据框;5、reorder用在绘图中,比如ggplot中绘条形图,可使x轴按y轴数值大小排序;比如横轴为age,纵轴为money,可写为:aes(x=reorder(age,...

2018-07-06 19:44:11

R语言垃圾邮件分类--朴素贝叶斯(机器学习)

邮件分类练习–朴素贝叶斯思路数据导入数据处理构建训练集和测试集词云展示数据降维训练模型模型测试提升模型一、数据导入文件目录为:C:\Users\kelanj\Documents\data\spam\…和C:\Users\kelanj\Documents\data\ham\…#数据导入#获得文件路径/目录setwd("C:\\Users\\kelanj\\Documents")spam.p...

2018-07-02 14:51:34
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。