自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(223)
  • 收藏
  • 关注

转载 【转】动态规划:最长递增子序列Longest Increasing Subsequence

转自:https://www.cnblogs.com/coffy/p/5878915.html设f(i)表示L中以ai为末元素的最长递增子序列的长度。则有如下的递推方程:这个递推方程的意思是,在求以ai为末元素的最长递增子序列时,找到所有序号在L前面且小于ai的元素aj,即j<i且aj<ai。如果这样的元素存在,那么对所有aj,都有一个以aj为末元素的最长递增子序列的...

2019-08-30 19:55:00 219

转载 动态规划--找零钱

1 coins=[1,2,5,10,50,100] #硬币面值 2 3 def cal_change(total): 4 if total<=0: 5 return 0 6 else: 7 res=[] 8 for coin in [x for x in coins if x<...

2019-08-19 18:04:00 249

转载 在线编写复杂的数学公式--EdrawMath

网址:EdrawMath, 非常好用转载于:https://www.cnblogs.com/aaronhoo/p/11246903.html

2019-07-25 20:53:00 1047

转载 pandas如何逐行需改DataFrame

逐行修改DataFrame而不会报SettingwithCopyWarning警告的方法:df.iloc[行数,df.columns.get_loc(列名)]=new_value参考:https://cloud.tencent.com/developer/ask/168023/answer/270064逐行修改数据时,我们可能关注或只记得列名,这时使用df.iloc或...

2019-07-25 20:50:00 1397

转载 neo4j开发自定义存储过程注意事项

开发自定义的neo4j存储过程(procedures)注意事项及说明:1.调用方式:在neo4j的web界面(http://localhost:7474/)命令行输入框内,输入call your_procedure_name。其中your_procedure_name格式为:包名+函数名2.开发的步骤:新建一个java工程项目,在一个类文件(如GraphD...

2019-01-08 10:47:00 196

转载 画出决策边界线--plot_2d_separator.py源代码【来自python机器学习基础教程】

1 import numpy as np 2 import matplotlib.pyplot as plt 3 from .plot_helpers import cm2, cm3, discrete_scatter 4 5 def _call_classifier_chunked(classifier_pred_or_decide, X): 6...

2018-12-19 23:18:00 851

转载 【书签】数据可视化(三)- Seaborn简易入门

数据可视化(三)- Seaborn简易入门转载于:https://www.cnblogs.com/aaronhoo/p/10039016.html

2018-11-29 16:12:00 110

转载 【书签】连续型特征的归一化和离散特征的one-hot编码

1.连续型特征的常用的归一化方法、离散型特征one-hot编码的意义2.度量特征之间的相关性:余弦相似度和皮尔逊相关系数转载于:https://www.cnblogs.com/aaronhoo/p/9985338.html...

2018-11-19 20:23:00 445

转载 【书签】转:对SVM的个人理解---浅显易懂

对SVM的个人理解---浅显易懂转载于:https://www.cnblogs.com/aaronhoo/p/9913702.html

2018-11-06 10:19:00 79

转载 【书签】stacking、blending

读懂stacking:模型融合Stacking详解/Stacking与Blending的区别https://blog.csdn.net/u014114990/article/details/50819948https://mlwave.com/kaggle-ensembling-guide/The basic idea behind stacked generalizatio...

2018-10-30 18:38:00 53

转载 【书签】机器学习相关

上手机器学习,从搞懂这十大经典算法开始集成学习方法图解十大经典机器学习算法入门机器学习之Validation(验证,模型选择)PLA算法总结——Percetron Learning Algorithm(机器学习基石2)转载于:https://www.cnblogs.com/aaronhoo/p/9829358.html...

2018-10-22 11:57:00 87

转载 正则表达式:匹配单个数字重复n次

匹配单个数字重复n次:(\d)\1{n-1}其中,\d表示一位数字,(\d)表示匹配之后捕获该匹配,并分组并对组进行编号\1表示被捕获的第一个分组{n-1}是因为被捕获的第一个分组已经消耗了一位数字,因此要减1。注意:用python写的时候,模式字符串引号前面一定要加r,即应该写成:re.findall(r'(\d)\1{3}','11112222')而不是re.find...

2018-09-25 14:53:00 5887

转载 pandas删除DataFrame中任意字段等于'null'字符串的行

删除df中任意字段等于'null'字符串的行:df=df.astype(str)#把df所有元素转为str类型df=df[df['A'].isin(['null','NULL'])] #找出df的'A'列值为'null'或'NULL'(注意此处的null是字符串,不是空值)df=df[~df['A'].isin(['null','NULL'])] #过滤掉A列为'null...

2018-09-21 10:36:00 692

转载 中文的csv文件的编码改成utf-8的方法

直奔主题:把包含中文的csv文件的编码改成utf-8的方法:https://stackoverflow.com/questions/191359/how-to-convert-a-file-to-utf-8-in-python啰嗦几句:在用pandas读取hive导出的csv文件时,经常会遇到类似UnicodeDecodeError: 'gbk' codec can't...

2018-09-19 19:52:00 12336

转载 【转】数据挖掘的几个概念

https://blog.csdn.net/u011089523/article/details/72841694转载于:https://www.cnblogs.com/aaronhoo/p/9646706.html

2018-09-14 15:07:00 54

转载 【转】roc曲线与auc值

https://www.cnblogs.com/gatherstars/p/6084696.htmlROC的全名叫做Receiver Operating Characteristic,其主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是false positive rate(FPR),纵坐标是true positive rate(TPR)。对某个分类器而言,...

2018-09-13 13:24:00 232

转载 pandas的sql操作

【Python实战】Pandas:让你像写SQL一样做数据分析(一)用pandas实现sql功能转载于:https://www.cnblogs.com/aaronhoo/p/9606919.html

2018-09-07 20:38:00 211

转载 【转】如何七周成为数据分析师22:用pandas进行数据分析实战

如何七周成为数据分析师22:用pandas进行数据分析实战转载于:https://www.cnblogs.com/aaronhoo/p/9591667.html

2018-09-05 13:49:00 95

转载 DataFrame-选择与切片

取得DataFrame对象reviews的description列的前10个值(或者说reviews前10行的description列):reviews.iloc[:10].loc[:,'description'] 等价于reviews[:10]['description']kaggles练习(https://www.kaggle.com/morein2008/index...

2018-08-20 23:48:00 445

转载 【转】shell的反引号、单引号、双引号的作用

Linux Shell中有三种引号,分别为双引号(" ")、单引号(' ')以及反引号(` `)。其中双引号对字符串中出现的$、''、`和\进行替换;单引号不进行替换,将字符串中所有字符作为普通字符输出,而反引号中字符串作为shell命令执行,并返回执行结果。具体含义如下:双引号(" "):在双引号中,除了$, '', `和\以外所有的字符都解释成字符本身。单引号(' '):...

2018-08-17 14:55:00 328

转载 shell日期格式化、加减运算

#!/bin/bash echo i love you输出:i love you=======================================反引号的作用=========================v=`echo i love you`echo $v输出:i love you结论:反引号``之内的字符被解析为命令,并返回命令执行完的结果===...

2018-08-17 14:42:00 394

转载 非凸优化的方法

关于非凸优化的方法,https://blog.csdn.net/kebu12345678/article/details/54926287提到,可以把非凸优化转换为凸优化,通过修改一些条件。非凸优化问题如何转化为凸优化问题的方法:1)修改目标函数,使之转化为凸函数2)抛弃一些约束条件,使新的可行域为凸集并且包含原可行域而https://blog.csdn.net/R1uNW...

2018-08-15 17:19:00 489

转载 随机梯度下降与批量梯度下降

http://www.cnblogs.com/maybe2030/p/5089753.htmlhttps://www.cnblogs.com/louyihang-loves-baiyan/p/5136447.html转载于:https://www.cnblogs.com/aaronhoo/p/9482335.html

2018-08-15 16:41:00 63

转载 python requests用于测试

https://blog.csdn.net/niedongri/article/details/71404314https://blog.csdn.net/temanm/article/details/49406131http://www.cnblogs.com/heiyexiaoguai/https://blog.csdn.net/qq_37318583/article/...

2018-08-15 14:55:00 43

转载 机器学习的梯度下降方法与凸优化

https://blog.csdn.net/qq_39521554/article/details/78896110转载于:https://www.cnblogs.com/aaronhoo/p/9481335.html

2018-08-15 14:45:00 111

转载 P,NP,NP-Complete,NP-hard

https://blog.csdn.net/bitcarmanlee/article/details/51935400https://blog.csdn.net/u013089961/article/details/50069779转载于:https://www.cnblogs.com/aaronhoo/p/9481212.html

2018-08-15 14:29:00 75

转载 【转】凸集与凸函数

来自:https://blog.csdn.net/kebu12345678/article/details/54926287凸函数:如果函数f(x)的图像上方的点构成的集合是一个凸集的话,那么f(x)就是一个凸函数。注意:此处的定义及内涵与百度百科不同,与英文的维基百科(https://en.wikipedia.org/wiki/Convex_function)一致,即I...

2018-08-15 00:02:00 220

转载 【转】DataFrame合并

参考:python 把几个DataFrame合并成一个DataFrame——merge,append,join,conca横向合并(扩展列):merge,类似SQL的join,内连接,外连接等。纵向合并(扩展行):append转载于:https://www.cnblogs.com/aaronhoo/p/9458058.html...

2018-08-10 23:46:00 88

转载 python的map,reduce函数与pandas的apply,filter函数

1. python自带的apply、filter、map函数、reduce函数,很多情况下可以代替for循环:map(func,list),对list的每个元素分别执行func函数操作,显然func函数的参数就是单个元素。reduce(func,list),对list的每个元素都执行func函数操作,最后汇总成一个结果。此处map不一样。详细介绍参考:https://bl...

2018-08-07 10:36:00 132

转载 json工具--org.json.jar

org.json可以解析json、把对象包装成json。API文档:http://resources.arcgis.com/en/help/arcobjects-java/api/arcobjects/com/esri/arcgis/server/json/JSONObject.htmljson.jar下载地址:链接:https://pan.baidu.com/s/1XGx0n_uA...

2018-08-05 13:58:00 197

转载 scikit-learn中文文档

http://sklearn.apachecn.org/cn/0.19.0/tutorial/statistical_inference/supervised_learning.html转载于:https://www.cnblogs.com/aaronhoo/p/9410936.html

2018-08-02 23:51:00 132

转载 pandas的loc与iloc

1. loc是用标签(也就是行名和列名)来查找,标签默认是数字,但也可以通过index参数指定为字符型等其他的类型。格式是df.loc[行名,列名],如果列标签没有给出,则默认为查找指定行标签的所有列。例如:1.1 创建一个DataFrame,不指定各行的名称(或者说标签),pandas会默认通过数字编号,将各行命名为0,1,2,。。。1.2 df.loc[行...

2018-07-28 15:26:00 305

转载 sql join与笛卡尔积

https://blog.csdn.net/yang5726685/article/details/53538438转载于:https://www.cnblogs.com/aaronhoo/p/9362811.html

2018-07-24 21:41:00 577

转载 neo4j-jdbc driver

https://github.com/neo4j-contrib/neo4j-jdbc/releases/tag/3.3.1转载于:https://www.cnblogs.com/aaronhoo/p/9339833.html

2018-07-20 09:46:00 595

转载 python时间格式化、运行时长计算

1.格式化:import timetimeStr=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime()) #格式化为:2018-07-17 19:03:36形式或者timeStr=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) #格...

2018-07-17 19:22:00 713

转载 pandas DataFrame 的横向纵向拼接组合

concat 与其说是连接,更准确的说是拼接。就是把两个表直接合在一起。于是有一个突出的问题,是横向拼接还是纵向拼接,所以concat 函数的关键参数是axis 。函数的具体参数是:concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,...

2018-07-17 15:05:00 3147

转载 unicode、encode、decode

1.encode与decode:unicode经过encode -> utf-8,反过来为decode。爬虫读取网页内容和pandas读取csv时,会把读取到的文字内容转成unicode,当我们需要把这些文字内容写入到新的文件时,需要设置该文件的编码(该编码应该与网页或原来的编码相同,以便带来编码的问题),即做一个encode的过程。2.读取时文件的编码要与写入文件时编码相...

2018-07-12 19:34:00 338

转载 pandas 小技巧

1.找出某个字段包含某字符串的行:my_df[my_df['col_B'].str.contains('大连') > 0]或者my_df[my_df['col_B'].apply(lambda x:str(x).find('大连')>=0)]2.字段值长度大于零的行:my_df[my_df['col_b'].apply(lambda x: len(...

2018-07-12 19:30:00 102

转载 excel操作数据实用技能

写代码写习惯了,在做数据预处理时也总是习惯性地用python、pandas来做处理,但其实有时候根本不需要写代码,用excel也能达到目的,甚至比写代码快很多,写代码要半天,excel只要几秒钟。下面是几个最近发现的实用技能和场景:1.去掉某一个列的重复项:例如,删除address列中的重复项。操作方法:点击address列的列头(表第一行上方的A,B,C等),选中该列的所有行,...

2018-07-12 10:28:00 88

转载 用pandas处理数据遇到的坑

1.使用pandas.read_csv(filePath)方法来读取csv文件时,可能会出现这种错误:ParserError:Error tokenizing data.C error:Expected 2 fields in line 407,saw 3.这句话的意思是,在csv文件的第407行数据,期待2个字段,但在第407行实际发现了3个字段。原因:header只有两个字段名,但数...

2018-07-10 17:09:00 1763

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除