- 博客(5)
- 收藏
- 关注
原创 数值处理(针对数字值的处理)
仅代表个人学习理解,不具有科学严谨的指导作用。通常需要处理空、异常、重复值而异常值的判断通常有强烈的主观色彩及业务逻辑关系的影响,所以判断规则不能准确说明。例如:一个产品平时日销售量平均是10单位,但某一天进行促销卖了100,这个数值在统计意义(正态分布)上可能是个异常值,但是有实际的业务意义。DataFrame.isnull()方法 可以得出一个布尔值的DataFrame,其中False的是空值...
2018-04-16 23:40:58 553
原创 Pandas--DataFrame修改值
pandas要修改值先需要了解DataFrame的一些知识此处参照的是pandas的官方文档When setting values in a pandas object, care must be taken to avoid what is calledchained indexing. Here is an example.要修改pandas--DataFrame中的值要注意避免在链式索引上得...
2018-04-11 20:16:02 119864 2
原创 Matplotlib使用记录
Scatter Plotimport numpy as npimport matplotlib.pyplot as pltheight = [164, 170, 182, 175, 173, 163]weight = [77, 88, 99, 57, 86, 88]plt.scatter(height, weight, linewidths=10) #, alpha=0.2 ,s=5 ...
2018-04-07 22:24:05 220
原创 K折交叉验证
留坑学习交叉验证:在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预测,并求这小部分样本的预测误差,记录它们的(平方加和),把每个样本的预测(误差平方)加和。K(5、10)折交叉验证:五折、十折交叉验证最常见。K折交叉验证的过程:1.将包含m条样本总体分成k个不相交子集S,则每个子集有m/k个样本,S1~S102.对每个分类器、学习器: 循环K次: ...
2018-03-31 11:42:36 2189
原创 DataFrame实现两表连接
连接查询:包含连接操作的查询称为连接查询连接查询包含:等值,自然,外连接,内连接,坐连接,自连接……挖坑坑,深入学习了慢慢填。pandas的DataFrame的连接不算真正意义的连接查询,只是在两个DataFrame中的操作达到了像连接查询的效果用pandas库下的DataFram创建DataFrame类型的数据other = pd.DataFrame({'key': ['K0', 'K1', '...
2018-03-29 21:32:34 7393
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人