自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数值处理(针对数字值的处理)

仅代表个人学习理解,不具有科学严谨的指导作用。通常需要处理空、异常、重复值而异常值的判断通常有强烈的主观色彩及业务逻辑关系的影响,所以判断规则不能准确说明。例如:一个产品平时日销售量平均是10单位,但某一天进行促销卖了100,这个数值在统计意义(正态分布)上可能是个异常值,但是有实际的业务意义。DataFrame.isnull()方法 可以得出一个布尔值的DataFrame,其中False的是空值...

2018-04-16 23:40:58 553

原创 Pandas--DataFrame修改值

pandas要修改值先需要了解DataFrame的一些知识此处参照的是pandas的官方文档When setting values in a pandas object, care must be taken to avoid what is calledchained indexing. Here is an example.要修改pandas--DataFrame中的值要注意避免在链式索引上得...

2018-04-11 20:16:02 119864 2

原创 Matplotlib使用记录

Scatter Plotimport numpy as npimport matplotlib.pyplot as pltheight = [164, 170, 182, 175, 173, 163]weight = [77, 88, 99, 57, 86, 88]plt.scatter(height, weight, linewidths=10) #, alpha=0.2 ,s=5 ...

2018-04-07 22:24:05 220

原创 K折交叉验证

留坑学习交叉验证:在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预测,并求这小部分样本的预测误差,记录它们的(平方加和),把每个样本的预测(误差平方)加和。K(5、10)折交叉验证:五折、十折交叉验证最常见。K折交叉验证的过程:1.将包含m条样本总体分成k个不相交子集S,则每个子集有m/k个样本,S1~S102.对每个分类器、学习器:        循环K次:    ...

2018-03-31 11:42:36 2189

原创 DataFrame实现两表连接

连接查询:包含连接操作的查询称为连接查询连接查询包含:等值,自然,外连接,内连接,坐连接,自连接……挖坑坑,深入学习了慢慢填。pandas的DataFrame的连接不算真正意义的连接查询,只是在两个DataFrame中的操作达到了像连接查询的效果用pandas库下的DataFram创建DataFrame类型的数据other = pd.DataFrame({'key': ['K0', 'K1', '...

2018-03-29 21:32:34 7393

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除