自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 K-means聚类收敛及改进

K-means聚类模型采用的迭代式算法,优点暂且不表。其存在两大缺陷:①初始簇心随机指定,容易收敛到局部最优解(1)什么叫局部最优解?K-means受到随机初始类簇中心点位置的影响,无法保证能够使得三个类簇的中心迭代到上图,会导致下图两种局部最优情况。这样导致无法继续更新聚类中心,使得聚类结果与正确结果有很大出入。这种情况是算法自身的理论缺陷造成的,无法简单的从模型设计上弥补,但是可以通...

2019-12-17 15:04:26 2312

原创 Python学习之Numpy知识点思维导图

2019-08-20 21:44:00 820

原创 Python学习之Pandas知识点思维导图

2019-08-20 21:42:27 897

原创 数据预处理流程图思维导图

2019-08-20 21:39:24 2662 1

原创 数据分析之数据预处理数据清洗流程图思维导图

2019-08-20 21:14:31 4207

原创 数据分析之数据初步探索流程图思维导图

以上是笔者自己整理,后续有补充会继续完善。

2019-08-20 21:11:38 989

原创 搭建用户数据分析框架

思路:用户=新用户+老用户用户指标=客单价*支付人数支付渠道=好友推荐(社群)+公众号+网站

2019-08-20 21:09:20 223

原创 Python选取数据 iloc()函数和loc()函数区别

1.iloc()iloc works on the positions in the index (so it only takes integers).使用 数字索引数据 ,只能是数字(俗称index的序值)In [1]: df = DataFrame(randn(5,2),index=range(0,10,2),columns=list('AB'))df A ...

2019-08-14 20:18:59 1929

原创 Python pandas 修改列顺序的几种方法整理 pop(),drop(),insert()

(简便)1.pop()弹出把要删除的列,再用insert()指定位置插入df.insert(4,'F',df.pop('F'))pop() 函数用于移除列表中的一个元素(默认最后一个元素),并且返回该元素的值。insert() 函数用于将指定对象插入列表的指定位置。list.insert(index, obj)index – 对象 obj 需要插入的索引位置。obj – 要插入列表中...

2019-08-13 19:13:08 4493

原创 Python内置的filter()函数和Pandas中的DataFrame.filter()参数及用法

1.Python filter() 函数filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回一个迭代器对象,如果要转换为列表,可以使用 list() 来转换 filter(function, iterable)` # function -- 判断函数。对每个元素进行判断,返回 True或 False # iterable -- 可迭代对象。# 过滤处列表中的奇数def i...

2019-08-13 15:26:22 34253

原创 DeprecationWarning Class RandomizedLogisticRegression is deprecated 随机逻辑回归模型

用随机逻辑回归RandomizedLogisticRegression筛选特征报错《数据分析与挖掘实战》 第5章逻辑回归,使用随机逻辑回归模型RLR()的get_support()方法获取特征筛选结果,但报错RLR()即将淘汰,但它的思想还是可以学习下:这种递归特征消除的思想是一种寻找最优特征子集的贪心算法。通过反复构建模型(如SVM和回归模型,选出最好或最差的特征,把选好的特征放到一边,...

2019-07-20 16:51:27 712

原创 python as_matrix()已淘汰

python as_matrix()已淘汰背景:读取Excel数据训练模型时,需要将表格转换成数组,as_matrix()可将dataframe数据转换成数组,但会报警1.1 原始DataFrame#原始DataFrameimport pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(12).reshape(3,4))运行...

2019-07-20 16:17:58 14620 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除