- 博客(12)
- 收藏
- 关注
原创 K-means聚类收敛及改进
K-means聚类模型采用的迭代式算法,优点暂且不表。其存在两大缺陷:①初始簇心随机指定,容易收敛到局部最优解(1)什么叫局部最优解?K-means受到随机初始类簇中心点位置的影响,无法保证能够使得三个类簇的中心迭代到上图,会导致下图两种局部最优情况。这样导致无法继续更新聚类中心,使得聚类结果与正确结果有很大出入。这种情况是算法自身的理论缺陷造成的,无法简单的从模型设计上弥补,但是可以通...
2019-12-17 15:04:26 2312
原创 Python选取数据 iloc()函数和loc()函数区别
1.iloc()iloc works on the positions in the index (so it only takes integers).使用 数字索引数据 ,只能是数字(俗称index的序值)In [1]: df = DataFrame(randn(5,2),index=range(0,10,2),columns=list('AB'))df A ...
2019-08-14 20:18:59 1929
原创 Python pandas 修改列顺序的几种方法整理 pop(),drop(),insert()
(简便)1.pop()弹出把要删除的列,再用insert()指定位置插入df.insert(4,'F',df.pop('F'))pop() 函数用于移除列表中的一个元素(默认最后一个元素),并且返回该元素的值。insert() 函数用于将指定对象插入列表的指定位置。list.insert(index, obj)index – 对象 obj 需要插入的索引位置。obj – 要插入列表中...
2019-08-13 19:13:08 4493
原创 Python内置的filter()函数和Pandas中的DataFrame.filter()参数及用法
1.Python filter() 函数filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回一个迭代器对象,如果要转换为列表,可以使用 list() 来转换 filter(function, iterable)` # function -- 判断函数。对每个元素进行判断,返回 True或 False # iterable -- 可迭代对象。# 过滤处列表中的奇数def i...
2019-08-13 15:26:22 34253
原创 DeprecationWarning Class RandomizedLogisticRegression is deprecated 随机逻辑回归模型
用随机逻辑回归RandomizedLogisticRegression筛选特征报错《数据分析与挖掘实战》 第5章逻辑回归,使用随机逻辑回归模型RLR()的get_support()方法获取特征筛选结果,但报错RLR()即将淘汰,但它的思想还是可以学习下:这种递归特征消除的思想是一种寻找最优特征子集的贪心算法。通过反复构建模型(如SVM和回归模型,选出最好或最差的特征,把选好的特征放到一边,...
2019-07-20 16:51:27 712
原创 python as_matrix()已淘汰
python as_matrix()已淘汰背景:读取Excel数据训练模型时,需要将表格转换成数组,as_matrix()可将dataframe数据转换成数组,但会报警1.1 原始DataFrame#原始DataFrameimport pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(12).reshape(3,4))运行...
2019-07-20 16:17:58 14620 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人