- 博客(17)
- 资源 (1)
- 收藏
- 关注
原创 什么是朴素贝叶斯中零概率问题?
要预测的样本某个属性值在已知的多个类别中,至少有一个类别在该属性上没有出现过这个值。所以计算的结果,属于该类别的概率为0,这不合理。所以要用拉普拉斯平滑。参考:https://mp.weixin.qq.com/s?__biz=MzI3NTkyMjA4NA==&mid=2247484288&idx=1&sn=e8ea0a317c58e5e191c127cddc2ceafa...
2018-09-17 16:13:25 3724
原创 信息增益和信息增益率
信息增益偏向取值较多的特征。(极端情况,把序号当做特征)信息增益率偏向取值较少的特征。 C4.5 找出信息增益高于平均水平的特征,然在在这些特征中再选择信息增益率最高的特征。...
2018-09-12 14:11:00 2198
原创 collections.Counter 可以统计数组中每个元素出现的次数
import collectionsdef MoreThanHalfNum_Solution(numbers): # write code here d = collections.Counter(numbers) print(type(d)) print(d)print(MoreThanHalfNum_Solution([1,2,3,2,2,2,5,4,2...
2018-08-14 15:07:26 1920
原创 sort 与 sorted 区别:
sort 与 sorted 区别:sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。list 的 sort 方法返回的是对已经存在的列表进行操作,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。reverse() 与 reversed() 区别:reverse 用法和sort 用法一样revers...
2018-08-06 15:35:02 268
原创 for 循环 注意点
Python for循环 尽量写成这种形式(names 是一个列表):for j in range(len(names)):不要写成这种形式:for name in names:当names是一个空列表时,上面一种情况不会出现空类型错误! ...
2018-07-31 17:37:35 194
原创 梯度下降和正规方程
执行梯度下降算法,不同属性的取值范围要保持大致一致(大约在-1到1之间)一般认为-3到3就是安全的,这样执行梯度下降算法收敛的更快。正规方程方法不需要使用特征缩放。...
2018-07-29 08:54:19 392
原创 逆矩阵存在的条件
逆矩阵充要条件有多种表述方式,以下三条相互等价:1. 矩阵的行列式不等于零2. 矩阵为满秩矩阵3. 矩阵的合同标准型是单位矩阵逆矩阵: 设A是数域上的一个n阶方阵,若在相同数域上存在另一个n阶矩阵B,使得: AB=BA=E。 则我们称B是A的逆矩阵,而A则被称为可逆矩阵。没有逆矩阵的矩阵称为“奇异矩阵”或“退化矩阵”...
2018-07-28 16:52:48 34349
原创 字符串和数字ASCII
字符串的比较与 tuple 类似,也是从第一个字符开始比较 ASCII 码,直到两个字符不相等为止。字母与数字的ASCII 码大小范围是 "a-z" > "A-Z" > "0-9",
2018-07-24 19:13:01 2567
原创 朴素贝叶斯
朴素贝叶斯法对条件概率分布做了条件独立性的假设,由于这是一个较强的假设,朴素贝叶斯也由此得名!这一假设使得朴素贝叶斯法变得简单,但有时会牺牲一定的分类准确率。...
2018-07-16 10:16:25 152
原创 DatetimeIndex 对象
DatetimeIndex 对象可以直接获取日期的 年 月 日time_value 是日期类型的对象time_value = pd.DatetimeIndex(time_value)time_value.yeartime_value.monthtime_value.weekday # 周几time_value.hour...
2018-07-05 09:59:59 2477
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人