自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (1)
  • 收藏
  • 关注

原创 什么是朴素贝叶斯中零概率问题?

要预测的样本某个属性值在已知的多个类别中,至少有一个类别在该属性上没有出现过这个值。所以计算的结果,属于该类别的概率为0,这不合理。所以要用拉普拉斯平滑。参考:https://mp.weixin.qq.com/s?__biz=MzI3NTkyMjA4NA==&mid=2247484288&idx=1&sn=e8ea0a317c58e5e191c127cddc2ceafa...

2018-09-17 16:13:25 3724

原创 信息增益和信息增益率

信息增益偏向取值较多的特征。(极端情况,把序号当做特征)信息增益率偏向取值较少的特征。 C4.5 找出信息增益高于平均水平的特征,然在在这些特征中再选择信息增益率最高的特征。...

2018-09-12 14:11:00 2198

原创 collections.Counter 可以统计数组中每个元素出现的次数

import collectionsdef MoreThanHalfNum_Solution(numbers): # write code here d = collections.Counter(numbers) print(type(d)) print(d)print(MoreThanHalfNum_Solution([1,2,3,2,2,2,5,4,2...

2018-08-14 15:07:26 1920

原创 sort 与 sorted 区别:

sort 与 sorted 区别:sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。list 的 sort 方法返回的是对已经存在的列表进行操作,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。reverse() 与 reversed() 区别:reverse 用法和sort 用法一样revers...

2018-08-06 15:35:02 268

原创 正则化参数对欠拟合和过拟合的影响

正则化参数太小容易产生过拟合,太大容易产生欠拟合。

2018-08-04 09:32:26 3840 1

原创 for 循环 注意点

Python for循环 尽量写成这种形式(names 是一个列表):for j in range(len(names)):不要写成这种形式:for name in names:当names是一个空列表时,上面一种情况不会出现空类型错误! ...

2018-07-31 17:37:35 194

原创 神经元个数

隐藏层单元的神经元个数通常是特征个数的 1倍 2倍 4倍 等。

2018-07-30 20:48:26 3373

原创 神经网络计算过程

计算过程就像是在进行Logistic回归计算,只不过最后的输出结果用的不是原始的x, 是经过计算之后的特征值而已。

2018-07-30 10:12:10 1846

原创 Logistic and Sigmoid

Logistic function 和 Sigmoid function 表示的是同一个意思。

2018-07-30 09:55:04 151

原创 梯度下降和正规方程

执行梯度下降算法,不同属性的取值范围要保持大致一致(大约在-1到1之间)一般认为-3到3就是安全的,这样执行梯度下降算法收敛的更快。正规方程方法不需要使用特征缩放。...

2018-07-29 08:54:19 392

原创 逆矩阵存在的条件

逆矩阵充要条件有多种表述方式,以下三条相互等价:1. 矩阵的行列式不等于零2. 矩阵为满秩矩阵3. 矩阵的合同标准型是单位矩阵逆矩阵: 设A是数域上的一个n阶方阵,若在相同数域上存在另一个n阶矩阵B,使得: AB=BA=E。 则我们称B是A的逆矩阵,而A则被称为可逆矩阵。没有逆矩阵的矩阵称为“奇异矩阵”或“退化矩阵”...

2018-07-28 16:52:48 34349

原创 字符串和数字ASCII

字符串的比较与 tuple 类似,也是从第一个字符开始比较 ASCII 码,直到两个字符不相等为止。字母与数字的ASCII 码大小范围是 "a-z" > "A-Z" > "0-9",

2018-07-24 19:13:01 2567

原创 fit_transform 和 transform

2018-07-16 17:37:55 497

原创 朴素贝叶斯

朴素贝叶斯法对条件概率分布做了条件独立性的假设,由于这是一个较强的假设,朴素贝叶斯也由此得名!这一假设使得朴素贝叶斯法变得简单,但有时会牺牲一定的分类准确率。...

2018-07-16 10:16:25 152

转载 全概率公式、贝叶斯公式推导过程

https://www.cnblogs.com/ohshit/p/5629581.html

2018-07-16 09:46:14 2147

原创 DatetimeIndex 对象

DatetimeIndex 对象可以直接获取日期的 年 月 日time_value 是日期类型的对象time_value = pd.DatetimeIndex(time_value)time_value.yeartime_value.monthtime_value.weekday # 周几time_value.hour...

2018-07-05 09:59:59 2477

原创 K近邻

使用K紧邻算法,需要先对数据进行标准化或归一化。

2018-07-04 15:52:20 194

数据结构习题

课后习题答案

2013-06-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除