- 博客(3)
- 收藏
- 关注
转载 在分类中处理训练集中类别不平衡问题
1.扩大数据集 当遇到类别不均衡问题时,首先应该想到,是否可能再增加数据(一定要有小类样本数据),更多的数据往往战胜更好的算法。因为机器学习是使用现有的数据多整个数据的分布进行估计,因此更多的数据往往能够得到更多的分布信息,以及更好分布估计。即使再增加小类样本数据时,又增加了大类样本数据,也可以使用放弃一部分大类数据(即对大类数据进行欠采样)来解决。2.尝试其他分类指标 类别不均衡的分...
2018-04-22 22:48:33 1961
原创 Python用两个栈实现队列
思想:用A栈存储入队的数据,出队时先把A栈的数据全部pop进B栈,再对B栈进行pop操作。Python代码如下:# -*- coding:utf-8 -*-class Stack(object): # 初始化栈为空列表 def __init__(self): self.stack = [] # 判断栈是否为空,返回布尔值 def is_empty(self):...
2018-04-16 22:53:32 161
转载 LR与SVM比较
相同点第一,LR和SVM都是分类算法。第二,如果不考虑核函数,LR和SVM都是线性分类算法,也就是说他们的分类决策面都是线性的。第三,LR和SVM都是监督学习算法。第四,LR和SVM都是判别模型。判别模型会生成一个表示P(Y|X)的判别函数(或预测模型),而生成模型先计算联合概率p(Y,X)然后通过贝叶斯公式转化为条件概率。简单来说,在计算判别模型时,不会计算联合概率,而在计算生成模型时,必须先计...
2018-04-15 21:29:31 480
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人