- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 机器学习笔记-文本专题(TF-IDF)
对于根据主题对文档进行分类的问题,主要是通过找到一些能够体现主题的词语来区分。通过算法查找关键词,先默认出现次数最多的词语越重要。 但是出现最多的都是类似 “的” ‘地’ ‘了’ 这些辅助词或停用词,需要去除TF.IDF : TF(Term Frquency 词项频率), IDF(Inverse Document Frequency 逆文档频率)TF
2016-11-09 14:18:08 281
原创 机器学习笔记-二分类评估相关术语
正例|返例 精度、错误率 分类正确和错误样本占总样本总量TP FP FN TN 真正例、假正例、假反例、真反例 正例 反例 正例 TP(真正例) FN(假反例) 反例 FP(假正例) TN(真反例)查准率 真正例 数(TP)/ 预测的所有正例数(TP+FP)真正例+假正例查全率 真正例 数(TP)/ 样本中的所有正例数(TP+FN)
2016-10-26 18:08:41 577
Building Machines That Learn and Think Like People(造类人智能机器)
2016-11-21
msvcr100.dll winutils.exe hadoop
2016-11-09
winutils.exe
2016-11-09
Head First Design Patterns 英文影印版本
2014-02-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人