- 博客(4)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 情感分析badcase分析
训练数据集:有157637条, 主要由酒店评论数据10000条、财经(主要是股市类)评论数据、微博评论数据(社会类、闲聊)训练集数据存在重复:去重后有150875训练集分布:正面:负面:中性 占比为: 训练集使用word2vec+DBSCAN 后有5861个类,详细统计如下:类别 定义 样本数 簇个数 大簇...
2019-05-24 11:07:44 4449
转载 Kaggle如何入门?
送一篇非常好的文章,https://dnc1994.com/2016/04/rank-10-percent-in-first-kaggle-competition/首先简单介绍一些关于 Kaggle 比赛的知识: 1. 不同比赛有不同的任务,分类、回归、推荐、排序等。比赛开始后训练集和测试集就会开放下载。 2. 比赛通常持续 2 ~ 3 个月,每个队伍每天可以提交的次数
2017-04-23 16:06:24 2089
原创 互联网公司数据分析/挖掘面试机器学习面到的题目
1、LR原理及公式推导,有哪些优化方法,梯度下降,牛顿法以及各种变种,L1、L2范数的区别,优缺点。2、GBDT、XGBOOST原理异同,如何并行化等等(最好去xgboost官方看原始论文,讲得很清楚)随机森林原理及细节。3、如何解决数据不均衡问题。SVM原理及细节,SVM和树模型的异同以及优缺点和局限性。4、推荐系统,协同过滤原理,基于用户、物品等等。深度学习中的一些小问题,比如re
2017-04-23 15:32:21 982
转载 mysql对某个字段分组侯取topN的sql写法
问题:有表 如下,要求取出各班前两名(允许并列第二)Table1+----+------+------+-----+| id |SName |ClsNo |Score|+----+------+------+-----+| 1 |AAAA | C1 | 67 || 2 |BBBB | C1 | 55 || 3 |CCCC | C1 | 67
2017-04-20 14:42:36 6336
text-segmentation-master.zip
2019-05-24
三个集合韦恩图可视化?
2016-05-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人