4 claire_9797

尚未进行身份认证

数据产品 // 机器学习 // Modelling 一直在路上

等级
TA的排名 65w+

R语言——连接mysql数据库

在R使用数据库接口## 使用数据库接口# 使用dbConnectinstall.packages("RMySQL")library(RMySQL)# 数据库配置信息channel <- dbConnect(MySQL(), user="yuxiaoyang", #用户名 password="yu...

2018-06-14 15:03:55

【转载】什么是P问题、NP问题和NPC问题

这或许是众多OIer最大的误区之一。    你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所说的NP问题其实都是指的NPC问题。他们没有搞清楚NP问题和NPC问题的概念。NP问题并不是那种“只有搜才行”的问题,NPC问题才是。好,行了,基本上这个误解已经被澄清了。下面的内容都是在讲什么是P问题,什么是NP问题,什么是N...

2018-06-13 17:50:45

集成学习——好而不同

接上一篇《树分类与树回归》,进一步讲解将弱分类器集成强分类器的集成方法。除了对现有理论知识的提炼汇总外,增加了很多自己的理解,请尊重原创。一、集成原理    机器学习常常用来解决分类与回归的问题,我们总是希望找到一个这样模型,它不仅对现有数据具有很好的拟合能力,对测试数据也有优秀的泛化能力,同时希望计算成本越低越好。实际上,对于一个实际问题往往找不到这么完美的解决方案,但是寻找一个表现不那么差的模...

2018-05-15 19:19:25

决策树与树回归

一、决策树步骤:定义评价指标,混乱程度的描述方法——entropy。计算整个数据集的熵划分数据集的最佳方式。遍历所有特征,循环计算熵。选择熵增最大的特征作为划分数据集的节点递归计算树的每一层,直至用完所有特征属性 or 每个分支下的实例都属于相同的分类。(如果遍历完所有属性仍旧未将数据集划分结束,则将其归属为出现最多的类别)需要遍历所有的特征以及特征属性值。二、树回归贪心算法:给定时间内的最佳选择...

2018-05-10 16:08:40
勋章 我的勋章
    暂无奖章