3 yehui_qy

尚未进行身份认证

暂无相关描述

等级
TA的排名 10w+

高维数据可视化

tsne-importtensorflowastfimportmathfromsklearnimportdatasetsfromsklearn.manifoldimportTSNEimportnumpyasnpimportmatplotlib.pyplotasplt#n_components维数#iris_dataset=datasets.l

2017-10-26 15:19:18

tensorboard的使用

tensorboard启动pipshowtensorflowpythontensorboard/**.py–logdir=”tensorboard数据分析

2017-10-18 11:10:16

weka使用

简介集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/download?use_mirror=nchc入口界面Explorer(探索环境)Knowledge

2017-02-23 22:06:34

weka使用调研

简介集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/download?use_mirror=nchc入口界面Explorer(探索环境)Knowledge

2017-02-20 15:04:24

多种数据过滤与降维算法

数据过滤1.缺失值比率(MissingValuesRatio)方法的是基于包含太多缺失值的数据列包含有用信息的可能性较少。因此,可以将数据列缺失值大于某个阈值的列去掉。阈值越高,降维方法更为积极,即降维越少。2.低方差滤波(LowVarianceFilter)与上个方法相似,该方法假设数据列变化非常小的列包含的信息量少。因此,所有的数据列方差小的列被移除。需要注意的一点

2017-01-10 15:58:21

计算广告领域的几大经典问题

大纲

2017-01-09 14:55:13

机器学习技能树

大纲

2017-01-09 14:51:32

特征工程基础

大纲

2017-01-09 14:47:25

机器学习基础

大纲

2017-01-09 14:45:22

统计学相关基础

大纲

2017-01-09 14:44:35

机器学习-常见的数据预处理

背景常见的数据预处理方法

2016-12-21 20:36:36

机器学习-数据归一化

定义数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。两种常用的归一化方法min-max标准化Z-score标准化方法优点归一化后加快了梯度下降求最优解的速度

2016-12-21 17:09:52

libsvm使用

libsvm

2016-12-06 18:57:02

基本统计与统计分析

相关矩阵-相关系数与协方差的区别是:协方差的绝对值大小不能评判相关性强弱,而相关系数弥补了这个缺点。相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i行和第j列的相关系数。这里的相关系数是指皮尔逊相关系数。著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关

2016-12-01 16:37:14

crond定时任务

定时任务sudotouch/etc/cron.d/yehuisudovim/etc/cron.d/yehui4714***rootbash/home/a/husky/apps/ecpm_algo_n_cmopeval/bin/mlpcommon_main_flow>/home/yehui.yh/common_main_flow.log2>&1sudoln-s

2016-11-28 15:46:17

机器学习-多分类问题

决策树和svm用于多分类的表现上的差异:

2016-11-18 15:53:37

数据分布-泊松分布

泊松分布的现实意义是什么?为何现实生活多数服从于泊松分布?一、基础概念在一个时间段内事件平均发生的次数服从泊松分布,这个次数在泊松分布中用lambda表示(与指数分布里面的意义一样,是一个时间段内事件平均发生的次数)。泊松分布(Poisson)是指某段连续的时间内某件事情发生的次数,而且“某件事情”发生所用的时间是可以忽略的。假如你把“连续的时间”分割成无数小份,那么每个小份之间都是相互独立

2016-11-18 15:14:27

sql

显示表中除了partition意外的所有列selectt.`(ds)?+.+`fromtablet;wm_concat(‘;’,cust_id)聚合yincount(DISTINCT),统计非空coalesce(a,0)相当于if(a=null,0,a)SELECT/+MAPJOIN(a)/将a表放在内存中,用于到a表是小表导致数据倾斜的时候

2016-07-26 17:11:07

maven test debug 方法

在配置化自动化测试方法的执行依赖于maventest指定的配置文件的场景下,需要由maventest来触发的集成测试,无法直接采用ideadebugtest方法的方式;这种情况下可以采用mavendebug的方式来debug代码,可以分为远程debug和本地debug两种模式,本文以远程debug为例子(这个方法和远程debug项目环境的开发代码类似)。

2016-07-21 07:39:43

一些链接

测试

2016-07-19 10:25:43

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!