自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

.

只是一个网盘

  • 博客(28)
  • 资源 (12)
  • 收藏
  • 关注

原创 【python学习笔记】

如何查看math下的所有方法import math # Imports the math moduleeverything = dir(math) # Sets everything to a list of things from mathprint everything # Prints 'em all!

2014-09-09 20:29:09 2461

转载 数据挖掘书单

2014.2.1更新,由于经常接到私信要求在这个书单之内再推荐两三本,每个人的行业背景也不一样,所以就把下面的书单归类整理一下。入门读物:深入浅出数据分析 (豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。啤酒与尿布 (豆瓣) 通过案例来说事情,而且是最经典的例子。难易程度:非常易。数据之美 (豆瓣) 一本介绍性的书籍,每章都解决一

2014-07-21 14:04:48 2151

转载 机器学习书单

入门书单《数学之美》 PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Soluti

2014-07-21 11:34:53 1389

转载 推荐几个机器学习算法及应用领域相关的中国大牛

李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性等问题的研究。曾在人大听过一场他的讲座,对实际应用的问题抽象,转化和解决能力值得学习。周志华

2014-07-15 16:38:01 1064

转载 一些自由的数据挖掘工具

R • R (http://www.r-project.org/) • Tinn-R(http://sourceforge.net/projects/tinn-r/)基于R语言环境的一个GUI。数据挖掘• Weka (http://www.cs.waikato.ac.nz/ml/weka/)– 一个数据挖掘的开源软件,和R一样产自新西兰。Weka是新西兰一种特产鸟类

2014-07-14 11:11:11 1473

原创 基于朴素贝叶斯分类器的文本分类算法的实现过程分析

基于朴素贝叶斯分类器的文本聚类算法 (上) http://www.cnblogs.com/phinecos/archive/2008/10/21/1315948.html 基于朴素贝叶斯分类器的文本聚类算法 (下)http://www.cnblogs.com/phinecos/archive/2008/10/21/1316044.html

2014-07-11 23:41:12 2468

转载 CSS选择器

CSS的基本选择器h1{color:blue; font-size:25px; text-decoration:underline;} /*标签选择器 */em{ color:red;} p span{ color:green;}p{font-weight:normal; font-size:55px;}.red{ color:red;

2014-07-10 20:57:07 680

原创 【读书笔记-数据挖掘概念与技术】高级模式挖掘

模式挖掘是一个比频繁挖掘模式更一般的shu'yu

2014-07-09 22:05:18 3180

原创 【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法

基本概念:频繁模式

2014-07-05 20:26:07 1416

原创 【学习计划】

2014-7 《数据wa》

2014-07-05 09:50:37 543

原创 Mac下遇到的mysql问题集

mac在系统偏好设置中无法停止My'S

2014-07-04 23:08:39 10895

原创 【读书笔记-数据挖掘概念与技术】数据立方体技术

基本概念:单元:基本方体的单元 聚集单元:非基本方体的单元 冰山立方体:部分物化的立方体 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围)∵冰山立方体仍有大量不感兴趣的单元需要计算∴引入——闭覆盖——一个单元没有后代或者它的后代的度量值与其不同                 没理解 法2:只预计算涉及少数维的立方体,这些方体形成的数据立方体

2014-07-04 20:01:57 1850 1

转载 理解maven的核心概念

好久没进行java方面的开发了,最近又完成了一个java相关的任务,顺便重新体会了 maven 这一利器。在使用过程中发现以前对maven的理解不够深入,借此机会重新梳理了一下maven的核心概念。相信理解了这些核心概念, 即使长时间不使用,以后再重新上手也会非常容易。本文以类图的方式,介绍maven核心的12个概念以及相互之间的关系。Table of Contents

2014-07-02 22:28:55 4910 3

转载 机器学习算法汇总:人工神经网络、深度学习及其它

摘要:机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里我们将为您总结一下常见的机器学习算法,以供您在工作和学习中参考。【编者按】机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式根

2014-07-02 09:57:19 1220

转载 hadoop三个配置文件的参数含义说明

1       获取默认配置配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,有两个方法:1.选择相应版本的hadoop,下载解压后,搜索*.xml,找到

2014-07-02 09:51:11 1137

原创 MAC下配置maven

官方文档:Unix-based Operating Systems (Linux, Solaris and Mac OS X)Extract the distribution archive, i.e. apache-maven-3.2.2-bin.tar.gz to the directory you wish to install Maven 3.2.2. These in

2014-07-02 08:56:57 3881

原创 【Mac OSX 遇到的问题】

复制粘贴快捷键的设定:系统偏好设置--》键盘--》快捷键--》应用程序快捷键--》添加。

2014-07-01 11:35:27 1064

原创 【阿里大数据】S1

测试数据:链接: http://pan.baidu.com/s/1pJI3Bzd 密码: r3vp

2014-06-29 23:30:47 2090 2

原创 【读书笔记-数据挖掘概念与技术】数据仓库与联机分析处理(OLAP)

数据仓库:

2014-06-29 22:14:53 2693

原创 【读书笔记—Hadoop实战】认识hadoop

hadoop是一个开源的框架,可编写和

2014-06-29 10:14:22 5132

原创 【hadoop入门实战】Mac上安装hadoop,并运行程序(1)

安装hadoop

2014-06-28 23:43:05 38404 6

原创 【读书笔记-数据挖掘概念与技术】数据预处理

数据预处理是为了提高数据质量,数据质量的三要素:zhun'que'x

2014-06-28 17:16:00 1398

原创 数据挖掘学习资源

张磊Blog:http://idmer.blog.sohu.com/?from=inf&wvr=5&loc=infblog

2014-06-28 10:10:15 825

原创 【JOB】

数据分析师职位描述工作职责: 1、负责业务数据采集整理,对数据进行深度分析、挖掘和建模; 2、对用户行为数据进行分析和挖掘,基于客观的分析结果找到可能的问题并给改进的意见; 3、基于网站的运营数据,设计用于统计分析的数据指标,从多个角度度量网站运营的状况,并制作各种反映运营状况的数据报表; 4、为公司运营决策、产品方向提供数据支持。 任职资格: 1、经济分析

2014-06-28 10:01:24 611

原创 【读书笔记-数据挖掘概念与技术】认识数据

属性分类:标称属性二元属性序数属性数值属性

2014-06-27 16:34:14 1607

原创 hadoop学习资源

blog:http://www.iteblog.com/

2014-06-27 09:32:48 938

原创 数据挖掘中的基本概念

OLAP:联机分析处理

2014-06-26 09:48:18 1044

原创 【DP-最大子串和】PAT1007. Maximum Subsequence Sum

1007. Maximum Subsequence Sum (25)时间限制400 ms内存限制32000 kB代码长度限制16000 B判题程序Standard作者CHEN, YueGiven a sequence of K integers { N1, N2, ..., NK }. A continuous

2014-06-23 01:21:33 1779

2008EPL Effect of initial configuration on network-based Recommendation

机器学习,推荐系统从入门到精通,必看的论文材料。

2014-08-20

2009自然科学进展 个性化推荐系统的研究进展

推荐系统的循序渐进读物,从入门到精通。机器学习必备。

2014-08-20

推荐系统的循序渐进读物

推荐系统的循序渐进读物,从入门到精通。机器学习必备。

2014-08-20

NumPy Cookbook

作者简介 · · · · · · 作者简介: Ivan Idris 实验物理学硕士。先后任职于多家公司,从事Java开发、数据仓库开发和QA分析等工作。主要的兴趣是商业智能、大数据和云计算,喜欢编写整洁、可测试的代码,以及撰写有趣的技术文章。另著有NumPy Beginner's Guide和Instant Pygame for Python Game Development How-to等书。可以访问ivanidris.net获取更多信息。

2014-08-11

深度学习的昨天今天和明天

蛮有意思的一篇文章,有关机器学习,深度学习!

2014-08-11

Mining of massive datasets

大规模数据集挖掘,机器学习的重要内容,可以适当做一些翻译

2014-08-11

Neural Network Learning Theoretical Foundations

神经网络经典资料,可以尝试翻译并学习!机器学习的水平提高

2014-08-11

The_Top_Ten_Algorithms_In_Data_Mining

十大算法的pdf就是出自这本书,适合初学者阅读

2014-08-10

基于naive bayes英文分类器(利用HashMAP进行预处理)(java)

基于naive bayes英文分类器(利用HashMAP进行预处理)(java),与一般的naive bayes不同的是,这里判断了词频,并且存在HASHMAP里面。效果比较好。

2014-07-31

libsvm开源软件包

LIBSVM 是台湾大学林智仁(Chih-Jen Lin)博士等开发的一个操作简单、 功能强大、支持多语言的通用的 SVM 包,可以解决分类问题,(包括 C-SVC、 v-SVC)、回归问题(包括 SVR   、v SVR  )以及分布估计(one-class-SVM)。 提供了线性、多项式、径向基、S 形 4 种常用的核函数供选择,可有效地提供 解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计 等

2014-07-31

how to do research at the MIT AI lab.pdf

how to do research at the MIT AI lab.pdf

2014-07-31

汉字识别技术

汉字识别技术,有助于理解汉子的识别模式。

2014-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除