自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

统计分析与数据挖掘

Data->information->knowledge->intelligen

  • 博客(77)
  • 资源 (6)
  • 收藏
  • 关注

原创 一些开源代码网站介绍(持续添加中....)

1、Netlib 网站:http://www.netlib.org/介绍:Netlib is a repository of software for scientific computing maintained by AT&T, Bell Laboratories, the University of Tennessee and Oak Ridge National L

2012-12-13 15:01:29 6800

原创 Fedora 新的服务管理工具

从Fedora16开始,Redhat不再推荐ntsysv、chkconfig、service,而是建议使用新的服务管理工具systemctl ,尽管旧指令也是可以用.

2015-04-29 15:28:33 5897

原创 c++编码规范

目录版权声明概述针对 C 程序员的快速回顾语法高亮与字体字体语法高亮文件结构文件头注释头文件内联函数定义文件实现文件文件的组织结构命名规则类/结构函数变量常量枚举、联合、typedef宏、枚举值名空间

2013-01-11 11:16:24 9018

原创 多处理器环境和线程同步的高级话题

本文主要阐述与 C/C++ 语言相关性比较紧密的,SMP 环境下的多线程同步问题。之所以称之为《高级话题》是因为本文预期的读者已经具备了信号量、互斥量、条件变量、原子操作和竞态条件等方面的背景知识。我们将以此为基础开始讨论三个相对高级一点的问题:原子操作和 volatile 关键字全局对象初始化时的线程安全性和相互依赖性问题局部静态对象初始化时的线程安全性问题 原子操作和 vola

2013-01-11 10:48:21 6419

原创 C++11 新特性点评

C++11 在不久之前已获通过,它对 C++03 的扩充主要体现在核心语言和标准库两个方面。本文主要讨论 C++11 中,新特性所带来的变化。目录核心语言右值引用和移动构造语义常量表达式(constexpr)放宽的 POD 类型定义extern 模板修饰初始化列表统一的初始化方式类型推断基于范围的遍历操作Lambda 表达式和闭包返回值后置式函数声明语法委托和成员默认初始值

2013-01-11 10:29:10 8728

原创 c++ typename 关键字扫盲

typedef _CharT char_type; typedef _Traits traits_type; typedef typename traits_type::int_type int_type; typedef typename traits_type::pos_type pos_type; typedef t

2013-01-08 11:09:00 5574

原创 硬盘下安装CentOS \Fedora

从硬盘安装Linux/GNU操作系统,有不需要光盘驱动器及刻录光盘等便利特点,因而具有实用价值。本文描述了Windows XP环境下使用Grub4Dos进行硬盘安装Fedora/CentOS Linux操作系统的详细步骤和方法(Grub4Dos是大名鼎鼎的引导装载程序Grub在Dos/Windows环境版本,其基于Grub开发并对其功能进行了增强和扩充,具有更好的兼容性和适应性)。 1

2012-12-19 15:11:49 5610

原创 LAPACK 相关 (继续添加中)

1、LAPACK的编译http://gcc.gnu.org/testing/testing-lapack.html

2012-12-13 11:30:43 5667

原创 Fedora 16 改变启动顺序

一、这是一个默认启动Windows的例子:1. 首先找到Windows的menuentry.# cat   /boot/grub2/grub.cfg | grep Windows结果:menuentry "Windows 7 (loader) (on /dev/sda1)" --class windows --class os {2. 设

2012-12-02 12:03:23 5743

原创 linux 各个系列介绍(转)

Linux操作系统的发行版本可以大体分为两类,一类是商业公司维护的发行版本,一类是社区组织维护的发行版本,前者以著名的Redhat(RHEL)为代表,后者以Debian为代表。Redhat,应该称为Redhat系列,包括RHEL(Redhat Enterprise Linux,也就是所谓的Redhat Advance Server,收费版本)、Fedora Core(由原来的Redhat桌

2012-11-28 10:16:24 10263

原创 SVN中tag branch trunk用法详解(zhuan)

本节主要讲解一下SVN中tag branch trunk的用法,在SVN中Branch/tag在一个功能选项中,在使用中也往往产生混淆。这里就向大家简单介绍一下,欢迎大家能和我一起学习SVN中tag branch trunk的用法。在实现上,branch和tag,对于svn都是使用copy实现的,所以他们在默认的权限上和一般的目录没有区别。至于何时用tag,何时用branch,完全由人主观的根

2012-11-27 09:31:11 7017 1

原创 c++11 新风格(转)

StroustrupC++11标准推出了很多有用的新特性,本文特别关注那些相比C++98更像是一门新语言的特性,理由是:这些特性改变了编写C++程序使用的代码风格和习语【译注 1】,通常也包括你设计C++函数库的方式。例如,你会看到更多参数和返回值类型为智能指针(smart pointer),同时也会看到函数通过值传递返回大型对象。你将会发现在大多数的代码示例中充斥着新特性的身

2012-11-26 11:13:42 5796

原创 Eclipse FAQ/C++11 Features

Eclipse FAQ/C++11 Features: 包括:eclipse包括c++11特性语法时的编译设置http://wiki.eclipse.org/CDT/User/FAQ#CDT_does_not_recognize_C.2B.2B11_features

2012-11-19 11:00:07 4908

原创 fedora 16 下 eclipse svn 插件安装

1、首先通过 eclipse help菜单下的软件安装菜单安装svn 插件插件地址网址为:http://subclipse.tigris.org/update_1.6.x      //后面的 1.6.x 可以换成其他的版本  如 :1.7.x   1.8.x 等2、重启eclipse 后如果报缺少 javaHL之类的库,使用下面的命令进行安装 javaHL 库# yum in

2012-11-07 13:06:16 5785

原创 linux 下 svn 常用命令

0、SVN 帮助 svn help svn help co  //子命令查看 1、将文件checkout到本地目录 svn checkout path(path是服务器上的目录) 例如:svn checkout svn://192.168.1.1/pro/domain 简写:svn co 2、往版本库中添加新的文件 svn add f

2012-11-06 11:12:14 7155

原创 学习统计类算法要诀

2.带着问题看各种书,不要看书找问题;   3.带着问题,集中几天系统看,不要每天看一点;   4.不断地问自己为什么;   5.原理、概念的理解比算题重要得多;   6.统计方法高级不一定好,简单有效最好。   7.讲清才是真懂,理解只是前奏;   8.统计先是思维方式,而后才是数学;   9.努力体验提升思维境界和突破思维疆界的兴奋;

2012-08-16 10:25:21 6605

原创 水务方面项目总结(2012-07-20)

昨天听取了公共水利部分的汇报,有如下总结,供各位共勉。 建议:1、 水利有先发优势,提高核心竞争能力a) 要和现有系统串联起来b) 强化信息资源目录、管控指标和辅助决策c) 同实时监控的对接 2、 总结提炼a) 明确目标和对象,做了那些功能,管理的目标是什么b) 给用户创造的价值,不管是社会的还是经济的还是自身的c) 系统的关键技术和特点是什么?

2012-08-08 21:27:29 7544

原创 关联规则算法(扫盲篇)

关联规则算法课件,对关联规则中的几个概念讲述的非常清楚http://wenku.baidu.com/view/6be795d9ad51f01dc281f187.html#10002-qzone-1-83904-35...数据挖掘整体介绍及关联规则应用案例http://www.docin.com/p-89331253.html?bsh_bid=101197840

2012-07-31 13:14:59 6583

原创 MATLAB 函数大全

附录1 常用命令附录1.1 管理用命令函数名功能描述函数名功能描述addpath增加一条搜索路径rmpath删除一条搜索路径demo运行Matlab演示程序type列出.M文件doc装入超文本文档version显示Matlab的版本号help启动联机帮助what列出当前目

2012-07-30 13:30:51 9361

原创 SAS逻辑回归实例

作为某商品类目公司的市场分析师,你可能需要为二值目标变量(purchase)建立逻辑回归模型,判断某个顾客是否会产生购买。输入数据集存放在SAS安装文件的SAMPSIO.DMEXA1中,该数据集包含1966个顾客观测值信息。它包含31个区间变量输入和18个分类变量输用于构建模型。该逻辑回归模型产生的打分公式应用在新的数据集中,给那些可能产生购买的顾客发送邮件。1创建SAS EM工程

2012-07-20 12:40:11 22829 2

原创 决策树 & SAS

决策树决策树主要用来描述将数据划分为不同组的规则。第一条规则首先将整个数据集划分为不同大小的子集,然后将另外的规则应用在子数据集中,数据集不同相应的规则也不同,这样就形成第二层数据集的划分。一般来说,一个子数据集或者被继续划分或者单独形成一个分组。1问题背景预测模型案例概述一家金融服务公司为客户提供房屋净值贷款。该公司在过去已经拓展了数千净值贷款服务。但是,在这些申

2012-07-20 12:36:27 15427 4

原创 常见多变量/多元统计分析方法分类图

2012-07-20 11:31:20 8088 1

原创 再见,2012! (转自小武哥-左右程序,右手诗)

又一年过去了,每年到了年底的时候,总会感叹光阴比箭还快,离开家又整整一年了。回看了一下年初给自己制定的计划,感慨满满,总觉得要写点什么,来对过去的一年有个交待,那就写点什么吧。      首先说一下工作,过去的一年,是整个搜索后台大重构最重要的一年,从基础的云平台,到基本的搜索的后台,几乎都在重构。说实话,这一年大家都很累,但换个角度来讲,这对我们来说也是一个机会,一个深入了解搜索引擎后台

2012-07-18 14:57:13 1855

原创 linux程序分析工具介绍—ldd,nm

本文要介绍的ldd和nm是linux下,两个用来分析程序很实用的工具。ldd是用来分析程序运行时需要依赖的动态库的工具;nm是用来查看指定程序中的符号表相关内容的工具。下面通过例子,分别来介绍一下这两个工具:1. ldd, 先看下面的例子, 用ldd查看cs程序所依赖的动态库:$ ldd cslinux-gate.so.1 => (0xffffe000)libz.so

2012-07-18 14:35:23 7183

原创 R-2.15.1 在 fedora16 上的安装(Can't find X11 headers and libs)

在安装 configure 的过程中会发生如下两个错误:Can't find X11 headers and libs ,还有一个是着不到 readline 的头文件及libs。此时需要安装下面这两个依赖包yum install readline-develyum install libXt-devel

2012-07-18 13:00:43 1995

原创 linux cat more less显示文件的区别

cat命令功能用于显示整个文件的内容单独使用没有翻页功能因此经常和more命令搭配使用,cat命令还有就是将数个文件合并成一个文件的功能。 more命令功能:让画面在显示满一页时暂停,此时可按空格健继续显示下一个画面,或按Q键停止显示。 less命令功能:less命令的用法与more命令类似,也可以用来浏览超过一页的文件。所不同的是less命令除了可以按空格键向下显示文件外,还可以利用上下

2012-07-18 10:50:46 1214

原创 使用 yum 安装 virtualbox 虚拟机

直接下载 virtualbox 包安装时,有时要安装依赖包,比较麻烦,所以用yum来安装比较方便,步骤如下:Install Fedora or RHEL Repo Filescd /etc/yum.repos.d/ ## Fedora 17/16/15/14/13/12 userswget http://download.virtualbox.or

2012-07-17 20:25:00 6607

原创 fedora16 下安装 gcc4.7.1

去gcc官方网站 下载最新版本的gcc-4.7.0.tar.bz2,同时在infrastructure目录下寻找下载【必须】的mpc-0.8.1.tar.gz、mpfr-2.4.2.tar.bz2,去http://gmplib.org/ 下载最新的gmp-5.0.4.tar.bz2开始安装gcc 4.7.1 依赖包,以下包的安装步骤不能错乱tar jxvf gmp-5.0.

2012-07-17 20:08:03 2466 2

原创 GCC 环境变量 & eclipse CDT 头文件配置

在unix 下使用eclipse 进行c/c++开发时,默认是使用系统的头文件路径,如果你自己新安装了编译器,比如最新版 gcc 4.7.1,这个时候你要将头文件路径指向你的gcc安装路径,配置如下图:菜单 window-->preferences添加变量 CPP_INCLUDE_PATH重启后,Include中的c++头文件就指向新设置的路径了

2012-07-16 12:44:55 7541

原创 Fedora 添加国内源(sohu, 163)

在国内163和搜狐提供很好的源,现在我们把它们俩添加到我们的源库。1. 添加搜狐的源进入网站http://mirrors.sohu.com/,在左边找到fedora目录,点击该行右边的help, 然后下载fedora-sohu.repo和fedora-updates-sohu.repo, 放入/etc/yum.repos.d/运行yum makecache生成缓存2.  添加1

2012-07-15 19:10:48 6997

原创 configure: error: C++ preprocessor “/lib/cpp” fails sanity 错误的解决

/lib/cpp fails sanity check的解决在某些软件的时候,运行./configure 会报错,错误提示为:configure: error: C++ preprocessor “/lib/cpp” fails sanity check See `config.log’ for more details解决办法:出现该情况是由于c++编译器

2012-07-13 15:44:42 9724

原创 如何做一个优秀的eader

TeamLeader是比较尴尬的角色,是从技术往管理的一个尝试性的阶段,这个阶段是比较辛苦的,1. TL首先要注意自己的定位,许多事情你都有责任从单位的角度,是希望你能站在他们的立场上把事情做好;从下属的角度,他们希望能够遇到一个开明的头。所以你一开始就要注意好你的策略,你是否和你的上层有明确的沟通,你能做到什么,什么你不能做;你决定你自己是站在哪一方面,当你决定你站在一方面以后,

2012-07-13 09:37:36 1605 2

原创 孤立点分析常用方法

孤立点是指数据集中那些小模式数据,它可能是度量或执行错误所导致的, 也可能是固有数据变异性的结果。Hawkins给出了其本质性定义: 孤立点是在数据集中与众不同的数据, 使人怀疑这些数据并非随机偏差, 而是产生于完全不同的机制。一般的孤立点挖掘中存在两个基本任务:一是在给定的数据集合中定义什么样的数据可以被认为不一致的; 二是找到一个有效的方法来挖掘这样的孤立点。   传统的孤立点挖掘算法

2012-07-11 11:43:40 8084

原创 丽江游玩攻略1

最近发现的好网站,关于游玩,与大家分享:http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10186.html   介绍很全面。--2012/08/14概 况:    丽江古城位于中国西南部云南省的丽江纳西族自治县,始建于宋末元初(公元13世纪后期)。古城地处云贵高原,海拔2400余米,全城面积达3.8平方公里,自古就是远近闻名的集市和重

2012-07-09 22:06:12 10052 1

原创 使用yum下载而不安装rpm包

你需要安装yum-downloadonly,这个rpm包将为yum添加--downloadonly 、--downloaddir这两个选项# yum install yum-downloadonly 好了!现在想要下载什么就是你的事了,如我现在要下载httpd,执行# yum update httpd -y --downloadonly --downloaddir=/opt

2012-07-06 09:30:15 935

原创 linux查找技巧: find grep xargs

在当前目录下所有.cpp文件中查找efg函数find . -name "*.cpp" | xargs grep 'efg'xargs展开find获得的结果,使其作为grep的参数另外 rm mv等命令对大量文件操作时报错 -bash: /bin/rm: Argument list too long也可用xargs 解决删除当前目录下所有.cpp文件find . -name

2012-07-05 14:54:46 27741

原创 科普-文本挖掘(文本分类)流程

一个典型的文本分类的数据挖掘流程如下图,这张图初看有点乱,我这里解释一下,红色的部分是训练时候调用的模块,绿色是测试时候调用的模块,而蓝色的部分是训练的时候生成的中间文件,它们联系着训练、测试两个部分。从左到右看是算法运行的流程,首先用户给出原始的用于训练的中文文本,然后进行分词等操作。 经过了生成矩阵这个步骤,文本就转化成了数学语言了,之后的算法都是运行在这个数学语言之上,之后的算法就不再关心输

2012-07-04 13:56:05 6404

原创 规则化和模型选择(Regularization and model selection)

2012-07-03 11:44:12 1269

原创 判别模型、生成模型与朴素贝叶斯方法

2012-07-03 11:22:32 2776

原创 需求分析中的注意点

在做项目时,经常会碰到这样的事情:客户向我们反映在和你们的工程师谈论需求时,他们总是满口答应没问题。可是,当他们做好以后,拿过来一看,根本就不是这么回事。而开发人员也在诉苦:用户什么都不懂,而且他们的需求老是变动,时间又这么紧,你让我们怎么办?我觉得如果开发人员在做需求分析时,需要注意下面几点:一、掌握相关的行业知识,会前做好充分准备通常会面前的问题列表准备

2012-07-03 10:03:14 5811 1

大数据下实时推荐系统架构文档

大数据环境下如何架构实时推荐系统的说明文档,使用了目前流行的spark hbase kafa sparkstream ml spray ...等技术。

2016-01-08

PASW Modeler 14 帮助文档

PASW Modeler 14 帮助文档,包括算法、节点介绍,建模介绍等。

2013-06-21

关联规则算法详细说明

关联规则算法详细说明,入门级人士看完此文档就能掌握该算法了。

2012-07-19

hadoop/mapreduce-矩阵乘法 mapreduce的实现(代码)

最近在研究hadoop与mapReduce,网上教程只有个wordcount程序示范,太简单,故写了个相对复杂点的涉及到多个文件之间同时运算的矩阵乘法的代码用于实验与测试,上传供大家学习与参考。 调用方法: 执行:hadoop jar matrix.jar com.baosight.mapred.test.MatrixMulti left:/tmp/a right:/tmp/b output:/tmp/c leftprefix:000000_ rightprefix:000000_ >参数1:left:左矩阵路径 >参数2:right:右矩阵路径 >参数3:output:左矩阵乘右矩阵结果路径 >参数4:leftprefix:左矩阵文件前缀 如/tmp/a/000000_0,000000_1,000000_2……的000000_ >参数5:rightprefix:右矩阵文件前缀 >左右矩阵按列存储,每个文件只存放一列值,如2x2的单位矩阵, 000000_0存放1 0 000000_1存放 0 1

2012-06-27

R and Hadoop

R Hadoop About Revolution Analytics Why R and Hadoop? The Packages (rhdfs, rhbase, rmr) Examples Resources and Further Reading Co-sponsored by Revolution and Cloudera

2012-05-17

scrum敏捷软件开发方法介绍

scrum敏捷软件开发方法介绍 目录如下 1、敏捷宣言及原则 2、常见的敏捷方法 3、敏捷方法的关键实践 4、Scrum敏捷开发方法 5、总结

2012-05-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除