12 yaoyepeng

尚未进行身份认证

学生

等级
TA的排名 3w+

Useful Javascript resources

http://www.scriptiny.com/

2011-11-28 14:51:53

数据挖掘领域顶级会议期刊及其分析

 JournalsACMTKDD http://tkdd.cs.uiuc.edu/DMKD http://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0IEEETKDE http://www.ieee.org/organizations/pubs/transactions/tkd

2011-06-09 12:55:00

UCI数据集和源代码&数据挖掘的数据集资源

<br />《UCI数据集和源代码》<br />UCI数据集是一个常用的标准测试数据集,下载地址在<br />http://www.ics.uci.edu/~mlearn/MLRepository.html<br />我的主页上也有整理好的一些UCI数据集(arff格式):<br />http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip<br />在看别人的论文时,别人使用的数据集会给出数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)

2011-03-27 21:15:00

聚类分析中几种算法的比较

<br />     将数据库中的对象进行聚类是聚类分析的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大,为了找到效率高、通用性强的聚类方法人们从不同角度提出了近百种聚类方法,典型的有K-means方法、K-medoids方法、CLARANS方法,BIRCH方法等,这些算法适用于特定的问题及用户。本文综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中常用聚类方法作了比较分析,以便于人们更容易、更快捷地找到一种适用于特定问题及用户的聚类算法。

2011-03-27 19:40:00

Acrobat9.0激活方法

<br />    在安装软件之前,先要打开 C:/windows/system32/drivers/etc/hosts 文件,往其中添加 127.0.0.1 activate.adobe.com 一行,这是防止到官方网站验证。<br />    hosts 是个隐藏文件,如果你找不到,则需要先修改“文件夹选项”中的相关设定。打开“文件夹选项”,切换到“查看”选项卡,选中“隐藏文件和文件夹”下面的“显示所有文件和文件夹”,然后单击“确定”。<br />也有人说要往 hosts 中添加更多屏蔽网址,如

2011-02-02 19:28:00

一些有用的电驴网址

<br />0、http://www.emule-project.net/<br />1、http://www.simplecd.org/<br />2. http://qvocd.com/<br />3、http://www.ied2k.com/<br />4、http://www.thshare.net/<br />5、http://www.eastgame.net <br />eastgame.net <br />6、http://www.chnp2p.com/<br />7、http://www.h

2011-01-27 12:13:00

python与java在语法上的几个不同点

<br />python的基本语法,和java的做个比较:<br /><br />一、数<br />    python只有4种类型的数:整数,长整数,浮点数和java中没有的复数;<br />    java则有char,short,byte,int,long,float,double类型;<br /><br />二、字符串<br />    python没有表示单个字符的char类型,可以用单引号,双引号来表示一个常量字符串,也可以用三引号('''或者“”“)来表示一个多行的字符串;<br />   

2010-10-29 23:45:00

Hadoop示例程序WordCount详解

<br />package com.felix; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable;

2010-10-29 13:23:00

Hadoop中的数据库访问

Hadoop主要用来对非结构化或半结构化(HBase)数据进行存储和分析,而结构化的数据则一般使用数据库来进行存储和访问。本文的主要内容则是讲述如何将Hadoop与现有的数据库结合起来,在Hadoop应用程序中访问数据库中的文件。1.DBInputFormatDBInputFormat是Hadoop从0.19.0开始支持的一种输入格式,包含在包org.apache.hadoop.mapred.lib.db中,主要用来与现有的数据库系统进行交互,包括MySQL、PostgreSQL、Oracle等几个数据库系

2010-10-29 13:18:00

VC实现无标题栏对话框的拖动

<br /> <br />1.在消息映射中手动添加:<br />afx_msg UINT OnNcHitTest(CPoint pt);<br />2.在.cpp文件中添加:<br />BEGIN_MESSAGE_MAP(CMyDialog, CDialog)<br />//{{AFX_MSG_MAP(CMyDialog)<br />ON_WM_SYSCOMMAND()<br />ON_BN_CLICKED(ID_APP_ABOUT,OnAbout)<br />ON_WM_PAINT()<br />ON_W

2010-10-20 23:02:00

c++&&python实现Hadoop Streaming的partitioner和模块化

<br />Hadoop Streaming 是一个工具, 代替编写Java的实现类,而利用可执行程序来完成map-reduce过程<br /><br />工作流程 : <br /><br />InputFile --> mappers --> [Partitioner] --> reducers --> outputFiles<br /><br />理解 : <br />1 输入文件,可以是指定远程文件系统内的文件夹下的 *<br />2 通过集群自己分解到各个PC上,每个mapper是一个可执行文件,相

2010-10-14 11:27:00

Ubuntu下使用Dr.com上网

<br />    首先,当然要下载个linux下的drcom源代码,在这里可以下载最新版本的drcom。<br />http://sourceforge.net/projects/drcom-client/files/drcom-for-linux-2.6/<br /> <br />    然后把下载的drcom-1.*.*.tar.gz放在桌面,右键解压到此处。<br />    进入刚解压的目录,执行<br />make<br />sudo make install<br />    PS:在这里

2010-10-09 15:53:00

在Ubuntu9.10环境下的Hadoop分布式模式的部署

Linux下的Hadoop--分布式模式的部署  选用软件版本:1. jdk 1.6.0.102. hadoop-0.19.11. 准备Host环境和配置ssh主节点IP是192.168.1.247,子节点1是192.168.1.36,修改两个节点的/etc/hosts文件:# /etc/hosts (for master AND slave)192.168.1.247 master192.168.1.36 slave分别在两台机器上添加用户hadoop①在master上:groupadd -g 2000

2010-10-09 13:59:00

用Python来写MapReduce的实际应用程序

<br />用Python来写分布式的程序。这样速度快。便于调试,更有实际意义。MapReduce适合于对文本文件的处理及数据挖掘用:<br />  在每台机器上:<br />su - hadoop<br />wget http://www.python.org/ftp/python/3.0.1/Python-3.0.1.tar.bz2<br />tar jxvf Python-3.0.1.tar.bz2<br />cd Python-3.0.1<br />./configure --prefix=/h

2010-10-09 13:56:00

Hadoop学习资料、博客及网站汇总

Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看http://cloud21.javaeye.com/blog/607175 关于Hadoop的两本书 -- 有电子书下载http://caibinbupt.javaeye.com/blog/418846 JavaEye Hadoop圈子 -- 圈子中的Hadoop资源篇很不错http://hadoop.group.javaeye.com/ 豆瓣hadoop小组http://www.douban.com/group/156966/ 推荐Clou

2010-10-09 13:29:00

Hadoop学习资料及网站汇总

Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看http://cloud21.iteye.com/blog/607175关于Hadoop的两本书 -- 有电子书下载http://caibinbupt.iteye.com/blog/418846JavaEye Hadoop圈子 -- 圈子中的Hadoop资源篇很不错http://hadoop.group.iteye.c...

2010-10-06 20:27:31

Cygwin国内镜像

之前用互联网安装Cygwin时用的都是台湾或是日本的源,平均速度在30k/s左右,今天偶然发现了一个163的源,速度达到了100k/s~200k/s,真是安装首选啊,下面介绍安装方法:在安装程序到选择站点时,将http://mirrors.163.com/cygwin/填入,点击Add按钮,即可。...

2010-10-06 15:07:15

计算机核心期刊排名及投稿信息

<br /><br />1    计算机学报    北京    中国计算机学会等<br />2    软件学报    北京    中国科学院软件研究所<br />3    计算机研究与发展    北京    中国科学院计算技术研究所等<br />4    自动化学报    北京    中国科学院等<br />5    计算机科学    重庆    国家科技部西南信息中心<br />6    控制理论与应用    广州    中国科学院系统科学研究所等<br />7    计算机辅助设计与图形学学报    北

2010-10-01 22:30:00

Hadoop备忘

Hadoop简介Hadoop 由 Apache Software Foundation 公司于 2005 年秋天作为 Lucene 的子项目 Nutch 的一部分正式引入。它受到最先由 Google Lab 开发的 MapReduce 和 Google File System 的启发。2006 年 3 月份,MapReduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。Hadoop 是最受欢迎的在 Internet 上对搜索关键字进

2010-09-26 19:30:00

Ubuntu10.04 硬盘安装方法

Ubuntu10.04硬盘安装法: 提取 ISO 里 casper 文件夹中的 “vmlinuz” 和 “initrd.lz” 文件到某分区下的某文件夹中,如 /dev/sda2 的 ubuntu 文件夹中,同时把 Desktop 版本的 ISO 更名为 ubuntu.iso 并放到该文件夹中,即 ubuntu 文件夹中有 “ubuntu.iso”、“vmlinuz” 和 “initrd.

2010-05-01 00:47:00

查看更多

勋章 我的勋章
    暂无奖章