自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 资源 (2)
  • 收藏
  • 关注

原创 科比难说再见

我不喜欢你,但是我不得不尊敬你 属于你的关键词“勤奋”    不多解释  ---凌晨四点的洛杉矶“天赋”    不多解释 ,能以高中生身份进入联盟的球员,哪一个不是天赋异禀 “独”    你是一个孤独的人,专注的人。用苛刻的标准,要求自己、队友。  回忆   不记得什么时候知道你的名字,只记得大学时很多人穿着你的球衣、穿着你的鞋,并以你为傲。后来看你...

2016-04-14 16:19:28 1626

原创 crontab命令

一、crond简介crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。Linux下的任务调度分为两类,系统任务调度和用户任务调度。系统任务调度:系统周期性所要...

2016-02-04 11:29:18 196

原创 Linux查看系统配置常用命令

Linux查看系统配置常用命令 系统# uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本# cat /proc/cpuinfo # 查看CPU信息# hostname # 查看计算机名# lspci -tv # 列出所有PCI设备# lsusb -tv # 列出所有USB设备# lsmod # 列出加载的内核模块#...

2016-02-03 15:58:37 171

原创 yum

yum(全称为 Yellow dog Updater, Modified)是一个在Fedora和RedHat以及SUSE中的Shell前端软件包管理器。基於RPM包管理,能够从指定的服务器自动下载RPM包并且安装,可以自动处理依赖性关系,并且一次安装所有依赖的软体包,无须繁琐地一次次下载、安装。yum提供了查找、安装、删除某一个、一组甚至全部软件包的命令,而且命令简洁而又好记。yum的命令形...

2015-03-27 18:29:31 181

原创 搭建我的CentOS7

 搭建我的CentOS7分类: Linux2014-09-19 12:50 544人阅读 评论(0) 收藏 举报 目录(?)[+] 搭建我的CentOS7学习一下centos7的一些特性,并在上面做一些日常练习,写写代码什么的。为了方便日后再搭建,做一下记录。下载安装在centos官网上下载,minimal的iso镜像,只有500M...

2015-03-27 18:17:37 133

原创 SQL 和Mongo 对比图表

SQL 和Mongo 对比图表博客分类: MySQL&Mongodb&MS/SQL 参看官方说明:  http://www.mongodb.org/display/DOCS/SQL+to+Mongo+Mapping+Chart   MySQL executableOracle executable...

2014-12-12 19:55:34 172

原创 大众点评的大数据实践<转>

摘要:大众点评网从2011年中开始使用Hadoop,并专门建立团队。Hadoop主分析集群共有60多个节点、700TB的容量,月运行30多万个Hadoop Job,还有2个HBase线上集群。作者将讲述这各个阶段的技术选择及改进之路。2011年小规模试水这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试。为了满足用户的需求,我们还调研了任务调度系统和数据交换系统。...

2014-11-18 09:35:33 342

原创 mongodb 常用命令

BSON       BSON是Binary JSON 的简称,是一个JSON文档对象的二进制编码格式。BSON同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型。如:BSON有Date类型和BinDate类型。       BSON被比作二进制的交换格式,如同Protocol Buffers,但BSON比它更“schema-less”,非常好的灵...

2014-11-13 16:16:41 143

原创 在Centos中yum安装和卸载软件的使用方法

安装方法安装一个软件时yum -y install httpd安装多个相类似的软件时yum -y install httpd*安装多个非类似软件时yum -y install httpd php php-gd mysql卸载一个软件时yum -y remove httpd卸载多个相类似的软件时yum -y remove httpd*卸载多个非类似软件时yum -y remove httpd ...

2014-11-13 11:29:45 130

原创 Centos 搭建mongodb

作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs下面我们在CentOS 6.5 x64系统上安装最新的MongoDB 2.6.0版。MongoDB v2.4.x版的软件仓库有两个包:1)mongo-10gen-server此包里面有最新版的mongod和mongos守护程序以及相关的配置和初始化脚本。2)mongo-10gen此包里面有最新版的所有M...

2014-11-12 18:26:08 109

原创 国内各地图API坐标系统比较(转载)

在开始这个题目之前,先给大家再次扫扫盲,扫的不是坐标系统的盲,而是我们国家所使用的坐标系统。大家都知道,美国GPS使用的是WGS84的坐标系统,以经纬度的形式来表示地球平面上的某一个位置,这应该是国际共识。但在我国,出于国家安全考虑,国内所有导航电子地图必须使用国家测绘局制定的加密坐标系统,即将一个真实的经纬度坐标加密成一个不正确的经纬度坐标,我们在业内将前者称之为地球坐标,后者称之为火星坐标,...

2014-11-05 17:48:47 366

如何从Eclipse导入github上的项目源码

1.首先在github.com上申请一个账号,比如笔者的账号为puma0072.Eclipse需要安装egit插件,在Eclipse中选择help-》Marketplace,在search中输入egit,找到后安装即可3.在github上找到你要导入的源码项目,比如笔者以oschina的Android客户端为例,网址:https://github.com/oschina/android-app4...

2014-08-16 19:15:29 166

原创 卸载 android 系统app

☆1.下载一键安全root软件,安装后运行,选择获取临时root权限。☆2.下载系统程序卸载器SystemAppRemover,安装后运行,进入界面后会提示已获得root权限,选择点击右下角SystemApps,之后就可卸载安卓系统自带程序了吧。但要慎重一些,有些系统程序还是有用的,完成之后,重启系统,就可回复普通用户权限。     ※注:带*号的千万不能删:         *AccountAn...

2013-12-29 09:17:29 480

原创 chrome启动参数设置

hrome禁止本地浏览时加载本地其他文件,可以采用添加启动参数的方式来支持添加参数为 --allow-file-access-from-files  或者 --disable-web-security   Google Chrome 浏览器默认安装路径是 %USERPROFILE%\AppData\Local\Google\Chrome,其中User Data文件夹存放cac...

2013-12-22 18:17:24 387

原创 NMF(非负矩阵分解)的SGD(随机梯度下降)实现

NMF把一个矩阵分解为两个矩阵的乘积,可以用来解决很多问题,例如:用户聚类、item聚类、预测(补全)用户对item的评分、个性化推荐等问题。NMF的过程可以转化为最小化损失函数(即误差函数)的过程,其实整个问题也就是一个最优化的问题。详细实现过程如下:(其中,输入矩阵很多时候会比较稀疏,即很多元素都是缺失项,故数据存储采用的是libsvm的格式,这个类在此忽略)  [ja...

2013-05-22 06:36:44 360

原创 模型选择(转载)

http://www.cnblogs.com/jerrylead/archive/2011/03/27/1996799.html1 问题     模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)?     还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎...

2013-04-10 05:11:25 166

原创 lucene3.0_IndexWriter基础使用及注意事项(转载)

http://www.cnblogs.com/huangfox/archive/2010/10/15/1852371.html

2013-04-09 11:32:06 134

原创 Nutch1.2 添加IKAnalyzer中文分词(zhuan)

http://blog.csdn.net/jiutao_tang/article/details/6461884

2013-04-08 10:05:19 158

Factoriztion Machine

       FM是推荐系统中使用的一种推荐模型,在很多领域有很好的推荐效果 .      kdd2012, wsdm2013有几篇论文都取得了比较好的效果。 数据格式:     与libsvm一样 接受的数据格式和libSVM是一样的,每行一个数值(分类结果or打分结果等),对应一组特征,每个非零特征都需要给出数值,零特征忽略主要思想:     传统的线性分类器: y=...

2013-03-07 06:35:31 162

原创 第 3 部分: 深入推荐引擎相关算法 - 聚类

http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/index.html?ca=drs-聚类分析什么是聚类分析?聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中...

2013-03-04 06:31:55 133

原创 第 1 部分: 推荐引擎初探

转载自 http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs-“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据...

2013-03-04 06:28:48 134

原创 第 2 部分: 深入推荐引擎相关算法 - 协同过滤

转载自http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html?ca=drs集体智慧和协同过滤什么是集体智慧集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web 应用中利用集体智慧构建更加有趣的应用或者...

2013-03-04 06:26:42 98

原创 原来Chrome自带了抓包功能

chrome://net-internals/#requests

2013-02-21 09:08:07 597

原创 Android系统手机端抓包方法

需求原因在对移动数据业务进行质量指标分析的过程中,需要在手机终端侧进行抓包分析。由于Android系统是当前的主流系统之一,因而实现在Android系统手机端进行抓包分析对移动数据业务质量指标分析具有重要作用。抓包准备1. Android手机需要先获得root权限。一种是否获得root权限的检验方法:安装并打开终端模拟器(可通过安卓市场等渠道获得)。在终端模拟器界面输入su并回车...

2013-02-20 10:09:38 118

原创 JProfiler与eclipse集成

转载自:http://my.oschina.net/heguangdong/blog/114881下载jprofiler_windows_5_1_4.zip和JProfilter.512crack.zip破解文件http://download.ej-technologies.com/jprofiler/jprofiler_windows_5_1_4.ziphttp://dl.ja...

2013-01-27 21:17:39 121

最新手机语音助手的调研

几个助手的分析虫洞语音助手智能360百度语音助手讯飞语点搜狗语音助手灵犀小i机器人

2013-01-27 07:23:11 217

原创 复杂的1秒图解Google搜索技术

 你点击了Google搜索按钮之后到看到结果这不足1秒钟的时间内,它做了什么?大家不妨看看谷歌搜索流程图,这张流程图展示了每天拥有3亿次点击量的Google搜索按钮背后搜索引擎在那不到1秒的响应时间内所进行的处理。转载自陈利人     ...

2012-12-21 05:37:00 201

原创 如何写robots

转载自: http://www.dunsh.org/2006/08/02/robotstxt/ 在国内,网站管理者似乎对robots.txt并没有引起多大重视,应一些朋友之请求,今天想通过这篇文章来简单谈一下robots.txt的写作。 robots.txt基本介绍robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定...

2012-12-20 06:43:03 104

龙星学习计划4-线性分类器

线性分类器

2012-11-27 05:25:18 84

原创 龙星学习计划3

linear regression

2012-11-21 04:37:01 112

原创 抱柱之信

《庄子・盗跖》:“尾生与女子期于梁下,女子不来,水至不去,抱梁柱而死。 看看庄子也没有文化,这不是记流水账么,干巴巴的?  时间地点人物事件几个要素都不全...........  反过来看,是不是我们的教育出了问题,真正的知识道理不需要华丽的词语,只需要突出自己的逻辑与主干。  好好学习一下庄子这种朴素的作风吧...

2012-11-17 14:11:15 136

龙星学习计划2

2

2012-11-14 06:50:54 117

原创 龙星学习计划1

123

2012-11-09 05:48:58 129

原创 机器学习研讨会

 11月3日,清华大学六教6C3008:30 – 8:45开幕式        张长水 教授(清华大学)Regular Session 1 – Session Chair: 周志华 教授(南京大学)8:45 – 9:35On Learning Sparse Structured Input-Output Mo...

2012-11-03 07:02:47 362

关于基于规则方法的反思【连载4】-思考

【问5】All and only假设是错的吗?【答】是错的,而且是最核心的方向性错误。基于规则方法未来要复兴,必须对All and only假设进行彻底的清算和否定。 为了更好地阐述笔者的观点,我们把“all and only”假设用计算机领域的术语复述一遍,如果有谁认为这不是乔姆斯基的原意,或者不是二十几年来基于规则方法主流技术路线的实际,欢迎商榷。另外,这里所说的“规则”仍然是狭...

2012-10-11 06:44:21 135

原创 eclipse 中code assist 设置-转载

如果你在Eclipse中,输入“.”后没有代码提示出现,请看下面的解决步骤。 1.window->Preferences->Java->Editor->Content Assist->Advanced 上面的选项卡Select the proposal kinds contained in the 'default' content assist list: 中 把 Other Jav...

2012-10-05 18:26:35 487

原创 使用Jersey构建rest接口

原文地址http://www.vogella.com/articles/REST/article.html从rest最基本的知识开始介绍,有介绍的jersey的开发过程,简单易学十分推荐 原文内容:RESTful Webservices with Java (Jersey / JAX-RS)This tutorial explains how to devel...

2012-10-04 16:17:20 221

关于基于规则方法的反思【连载3】-思考

原文地址:http://blog.sina.com.cn/s/blog_729574a0010134zr.html 原文内容: 【问4】基于规则方法是不是“拍脑袋”?【答】不是。基于规则方法做了两件事情。第一,对“规则长什么样”做了一些可证伪的基础假设;第二 ,鼓励人们对一些具体的语言,按照这些可证伪的基础假设,建立相应的具体的规则体系。第一件事情是 基于大量的...

2012-09-26 06:47:57 164

关于基于规则方法的反思【连载2】-思考

  原文地址:http://blog.sina.com.cn/s/blog_729574a0010134fj.html原文内容: 【问3】基于规则方法的主流技术路线是什么?它的主要贡献是什么?【答】追溯历史,可以发现:基于规则方法起源于结构主义语言学派,伴随生成语言学派在语言学界占据主导地位而在计算语言学界达到鼎盛,伴随因特网的兴起而被基于统计的方法逐渐趋于边缘化。因此,谈...

2012-09-25 05:47:19 204

对白老师的文章《关于基于规则方法的反思【连载1】》的思考

  原文地址:http://blog.sina.com.cn/s/blog_729574a0010134bq.html 原文内容: 【问1】:基于规则方法和基于统计方法,被称为自然语言处理的两大“阵营”,并且上升到理性主义和经验主义“之争”的高度。请问,这个概括是否准确?两大阵营“之争”到目前为止是否已经见分晓?【答】:确实有两种技术路线之争。从上个世纪九十年代初阵营划...

2012-09-24 06:53:17 169

cheatsheet-python

平时收集的cheatsheet,大家的编码效率至少提高50%. 包括 python, scipy numpy 等很多必要工具

2018-03-05

lucene-analyzers-3.3.0 jar包和源码

lucene-analyzers-3.3.0 jar包和源码。

2011-08-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除