自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

原创 java 正则 正向 逆向 匹配

Often unknown, or heralded as confusing, regular expressions have defined the standard for powerful text manipulation and search. Without them, many of the applications we know today would not functio...

2014-03-21 17:32:02 457

原创 Android中Context详解 ---- 你所不知道的Context

转自:http://blog.csdn.net/qinjuning/article/details/7310620 大家好, 今天给大家介绍下我们在应用开发中最熟悉而陌生的朋友-----Context类 ,说它熟悉,是应为我们在开发中 时刻的在与它打交道,例如:Service、BroadcastReceiver、Activity等都会利用到Context的相关方法 ; 说它陌生...

2014-02-26 20:40:47 143

原创 非常好的一个集合工具类

今天读Heritrix看到这么个类,设计非常棒,多个集合的合并其实并不需要新建集合对象,并进行数据搬移。public class CompositeIterator implements Iterator { protected ArrayList iterators = new ArrayList(); protected Iterator currentIterat...

2014-01-16 10:01:28 152

原创 java中byte, int的转换 [转]

转自:http://freewind886.blog.163.com/blog/static/661924642011810236100/int -> byte可以直接使用强制类型转换: byte b = (byte) aInt;这个操作是直接截取int中最低一个字节,如果int大于255,则值就会变得面目全非了。对于通过InputStream.read()获取的int,可采用这个...

2013-12-24 16:09:59 551

原创 mysqldump导出数据

【mysqldump导出数据】备份数据库Linux代码 #mysqldump 数据库名 >数据库备份名 #mysqldump -A -u用户名 -p密码 数据库名>数据库备份名 #mysqldump -d -A --add-drop-table -uroot -p >xxx.sql #mysqldump 数据库名 >数据库备份名#...

2013-12-19 00:00:37 153

原创 redis之dump.rdb存放位置

若按默认配置:dbfilename dump.rdb这时dump.rdb存放位置是不固定的,而是存放在启动redis时的当前目录

2013-12-13 13:53:36 5147 1

原创 [转]Redis 配置文件详解

[size=x-large] 转自:http://weipengfei.blog.51cto.com/1511707/1217504(基于Redis 2.6)基础部分设置:daemonize no#默认情况下redis 不是以守护进程的模式运行。pidfile /var/run/redis.pid#在守护进程模式下,pid进程号文件路径的存储位置port 637...

2013-12-13 09:48:48 83

原创 [转]CRF条件随机场简介

[size=large]转自:http://hi.baidu.com/hehehehello/item/3b0d1f8ba1c2e5c698255f89 CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析、命名实体识别、词性标注等。在我看来,CRF就像一个反向的隐马尔可夫模型(HMM),两者都是用了马尔科夫链作为隐含...

2013-12-12 15:40:47 117

原创 Tomcat绑定内网IP

2013-12-11 18:31:38 287

原创 [转]关于MMSEG分词算法

转自:http://hi.baidu.com/catro/item/5c76247c0ff6a9376f29f6edMMSEG是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较快。关于算法的原文,可以参 见:http://technology....

2013-12-11 14:44:29 83

原创 切分歧义字段的综合性分级处理方法

转自:http://www.ooreport.com/bbs/topicView.aspx?Id=91400切分歧义字段的综合性分级处理方法--北京大学计算语言学研究所讨论班, 99.4.13孙 斌北京大学计算语言学研究所(*)在这次讨论班要报告的内容:一、 汉语自动分词的必要性、困难、分词系统的指标二、 自动分词算法的分类三、 几种典型的自...

2013-12-03 10:55:34 1078

原创 三种中文分词算法优劣比较【转】

===============================================================================转自:作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051)Email:jyz3051 at yahoo dot com dot cn('at'请替换成'@','dot'请替换成'.' )====...

2013-11-29 13:53:55 799

原创 [转]Baidu分词算法分析详解

http://blog.sina.com.cn/s/blog_a48ff37201010cxv.html

2013-11-29 11:39:54 67

原创 [转]布隆过滤器 (Bloom Filter) 详解

转自:http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常...

2013-10-15 15:49:17 105

原创 spring @ResponseBody 返回json格式问题

错误:The resource identified by this request is only capable of generating responses with characteristics not acceptable according to the request "accept" headers (). 网上一般的解决方法: 首先引入jackson...

2013-10-11 23:22:07 265

原创 Velocity与jQuery的$发生冲突

Velocity的$与Jquery的$发生冲突时的解决方法有以下几个:1、使用jQuery代替$。   如:jQuery.ajax();   缺点:不适合扩展,一旦替换成第三方库时,那就麻烦大发2、使用jQuery.noConflict。   如:var j = jQuery.noConflict(); j.ajax();   缺点:当使用jQuery的相关插件时,会使得插件失效哦!3、wrap ...

2013-10-05 20:56:56 78

原创 spring 中文乱码

form表单的中文值提交后成乱码。、查了一下资料,在web.xm中做一个中文过滤的配置就OK了。上体配置如下,参考:http://www.cnblogs.com/rollenholt/archive/2012/12/26/2833921.htmlspring Web MVC框架提供了org.springframework.web.filter.CharacterEncodingFilter用...

2013-09-23 14:58:07 76

原创 google svn 服务器使用

转自:http://ipc.iteye.com/blog/447554 1. 进入http://code.google.com/ 用Google帐户登录(推荐使用gmail邮箱)。然后点击>Project Hosting 2. 进入>> http://code.google.com/hosting/  然后点击>Create a new project...

2013-09-14 23:58:12 62

原创 Linux下安装 Redis 并配置开机启动

1、下载安装:1cd /tmp2wget http://redis.googlecode.com/files/redis-2.2.13.tar.gz3tar -zxf redis-2.2.13.tar.gz4cd redis-2.2.135make6sudo...

2013-09-04 09:53:15 138

原创 [转]ubuntu下eclipse的svn插件使用javahl

转自:http://www.cnblogs.com/feng_013/archive/2010/07/22/1783228.html ubuntu下eclipse安装subclipse之后使用javaHL作为连接器会出现一下错误:Failed to load JavaHL Library.These are the errors that were encountered:n...

2013-08-30 11:28:31 78

原创 MYSQL5.5修改字符集报错:unknown variable 'default-character-set=utf8'

今天在修改MYSQL字符集的时候启动报错:unknown variable 'default-character-set=utf8'看来是default-character-set=utf8这个设置项惹得祸....因为MYSQL 5.5修改了字符集设置参数应该改成:用character_set_server=utf8 取代default-character-set=utf...

2013-08-14 13:07:51 211

原创 【转】 出现java.lang.UnsupportedClassVersionError 错误的原因

转自:http://blog.csdn.net/shendl/article/details/1050611 出现java.lang.UnsupportedClassVersionError 错误的原因  出现java.lang.UnsupportedClassVersionError 错误的原因,是因为我们使用高版本的JDK编译的Java class文件试图在较低版本的JV...

2013-08-14 09:45:22 229

原创 data:image/png;base64

大家可能注意到了,网页上有些图片的src或css背景图片的url后面跟了一大串字符,比如:data:image/png;base64, iVBORw0KGgoAAAANSUhEUgAAAAEAAAAkCAYAAABIdFAMAAAAGXRFWHRTb2Z0d2FyZQBBZG9iZSBJbWFnZVJlYWR5ccllPAAAAHhJREFUeNo8zjsOxCAMBFB/ KEAUFFR0Cb...

2013-08-08 13:01:51 2519

原创 Java多线程sleep(),join(),interrupt(),wait(),notify()

1. sleep() & interrupt()     线程A正在使用sleep()暂停着: Thread.sleep(100000);     如果要取消他的等待状态,可以在正在执行的线程里(比如这里是B)调用         a.interrupt();     令线程A放弃睡眠操作,这里a是线程A对应到的Thread实例     执行interrupt()时,并不需要获取Threa...

2013-07-23 23:40:30 62

原创 spring @value注解

 转自 http://jackyrong.iteye.com/blog/1330946在spring 3.0中,可以通过使用@value,对一些如xxx.properties文件 中的文件,进行键值对的注入,例子如下: 1 首先在applicationContext.xml中加入:    <beans xmlns:util="http://www.springframework....

2013-07-23 18:27:51 176

原创 关于设置http响应头connection的作用

 转自:http://chenchendefeng.iteye.com/blog/461248  有的网站会在服务器运行一段时间后down掉,有很多原因可能造成这种现象:比如tomcat堆和非堆内存设置不足,程序没能释放内存空间造成内存溢出,或者某些进程一直运行没能释放,造成cup资源大量消耗。      但除了程序本身的原因,还有可能是客服端访问造成(当然这个客户端也包含如蜘蛛...

2013-07-19 15:47:24 704

原创 BeanNameAware

 如果某个 bean 需要访问配置文件中本身的 id 属性,则可以使用 BeanNameAware 接口,该接口提供了回调本身的能力。实现该接口的 bean,能访问到本身的 id 属性。该接口提供一个方法:voidsetBeanName(String name)。该方法的 name 参数就是 bean 的 id。该方法在依赖关系设置之后,初始化回调(InitializingBean 的 ...

2013-07-19 13:20:45 185

原创 libsvm 常见问题

  转自:http://dly0205.blog.sohu.com/54750954.html 这里是libsvm的FQA : 问: 我在那里能够找到libsvm的文件 ? 软件包中有一个 README 文件,里面详细说明了所有参数选项、数据格式以及库函数的调用。在python目录下,模型选择工具和python界面的libsvm各有一个README文件。 初学者可以通过A...

2013-07-11 23:54:53 902

原创 【转】SVM入门(十)将SVM用于多类分类

  本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/26/262113.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外,例如垃圾邮件过滤,就只需要确定“是”还是“不是”垃圾邮件),比如文本分类,比如数字识别...

2013-07-09 13:52:43 91

原创 【转】文本分类入门(十一)特征选择方法之信息增益

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html 前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用...

2013-07-09 13:52:20 87

原创 【转】SVM入门(九)松弛变量(续)

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/17/260315.html 接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C。回头看一眼引入了松弛变量以后的优化问题:注意其中C的位置,也可以回想一下C所起的作用(表征你有多么重视离群点,C越大越重...

2013-07-08 14:30:40 91

原创 【转】SVM入门(八)松弛变量

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/15/259786.html 现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了)。现在想象我们有另一个训练集,只比原先这个训练...

2013-07-08 13:40:28 79

原创 【转】SVM入门(七)为何需要核函数

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/06/258288.html 生存?还是毁灭?——哈姆雷特可分?还是不可分?——支持向量机之前一直在讨论的线性分类器,器如其名(汗,这是什么说法啊),只能对线性可分的样本做处理。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来...

2013-07-08 13:17:32 129

原创 【转】SVM入门(六)线性分类器的求解——问题的转化,直观角度

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/03/01/257237.html 让我再一次比较完整的重复一下我们要解决的问题:我们有属于两个类别的样本点(并不限定这些点在二维空间中)若干,如图,圆形的样本点定为正样本(连带着,我们可以把正样本所属的类叫做正类),方形的点定为负例。我们想求得这样一个线性函数(在n...

2013-07-08 11:42:28 83

原创 【转】SVM入门(五)线性分类器的求解——问题的描述Part2

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/02/14/254630.html 从最一般的定义上说,一个求最小值的问题就是一个优化问题(也叫寻优问题,更文绉绉的叫法是规划——Programming),它同样由两部分组成,目标函数和约束条件,可以用下面的式子表示:(式1)约束条件用函数c来表示,就是constra...

2013-07-08 11:41:04 80

原创 【转】SVM入门(四)线性分类器的求解——问题的描述Part1

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/02/13/254578.html 上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔和几何间隔的...

2013-07-07 23:43:40 76

原创 【转】SVM入门(一)至(三)Refresh

 本文转自:http://www.blogjava.net/zhenandaci/archive/2009/02/13/254519.html (一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中...

2013-07-07 16:59:21 68

原创 Java中的字符集编码入门——Java中的增补字符

  本文转自:http://www.blogjava.net/zhenandaci/archive/2009/01/05/249866.html Java号称对Unicode提供天然的支持,这话在很久很久以前就已经是假的了(不过曾经是真的),实际上,到JDK5.0为止,Java才算刚刚跟上Unicode的脚步,开始提供对增补字符的支持。现在的Unicode码空间为U+0000到U...

2013-07-07 16:49:15 98

原创 Java中的字符集编码入门——Java代码中的字符编码转换

 本文转自 http://www.blogjava.net/zhenandaci/archive/2008/12/25/248213.html 如果你是JVM的设计者,让你来决定JVM中所有字符的表示形式,你会不会允许使用各种编码方式的字符并存?我想你的答案是不会,如果在内存中的Java字符可以以GB2312,UTF-16,BIG5等各种编码形式存在,那么对开发者来说,连进行最基本的...

2013-07-07 16:30:49 137

原创 Java中的字符集编码入门——网页文件的编码

 本文转自 http://www.blogjava.net/zhenandaci/archive/2008/12/24/248062.html  接着上节的思路说,一个网页要想在浏览器中能够正确显示,需要在三个地方保持编码的一致:网页文件,网页编码声明和浏览器编码设置。首先是网页文件本身的编码,即网页文件在被创建的时候使用什么编码来保存。这个完全取决于创建该网页的人员使用了什么编...

2013-07-06 23:49:21 68

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除