自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

追梦船的专栏

追逐梦想的人 会飞!

  • 博客(317)
  • 资源 (4)
  • 收藏
  • 关注

原创 Solution of Codility

Solution of Codilitycodility.com is another great place to improve your programming skill. Train myself , and record here.Lesson 1: Time Complexity Lesson 2: Counting Elements Lesson 3: Prefix Sums

2015-06-02 22:05:33 2383

原创 中文分词实现——双向最大匹配

关于中文分词的一些基本介绍,可以看这篇博客《中文分词方法总结》。这里就不再进行详细介绍了。双向最大匹配方法双向最大匹配方法是一种基于词典的分词方法。基于词典的分词方法是按照一定策略将待分析的汉字串与一个“大机器词典”中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。按照扫描方向的不同:正向匹配和逆向匹配按照长度的不同:最大匹配和最小匹配正向最大匹配思想FM

2014-11-02 16:06:44 17661 8

原创 汉字自动注音程序

汉字注音在平时应用中,可能会有这样的需求:要给一些中文进行自动注音。这个程序就是根据这个需求实现的。思想汉字注音程序的思想主要是依赖一些已有的常用词的注音词表。对于给定的需要注音的汉字串text,首先对text进行分词。这里的分词方法采用了正向最大匹配和逆向最大匹配想结合的方法。然后根据注音词表中每个词是某个音的概率,得到一个最大可能的注音结果。思想很简单,

2014-11-01 20:07:39 2923

原创 网站性能评测实验

实验内容本实验的目的是利用主流的网站分析工具对Alexatop100的前5名网站进行分析,评价其网站性能。在本实验中,我将在Windows平台下进行实验,评测的网站是目前Alexatop 100 的前5名的网站,包括google.com, Facebook.com, Youtube.com, Yahoo.com 和baidu.com。但是由于网络的问题,我们无法登陆到Facebook.com和

2014-04-22 00:14:34 2677

原创 语音识别结果文本纠错综述

语音识别结果的纠错是语音理解过程中的一项重要工作。由于受限于语音识别的准确性,语音识别的结果常常会出现错误,这将对语音理解的后续工作造成障碍,增加了语音理解的难度。语音识别结果的纠错可以对一些识别的错误结果进行纠正,从而提高语音理解的准确性。目前,用于语音识别结果纠正的方法有很多,但还没有一个主流的方法。大多数的ASR后修正的研究都是基于词的识别结果概率信息的统计方法。Ringger和Al

2014-04-16 16:08:46 9729 5

原创 MySQL error: The partition with /var/lib/mysql is too full!

启动mysql /etc/init.d/mysql start我遇到了这个问题:MySQL error: The partition with /var/lib/mysql is too full! 于是在网上搜索解决方法:方法一: sudo /etc/init.d/mysql stop sudo /etc/init.d/mysql start无效方法二: sudo service my

2016-01-30 16:13:59 4748

原创 [solved]access denied for user 'root'@'localhost' (using password no) ubuntu mysql

又忘记mysql密码了!  在网上找了找方法,找到了个十分简单的方法. 亲测ubutu可用.其他系统没有测试.sudo dpkg-reconfigure mysql-server-N.NN.N换成你mysql server的版本号. 而后按照步骤重置密码即可.参考: https://help.ubuntu.com/community/MysqlPasswordRes

2016-01-26 17:15:07 1004

转载 基于深层神经网络的命名实体识别技术

命名实体识别是从文本中识别具有特定类别的实体,例如人名、地名、机构名等。命名实体识别是信息检索,查询分类,自动问答等问题的基础任务,其效果直接影响后续处理的效果,因此是自然语言处理研究的一个基础问题。引言命名实体识别(Named Entity Recognition,后文简称NER)是指从文本中识别具有特定类别的实体(通常是名词),例如人名、地名、机构名、专有名词等。命名实

2015-09-12 10:58:00 1422

转载 linux进程间通讯的几种方式的特点和优缺点

1.# 管道( pipe ):管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。# 有名管道 (named pipe) : 有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。# 信号量( semophore ) : 信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正

2015-08-18 09:37:42 1216

转载 后缀树

转自:http://www.cnblogs.com/gaochundong/p/suffix_tree.html后缀树在《字符串匹配算法》一文中,我们熟悉了字符串匹配问题的形式定义:文本(Text)是一个长度为 n 的数组 T[1..n];模式(Pattern)是一个长度为 m 且 m≤n 的数组 P[1..m];T 和 P 中的元素都属于有限的字母表 Σ 表;如果

2015-08-11 20:02:49 1096

转载 随机选择问题

http://blog.csdn.net/pipisorry/article/details/44491727Question:随机播放音乐(随机数相关,带权重)假设张三的mp3里有1000首歌,现在希望设计一种随机算法来随机播放。与普通随机模式不同的是,张三希望每首歌被随机到的改了吧是与一首歌的豆瓣评分(0~10分)成正比的,如item0评分为8.9分,item1评分为9.5

2015-07-22 22:51:57 855

转载 C++ STL priority_queue

priority_queue 对于基本类型的使用方法相对简单。他的模板声明带有三个参数,priority_queueType 为数据类型, Container 为保存数据的容器,Functional 为元素比较方式。Container 必须是用数组实现的容器,比如 vector, deque 但不能用 list.STL里面容器默认用的是 vector. 比较方式默认用 operator

2015-07-01 22:10:57 460

原创 reservoid sample 蓄水池问题

题目:如何从无穷尽流中等概率的抽样出一个单词?或许我们换一种说法会更加容易理解.等概率的抽取出一个单词,也即随机的抽取一个单词。本体的难点在于没有给定单词数,而是一个无尽的流。这个问题可以用蓄水池抽样的方法来思考。先简单的介绍一下蓄水池抽样(reservoid sample)算法,我们可以结合算法理解其原理。 Init : a reservoir with the size: k

2015-06-24 16:34:11 893

转载 IT求职经验总结——面试和准备策略

转自http://blog.csdn.net/hopeztm/article/details/8177666IT求职经验总结——面试和准备策略 风风火火的求职经历断断续续持续了大概2个月,最匆忙的时候,可以一天赶3个场子,有心灰意冷,也有身心俱疲。幸好最后结果还算好,所以写个东西,主要还是希望师弟师妹可以从中受到一些启发吧。首先,楼主的专业是计算机,所以这个求职经历主要

2015-06-12 17:20:56 779

原创 the solution of CountNonDivisible by Codility

question:https://codility.com/programmers/lessons/9To solve this question , I get each element's divsors which appearing in input Array A using Sieve of Eratosthenes method. Time complexity is O

2015-06-03 22:32:23 1223

原创 Solution of NumberOfDiscIntersections by Codility

question:https://codility.com/programmers/lessons/4trap: int overflowcode:#include int solution(vector &A) { // write your code in C++11 int size = A.size(); if (size <2)

2015-06-02 23:19:54 1944

原创 Solution to Triangle by Codility

question: https://codility.com/programmers/lessons/4we need two parts to prove our solution.on one hand,there is no false triangular. Given the array has been sorted, if A[i]+A[i+1]>A[i+2]

2015-06-02 22:01:21 1320

转载 内存泄漏检查工具valgrind使用方法

调试内存问题的工具和技术动态内存分配看起来似乎非常简单:您可以根据需要分配内存 —— 使用 malloc() 或其变种 —— 并在不需要时释放这些内存。实际上,内存管理的问题是软件中最为常见的 bug,因为通常在程序启动时这些问题并不明显。例如,程序中的内存泄漏可能开始并不为人注意,直到经过多天甚至几个月的运行才会被发现。接下来的几节将简要介绍如何使用流行的调试器 Valgrind 来发现并调

2015-05-21 10:07:40 851

转载 inline函数必须在头文件中定义吗?

前不久在写代码的时候遇到一个link错误,代码的原型如下所示,基本就是定义了一个基类和派生类,在派生类的一个成员函数中用到了基类定义的一个内联函数。[cpp] view plaincopyprint?// base.h  class Base  {  protected:     void fun();  };    // base.cpp  #in

2015-05-14 14:45:18 8824

原创 回文字符序列

描述给定字符串,求它的回文子序列个数。回文子序列反转字符顺序后仍然与原序列相同。例如字符串aba中,回文子序列为"a", "a", "aa", "b", "aba",共5个。内容相同位置不同的子序列算不同的子序列。输入第一行一个整数T,表示数据组数。之后是T组数据,每组数据为一行字符串。输出对于每组数据输出一行,格式为"Case #X: Y",X代表数据编号(从1开始),Y为答

2015-04-19 15:02:33 1391

转载 最大子序列、最长递增子序列、最长公共子串、最长公共子序列、字符串编辑距离

最大子序列最大子序列是要找出由数组成的一维数组中和最大的连续子序列。比如{5,-3,4,2}的最大子序列就是 {5,-3,4,2},它的和是8,达到最大;而 {5,-6,4,2}的最大子序列是{4,2},它的和是6。你已经看出来了,找最大子序列的方法很简单,只要前i项的和还没有小于0那么子序列就一直向后扩展,否则丢弃之前的子序列开始新的子序列,同时我们要记下各个子序列的和,最后找到和最大的子序

2015-04-08 15:53:35 533

转载 算法-最长递增子序列

之前学习了动态规划中最基本的问题,最长公共子序列,具体解法,见前前一篇博客:http://www.cnblogs.com/liyukuneed/archive/2013/05/22/3090597.html本篇博客要继续解决一个升级的问题——最长递增子序列问题定义:给定一个长度为N的数组,找出一个最长的单调自增子序列(不一定连续,但是顺序不能乱)。例如:给定一个长度为6的数组A{5

2015-04-08 15:32:34 658

转载 python range 与xrange的区别

range    函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例: >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,6,2)[0, 2, 4]xrange    函数说明

2015-04-08 14:56:29 525

转载 GitHub上整理的一些工具

技术站点Hacker News:非常棒的针对编程的链接聚合网站Programming reddit:同上MSDN:微软相关的官方技术集中地,主要是文档类infoq:企业级应用,关注软件开发领域OSChina:开源技术社区,开源方面做的不错哦cnblogs,51cto,csdn:常见的技术社区,各有专长stackoverflow:IT技术问答网站GitHub:全球最大的源代码管理平台,很多知

2015-03-18 11:13:44 1481

转载 函数式编程

转自:http://coolshell.cn/articles/10822.html————————————————————————————————————————————————当我们说起函数式编程来说,我们会看到如下函数式编程的长相:函数式编程的三大特性:immutable data 不可变数据:像Clojure一样,默认上变量是不可变的,如果你要改变变量,你需要把变量

2015-03-16 16:51:45 657

转载 C/C++中几种经典的垃圾回收算法

1.引用计数算法         引用计数(Reference Counting)算法是每个对象计算指向它的指针的数量,当有一个指针指向自己时计数值加1;当删除一个指向自己的指针时,计数值减1,如果计数值减为0,说明已经不存在指向该对象的指针了,所以它可以被安全的销毁了。可以很直观的用下面的图表示:        引用计数算法的优点在于内存管理的开销分布于整个应用程序运行期间,非常

2015-03-16 16:42:29 582

转载 C/C++程序的编译过程

转自:http://www.ruanyifeng.com/blog/2014/11/compiler.htmlC/C++源码要运行,首先得转成二进制的机器码。这是编译器的任务。比如,下面这段源码(假定文件名叫做test.c):#include int main(void){ fputs("Hello, world!\n", stdout); return 0;

2015-03-16 14:51:18 788

转载 虚继承与虚基类的本质

转自:http://www.cppblog.com/chemz/archive/2007/06/12/26135.html————————————————————————————————       虚继承和虚基类的定义是非常的简单的,同时也是非常容易判断一个继承是否是虚继承的,虽然这两个概念的定义是非常的简单明确的,但是在C++语言中虚继承作为一个比较生僻的但是又是绝对必

2015-03-16 11:23:25 535

原创 虚函数实现总结

转载一篇非常好的讲解c++ 虚函数的文章:http://www.cnblogs.com/chenyuming507950417/archive/2012/04/15/2449020.html你也可以结合这篇文章一起看http://blog.csdn.net/chenlei0630/article/details/44096535,能够使你在虚函数实现上有个不错的认识!我会对这篇

2015-03-15 12:18:35 592

转载 python保存文件UnicodeEncodeError以及reload(sys)后print失效问题

今天遇到了相同的问题,在网上查了查。找到了这篇文章,确实好用。转载一下:  转自:http://hi.baidu.com/cenxcen/item/1c8b4b9769428cdd7a7f0154在将字符串写入文件时,执行f.write(str),后台总是报错:UnicodeEncodeError: 'ascii' codec can't encode character

2015-03-14 20:29:45 1129

转载 crontab使用手册

前言crontab是Unix和Linux用于设置周期性被执行的指令,是互联网很常用的技术,很多任务都会设置在crontab循环执行,如果不使用crontab,那么任务就是常驻程序,这对你的程序要求比较高,一个要求你的程序是24X7小时不宕机,一个是要求你的调度程序比较可靠,实际工作中,90%的程序都没有必要花这么多时间和精力去解决上面的两个问题的,只需要写好自己的业务逻辑,通过crond这个工

2015-03-10 14:30:48 635

转载 const的常见用法

const用法主要是防止定义的对象再次被修改,定义对象变量时要初始化变量 下面我就介绍一下几种常见的用法1.用于定义常量变量,这样这个变量在后面就不可以再被修改 const int Val = 10;  //Val = 20; //错误,不可被修改 2. 保护传参时参数不被修改,如果使用引用传递参数或按地址传递参数给一个函数,在这个函数里这个参数的值若被修改,则

2015-03-06 11:11:40 485

转载 c++中static的用法总结

不管是C,C++,还是JAVA,它们中都包含static。当然这其中的用法及作用也是不一样的。下面主要介绍static在C++中的用法:要理解static,就必须要先理解另一个与之相对的关键字,很多人可能都还不知道有这个关键字,那就是auto,其实我们通常声明的不用static修饰的变量,都是auto的,因为它是默认的,就象short和long总是默认为int一样;我们通常声明一个变量:i

2015-03-06 11:04:02 475

转载 虚函数及继承

1、空类,空类单继承,空类多继承的sizeof#include iostream>using namespace std;class Base1{};class Base2{};class Derived1:public Base1{};class Derived2:public Base1,public

2015-03-06 10:40:34 629

转载 MongoDB 关于索引的建议

我们收到了很多关于索引的问题。这一部分解答了其中的一小部分。有几点要记住。第一,MongoDB索引和MySQL索引非常相似并且对于MySQL的索引优化有很多也适用于MongoDB。 第二,更重要的是,这些索引的建议对你的应用提高也是有限的。对于应用的最佳索引策略应该基于很多的重要因素。包含了你期望查询的类型,数据读取与写入的比率,甚至于你服务器的空闲内存

2015-03-04 15:32:08 895

转载 140个Google的面试题

某猎头收集了140多个Google的面试题,都张到他的Blog中了,主要是下面这些职位的,因为被墙,且无任何敏感信息,所以,我原文搬过来了。Product Marketing Manager Product Manager Software Engineer Software Engineer in Test Quantitative Compensation Analyst Engine

2015-03-02 14:08:51 1088

转载 决策树模型组合之随机森林与GBDT

版权声明:    本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系[email protected]前言:    决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策

2015-02-28 10:25:02 889

转载 O(n)时间求字符串的最长回文子串

Translated to ENGLISH VERSION源于这两篇文章: http://blog.csdn.net/ggggiqnypgjg/article/details/6645824http://zhuhongcheng.wordpress.com/2009/08/02/a-simple-linear-time-algorithm-for-finding-longest

2015-02-13 18:32:21 496

转载 python中的深拷贝和浅拷贝理解

在python中,对象赋值实际上是对象的引用。当创建一个对象,然后把它赋给另一个变量的时候,python并没有拷贝这个对象,而只是拷贝了这个对象的引用。以下分两个思路来分别理解浅拷贝和深拷贝:利用切片操作和工厂方法list方法拷贝利用copy中的deepcopy方法进行拷贝1、利用切片操作和工厂方法list方法拷贝代码场景:有一个小伙jack,tom通过切片操作拷贝jack,ann

2015-02-13 11:37:44 567

原创 python is 和==的区别

Python中的对象包含三要素:id、type、value其中id用来唯一标识一个对象,type标识对象的类型,value是对象的值is判断的是a对象是否就是b对象,是通过id来判断的==判断的是a对象的值是否和b对象的值相等,是通过value来判断的如下代码或许可以帮助你理解。>>> a = 1>>> b = 1.0>>> a is bFalse>>> a == bTrue

2015-02-07 18:35:06 883

中文汉字注音程序jar包 PYLabeler_v1.0.jar

利用该jar包可以很容易的调用注音程序。具体调用细节可以参见我的博客http://blog.csdn.net/chenlei0630

2014-10-31

中科院刘莹老师的数据挖掘第二次作业

中科院刘莹老师的数据挖掘第二次作业.共享一下!

2013-12-07

中科院王斌信息检索的第二次作业

中国科学院大学 王斌老师信息检索课程的第二次作业 主要包括第六至第十五章的内容。

2013-12-04

《JavaScript 语言参考》中文版

《JavaScript 语言参考》中文版

2011-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除