自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (10)
  • 收藏
  • 关注

原创 让Jena帮我们想

让Jena帮我们想----wuhui      谈到互联网的未来,人们自然的想到了语义网,虽然这个概念早在1999年就被伯纳斯-李先生提出,随后被学术界吵得沸沸扬扬,但是,真正基于语义网的应用似乎还处于孵化期。本文当然不想去解释什么是语义网、语义网的体系架构等等知识,本文将结合一个具体应用来说说语义网的一些特性,并由此希望能引起大家对语义网研究的兴趣和信心。       首先,我们来讲

2008-02-16 08:47:00 3586 2

原创 用c++实现urlencode

 用C++来实现UrlEncode----wuhui       在php里面实现urlencode是异常简单的事情,但是,想在c++中实现这个功能,可能得自己开发了。       基于这个需要,我在网上逛了一趟,找到了一个比较好的实现,并封装成一个小工具,大家以后就方便了。    #ifn

2008-02-16 08:45:00 6185

原创 潜在语义索引(LSI)相关公式推导

 LSI中SVD的相关公式推导SVD的公式为(公式0)其中,U、V为正交矩阵,即 , ,S为对角矩阵,即 。利用矩阵计算法则,对上式进行分析得到  (公式1)经过svdlibc的计算,即可得到 、 和 ,利用上述三个矩阵我们来进行相关的计算。如果 为 ,则上式可理解为:N:   文本对于特征的原始向量空间V:    文本降维后的数据空间,V的每一行为一个文本

2007-09-09 10:16:00 1477

原创 Mysql操作优化

        项目中常常会用到数据库,插入和查询是经常用到的操作,为了提高其效率,有很多地方是可以改进的,下面列举几个加以介绍。1.         批量数据的插入这样的操作一般是用Mysql的C接口来操作,一般逻辑是得到一条记录的内容,然后插入到数据库。这种逻辑会使得操作比较慢,就其原因有几个:1.         插入过程中要建索引2.         通过Sql插入数据

2007-08-06 13:25:00 880

原创 Linux上安装Mysql4.1.22及ERROR2002问题

 Linux上安装Mysql4.1.22及ERROR2002问题1.         获取源码:http://dev.mysql.com/get/Downloads/MySQL-4.1/mysql-4.1.22.tar.gz/from/pick,注意:文件名是“mysql-4.1.22.tar.gz”。2.         解压:tar xvzf mysql-4.1.22.tar.gz

2007-07-21 00:37:00 2031

原创 Linux C++ 面向对象多线程编程实例之“生产者-消费者”

Linux C++ 面向对象多线程编程实例之“生产者-消费者”问题1:生产者-消费者模型解决方案:两个线程,一个共享变量。源码: #include #include using namespace std;

2007-07-13 20:40:00 4952 1

原创 我看搜索引擎!

我看搜索引擎[email protected]从第一次接触搜索引擎到现在应该有几年历史了,从事其相关领域的开发也有一些时间了,总想写点什么来表针对自己经历的一个总结,本文算是一个开始吧。本文将重点讲解一下我对搜索引擎发展的理解。       现在大家都炒搜索引擎,为什么?因为能赚钱,因为眼红Google。每天,当我用搜索引擎的时候,我在想一个问题,难道这就是我们查找

2007-07-03 10:22:00 1004

原创 WordMap

WordMap介绍[email protected]       在解释这个概念之前,我们来分析一下一种现象。       众所周知,词语是最小的语义单位,想理解语言本身不能不研究词语,这也难怪现在的语言学研究都从分词开始。词语和词语之间也是有联系的,看到“刘翔”和“冠军”你会想到什么?那么“马云”和“雅虎”呢?无需置疑,词语之间是有关系的。人掌握这种关系是通过“听”和“看”

2007-07-03 10:15:00 3696

原创 关于搜索引擎的思考!

最近想整理一下关于搜索引擎以其相关东西的资料,总觉得应该好好的来整理一些东西.从爬虫到排序,从结构到算法,应该说搜索引擎是越发复杂了. Java开源搜索引擎列表 Java开源爬虫

2007-01-03 14:52:00 932

原创 用搜索引擎改变人们的生活!

人类的进步应该说是一步步踏着巨人肩膀前进的过程。自从网络出现后,人们的学习习惯在不断改变,从最开始的综合门户到现在的搜索引擎,我们查阅资源的方式在不断的改变着,信息获取的手段日益快捷,得到的信息量也在不断增加,可以毫不夸张的说,现在社会需要的是会查找资源和合理利用资源的人,因此,人的智商要求也越来越高,但是相反,搜索引擎却在不断的努力,让每个人都能平等的获取资源,让每个人都能从别人的经验中成长、收

2006-07-12 22:33:00 1658

原创 反网页垃圾研究现状

目前,反网页垃圾技术可谓是如火如荼啊,大家都在一股劲的想法子将自己的技术弄上去,研究的热点也集中人工智能和知识工程领域。人工智能干什么呢?很简单,就是想让机器来学习,让他们能自主积累知识,发现Spam的特点,成为他们的老朋友,将其干掉 从某种角度讲,人工智能是一种理想化的东西,且不说我们如何引入人工智能,就是人工智能本身也并没有其名字那样聪明。于是,人们想到了知识工程,这个知识就是人将积累的东西整

2006-04-22 15:15:00 908

转载 Antispam,反垃圾,反作弊[转载]

Antispam,反垃圾,反作弊[原创]http://FullSearch.Com 中文全文检索网 2006-2-5 15:59:10 sigz 关键词:搜索引擎优化 反作弊 antispam

2006-04-19 21:49:00 3520

原创 网页垃圾简介

所谓网页垃圾,就是某些网站,利用搜索引擎的结果排序特点,采用一定的欺骗技术,使其在某些主题上具有较高的权重,当用户搜索这些主题时,这些网站将排在结果序列的前面.从某种角度讲,网页垃圾的出现是互联网发展的一个表现,它反映出互联网在更大的范围内为人们所了解和研究.对于网页垃圾的学术研究也开始逐步形成规模,在Web spam taxonomy一文中,作者Zolt´an Gy¨ongyi 和Hecto

2006-04-18 13:21:00 1177

原创 开版致辞!

由于工作需要,到各大搜索引擎上去搜相关资料,发现反垃圾网页的资料非常少,于是,决定开辟此版,并希望此版能成为一个良好的交流平台!

2006-04-17 12:47:00 741

原创 国家自然科技资源平台资源分类与编码表

2006-02-05 13:22:00 1608 1

原创 非常态心理学!

师弟这几天思维颇为活跃,每每谈话总能蹦出思想的火花!昨日餐桌上,大而特大的宣讲其独门秘笈“非常态心理学”。话题初始,跃进兄问到“敢问此‘非常态’和‘BT’有和区别”。师弟严肃说“非常态乃心理不正常之谓也,然未达BT之程度,此态介于常态和BT之间,有恢复常态之可能,亦有恶化成BT之possibility!”其间,吾一语未发。顿间,师弟对俺说“师兄,以吾之拙见,汝当研习一下非常态!”“此言甚是有理,虽

2005-03-22 22:21:00 1433 2

原创 树梢上的鸟儿啊,你到底有几只?

 “树上有十只鸟,开枪打死一只,还剩几只?”  n“问的是树上还剩几只么?” n“是无声手枪或别的无声的枪吗?” n“枪声有多大?” n“枪声震的耳朵聋或其他的伤害么?” n“在这个城市里打鸟犯不犯法?” n“您确定那只鸟真的被打死啦?” n“树上的鸟里有没有聋子?” n“有没有关在笼子里的?” n“边上还有没有其他的树,树上还有没有其他鸟?” n“有没有残疾的或饿的飞不动的鸟?” n“算不算怀孕

2005-03-22 22:07:00 1133

原创 语义距离的经典文章:Fuzzy Semantic Distance Measures between Ontological Concepts!

Paper: Fuzzy Semantic Distance Measures between Ontological ConceptsProfileFrom: IEEE 2004Author: Valerie CrossE-mail:[email protected] AbstractNotes:: Similarity between concepts: Distance betwee

2005-03-16 15:34:00 2071 1

CareerCup_Top_150_Questions 5th,2011

码工面试必备宝典,提高技能的方法只有一个:练习,练习,练习。。

2014-08-11

Linux C 函数手册 chm 文件

这是Linux C 函数手册. Chm文件,使用起来超级方便。

2009-04-19

支持向量机导论(中文版)

支持向量机中文版,对于想了解svm的人来说是一本不错的入门书籍,同时,书中对svm的相关知识都给了介绍,很值得一读。

2009-03-21

Jena使用介绍

本文是通过实例介绍了Java推理引擎Jena的使用方法。

2008-03-15

C++数据类型

本文全面介绍了c++数据类型所在内存大小。

2008-01-10

用C++来实现UrlEncode

本文用C++来实现UrlEncode!

2008-01-10

NB在自然语言处理中的应用

NB在自然语言处理中的应用,本文介绍了相关应用和公式推导。

2008-01-10

《图论导引》

图论导引,该书的重要性不言而喻!

2008-01-10

我看搜索引擎

当高速公路修好的时候,你研究如何改进马车还有意义么?

2007-07-03

WordMap

WordMap表示的是词语之间的关系,主要信息元是词语之间共现的条件概率和位置关系。

2007-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除