- 博客(0)
- 资源 (17)
- 收藏
- 关注
C#编写的三叉Trie树
对于一般的Trie树的数据结构,它的实现简单但是空间效率极低。三叉搜索树使用了一种聪明的手段去解决字典树的内存问题(空的指针数组)。为了避免多余的指针占用内存,每个节点不再用数组来表示,而是表示成“树中有树”。节点里每个非空指针都会在三叉搜索树里得到属于它自己的节点。该代码为C#版本。
2015-04-09
C#编写的Trie树操作
Trie是一种字典树,用于存储文本字符,并利用了单词之间共享前缀的特点,所以叫做前缀树。不像平衡BST,Trie的高度只与最长的文本串的长度s有关系,而与单词的数量n无关。该代码为C#版本。
2015-04-09
C#编写的PatriciaTrie树及其基本操作
Trie是一种字典树,用于存储文本字符,并利用了单词之间共享前缀的特点,所以叫做前缀树。不像平衡BST,Trie的高度只与最长的文本串的长度s有关系,而与单词的数量n无关。如果一颗Trie中有很多单词只有一个儿子结点,可以用Patricia Trie(Linux内核中叫做Radix Tree)压缩存储。该代码为Patricia Trie的C#版本。
2015-04-09
C#编写的基于知网HowNet的词语相似度计算
知网(英文名称为HowNet)是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库,包括词语之间的相似度。
该代码是在前人基础上进行修改的C#版本。
2015-04-09
C#编写的Apriori算法
Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。而且算法已经被广泛的应用到商业、网络安全等各个领域。
2015-04-09
基于NLPIR(ICTCLAS2013)的中文分词C#实例
NLPIR(ICTCLAS2013)是由张华平博士发布的中文分词系统,可用多种语言进行二次开发,该资源是用C#语言在VS2010环境下在http://www.nlpir.org/提供的原示例基础上进行改进后的示例程序。
2013-12-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人