- 博客(0)
- 资源 (5)
- 收藏
- 关注
语言分词,jieba结巴分词,vc++ 2010,jieba分词 用于分解句子识别词语
在处理英文文本时,由于英文文本天生自带分词效果,可以直接通过词之间的空格来分词(但是有些人名、地名等需要考虑作为一个整体,比如New York)。而对于中文还有其他类似形式的语言,我们需要根据来特殊处理分词。而在中文分词中最好用的方法可以说是jieba分词。接下来我们来介绍下jieba分词的特点、原理与及简单的应用
1、特点
1)支持三种分词模式
精确模式:试图将句子最精确的切开,适合文本分析
全模式:把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义
搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词
2)支持繁体分词
3)支持自定义词典(支持载入新的词典或者更新自带的词典)
2023-12-15
delphi实现指针P[n]索引数组
在delphi中是不可以用指针索引数组的。如定义P:PInteger后,用P[0]索引数组会出现编译错误。这里介绍一种方法,通过简单定义使P[0]索引合法,取值正常。当然在C中是可以的,例如int *P,P[0]将被看做数组第一个元素。这个方法适用于将C代码迁移为delphi代码。
2022-08-23
在delphi中实现任意类型的三元运算函数ThreeAsk
在delphi中实现任意类型的三元运算函数ThreeAsk。就像c或c++中的三元运算一样。
用法:任意类型 = ThreeAsk(boolen,任意类型,任意类型);
2022-08-22
mtk-mre-vxp短信保存
路虎三防手机,老人机等mtk山寨手机,系统为mre xxxx,编译出的程序为*.vxp,该程序可以将短信自动备份为sms_backup.txt。然后可以用蓝牙将文件传出。特别注意:MRE_SDK_2.0.01.05_Normal_Chi.zip,ARM.Developer.Suite v1.2必须另外下载,第一个是开发软件的sdk,第二个是arm编译器,因山寨手机mtk版cpu为arm。
2016-10-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人