1 张海玲

尚未进行身份认证

men proposes,god disposes.

等级
TA的排名 3w+

语言模型N-Gram之KenLM环境的搭建

语言模型N-Gram之KenLM环境的搭建1在windows下在windows下搭建的kenlm只能运用训练好的模型,不能训练模型。查资料了解到,若想在windows训练kenlm模型,理论上可以在cygwin(仿真linux操作系统)进行。但是,我折腾了好久好久好久,还是存在一系列的问题,固执的金牛座被打败了,转战linuxcygwincygwin是一个windows软件,该软件就...

2019-08-18 09:41:42

kenlm语言模型介绍

语言模型计算P(w1,w2,…,wn)P\left(w_{1},w_{2},\dots,w_{n}\right)P(w1​,w2​,…,wn​)利用链式法则:P(A,B,C)=P(A)P(B∣A)P(C∣A,B)P(A,B,C)=P(A)P(B|A)P(C|A,B)P(A,B,C)=P(A)P(B∣A)P(C∣A,B)P(w1,w2,…,wn)=P(w1)P(w2∣w...

2019-08-17 13:23:26

【python】解决Anaconda下输入python出现Warning: This Python interpreter is in a conda environment...的问题

因为安装的是Anaconda中带的python版本,python处于conda环境中,在命令行输入python出现“Warning:ThisPythoninterpreterisinacondaenvironment。。。python需要激活。出现的警告如下图所示。首先我们要查看Anaconda的位置在cmd中输入condaenvlist,复制base后面的位置信息。(我...

2019-07-06 19:08:52

解决win10搜索框不能用的问题

按Win+R键调出运行,输入Powershell点击确定,如下图所示。在该窗口下输入Get-AppXPackage-NameMicrosoft.Windows.Cortana|Foreach{Add-AppxPackage-DisableDevelopmentMode-Register“(((_.InstallLocation)\AppXManifest.xml”}回车...

2019-06-22 20:34:13

Java实现两个变量的互换(不借助第三个变量);加密应用

基本异或公式:A^B=B^A;(A^B)^A=A^(B^A)=B;(A^B)^A=A^(A^B)=B;1.通过位运算中的异或运算符(^)实现两个变量的互换。代码如下:classSwitch{ publicstaticvoidmain(String[]args) { intA=12,B=15; System.out.println("交换前:A:"+A...

2019-05-23 16:02:26

java主函数调用方法中的变量

在主函数中定义一个变量,然后在方法调用并处理该变量,最后再在主函数中调用处理后的变量。我们来看如下的一段代码:classDemo1{ //方法(f=f+1)publicstaticvoidadd(intf) { f=f+1; System.out.println("经过处理的值:"+f); }//主函数 publicstaticvoid...

2019-04-09 22:16:33

java定义文章的难度系数

本文定义文章的难度系数为:平均句长难度系数+常用字难度系数。思路:(1)统计文章中。!?的数量来确定句子数,句子数除以总字符数即为平均句长,即可得到一个测评标准(句长);(2)保存一个常用500字.txt文档库,用需要判定的文章逐字与常用500字.txt文档进行比较,得到文章的常用字数量,再除以总字符数即可得到另一个测评标准(常用字比例);(3)设置对应的难度系数。注:(本次任务测试了...

2019-02-24 20:31:23

java找出txt文本中最长/最短的句子,出现次数最多的句子,求平均句长,方差

找出文本中最长/最短的句子,出现次数最多的句子,求平均句长,方差。思路:(1)将文本按特定的方式进行切分(本文以。!?切分;(2)创建两个数组,数组1存放切分后每句话的长度,数组2存放切分后的每句话;(3)找最长句只需找到数组1中长度最长那一个,即可输出,最短同理;次数最多句子则需要遍历所有句子,找到相同的句子,对应的次数加1,最后输出次数最多那一个即可。(4)总字符长度除以总句子数即平...

2019-02-20 21:38:37

java对文章字符出现个数进行统计排序(TreeMap排序)

文章目录1.介绍Map2.TreeMap排序2.1根据TreeMap的key值来进行排序2.1.1根据key值的升序排序(默认)2.1.2根据key值的降序排序2.2根据TreeMap的Value值来进行排序2.2.1根据Value值的升序排序2.2.2根据Value值的降序排序3.实例:对《西游记》中的字符进行降序排序任务所涉及到的排序问题,由于需要对文本字符及文字字符出现的次数进行排序,相当...

2019-01-27 17:38:21

python中文分词之jieba分词的使用

文章目录1.特点2.安装说明安装示例下载:安装:测试:3.算法4.主要功能(1)分词(2)添加自定义词典载入词典调整词典(3)关键词提取一、基于TF-IDF算法的关键词抽取二、基于TextRank算法的关键词抽取小应用:查看《西游记》这本书的人物关系。(4)词性标注(5)Tokenize:返回词语在原文的起止位置(6)命令行分词中文分词的工具有很多种,例如HanLP、jieba分词、Fu...

2019-01-14 12:39:00

java实现小说阅读器(功能:查看全文、统计总行数/总页码数、查找指定行、指定页码、实现翻页)

本次任务主要是实现在DOS窗口下,可以查看小说全文、小说全文总行数、查找指定行、查找指定页码内容代码如下:结果如下:

2018-12-09 22:55:09

编码趣味小知识

一个关于记事本的BUG:记事本无法单独保存“联通”。(unicode编码的问题)新建.txt另存为保存,重新打开。新建一个文本文件时,记事本的编码默认是ANSI,如果在ANSI的编码输入汉字,那么实际就是GB系列的编码方式,而“联通”两个字的GB2312编码与UTF8编码产生了编码冲撞。so~乱码了...

2018-11-22 21:31:23

java 认识命令行参数

命令行参数就是main方法里面的参数String[]args,它就是一个数组,args只是数据类型的一个名称,即一个数组的变量。这是程序的入口点。一个简单小程序了解java命令行参数代码如下:classtest{ publicstaticvoidmain(String[]args) { for(inti=0;i<args.length;i++) ...

2018-11-22 20:30:51

java读取文章实现分段落/分页

代码如下:importjava.io.FileReader;importjava.io.BufferedReader;importjava.io.IOException;classReadLine{ publicstaticvoidmain(String[]args)throwsIOException { FileReaderfr=newFileR...

2018-11-19 18:54:35

java检测.txt文档出现某个字符串的次数

检测.txt文档出现某个字符串的次数。(这里以小说《南渡北归》为例,检测出现“我”、“梅贻琦”出现的次数)代码如下:importjava.io.*;importjava.util.Scanner;classStrCompare{ publicstaticvoidmain(String[]args)throwsIOException,NullPointerExcept...

2018-11-12 18:38:16

java读取txt文件出现中文乱码

在保证代码没有问题的前提下,读取txt文件出现了如下乱码。解决方法:1.查看文件代码的编码方式是否是ANSI(我使用的文本编辑器为EditPlus)2.查看.txt文件的编码方式是否是ANSI修改保存,结果如下...

2018-11-10 17:11:22

Altium Designer2018下载安装及基本使用

一、AltiumDesigner2018下载下载链接:https://pan.baidu.com/s/1gVJre-0tW_T2_oRqclYWAQ提取码:fnr9安装步骤请点我!2、用AD画基本的电路图1.首先新建一个PCB工程。如下所示:2.新建一个原理图如下所示:3.导入基本的元件库4.查找所需元件(这里以查找电阻为例)以下给出了一些常用元件的查找字母(...

2018-11-04 21:50:12

java定时器类Timer和多线程介绍及实例

任务要求:完成一个javaapplication应用程序,使用定时器编程,在实时显示当前时间,每1秒时钟内容更新一次。完成一个javaapplication应用程序,在应用程序主进程中新开一个线程,此线程进行死循环,每1秒被激活一次,激活时即在输出显示当前时间。完成一个javaapplication应用程序,此应用程序公共类有一个double型类属性(变量)x,初始值为0;在应用程序...

2018-10-21 16:12:06

java 字符串操作

字符串的初始化赋值和输出

2018-10-09 20:45:03

gnuplot下载及基本使用

一.介绍gnuplot及下载Gnuplot支持多种类型地块在任何2D和3D。它可以通过绘制线,点,箱,等高线,矢量场,表面和各种相关文字。它也支持各种专业绘图类型。Gnuplot支持多种不同类型输出:交互式屏幕终端(鼠标和热键输入),直接输出到笔式绘图仪或现代打印机,并输出到多种文件格式(EPS,无花果,JPEG,乳胶,METAFONT,PBM,PDF,PNG,后记,SVG,…)。gnup...

2018-10-07 23:23:24

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。