自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 HMM学习三:维特比算法(预测问题)

1. 前言关于HMM的相关知识请关注之前博文:HMM学习一:前向和后向算法HMM学习二:Baum-Welch算法详解(学习算法)维特比算法针对HMM第三个问题,即解码或者预测问题,寻找最可能的隐藏状态序列:对于一个特殊的隐马尔可夫模型(HMM)及一个相应的观察序列,找到生成此序列最可能的隐藏状态序列。也就是说给定了HMM的模型参数和一个观测序列,计算一系列的隐状态,使得此观察序列的出现...

2019-05-30 17:07:53 1311

原创 HMM学习二:Baum-Welch算法详解(学习算法)

一,前言在上篇博文中,我们学习了隐马尔可夫模型的概率计算问题,如果对隐马尔可夫模型还不胜了解的话,可参看博文HMM学习(一)。学习问题隐马尔可夫模型的学习,根据训练数据是包括观测序列和对应的状态序列还是只有观测序列,可以分别由监督学习与非监督学习实现。本节首先介绍监督学习算法,而后介绍非监督学习算法——Baum-Welch算法(也就是EM算法)。监督学习问题假设已给训练数据包含S个长度相...

2019-05-29 22:58:09 4103 1

原创 HMM学习一:前向和后向算法

一, 马尔科夫相关概念马尔可夫过程 (Markov Process): 它因俄罗斯数学家安德烈·马尔可夫而得名,代表数学中具有马尔可夫性质的离散随机过程。该过程中,每个状态的转移只依赖于之前的 n 个状态,这个过程被称为1个 n 阶的模型,其中 n 是影响转移状态的数目。最简单的马尔科夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状态。注意这和确定性系统不一样,因为这种转移是有概率...

2019-05-29 19:47:35 3658 1

原创 CRF++学习四:中文分词实战

参考博文为:原文一,CRF++安装:见CRF++学习一:ubuntu下安装CRF++(CRFPP)环境为:Ubuntu16.04 + Python2.7语料:http://sighan.cs.uchicago.edu/bakeoff2005/第一步:预料的预处理将语料文件夹解压之后,里面有多个子文件夹.现在我们采用的标记方法为4-tag标记法,分别为( B(Begin,词首), E(En...

2019-05-24 16:18:13 779

转载 CRF学习三:CRF++源码解析

参考博文如下:[原文](https://blog.csdn.net/juanjuan1314/article/details/78875583)

2019-05-21 18:05:08 375

翻译 CRF学习二:多个分词模型对比

CRF简介Conditional Random Field:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)词性标注(标注分词的词性,例如:名词,动词,助词)命名实体识别(识别人名,地名,机构名,商品名等具有一定内在规律的实体名词)本文主要描述如...

2019-05-21 17:21:50 590

翻译 CRF++学习一:ubuntu下安装CRF++(CRFPP)

原文链接为:原贴下载安装包:CRF++0.58对于下载CRF++0.58的安装包,可以有两种方式,一是如果能上谷歌搜索,可以在此下载:https://taku910.github.io/crfpp/#source,下载CRF++-0.58.tar.gz的包具体操作如下:下载linux版本CRF++包-----CRF++-0.58.tar.gz,并解压。cd CRF++-0.58./c...

2019-05-21 16:33:48 759

原创 mysql导出文件不输出表头,同时只导出指定字段,并且进行某个字段中的某个字符串查询

指令如下所示:select questions, Consulting_questions_detailed,answer from asking where questions like "%脐炎%" into outfile "d:/1.txt" fields terminated by ','enclosed by '"'lines terminated by '\r\n';...

2019-03-19 21:18:33 1159

原创 Mysql查找如何判断字段中是否包含某个字符串(或者包含某个内容)

如下所示,在命令行中执行如下指令:SELECT * FROM asking where questions like "%黄疸%";其中,asking是表名,question是字段名,%黄疸%是里面内容,其中省略的内容,用百分号即可实现。...

2019-03-19 21:15:57 6093

原创 python对文件进行修改替换操作

当我们读取文件的内容后,想要修改文件中某一行的内容或者某一个位置上的内容时,可以尝试将文件所有的内容都读出来,然后进行匹配之后写入新文件中。实现如下:fr = open("/home/yangjie/文档/机器学习/datingTestSet.txt",'r')##打开旧文件,设置权限为读fr_new = open("/home/yangjie/文档/机器学习/datingTestSet_n...

2019-03-17 15:24:00 3692

原创 在Ubuntu上如果权限不够时,并且使用sudo还是权限不够,获得root权限

如果用户具有sudo权限,那么直接可以运行如下命令:sudo su root#输入当前用户的密码passwd#输入密码#再次输入密码

2019-03-13 19:58:34 9742

原创 标注精灵助手标注使用教程(nlp方向,文本标注)

一,网址为:http://www.jinglingbiaozhu.com/,其中下载中文版,for windows版:二,下载后好直接双击安装;三,如何使用:(1)点击“+”界面如图所示:(2)打开之后,点击实体关系标注,如下图所示:(3)修改项目名为所需项目名,文本文件夹为需要标注的文件夹所在位置,实体定义为txt格式文件的文件名称,中间分隔用英文逗号分开,删除事件定义和属性定义内...

2019-03-13 13:46:12 10064 28

原创 mysql命令行如何输一个id的范围

使用命令:select symptom from health2 where id in (96,97,98,99,100);

2019-03-10 20:03:58 1052

原创 MySQL 导出指定数据表中的一行记录

1,打开MySQl Workbench,在命令对话框中输入指令,如下图所示(其中health为选择的数据表,框中为输入的命令,最底下为所运行的结果)运行命令为:SELECT * FROM health where id=147;2,ctrl+enter为运行快捷键,按下之后,上图最底下为运行结果。3,点击图中的Export/Import中的Export按钮,即可将刚才筛选的结果输出,如下...

2019-03-10 19:57:38 3815 1

原创 MySQL数据库如何用命令行导出不带表头(列名)的csv或txt文件

1,使用命令:mysql> select * from test into outfile ‘d:\test.csv’ fields terminated by ','enclosed by '"'lines terminated by ‘\r\n’;报错:ERROR 1290 (HY000): The MySQL server is running with the --secu...

2019-03-10 19:48:28 2434

原创 如何使用mysql workbench进行命令行操作,并筛选数据库

1,先选择数据库和数据表,选择了health这个数据表:其中,ai-health为数据库,health为数据表。2,对命令行进行输入命令操作:选择的为health这个数据表,输入上面那行命令之后,按下ctrl+enter,会出现执行结果,其中结果如下图所示。3,图中所示为结果:筛选出来的结果id=147时的结果如图所示。最底下为执行结果,显示操作成功。...

2019-03-10 19:43:53 11150

原创 error C2628: “Remote”后面接“int”是非法的 解决办法

问题:在VS2015中,出现如下错误错误 C2628 “Remote”后面接“int”是非法的(是否忘记了“;”?)时,一般是Remote这个类最后没有加“;”,如下图中所示:在Remote类的最后需要加这个“;”。解决办法:就是在该类最后加“;”。...

2019-02-18 15:29:12 2454

原创 #C4996: 'fopen'(或者'scanf'): This function or variable may be unsafe的安全检查错误

当刚使用VS2015的时候可能总遇到类似于这样的错误:error C4996: 'fopen': This function or variable may be unsafe. Consider using scanf_s instead. To disable deprecation, use _CRT_SECURE_NO_WARNINGS. See online help for deta...

2019-02-12 11:18:19 1384

原创 # fatal error LNK1104: 无法打开文件“XXX".lib“

解决方法一:如果将用如果将用低版本的VC开发的项目,拿到高版本的VC开发环境上去编译,链接时也许会触发LNK1104错误。解决方案是链接时忽略此库,在此提供两种解决方案:具体路径为:Project | Properties | Configuration Properties | Linker | InputIgnore Specific Library: libc.lib(项目|属性|...

2019-02-12 09:55:38 3857 1

原创 LINK : fatal error LNK1104: 无法打开文件“opencv_calib3d240d.lib”解决方法

LINK : fatal error LNK1104: 无法打开文件“opencv_calib3d240d.lib”解决方法出现这种问题的时候,可以考虑以下两种解决办法:1,第一种情况下是opencv版本和附加依赖项lib版本对应不上:比如说实际上opencv的版本是2.4.0,但是选择的附加依赖项是2.4.8(附加依赖项版本看依赖项最后几位数字:opencv_calib3d240d.lib...

2019-01-15 19:10:32 4362

原创 如何删除mysql数据库某张表中完全重复数据

对于删除数据表中某个字段重复的内容,使用语法具体如下:delete from 表名 where 自增字段名 not in(select bid from(select min(自增字段名) as bid from 表名 group by 字段名) as b);具体例子如下:delete from position where id not in(select bid from(select...

2018-12-22 16:40:41 1004

原创 mysql批量删除指定字符前的内容,删除某个字符之前的字符串

参考博文为(https://blog.csdn.net/wzx19840423/article/details/77507772)instr()函数参考博文为:https://www.cnblogs.com/dshore123/p/7813230.htmlleft(),right()函数参考博文为:https://blog.csdn.net/qq_27495157/article/detail...

2018-12-15 22:14:57 5197 1

原创 批量删除mysql字段中相关的内容,对字段中字符串进行处理

使用语法如下:update askingset doctor_imformation=replace(doctor_imformation,"职称","")where id between 3438 and 57588;语法解释:asking为所做的表;doctor_imformation是所在表的字段;replace(字段,“被代替内容”,“代替内容”)where是选择条件,本...

2018-12-15 16:34:27 880

原创 如何在mysql的表中按设置条件更新数据(update, id)

如何在mysql的表中按设置条件更新数据(update, id)语句为:update health set website='spring_rain_doctor' where id>1013;其中:health为所在的表;website为需要更新的字段;'spring_rain_doctor’为更新入website的字段;id>1013为设置条件,是指在id>101...

2018-12-15 15:19:19 6844 1

原创 解决python的scrapy爬虫时Memory error问题问题

解决python的scrapy爬虫时Memory error问题用pycharm运行scrapy爬虫代码时竟然出现Memory error错误,比较之后发现是并发任务过多导致内存不够用,这时候去调整setting文件夹中的CONCURRENT_REQUESTS_PER_DOMAIN = 16是不管用的。所以需要重写并发代码部分;具体问题代码如下:next_pages = sel.xpath(...

2018-11-19 19:33:17 1050

原创 调用normalize-space函数清除多余空格时导致爬取内容清空问题和清除爬取内容的空格换行字符问题

解决调用normalize-space函数清除多余空格时导致爬取内容清空和清除爬取内容的空格字符一、函数的使用方法为:见官网链接:二、对于normalize-space函数清除多余空格时导致爬取内容清空:对于该问题建议不使用该函数,因为该函数是在xpath路径中使用,我们只需将xpath路径爬取的内容保存为字符串,然后使用正则表达式re.sub()替换空格换行符即可:re.sub(pa...

2018-11-19 19:24:01 2509

原创 关于UnicodeDecodeError 问题整理

关于UnicodeDecodeError整理今天做浏览器模拟登陆,当用户名是中文时,出现关于UnicodeDecodeError的两个问题。开始是中文不能编码成utf8,后面再博文指导下,修改之后出现不能编码为ascii。1,当代码中是中文时,如下图:代码第34行出现中文。编译后出现问题为:不能编译为utf-8格式UnicodeDecodeError: 'utf8' codec can'...

2018-10-12 21:08:48 350 1

原创 安装python的两个版本时,如何使用pip命令,且相应问题总结

安装python的两个版本时,如何使用pip命令,且相应问题总结对于存在python2和python3时,如何使用pip命令1.使用pip当Python2和Python3同时存在于windows上时,它们对应的pip都叫pip.exe,所以不能够直接使用 pip install 命令来安装软件包。而是要使用启动器py.exe来命令如下:py -2 -m pip install XXXXp...

2018-10-08 18:01:23 7000 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除