自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不凡不弃的博客

自然语言处理方向

  • 博客(21)
  • 资源 (4)
  • 收藏
  • 关注

原创 【Java开发常用软件整理】

该博客整理了一些JAVA程序员常用的软件开发类软件、系统类软件,可以作为JAVA程序员配置Java开发基础环境的参考手册。

2023-01-29 21:24:04 502

原创 【MySQL开发手册(基础篇)】

MySQL开发手册(基础篇)的目的是帮助开发者快速的学会MySQL的基本使用。

2022-06-26 21:53:20 565

原创 第二阶段:企业级开发—基础框架

学习目标:提示:这里可以添加学习目标18天掌握企业级开发—基础框架学习内容:提示:这里可以添加要学的内容1、 项目构建Maven2、 版本控制Git3、 SSM(Spring框架+SpringMVC+持久层框架Mybatis)4、 Spring框架5、 快速开发框架SpringBoot6、 持久层框架MybatisPlus学习时间:提示:这里可以添加计划学习的时间18天 72小时 每天4个小时1、 项目构建Maven2、 版本控制Git3、 SSM(Spring框架+Sp

2021-09-27 13:32:09 184

原创 JavaWeb基础知识总结-1

目录一、Junit单元测试二、反射:框架设计的灵魂三、注解一、Junit单元测试1. 测试分类黑河测试:不需要写代码,给定输入值,判断程序是否能够输出期望的值。白盒测试:需要写代码,关注程序具体的执行流程。2. 测试步骤(使用Junit进行白盒测试)定义一个测试类(测试用例),建议测试类名为被测试的类名+Test,包名为xxx.xxx.xxx.test。定义测试方法,可以独立运行,建议方法名为test+测试的方法名,返回值为void,参数列表为空参。给方法加@Test注解导入juni

2021-02-10 11:01:45 171

原创 总结一些阅读过的博客

关于python的博客Scrapy 将数据保存为标准 Json 格式文件的方法Linux root用户下安装anaconda,如何让普通用户使用root用户安装的pythonscrapy Accept-Language 语言代码缩写表大全关于大数据的博客Idea中运行spark消除控制台的info日志输出的方法Failed to locate the winutils binary in the hadoop binary path java.io.IOException解决idea中创

2020-12-31 16:45:00 109

原创 Python环境报错总结

报错1:error: Microsoft Visual C++ 14.0 is required解决方法:下载安装包:http://go.microsoft.com/fwlink/?LinkId=691126双击下载的exe文件进行安装,如下图所示:安装成功后重启,到cmd中pip安装自己所需的包即可。...

2020-12-31 15:54:48 269

转载 实现Windows直接远程访问Ubuntu 18.04

1. 设置Ubuntu 18.04 允许进行远程控制首先,我们先设置Ubuntu的远程控制,将其设置为允许被远程连接,进入系统 => 首选项 => 桌面共享,或者直接搜索桌面共享,如图所示:将【允许其他人查看您的桌面】这一项勾上,然后在安全那项,勾选【要求远程用户输入此密码】,并设置远程密码。并且我们取消勾选【必须为对本机器的每次访问进行确定】(这样做,是为了被远程的时候不需要再确认,否则每次远程都要人为确认才能被远程,会很繁琐)如图所示:2. 安装vncserver其次,打开终端,

2020-12-31 15:30:30 2404

原创 Docker报错总结

报错1:Failed to get D-Bus connection: Operation not permitted解决方法:创建容器添加 privileged=true 参数docker run -d -name centos7 --privileged=true centos:7 /usr/sbin/init进入容器docker exec -it centos7 /bin/bash

2020-12-31 15:03:01 354

原创 linux系统中一些常用的命令

1. 关闭linux系统中指定的端口sudo fuser -k -n tcp 端口号 例如:sudo fuser -k -n tcp 80002. python模块安装命令 pip install 模块名 -i https://pypi.tuna.tsinghua.edu.cn/simple(https://pypi.douban.com/simple/)3. 解决django的mysql问题import pymysqlpymysql.version_info = (1, 4, 13, "

2020-12-31 14:27:40 220 2

转载 linux系统安装(Ubuntu 16.04.5)

目录1. 制作u启动盘2. 安装Ubuntu 系统1. 制作u启动盘下载ubuntu-16.04-desktop-amd64.iso和UltraISO软件(用来将镜像文件刻录到u盘中)链接:https://pan.baidu.com/s/1Y3UMyejbJ-fwVrKvtEt2YA 密码:pj5n打开UltraISO软件,点击 文件=>打开,找到下载的Ubuntu的ISO文件,双击打开,完成ISO文件的加载,效果如下图:点击启动=>写入硬盘映像,写入方式:USB-ZIP+

2020-12-09 13:10:31 3124

原创 IDEA和PyCharm注释模板

IDEA/* 1. @File : ${NAME}.java 2. @Contact : [email protected] 3. @Modify Time @Author @Version @Description 4. ------------ ------- -------- ----------- 5. ${DATE} ${TIME} 不凡不弃 1.0 None **/PyCharm.

2020-11-19 21:39:04 188

原创 对条件随机场CRF(Conditional Random Field)的理解

从最简单的图的定义出发,接着介绍了马尔科夫随机场要满足的三个性质,接着介绍团的定义,提出马尔科夫随机场,最后介绍线性条件随机场的定义以及公式的说明,并以一个简单的例子来运用了一下公式!

2020-07-06 11:11:02 354

原创 linux上部署django项目

在linux上用最简单的步骤成功部署django项目,经过测试可行!

2020-07-06 11:05:04 404

转载 如何通过文献掌握自然语言处理(NLP)学术动态

阅读学术文献是掌握学术动态的主要方式。计算机技术日新月异,科技文献也汗牛充栋,如何查阅和选择领域重要文献,是需要在实践中不断磨练的技巧;即使精心选择,NLP每个课题也都至少有几十篇论文需要读,实际没有必要平均用力,可以泛读和精读相结合,快速掌握课题的学术脉络。接下来,分别介绍在这些方面的一些建议。

2020-05-30 12:32:09 876

转载 走近自然语言处理(NLP)学术界

前言:与老牌学科如物理学、化学等相比,计算机学科还非常年轻,学科体系长期处于剧烈变革之中。作为计算机应用的重要方向,人工智能和自然语言处理自然更不例外,与现实应用紧密相关,技术发展日新月异,常给人今是昨非之感。在这种情况下,传统学术期刊的那种投稿1-2年才能见刊的模式已经赶不上技术革新的速度,年度学术会议显然更符合计算机学科发展和交流的需求,可以看作是一种“小步快跑”的模式。阅读学术论文、参加学术会议是进入学术界、走进学术前沿的重要方式,在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班(Tutori

2020-05-30 11:33:09 1336

转载 自然语言处理(NLP)简介

简单地说,自然语言处理就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。由于自然语言是人类区别于其他动物的根本标志。没有语言,人类的思维也就无从谈起,所以自然语言处理体现了人工智能的最高任务与境界,也就是说,只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。

2020-05-30 00:00:29 33311 7

原创 基础的分词算法实现 前向最大匹配、后向最大匹配、维特比算法(viterbi)

最基础的分词算法的python实现,前向最大匹配(forward max matching)后向最大匹配(backward max matching)维特比算法(viterbi)考虑语义。

2020-05-28 20:36:00 1198

原创 自然语言处理(NLP)项目的基本流程

刚入门自然语言处理的小伙伴,或者说已经接触了一段时间,但是一直不能够对自然语言处理项目的整个流程有一个大方向的把握,不知道自己目前所研究的点,是处于NLP项目的流程的哪部分,可以通过此文章来了解一下。

2020-05-28 14:25:15 7414

原创 利用scrapy框架爬取中国省市县镇村的数据

GitHub地址:https://github.com/fanorfan/CrawlChinesePlaceNames目录准备工作安装scrapy模块创建scrapy项目python代码settings.pyitems.pypipelines.pyplace_spiders.py程序效果准备工作安装scrapy模块cmd命令行输入以下命令:pip install scrapy -i https://pypi.douban.com/simple/创建scrapy项目cmd命令行切换到要创建项目

2020-05-20 15:49:27 854

原创 python脚本实现英文单词纠错

GitHub地址:https://github.com/fanorfan/EnglishWordErrorCorrection目录单词纠错算法python实现1. 英文单词纠错(CorrectWords.py)2. word文档纠错(CorrectDocx.py)编辑距离动态规划算法python实现(DynamicProgramming.py)单词纠错算法准备一个语料库,里面包含的内容如下:Gutenberg语料库数据维基词典英国国家语料库中的最常用单词列表下载地址:https://g

2020-05-18 12:06:14 4756 7

原创 大数据报错总结

报错:java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArray(II[BI[BIILjava/lang/String;JZ)V解决方法:如图,VM options:后面输入:-Djava.library.path=$HADOOP_HOME/lib/nat...

2020-04-29 21:54:31 523

中国的省市县镇村json格式数据.txt

利用scrapy爬虫框架,爬取中国省市县镇村的数据,存储为json文件。 博客:https://blog.csdn.net/qq_39393772/article/details/106234731 示例: { "province_num": "11", "province_name": "北京市", "province_url": "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/11.html", "city_num": "110100000000", "city_name": "市辖区", "city_url": "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/11/1101.html", "county_num": "110115000000", "county_name": "大兴区", "county_url": "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/11/01/110115.html", "town_num": "110115109000", "town_name": "北臧村镇", "town_url": "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/11/01/15/110115109.html", "village_num": "110115109200", "village_name": "六合庄村村委会", "village_class": "220" }

2020-05-21

全国高等学校名单.zip

全国高等学校名单示例: { "province": "北京市", "schools": [ { "name": "北京大学", "code": "4111010001", "supervisor": "教育部", "city": "北京市", "level": "本科", "type": "公办" }, { "name": "中国人民大学", "code": "4111010002", "supervisor": "教育部", "city": "北京市", "level": "本科", "type": "公办" }] }

2020-05-21

ChinaUniversityList.json

全国高等学校名单示例: { "province": "北京市", "schools": [ { "name": "北京大学", "code": "4111010001", "supervisor": "教育部", "city": "北京市", "level": "本科", "type": "公办" }, { "name": "中国人民大学", "code": "4111010002", "supervisor": "教育部", "city": "北京市", "level": "本科", "type": "公办" }] }

2020-05-20

xml3个小任务-不凡不弃.zip

1)请用XML Schema创建一个表示新闻的大纲,根据大纲定义的结构,写出包含以下内容的XML新闻实例: 2)写出一个XSLT式样单,将该XML文档实例转换成XSL-FO,再采用FOP将上述文档转换成PDF格式,尽量与上述新闻的版式相同。 3)采用RDFa标注FO格式的新闻中的实体(人名、地名、机构名、事件名和时间),并参考GRDDL将其中的实体抽取成RDF表示的知识,并可用SPARQL进行查询。

2020-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除