自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (4)
  • 收藏
  • 关注

原创 NLP入门学习资料

引言自然语言处理(NLP)其实是一个涉猎技术很广的领域,因此,在打基础的过程中,建议从机器学习-深度学习-NLP的相关处理技术实践,这样的一个层次递进的学习过程。视频教程【注】下列课程基本是免费课程,浏览器打不开考虑代理VPN。《机器学习》链接:https://www.coursera.org/learn/machine-learning/home/welcome主讲:吴恩达课程简介:机器学习是一门让计算机在没有明确编程的情况下行动的科学。在过去的十年里,机器学习给我们带来了自动驾驶汽车、实

2020-12-07 09:37:10 353

原创 【异常处理】python之pandas的to_csv保存后出现中文乱码的解决

法一df.to_csv(file_name2, encoding='utf-8')法二如果还是乱码,可以尝试法二。但是法二有时候会出现一个问题,就是文件打开修改后,即使不保存,再打开也会出现格式混乱的情况。出现这种情况,则用法三可以解决或者修改后另存为csv文件来解决。df.to_csv(file_name3,encoding="utf_8_sig")法三df.to_csv(file_name,encoding = gbk’)...

2020-12-05 09:09:58 956

原创 【Python+中文NLP】知识图谱系列(2)——知识存储

目录前言一、neo4j安装(Windows)1. JDK安装2. neo4j安装二、neo4j使用前言当前比较常用的图数据库之一就是neo4j,先介绍下这个的安装与使用吧一、neo4j安装(Windows)1. JDK安装Neo4j是基于Java的图形数据库,运行Neo4j需要启动JVM进程,因此必须安装JAVA SE的JDK。从Oracle官方网站下载 Java SE JDK,并安装jdk(java的环境),可以参考这里。2. neo4j安装(1)neo4j下载【注意:如果jdk1.8,

2020-11-27 22:29:37 643

原创 【Python+中文NLP】知识图谱系列(1)——构建流程

目录前言领域知识图谱构建一、知识图谱基本定义1.1 三元组1.2 两个层次二、构建流程2.1 四个阶段2.2 六个环节1. 知识建模2. 知识存储3. 知识抽取4. 知识融合5. 知识计算6. 知识应用前言人工智能与行业结合的应用中,因行业领域的差异,存在大量数据模式不同,“领域知识图谱”以其更加符合实际应用需求的特性在工业领域得到了广泛应用。本文主要讲解特定领域知识图谱的构建流程。领域知识图谱构建一、知识图谱基本定义1.1 三元组知识图谱由多个“实体(Entity)-关系(Relationsh

2020-11-27 21:32:03 3786

原创 【pytorch与tensorflow框架】—深度学习中神经网络结构查看/打印

一、pytorch打印网络结构#前提:构建了一个TransformerModel网络结构类#实例化网络对象model = TransformerModel(ntokens, emsize, nhead, nhid, nlayers, dropout)法一:主要查看网络层次结构,也包括输入输出参数print(model)结果如下:TransformerModel( (pos_encoder): PositionalEncoding( (dropout): Dropout(

2020-09-20 16:06:00 1215

原创 【异常处理】解决Windows下access denied for user ‘root‘@‘localhost‘(using password:YES)的mysql启动问题

C:\AppServ\MySQL> mysql -u root -p Enter password: ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) 若出现上述问题,则解决方法如下:1、编辑mysql配置文件my.ini(默认安装路径的5.6在C:...

2019-04-14 19:29:04 10704 9

原创 【特征工程】(一)数据集中缺失值的处理

目录引言一、可选处理方法二、Python中Pandas库处理缺失值1.查看数据缺失值得分布情况2.删除包含缺失值的数据 2.1. 删除包含缺失值的行或列 2.2. 根据条件删除包含缺失值的数据三、Python中其他库处理缺失值四、缺失值处理案例(一)----疝气病数据集预处理1.处理缺失值,以便使用分类算法引言 数据中的缺失值是...

2019-04-04 09:19:51 9085 4

原创 【Python+中文NLP】(二) 中文分词工具包:jieba

前言 目前中文分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法 。随着大规模语料库的建立,统计机器学习方法的研究和发展,基于统计的中文分词方法渐渐成为了主流方法,主要方法为:给出大量已经分词的文本,利用统计机器学习模型学习词语切分的规律(称为训练),从而实现对未知文本的切分。例如最大概率分词方法和最大熵分词方法等。 主要统计...

2019-04-03 11:07:55 2294

原创 【Python+中文NLP】(一) NLTK库

一、nltk库 nltk是一个python工具包, 用来处理与自然语言相关的东西. 包括分词(tokenize), 词性标注(POS), 文本分类等,是较为好用的现成工具。但是目前该工具包的分词模块,只支持英文分词,而不支持中文分词。1.安装nltk库在命令行输入:conda install nltk #anaconda环境pip install nltk ...

2019-04-03 11:05:07 19148 3

原创 【Python+中文NLP】(三)实践篇 ——用户评论文本分类:从中文csv处理到分类

本文为博主心得笔记,如有不足之处,还望包容,代码部分见下方链接。中文CSV处理 1.Excel的中文表格文件,直接另存为.csv文件 2.解决各种csv用各种代码编辑器出现error的一劳永逸的方法:把.csv文件编码改为utf-8编码方式。 方法:首先,将.csv文件鼠标右击用记事本打开。 然后,文件-另存为。...

2018-10-19 10:26:43 2034 2

原创 【机器学习】(一) 线性模型之Linear Regression

前言一、原理 1.算法含义 2.算法特点二、实现 1.sklearn中的线性回归 2.用Python自己实现算法三、思考(面试常问)参考前言 线性回归(Linear Regression)基本上可以说是机器学习中最简单的模型了,但是实际上其地位很重要(计算简单、效果不错,在很多其他算法中也可以看到用其其作为一部分)。机器学习所针对的问...

2018-10-08 11:39:42 51784 3

原创 【异常处理】解决anaconda安装出现CondaHTTPError问题

Step 1 :在命令行中输入并运行:(清华大学镜像)conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/...

2018-10-07 14:11:20 29769 19

原创 【Android】(二)SQLite可视化工具SQLiteStudio的用法

一、SQLiteStudio下载地址: http://www.pc6.com/softview/SoftView_86552.html#download二、SQLiteStudio使用教程第一步:建库 打开SQLite Studio,点击“添加数据库”按钮第二步:数据类型选择“System.Data.SQLite”,点击绿色添加按钮,将文件保存至你想保存的位置,并在Password一栏内输...

2018-03-07 13:44:22 23471 2

原创 【Android】(一) 自带数据库SQLite的用法

一、SQLite是什么 SQLite数据库存储是Android系统提供的数据存储方式之一 SQLite是专为嵌入式设备设计的一款轻量级数据库 SQLite占用资源非常低,在嵌入式设备中,只需要几百K的内存 SQLite支持标准的SQL语法,遵循数据库的ACID事务 SQLite是android系统自带,不需要单独安装,不需要用户名密码就可以使用。二、SQLite怎么用step1:新建类继承S...

2018-03-07 13:04:59 3645

原创 【Java】Java中的利用List实现数组排序

重点内容 -compareTo与compare方法的区别 -List数组实现不限定的多个类对象添加 -Collections.sort排序的使用

2016-09-26 14:49:48 439

nltk库中punkt.zip下载

解决nltk安装punkt等语料库时报错的问题; 把下载好的语料包punkt.zip解压到nltk_data/tokenizers/punkt中

2020-09-20

Python自己实现线性回归算法

可详细参考博主文章《【机器学习+sklearn框架】(一) 线性模型之Linear Regression》的公式推导,结合代码进行学习。

2018-10-12

线性回归实现sklearn自带的糖尿病datasets数据集

【线性回归实现sklearn自带的糖尿病datasets数据集】 Diabetes:包含442个患者的10个生理特征(年龄,性别、体重、血压)和一年以后疾病级数指标。 可参考博主文章《【机器学习+sklearn框架】(一) 线性模型之Linear Regression》

2018-10-12

学生信息管理系统(连接SQL)

基于Java的学生信息管理系统,实现学号、姓名、年龄、成绩的增删查改

2017-01-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除