自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

转载 学习笔记(1):自然语言处理动手学Bert文本分类-动手学中文文本分类开篇

Bert作为目前自然语言处理领域最流行的技术之一,文本分类作为自然语言处理领域最常见的任务之一,Pytorch作为目前最流程的深度学习框架之一,三者结合在一起将会产生什么样的花火,本套课程基于Pytorch最新1.4版本来实现利用Bert实现中文文本分类任务,延续动手学系列课程风格,全程手敲代码,跟着杨博一行一行代码撸起来。...

2020-06-19 09:43:30 733 2

原创 中文命名实体识别实战学习路线图-揭开中文命名实体识别的神秘面纱

中文命名实体识别实战学习路线图-揭开中文命名实体识别的神秘面纱命名实体识别作为自然语言处理 的基础技术之一,在自然语言处理上游各个任务(问答系统、机器翻译、对话系统等)重扮演者十分重要的角色,因此深入掌握命名实体识别技术,是作为自然语言处理从业者毕本技能,本学习路线图理论与实践相结合,希望能给大家带来帮助。本学习路线图主要从最简单的基于BiLSTM+CRF的中文命名实体模型到基于IDCNN+CR...

2019-10-06 10:47:46 617

原创 轻松理解循环神经网路

最近看了台湾大学李宏毅老师讲的RNN视频,觉得非常好,因此总结一下,希望对自己有提升,同时也分享给需要的朋友。下面进入正题:我们先来看一个例子,在订票系统或者说更通用的智能客服中都涉及到Slot Filling问题,具体如下图:如上图所示,针对用户提出的I would like to arrive Taipei on November 2nd,ticket booking syst...

2018-12-19 17:07:26 241

原创 自然语言处理之动手学词向量(word embedding)-杨帅-专题视频课程

词向量(Word embedding)是深入学习技术在自然语言处理中应用的基础,因此掌握好词向量是学习深度学习技术在自然语言处理用应用的重要环节。

2018-09-17 09:42:01 800 1

原创 配置jupyter notebook远程访问

生成配置文件 jupyter notebook –generate-config生成密码 打开ipython, 创建一个密文密码 In [1]: from notebook.auth import passwd In [2]: passwd() Enter password: Verify password: Out[2]: ‘sha1:ce2...

2018-08-29 15:22:21 305

原创 Ubuntu 16.04 SSH 无法远程登录问题解决方案

Ubuntu 16.04 SSH 无法远程登录问题解决方案对于新安装的Ubuntu系统,本文以16.04为例: 在我们新安装ubuntu系统后需要安装以下软件及配置才可以远程登录到ubuntu系统: (1)安装vim 新安装的ubuntu系统是不带vim,因此需要使用以下命令进行安装: sudo apt-get install vim (2)安装openssh sudo apt-...

2018-08-26 10:53:45 3300 2

原创 轻松理解TF-IDF原理及应用

  在了解TF-IDF原理前,我们首先需要高清楚为啥需要它以及它能解决什么问题?下面我们先从以计数为特征的文本向量化来说起。以计数特征文本向量化的不足  计数特征,简单来讲就是统计每个特征词在文档中出现的次数,把次数作为特征的权重。因此在以计数特征文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如我们将下面4个短文本做了词频统计:   corpus=[  ...

2018-08-09 09:39:53 1995

原创 中文分词学习路线图

中文分词作为自然语言处理技术(NLP)的底层技术之一,是自然语言处理入门的第一步。因此学习好中文分词技术对于学习好NLP后续技术有着至关重要的作用,因此本文总结了中文分词技术的学习路线图,希望能给中文分词学习者提供一点帮助。下面我们给出中文分词学习路线图同时特意录制了先关视频课程,喜欢的可以看下: 课程视频地址:http://study.163.com/course/intr...

2018-07-31 13:45:05 481

原创 动手学Numpy-杨帅-专题视频课程

本课程分为Numpy基础、Numpy进阶与Numpy三部分,采取循循渐进的方式进行讲解,从基础的环境搭建,到的线性代数,全程手敲代码,保证课堂质量,杜绝对着讲义照本宣科,保证课堂趣味性。...

2018-07-30 11:06:23 229

原创 动手学Pycharm2018-杨帅-专题视频课程

本课程是学习Python课程及后续人工智能的课程基础,课程目标是让学习本课程的学员掌握Pycharm这款IDE的使用,同时为了避免课程的枯燥,专门精心准备了词云制作及在线分词实战的案列。同时这两个案例也是为我们后续的深度学习与自然语言处理课程的基础,希望本门课程能给学院带来收获。本课程所有案例都现场手敲代码,坚持动手是学习的第一原则。...

2018-07-02 14:19:08 287

原创 我眼中的机器学习

今天我们要讨论的内容是什么是机器学习,首先我们给出下面一个思维导图,作为我们今天要讨论的内容: 什么是机器学习? 什么是机器学习,这是我们在入门机器学习时,要首先弄清楚的概念,只有弄清楚了这个概念,我们才能更好的去理解机器学习。其实我们的前辈和先驱已经给出过,一些定义,首先在1959年 Arthur Samuel给出的定义:Field of study that gives comput...

2018-06-26 10:19:37 374

原创 深度学习环境搭建(Windows下Anaconda安装与配置)

目前Tensorflow支持Windows,但是Anaconda需要3.5,需要的可以去网盘地址下载。安装的时候主要邮件选中安装包,选择以管理员身份运行即可,剩余的按下截图即可。如果有问题可以加入深度学习与Tensorflow技术交流QQ群AI壹号堂220823345

2017-12-03 14:27:41 1155 1

原创 ubuntu16.04下创建py2与py3虚拟环境

(一)创建python2虚拟环境mkvirtualenv -p /usr/bin/python2.7 bruce_py2查看创建虚拟环境中所安装的包pip freeze list(二)创建python3虚拟环境mkvirtualenv -p /usr/bin/python3.5 bruce_py3查看创建虚拟环境中所安装的包pip freeze list

2017-11-29 15:23:39 922

转载 ubuntu下python虚拟环境搭建

virtualenvvirtualenv 是一个可以在同一计算机中隔离多个python版本的工具。有时,两个不同的项目可能需要不同版本的python,如 python2.6.6 / python3.0 ,但是如果都装到一起,经常会导致问题。所以需要一个工具能够将这两种或几种不同版本的环境隔离开来,需要哪个版本就切换到哪个版本做为默认版本。virtualenv 既是满足这个需求的工具。它能够用于创建

2017-11-29 14:57:23 1033

stopwordlist.txt

最全中文停用词表整理(1893个),可用于自然语言处理任务,比如文本分类,文本摘要,关系抽取,事件抽取等

2020-04-08

数据科学入门之环境搭建

数据科学入门之环境搭建展示了数据科学所需要的安装软件演示,包含Anaconda,git,Pycharm

2018-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除