自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Q_S_Y_Q的博客

我们都有最朴素的生活和最遥远的梦想,哪怕明天天寒地冻,路遥马亡。 --至心怀梦想的人

  • 博客(24)
  • 资源 (2)
  • 收藏
  • 关注

转载 深度解密天猫精灵对话系统

深度解密天猫精灵对话系统一、序天猫精灵音箱是阿里巴巴人工智能实验室出品的智能音箱,在推出不久就迅速占领国内市场,将人工智能以开口即得的方式带入千家万户。对话智能是天猫精灵智能的重要体现,它一部分来自于强大的算法,一部分来自于阿里丰富的后台服务与内容,一部分来自于人工知识的累积。如何把上述能力合而为一,并实现工程落地与大规模的输出,就是对话引擎的使命。相信有不少同学对其充满了好奇,一堆问题等待...

2019-07-11 23:12:55 9458 2

转载 最新整理停用词表(中文)

停用词表(中文)! ” $ % & ’ ( ) * + , –...………………………../.一.数.日///0123456789:// :: ;< ? @ A Lex [ \ ] ...

2018-06-15 11:54:04 2762

转载 ACL 2016收录paper集合

ACL 2016收录paper集合Long PapersA CALL system for learning preposition usage John Lee A Character-level Decoder without Explicit Segmentation for Neural Machine Translation Junyoung Chung, Kyunghyu...

2018-06-09 21:40:00 1588

转载 ACL 2017 录用论文整理(长文)

ACL 2017 录用论文整理(长文)https://chairs-blog.acl2017.org/2017/04/05/accepted-papers-and-demonstrations/论文集现在还不能直接下载到(好像在 这里 是能下载的),本文将会陆续搜集录用论文的下载地址。同时部分文章会精读、写一些笔记。下面的短评都是纯粹基于abstract部分加上笔者的脑补形成的。很多领域我...

2018-06-06 16:09:43 3810

原创 知识抽取之关系抽取[3]

Bidirectional Recurrent Convolutional Neural Network for Relation Classification 学习笔记来源:ACL2016 问题: 基于深度学习的关系抽取 (Relation Extraction)主要思路:本文提出了一个基于最短依赖路径(SDP)的深度学习关系分类模型,文中称为双向递归卷积神经网络模型(BRCNN)...

2018-06-01 21:36:17 1639 3

原创 知识抽取之关系抽取[2]

《End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures》阅读笔记来源:ACL2016解决问题:使用LSTM基于序列结构,结合实体检测end-to-end的关系抽取主要方法:本文提出了一种联合实体参数检测参数共享的关系抽取模型,模型中有两个双向的LSTM-RNN,一个是基于word sequ...

2018-06-01 16:08:59 1158 3

转载 知识抽取之关系抽取[1]

导读:本文转载自知乎RUC智能情报站的论文阅读笔记。Neural Relation Extraction with Selective Attention over Instances阅读笔记论文:Neural Relation Extraction with Selective Attention over Instances发表会议:ACL2016作者:Yankai Lin...

2018-06-01 15:26:20 5687

原创 双向GRU加字级别attention的模型论文笔记

双向GRU加Dual Attention模型论文名称:”Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification” [Zhou et al.,2016]

2018-05-17 22:51:29 2923

转载 知识抽取-1

知识抽取

2018-05-17 16:51:54 1084

原创 知识图谱概述

知识图谱概述

2018-05-16 21:58:19 598

原创 聊天机器人开发实战

聊天机器人开发实战目录由于最近在做智能客服,聊天机器人方面的工作,在工作工程中查阅了很多资料,也看了很多的paper,现在将整理的笔记和经验整理成文,写成一个聊天机器人开发实战的系列博客。希望读者们可以持续关注。本文将从以下方面介绍聊天机器人的开发预备知识自然语言处理自然语言理解 语料库介绍语言知识库语言模型文本处理 * 分词 * pos-tagging *...

2018-05-16 21:14:31 1024

原创 NLP系列博客

最近在整理一些NLP相关的知识,所以计划将一系列笔记整理成文,完成一个NLP和chatbot(人机对话)的系列博客。 主要内容包括机器学习算法推导,个人理解,代码实现(以python为主,少量java),论文笔记等内容。 nlp系列博客目录为:...

2018-05-08 11:08:44 577

原创 Python : open函数

open/文件操作f = open(‘/tmp/hello’, ‘w’)// open(路径+文件名,读写模式) 读写模式:r只读, r+读写, w新建(会覆盖原有文件),a追加,b二进制文件。读写模式的类型有: rU 或 Ua 以读方式打开, 同时提供通用换行符支持 w 以写方式打开 a 以追加模式打开 r+ 以读写模式打开 w+

2017-11-03 17:50:47 306

原创 Github使用教程

一,本地git客户端安装

2017-10-17 16:51:20 372

原创 Selenium学习笔记

Selenium介绍一,安装 pip install -U seleniun

2017-10-17 16:12:24 355

转载 bp算法python实现(bpnn.py)

import math import randomrandom.seed(0)def rand(a, b): return (b - a) * random.random() + adef make_matrix(m, n, fill=0.0): mat = [] for i in range(m): mat.append([fill] * n)

2017-05-10 19:40:01 3317

原创 spark性能优化-数据倾斜调优

调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。 数据倾斜发生时的现象   1、绝大多数task执行得都非常快,但个别task执行极慢。比如,总共有1000个task,997个task都在1分钟之内执行完了,但是剩余两三个task却要一两

2017-05-10 19:38:57 379

转载 JAVA类实现从hdfs导入数据到hive表中

// 需要引入 hadoop & hive jar import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; /** * 演示了通过java jdbc 操作hive ,一般企业环境不会这么做 ,hive 目的是去ja

2017-04-20 09:19:44 4858 2

原创 神经网络之BP算法

1,基本思想 BP算法的思想是:学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播阶段。误差反向传播是将输出误差以某种形式通过隐层向输入层逐层反转,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正个单元权值的依据。这种信号正

2017-04-20 09:15:35 657

原创 机器学习基础之----感知机----

写在前面的话 由于博主最近在某国企工作,业余时间较多,于是蒙生写博客的想法,一来是做读书笔记,二来也希望可以和更多热爱ML和DL的人一起交流学习。本文将从四个方面介绍感知机的内容: 1,感知机总体介绍 2,叙述感知机的学习策略 3,介绍感知机的学习算法 4,证明算法的收敛性一,感知机总体介绍 OK,进入正题。感知机(Perceptron)是二分类的

2017-01-12 10:59:05 847 1

转载 牛顿法、雅克比矩阵、海森矩阵

牛顿法、雅克比矩阵、海森矩阵一般来说, 牛顿法主要应用在两个方面, 1, 求方程的根; 2, 最优化。 1,求方程的根 其原理便是使用泰勒展开,然后去线性部分,即: (1) 然后令上式等于0,则有: (2) 经过不断迭代: (3)

2017-01-11 17:07:27 1587

转载 支持向量机通俗导论(理解SVM的三层境界)

前言    动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描述数学公式的时候还是显得不够。得益于同学白石的数学证明,我还是想尝试写一下,希望本文在兼顾通俗易懂的基础上,真真正正能足以成为一篇完

2017-01-10 14:15:50 810

转载 (EM算法)The EM Algorithm

EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式      回顾优化理论中的一些概念。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。当x是向量时,如果

2017-01-05 16:51:43 716 1

原创 Maven的镜像地址汇总

#阿里云的镜像mirror>        id>alimavenid>        name>aliyun mavenname>        url>http://maven.aliyun.com/nexus/content/groups/public/url>        mirrorOf>centralmirrorOf>              mirro

2016-12-22 09:31:43 426

基于序列标注的中文依存句法分析方法

提出了一种基于序列标注模型的中文依存句法分析方法。 该方法将依存句法分析转化成序列标注问题, 利用条件随机 场 CRF ( Cond itionalR andom F ie ld)建立序列标注模型。 在宾州中文树库的测试中, 达得了 76. 59% 的依存关系准确率, 句子准确率也 达到了 23. 5% 。 同时我们改进了 Viterbi算法, 使得依存关系的准确率提高了近 2个百分点, 句子准确率提高了近 3. 5个百分点。

2018-05-17

中文停用词表(比较全面,有1208个停用词)

中文停用词表(比较全面,有1208个停用词),挺好用。

2017-09-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除