6 卓寿杰_SoulJoy

尚未进行身份认证

暂无相关简介

等级
TA的排名 6k+

对抗机器学习模型

1.AttackMLModel随着AI时代机器学习模型在实际业务系统中愈发无处不在,模型的安全性也变得日渐重要。机器学习模型很可以会遭到恶意攻击,比较直接就能想到的如:人脸识别模型的攻击。训练出具有对抗性的机器学习模型,在业务系统存在着越来越重要的实际意义。2.Attack机器学习模型攻击要做的事情如下图所示:假设我们有一个Network用来做动物的图像识别。我们输入一张如图所示...

2019-05-04 14:28:50

ELMo

论文:《Deepcontextualizedwordrepresentations》1.word2vector我们先简单回顾下word2vector。我们想解的问题的是:如何将一个词语用向量来表示?1.1one-hot首先想到的是使用one-hot来表示,如我们有一个词典:【a,apple,…,zoo,】,词典有n个词语,那么就用n维向量表示某个词。向量中词语下标位的值为1,其余...

2019-04-22 22:42:11

异常值检测

1. 异常值检测异常值检测想要做的任务是从数据中找出与其他数据显著不同的数据,其具体应用有如:信用卡盗卡检测、网络攻击检测、癌细胞检测等。2. 看做二分类?异常值检测能不能看做一个二分类任务来建模?通常来说,异常值不能被看做为一个类别,因为异常值的种类实在是太多了。比如说做数字图片分类,有异常值图片根本就不是0~9中的某一个数字,但不是0~9的图片种类实在是太多了,根本不能把它们看做是一个类...

2019-04-15 09:15:59

如何用人机协同提高客服效率?阿里巴巴客服助手诞生了

去年参与的项目 : https://mp.weixin.qq.com/s/JG_Ajl4uO4kIS7cyUXqztw

2019-03-27 21:35:02

图解当前最强语言模型BERT:NLP是如何攻克迁移学习的?

前段时间,谷歌发布了基于双向Transformer的大规模预训练语言模型BERT,该预训练模型能高效抽取文本信息并应用于各种NLP任务,该研究凭借预训练模型刷新了11项NLP任务的当前最优性能记录。技术博主JayAlammar近日发文通过图解方式生动地讲解了BERT的架构和方法基础。2018年是机器学习模型处理文本(更准确地说是自然语言处理,简称NLP)的一个转折点...

2019-01-05 18:52:37

基于神经网络的智能对话系统(二)——机器学习背景知识

2. 机器学习背景知识本章简要回顾了深度学习和强化学习,这些学习与后续章节中的会话AI最相关。2.1 机器学习基础Mitchell(1997)将机器学习广义地定义为包括任何计算机程序,该计算机程序通过经验E来改善其在某个任务T(由P测量)的性能。如表1.2所示,对话是一个明确定义的学习问题,T,P和E规定如下:•T:与用户进行对话以实现用户的目标。•P:表1.2中定义的累积奖励。•E...

2018-12-03 15:48:15

基于神经网络的智能对话系统(一)——介绍

1.介绍1“对话系统”和“对话AI”在科学文献中经常互换使用。差异反映了不同的传统。前一个术语更为笼统,因为对话系统可能纯粹基于规则,而不是基于人工智能。2我们未涉及的会话AI的一个重要主题是口语理解(SLU)。SLU系统旨在从语音话语中提取其含义,​​其应用范围很广,从移动设备中的语音搜索到会议摘要。尽管本文中回顾的许多神经方法都适用于改进SLU系统,但这不是本文的重点。我们将...

2018-11-27 17:03:12

Transformer

前言2017 年中,有两篇类似同时也是笔者非常欣赏的论文,分别是 FaceBook 的 Convolutional Sequence to Sequence Learning 和 Google 的 Attention is All You Need,它们都算是 Seq2Seq 上的创新,本质上来说,都是抛弃了 RNN 结构来做 Seq2Seq 任务。 在本篇文章中,笔者将对 Attentio...

2018-11-20 10:17:53

论文阅读:《Ask Me Anything: Dynamic Memory Networks for Natural Language Processing》

论文:https://arxiv.org/pdf/1506.07285.pdf原文:http://www.hankcs.com/nlp/cs224n-dmn-question-answering.html最有意思的一课,将所有NLP任务视作QA问题。模仿人类粗读文章和问题,再带着问题反复阅读文章的行为,利用DMN这个通用框架漂亮地解决了从词性标注、情感分析到机器翻译、QA等一系列任务。是否所...

2018-11-08 14:13:10

论文阅读:《AliMe Assist: An Intelligent Assistant for Creating an Innovative E-commerce Experience》

原文:https://www.zybuluo.com/Rays/note/1024203阿里小蜜:提供创新电子商务体验的智能助理论文导读摘要:在本文中,阿里团队介绍了会话机器人平台“阿里小蜜”。该智能助理设计提供一种创新性的电子商务体验,并已经在真实的商业场景中上线。当前,阿里小蜜为客户提供帮助服务、客户服务和聊天服务,日处理上百万的客户问题。论文标题:AliMeAssist:AnI...

2018-11-07 20:48:22

论文阅读:《AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine》

原文:http://www.sohu.com/a/229801262_100118081AliMe聊天:基于序列到序列和重排的聊天机器人引擎AliMeChat:ASequencetoSequenceandRerankbasedChatbotEngine阿里巴巴集团AlibabaGroup【摘要】我们推出了AliMe聊天,一个开放域聊天机器人引擎,它将信息检索...

2018-11-07 18:21:44

论文阅读:《Text Matching as Image Recognition》

原文:https://blog.csdn.net/sinat_33741547/article/details/80649542一、概述MatchPyramid来自LiangPang等在2016发表的一篇文章TextMatchingasImageRecognition,大意为利用图像识别的方式进行文本匹配。二、思路对于文本匹配,基本思路如下述公式:其中T为文本,函数θθ,...

2018-11-07 12:37:32

TensorFlow文本摘要生成 - 基于注意力的序列到序列模型

原文:https://blog.csdn.net/tensorflowshizhan/article/details/692300701 相关背景维基百科对自动摘要生成的定义是, “使用计算机程序对一段文本进行处理, 生成一段长度被压缩的摘要, 并且这个摘要能保留原始文本的大部分重要信息”. 摘要生成算法主要分为抽取型(Extraction-based)和概括型(Abstraction-bas...

2018-11-07 11:19:23

论文阅读:《Deep Reinforcement Learning for Dialogue Generation》

原文:https://blog.csdn.net/liuchonge/article/details/78749623文章亮点本文是使用深度增强学习DRL的方法来解决多轮对话问题。首先使用Seq-to-Seq模型预训练一个基础模型,然后根据作者提出的三种Reward来计算每次生成的对话的好坏,并使用policy network的方法提升对话响应的多样性、连贯性和对话轮次。文章最大的亮点就在于定...

2018-11-06 20:34:27

论文阅读:《 Lip Reading Sentences in the Wild》

论文:https://arxiv.org/abs/1611.05358原文:http://www.hankcs.com/nlp/cs224n-lip-reading.html唇语翻译将视频处理为以嘴唇为中心的图片序列,给或不给语音,预测正在讲的话。这些数据可能来自新闻直播:动画演示:这里唇语和语音的识别、卡拉OK效果式的对齐,都是模型自动完成的。架构视觉和听觉两个模块或者...

2018-10-26 17:02:57

论文阅读:《Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation》

论文:https://arxiv.org/pdf/1611.04558.pdf原文:http://www.hankcs.com/nlp/cs224n-google-nmt.html双语NMT一般“瘦弱”的NMT系统只支持双语单向翻译,比如课上常见的这种:如果想实现一个模型支持多语种互译怎么办呢?土办法之前的尝试是使用多对encoder-decoderpair、一个encoder多个...

2018-10-25 19:37:35

论文阅读:《Visual Dialog》

论文:https://arxiv.org/pdf/1611.08669.pdf原文:http://www.hankcs.com/nlp/cs224n-visual-dialog.html术语VisualDialog,大致这么翻译(通俗理解为斗图)。你可以给聊天机器人发送图片,它能理解图片的意思,你们可以就图片内容展开对话;除了文本之外,让图片也成为交流的一部分;这可以帮助盲人理解周围或社交媒...

2018-10-24 22:34:10

论文阅读:《a simple but tough-to-beat baseline for sentence embeddings》

https://openreview.net/pdf?id=SyK00v5xx原文:http://www.hankcs.com/nlp/cs224n-sentence-embeddings.html句子Embedding动机虽然这节课一直在讲词向量可以编码词的意思,但自然语言处理真正关心的是整个句子的意思。如果我们能够拿到句子的向量表示,则可以方便地用内积计算相似度:还可以在这些句子...

2018-10-24 19:17:19

MovieTaster-使用Item2Vec做电影推荐

https://blog.csdn.net/fly_time2012/article/details/78439662前言自从Mikolov在他2013年的论文“Efficient Estimation of Word Representation in Vector Space”[1]提出词向量的概念后,NLP领域仿佛一下子进入了embedding的世界,Sentence2Vec、Do...

2018-08-27 13:00:08

论文阅读:《Wide & Deep Learning for Recommender Systems》

http://www.shuang0420.com/2017/03/13/%E8%AE%BA%E6%96%87%E7%AC%94%E8%AE%B0%20-%20Wide%20and%20Deep%20Learning%20for%20Recommender%20Systems/ Google Play 用的深度神经网络推荐系统,主要思路是将 Memorization(Wide Model) ...

2018-08-26 13:05:47

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。