7 卓寿杰_SoulJoy

尚未进行身份认证

我要认证

微信公众号:小爷毛毛;方向:语义匹配、QA Bot、搜索、推荐

等级
TA的排名 6k+

密度聚类DBSCAN、HDBSCAN

语雀导流:https://www.yuque.com/chudi/tzqav9/ulauy9

2020-04-14 19:39:43

语雀导流

接下来博客准备都在语雀写~希望大家感兴趣能够关注下:https://www.yuque.com/chudi/tzqav9建议没用过语雀的同学可以试试语雀,语雀有几个优点:清爽简洁的画风、无广告自定义文档目录结构,给创作者一种自己在写一本书、在创造一个知识库的体验同一个知识库,可多人协调编辑创作。富文本与markdown顺滑结合的体验。点很多,举个例子,在CSDN上用markdown模...

2020-04-05 12:54:34

论文阅读:【AAAI 2020 】Long Short-Term Sample Distillation(基于长短期老师的样本蒸馏方法)

语雀引流:https://www.yuque.com/chudi/tzqav9/fgprse

2020-04-05 12:08:31

对话系统调查:近期进展与新前沿

语雀~https://www.yuque.com/chudi/tzqav9/pxa0ok

2020-04-03 13:52:46

推荐系统提纲笔记

相关图文Xmind、PDF、视频讲解、代码,请参阅语雀地址:https://www.yuque.com/chudi/tzqav9/ny150b推荐系统推荐系统的传统匹配模型基于 Collaborative Filtering 的方法分类User-base CF:通过对用户喜欢的 item 进行分析,如果用户 a 和用户 b 喜欢过的 item 差不多,那么用户 a 和 b 是相似的。类似朋友推荐一样,可以将 b 喜欢过但是 a 没有看过的 item 推荐给 a。Item-base CF: i

2020-03-29 11:50:58

业界搜索算法应用概览(v.2019)

2020-03-04 14:20:10

深度自然语言处理在搜索&推荐系统的应用

阅读原文

2020-03-02 16:14:50

对抗机器学习模型

1. Attack ML Model随着AI时代机器学习模型在实际业务系统中愈发无处不在,模型的安全性也变得日渐重要。机器学习模型很可以会遭到恶意攻击,比较直接就能想到的如:人脸识别模型的攻击。训练出具有对抗性的机器学习模型,在业务系统存在着越来越重要的实际意义。2. Attack机器学习模型攻击要做的事情如下图所示:假设我们有一个Network用来做动物的图像识别。我们输入一张如图所示...

2019-05-04 14:28:50

ELMo

论文:《Deep contextualized word representations》1. word2vector我们先简单回顾下word2vector。我们想解的问题的是:如何将一个词语用向量来表示?1.1 one-hot首先想到的是使用one-hot来表示,如我们有一个词典:【a,apple,…,zoo,】,词典有n个词语,那么就用n维向量表示某个词。向量中词语下标位的值为1,其余...

2019-04-22 22:42:11

异常值检测

1. 异常值检测异常值检测想要做的任务是从数据中找出与其他数据显著不同的数据,其具体应用有如:信用卡盗卡检测、网络攻击检测、癌细胞检测等。2. 看做二分类?异常值检测能不能看做一个二分类任务来建模?通常来说,异常值不能被看做为一个类别,因为异常值的种类实在是太多了。比如说做数字图片分类,有异常值图片根本就不是0~9中的某一个数字,但不是0~9的图片种类实在是太多了,根本不能把它们看做是一个类...

2019-04-15 09:15:59

如何用人机协同提高客服效率?阿里巴巴客服助手诞生了

去年参与的项目 : https://mp.weixin.qq.com/s/JG_Ajl4uO4kIS7cyUXqztw

2019-03-27 21:35:02

图解当前最强语言模型BERT:NLP是如何攻克迁移学习的?

前段时间,谷歌发布了基于双向 Transformer 的大规模预训练语言模型 BERT,该预训练模型能高效抽取文本信息并应用于各种 NLP 任务,该研究凭借预训练模型刷新了 11 项 NLP 任务的当前最优性能记录。技术博主 Jay Alammar 近日发文通过图解方式生动地讲解了 BERT 的架构和方法基础。2018 年是机器学习模型处理文本(更准确地说是自然语言处理,简称 NLP)的一个转折点...

2019-01-05 18:52:37

基于神经网络的智能对话系统(二)——机器学习背景知识

2. 机器学习背景知识本章简要回顾了深度学习和强化学习,这些学习与后续章节中的会话AI最相关。2.1 机器学习基础Mitchell(1997)将机器学习广义地定义为包括任何计算机程序,该计算机程序通过经验E来改善其在某个任务T(由P测量)的性能。如表1.2所示,对话是一个明确定义的学习问题,T,P和E规定如下:•T:与用户进行对话以实现用户的目标。•P:表1.2中定义的累积奖励。•E...

2018-12-03 15:48:15

基于神经网络的智能对话系统(一)——介绍

1. 介绍1 “对话系统”和“对话AI”在科学文献中经常互换使用。差异反映了不同的传统。前一个术语更为笼统,因为对话系统可能纯粹基于规则,而不是基于人工智能。2 我们未涉及的会话AI的一个重要主题是口语理解(SLU)。 SLU系统旨在从语音话语中提取其含义,​​其应用范围很广,从移动设备中的语音搜索到会议摘要。尽管本文中回顾的许多神经方法都适用于改进SLU系统,但这不是本文的重点。我们将...

2018-11-27 17:03:12

Transformer

前言2017 年中,有两篇类似同时也是笔者非常欣赏的论文,分别是 FaceBook 的 Convolutional Sequence to Sequence Learning 和 Google 的 Attention is All You Need,它们都算是 Seq2Seq 上的创新,本质上来说,都是抛弃了 RNN 结构来做 Seq2Seq 任务。 在本篇文章中,笔者将对 Attentio...

2018-11-20 10:17:53

论文阅读:《Ask Me Anything: Dynamic Memory Networks for Natural Language Processing》

论文:https://arxiv.org/pdf/1506.07285.pdf原文:http://www.hankcs.com/nlp/cs224n-dmn-question-answering.html最有意思的一课,将所有NLP任务视作QA问题。模仿人类粗读文章和问题,再带着问题反复阅读文章的行为,利用DMN这个通用框架漂亮地解决了从词性标注、情感分析到机器翻译、QA等一系列任务。是否所...

2018-11-08 14:13:10

论文阅读:《AliMe Assist: An Intelligent Assistant for Creating an Innovative E-commerce Experience》

原文:https://www.zybuluo.com/Rays/note/1024203 阿里小蜜:提供创新电子商务体验的智能助理论文导读摘要: 在本文中,阿里团队介绍了会话机器人平台“阿里小蜜”。该智能助理设计提供一种创新性的电子商务体验,并已经在真实的商业场景中上线。当前,阿里小蜜为客户提供帮助服务、客户服务和聊天服务,日处理上百万的客户问题。论文标题: AliMe Assist: An I...

2018-11-07 20:48:22

论文阅读:《AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine》

原文:http://www.sohu.com/a/229801262_100118081AliMe聊天:基于序列到序列和重排的聊天机器人引擎 AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine 阿里巴巴集团 Alibaba Group 【摘要】我们推出了AliMe聊天,一个开放域聊天机器人引擎,它将信息检索...

2018-11-07 18:21:44

论文阅读:《Text Matching as Image Recognition》

原文:https://blog.csdn.net/sinat_33741547/article/details/80649542一、概述MatchPyramid来自Liang Pang等在2016发表的一篇文章Text Matching as Image Recognition,大意为利用图像识别的方式进行文本匹配。二、思路对于文本匹配,基本思路如下述公式: 其中T为文本,函数θθ,...

2018-11-07 12:37:32

TensorFlow文本摘要生成 - 基于注意力的序列到序列模型

原文:https://blog.csdn.net/tensorflowshizhan/article/details/692300701 相关背景维基百科对自动摘要生成的定义是, “使用计算机程序对一段文本进行处理, 生成一段长度被压缩的摘要, 并且这个摘要能保留原始文本的大部分重要信息”. 摘要生成算法主要分为抽取型(Extraction-based)和概括型(Abstraction-bas...

2018-11-07 11:19:23

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。