4 华师数据学院·王嘉宁

学生身份

我要认证

研究方向:JavaWeb开发、微信二次开发、机器学习、深度学习、知识图谱、自然语言处理、计算机视觉、强化学习

等级
TA的排名 2w+

论文解读:MeLU:Meta-Learned User Preference Estimator for Cold-Start Recommendation

论文解读:MeLU:Meta-Learned User Preference Estimator for Cold-Start Recommendation  推荐领域内的一个痛点问题是冷启动问题,现如今许多学术界在推荐领域内的研究都指向该问题。事实上,冷启动可以认为是一种由于用户-物品交互数据缺乏所导致的,自然而然可以想到利用小样本学习的方法,使得我们训练的模型可以在很少的样本前提下就能够给出较好的推荐效果。一、简要信息序号属性值1模型名称MeLU2所属领域推荐系

2020-10-30 12:14:06

论文解读:Open Domain Question Answering Using Early Fusion of Knowledge Bases and Text

论文解读:Open Domain Question Answering Using Early Fusion of Knowledge Bases and Text  知识库问答通常存在一个问题,就是由于知识库不充分导致在一定的推理范围内无法找到相应的答案,因此,可以通过引入额外非结构化文本做辅助增强。本文提出一种开放领域的知识库和文本问答方法。一、简要信息序号属性值1模型名称GRAFT-Nets2所属领域自然语言处理3研究内容知识库问答4核心内容

2020-10-23 11:25:42

pycharm与ssh远程访问服务器docker

pycharm与ssh远程访问服务器docker  背景:有些实验需要在服务器上完成,因此为了快速便利地在本地调试远程服务器上的代码,需要完成本地与远程服务器的直连。然而现阶段诸多服务器上安装有docker,通常需要在docker内完成调试代码,因此本文主要提供远程访问服务器docker的配置方法。  需要工具及说明:pycharm:集成开发工具ssh:远程访问工具docker:容器1、配置远程服务器docker第一步:购置配置服务器(如果已有服务器跳过)  可自行在阿里云或腾讯云等服务

2020-10-09 17:37:35

基于监督学习和远程监督的神经关系抽取

神经关系抽取技术综述作者:王嘉宁  QQ:851019059  Email:lygwjn@126.com  关系抽取作为自然语言处理重要的研究领域之一,一直以来受到国内外诸多高校、科研机构的高度关注。近些年来的ACL、EMNLP、AAAI、IEEE、ICDE、IJCAI等顶会,以“Relation Extraction”或“Relation Classification”为关键字的论文逐年增加...

2019-11-29 19:01:09

A survey on Few-shot Learning (小样本学习)

A survey on Few-shot Learning (小样本学习)  机器学习已经成功地在数据密集型任务上得以应用,但通常却不能够处理数据很少的情况。最近,小样本学习(Few-shot Learning,FSL)被提出用于解决这个问题。在先验知识的基础上,FSL可以有效的涵盖一个只有极少监督信息数量样本的新任务。本文,我们将对小样本学习FSL进行一个系统的梳理。首先给出FSL一个形式化的定义,其次根据相关机器学习的问题进行分类,同时指出一个核心的关键问题即小样本学习不能依赖于传统的经验风险最小化的

2020-09-25 17:39:11

抖音推荐的背后原理——大数据+推荐

抖音推荐的背后原理——大数据+推荐  大数据作为当前热门的话题,在软件开发与人工智能领域的敲门砖,各大厂都需要接触过大数据应用项目的人才。本文以大数据处理为出发点,浅层地讲述抖音推荐的背后原理。关键词:大数据、推荐系统、关系图谱、数据中台、联邦学习什么是大数据?  大数据具备5V特性分别是:(1)Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。(2)Variety:种类和来源多样化。包括结构化、半结构化

2020-09-22 12:11:43

2020第十七届华为杯数模C题——P300脑电信号数据预处理算法

脑电信号数据预处理  这两天的数学建模选的C题,目标是要处理脑电P300信号的数据并进行相关预测任务。该题重点是数据预处理,因此根据最后实验的结果,分享相关的预处理方法以及源代码。长话短说,给出任务的简单描述、分析方法以及相关源代码。关于2020年第十七届华为杯研究生数学建模所有赛题可前往: (https://pan.baidu.com/s/19O9J_0tnWumMe47zqk3jMg ,提取码:xx3j),赛题解压码为  任务描述:脑机接口是通过计算机检测人脑活动的系统,其通过对人体大脑各个通道检测

2020-09-21 14:50:26

【算法编程】和为 K 的最少斐波那契数字数目

【算法编程】和为 K 的最少斐波那契数字数目  给定k个数,其满足斐波那契性质,从中挑选一部分数字(每个数只能被挑选1次)使得它们的和恰巧为k。目标是求出最少能够挑选几个数满足这个条件。k取值范围为 1≤k≤1091\leq k\leq10^91≤k≤109 。  试题来源: LeetCode.1414  难度:★★★☆☆【输入】k=7【输出】2【解析】斐波那契数字为:1,1,2,3,5,8,13,……,对于 k = 7 ,我们可以得到 2 + 5 = 7 。C++源代码: class

2020-09-14 20:32:01

【推荐系统】RippleNet——基于知识图谱偏好传播的推荐系统

【推荐系统】RippleNet——基于知识图谱偏好传播的推荐系统论文名称:《RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems》PDF:https://arxiv.org/pdf/1803.03467源码地址:https://github.com/hwwang55/RippleNet.一、前言  推荐系统(Recommender System, RS)作为最经典最重要的人工智

2020-09-13 22:19:39

论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction?

论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction?  远程监督关系抽取普遍遭受噪声的影响,先前的工作一直关注如何降低噪声对分类产生的错误影响,例如通过多示例学习以及句子级别的注意力机制,或者使用强化学习、对抗学习直接过滤噪声等。本文则完全从新的角度出发——是否可以将那些可能是噪声的标签纠正,这样即不会降低语料的数量,也能直接提升语料的质量。一、简要信息序号属性值1模型名称DC

2020-09-02 21:06:55

论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings

论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings  知识库问答(KBQA/KGQA)是指给定一个自然语言问句和对应的知识库,试图从知识库中返回对应正确的答案。现如今一些方法是通过对问句中的候选实体在知识库中对齐,并获得一定跳数范围内的子图,通过排序算法或TopK算法等获得有可能的答案。但是有时候知识库是不充分的,某些目标答案需要经过非常长的推理路径才能获得,而在

2020-08-20 16:02:26

k近邻算法

k近邻算法  k近邻算法是一个基本的分类回归方法,其没有显式的学习过程,而是完全取决于数据,因此k近邻是基于数据的学习算法,其只有唯一的一个参数 k(k>0,k∈N+)k(k>0,k\in\mathbb{N}_+)k(k>0,k∈N+​) 。1、k近邻算法  给定一组已知数据 T={(xi,yi)}i=1i=NT=\{(x_i,y_i)\}_{i=1}^{i=N}T={(xi​,yi​)}i=1i=N​,其中 xix_ixi​ 表示样本的特征向量,yiy_iyi​ 是对应的标签。通

2020-08-15 15:40:58

论文解读:Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question

论文解读:Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question  知识图谱问答的任务目标是在给定一个自然问句以及对应的知识库下,找到正确的答案(实体)。本文则通过多任务学习的框架,利用多视角注意力机制完成知识图谱问答任务。1、什么是知识图谱?  知识图谱是近年来非常热门的研究内容,现如今可以和自然语言处理、计算机视觉一并作为一个新的研究领域。知识图谱通常可以抽象为知识

2020-08-14 21:11:38

论文解读:Graph Convolutional Networks for Text Classifification

论文解读:Graph Convolutional Networks for Text Classifification  先前的文本分类方法是基于CNN或RNN进行的,只能单独的对文本自身的上下文进行语义提取,而不能够对文本之间的相关信息进行表示。随着图结构在NLP领域的大放光彩,将图引入文本分类是新的思路。一、简要信息序号属性值1模型名称Text-GCN2所属领域自然语言处理3研究内容文本分类4核心内容Text Classification,

2020-08-06 14:31:47

基于PCA的图像压缩实现

基于PCA的图像压缩实现注:该内容为校内课程实验,仅供参考,请勿抄袭!源码:PPCA-for-Image-Compession摘要  随着计算机互联网的发展和数据的日益增长,如何高效的处理和传输海量数据成为大数据处理的瓶颈问题,尤其对于图像类数据,通常其占有空间大,包含信息量丰富,如何对图像数据进行压缩吸引广大研究者们的注意。本文通过调研PCA图像压缩的相关工作,认为当前方法依赖于整个数据集,压缩效率低、占据内存量大的问题,本文提出一种分片PCA(P-PCA)图像压缩算法,旨在通过对图像进行分片,并

2020-08-02 17:50:10

对话生成的新探索——从模仿学习到逆强化学习

论文解读:Dialogue Generation: From Imitation Learning to Inverse Reinforcement Learning  对话生成是一个常见的自然语言处理任务,其在工业界广泛应用与智能客服,闲聊机器人等。现如今主要研究于如何提高对话的质量,多样性。本文则采用先进的技术试图解决这个问题。一、简要信息序号属性值1模型名称DG-AIRL2所属领域自然语言处理3研究内容对话生成4核心内容Dialogue G

2020-08-02 16:09:19

关联规则常用算法

关联规则常用算法  关联规则(Association Rules)是海量数据挖掘(Mining Massive Datasets,MMDs)非常经典的任务,其主要目标是试图从一系列事务集中挖掘出频繁项以及对应的关联规则。关联规则来自于一个家喻户晓的“啤酒与尿布”的故事,本文通过故事来引出关联规则的方法。啤酒与尿布的故事  在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家

2020-07-03 15:53:41

手写数字识别Mnist的Pytorch实现

手写数字识别Mnist的Pytorch实现注:该内容为校内课程实验,仅供参考,请勿抄袭!源码地址:一、引言(Introduction)  手写数字识别时经典的图像分类任务,也是经典的有监督学习任务,经常被用于测试图像的特征提取效果、分类器性能度量等方面,本文将通过应用机器学习和深度学习算法实现手写数字识别。  图像分类任务是指给定一张图像来对其进行分类,常见的图像分类任务有手写数字识别、猫狗分类、物品识别等,图像分类也是计算机视觉基本的分类任务。而对于手写数字识别任务来说,可以当做图像分类问题,也

2020-07-02 23:20:09

AAAI2020知识图谱论文集

全部列表:https://aaai.org/Conferences/AAAI-20/wp-content/uploads/2020/01/AAAI-20-Technical-Program-Schedule.pdf本文精选了知识图谱有关论文集:知识图谱补全(Graph Completion)1322: Improving Entity Linking by Modeling Latent Entity Type InformationShuang Chen; Jinpeng Wang; Feng .

2020-06-29 16:05:29

论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering

论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering  本文解决KBQA中的子问题——Relation Detection(关系检测)。关系检测目的是给定一个问句,根据知识库来判断该问句目标的关系是什么。例如问句“中国的首都是哪里”,我们会先锁定问句的中心实体(主题词)是“中国”,其次检测这句话目标是问与“中国”这个实体具有“首都”关系的实体,因此类似于知识图谱的补全工作:(中国,首都,?)。因此关系检测

2020-06-19 11:47:54

查看更多

勋章 我的勋章
  • 领英
    领英
    绑定领英第三方账户获取
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 分享精英
    分享精英
    成功上传11个资源即可获取