自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

转载 文本自动生成研究进展与趋势

CCF 中文信息技术专业委员会万小军 冯岩松 孙薇薇北京大学计算机科学技术研究所,北京摘要我们期待未来有一天计算机能够像人类一样会写作,能够撰写出高质量的自然语言文本。文 本自动生成就是实现这一目的的关键技术。按照不同的输入划分,文本自动生成可包括文本 到文本的生成、意义到文本的生成、数据到文本的生成以及图像到文本的生成等。上述每项 技术均极具挑战性,在自然语言处理

2017-12-02 14:30:42 29208 4

原创 内容理解之情感计算

情感计算是关于情感、情感产生以及影响情感方面的计算。让机器也具备“情感”。它被称为机器人的“读心术”,也有人称为“察言观色”的能力,让机器拥有“情商”。

2022-11-30 18:30:00 1354 1

原创 文本自动生成研究进展与趋势之文本到文本的生成(二)

Seq2Seq框架下模型及其最新研究进展

2022-11-03 23:22:11 446

原创 知识图谱之知识抽取

知识抽取是知识图谱构建的核心技术之一,是实现自动化构建大规模知识图谱的重要技术。其目的主要从不同来源、不同结构的数据中进行知识提取并存入知识图谱中。知识抽取任务主要包括以下三个子任务:实体抽取、关系抽取和事件抽取。

2022-10-20 00:57:02 4354

原创 知识图谱构建概述

知识图谱系列之知识图谱概述

2021-11-07 09:56:56 2367 1

原创 知识图谱助力新基建

知识图谱助力新基建导读:大家上午好,本次分享题目为知识图谱助力新基建,基于知识图谱构建新一代数据智能基础设施,主要介绍:新基建简介 知识图谱助力新基建 基于知识图谱的智能数据治理 基于知识图谱的认知智能中台 产业化实践▌新基建简介新基建:提出与发展新基建:建设内容上述我们讲到的新基建主要包括哪些内容?主要包括5G基建、大数据中心、人工智能、工业互联网、高速铁路和城际轨道交通、特高压、新能源汽车充电桩等七大部分的建设,今天主要关注大数据中心与人工智能两个话题。...

2021-11-07 09:56:03 274

原创 Maven项目实战

第一章、初识Maven第二章、在Eclipse 使用Maven第三章、Maven 核心技术第四、Maven构建Web项目第一节、项目借鉴第二节、配置文件 视频链接:https://pan.baidu.com/s/1_fe3wdwMQmXqQ0UCgvjKbQ相关视频如有需要提取码可加qq:2322450901...

2021-08-23 07:08:21 124

原创 大厂算法面试系列---链表操作

1、有序链表合并1.1 两个有序链表合并题目描述给出两个有序的整数数组A和B,请将数组 B合并到数组A中,变成一个有序的数组注意:可以假设A数组有足够的空间存放B数组的元素,A和B中初始的元素数目分别为m和n 解题思路 一般有递归与迭代两种方法,迭代方法后续补充 方法一:递归 如果left或者right一开始就是空链表,那么没有任何操作需要合并,所以我们只需要返回非空链表。 否...

2021-08-23 06:43:21 206 3

原创 文本自动生成研究进展与趋势之总结与展望

总结与展望 文本自动生成研究进展与趋势 系列也到尾声,最后对文本自动生成研究进展与趋势进行总结和展望 本文对文本自动生成技术进行了全面的介绍,包括文本到文本的生成、意义到文本的生成、数据到文本的生成、图像到文本的生成等。由于上述每项技术均有众多的研究者在研究,相关的学术成果也层出不穷,因此本文的总结难免有遗漏之处。希望本文的内容能够对相关研究人员和从业者有所帮助。 对文本自动生成技术的国际研究现状和国内研究现状进行比较可以看到,国内对该领域的研究投入和产出均远远...

2021-04-21 13:52:40 593 2

原创 文本自动生成研究进展与趋势之图像到文本的生成

图像到文本的生成1 国际研究现状 图像到文本的生成技术是指根据给定的图像生成描述该图像内容的自然语言文本,例如新闻图像附带的标题、医学图像附属的说明、儿童教育中常见的看图说话、以及用户在微博等互联网应用中上传图片时提供的说明文字。依据所生成自然语言文本的详细程度及长度的不同,这项任务又可以分为图像标题自动生成和图像说明自动生成。前者需要根据应用场景突出图像的核心内容,例如,为新闻图片生成的标题需要突出与图像内容密切关联的新闻事件,并在表达方式上求新以吸引读者的眼球;而后者通常需要详细描...

2021-04-21 13:49:15 3739 2

原创 文本自动生成研究进展与趋势之数据到文本的生成

数据到文本的生成1 国际研究现状 数据到文本的生成技术指根据给定的数值数据生成相关文本,例如基于数值数据生成天气预报文本、体育新闻、财经报道、医疗报告等。数据到文本的生成技术具有极强的应用前景,目前该领域已经取得了很大的研究进展,业界已经研制出面向不同领域和应用的多个生成系统。针对数据到文本的生成技术的研究单位主要集中少数几个单位,例如英国阿伯丁大学、英国布莱顿大学、爱丁堡大学等,相关研究成果主要发表在 INLG、ENLG 这几个专业学术会议上。英国阿伯丁大学的 Ehud Reit...

2021-04-21 13:43:43 1173

原创 文本自动生成研究进展与趋势之意义到文本的生成

意义到文本的生成1 国际研究现状不同于文本到文本的生成,意义到文本的生成这一任务的输入在学界并没有达成一致,其根本在于不论是哲学家还是语言学家对何为自然语言的语义都未能形成较为一致的定义。在计算语言学领域,研究人员普遍遵循的语义研究原则建立在“真值条件(Truth Condition)” 的基础上,认为寻找到了能够使自然语言语句成真的条件,即是在某种程度上刻画了自然语言的语义。在真值条件假设基础上,学者普遍采用逻辑的方法来对语义进行表征,并分别从模型论(Model Theory)和证明论(...

2021-04-21 13:33:28 811

原创 文本自动生成研究进展与趋势之文本到文本的生成

文本到文本的生成现状1、国际研究现状 文本到文本的生成技术主要指对给定文本进行变换和处理从而获得新文本的技术,具体说来包括文本摘要(Document Summarization)、句子压缩(Sentence Compression)、句子融合 (Sentence Fusion)、文本复述(Paraphrase Generation)等。国际上对上述不同技术均进行了多年的研究,相关研究成果主要发表在自然语言处理相关学术会议与期刊上,例如 ACL、EMNLP、NAACL、COLING、AAA...

2021-04-21 13:22:51 1056

原创 python下mxnet 编译安装遇到问题汇总(二)

上次讲到编译安装mxnet, 这次讲一下对因特尔CPU处理器优化的mxnet(mxnet-mkl)编译安装,也是工作需要,目前mxnet在最模型推理时,耗时长(与开发相比慢了将近10倍)。首先还是先将源码下载下来,我这边下载的是最新发布版mxnet-1.6.0。值得注意的一点细节, mxnet-1.6.0版本也是最后一个支持pyhon2的版本,之后不再对python2进行支持。wget...

2020-03-07 18:18:32 650

原创 python下mxnet 编译安装遇到问题汇总(一)

首先说一下为什么编译安装通过pip install mxnet 安装遇到Illegal instruction (core dumped)已经过一番查找,原来是因为服务器cpu 指令集sse 不支持,mxnet pip安装支持编码集是avx,查看命令:cat /proc/cpuinfo flags : fpu de pse tsc msr pae mce cx8 ...

2020-01-21 15:11:26 2590 1

原创 RNN循环神经网络-初探

闲言碎语不多讲,本文主要从循环神经网络中起源、应用、主要用途、遇到问题、以及解决方案5部分进行初步探究,具体如下: 起源:循环神经网络是在1982年由霍普菲尔德提出的,使用历史信息来帮助当前决策! 应用:传统的机器学习算法非常依赖于人工提取的特征,使得基于传统机器学习的图像识别、语音识别以及自然语言处理等问题存在特征提取的瓶颈。而基于全连接神经网络的方法也存在太多参数,无法利用数据中的时...

2018-07-17 17:23:43 633

原创 云计算之虚拟化技术的探究

虚拟化技术虚拟化技术在云计算技术发展和应用中所发挥的作用体现为云数据中心为管理员带来的高效、便捷的管理体验;提高数据中心的资源利用率减少能源消耗1、虚拟化技术概述IaaS直接应用虚拟化技术。虚拟化技术在分布式计算,并行计算,高性能计算、网格计算、云计算中得到很好的应用。商业优势:降低IT成本增强了系统安全性和可靠性1)、定义:通常虚拟化是指计算组间-虚拟,的...

2018-07-17 17:08:46 4849 1

原创 推荐系统初步研究

1、定义:它利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程广义:刻画用户特征和商品特征的关联关系,根据用户(物品)的特征按照它们之间的关联程度来进行排序展示。 1.1、本质: 通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。 比如,利用好友,用户历史兴趣记录以及用户的注...

2018-07-17 16:51:33 1072

原创 数据插入到mysql数据库出现编码异常处理

异常:BatchUpdate error! sql:INSERT INTO t_industry_summary_error_info (id, create_time, update_time, rowkey, content, summary) VALUES (?, ?, ?, ?, ?, ?) ;Caused by: java.sql.SQLException: Incorrect ...

2018-02-02 18:13:30 584 1

原创 在文本处理数据进行规则匹配常用正则表达式大全

http://jingyan.baidu.com/article/54b6b9c038b84f2d583b47f7.html 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$ 2 只能输入数字:"^[0-9]*$"。 3 只能输入n位的数字:"^\d{n}$"。 4 只能输入至少n位的数字:"^...

2015-07-04 14:06:28 508

转载 在 Windows 上安装Rabbit MQ 指南

rabbitMQ是一个在AMQP协议标准基础上完整的,可服用的企业消息系统。他遵循Mozilla Public License开源协议。采用 Erlang 实现的工业级的消息队列(MQ)服务器。     RabbitMQ的官方站:http://www.rabbitmq.com/        AMQP(高级消息队列协议) 是一个异步消息传递所使用的应用层协议规范,作为线路层协议,而不是

2015-07-01 16:42:18 324

转载 虚拟机入门(2)之虚拟机的三种网络模式

在看完虚拟化零基础入门之后,有必要了解一下虚拟机的三种网络模式。VMWare提供了三种工作模式,它们是bridged(桥接模式)、NAT(网络地址转换模式)和host-only(主机模式)。要想在网络管理和维护中合理应用它们,你就应该先了解一下这三种工作模式。这里首先大概介绍它们什么情况下需要它们。bridged相当于创建一台独立的电脑。你可以让它跟主机通信,但是网络需要手工配置

2015-06-23 15:50:10 318

转载 hadoop源代码分析之:yarn的核心设计介绍

hadoop源代码分析之:yarn的核心设计介绍又有了提笔的冲动,斯咪哒喵。。上回从宏观层面分析了RPC调用全过程,请参考http://user.qzone.qq.com/578333569/2假设:您已经对yarn有了初步的了解,在此,请原谅小呆呆不会介绍什么是YARN,还请各位google下假设:您已经理解了分布式系统通信核心:RPC调用,准备好了吗?我们就开始了呀

2015-06-22 16:49:04 428

转载 Hadoop

HBase 系统架构HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的,分布式的,多版本的,面向列的存储模型。它存储的是松散型数据。HBase特性:1 高可靠性2 高效性3 面向列4 可伸缩5 可在廉价PC Server搭建大规模结构化存储集群HBase是Goog

2015-06-21 21:35:39 322

原创 如何在Linux(Ubuntu)零基础l学习hadoop使用

这里总结了刚接触Ubuntu的一些使用经验。下面的命令等都可以直接使用。你是否看到别人在Linux中desktop中使用命令,而自己却找不到地方。一、下面给大家提供四种方式:1.其实这些都很好弄,在左上角的菜单上点一下,出来一列,在里面选择[附件] 中的[终端],点一下就OK。那是快捷执行图标,可以把图标拖到桌面然后释放,以后在桌面上直接执行。同理,可以拖到上面的任务 栏里面。以后在上面的任...

2015-04-21 09:51:08 381

模式识别与机器学习

这书对于要学大数据的朋友是基础课,很不错!

2015-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除