4 达观数据

企业博客

暂无相关简介

添加认证
等级
TA的排名 8w+

达观杯携手CCKS,基于本体的金融知识图谱自动化构建技术评测开启报名

​​作为国内知名算法大赛,“达观杯”已经连续举办三届,分别以备受关注的“个性化推荐“、“文本分类”、“智能信息抽取”作为赛事主题,吸引了全球近万名NLP爱好者的关注和参与。在达观杯第四年之季,主办方达观数据将携手国内年度学术大会CCKS(全国知识图谱与语义计算大会),围绕“基于本体的金融知识图谱自动化构建”这一主题,继续和广大技术爱好者们探索NLP前沿技术的产业应用效果。​任务背...

2020-04-13 14:24:55

达观数据:怎样评价推荐系统的结果质量?

推荐系统是互联网发展至今最常见也重要的技术之一。如今各类APP、网站、小程序等所有提供内容的地方,背后都有推荐系统在发挥作用。开发好一套真正优秀的推荐系统非常有价值,但也非常艰巨。达观数据是国内推荐系统主要第三方供应商,一直在摸索中前进。在想办法开发出强大的推荐系统服务好客户时,也一直在思考推荐系统的评估方法。众所周知业界有一句俗话:“没有评价就没有进步”,其意思是如果没有一套科学的评价推...

2020-04-01 19:23:50

通过文本挖掘,我们发现了国家公务员考试的这些秘密

据中国新闻网报道,2020年度中央机关及其直属机构公务员招考笔试有超143万人报名,涉及中央和国家机关86个单位、23个直属机构,而计划招录2.4万人,通过资格审查人数与录用计划数之比约为60:1,在报名期间出现多个竞争超“千里挑一”的职位也就不足为奇了。虽然笔者没参加过国家公务员考试(以下简称“国考”),但本着“内行看门道,外行看热闹”的心态,笔者想一个旁观者的视角,通过一些语义分析技术去发...

2019-11-29 18:55:37

LTR那点事—AUC及其与线上点击率的关联详解

LTR(Learning To Rank)学习排序是一种监督学习(SupervisedLearning)的排序方法,现已经广泛应用于信息索引,内容推荐,自然语言处理等多个领域。以推荐系统为例,推荐一般使用多个子策略,但哪个策略更好?每个策略选出多少候选集?每个候选集呈现的顺序如何排序?这些问题只能根据经验进行选择,随着策略越来越多,上述问题对推荐效果的影响会越来越大。于是乎,人们很自然的想到了用机...

2019-10-14 11:25:11

掌握动态规划,助你成为优秀的算法工程师

1.导论相信很多同学已经在为今年的校招做准备了,随着AI的火热,越来越多的同学涌入了算法的行当之中。那去年校招的算法岗是有多火热?在知乎上看到这么一条帖子,先不说内容哈,足足400w+的阅读量啊。不光是计算机或软件专业的学生,很多电子,通信,自动化等相关专业的同学也吸引了进来。当然,这应该是件好事。但是相当一部分同学,在学习的过程中,尤其是刚入门的时候,可能会有这样一个疑问:算法工程师...

2019-09-29 18:07:55

达观数据与华南师范大学产学研合作论文被物联网领域顶级期刊IEEE IOT录用

达观数据与华南师范大学认知与智能信息处理实验室首篇产学研合作论文“An Efficient Passenger-Hunting Recommendation Framework with Multi-Task Deep Learning”被‍物联网领域顶级期刊IEEE Internet of Things Journal录用。目前该论文的研究成果正与智能交通领域的企业商谈应用和...

2019-08-23 11:27:45

破解 RPA的 5 大迷思

任何新事物在刚刚起步时都难以避免被误读,新接触RPA(机器人流程自动化)概念时,我们时常碰到一些迷思。人们可能会认为RPA将抢走人类的工作,它无所不能。但事实是这样的吗?迷思 1:RPA机器人是人形的尽管RPA(机器人流程自动化)的名称里有“机器人”三个字,这并不意味着它涉及到实体的器械。事实上,这类“机器人”只是一种软件,它模拟人类操作执行人机交互行为,作为虚拟劳动力协助我...

2019-08-19 11:59:42

达观数据CTO纪达麒:小标注数据量下自然语言处理实战经验

自然语言处理在文本信息抽取、自动审校、智能问答、情感分析等场景下都有非常多的实际应用需求,在人工智能领域里有极为广泛的应用场景。然而在实际工程应用中,最经常面临的挑战是我们往往很难有大量高质量的标注语料。“巧妇难为无米之炊”,在缺少语料的情况下,如何达到良好的NLP应用效果,是这些场景要落地所必须解决的问题。我们通常称其为“低资源问题”,或者称为“小样本学习”问题,本文从达观数据的实践经...

2019-08-16 14:25:35

银行流程自动化,达观RPA大显身手的十大场景

机器人流程自动化(RPA)是以自动化软件作为虚拟劳动力,依据预先设定的程序与现有系统进行交互并完成预期的任务。银行作为一个强规则领域,业务流程和报告流程的重复性强,规则明确,因此也最易于实现流程自动化;同时,由于RPA还有具有可追溯记录的属性,在合规上具有特别的优势。融合OCR和NLP智能模块的达观RPA机器人可以具备更高级别的计算机视觉和语义处理能力,不但可以登陆程序,移动文件,读写...

2019-08-16 11:39:15

“达观杯”进行时 | 万字长文详解“智能文本抽取”算法进阶与应用

导读:本文整理自达观数据联合创始人高翔 7 月 11 日的直播公开课——《智能文本信息抽取算法的进阶和应用》。本文重点总结了文本信息抽取的传统和前沿算法应用,以及如何把这些方法应用到“达观杯”文本智能信息抽取挑战赛中。

2019-07-29 18:54:52

第三届“达观杯”文本智能信息抽取挑战赛强势来袭,奖金 Offer你想要的都在这里!

“达观杯”是由达观数据主办的全国前沿人工智能和大数据技术竞赛,面向全国数百所高等院校本科及以上学生、大型科技企业和初创科技企业研发人员及各行业数据工作者、爱好者展开,意在发现更多技术人才,共同在NLP应用系统的开发实现突破,促进人工智能产业发展。自 2017 年“达观杯”算法挑战赛开始以来,两年的时间在NLP 的技术圈吸引了近万名技术爱好者,选手们在比赛拿奖后申请到了TOP海外高校,收获了心仪...

2019-07-17 14:43:10

达观数据:Angular 6+依赖注入使用指南:providedIn与providers对比

本文由达观数据研究院根据《Total Guide To Angular 6+ Dependency Injection — providedIn vs providers》编译,如有不当,还请指正。Angular 6为我们提供了更好的语法——provideIn,用于将服务注册到Angular依赖注入机制中。然而,新语法带来了非常多使用上的困惑,在GitHub评论,Slack和Stac...

2019-06-17 14:03:34

达观数据:数据不够?GAN来凑!

大名鼎鼎的深度学习之父Yann LeCun曾评价GAN是“20年来机器学习领域最酷的想法”。的确,GAN向世人展示了从无到有、无中生有的神奇过程,并且GAN已经在工业界有着广泛的应用,是一项令人非常激动的AI技术。今天我将和大家一起去了解GAN及其内部工作原理,洞开GAN的大门。本文尽量用浅显易懂的语言来进行表述,少用繁琐的数学公式,并对几个典型的GAN模型进行讲解。一、GAN(Gen...

2019-06-13 18:20:32

达观数据:Selenium使用技巧与机器人流程自动化实战

背景北京时间晚上十一点,突然电脑右下角的QQ弹出了一条消息,"在?"都9012年了还会有人单独发个"在"然后人就失踪了?有事情找就直接说事情嘛,你不说事情,我怎么知道我应该"在"还是应该"不在"呢?鼠标移动到右下角准备点击"取消闪烁"时发现,是小美。感觉空气中突然弥漫着一种说不明的东西,还是忍不住回复了一句,"在,什么事情?""你明天下午一点方便使用电脑吗?"唉,有什么...

2019-06-10 16:49:20

达观数据:计算广告系统算法与架构综述

前言我们当今身处一个被广告包围的时代,无论是走在马路上、收看电视剧、或者是玩手机游戏,都能看见形形色色的广告。随着时代和技术的发展,广告的形式呈现出多样化、立体化的趋势,从最早的纸媒广告发展到如今的网页的展示、搜索广告,广告的定位也从原先的“广而告之”发展成大数据时代的“精准营销”,相应地,人们对广告的态度也在悄然变化。这一切都得益于互联网技术的快速发展以及用户数据的爆炸式增长。作为IT从...

2019-04-01 17:03:39

达观数据:中文和英文语言差异和计算机处理的区别

关于作者陈运文:达观数据创始人,复旦大学计算机博士,科技部“万人计划”专家,国际计算机学会(ACM)、电子电器工程师学会(IEEE)、中国计算机学会(CCF)、中国人工智能学会(CAAI)高级会员;第九届上海青年科技英才。在人工智能领域拥有丰富研究成果,是复旦大学、上海财经大学聘任的校外研究生导师,在IEEE Transactions、SIGKDD等国际顶级学术期刊和会议上发表数十篇高水平科...

2019-03-20 14:00:50

达观数据:用好学习排序 (LTR) ,资讯信息流推荐效果翻倍

序言达观数据是一家基于文本语义理解为企业提供自动抽取、审核、纠错、推荐、搜索、写作等系统服务的人工智能企业,其中在推荐场景上我们也服务了很多客户企业,客户在要求推荐服务稳定、需求响应及时的基础上,对系统的效果也提出了越来越高的期望,这对算法团队也是一个挑战。本文将从资讯信息流这个场景入手,先简单介绍达观推荐引擎的架构演化,同时尽可能详细的介绍学习排序这个核心技术的实践和落地经验。达观推...

2019-03-05 18:47:41

达观数据刘思乡:一文详解AlphaGo原理

摘要1、围棋是一个MDPs问题2、policy iteration如何求解MDPs问题?3、WHAT and WHY is MonteCarlo method?4、AlphaGo Zero的强化学习算法前言AlphaGo是GoogleDeepMind团队开发的一个基于深度神经网络的围棋人工智能程序,其一共经历了以下几次迭代[1]:马尔可夫决策过程一个马尔...

2019-01-30 10:47:49

达观数据郭权:用好ngResource和postman,提高你的开发调试效率

本文将主要从angularjs下Resource与RESTful 接口初探,和调试工具postman的使用介绍这两个方面,和大家分享方便开发与维护的技巧工具。如有不当之处,还请交流指正。技巧1:减少开发与运维难度,angularjs下Resource与RESTful 接口初探现代的项目中前端页面展现的数据多数是动态变化的,展示数据会涉及到网络请求,从后台拿取数据,前端进行展示。最初的是...

2019-01-28 10:12:44

一文详解下一代web应用模型—PWA

去年apple在iOS11.3的正式更新中,添加了对service worker的支持。新的桌面版Safari会默认打开Service Worker。这意味着我们可以通过Safari将支持PWA的站点像原生app一样添加到桌面,并且支持在离线状态下访问。至此,Microsoft, Chrome, Apple这些浏览器大厂都已全部支持了PWA。本文将为大家介绍PWA的特点、技术核心、创建方法、在项目...

2019-01-23 16:13:59

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。