4 达观数据

尚未进行身份认证

达观数据是一家专注于文本智能处理技术的国家高新技术企业,获得2018年度中国人工智能领域最高奖项 “吴文俊人工智能科技奖”,也是本年度上海市唯一获奖企业。达观数据利用先进的自然语言理解、自然语言生成、知识图谱等技术,为大型企业和政府客户提供文本自动抽取、审核、纠错、搜索、推荐、写作等智能软件系统,让计算机代替人工完成业务流程自动化,大幅度提高企业效率。

等级
博文 39
排名 9w+

第三届“达观杯”文本智能信息抽取挑战赛强势来袭,奖金 Offer你想要的都在这里!

“达观杯”是由达观数据主办的全国前沿人工智能和大数据技术竞赛,面向全国数百所高等院校本科及以上学生、大型科技企业和初创科技企业研发人员及各行业数据工作者、爱好者展开,意在发现更多技术人才,共同在NLP应用系统的开发实现突破,促进人工智能产业发展。自2017年“达观杯”算法挑战赛开始以来,两年的时间在NLP的技术圈吸引了近万名技术爱好者,选手们在比赛拿奖后申请到了TOP海外高校,收获了心仪...

2019-07-17 14:43:10

达观数据:Angular 6+依赖注入使用指南:providedIn与providers对比

本文由达观数据研究院根据《TotalGuideToAngular6+DependencyInjection — providedInvsproviders》编译,如有不当,还请指正。Angular6为我们提供了更好的语法——provideIn,用于将服务注册到Angular依赖注入机制中。然而,新语法带来了非常多使用上的困惑,在GitHub评论,Slack和Stac...

2019-06-17 14:03:34

达观数据:数据不够?GAN来凑!

大名鼎鼎的深度学习之父YannLeCun曾评价GAN是“20年来机器学习领域最酷的想法”。的确,GAN向世人展示了从无到有、无中生有的神奇过程,并且GAN已经在工业界有着广泛的应用,是一项令人非常激动的AI技术。今天我将和大家一起去了解GAN及其内部工作原理,洞开GAN的大门。本文尽量用浅显易懂的语言来进行表述,少用繁琐的数学公式,并对几个典型的GAN模型进行讲解。一、GAN(Gen...

2019-06-13 18:20:32

达观数据:Selenium使用技巧与机器人流程自动化实战

背景北京时间晚上十一点,突然电脑右下角的QQ弹出了一条消息,"在?"都9012年了还会有人单独发个"在"然后人就失踪了?有事情找就直接说事情嘛,你不说事情,我怎么知道我应该"在"还是应该"不在"呢?鼠标移动到右下角准备点击"取消闪烁"时发现,是小美。感觉空气中突然弥漫着一种说不明的东西,还是忍不住回复了一句,"在,什么事情?""你明天下午一点方便使用电脑吗?"唉,有什么...

2019-06-10 16:49:20

达观数据:计算广告系统算法与架构综述

前言我们当今身处一个被广告包围的时代,无论是走在马路上、收看电视剧、或者是玩手机游戏,都能看见形形色色的广告。随着时代和技术的发展,广告的形式呈现出多样化、立体化的趋势,从最早的纸媒广告发展到如今的网页的展示、搜索广告,广告的定位也从原先的“广而告之”发展成大数据时代的“精准营销”,相应地,人们对广告的态度也在悄然变化。这一切都得益于互联网技术的快速发展以及用户数据的爆炸式增长。作为IT从...

2019-04-01 17:03:39

达观数据:中文和英文语言差异和计算机处理的区别

关于作者陈运文:达观数据创始人,复旦大学计算机博士,科技部“万人计划”专家,国际计算机学会(ACM)、电子电器工程师学会(IEEE)、中国计算机学会(CCF)、中国人工智能学会(CAAI)高级会员;第九届上海青年科技英才。在人工智能领域拥有丰富研究成果,是复旦大学、上海财经大学聘任的校外研究生导师,在IEEETransactions、SIGKDD等国际顶级学术期刊和会议上发表数十篇高水平科...

2019-03-20 14:00:50

达观数据:用好学习排序 (LTR) ,资讯信息流推荐效果翻倍

序言达观数据是一家基于文本语义理解为企业提供自动抽取、审核、纠错、推荐、搜索、写作等系统服务的人工智能企业,其中在推荐场景上我们也服务了很多客户企业,客户在要求推荐服务稳定、需求响应及时的基础上,对系统的效果也提出了越来越高的期望,这对算法团队也是一个挑战。本文将从资讯信息流这个场景入手,先简单介绍达观推荐引擎的架构演化,同时尽可能详细的介绍学习排序这个核心技术的实践和落地经验。达观推...

2019-03-05 18:47:41

达观数据刘思乡:一文详解AlphaGo原理

摘要1、围棋是一个MDPs问题2、policyiteration如何求解MDPs问题?3、WHATandWHYisMonteCarlomethod?4、AlphaGoZero的强化学习算法前言AlphaGo是GoogleDeepMind团队开发的一个基于深度神经网络的围棋人工智能程序,其一共经历了以下几次迭代[1]:马尔可夫决策过程一个马尔...

2019-01-30 10:47:49

达观数据郭权:用好ngResource和postman,提高你的开发调试效率

本文将主要从angularjs下Resource与RESTful接口初探,和调试工具postman的使用介绍这两个方面,和大家分享方便开发与维护的技巧工具。如有不当之处,还请交流指正。技巧1:减少开发与运维难度,angularjs下Resource与RESTful接口初探现代的项目中前端页面展现的数据多数是动态变化的,展示数据会涉及到网络请求,从后台拿取数据,前端进行展示。最初的是...

2019-01-28 10:12:44

一文详解下一代web应用模型—PWA

去年apple在iOS11.3的正式更新中,添加了对serviceworker的支持。新的桌面版Safari会默认打开ServiceWorker。这意味着我们可以通过Safari将支持PWA的站点像原生app一样添加到桌面,并且支持在离线状态下访问。至此,Microsoft,Chrome,Apple这些浏览器大厂都已全部支持了PWA。本文将为大家介绍PWA的特点、技术核心、创建方法、在项目...

2019-01-23 16:13:59

达观数据陈祥龙:集成学习算法(Ensemble Method)浅析

个性化推荐系统是达观数据在金融、电商、媒体、直播等行业的主要产品之一。在达观数据的个性化推荐系统架构中,可以简单地分为5层架构,每层处理相应的数据输出给下一层使用,分别是:数据处理层 作为推荐系统最低端的数据处理层,主要功能是首先将客户上传上来的一些无用的噪声数据进行清理过滤,将推荐系统所需要用到的数据导入到数据存储层中;数据存储层 对于item的数据一般存入在Mysql中,随着数...

2018-12-28 15:08:00

达观数据技术实践:知识图谱和Neo4j浅析

在当前大数据行业中, 随着算法的升级, 特别是机器学习的加入,“找规律”式的算法所带来的“红利”正在逐渐地消失,进而需要一种可以对数据进行更深一层挖掘的方式,这种新的方式就是知识图谱。下面我们来聊一下知识图谱以及知识图谱在达观数据中的实践。 NO.1什么是知识图谱知识图谱(KnowledgeGraph)是一种用点来代替实体,用边代替实体之间关系的一种语义网络。通俗来说,知识...

2018-12-11 11:49:31

达观数据:kubernetes简介和实战

在本文中,我们从技术细节上对kubernetes进行简单运用介绍,利用一些yaml脚本层面上实例告诉大家kubernetes基本概念。Kubernetes以及它呈现出的编程范式值得你去使用和整合到自己的技术栈中。kubernetes简单介绍1 kubernetes起源Kubernetes最初认为是谷歌开源的容器集群管理系统,是Google多年大规模容器管理技术Borg或Omega的...

2018-12-04 19:03:22

达观数据王江:fastText原理及实践

fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在学术上并没有太大创新。但是它的优点也非常明显,在文本分类任务中,fastText(浅层网络)往往能取得和深度网络相媲美的精度,却在训练时间上比深度网络快许多数量级。在标准的多核CPU上,能够训练10亿词级别语料库的词向量在10分钟之内,能够分类有着30万多类别的50多万句子在1分钟之内。本文首先会介绍一些...

2018-12-03 11:28:13

当知识图谱遇上文本智能处理,会擦出怎样的火花?

目前以理解人类语言为入口的认知智能成为了人工智能发展的突破点,而知识图谱则是迈向认知智能的关键要素。达观数据在2018AIIA人工智能开发者大会承办的语言认知智能与知识图谱公开课上,三位来自企业和学术领域的专家分别从不同角度讲述的知识图谱的应用和发展。文本根据达观数据副总裁王文广演讲内容《知识图谱与文本智能处理》整理所得,内容略有删减。人们一些模糊词义的表达,比如:以前没有钱买华为,现在没...

2018-11-28 23:26:23

达观数据特聘专家复旦大学黄萱菁教授带你了解自然语言理解中的表示学习

本文根据达观数据特聘专家复旦大学黄萱菁教授在达观数据举办的长三角人工智能应用创新张江峰会上的演讲整理而成,达观数据副总裁魏芳博士统稿一、概念1 什么是自然语言和自然语言理解?自然语言是指汉语、英语、德语、俄语等人们日常使用的语言,是自然而然的随着人类社会发展演变而来的语言,而不是人造的语言。我们平时说的口语还有书面语,这些都是自然语言,还有其他的语言,比如说手语等等。它区别于人...

2018-11-23 11:16:16

达观数据:文字的起源与文本挖掘的前世今生

01/08、人类的文明,始于文字诞生。100万年前,古猿进化成人类。50万年前,人类学会使用火。5000年前,人类发明文字。文明并非从天而降,人类从蒙昧、野蛮步入文明,是个漫长而坎坷的过程。远古智人和禽兽并没有什么区别,和动物一样,只有一种把信息传递下去的方式:基因。文字诞生后,人类学会用字把信息保存下来,才逐渐脱离了动物状态。人们开始了解历史不同时期所发生的事。历史是前人走过...

2018-11-15 18:33:04

如何做好文本关键词提取?从三种算法说起

在自然语言处理领域,处理海量的文本文件最关键的是要把用户最关心的问题提取出来。而无论是对于长文本还是短文本,往往可以通过几个关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜索,对于文本关键词的依赖也很大,关键词提取的准确程度直接关系到推荐系统或者搜索系统的最终效果。因此,关键词提取在文本挖掘领域是一个很重要的部分。关于文本的关键词提取方法分为有监督、半监督和无监...

2018-11-14 19:21:39

达观数据王文广:如何玩转自然语言理解和深度学习实践?

本文根据达观数据王文广在“达观杯”文本智能处理挑战赛期间的技术直播分享整理而成,内容略有删减。一、深度学习概述深度学习是从机器学习基础上发展起来的,机器学习分为监督学习、非监督学习以及强化学习三种类型。深度学习是在机器学习的基础上把特征抽取工作放到里面一起来完成的,直接实现了端到端的学习。通常我们遇到的深度网络包括:堆叠自编码器、深度信念网络、卷积神经网络和循环神经网络。下面左...

2018-10-30 18:30:06

一入编码深似海,在达观数据做程序员是怎样一种体验?

在技术浪潮一波接一波推动人类社会前进的历史进程当中,程序员始终是站在浪尖的群体。2014年起,把每年10月24日(2^10)定义为程序员节。这可能是唯一一个与数字紧密相关的节日——也体现了这个节日的含义:数字、代码、简单。作为一家程序员占比60%以上的技术驱动公司,小编今天找了技术部几位小伙伴们,聊了聊他们对自身工作的认识与想法、在工作中的坚持与改变,包括但不限于:1. 如何走上了...

2018-10-24 23:18:30
奖章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。