达观数据

文本智能处理专家

  • 博客(161)
  • 资源 (7)
  • 收藏
  • 关注

原创 MoE大模型一键训练,达观大模型管理平台新功能惊艳发布

独家支持MoE大模型!达观大模型管理平台再度创新!同时还有更大参数量级的70B曹植模型,使得模型在长文本、多语种或众多垂直场景中发挥出更优、更强劲的性能。

2024-03-14 14:38:02 743

原创 “达观杯”智能文档版面分析赛题baseline已上线,欢迎下载报名!

该baseline使用的是DINO模型,模型主要思路是将文档版面分析任务转换为一个纯视觉的目标检测的任务,通过模型提取图像特征,预测文档元素的box坐标和元素所属类别 ,达到版面分析的目的。baseline使用的是DINO论文的官方实现版本,基于此次比赛的数据,在官方提供的预训练权重基础上迭代训练。作为本次赛题的出题方,为助力各位打榜达人更快速上手比赛,更高效优化模型,冲击决赛top榜,本届大赛的总奖金池 5.5W元,此外,排名Top50的选手将获得达观数据全职和实习工作的面试直通机会,优先录用。

2023-10-20 14:08:26 234

原创 柴洪峰院士:大模型赋能金融科技思考与展望

在大模型时代,也不能完全摒弃已构建的海量知识图谱,知识图谱能够指导大模型对行业进行正确精准的认知,提高其理解、推理决策的能力,同时知识图谱及专家知识库解决问题的范式需要基于统计学习的大模型范式相融合,才能更好推动领域内涌现能力的出现,我们需要把以知识图谱为代表的知识驱动方法,基于利用静态以及动态的知识图谱,与以大模型为代表的数据驱动方法进行持续交互,运用多种模式,以达到知识图谱与大模型的完美结合。金融科技的崛起正在改变金融行业的面貌,实现金融科技突破对于推动金融领域的创新和发展至关重要。

2023-08-01 10:11:26 182

原创 RPA界面元素定位与操控技术详解-达观数据

另外一个比较大的优点就是,自定义控件的支持,当然了,并不是说开发写一个自定义控件,这个控件就可以通过 MSAA 来识别,而是说当开发人员在实现自定义控件的时候,可以实现 IAccessible 的接口,并且通过这个接口,把一些的属性和操作暴露出来,测试人员就可以将这个控件当作标准控件,并通过MSAA来自动化。另外,UIA 也兼容 MSAA。在“异常场景恢复模式”下,GUI 自动化框架依次检测各种可能出现的对话框,一旦确认了对话框的类型,立即执行预定义的操作(比如:点击“确定”按钮),接着重试刚失败的步骤。

2023-07-24 16:12:40 270

原创 达观曹植大模型正式对外公测!专注于长文本、多语言、垂直化发展

长文本最大的难点在于文档内存在诸多复杂结构元素,如文本、图片、表格、数据图、标题、段落、页眉页脚、摘要等版面元素,以及跨多个文档间存在复杂关系,还需解析各类复杂格式,如PDF、PPT、Excel、Doc,扫描图片等;大模型时代到来,国内出现“百模大战”的局面。达观坚持训练数据与算法模型自主可控,实现与国产GPU联调对接,推理功能成功上线运行,与国产GPU合作伙伴开展长期合作,不断优化高质量硬件设备,以适应市场需求和技术发展,为客户提供了“算力+模型”的全套国产化信创方案,让大模型赋能百业。

2023-07-14 11:05:20 208

原创 Python源码剖析:深度探索Cpython对象-达观数据

/configure步骤用来自动化构建过程,CPPFLAGS 是 c 和 c++ 编译器的选项,这里指定了 zlib 头文件的位置,LDFLAGS 是 gcc 等编译器会用到的一些优化参数,这里是指定了 zlib 库文件的位置,(brew --prefix openssl) 显示的是 openssl 的安装路径,运行完上面命令以后在存储库的根目录中会生成一个 Makefile,你可以通过运行以下命令来构建 CPython 二进制文件。Python 中有许多效果相同,过程不同的表达,值得我们进一步思考。

2023-07-13 14:52:17 257

原创 一文详解新一代高效前端构建工具VITE-达观数据

Vite 的配置简单易用,支持多种前端框架和语言,具有很高的灵活性和扩展性。总之,Vite 是一个非常优秀的前端构建工具,它的技术原理和优点让它成为了当前前端开发领域中备受关注和推崇的工具之一。Vite 的构建过程是基于 ES Modules 实现的,这是一种浏览器原生支持的模块系统,它能够在运行时动态加载依赖,从而避免了传统构建工具的静态打包和编译。Vite 的构建速度非常快,由于采用了浏览器原生的模块化系统,因此可以避免传统构建工具的静态打包和编译,从而提高了开发效率和构建速度。

2023-07-13 14:49:14 235

原创 【无标题】

详细介绍了针对于中文拼写检查任务的纠错系统,并对其主要包含的五个部分进行了详细描述

2022-12-23 08:45:00 761

原创 中文语法纠错全国大赛获奖分享:基于多轮机制的中文语法纠错

分享了 在CCL汉语学习者中文语法纠错任务赛道二的亚军方案,重点介绍“基于多轮机制的中文语法纠错任务”。

2022-12-22 18:24:07 1334 1

原创 文字语义纠错技术探索与实践-张健

介绍文字语义纠错的技术算法,技术难点与挑战以及实际产品的落地情况

2022-12-22 09:00:00 811

原创 智能文档处理IDP关键技术与实践

IDP技术是针对文档内容自动处理分析的一揽子技术,除自然语言处理外,还包括计算机视觉、文档解析等相关底层技术。

2022-11-03 08:30:00 663

原创 文本智能处理与RPA领军企业达观数据宣布完成5.8亿元C轮融资

中国人工智能和RPA知名企业达观数据宣布近期已成功完成了C轮5.8亿元融资,并刷新了中国文本智能处理行业的单笔最高融资记录。

2022-03-09 10:07:09 382

原创 达观RPA独家推出高可用流程编排,RPA运营效率提升数倍

达观RPA帮助客户自动化处理重复性劳动,高效且低门槛地连接不同业务系统,助力财税、银行、证券、保险、通信、物流、制造等领域实现业务流程自动化智能升级,目前已与众多行业龙头企业达成深度合作,帮助客户大幅降本增效。日前,达观RPA12.0已携众多重磅新功能上线,本文重点介绍开发平台新功能:编排流程。众多行业传统的业务环境中,RPA要代替人完成的流程往往涉及到多个业务岗位、多个业务系统、多台计算机设备、甚至多个网络。普通的RPA流程一般只能在单台计算机设备上运行,对于多设备和多网络的情况,需要借助多个

2022-03-08 14:41:55 7230

原创 达观RPA助力公安反诈中心数字化转型,提升办案效率

“全民反诈全警反诈”,达观数据RPA机器人助力某公安反诈中心,构建反诈新格局,大幅度缩减调证、止付、冻结、续冻、预警等流程时间,提升办案效率。图 人工录入诈骗预警流程演示现阶段公安工作正在全面步入大数据时代,各种来源、不同种类的海量数据正在涌入,在新的大数据态势下,传统数据融合技术已经开始出现疲态,技术瓶颈逐步显现,相关风险防控、打击犯罪、维护稳定的响应速度越来越慢,不少应用已然不能支撑实战需要。各分局内众多业务流程中存在着大量重复、繁琐的操作和工作量,效率低下且容易出错。例如:跨...

2022-02-25 14:48:56 1141

原创 达观数据中标招商证券企业级数字员工管理平台项目

达观企业级数字员工管理平台助力招商证券推进数字化转型升级与发展。

2022-02-22 09:53:34 10759

原创 达观OCR首创无锚点文字提取算法,攻克行业难点

达观OCR首创无锚点文字提取算法,支持可视化拖拽建模,无需人工版式配置或代码开发,鼠标拖拽即可训练模型。

2022-02-18 11:09:36 1505

原创 达观银行询证函解决方案,文档智能审核技术提升审计回函业务往来效率

达观银行询证函智能审核解决方案已在全国范围多家商业银行推广落地。

2022-02-18 10:55:41 430

原创 达观数据与同济大学联合共建的“知识图谱与语义计算联合实验室”正式揭牌成立

达观数据与同济大学联合共建的“知识图谱与语义计算联合实验室”正式揭牌成立。

2022-02-11 10:18:12 530

原创 达观智能文本分析系统,赋能企业大数据加工处理

达观智能文本分析系统,能根据各行业用户特点,构建多行业专属语义模型,对海量数据进行规模化的采集/对接、有效清洗、融合;自研的融合型NLP算法,更是能对复杂的行业信息和用户行为数据进行字词级、句法级、篇章级的文本分析处理,有效得到相关事件标签、情感标签、产业标签、行业分类标签、地域标签等等

2022-01-27 15:17:04 3060

原创 达观NLP文本理解技术赋能企业舆情风控,推进尽调业务智能化

达观NLP文本理解技术赋能企业舆情风控,推进尽调业务智能化

2022-01-27 15:00:01 2343

原创 达观汽车故障知识图谱,加速汽车行业质量管控智能化

达观汽车故障知识图谱帮助汽车及零部件厂商构建质量管控知识库,整合知识经验,辅助质量工程师高效、全面地分析故障。汇聚所有专家的智慧,降低对工程师自身经验的依赖,让资历较浅的工程师也能做好故障分析工作,大幅提升故障分析效率,加速工程师成长

2022-01-27 14:54:30 3462

原创 达观RPA赋能财务共享中心三大典型场景自动化

达观RPA赋能财务共享中心三大典型场景自动化

2022-01-21 10:38:11 1421

原创 达观数据荣获认知图谱产业建设“创新突破奖”,并与图谱知名专家共同探讨工业知识图谱应用落地

达观知识图谱平台作为业内首个为智能制造企业在产品方案规划、产品研发设计、生产和使用等环节提供失效与故障的归因分析,智能问答与语义搜索,相似失效分析报告推荐,FTA、FMEA、FMECA的新故障模式、新失效机理、新故障发生原因、新解决方法和新改善措施等新知识的自动发现等知识型应用。为客户量身打造基于知识图谱的数据智能化应用,为制造、政务等行业客户提供业务场景智能升级服务。

2022-01-21 10:07:10 1042

原创 达观数据为某城商行构建数字员工卓越中心,提升RPA的开发及运营能力

达观数据为某城商行构建数字员工卓越中心,助力RPA机器人在银行、保险、信托、公用事业和电信公司等组织和机构落地,帮助当地核心企业降本增效,实现区域运营效率的提升。

2022-01-17 10:27:10 10022

原创 达观AI+知识图谱技术在数字档案馆建设中的探索

达观数据现在已经与全国多家档案馆进行合作,深入探索人工智能技术在档案管理应用领域的发展

2022-01-14 19:06:30 900

原创 达观OCR,图像文字抽取算法平台满足业务场景快速定制

达观OCR平台基于领先的视觉技术、跨模态语义理解技术开发,利用海量的图像、文档训练出底层模型。进一步扩展业务定制能力,为企业提供强大的视觉基础模型以及一整套视觉任务定制与应用能力。

2022-01-14 11:06:15 1178

原创 达观FMEA知识图谱助力医疗设备研发制造弯道超车

达观基于知识图谱的自然语言处理语义分析技术,完成产品/部件FMEA文档版本差异化比对工作,能辅助专家全面了解FMEA文档各知识点的全生命周期路径变化,有效的对潜在的产品质量风险进行全面、系统的识别和原因分析,从而更好的帮助企业减少和预防产品质量问题的产生,提升企业质量管控水平。

2022-01-14 10:01:58 368

原创 达观数据荣获长三角金融科技研究院和《金融电子化》2021中国金融科技领军企业

达观数据凭借数字化信贷办公机器人项目在此次比赛中脱颖而出,荣获“2021中国金融科技领军企业奖”。

2022-01-11 10:32:40 3659

原创 达观数据携手某市审批局打造智能“一业一证”申报信息系统

达观数据融合自研人工智能OCR技术和RPA流程自动化机器人,为该城区“一业一证”申报信息系统打造坚实的技术支撑。从流程上优化行业准入业务流程

2022-01-10 17:03:55 312

原创 达观打造基于AI能力的社会治理平台,助力政府管理智能化升级

达观推出的治理平台以社会基础矛盾感知防控、风险动态预测预警、事件处置跨部门协同为建设主线,以“数据+知识”双引擎为推手,形成信息变知识、知识可分析、分析可预警、预警可处置、处置可评估的治理工作智慧格局。

2022-01-06 10:42:19 1048

原创 达观RPA+AI减轻基层报表报送负担 助力浙江某县“最多报一次”改革

达观RPA+AI减轻基层报表报送负担 助力浙江某县“最多报一次”平台实现,未来将继续完善平台功能的提升,促进文本智能处理技术在政务领域的深入应用。

2022-01-04 11:12:44 1122

原创 再获金融科技领域认可,达观荣获毕马威金融科技50强,艾瑞FinTech卓越者TOP50

达观荣获毕马威金融科技50强,艾瑞FinTech卓越者TOP50

2021-12-31 17:07:24 2778

原创 达观RPA构建制造业流程数字化平台,打通数据流,制造业转型好帮手

达观制造业流程数字化平台在充分考虑了制造业转型特性及管理难度后,就企业管理者最关心的问题,达观数据运用自身RPA+AI的技术优势,结合制造业多种业务场景,研发的一套可以辅助生产、研发、采购、库存、物流、财务、人事部门更好完成工作便捷管理工具。

2021-12-30 10:32:08 311

原创 达观智能文档审阅系统,一键完成上百份合同信息自动比对、录入与风险核查

达观智能文档审阅系统融合自然语言处理(NLP)、光学字符识别(OCR)、计算机视觉(CV)等核心技术,结合海量文本语料库、外界知识库(法律法规、监管要求)、自定义审核规则,覆盖合同起草、审核、审批、签订、履约及归档调阅等企业合同管理全流程。

2021-12-29 10:34:54 1084

原创 投行数字化转型方案,达观智能文档处理赋能数字投行

投行业务项目组的实际工作中,存在大量的文档处理工作,包括项目尽调阶段的各类工作底稿、项目上报阶段的全套申报材料、以及受托管理/持续督导工作中的定期报告审核及底稿制作,所涉及的文档数据量庞大、格式繁多且文档质量参差不齐,单纯依靠人工进行资料录入、文档审核、项目质控将耗费大量的人力成本,工作效率低下且准确度难以保证。达观数据基于公司自研的四大能力平台,即IDPS文档智能审阅平台+NLP平台+OCR平台+RPA流程自动化机器人,针对投行业务实际工作中的项目尽调、项目申报、受托管理/持续督导三大工作阶段,提

2021-12-28 11:16:13 708

原创 达观数据与西南财经大学金融科技国际联合实验室达成产学研战略合作,共同助推人工智能在财经领域的应用与发展

达观数据与西南财经大学金融科技国际联合实验室正式签署产学研战略合作协议,双方将共同推动人工智能前沿技术和创新产品在金融科技领域的研究与应用。

2021-12-24 18:57:30 3206

原创 达观数据入选德勤2021明日之星50强榜单,文本智能创新国内领先

达观凭借创新管理、组织效能、人才管理、绿色发展、融资与风控在此次评选中脱颖而出,顺利登榜,成功入选“2021中国明日之星榜单50强”。

2021-12-24 11:21:26 860

原创 达观数据中标国信证券文档智能审阅项目

达观数据成功中标国信证券股份有限公司(简称“国信证券”)文档智能审阅系统项目,为其提供全方位的智能文档审核服务,助力加速数字化智能转型升级与发展。

2021-12-21 10:09:46 137

原创 达观VOC舆情洞察系统赋能风险情报处理与分析,强化金融行业风控管理

达观数据VOC舆情洞察系统通过对各类风险情报进行语义分析和处理,提高相关信息的分析挖掘能力,以及对(潜在)风险情报的实时预警,从而建设一个互联网文本信息处理、分析和预警于一体的风险情报处理与分析平台

2021-12-20 18:35:35 350

原创 复旦大学首届达观数据奖学金颁奖仪式圆满落幕,达观CEO陈运文博士与学院党委书记王新为获奖同学颁奖

复旦大学首届达观数据奖学金颁奖仪式圆满落幕,达观CEO陈运文博士与学院党委书记王新为获奖同学颁奖近日,复旦大学计算机科学技术学院(含软件学院、国家保密学院)首届2021年达观数据奖学金颁奖仪式于复旦大学江湾校区圆满落幕。计算机科学技术学院党委书记王新,副院长曹瑜,党委副书记沈安怡,专职辅导员、奖学金工作负责人靳煜,达观数据董事长兼CEO陈运文,总经理办公室主任赛娜,市场运营部经理王小荻,政府事务经理尚志浩参与了本次颁奖仪式。本次颁奖仪式中,王新书记作为学院代表向达观数据致欢迎辞,陈运文董事长

2021-12-20 18:17:08 733

达观数据于敬:个性化推荐系统实践

本文从构建用户模型到个性化推荐,介绍了达观数据的一些实践经验。个性化推荐系统能有效解决信息过载和长尾物品两个方面的问题,不仅提供了极佳的用户体检,满足了用户的信息需求,也帮助了企业挖掘其中蕴含的无限商机。

2016-01-27

达观数据文辉:Hadoop和Hive使用经验

近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Hadoop的热点应用之一。本文将从Hive的原理、架构及优化等方面来分享Hive的一些心得和使用经验,希望对大家有所收货。

2016-01-18

点击模型:达观数据提升算法精度的利器

达观数据在引擎架构研发实践中,大量使用到了点击模型,通过与用户的隐性交互,大幅提升了算法效果,积累了丰富的实战经验,特来分享。

2016-01-13

达观数据:文本大数据的机器学习自动分类方法

多年经验与业界人士分享如何对浩如烟海的数据进行分类、组织和管理。

2016-01-07

达观数据阐述推荐系统和搜索引擎的关系

从信息获取的角度来看,搜索和推荐是用户获取信息的两种主要手段。无论在互联网上,还是在线下的场景里,搜索和推荐这两种方式都大量并存,那么推荐系统和搜索引擎这两个系统到底有什么关系?区别和相似的地方有哪些?本文作者有幸同时具有搜索引擎和推荐系统一线的技术产品开发经验,结合自己的实践经验来为大家阐述两者之间的关系、分享自己的体会(达观数据陈运文博士)

2016-01-04

推荐系统和搜索引擎的关系达观陈运文

达观数据深入分析推荐系统和搜索引擎的关系,通过简单易懂的逻辑,更好的了解文章内容。

2015-12-29

机器学习技术在达观数据的实现

大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺诈交易监测等等。达观数据技术团队长期以来一直致力于钻研和积累各种大数据技术,曾获得cikm2014数据挖掘竞赛冠军,也开发过智能文本内容审核系统、作弊监测系统、用户建模系统等多个基于大数据技术的应用系统。

2015-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除