• 博客(299)
  • 收藏
  • 关注

原创 十种常见的图像标注方法 | 数据标注

计算机视觉的飞速发展离不开大量图像标注数据的支撑,随着各类图像检测、识别算法的商业化落地,市场对图像标注精准度愈发严格,同时针对不同的应用场景,也衍生出了不同的图像标注方法。今天景联文科技给大家介绍10种常见的图像数据标注方法及其应用。http://www.jinglianwen.com/admin/rest/newsinfo?id=511、语义分割语义分割是指根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应上属性,以帮助训练图像识别模型,常应用于自动驾驶、人机交互、虚拟现实

2021-07-16 11:02:07 23022 2

原创 赋能AI创新,景联文科技提供海量优质大模型数据集

而2024年,业界关注焦点转向“缺数据”,逐渐出现数据需求剧增、数据质量问题、标注挑战、隐私与合规关切、数据偏见与公平性问题、数据孤岛与共享难题,以及新兴领域数据匮乏等多方面挑战。在大模型训练的各个阶段,数据的确扮演至关重着要的角色。景联文科技作为大语言模型数据服务商,提供海量优质大模型数据集,致力于为不同训练阶段的算法精准匹配高质量数据资源,以应对上述数据挑战。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。

2024-04-24 09:18:12 297

原创 高质量数据赋能大模型应用落地,景联文科技提供海量AI大模型数据

Dimensional Research的全球调研报告显示,72%的受访者认为,要确保模型的有效性和可靠性,至少需要使用超过10万条训练数据进行模型训练。随着人工智能技术的迅猛进步,AI算法持续创新突破,模型的复杂度不断攀升,呈现出爆炸性的增长态势。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。景联文科技是大语言模型数据供应商,致力于为不同阶段的模型算法匹配高质量数据资源。

2024-04-10 13:37:46 589

原创 景联文科技:为AI大模型提供高质海量训练数据

其中,大模型的预训练对数据要求很高,必须在前期进行清洗、标注、标识。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。艾瑞咨询数据显示,包括数据采集、数据处理(标注)、数据存储、数据挖掘等模块在内的AI基础数据服务市场,将在未来数年内持续增长。在全球AI浪潮的推动下,大量训练数据已成为AI算法模型发展和演进中的关键一环。景联文科技是大模型数据供应商,致力于为不同阶段的模型算法匹配高质量数据资源。

2024-04-08 09:26:41 646

原创 数据质量决定大模型能力,景联文科技提供高质量大模型数据

大模型往往拥有庞大的参数和复杂的网络结构,需要大量的数据来学习和优化。若数据不足或质量不佳,模型可能无法有效学习到数据的特征和规律,从而影响性能。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。数据能提升模型的泛化能力,即模型在未见数据上的表现能力。景联文科技是大语言模型数据供应商,致力于为不同阶段的模型算法提供高质量数据资源。数据还可用于评估大模型性能,帮助研究者调整模型参数和结构,理解模型的局限性。

2024-04-03 14:06:59 475

原创 景联文科技提供高质量医疗健康AI大模型数据

医疗健康AI大模型,作为人工智能的一个分支,能够通过学习大量的数据来生成新的数据实例,在医药研发、医学影像、医疗文本分析等都有广泛的应用前景。这些应用不仅能够提升医疗服务的质量和可靠性,还能够推动整个医疗产业的创新发展,形成新的产业生态和生产力。同时景联文科技提供大模型训练数据的标注服务,建立了数据分发、清洗、标注、质检、交付的标准化操作流程,为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。景联文科技是大模型数据供应商,致力于为不同阶段的模型算法匹配高质量多模态数据资源。

2024-04-01 09:26:08 495

原创 景联文科技推出五千万轮高质量大模型多轮对话数据库

包含数码产品、日常服饰、个人洗护、美容护肤、果蔬生鲜、 宠物用品、母婴育儿、粮油调味等多领域;涵盖产品咨询、库存查询、订单查询、促销和优惠活动、退换货问题、支付问题、物流配送、售后服务、客户反馈、投诉处理等多类型;包含学校和教育机构客服、在线教育平台客服、职业培训客服、留学咨询客服等领域,主要涉及课程推荐、活动通知、课程咨询、跟进回访、投诉处理等对话语料。涵盖内/外科、儿科、耳鼻喉科、骨科、皮肤科、牙科等全面领域的医疗语料,内容主要为病情诊断、治疗方式、预约挂号、病情跟踪、服务协调、健康宣导等。

2024-03-29 09:28:21 368

原创 景联文科技高质量大模型训练数据汇总!

特别是专业的行业应用数据集,其获取难度更大,这导致大模型可使用的数据量受到限制,进而对大模型效果形成阻碍。3月25日,2024年中国发展高层论坛年会上,国家数据局局长刘烈宏在“释放数据要素价值,助力可持续发展”的演讲中表示,中国10亿参数规模以上的大模型数量已超100个。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。景联文科技是大语言模型数据供应商,致力于为不同阶段的模型算法匹配高质量数据资源。

2024-03-27 09:09:27 600

原创 景联文科技上新高质量大模型训练数据!

在3月24日举办的2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室的领军科学家林达华表示,大模型研发机构的核心竞争力在于能否大规模地生产出高质量的数据,这是推动大模型持续创新和进步的关键因素。在过去的一年中,人工智能领域呈现出了风起云涌的态势,其中模型架构、训练数据、多模态技术、超长上下文处理以及智能体发展等方面均取得了突飞猛进的发展。同时景联文科技提供大模型训练数据的标注服务,致力于为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。

2024-03-25 11:49:43 453

原创 大模型刷屏“两会”,景联文科技提供高质量大模型数据

数据的质量与数量直接影响模型性能。同时,数据的多样性也推动大模型适应不同场景和需求,以提升模型的通用性和实用性。大模型的发展也促进了数据要素的深入挖掘和利用,随着大模型在各个领域的应用不断深化,人们对于数据的需求也日益增长。近年来,智能化变革席卷全球,2024年两会政府工作报告首次明确提出实施“人工智能+”行动,特别是大模型等先进技术,在推动产业数智化转型方面的巨大价值已经得到充分认可。大模型的发展已成为AI领域的重要方向,数据要素作为其重要基石,共同推进智能化时代的到来。

2024-03-20 09:26:00 162

转载 别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元

作者团队向我们透露,通过互联网上丰富的大规模图像数据和先进的文生图技术,我们可以训练一个高质量的文生图模型,该模型将作为下一阶段视频预训练的初始化权重。例如在上面的乌龟视频中,生成的乌龟多了一只脚。欢迎持续关注Open-Sora开源项目:https://github.com/hpcaitech/Open-Sora作者团队提及,他们将会继续维护和优化Open-Sora项目,预计将使用更多的视频训练数据,以生成更高质量、更长时长的视频内容,并支持多分辨率特性,切实推进AI技术在电影、游戏、广告等领域的落地。

2024-03-18 15:05:17 52

原创 景联文科技:提供通用多模态数据,助力AI多模态领域实现飞跃式发展

高质量的多模态数据是构建和训练多模态大模型的基础,它决定了模型能否有效捕获和利用不同模态间复杂的语义关系,进而影响到模型的整体性能和应用价值。同时景联文科技提供大模型训练数据的标注服务,建立了数据分发、清洗、标注、质检、交付的标准化操作流程,为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。根据大模型之家、钛媒体数据,2023年中国大模型市场规模达到147亿人民币,同比增长110.0%,预计到2028年中国大模型市场规模将达到1179亿人民币。

2024-03-15 10:39:29 620

原创 景联文科技:提供行业垂直大模型训练数据

为进一步提高垂直大模型的专业性、安全性与实用性,更好地发挥人工智能技术对千行百业的赋能作用,人大代表其实提出三方面建议:一是加快推动高质量垂类语料数据开放共享,二是进一步完善垂直大模型评测标准体系,三是积极打造垂直大模型创新应用场景。同时景联文科技提供大模型训练数据的标注服务,建立了数据分发、清洗、标注、质检、交付的标准化操作流程,为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的垂直大模型训练数据。景联文科技是大模型数据供应商,致力于为不同阶段的模型算法匹配高质量数据资源。

2024-03-13 11:53:41 517

原创 热烈庆祝景联文科技北京分公司正式成立!

同时,北京分公司也致力于拓展军工数据业务,探索与部队单位、军工集团的联络与合作,针对军事智能化、军事信息化场景,提供数据采集标注,以及数据分析挖掘系统定制化开发等服务。未来,景联文科技将在技术支持与售后服务方面作好充分准备,持续加大研发投入,严格控制数据质量,以更完善的产品和服务助力客户赢得市场先机。北京分公司是景联文科技在北方的销售和客户服务中心,承担快速响应北方市场需求的重任,我们有信心为北方市场客户提供高效的数据解决方案。

2024-03-12 09:42:04 363

原创 景联文科技:专业提供高质量大语言模型训练数据

人大代表杨剑宇指出,尽管我国在大模型领域起步较晚,但现已位居世界第一梯队,构建了以通用大模型为基石、专注于垂直行业服务的商业模式,并在多个重点领域得到广泛应用。同时景联文科技提供大语言模型训练数据的标注服务,建立了数据分发、清洗、标注、质检、交付的标准化操作流程,为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI大语言模型训练数据。景联文科技是大语言模型数据供应商,通过对全球电子数据资源的整合清洗,致力于为不同阶段的模型算法匹配高质量数据资源,进一步推动人工智能行业在我国的蓬勃发展。

2024-03-08 14:43:36 674

原创 ElevenLabs用AI为Sora文生视频模型配音 ,景联文科技提供高质量真人音频数据集助力生成逼真音效

通过智能化的标注平台产品赋能AI训练数据行业,能够有效提高人机协作效率扩大产能,及时调整方案做好逾期风险管控,准确把控数据质量问题,为语音相关企业提供处理大规模语音数据的能力,节省企业的时间和开发成本,实现人力驱动向技术驱动的重要升级,为行业赋能。经过我司严格的筛选和编辑,确保音频的品质和格式符合大模型训练的需求。拥有丰富的语音数据采集项目经验,也自建了专业的语音采集录音室,有高度还原真实场景能力,在全国30多个省市有近一万人的被采集人员储备,全球范围内也有采集渠道,支持多语种、多方言语音采集。

2024-03-06 09:17:01 851

转载 国产视频大模型奋起直追 Pika、阿里同日发布“对口型”利器

https://baijiahao.baidu.com/s?id=1792224910498044635&wfr=spider&for=pc

2024-03-04 16:51:25 61

原创 文生视频大模型Sora爆火出圈,景联文科技上新百万段视频描述数据集!

Sora是基于OpenAI的DALL-E模型开发的视频生成技术,能根据文本描述创建最长60秒的逼真视频。随后,确定视频中内容发生变化的具体时间点,并对每个时间段的子视频进行详细的内容描述。景联文科技是大语言模型数据供应商,可为文生视频大模型提供大量高质量数据,提高大模型的准确性和性能。自有大规模、高质量视频描述成品数据集近百万段,内容涵盖广泛。为确保业务操作的安全性和合规性,满足不同业务场景下的数据保护需求,景联文科技有一套全面的数据安全与合规管理方案,涵盖版权数据产品、数据定制服务的私有化部署。

2024-03-01 09:38:25 386

转载 一段文字生成60秒视频,虚拟和现实融为一体,Sora冲击波震荡国内学术圈

这种差距本质上是我们在大语言模型(LLM)和多模态大模型上的差距的直接映射,因为Sora背后的技术在本质上与LLM技术类似:LLM是大量读书,Sora是大量读图(视频),且通过学习大量“视文对”样本来实现视文对产,进而实现文生视频。“确实,我们又落后了!”他表示,小时级别的视频一定是人机协同创作的结果,否则视频中的矛盾点会多如牛毛。当然,Sora作为世界模型也存在一些问题,例如通过大量“读图”学习世界运行的规律固然是合理的,但类比“人”,仅“睁眼看世界”是学不会牛顿定律等物理学可以演绎的世界规律的。

2024-02-19 10:00:56 59

原创 景联文科技受邀出席全国信标委生物特征识别分委会二届五次全会

景联文科技活体指纹检测技术全球领先,持有自主知识产权专利及软件著作权,2017年、2019年连续两届荣获LivDet:Fingerprint Liveness Detection Competition(国际活体指纹检测大赛)第一名,参与制定工信部生物识别行业发展白皮书,起草8项国家数据交换格式和数据安全相关的国家标准计划。景联文科技作为全球指纹防伪技术企业、生物识别行业标准研制单位,牵头制定了《信息技术 可扩展的生物特征识别数据交换格式 第4部分:指纹图像数据》的国家标准,受邀出席此次会议。

2024-02-02 14:15:00 826

转载 国产开源模型标杆大升级,重点能力比肩ChatGPT!书生·浦语2.0发布,支持免费商用

另外,为了避免数据污染导致评测结果失真,InternLM2通过更严谨的训练集构建流程,把各测试集排除在外,同时通过min-hash去重,去掉训练语料中和测试集接近的部分。最新升级中不仅加入了多个领先医学大模型,新增5个开源数据集、新增评测模块等,实现了医疗大模型群“产、学、研、用、评”一站式开源。总结来看,对于InternLM2的升级迭代,上海AI实验室核心关注模型基座能力,同时还结合大模型应用趋势的需求,针对部分下游任务做重点提升。它的评测成绩更好,同时保持了很好的通用语言能力,适合大部分应用。

2024-01-29 14:06:41 88

原创 景联文科技大模型数据集更新!教育题库新增高质量数学题、逻辑推理题及英文题

大语言模型可以通过与学生的互动,为他们提供个性化的学习体验,更好地满足学习需求,激发学生的学习兴趣,点燃他们内心的求知欲望。题目涵盖不同的难度级别,从简单到复杂,适合不同水平的逻辑思维和数学能力。所有题目均提供word可编辑版本、json格式,均经过严格的挑题、录入、排查、筛重、解答、复核、校稿程序,保证公式转写准确性和可读性,包括各种常见的数学符号和表达式。AI与教育的结合,已成为教育行业的重要发展方向,景联文科技作为AI基础数据行业的头部企业,推出高质量教育题库,为教育大语言模型赋能。

2024-01-24 09:37:18 663

原创 高质量训练数据助力大语言模型摆脱数据困境 | 景联文科技

目前,大语言模型的发展已经取得了显著的成果,如OpenAI的GPT系列模型、谷歌的BERT模型、百度的文心一言模型等。大语言模型的训练数据也可能存在偏见和歧视问题,这会影响模型的公正性和准确性。例如,如果训练数据中存在性别、种族、文化等方面的偏见,那么训练出的模型也会存在类似的问题。大语言模型的训练需要高质量的多模态数据,这些数据需要经过精确的标注和处理,以确保模型的训练效果。大语言模型的训练需要大量的数据,如何在保证数据隐私和安全的前提下,利用数据进行模型训练是一个重要的问题。

2024-01-12 09:15:00 551

原创 景联文科技:以高质量数据赋能文生图大模型

1月5日,在智求共赢・中国AIGC产业应用峰会暨无界AI生态合作伙伴大会上,中国AIGC产业联盟联合无界AI发布了《中国AIGC文生图产业白皮书2023》,从AIGC文生图发展历程、主流工具、产业实践以及规模预测等多个维度,全面揭示了中国AIGC文生图产业的未来。近年来,文生图的技术已实现大幅的进步,国内的万兴科技的万兴爱画、百度的文心·一格已投入商用。支持计算机视觉:矩形框标注、关键点标注、线段标注、语义分割、实例分割标注、ocr标注、图片分类、视频标注等对类型图像标注。

2024-01-10 09:15:20 755

原创 景联文科技GPT教育题库:AI教育大模型的强大数据引擎

试题属性包含学科、章节、知识点、题型、题类(中考题/常考题/易错题/压轴题等)、真题次数、试题来源(所属地区)、能力、解析等十余类;试卷属性包含学科、教材版本、年份、地区、学校、年级、学期、试卷类型、来源、分值、难度系数、考试时间、命题人等十余类;涵盖K12、大学、职业教育等各个学科和年级,包括语文、数学、英语、物理、化学、生物等。所有题目均提供word可编辑版本、json格式,均经过严格的挑题、录入、排查、筛重、解答、复核、校稿程序,保证公式转写准确性和可读性,包括各种常见的数学符号和表达式。

2024-01-04 10:06:28 695 1

原创 大模型赋能“AI+电商”,景联文科技提供高质量电商场景数据

景联文科技拥有丰富的采集资源,构建了全国27个省市直辖市全球52个国家的数据采集资源网络,拥有丰富的电商数据采集项目经验及数据质量管控经验,可以根据方案设计,对目标领域、场景的特定数据进行采集。拥有来自不同领域的专家,可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。为智能驾驶、智能安防、智慧医疗、智能教育、智慧金融、智能客服、新零售等领域的全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI算法训练数据。

2023-12-20 15:24:07 678

原创 数据标注公司如何确保数据安全?景联文科技多维度提供保障

数据标注公司确保标注数据的安全可以从制度、人员、工具等多个方面入手,建立完善的安全管理体系和审计机制,加强应急预案和备份机制的建立,以保障数据的安全性和可靠性。建立完善的安全审计机制,对数据标注过程进行全面的安全审计和监控,及时发现和解决存在的安全问题,确保数据标注过程的安全性和可靠性。对数据标注人员进行严格的培训和管理,加强其对数据安全的认识和意识,规范其工作流程和操作方法,以减少因人为因素导致的安全事故。建立完善的数据管理制度,包括数据的分类、存储、备份、加密等方面的规定,以确保数据的完整性和安全性。

2023-12-13 09:18:12 564

原创 景联文科技教育题库:提供高质量数据,驱动“AI+教育”蓬勃发展

运用关系型数据库管理模板和非关系型数据库(NoSQL)结合的方法来处理和存储大量的题库数据,并利用大数据处理框架Hadoop和Spark进行高效的数据分析和处理,以支持大模型进行复杂的数据库操作,同时保证其高效性。教育题库提供了丰富多样的学习资源,包括各种知识点、题型和难度级别的题目,为模型提供了广泛的学习材料,有助于提升模型的性能和泛化能力;为多元化的教育需求提供了强有力的支持。不仅可以提高学生的学习效果和效率,也能帮助教师更好地了解学生的学习需求和情况,为未来的教育发展提供新的可能性。

2023-12-11 10:24:12 385

原创 权威认证!景联文科技入选杭州市2023年第二批省级“专精特新”中小企业认定名单

根据工业和信息化部《优质中小企业梯度培育管理暂行办法》(工信部企业〔2022〕63号)和《浙江省经济和信息化厅关于印发浙江省优质中小企业梯度培育管理实施细则(暂行)的通知》(浙经信企业〔2022〕197号)等要求,经过专家层层评审和综合评估,并将积极创新创造,依据国家不断推陈出新的政策条例,不断迭代自己的产品和服务水平,致力为国内企业破解AI数据短缺问题,携手共促人工智能产业发展跃上新台阶。景联文科技将以优质的服务、创新性的理念和深入的视角深度服务市场,持续发力为国内人工智能的快速推进注入新活力;

2023-12-08 15:25:32 765

原创 景联文科技:高质量垂直领域数据集助力AI技术突破

景联文科技支持定制采集标注服务。多年龄段、多时间段、多种行为(疲劳驾驶、副驾驶及后排座椅、未系安全带、抽烟、吃喝、后挡风玻璃置物台、主驾驶防护栏、中控台 、手持手机打电、中央扶手处、聊微信看视频)采集城市道路上暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒 、游摊小贩、占道经营等12种场景数据。暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒、游摊小贩、占道经营。

2023-12-06 09:12:25 1278

原创 景联文科技解读《2023人工智能基础数据服务产业发展白皮书》,助力解决数据标注挑战

这些专家可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。可根据不同需求提供定制的数据标注能力,突破数据与应用场景之间的边界,支持全面质检、验收和管理,开放甲方验收通道,支持在线导出多种格式的标注结果,标注精确率最高可达99%,实现高标准、高质量、快速交付。标注平台搭载SAM相关算法以提升标注效率,研发自动标注功能,可对数据进行预处理,根据标注结果调整模型进行标注,根据场景灵活配制标注流程,进一步保证了标注精度。

2023-12-04 09:27:53 639

原创 景联文科技数据标注平台助力AI数据实现价值最大化

景联文科技数据采集标注平台(下称,景联文标注平台)支持计算机视觉(拉框标注、语义分割、3D点云标注、2D/3D融合标注、关键点标注、线标注、目标跟踪、图片分类、帧标注、4D全类别标注等)、语音工程(语音切割、语音情绪判定、ASR语音转写、声纹识别标注、音素标注、MIDI标注等)、自然语言处理(OCR 转写、文本信息抽取、NLU语句泛化、NER命名实体标注、SPO文本三元组标注、内容审核、情绪分析等)多类型数据标注。景联文标注平台通过实现标审分离,完善平台风险管控机制,且设置了严格的数据隐私安全保障措施。

2023-12-01 09:46:25 719

原创 对话式数据需求激增,景联文科技提供高质量多轮对话数据定制采集标注服务

拥有丰富的采集资源,构建了全国27个省市直辖市全球52个国家的数据采集资源网络,拥有丰富的方言,小语种、专业的数据采集设备、场景搭建能力,可快速还原搭建多轮对话所需的真实场景,拥有丰富的数据采集项目经验及数据质量管控经验,可以根据方案设计,对目标领域、场景的特定数据进行采集。拥有来自不同领域的专家,可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。焦虑、困惑、悲伤、失望、恐惧、内疚、愤怒、懊悔、妒忌、羞耻等。

2023-11-29 14:24:11 1237

原创 景联文科技加入中国人工智能产业联盟(AIIA)数据委员会

此次,景联文科技加入中国人工智能产业联盟(AIIA)数据委员会,将会继续坚持以高质量数据赋能AI,围绕数据采集标注、质量管理等需求,建设AI数据治理标准体系,开展针对数据构建、增强、清洗、标注、治理和合成等共性关键技术和工具平台建设工作。该委员会旨在汇聚数据资源持有方、数据标注加工方、数据需求方等主体,聚焦AI数据资源汇聚、需求反馈、数据加工、供需对接等方面,提供AI数据集产业公共服务能力。和AIIA共同探索影响人工智能产业发展的数据方案,共同破解AI数据短缺问题,携手共促人工智能产业发展跃上新台阶。

2023-11-28 09:14:15 718

原创 扫地机器人市场持续火爆,景联文科技数据采集标注方案助力扫地机器人智能化升级

可用于识别家庭居住环境物体,进行物体检测分类算法模型的优化,便于扫地机器人理解不同家居场景,实现对不同家居场景物体的定位与识别,避免盲动和减少能耗。目前国内排名前十的扫地机器人厂商均和景联文科技达成合作,共计采集50万张在家庭场景下扫地机器人数据,包含常见小物体400种以上,不常见小物体70种以上,标注总框数150万。房屋环境包含客厅,餐厅、厨房、卧室,洗手间,阳台,书房、两房一厅三房一厅等户型;采集类别包含地毯地垫、成人、小孩、沙发、椅子、床、茶几、餐桌等400多类;

2023-11-27 09:18:12 791

原创 城市NOA加速落地,景联文科技高质量数据标注助力感知系统升级

基于自身丰富的3D点云项目标注经验和先进的数据标注工具,景联文科技可以根据客户需求提供相应的数据标注服务,有力突破数据与应用场景之间的边界,支持全面质检、验收和管理,开放甲方验收通道,标注结果支持多种格式在线导出,校对数据,基本实现标注精确率达99%,完成高标注、高质量、快速交付。景联文科技是人工智能基础行业的数据标注公司,自建数据标注平台与成熟的标注、审核、质检机制,拥有丰富的标注工具,支持自动驾驶等场景下2D、3D、4D全类别标注,如2/3D融合、点云分割、点云时序叠帧、BEV标注等多类型数据标注。

2023-11-24 09:15:15 892

原创 基于高质量训练数据,GPT-4 Turbo更出色更强大

但是,GPT-4 Turbo的数据质量更高,因为它使用了更先进的筛选和清洗算法,以去除重复、错误或不相关的内容。这将提高GPT-4 Turbo的准确性和可靠性,使其能够生成更高质量的内容和回答。景联文科技是人工智能基础行业的数据标注公司,能够提供众多模态数据,包含图像、视频、音频、文本等多种类型,并提供丰富的场景和应用场景,可以更好的帮助研发者进行模型的微调和自适应。GPT-4 Turbo输入tokens价格仅是GPT-4的1/3,输出token价格仅为GPT-4的1/2,每分钟限制提升一倍。

2023-11-22 09:12:12 723

原创 专业数据标注公司:景联文科技领航数据标注行业,满足大模型时代新需求

这些专家可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。可根据不同需求提供定制的数据标注能力,突破数据与应用场景之间的边界,支持全面质检、验收和管理,开放甲方验收通道,支持在线导出多种格式的标注结果,标注精确率最高可达99%,实现高标准、高质量、快速交付。标注平台搭载SAM相关算法以提升标注效率,研发自动标注功能,可对数据进行预处理,根据标注结果调整模型进行标注,根据场景灵活配制标注流程,进一步保证了标注精度。

2023-11-17 09:20:27 692

原创 景联文科技入选量子位智库《中国AIGC数据标注产业全景报告》数据标注行业代表机构

景联文科技提供的产品为全链条AI数据服务,从数据采集、清洗、标注、到驻场的全流程、垂直领域数据解决方案一站式AI数据服务,满足不用应用场景下的各类数据采集标注业务的需要,协助人工智能企业解决整个人工智能链条中数据采集标注环节的相对应问题,推动大模型在更多地场景下实现落地应用,构建完整的AI数据生态。景联文科技是专业AI数据采集标注企业,拥有深厚行业数据壁垒,提供高质量数据集,拥有千人从业经验丰富的数据标注团队及丰富的图像和文本标注经验,可为大模型提供图像和NLP相关数据采集和数据标注服务。

2023-11-15 17:24:35 556

原创 景联文科技:驾驭数据浪潮,赋能AI产业——全球领先的数据标注解决方案供应商

可根据不同需求提供定制的数据标注能力,突破数据与应用场景之间的边界,支持全面质检、验收和管理,开放甲方验收通道,支持在线导出多种格式的标注结果,标注精确率最高可达99%,实现高标准、高质量、快速交付。标注平台支持多维度灵活数据检索,支持标签结果的图形化展示,采用直观的可视化界面,支持标注数据版本管理,提供精细的权限管理功能,有效提升AI数据产能,助力企业和团队更高效地进行数据管理和AI开发。通过对对话记录进行标注,可以帮助算法更好地理解用户意图,提升智能客服的效率和用户满意度。

2023-11-14 14:16:12 653

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除