自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

第四范式开发者社区

AI for every developer,AI for everyone

  • 博客(146)
  • 收藏
  • 关注

原创 开源机器学习数据库OpenMLDB贡献者计划全面启动

随着OpenMLDB 0.3.0版本的发布,OpenMLDB社区发起「OpenMLDB贡献者计划」(OpenMLDB Contributor Program,简称OCP),希望更多开发者参与社区建设,一同构建包容、友好、完善的开源生态,加速AI工程化落地进程。

2021-12-06 11:32:27 1427

原创 第四范式OpenMLDB优化创新论文被国际数据库顶会VLDB录用

第四范式与新加坡国立大学及英特尔的最新联合研究成果——基于持久内存优化的AI实时决策系统数据库OpenMLDB(Open Source Machine Learning Database)被国际数据库顶级会议VLDB 2021录用。VLDB (Very Large Data Base) 是数据库研究人员、厂商、应用开发者,以及用户广泛参与的年度国际会议,它与SIGMOD、ICDE被公认为数据管理与数据库领域的三大国际顶尖学术会议。这是国内AI厂商第一次在VLDB Research Track上发表机器

2021-08-19 19:36:04 307

原创 OpenMLDB v0.9.0 发布:SQL 能力大升级覆盖特征上线全流程

相比于传统的 SQL 数据库,OpenMLDB 覆盖机器学习的全流程,包含离线模式和在线模式,在线模式下支持用户传入单行样本数据,通过 SQL 特征抽取返回特征结果。OpenMLDB 正常发布了一个新的版本 v0.9.0,包含了 SQL 语法拓展、MySQL 协议兼容、TiDB 存储支持、在线执行特征计算、特征签名等功能,其中最值得关注和分享的就是对 MySQL 协议和 ANSI SQL 兼容的特性,以及本地拓展的 SQL 语法能力。语句,以样本行作为参数传入进行存储过程的调用,示例如下。

2024-05-03 11:18:26 847 1

原创 OpenMLDB vs Redis 内存占用量测试报告

OpenMLDB 是一款开源的高性能全内存 SQL 数据库,在时序数据存储、实时特征计算等方面都有很多创新和优化。Redis 是业界最流行的内存存储数据库,广泛应用于缓存等高性能在线场景。虽然二者应用场景不尽相同,但作为都是使用内存作为存储介质的数据库,希望通过对相同数据行数下的内存占用量进行测试对比,让客户直观了解二者在内存资源上的消耗占比。

2024-04-03 14:00:12 1015

原创 超高性能数据库 OpenM(ysq)LDB:无缝兼容 MySQL 协议 和多语言 MySQL 客户端

OpenM(ysql)LDB 是 OpenMLDB 项目的一次大胆的尝试,在 0.1.5 到 0.8.5 一共39个版本发布后,在不断的功能完善和 SQL 语法兼容以后,终于实现了完全兼容 MySQL 协议的功能,在保证了基本的 SQL 查询功能外还提供了比 MySQL 更高性能的底层存储实现和 AI 能力拓展。

2024-04-03 13:37:55 774

原创 全新特征平台 FeatInsight 测试平台上线,现已开放抢先体验!

OpenMLDB 社区开源特征平台产品 - FeatInsight(https://github.com/4paradigm/FeatInsight),现已开放测试平台 @http://152.136.144.33/,联系我们获取用户名及密码,抢先体验!FeatInsight 的主要目标是解决机器学习项目中常见的问题,包括简便快捷地进行特征提取、转换、组合、选择以及血缘管理,实现特征的重用和共享,特征服务版本控制,以及确保在训练和推理过程中使用的特征数据的一致性和可靠性。

2024-03-14 11:23:03 368

原创 十分钟掌握分布式数据库开发:OpenMLDB 开发者镜像详解

OpenMLDB 是一款国产的、开源的、面向时序数据的分布式内存数据库系统,它专注于高性能、高可靠性和易扩展性,适用于海量时序数据的处理以及在线特征的实时计算。在大数据和机器学习的浪潮中,OpenMLDB 以其强大的数据处理能力和高效的机器学习支持,在开源数据库领域崭露头角。

2024-03-13 11:54:35 873

原创 OpenMLDB v0.8.5 发布:认证功能完善,安全升级全面实施

OpenMLDB 将 Iceberg集成到其平台中,使得用户可以在使用 OpenMLDB 的功能时直接读写 Iceberg 数据湖,从而实现更高的数据可靠性和一致性、更灵活的数据操作和管理功能以及更高效的数据查询性能,为企业提供了全面、可靠的数据湖管理解决方案。OpenMLDB 昨天发布了一个新的版本 v0.8.5,包含了 SQL 语法拓展、Iceberg 数据湖支持、TTL 类型拓展以及实现用户认证等功能,其中最值得关注和分享的就是 Iceberg 引擎集成以及用户认证功能的完善。

2024-02-29 11:16:25 916

原创 OpenMLDB 作为中国唯一的特征平台产品入选 2023 Gartner 研究报告

在国际权威咨询与研究机构 Gartner 发布的重要研究报告 “逻辑特征存储:机器学习的数据管理” 中,OpenMLDB 荣幸作为中国唯一的特征平台代表产品入选该报告。

2024-02-08 13:30:27 908

原创 FeatInsight: 基于 OpenMLDB 的特征平台助力高效的特征管理和编排

OpenMLDB 特征平台 (https://github.com/4paradigm/feature-platform)是一个先进的特征存储(Feature Store)服务,基于 OpenMLDB 数据库实现高效的特征管理和编排功能。

2024-01-18 16:41:36 925

原创 OpenMLDB SQL 开发调试神器 - OpenMLDB SQL Emulator

今天为大家介绍一款来自 OpenMLDB 社区的优秀独立工具 - OpenMLDB SQL Simulator(https://github.com/vagetablechicken/OpenMLDBSQLEmulator) ,可以让你更加高效方便的开发、调试 OpenMLDB SQL。为了高效的实现时序特征计算,OpenMLDB SQL 对标准 SQL 做了改进和扩展,因此初学者在使用 OpenMLDB SQL 的时候,经常会碰到语法不熟悉、执行模式混淆等问题。

2023-11-24 11:09:14 633

原创 OpenMLDB v0.8.4 诊断工具全面升级

新的v0.8.4版本中,我们对于诊断工具进行了全面系统化的升级,以提供更加完整和智能化的诊断报告,有助于高效排查 OpenMLDB 集群问题,大幅提升运维效率。相比于之前的版本,新的诊断工具增添一键诊断功能,使用就可以一键诊断集群的健康状态。提供的信息包括XX Detail和两个部分。XX Detail部分提供集群现状信息;部分总结了重点需要关注的信息点,并且智能提示可能有问题的地方及相应的对策,帮助用户进行集群修复。一般情况下,部分的信息足够用户对集群进行对应的修复;对于更棘手的情况,用户可参照。

2023-11-24 11:07:38 587

原创 OpenMLDB 基于 Kubernetes 的部署全攻略

本文将分别介绍离线和在线引擎基于 Kubernetes 的部署攻略。

2023-09-07 11:21:08 349

原创 OpenMLDB荣登ACM旗舰期刊

日前,最新一期的ACM(国际计算机学会)旗舰期刊《Communications of the ACM》(ACM 通讯) 刊登了开源机器学习数据库项目 OpenMLDB 的文章,获得了期刊编辑主席团的一致认可。

2023-07-26 10:41:52 368

原创 OpenMLDB 发布线上到线下数据自动同步工具

近期,OpenMLDB v0.8.0 正式推出自动化线上到线下数据同步工具,实现了从实时数据库到离线数仓的自动同步,改进了手动维护的运维复杂度。这篇文章总结了线上到线下数据自动同步的工具

2023-07-20 16:28:07 419

原创 【无标题】

OpenMLDB v0.8.0 新版本发布中新增加了对于 Amazon S3 作为离线数据源的支持。点击文章了解更多

2023-06-01 12:18:26 374

原创 首个机器学习实时特征平台测试基准论文被 VLDB 2023 录取

首个机器学习实时特征平台测试基准论文 FEBench: A Benchmark for Real-Time Relational Data Feature Extraction 被 VLDB 2023 录取

2023-05-25 11:04:51 387

原创 OpenMLDB v0.8.0 发布

v0.8.0 新版本发布

2023-05-17 12:08:35 562

原创 论文解读:基于 OpenMLDB 的流式特征计算优化

近期,数据库领域的顶级学术会议 ICDE 2023 在迪斯尼主题公园的故乡 - 美国的安纳海姆(Anaheim)举办。由 OpenMLDB 开源社区和新加坡科技设计大学(Singapore University of Technology and Design)联合完成的研究工作在 ICDE 2023 上作为工业界的常规论文发表。

2023-04-17 10:43:32 457

原创 实时决策系统中 OpenMLDB 的常见架构整合方式

本文关注基于 OpenMLDB,在企业级业务系统中使用的常见架构。

2023-04-05 10:48:44 810

原创 数据库ChatGPT插件来了,SQL使用体验进一步起飞

基于 ChatGPT API 和 OpenMLDB 数据库实现的 openmldb-chatgpt-plugin 项目开源了,作为人类迄今为止最强AI模型之一(GPT4未开放API),集成了 ChatGPT 模型的数据库有多好用,下面将带大家体验一下。

2023-03-23 15:19:55 6377

原创 演讲实录|AI 数据库的内存优化之路

本文整理自 OpenMLDB PMC 陈迪豪在 2023 Qcon 全球软件开发大会 AI 基础架构论坛上的发表的演讲实录。

2023-03-08 14:44:28 665

原创 OpenMLDB 社区月报 | 2023 年 2 月

OpenMLDB 社区每个月都会发布一版社区月报,总结一个月以来的产品动态、社区活动、内容发布等,让大家对我们社区的发展有更加清晰的了解。如果您对我们的社区有任何建议,欢迎在 GitHub 上提 Issues 或 PR ,共同参与社区的建设。

2023-03-01 13:49:52 543

原创 活动预告 | GAIDC 全球人工智能开发者先锋大会

GAIDC 即将于本周末开幕,OpenMLDB 荣幸受邀参与。

2023-02-22 11:13:10 691

原创 活动预告 | 2023 QCon 全球软件开发大会 - AI 基础架构论坛

2023 QCon 北京站即将举行。郑曌作为出品人在本次峰会上发起了 AI 基础架构专题论坛。

2023-02-03 19:38:53 965

原创 OpenMLDB 社区月报 | 2023 年 1 月

一月,OpenMLDB 正式发布 0.7.0 版本,该版本主要增强了易用性和稳定性——系统性改进消息和错误码,提升易用性;设定内存使用上限,增强服务稳定性;新增自动化部署和启动工具,降低使用门槛。而后还快速迭代了 0.7.1 小版本,修复了一些社区问题。同时, OpenMLDB 项目荣获多项年度奖项,这些奖项是认可也是激励,2023 年 OpenMLDB 会再接再厉,持续创新优化,不负期待!

2023-02-01 11:07:05 387

原创 运维实践 | OpenMLDB 跨机房容灾方案

在单集群部署环境下,OpenMLDB 具备集群内节点级别的高可用能力。但若受到机房断电或者自然灾害等不可抗拒因素,则将造成的机房或大部分节点无法正常运转的情况,从而引发该集群状态异常,导致在线服务中断。

2023-01-31 11:39:41 615

原创 名单揭晓!OpenMLDB 获评 2022 年度中国开源社区健康案例

2023年1月13日,2022 年度OSC中国开源项目评选 ——「2022 中国开源社区健康案例」获奖社区正式揭晓!OpenMLDB 社区获评 2022 年度中国开源社区健康案例。

2023-01-31 11:31:54 385

原创 荣誉+1,OpenMLDB 荣获 InfoQ 2022 年度杰出开源运营团队

近日,在 InfoQ 合作伙伴年度盛典上,InfoQ 中国技术力量 2022 年度榜单正式公布,OpenMLDB 荣获“2022 年度杰出开源运营团队”。

2023-01-18 16:16:26 352

原创 OpenMLDB v0.7.0 发布

2023 新年伊始,OpenMLDB v0.7.0 正式发布。本次版本更新重点增强了易用性和稳定性,下文将详细介绍主要改进和更新内容。

2023-01-13 12:59:03 871

原创 2022 OpenMLDB 硕果累累,颁奖台上荣耀连连

岁末年初,既是回望过去和规划未来的日子,也是总结成长与收获成果的时间。

2023-01-06 17:34:07 765

原创 OpenMLDB 祝大家新年快乐!

OpenMLDB 祝大家新年快乐,2023 兔飞猛进~

2023-01-03 15:41:54 376

原创 回顾 OpenMLDB 2022 之旅 | 开源之路,行将致远

2022年初,OpenMLDB 尚且懵懂稚嫩。彼时的我们刚刚走过开源道路上的第一个秋天,还没有结出丰硕的果实。前进着,期待着,2022的一切徐徐展开

2023-01-03 15:39:06 492

原创 专访 | 刘嘉松:开源,互惠且共赢

本文整理自对 2022 开源之夏 OpenMLDB 社区贡献者刘嘉松同学的采访,欢迎大家关注~

2023-01-03 15:36:11 318

原创 性能成本难两全?OpenMLDB 实时计算双存储引擎让你不必纠结(附测评报告)

OpenMLDB 的线上服务部分为了满足不同的性能和成本需求,提供了两种分别基于内存和磁盘的存储引擎。关于这两种存储引擎的使用考量,和推荐匹配场景,见如下表。

2023-01-03 15:31:29 443

原创 OpenMLDB 贡献者任务第六期 | 暖冬时节,活力继续

十二月,冬天已经来临,风里裹挟着寒意。时光流转,十二月或许是一年中数着遗憾的结尾;四季轮回,现在也可能是收获美好与崭新开始的节点。

2022-12-15 14:57:35 520

原创 数据生态第四弹 | OpenMLDB Hive Connector,架构起数据仓库到特征工程的生态桥梁

近日,OpenMLDB 实现了与开源数据仓库软件 Hive 的连接,继完成与 Kafka、Pulsar、RocketMQ 等实时数据源生态整合后,持续构建离线数据生态,期待建设一个更加全面一体的上下游生态圈,在吸引更多用户的同时也能降低用户的使用门槛。

2022-12-14 17:50:21 284

原创 演讲实录|OpenMLDB 与阿里云 MaxCompute 生态集成

在 OpenMLDB 第 8 期 Meetup 中,OpenMLDB PMC 陈迪豪以出租车行车时间预测问题为例,使用 OpenMLDB 基于阿里云 MaxCompute 的 Serverless 服务搭建机器学习应用,从数据引入开始,实现了端到端的机器学习应用全流程构建。

2022-12-14 17:49:12 535

原创 专访 | 刘乔升:开源是人类智力劳动最好的组织形式

OpenMLDB:可以请你先自我介绍一下吗?

2022-12-14 17:47:09 449

原创 活动预告 | 2022 中国开源开发者(北京)峰会

12月8日 14:30-14:55,OpenMLDB PMC、第四范式系统架构师 卢冕,将在 2022 中国开源开发者(北京)峰会中为大家带来议题为《开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台》的内容分享,欢迎各位关注。

2022-12-14 17:44:29 419

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除