自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(183)
  • 收藏
  • 关注

原创 论文导读 | 漫谈图神经网络

本文主要介绍图神经网络相关内容,包括图神经网络的基本结构以及近期研究进展。

2024-03-25 14:50:03 352

原创 论文导读 | 漫谈编辑问题

本文围绕深度学习模型的编辑,介绍了针对一般分类器、图像生成模型、语言模型的编辑问题及一些相关方法,还对现有工作的优劣、一些可能的未来研究方向给出了简单的讨论。

2024-03-25 14:44:32 805

原创 图解李白的“朋友圈”

本次我们从互联网上搜集了有关《长安三万里》中的人物以及其他唐代著名诗人的基本信息,然后以诗人、诗歌为主要实体类型,梳理了诗人之间的关系,在gBuilder中用非结构化数据表单录入的方式,最终得到了唐朝诗人关系的RDF文件。节点可以表示实体和属性,边可以表示为实体-实体和实体-属性之间的关系,这种形式对处理复杂的关联关系有着天然的优势,也更接近人类认知世界的形式,为数据处理提供了一种更好的组织和管理能力。在实际项目中,也可以根据不同类型的数据选择不同的抽取方式,或多种方式结合的形式来构建知识图谱。

2024-02-23 16:21:30 607

原创 辞旧迎新|回顾gStore的2023

2024-02-23 16:20:00 118

原创 #gStore-weekly | gMaster功能详解之数据划分策略

文件格式为<predicate>\t{Node_id},predicate为三元组谓语,Node_id为节点id(数字类型),把计划分配到同一节点的节点id配置为相同。文件格式为<entity>\t{Node_id},entity为三元组主语或宾语,Node_id为节点id(数字类型),把计划分配到同一节点的节点id配置为相同。如果主语、宾语模值不相等,该三元组分配到两个节点。划分节点时,1种是根据对主语、宾语、谓语计算hash值与节点数取模确认节点,1种是指定节点ID,通过ID与节点数取模确认节点。

2024-02-21 16:25:03 424

原创 #gStore-weekly | gMaster功能详解之节点配置

点击【新增按扭】,弹出新增节点页面,需要输入节点名称、节点IP、gStore用户、gStore密码、gStore端口、节点系统用户、节点系统密码、gStore路径、SSH端口、接口类型,所有字段都是必输项。点击左侧菜单【系统管理】下的【节点配置】,可以进入节点配置页面,展示当前已配置的所有节点的节点名称、节点IP、gStore版本、gStore用户名、gStore服务状态、gStore接口类型、端口、节点系统用户名、节点系统登录状态、ssh端口、gStore路径列表。gMaster提供了节点配置功能。

2024-02-21 16:24:29 333

原创 #gStore-weekly | gMaster功能详解之数据库查询

gMaster提供了数据库查询功能。该功能可以对集群中的数据库通过SPARQL进行查询。平台基于Master-Slave架构,内置了基于随机划分和指定划分的4种数据查询分解策略,支持百亿图数据规模下多达六跳的秒级查询。登录gMaster,点击左侧菜单【数据库】下的【图数据库查询】,进入数据库查询页面。在【数据库】下拉框选择要查询的数据库名。在查询SPARQL输入框中输入SPARQL语句,点击【查询】按钮,页面右侧展示查询结果。

2024-02-21 16:23:20 348

原创 #gStore-weekly | gMaster功能详解之数据库管理

gMaster提供了数据库管理功能。该功能可以对集群中的数据库进行集中管理,可以查看各个数据库详细信息。能够方便的对数据库进行新建、构建、导出、备份、还原、删除操作。登录gMaster,点击左侧菜单【数据库】下的【数据库管理】,进入数据库管理页面,页面展示已新建的数据库。在数据管理页面,点击右上角【新建数据库】按钮新建数据库。输入数据库名称后,点击提交按钮。点击【构建数据库】按钮。第一步配置节点,上传数据源文件。上传有两种方式:1、服务器文件方式,手动将文件传到gMaster服务器,并配置文件路径。

2024-02-21 16:22:37 588

原创 #gStore-weekly | workbench功能详解之知识更新

gStore workbench作为gStore的可视化管理工具,不仅提供了可视化查询功能,还提供了可视化的知识更新功能,用户可以在可视化界面上进行知识的新增、修改和删除等操作,让我们的知识管理更加清晰和便捷。登录workbench平台,进入知识更新页面,选择要更新的数据库,通过SPARQL查询出需要更新的实体和属性。新增节点可以直接通过【新增节点】按钮进行新增,同时如果只是新增节点则不需要进行第一步的查询动作,但是新增节点必须要选择先数据库。

2024-02-21 16:21:19 820

原创 #gStore-weekly | gStore最新版1.2之CONCAT函数使用详解

截至当前,关于gStore最新版1.2的新功能介绍就结束了,后续我们将持续完善和新增更多的功能,尽请期待!【注】LCASE函数将所有字母转化为小写,如LCASE("Alice") = "alice"【注】STR函数返回字符串的词法表示形式,如:STR(<Alice>) = "Alice"gStore最新版1.2其他新功能的介绍可点击以下连接查看>>:过滤查询宾语字面量为Al和ice拼接的数据。:查询宾语字面量等于主语字符串拼接邮箱后缀。:将查询到关系为喜欢的数据拼接在一起。: string类型的字符串值。

2024-02-21 16:20:26 478

原创 #gStore-weekly | gStore最新版1.2之新增内置高级函数详解(二)

gStore1.2版本新增了七个高级函数,我们第2期将继续介绍的高级函数为:整体/局部集聚系数(clusterCoeff)、鲁汶算法(louvain)、K跳计数(kHopCount)/K跳邻居(kHopNeighbor)三类高级函数。

2024-02-21 16:19:36 254

原创 论文导读 | 因式分解数据库

在传统的关系型数据库中,二维表格形式容易造成信息的冗余。如果我们将数据库中的每条元组看成单项式,一个关系型数据库就可以表示成这些单项式的和。通过对多项式的因式分解就能够得到更加紧凑的表示形式。例如:下图中的表格,A 的取值有 a1,a2, B的取值有b1,b2,C的取值有c1,c2。不难看出表格中存储的是这些取值的所有组合情况。按照上述思路,我们可以将它用因式分解的表示形式进行表示:。我们发现,因式分解的表示形式只用了 6 个值就表示了具有 24 个值的二维表格。

2024-02-21 16:18:26 658

原创 #gStore-weekly | gStore最新版1.2之新增内置高级函数详解(一)

gStore1.2版本新增了七个高级函数,我们第2期将继续介绍的高级函数为:整体/局部集聚系数(clusterCoeff)、鲁汶算法(louvain)、K跳计数(kHopCount)/K跳邻居(kHopNeighbor)三类高级函数。

2024-02-21 16:15:38 793

原创 gStore最新版1.2之新增内置高级函数详解(一)

gStore1.2版本新增了七个高级函数,我们分成2期来对每一个函数的使用进行详细介绍,本期介绍的高级函数为单源最短路径(包括SSSP和SSSPLen)、标签传播(labelProp)、弱连通分量(WCC)三个高级函数。

2024-02-21 16:14:43 610

原创 基于深度学习的子图计数方法

子图计数(Subgraph Counting)是图分析中重要的研究课题。给定一个查询图 和数据图 , 子图计数需要计算 在 中子图匹配的(近似)数目。一般我们取子图匹配为子图同构语义,即从查询图顶点集 到数据图顶点集 的单射 ,保持拓扑关系(当查询图存在边 时,数据图中对应点也需要有连边 )和标签(查询图顶点 和数据图中对应点 标签相同)不变。

2024-02-21 16:14:17 1203

原创 #gStore-weekly | gStore最新版1.2之新增API接口详解

gStore1.2版本进一步丰富了API接口,接下来我们就逐一讲解每个接口的作用以及如何使用。我们首先启动http服务(以grpc为例),并指定服务端口号为9000:

2024-02-21 16:12:50 1022

原创 #gStore最新版1.2之空库的构建和批量数据构建

gStore1.2版本支持了空库的构建和批量数据构建,接下来我们将从本地命令、控制台、API接口三种方式来进行介绍如何使用:

2024-02-21 16:12:08 1195

原创 #gStore-weekly | gAnswer源码解析 调用NE模块流程

gAnswer系统的主要思想,是将自然语言问题转化为语义查询图,再和RDF图做子图匹配。在转换成查询图的第一步就是确定查询图的节点,即节点提取(Node Extraction, NE)。查询图中的节点由实体(entity)、类型(type)和通配符(wild-cards)构成,因此节点提取的主要工作就是提取问题中的实体和类型的提及(mention),以及给出在知识库中对应的候选。具体而言,节点提取模块分为离线和在线两部分。

2023-11-21 10:08:44 159

原创 #gStore-weekly | gBuilder功能详解之结构化数据抽取

gBuilder的结构化数据抽取采用D2RQ技术实现。DR2Q是一个能够将关系数据库中的内容转换成RDF三元组的工具,由于知识图谱中储存的数据通常为三元组格式,而知识图谱构建模块的数据大多储存在关系数据库中,以不同的表的形式来区分,所以需要进行转换。D2RQ主要包括 D2R Server, D2RQ Engine 以及 D2RQ Mapping 语言。

2023-11-20 16:58:19 168

原创 #gStore-weekly | gStore源码解析(十)事务机制

本章主要介绍gStore事务的MVCC实现和事务管理两部分,前者介绍了在事务模式下数据的存储方法,后者介绍了事务的处理流程。请注意,本章的代码省略了磁盘IO的相关操作。

2023-11-20 16:57:43 111

原创 #gStore-weekly | gBuilder功能详解之非结构化数据抽取模型

知识图谱自动化构建工具gBuilder

2023-11-20 16:55:29 124

原创 #gStore-weekly | gBuilder功能详解之表单录入

知识图谱自动化构建工具

2023-11-20 16:54:06 71

原创 #gStore-weekly | gAnswer源码解析 查询图生成

开源基于知识图谱的问答gAnswer

2023-11-20 16:52:36 238

原创 #gStore-weekly | gBuilder功能详解之模型说明

知识图谱自动化构建工具

2023-11-20 16:51:43 50

原创 #gStore-weekly | gBuilder功能详解之单机版模型部署

自动化知识图谱构建工具

2023-11-20 16:51:09 67

原创 #gStore-weekly | gBuilder功能详解之非结构化标注中心

知识图谱自动化构建工具

2023-11-20 16:49:38 81

原创 #gStore-weekly | gBuilder功能详解之人工录入数据

自动化知识图谱构建工具

2023-11-20 16:45:33 87 1

原创 #gStore-weekly | ​gAnswer源码分析:基于通用数据集的NE、RE服务开发

知识图谱问答系统

2023-11-20 16:44:47 100

原创 #gStore-weekly | ​gAnswer源码分析:后处理

基于知识图谱的问答系统gAnswer

2023-11-20 16:41:43 87

原创 #gStore-weekly | gBuilder功能详解之数据入库、定时任务、抽取日志、数据库管理等

自动化知识图谱构建工具gBuilder

2023-11-20 16:40:24 135

原创 #gStore-weekly | ​gAnswer安装部署

基于知识图谱的问答gAnswer

2023-11-20 16:39:34 93

原创 #gStore-weekly | gAnswer的使用

知识图谱问答gAnswer

2023-11-20 16:38:44 109

原创 论文导读 | 大语言模型与知识图谱复杂逻辑推理

大语言模型,尤其是基于思维链提示词(Chain-of Thought Prompting)[1]的方法,在多种自然语言推理任务上取得了出色的表现,但不擅长解决比示例问题更难的推理问题上。本文首先介绍复杂推理的两个分解提示词方法,再进一步介绍将提示词方法应用于知识图谱复杂逻辑推理的工作。

2023-11-20 16:36:53 855

原创 论文导读 | 图流的分割和摘要

文章基于如下观察:如下图所示,固定 vertex (为了更好的区分原图顶点和超点,我们在文中用vertex表示原图顶点,super node表示超点)划分,最优的 super node 间连边是显然的, 因此算法针对 vertex 划分即可。本文提出的方法是,在图流的开头,把一批 edge 读入内存,运行 offline 分割算法来提高初始状态下partition state信息少的时候的准确性,而不是在读入第一条边的时候立刻决定怎么分割。因此,第i层的矩阵中,每条边可以节省i bit的指纹。

2023-11-13 17:39:18 69

原创 gStore入选BenchCouncil年度世界开源系统杰出成果

团队在深耕图数据管理的前沿理论和方法,发表了包括SIGMOD、VLDB在内的一系列顶级数据库领域国际会议和期刊论文的同时,不断完善gStore开源项目,支持在各领域的大规模的知识图谱数据的管理与应用,培养了一批从事数据库内核研发的毕业生。面向大规模知识图谱应用的原生图数据库系统gStore的发展离不开众多开发者和使用者的支持以及研发团队的不断努力,希望在未来的道路上不断前行,打造功能更加完善、性能更加优异的国产图数据库系统。这是对gStore在图数据库领域的技术实力、成果落地和创新能力的高度认可。

2023-11-13 17:37:51 85

原创 讲座录播 | 邹磊教授:图数据库的概念和应用

在图中,每个节点表示一个实体,边表示实体之间的关联,边上的标签表示关系的性质。现在,图数据库有两个主要派别,属性图和RDF图。属性图使用属性值来表示图上的点和边,而RDF图则受到了三元组数据模型的启发,使用主谓宾形式来表示实体之间的关系。而在图数据库中,实体之间的关系通常以图的形式存储,以更自然的方式表示实体和它们的关系。第二个是说现在的图数据库跟图计算系统目前来说是分离的,一份数据在不同系统当中有多份,会造成空间消耗及数据的不一致性,未来可不可以有事务处理和分析的联机系统的一体化的图数据系统。

2023-11-13 17:36:45 85

原创 论文导读 | 融合大规模语言模型与知识图谱的推理方法

本文介绍的三项工作中,第一项工作通过简单的提示方法让大模型展现出了让人惊叹的推理能力,第二三项工作则是在大模型基础上,通过不同方法融合知识图谱的结构化知识,从而使用大模型进行推理,但是目前融合方法比较简单,该方向仍然存在一定研究空间。如下图例子中,左边是传统的提示词方法,首先给出一组问题样例及答案,然后给出问题,大模型输出内容即为最终答案。本文所提方法整体结构如下图所示(ToG),从给定问题出发,每一步推理都要经过扩展-推理的过程,每步推理都是基于问题通过大模型在知识图谱数据中搜索下一步推理的相关路径。

2023-11-13 17:35:29 841

转载 对话北大邹磊:要以发展的眼光看图数据库的挑战和机遇

海量数据爆发下如何挖掘数据价值成为每个企业的必修课,图数据库因在处理复杂关系方面有独特的优势,可以挖掘关系背后隐藏的数据价值,越来越受到关注。本文为《图数据库选型指南》系列选题文章之一,对话一线厂商、用户和学术界专家,揭开图数据库这一新型数据库的神秘面纱。探求图数据库技术发展的重点和难点,整理行业落地应用的实践,供业内参考。(北京大学王选计算机所教授 邹磊)图数据库当前处于早期发展阶段,很多方面还没有形成标准和共识。什么样的场景会用到图数据库?图数据库在数据栈中处于什么样的位置?

2023-11-13 17:33:56 25

原创 论文导读 | 多模态知识图谱的构建

本文将介绍四篇多模态知识图谱构建的相关论文,涉及到的方法主要分为两类,即根据多模态文档构建(GAIA、RESIN)和根据搜索引擎获取的图像构建(MMKG、Richpedia)。

2023-10-19 16:58:19 447

原创 DASFAA2023 | 关系数据库和图数据库关键技术融合趋势

本期论文导读为大家介绍近年来关系数据库和图数据库关键技术的融合趋势及代表性工作。相关内容来自DASFAA 2023 Tutorial “Fusion of Relational and Graph Database Techniques: An Emerging Trend”,由北京交通大学刘钰博士、中北大学郭青松博士和赫尔辛基大学陆嘉恒教授共同完成。

2023-10-19 16:56:27 445

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除