自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 资源 (4)
  • 收藏
  • 关注

原创 知识图谱:信息抽取简易流程

使用工具:Brat。

2023-09-23 15:54:22 256

原创 知识图谱:架构

体系架构图数据采集 → 信息抽取 → 知识融合 → (知识合并) → 知识加工 → 知识更新 数据采集 1.结构化数据​ 结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。 2.半结构化数据​ 半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。常见的半结构数据有XML和JSON。 3.非结构化数......

2022-07-31 11:27:27 3778

原创 知识图谱:语义网络、语义网、链接数据、知识图谱

语义网络 语义网络是由Quillian于上世纪60年代提出的知识表达模式,其用相互连接的节点和边来表示知识。节点表示对象(object)、概念,边表示节点之间的关系。 语义网络的优点: 1. 容易理解和展示。 2. 相关概念容易聚类。 语义网络的缺点: 1. 节点和边的值没有标准,完全是由用户自己定义。 2. 多源数据融合比较困难,因为没有标准。 3. 无法区分概念节点和对象节点......

2022-07-30 18:30:36 3553 1

原创 GIS:MBTiles数据

# GeoServer插件 所需安装插件:1、mbtiles 2、wps 1️⃣ mbtiles-plugin 下载地址:Index of /geoserver/(选择相应版本后进入community文件夹geoserver-2.20-SNAPSHOT-mbtiles-plugin.zip

2021-11-20 17:10:37 7203

原创 OpenLayers:加载GeoServer发布的WMTS、TMS服务

# 数据 ## 数据说明:广州天河区路网.shp ## 坐标系:EPSG:3857 ## 坐标系范围:[-20037508.34, -20037508.34, 20037508.34, 20037508.34] ## 数据范围:[12612071.934997188, 2644615.605161872, 12628768.72360215, 2660183.6516002486]## 数据中心:[12620420.32929967, 2652399.6283810604].....

2021-11-17 15:37:48 12745 2

原创 openlayers6:入门基础(二)之加载图层

#Tiled Layers ## OSM ????OpenLayers v6.9.0 API - Class: OSM Layer source for the OpenStreetMap tile server.new ol.layer.Tile({ title: "OSM", source: new ol.source.OSM({ url: "https://c.tile.openstreetmap.org/{z}/{x}/{y}....

2021-10-31 09:45:10 7025 3

原创 openlayers6:入门基础(一)

# 前言???? 资源:OpenLayers3示例???? 资源:OpenLayers_3_入门教程完整版.pdf# 下载 官网:https://openlayers.org/download/ 这里根据自己所需点击下载即可(-dist.zip只包含必要的css、js文件(约1M),.zip包含很多示例、API文档等,文件大小更大(约27M) 也可以直接使用网络资源<script src="https://cdn.jsdelivr.net/gh/openlay

2021-10-28 16:52:56 9604 1

原创 WebGIS系列(一):坐标系

# 1. 坐标系1. 大地坐标系与地理坐标系有何不同? 回答一:大地坐标系和地理坐标系都是经纬度表示的坐标系,本身并不包含投影信息,很多时候,这两种说法都是相同的 [来源] 回答二:地理坐标(经度B,纬度L)只能描述地面点在椭球面的投影;大地坐标(经度B,纬度L,大地高H)描述的是地面点的三维空间位置 [来源]2. 通常所说的西安80,北京54是指什么? 椭球体和基准面之间是一对多的关系(我国的北京54、西安80、国家2000坐标系都使用了不同的椭球体)。大地基准面.......

2021-10-27 11:52:45 3419 1

原创 IR:检索模型

# 信息检索模型 信息检索的主题之一是定义一个无须工程师提炼规则的模型。这样的检索模型(retrieval model)应该尽可能准确地捕获相关性的概念。给定一组搜索结果,检索模型将对它们进行排序:结果越相关,分数越高。# TF-IDF 一种度量文档相对于查询的重要性的常见方法,是利用基于查询和文档中的词项计算出的统计数据。这种检索模型称为信息检索的统计模型(statistical models for information retrieval) # 示例 ...

2021-09-03 00:23:54 1444

原创 Linux:_tkinter.TclError: couldn‘t connect to display “localhost:10.0“

# 前言 Linux 服务器是不安装图形化界面的,这不仅出于资源优化的考虑,同时还提升了系统的安全性。但是有一些应用程序在安装时使用图形化界面,最典型的例子就是 Oracle,不采用图形化安装,其复杂程序直线上升。其实这个问题很好解决,对于 Xserver 运行机理有所了解的话,很容易就可以想到使用 X 服务器来显示 Linux 系统的图形界面,达到本机不安装图形环境而一样可以显示图形化界面的效果。 有两种解决方法: 1️⃣ 安装 XManager(不免费,可试用30天...

2021-08-13 23:58:16 4643

原创 NLP:预训练+转移学习

以情感分析(supervised)为例,探究一直以来是如何解决该NLP任务的?2013年1️⃣randomly initialize the model params (这些参数都是从头开始学习,模型需要从少量的标注数据集中学习语言的运作方式2️⃣ update all params by backprop using cross entropy loss from labeled training set2014 ~ 2017 年 Why train everythi...

2021-08-12 14:08:41 1582

原创 NLP:self-attention + Transformer

前言 通常认为RNN有两个缺点:1、RNN隐藏层中记录的较早信息会随着时间步的推移而冲淡,所以就无法建立起和较早时间步信息的依赖关系。2、RNN不能并行化处理。因而催生出了attention解决上述问题。 Attention机制的本质来自于人类视觉注意力机制。人们视觉在感知东西的时候一般不会是一个场景从到头看到尾每次全部都看,而往往是根据需求观察注意特定的一部分。而且当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。背...

2021-07-22 14:32:00 316

原创 Python:读取json文件并修改文件内容

前言 由于中国地图需要按各省密度值大小实现分级渲染,而网上获取的json数据不会带有我们需要的参数,所以我们需要修改json中的文件内容。代码import jsonimport randomdicts = {} #用来存储数据def get_json_data():#获取json里面数据 with open('D:/Code_collection/JavaScript/leaflet/全国2.json','r',encoding='utf8') as f: ...

2021-06-21 22:04:52 6102

原创 echarts:迁徙图

前言 echarts官方之前有一个案例geo-lines,但在新版本中似乎被剔除了 根据代码学习了一下echarts,只为看看效果,所以数据简化了,并对代码做了注释数据 迁徙数据:高德地图迁徙数据 GeoJSON数据:http://datav.aliyun.com/tools/atlas/ 注意:由于echarts之前提供的china.js数据不符合规定,现在下载不了了,所以使用高德的全国json数据,使用 echarts.registerMap ...

2021-05-27 14:34:37 7767 2

原创 AllenNLP2.2.0:入门篇

前言 AllenNLP 是艾伦人工智能研究院开发的开源 NLP 平台。它的设计初衷是为 NLP 研究和开发(尤其是语义和语言理解任务)的快速迭代提供支持。它提供了灵活的 API、对 NLP 很实用的抽象,以及模块化的实验框架,从而加速 NLP 的研究进展。安装1. 若有GPU查看CUDA版本 输入nvcc -V命令,即可查询到CUDA版本号2.1 Windows版 torch安装教程:链接# 安装pytorchpip install torch==...

2021-05-16 22:13:10 1276

原创 NLP:HMM、MEMM、CRF序列标注

前言 概率序列模型:它的工作是为序列中的每个单元分配一个标签或类,从而将一个观察序列映射到一个标签序列。给定一个单位序列(单词、字母、语素、句子,等等),它计算可能的标签序列的概率分布,并选择最佳的标签序列,即Seq2Seq。Markov Chains马尔科夫链 图中节点表示状态,弧线表示状态的转移,其上数字表示转移的概率(注:离开给定状态的弧的值之和必须为1 一个马尔可夫链由以下部分组成:HMM 隐式马尔可夫模型 在许多情况下,我们...

2021-05-15 18:28:04 1790

原创 探究GeoSPARQL(二)

#GraphDB GraphDB 官方下载地址:GraphDB Downloads and Resources (ontotext.com)(填写信息后会发软件到邮箱 GraphDB 免费版支持空间数据查询GraphDB™ - Ontotext(页面下拉# Stardog 在社区版本的Stardog中没有启用地理空间特性。必须拥有Enterprise许可证才行(可以试用30天 空间查询案例:Geospatial: A Primer ......

2021-05-04 18:49:41 877

原创 探究GeoSPARQL(一)

# 案例 RDF语句定义了特性类my:PlaceOfInterest,创建了两个属性用于将几何与特性关联起来:my:hasExactGeometry和my:hasPointGeometry。 my:hasExactGeometry被指定为my:PlaceOfInterest特性类的默认几何体。 relation_family = Simple Features, serialization = WKT, and version = 1.0.@p...

2021-05-04 17:01:54 1412 1

原创 知识图谱:SPARQL的基本语法示例

前言 SPARQL的英文全称为SPARQL Protocol and RDF Query Language,是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。 从SPARQL的全称我们可以知道,其由两个部分组成:协议和查询语言。1、查询语言很好理解,就像SQL用于查询关系数据库中的数据,XQuery用于查询XML数据,SPARQL用于查询RDF数据。2、协议是指我们可...

2021-04-30 12:03:20 7928 3

原创 HanLP的依存分析

# 安装1. 创建虚拟环境(非必要操作conda create -n hanlp python=3.72. 安装HanLP(当在线安装失败时,可选择离线安装 [hanlp库]pip install hanlp-2.1.0a36.tar.gz3. HanLP的使用import hanlpHanLP = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH) # 世界最

2021-04-29 10:55:52 3388

原创 Spacy的依存分析

模型 上次使用spacy时,官网提供的模型有en_core_web_sm、en_core_web_md和en_core_web_lg,现在发现又提供了一种en_core_web_trf。根据说明解释 trf 是larger and slower pipeline, but more accurate,而 sm是faster and smaller pipeline, but less accurate [来源] 导入方式也增加了一种# 方式一import spacynlp =...

2021-04-02 17:34:44 7196 1

原创 百度DDParser的依存分析

1.安装百度深度学习框架paddlepaddle飞桨python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple2. 安装DDParserpip install ddparser3. 报错 [链接]RuntimeError: paddle-ernie requires paddle 1.7+, got 2.0.14. 打开C:\Anaconda3\lib\site-packages\dd.

2021-04-01 20:20:18 3455

原创 ArcGIS:各种报错的解决方案

前言 每年临近毕业,网上问ArcGIS各种问题的人就多了起来。有时候靠经验、有时候靠玄学,备受折磨.... 由于出现的问题是问不完的,且网上不一定能找到资料,这里甩出esri官方提供的技术支持 [网址],大部分问题应该都能找到,毕竟为什么会报错它最清楚(狗头操作 例如我看到有人问安装ArcGIS时报错2753 在网站搜索2753,找到相关内容 可以看到给出了错误原因以及解决方案,视情况自己修改 注意:同一个错误代码可能有几种...

2021-03-31 21:28:23 11707 3

原创 哈工大LTP的依存分析

安装 1. pip install ltp 2. 允许代码后报错Microsoft Visual C++ Redistributable is not installed, this may lead to the DLL load failure. It can be downloaded at https://aka.ms/vs/16/release/vc_redist.x64.exe 3. 根据报错里提供的网址下载vc_redist...

2021-03-31 19:35:11 5822

原创 NLP:依存分析

前言 自然语言处理任务中,有很重要的一块,就是分析语言的结构。语言的结构,一般可以有两种视角: 1. 组成关系(Constituency) 句法结构分析(syntactic structure parsing),又称短语结构分析(phrase structure parsing),也叫成分句法分析(constituent syntactic parsing)。作用是识别出句子中的短语结构以及短语之间的层次句法关系。 2. 依赖关系(Dependency)...

2021-03-31 18:56:57 4803 1

原创 知识图谱:知识表示之RDF、RDFS、OWL

RDF RDF(Resource Description Framework),即资源描述框架,其本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种方法和手段。 RDF序列化方法 我们怎么存储和传输RDF数据呢?RDF序列化的方式主要有:RDF/XML,N-Triples,Turtle,RDFa,JSON-LD等几种。 1)RDF/XML,顾名思义,就是用XML的格式来表示RDF数据。然而,对于RD........

2021-03-09 11:58:43 6003

原创 GeoServer:Could not list layers for this store, an error occurred retrieving them

前言 用GeoServer发布 .tif 数据供前端调用底图时,由于网络地图通常是使用Web Mercator ,所以在ArcGIS导出数据时,使用了 WGS1984 WebMercator(auxiliary sphere)(wkid:3857)坐标系,结果在GeoServer创建数据存储时却报错(如图,报错详情可以在geoserver的日志中查看),而改用 WGS1984 WorldMercator(wkid:3395)却能正常创建数据存储正文 ① EPSG可以到...

2021-02-20 18:45:29 4698

原创 NLP:Word2Vec

前言 之前写过的一篇博客提到过Word2Vec,但也只是草草说了一下基本的认识。最近在看自然语言处理相关书籍时,发现Word2Vec是个很重要的东西,且原理也并没有以为的那么难以理解,所以在此再梳理一下。概述 Word2Vec是Google在2013年推出的一个NLP工具,它的特点是能够将单词转化为向量来表示,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。Word2Vec的目的是理解两个或更多单词一起出现的概率,从而将具有相似含义的单词组合在一起,在向量空间...

2020-12-21 16:33:32 1287

原创 Rasa_nlu_chi:入门教程

1. 为防止版本兼容问题,创建Python虚拟环境 链接:https://jingyan.baidu.com/article/b7001fe15d584c4e7282ddb2.html 1.1 创建一个文件夹(如pythonEnv),控制台进入该文件夹,运行python -m venv . 1.2 完成后会在该文件夹下生成一些文件,控制台进入Scripts文件夹,运行activate即可2. 安装jiebapip install jieba==0.41...

2020-12-09 16:11:32 2007 5

原创 spaCy:No module named ‘en’ || Can‘t find model ‘en’

前言 了解到 ChatterBot 后,打算上手试试,安装好库包、敲好入门代码,一运行报错:ModuleNotFoundError: No module named 'en' ,又或是OSError: [E050] Can't find model 'en'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory. 先贴上最后配置的库包版本:库包 ...

2020-12-07 16:08:09 2109 4

原创 知识图谱:本体建模之Protégé

下载 官网:https://protege.stanford.edu/products.php 1.点击 Download for Windows 2. 选择 No,thanks... 即可开始下载 3. 下载完成解压即可建模 数据:https://zhuanlan.zhihu.com/p/32389370 1.在Ontology IRI中填写我们新建本体资源的IRI。读者可以填写自己的符合标准的IRI。 2......

2020-11-29 23:49:34 240

原创 Jena 3.16:OWL推理机配置文件

官方文档Apache Jena - Jena assembler quickstarthttps://jena.apache.org/documentation/assembler/assembler.ttlApache Jena - Jena Assembler howto博客知识图谱 KBQA Demo:fuseki sparql python 版本问题详细解决方案_深刻的博客-CSDN博客jena fuseki 自定义推导规则(OWLFBRuleReasoner推理机)_.

2020-11-29 23:34:24 910

原创 知识图谱:R2RDF转换之D2RQ

前言 为了规范化RDB转换成RDF,W3C于2012年推出了两种映射语言标准:一是Direct Mapping(A direct mapping of relational data to RDF),即直接映射。但实际中很少使用这种方法,因为不能把RDB中数据映射到我们定义的本体上面。二是R2RML(RDB to RDF Mapping Language),它具有较高的灵活性和可定制性。 一些常用的工具有: D2RQ(http://d2rq.org/) ...

2020-11-29 19:50:41 2238 8

原创 Neo4j:入门基础(八)之Traversal API

前言 Neo4j数据库的高性能查询表现就是根据图数据库结构的自然伸展特性,使用免索引邻近查询算法,即图的遍历来实现的。图的遍历是图数据结构所具有的独特算法。 根据遍历时查找数据的路径不同,遍历算法可以分为广度优先遍历和深度优先遍历。案例 完整代码请参照https://github.com/mr-csj/neo4j-useapi/blob/master/traversal/src/main/java/com/test/Friends.javapublic e...

2020-11-01 23:51:45 1302 1

转载 ElasticSearch教程

前言 本文转载自https://blog.csdn.net/qq_36639232/article/details/106236468 博主在博客园也上传了,展示效果感觉更舒服https://www.cnblogs.com/coderxz/p/13268417.html 其他:EleasticSearch综述(一) EleasticSearch综述(二)文章目录1.ElasticSearch简介 1.1ElasticSear...

2020-10-27 00:00:17 1286

原创 Neo4j:入门基础(七)之Algo插件

前言 Neo4j提供了两个常用的算法库:apoc和algo。相对于algo,apoc不仅仅提供了一些算法实现,还提供了数据导入等功能,更多地像一个工具包。而在算法实现方面,algo显得更专业、全面。 Neo4j v3.5以前,使用的是Neo4j Graph Algorithms,往后的版本更新为Neo4j Graph Data Science Graph Algorithms Docs:https://neo4j.com/docs/graph-algorithms/cu...

2020-10-18 10:42:35 6371

原创 Neo4j:入门基础(六)之从MySQL导入数据

前言 本文以MySQL为例,数据来自https://blog.csdn.net/appleyk/article/details/80331997配置 APOC [下载地址] MySQL JDBC [下载地址] 把两个jar包放在neo4j安装目录的plugins文件夹下操作 1. 启动neo4j数据库 2. 运行Cypher语句CALL apoc.load.jdbc( 'jdbc:mysql://localhost:...

2020-10-04 16:06:48 2065 1

原创 Xshell6:应用程序无法正常启动(0xc000007b)

案例 最近发现XShell 6 打不开了,应用程序无法正常启动。卸载再安装/更新都解决不了问题 用depends查看 找到这些dll文件 ,导入c:/windows/system64,结果还是不行 将一个可以正常运行的软件用depends检测,和XShell结果比对,以下是找到的一些缺失的文件 网上有人说是VC++的问题,想到之前确实不懂事乱删了一次正在上传…重新上传取消正在上传…重新上传取消按照前面11...

2020-09-25 17:12:12 12963 8

原创 知识存储之Apache Jena

案例示例数据用Python随机生成

2020-09-25 16:15:27 5420 2

原创 知识图谱:关系抽取之DeepDive

DeepDive DeepDive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 。DeepDive项目目前处于维护模式,不再处于积极开发状态 DeepDive文档:http://deepdive.stanford.edu/依赖 注:以下是从别的博主那看到的,不太清楚来源 Java (1.7.0_45版本或以上) Python 2.X(有博主说推荐2.X,但3.X...

2020-09-24 16:09:00 1798

spambase.csv

机器学习垃圾邮件分类数据集

2021-05-19

北上广深公交路线数据csv.zip

高德API获取北上广深公交路线数据。注意:此为csv文本数据,如需矢量线数据,请访问https://blog.csdn.net/sinat_36226553/article/details/104948734

2020-08-18

北上广深公交线路数据.zip

抓取的8684网站北上广深公交线路数据,包括以数字开头和以字母/拼音开头的数据,如:1路,10路,11路,12路。注意:仅为名称,如需线数据,请访问https://blog.csdn.net/sinat_36226553/article/details/104948734

2020-08-18

OfflineRouting.zip

对ArcGIS Runtime SDK for Android的Offline Routing案例进行实现,单击设置停靠点,双击计算路线(至少有2个站点才能计算路线)

2020-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除