自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(378)
  • 资源 (17)
  • 收藏
  • 关注

原创 离线装docker和相关应用保姆级教程——以安装docker-jupyter/notebook为例

离线安装docker以及相关应用的保姆级教程

2023-06-05 11:42:23 2444 2

原创 使用windows的python-faiss库报错指南

windows的python-faiss库的常见报错指南,在conda虚拟环境中可以使用该库

2023-02-23 14:01:54 1524

原创 【Python技术难题】Python中准确测量对象占用的内存大小——解决sys.getsizeof测不准和不起作用

在Python中如何准确测量对象占用的内存大小——彻底解决sys.getsizeof测不准和不起作用这一技术难点,这个问题是困扰很多编程新手的问题。

2022-12-29 16:22:09 1080

原创 【算法刷题】1 Python基础篇

第四次开始刷算法题了,第一次是为了考浙大,第二次是为了求职,第三次是为了毕业求职,第四次是为了工作。

2022-11-14 23:33:18 2254 2

原创 【知识图谱项目】0 知识图谱整体架构分析

知识图谱项目框架设计和思考

2022-10-24 11:24:32 746

原创 【实体关系抽取】OneRel和TPLinker两篇方案的不同之处

实体关系一次性抽取论文——《OneRel》和《TPLinker》所采用的方法是不同的,如果真的像OneRel实验部分所表述的那样,那么OneRel是非常有价值的一次探索,它从图嵌入技术中得到启发,改变了边和关系的交互方法,理应效果好一些。但是想使用到工业上的话,还有很长的一段路要走。

2022-10-17 14:29:13 2486

原创 【bug】汇总Elipse项目中代码中文乱码解决方法!

解决eclipse中java允许的中文乱码问题!

2022-08-02 01:26:36 167

原创 NLP应用:情感分析和自然语言推断

重点介绍如何应用 DL表征学习*来解决NLP问题;讨论两种经典的 NLP任务:情感分析(针对单个文本) 和 自然语言推断(针对文本对)

2022-05-06 03:30:30 1698

原创 自然语言处理:预训练

Bert预训练模型的预处理、搭建和训练

2022-04-30 02:15:42 669

原创 词的相似性和词类比任务

使用预训练模型实现词相似度和词类比任务。

2022-04-26 22:17:52 349 1

原创 注意力机制详解(脉络版)

注意力机制详细解读,让你一次性搞懂注意力机制的原理。

2022-04-26 22:00:29 1871

原创 基于CRF的医疗实体识别baseline

基于CRF的医疗实体识别baseline,数据中共包含5种实体:治疗、身体部位、疾病和诊断、症状和体征、检查和检验。可用于多种NLP下游任务。

2022-04-21 16:58:26 2745 7

原创 检索式问答系统baseline

搭建一个基于检索式的简单的问答系统baseline。

2022-04-21 16:49:16 2436

原创 【数学建模】我的数模记忆

我的数模记忆  夜幕暗淡,窗前竟已是点点灯光。在截止日的最后一天,就要毕业的我还是决定来记录一下过去这几年数学建模的点点滴滴。  在2016年春季的一堂高数课下课前,黄老师正鼓励班上所有人都积极参加学院组织的数学建模,依然是用那平和的语调,但却一直令我受到鼓舞,最后他说:“你们的现状是三年前的你们所造就了,如果你们想要三年后不再后悔,那么现在就必须努力学习。”的确,参加数学建模竞赛就是一个很好的开始,从那次报名校赛之后,我便从寻找队友组队、带领团队学习数模知识、共同参与学校培训、督促和鼓舞队友等方面学到

2022-04-21 02:37:00 420

原创 机器翻译baseline

机器翻译baseline

2022-04-21 02:19:55 1913

原创 知识图谱综述(三)

知识图谱综述(三)论文原文链接这部分为数据图(页码4)部分,主要包括了:图结构数据模型的介绍:有向边标签图(多关系图)、异构体、属性图、图数据集、其他图数据模型、图存储;查询(语言):图模式、复杂的图模式、导航图模式、其他特性。下文的每一小点即论文中的一个段落。任何KG的建立都要事先将数据抽象成图模型,本章选取一些在实际中常用的图结构数据模型来表示数据图。然后,我们在图查询语言的基础上,讨论了此类数据图的查询原语。一、图结构数据模型撇开图表不谈,先假设我们所呈现示例中的旅游

2022-04-15 01:18:15 1464

原创 知识图谱综述(二)

这部分为《知识图谱大综述》引言(页码1)部分,主要包括了六点内容:相关工作、KG的概念、KG的应用、本文使用的例子(智利的旅游业)、KG综述文献对比、本文结构。

2022-04-10 18:59:48 753

原创 知识图谱综述(一)

该论文誉为最全、最好的知识图谱(KG)综述论文。这个系列的博客带你一览该论文的所有内容。

2022-04-10 03:45:55 568

原创 解决seq2seq+attention机器翻译中的技术小难题

1 源码首先上源码:https://github.com/keon/seq2seq通常我们使用这个源代码来学习机器翻译的模型架构,但是会遇到诸多小技术问题。2 python -m spacy download en 提示服务器连接一直失败安装不上官方描述的以下命令行是无法使用的,会出现连接不上的错误:python -m spacy download depython -m spacy download en于是乎,需要使用这两个包de_core_news_sm-2.3.0.tar.gz和en

2022-02-26 15:09:50 677

原创 Win10启动VMware虚拟机开机秒蓝屏问题完美解决

大家在工作中都常用到虚拟机,本人也是。但是用了虚拟机工作了一段时间后,经常发现开机秒蓝屏,我遇到过两三次了,网上的教程也是良莠不齐,不能彻底解决这个问题,于是今天打算彻底解决这个问题。不废话,直接上教程。一定要看完,最后一步是关键!1 操作控制面板右键windows图标,点击搜索,搜索“控制面板”,点击右上角的“大图标”或者“小图标”显示,点击“程序和功能”,如下图操作:接下来,按照下图操作。2 操作此电脑的“服务”右键“此电脑”。点击“管理”,按照下图依次操作:然后直接禁用“HV .

2021-11-23 09:52:20 65535 49

原创 win10 + neo4j + jdk 完美安装教程 欲哭无泪贴!!教你彻底卸载老的jdk!

本安装必须按照版本来,否则后果自理!!!!一、安装Java环境1.0 jdk-13.0.2 一定是要这个版本1.1 在系统变量里新建"JAVA_HOME"变量,变量值例如为:C:\Program Files\Java\jdk1.8.0_60(根据自己的jdk的安装路径填写)1.2 在系统变量里新建"classpath"变量,变量值为:.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar (注意最前面有一点)1.3 找到path变量(已存在不用新建)添加变量值:

2021-09-06 21:09:28 2297 2

原创 人这一生啊

Helloworld说:我家庭出身不好,农村娃,拉过犁子,割过麦子那种。 父母在小县城卖点菜。回去就是和他们一起睡,读研之前,基本没有过自己房间,挺苦的,他们文化水平低,也意识不到人个人成长独立性要求。 我吧,我感觉我也一点点争气。农村进县城读初中时候,千人考试考第四,abc仨城市都考上了,去了c,他们卖菜的地方。 中考,abc仨高中都考上了,也去了c。现在知道了a全国排名99,bc全国排名450+。 高中呢,就找不到方向,爸妈给我说多交朋友,我的经验值就在刷社交,然后学习落下了。高考g了,30

2021-09-06 16:51:45 187

原创 通俗解析KMP算法和next函数(小学生都能懂!!!!)

1 目标搞任何算法前我们需要搞清楚目标,我们的目标是:给定一个文本串和一个模式串,从文本串里面找第一次出现的模式串。特别地,找不到就返回-1,模式串为空则返回。例如:kmp(‘aadaadaaf’, ‘aadaaf’) = 32 概念我们学习模式串匹配文本串之前,必须明确几个重要的概念:文本串:一个长字符串,里面可能有模式串,如aadaadaaf。模式串:一个比文本串短的字符串,它可能蕴含在文本串中,如aadaaf。前缀:一个字符串的子串(去除最后一个字符)。如aad的前缀:a,

2021-09-05 18:25:31 535

原创 2021-09-03 爬虫模板(只支持静态页面)

# -*- coding: utf-8 -*-# @Time : 2021/9/3 21:32# @Author : Yj Xue# @FileName: entity_car.py# @Software: PyCharm 2020.2.2 x64# @Blog :https://blog.csdn.net/qq_37150711/category_9396602.htmlfrom requests_html import HTMLSessionfrom requests_ht

2021-09-03 22:26:54 162

原创 python实现打乱文件夹里的文件顺序/文件随机排列

最近因为一些图片文件保持新鲜感(嘻嘻~),所以希望图片能够随机排列,我发现通过window10的文件资源管理器无法实现随机排序,因为几万张图片总有几十张图片的属性是极其相似的。此blog通过python实现图片(或者其他文件)的随机排序,唯一的坏处就是排序后的文件名会被修改。废话不多说,直接上干货,以下是完整可运行代码!但是小伙伴们注意可能需要修改若干个地方!使用方法:创建一个空白的txt文件到image文件夹的同级目录下,重命名该txt文件为“a.txt”,然后将下面代码复制到这个txt文件,再.

2021-08-21 01:45:19 6070 9

原创 win10完美安装cuda11.x + pytorch 1.9 (血流成河贴┭┮﹏┭┮)让你的torch.cuda.is_available()变成True!

当大家有一个小梦想要搞人工智能的时候,甚至要搞深度学习的时候,屁颠屁颠地买重金买来一个N卡的机器之后,却发现你的torch.cuda.is_available()居然是False!顿时泪奔o(╥﹏╥)o,当你忙活大半天之后发现一无所获之后,让你顿时有了砸电脑的想法。对,这篇blog就是来帮你解决这个困惑,让你重拾深度学习的信心与动力!!!0 先看看你的GPU支不支持cuda,一般来说N卡是支持的。0.1 右键任务栏,打开任务管理器,看看自己的卡的型号。0.2 打开N卡官网,滑到官网首页最下面,找.

2021-08-09 07:47:22 5165 7

原创 Python基础综合训练(四)自动发送邮件

废话不多说直接上代码!#!/usr/bin/python3.7# -*- coding: utf-8 -*-# @Time : 2021/7/7 1:08# @Author : Yujie_Xue# @Email : [email protected]# @File : 14.7 发送有附件的邮件.py# @Software: PyCharm 2019.1from smtplib import SMTPfrom email.header import Header

2021-07-07 01:48:05 129

原创 Python基础综合训练三(tkinter牛刀小试)

1 目的了解Python GUI编程;熟悉GUI编程的大致流程;熟悉组件和用户行为交互的方式。2 GUI编码流程基本上使用tkinter来开发GUI应用需要以下5个步骤:导入tkinter模块中我们需要的东西。(导包)创建一个顶层窗口对象并用它来承载整个GUI应用。在顶层窗口对象上添加GUI组件。通过代码将这些GUI组件的功能组织起来。进入主事件循环(main loop)。3 牛刀小试——修改label的内容和颜色***注意confirm_to_quit中需要最后加入“ ex

2021-06-24 18:28:54 712 6

原创 Python基础综合训练二(21点扑克牌大战)

1 游戏规则百度参考21点的游戏规则。2 目的学习类中私有属性构建方法(封装内部属性,只允许外部访问,防止外部篡改值);学习继承父类;学习对抽象类的具体化方法;学习多态的实现方法。3 代码#!/usr/bin/python3.7# -*- coding: utf-8 -*-# @Time : 2021/6/24 15:05# @Author : Yujie_Xue# @Email : [email protected]# @File : 9.5 puk

2021-06-24 16:51:24 499

原创 Python基础综合训练一(杨辉三角的打印)

1 写作动机答案太过于敷衍了事,自己重新编码了一下。2 答案参考代码#!/usr/bin/python3.8# -*- coding: utf-8 -*-# @Time : 2021/6/23 11:24# @Author : Yujie_Xue# @Email : [email protected]# @File : 7.6 yanghui_angle_answer.py# @Software: PyCharm# 答案太垃圾!!根本没有体现出杨辉三角的性质de

2021-06-23 11:34:28 376

原创 Pyqt5 遇到的超级无敌大坑!clicked.connect后面的connect出现下划线 & 计算机积极拒绝问题

1 计算机积极拒绝问题这类问题真的好幼稚,我是没有启动服务器文件,所以这样。。。。还有就是服务器堵塞宕机了;端口被占用,打开cmd,输入netstat -ano, 查看端口是否被占用,总之就是计算机找不到这个ip下的端口服务器。2 clicked.connect后面的connect出现下划线这个问题其实很简单,千万不能把库里面所有的包都导入,否则会有重名包会有冲突,视频教程里面真的是坑!3 总结发现出错的时候觉得非常恼火,本来看起来不应该出错的,结果就发生了,找到原因了,又觉得好

2021-05-16 15:33:46 6959 2

原创 2 构建红楼梦关系图谱

1 导入相关的包import csvimport py2neofrom py2neo import Graph, Node, Relationship, NodeMatcher2 连接neo4j知识图谱数据库g = Graph('http://localhost:7474', user = 'neo4j', password = 'neo4j') # 此处为系统默认的密码3 导入数据并构建知识图谱with open('triples.csv', 'r', encoding='utf-8')

2021-05-14 15:43:05 648 2

原创 1 知识图谱快速入门

0 前言知识图谱属于一种特殊的结构化数据,具有良好的可读性;知识图谱是高效知识检索系统的一部分,摒弃的非结构化数据(如文本)的低效性;知识图谱的数据集来自于非结构化数据,其得益于自然语言处理的一系列流程(如:词性标注,命名实体识别,实体消歧等),自然语言处理之后的非结构化数据可以存放在csv等结构化数据数据库中,常常以三元组的形式存放,还可以存放属性。1 安装JDK方法自行度娘:先在官网下载最新的JDK,然后添加环境变量,最后如果运行不了neo4j的话,就重新安装老版本的JDK。2 下载

2021-05-14 14:48:24 442 1

原创 软考高级《信息系统项目管理师》(简称高项)考证经验(满满的干货)

1 写作动机深夜睡不着,打算写这样一篇文章,纪念这半年以来(2020年5月底-2020年11月07日)考证生涯的我。各位也可以参考本人的考证经历,可供参考。2 考证动机本人大学三年级一次性考过了软考中级《网络工程师》,顺便看完了谢希仁老师的《计算机网络》,盲目地刷完了最近十年的真题,考完感觉很难没有什么胜算,因为配置语句都记不太熟练,纯粹的题海战术。结果是:上午选择题是50,下午案例分析题是51。因此抱着想考一个高级的想法,在研究生阶段想通过这个神秘的高级考试。其实还有一个动机:那就是疫情在家感觉

2021-02-04 04:33:22 21295 39

原创 密码学——保序加密算法(OPE算法-2009年提出)通俗易懂解析(小学生都能懂!)含python代码

保序加密算法(OPE算法-2009年提出)通俗易懂解析(小学生都能懂!)一、 预备知识保序加密算法:最初是由2009年,Boldyreva等四个人提出来的,可简称BCLO-09算法,论文题目为。。。。。。。,请自行搜索并下载,本文直接让你读懂该论文的核心算法。算法目的:简单来说就是本来有顺序的明文,加密之后依然保持顺序,但是除此之外不知道任何信息。简单来说,我要加密2,5,8三个数字,我把它们分别换成45,4424,22224,这样就保证了别人不知道我原来的数字,但是又保持了原来的顺序,但是我们必须

2020-12-17 22:52:20 10857 3

原创 4 复习神经网络——FizzBuzz游戏

1 构建这个游戏标签的一些方法def fizz_buzz_encode(i): if i % 15 == 0: return 3 elif i % 5 == 0: return 2 elif i % 3 == 0: return 1 else: return 0 def fizz_buzz_decode(i, prediction): return [str(i), 'fizz', 'buzz

2020-11-01 18:56:01 269 1

原创 3 神经网络学习——最后两次改进

1 第四次改进——optim更新参数import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npimport pandas as pdimport random, mathimport sklearnimport scipyN, D_in, H, D_out = 64, 1000, 100, 10x = torch.randn(N, D_in)y = torch.randn(N

2020-11-01 14:06:52 171

原创 2 神经网络学习——对numpy手敲神经网络的三次改进

1 第一次改进——修改成torch语法1.1 初始化部分import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npimport pandas as pdimport random, mathimport sklearnimport scipy# 大小定义N, D_in, H, D_out = 64, 1000, 100, 10# 变量初始化x = torch.randn

2020-10-30 17:06:57 117

原创 1 神经网络学习——numpy手敲神经网络

1 初始化定义import numpy as npN, data_in, hidden, data_out = 64, 100, 100, 100epochs = 10002 初始化变量# h = x * w1# h_relu = relu(h)# y_pred = w2 * h_relu x = np.random.randn(N, data_in)y_pred = np.random.randn(N, data_out)w1 = np.random.randn(data_in,

2020-10-30 16:32:55 144

原创 小技巧——利用python实现变量的存和读

我们在运行耗时间的代码的时候经常需要保存变量到本地,以免宕机或者下次使用这些变量。本代码适合字典、列表、字符串# 要存的变量名,要存的文件名字(不用后缀),存(write)还是读(read)def operate_file(file, filename, cmd): if cmd == 'write': f = open(filename+".txt", 'w') f.write(str(file)) f.close() p.

2020-10-20 10:45:59 173 1

所有neo4j-community-3.x老版本下载

由于目前一些公司还在使用neo4j的3.x老版本,而且官网上找不到下载的页面,该资源提供所有neo4j-community-3.x的老版本下载,并且提供两个最重要的neo4j老版本上的插件(apoc和algo)的下载。

2023-02-06

protege 5.5 实现动物animal推理项目,并且带注释

本项目是本体知识库构建项目。在动物本体论中,建立了狮子和食肉动物。通过推理,得出狮子是食肉动物的结论。使用此示例可以简单地了解推理引擎racer的用法。基本项目解释了基本操作方法。如果您不清楚使用protege5.5的基本操作,请先自行学习protege5.5的基本操作。单击此处下载项目,然后单击protege中的Open project打开压缩包包含的owl文件即可使用。

2022-06-29

该软件经过整合,是目前最新的protege5版本,可以让你直接不需要任何jdk,就可以直接运行非常方便。

该软件经过整合,是目前最新的protege5版本,可以让你直接不需要任何jdk,就可以直接运行非常方便。适合学习本体建模和知识图谱的入门人群和研研究人群。

2022-06-20

de_core_news_sm-2.3.0.tar.gz和en_core_web_sm-2.2.5.tar.gz

机器翻译项目中包含了很多spacy的model,可自行选择一个对应的en和de,这里我选的是de_core_news_sm-2.3.0.tar.gz和en_core_web_sm-2.2.5.tar.gz,亲测可用。

2022-02-26

中文同义词近义词数据集.csv

中文数据集,常用词同义词、近义词库,可以提供给你们做词向量的NLP检测标签

2022-01-05

neo4j+jdk套装和教程.zip

适合于那些想要学习知识图谱却不知道如何安装的新手,本教程将解决你的所有困惑!!!!!让你彻底爱上知识图谱!!!!

2021-09-06

朗文词典必要支撑文件.7z

这是朗文第五版词典的支撑文件,这个文件用于电脑版本的词典认证。

2020-08-19

命名实体识别命名实体识别ner_dataset.7z

这个命名实体识别数据集是本人亲自整理的最终大型的数据集,供各位学习投票模型的亲朋好友们使用,本人亲自测试,效果非常好!!!!!!

2020-07-29

情绪识别实战数据集ISEAR.csv

情绪识别数据集汇总,里面是本人亲自汇总的情绪识别的训练数据集,其中第一个是label标签,表示的是情绪,第二个是数据,是句子。

2020-07-19

pycharm中文补丁可打开设置.zip

里面有两个jar,本人亲自研究。pytharm无法打开设置是因为这是以前版本的中文补丁,新版本(19年之后)无法采用,本人亲自设计了这补丁,关闭pycharm,再把这两个jar包放到pycharm的lib目录下重启即可用。本人亲测!!

2020-07-11

历年全国研究生数学建模竞赛赛题合集(04-19年).zip

这个是本人专门整理地最新一期的华为杯全国研究生数学建模竞赛的竞赛赛题,这一切为了备考2020年九月中旬的研究生数学建模竞赛的同学!

2020-07-07

itchat替代品中的msgDB.py

itchat替代品中的msgDB.py,底层通信,封装了函数。非常好用的itchat替代函数库,里面主要实现了通信中的信息处理。这是一个非常关键的脚本文件。

2020-06-04

LADR1007B-win.zip

解压LADR1007B-win.zip,,将解压产生的文件夹LADR1007B-win改名为prover9,并将文件夹prover9移动到C:\nltk_data中即可使用之。这是python自然语言处理第十章的必备包。官方网站已经不提供使用了。

2020-04-24

mqtt_aes.tar.gz

利用C设计mqtt的源代码,然后把AES加密功能与MQTT数据发布与订阅代码结合,实现MQTT消息的加密传输。

2020-04-17

18 深度学习案例——基于卷积神经网络的手写体识别数据集.zip

本人的《十九个小项目》中18 深度学习案例——基于卷积神经网络的手写体识别,所需要训练和验证的数据集。非常适合初学者

2020-04-17

17 机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集

机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集,见本人的这篇博客!!!这个资源是本人搜集的支撑数据包!

2020-04-11

itchat替代品.7z

可以用该程序替代itchat,即不需要uuid而是通过wx电脑客户端即可用该开发接口。该接口可以替代原来已经被限制使用的itchat,wxweb等工具。

2020-03-22

数据结构与算法:Python语言实现课后习题答案PPT等.rar

本资源包括该书的课后习题讲解以及书上的一些源代码,供老师上课的PPT等资源。

2019-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除