- 博客(20)
- 收藏
- 关注
原创 conda安装包的时候遇到的问题,Solving environment: failed with initial frozen solve. Retrying with flexible solve
conda安装包时遇到的问题
2022-12-10 12:17:59 570
原创 其他小问题(3)
1.使用pkg包的时候,一开始环境总是配不好,spacy包存在问题,后面用ython3 -m spacy link en_core_web_sm en解决的2.运行时间超长。
2020-07-02 11:10:22 122 1
原创 几种提取关键词的算法(6)
一篇只讲常用算法以及几个简单的实现------原理https://blog.csdn.net/Sakura55/article/details/85122966具体的算法实现大杂烩:https://github.com/yongzhuo/nlp_xiaojiang/blob/master/FeatureProject/sentence_sim_feature.py(已经把代码复制到 实训下的短文本相似度计算)https://blog.csdn.net/rensihui/article/detail
2020-07-02 10:58:12 380
原创 Bert(7)
计算出句向量再计算相似度只写一下原理最新语言表示学习方法XLNet,在20项任务上超越BERThttps://blog.csdn.net/qq_31456593/article/details/93015488提取关键词之后,嵌入成词向量,然后不是计算jaccard相似度,而是迁入后,计算cos等其他的相似度。...
2020-07-02 10:58:00 238
原创 判断论文对在子空间上的相似度(5)
基本思路:刚开始是通过提取关键词计算jaccard相似度的方法,来得出论文对在子空间上的相似度。关键词是用多种算法提取关键词(候选词)后进行综合而得到的。后面发现使用的方法大多和语义不太相关,所以又打算使用bert进行训练子空间上的句向量,然后不是计算jaccard相似度,而是计算cos等其他的相似度。...
2020-07-02 09:49:05 196
原创 几种常见的提取关键词的算法(4)
有监督的文本关键词提取算法需要高昂的人工成本,因此现有的文本关键词提取主要采用适用性较强的无监督关键词抽取。其文本关键词抽取流程如下:图 1 无监督文本关键词抽取流程图无监督关键词抽取算法可以分为三大类,基于统计特征的关键词抽取、基于词图模型的关键词抽取和基于主题模型的关键词抽取。NO.1、文本关键词提取算法基于统计特征的关键词提取算法基于于统计特征的关键词抽取算法的思想是利用文档中词语的统计信息抽取文档的关键词。通常将文本经过预处理得到候选词语的集合,然后采用特征值量化的方式从候选集合中得到.
2020-07-02 09:00:16 7196
原创 基于jaccard计算论文对的reference相似度的算法(2)
基本实现思路:由于样本数据量较大,后续使用时,每次读取所有的数据(一对一的引用关系),然后计算相似度速度比较慢,所以把数据集进行了整理,以每篇论文的id为key,以引用的论文的id列表为value进行保存,没有把所有的论文对的相似度计算完保存起来,是因为维度比较高,且数据比较稀疏。(注:对称且稀疏矩阵,可以采用压缩存储。)算法:十分简单的杰卡德系数(Jaccard Index),也称Jaccard相似系数(Jaccard similarity coefficient),用于比较有限样本集之间的相似性与差异
2020-07-01 11:44:46 537
原创 vcpkg不用卸载可以直接使用多个版本
一开始下载一个vcpkg出了点问题,后面有重新安装了一个不知道会不会相互影响,所以想要卸载,没有找到卸载的命令,不知道直接删了行不行???后来找到一篇文章,说是互不干扰。https://blog.csdn.net/liudongdong19/article/details/105751263...
2020-06-26 17:00:25 1355
原创 项目实训(1)
第一周的主要工作研究论文并根据reference实现了基于jaccard计算论文对相似度的算法成果论文:我们要实现的算法部分的主要原理:自己的实现:每次输入两个论文的名字,然后通过查询node.list找到相应的id,然后在inlinks.list中找到他引用的所有论文集合,然后计算jaccard相似度。不足之处:在遇到大量的查询两个论文的jaccard相似度时,可能会速度比较慢,想预先计算好相似度,或者保存好每篇论文所以引用的论文集合。python 两个小技巧将字典写入txt或者json 文
2020-06-17 18:37:30 176
原创 SDUer 校外访问知网等一众论文期刊(实际上就是通过图书馆啦)
发现了好多有趣的东西,大三了,菜鸡一只!!!!!!!1.首先登录信息化服务平台2.访问电子图书资源,就进入图书馆了,当然也可以直接进,我只记得信息化服务平台的密码,所以只能靠他了。3.图书馆中的数据库可以进入一个登录的界面(VPN的密码也忘记啦,呜呜呜!!!)4.选择第一个登录的那个,进来之后就是下面的界面了,然后就可以看到一众网站了。。。。知网不必说了ACM好多好多多多多!!!悔之晚矣,呜呜呜!!!...
2020-05-30 18:44:44 406
转载 Git Bash 的使用
1.标题使用Git Bash激活python虚拟环境任意目录,source activate xxx 进入虚拟环境,任意目录,source deactivate 退出虚拟环境2.Git Bash使用详细教程SVN与Git的最主要的区别?SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时候,用的都是自己的电脑,所以首先要从中央服务器哪里得到最新的版本,然后干活,干完后,需要把自己做完的活推送到中央服务器。集中式版本控制系统是必须联网才能工作,如果在局域网还可以,带宽够大,速度够快,
2020-05-23 22:19:09 220
原创 anaconda+pytorch1.5.0+gpu9.2
1.安装好anaconda之后2.新建一个新的环境conda create -n (设置环境名称,如first)python=3.73.然后用pytorch官网上直接生成的安装命令-----去掉 -c -pytorch就会用自己已经设置好的清华源下载。
2020-05-22 18:37:55 485
转载 启动MySQL报错:ERROR 2003 (HY000): Can't connect to MySQL server on 'localhost' (10061)
参考链接:https://blog.csdn.net/BigData_Mining/article/details/88344513
2020-05-13 22:04:17 179
原创 VS2019里新建openGL项目
安装VS community 2019新建C++项目文件-新建-项目-控制台应用-命名(位置)添加 nupengl.core 包点击项目 -> 管理NuGet程序包点击浏览搜索 nupengl点击 nupengl.core ,下载它.查看下方有已完成字样时,关掉NuGet包管理器选项卡.接下来就可以使用了。...
2020-04-30 16:59:52 1617
转载 DEV-c++ 运行窗口闪退
1.在主函数最后一句语句上面加一句getchar();即可2.添加一个<stdlib.h>的头文件,在return 0;的前面,程序即将结束的时候添加一句,system("pause");system("pause") 的意思是调用系统中的命令,或者shell命令也可以。“pause”这个系统命令的功能很简单,就是在命令行上输出一行类似于“Press any k...
2019-02-22 10:34:15 3124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人