自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 JAVA-使用前缀树(Tire树)实现敏感词过滤、词典搜索

简介有时候需要对用户输入的内容进行敏感词过滤,或者实现查找文本中出现的词典中的词,用遍历的方式进行替换或者查找效率非常低,这里提供一个基于Trie树的方式,进行关键词的查找与过滤,在词典比较大的情况下效率非常高。Trie树Trie树,又叫前缀树,多说无益,直接看图就明白了词典:[“猪狗”, “小狗”, “小猫”, “小猪”, “小屁孩”, “垃圾”, “狗东西”]Tire数据结构:余弦相似度private static double getSimilarity(String doc1, Str

2020-10-21 09:46:37 1476

原创 命令行版今日头条——上班“摸鱼”的好帮手

简介上班无聊怎么办?想刷新闻怎么办?怕被发现怎么办?命令行版今日头条帮你忙,摸鱼神器~喜欢请帮忙点下star项目说明项目地址功能:支持今日头条推荐入口的新闻支持新闻溯源单条标题显示,感兴趣的可以查看新闻内容操作说明方向键控制:下键切换新闻,左键查看内容,右键溯源下载地址下载地址...

2019-11-21 19:00:24 989

原创 JAVA 别再问为什么CPU占用率100%

简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,开发完成之后,发布到服务器上发现CPU占用一直是100%,糟了,多半是死循环的感觉。排查步骤1. 查看服务PIDjps服务kg_deep_tuple_extraction.jar是我们的服务,PID为316602. 使用top -p查看资...

2019-10-21 17:09:07 738

原创 tensorflow1.14-libtensorflow_framework.so.1 cannot open shared object file no such file or directory

简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,前不久我们开始使用tensorflow1.14,Estimator真香。所以对应Java这边也需要使用tf1.14导入graph,这里就来说说官方jar包的问题。报错Windows下无异常,Linux下服务启动时报:libtensorflow_fr...

2019-09-25 16:42:43 6754 54

原创 JAVA-简单实现文本相似度计算-余弦相似度

简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发。手上是一个消息监控的项目,需要实时把爬虫组爬到的新闻经过处理入库。今天来了个需求,需要对新闻做一个去重的处理,减少类似新闻的出现。我理性分析一波,应该就是要计算一下文本的相似度嗯嗯。。。那该怎么做呢。。。计算文本相似度方法文本的相似度计算方法可以分为两大类:基于深度学习的方法和基于非深度学习的方法。虽然小的我在自然语言处理与交...

2019-07-25 15:51:42 6324

原创 JAVA-SpringBoot+JPA+Druid多数据源配置完全版+有坑提示

SpringBoot+JPA+Druid多数据源配置完全版+有坑提示简介多数据配置需要注意的点(坑)体会参考简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,手头上的项目(crud项目)本来是只连Mysql,现新增了功能需要连Postgre,于是哼哧哼哧开始了JPA的多数据源配置。经历一番轰轰烈烈的搜索,找了好几个多数据源的配置教程,就开始了我的模仿表演。没想到一步一个坑,经过几...

2019-07-25 11:15:40 4317

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除