自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(141)
  • 资源 (19)
  • 问答 (1)
  • 收藏
  • 关注

原创 交叉熵的理解:理解交叉熵的时候勿引入熵的概念来理解

交叉熵的理解:理解交叉熵的时候勿引入熵的概念来理解结论理解交叉熵的时候勿引入熵的概念来理解原因每当我试图交叉熵的时候,网上找的科普文章都会引入熵的概念,说要从熵的概念入手,然后感觉自己更加迷茫了。然后一堆名词就过来了,如信息量、熵、概率、相对熵、交叉熵等等理解但是其实完全不用管它,不用管熵这个概念,直接损失函数的目的出发。损失函数是寻找预测的标签与真实标签的差异,均方误差(MSE)、均方根误差(RMSE)、MAE(平均绝对误差)都是为了这一个目的。而交叉熵的log,也能实现这一

2021-10-27 13:11:42 372

原创 RTX3060适配的tensorflow

RTX3060适配的tensorflowRTX3060及以上适配的tensorflow适宜人群原因魔改版tensorflowRTX3060及以上适配的tensorflow适宜人群不适用tensorflow2.0以上,只使用tensorflow1.0版本原因RTX3060以上版本最高支持cuda11.4然而实际上只支持cuda11以上;cuda11以上不支持tensorflow<2.0所以,用不了魔改版tensorflow大佬范沅魔改了编译的是nvidia魔改版的tensorflo

2021-10-15 22:42:56 2219 1

原创 深度学习的特征与标签的维度(keras)

@TOC)一、结论Dense层维度要与标签维度一致,根据需要的一致;[1,2,3]对应0与[1,2,3]对应[5,6,8]即可。如文本分类,则标签不需要one-hot,dense层不需要TimeDistributed因为文本分类 train_x(16656, 22) ,使得22个字的评论与标签0或者1,进行匹配,所以标签不需要one-hot,dense层不需要TimeDistributed如中文分词,需要字与标签一一对应,标签one-hot,使得标签升维;TimeDistributed使得x与y维

2021-07-22 16:45:40 4565

原创 appium安装使用问题(二)

appium安装使用问题(二)一、问题Appium安装问题第二步:问题一:第三步:问题二:二、解决方法第一个问题解决方法第二个问题的解决方法三、环境变量配置完整图一、问题Appium安装问题appium绝对不能直接安装,原因下载太慢使用node.js下载要用appium就必须node.js,下载node.js一路next的时候会有一个需要打勾的地方,注意不要打勾,因为这会安装python;当然对于还没有python的可以打勾勾上,如果有的就不要打勾其次,对于不想将npm包安装到系统盘的,需要

2021-07-19 14:50:37 1035

原创 python运行加速的几种方式

python运行加速的几种方式一、总结二、全面加速(pypy)二、减少文件的打开即with的调用三、if判断靠前一、总结1、使用pypy2、减少函数化调用3、减少文件的打开即with的调用,将这一调用放在for循环前面,然后传递至后面需要用到的地方4、if函数判断条件多的尽量在前面全面加速(pypy)二、全面加速(pypy)将python换为pypy,在纯python代码下,pypy的兼容性就不影响使用了,因为一些纯python的代码常常会用pypy进行一下加速测试代码,for循环1000

2021-07-11 22:58:12 3110 3

原创 Keras.Backend的一些理解

Keras.Backend的一些理解(备份)一、理解二、重要的一些backend函数(方法)一、理解我理解的深度学习层级由大到小为:Model>layer>函数,方法形成layer层,layer层形成model,keras.backend即后端,其实就是将深度学习向比layer更小的方法即函数下沉,更能实现灵活性;这里的方法即函数层,其实就是一些基本的数值处理方法,例如求均值的mean、求最大值的max,求点积的dot等,这些方法组合就可以形成一个layer,loss等基本的层。二、重要的

2021-07-10 15:08:14 7672 2

原创 Seq2Seq(keras)的理解:关于encoder_model和decoder_model

Seq2Seq_keras:关于encoder_model和decoder_model一、三个model(一)Seq2Seq之前的keras model:1、创建模型2、模型预测(二)Seq2Seq的keras model二、再次遇见seq2seq难点一:lstm难点二:return_sequences和return_state难点三:三个模型三、seq2seq全部代码一、三个model(一)Seq2Seq之前的keras model:1、创建模型# 多层感知机(MLP)模型from keras.

2021-07-03 09:40:28 1653 2

原创 RNN、self-attention、transform的浅显或许错误的理解

RNN、self-attention、transform的浅显或许错误的理解一、RNN的理解二、self-attention的理解三、Transform的理解四、结语所有的理解都是基于我匮乏的数学知识,当成y = kx+b来理解一、RNN的理解刚开始学的时候看了很多文章,但是感觉都是云里雾里,要么是数学要么是各种没有说明白的图,但是看的多了以后看到《难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)》 《难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)》.之后,有了自己简单但可能错误

2021-06-12 22:32:24 333 3

原创 法律领域中文分词

法律领域中文分词一、结果对比1、jieba的分词效果2、训练模型的分词效果3、自训练模型原因二、自训练模型难点1、专业名词2、姓名隐去3、模糊词语4、解决办法三、自训练模型核心代码一、结果对比1、jieba的分词效果2、训练模型的分词效果3、自训练模型原因如上所述,jieba分词在一般分词中效果还可以,但是在法律领域则不是那么准确,比如下面展示一些 内联代码片。中级 人民法院将中级人民法院拆开了,但是这不进行拆开应该会更好,法言法语中常常并不会“中级–停顿–人民法院,而是中级人民法院

2021-06-12 09:40:28 1064 3

原创 帮师妹写的裁判文书内容提取程序:可做进一步提取模板

帮师妹写的裁判文书内容提取:可做进一步提取模板一、提取结果二、提取内容三、代码一、提取结果二、提取内容 需求内容为:被告、裁判文书案号、时间、地域、刑事强制措施、罪名、刑罚 整体运用的技术:主要采取的是正则匹配,因为裁判文书的这些表述是存在一定的模式的,法言法语的要求是的语言表述一般比较固定;当然在被告名字处正则匹配可能会遗漏,于是通过pyhanlp实体识别进行了进一步的精确化 遇到的一些问题:多主体不同罪名 这一问题主要通过被告名称进行定位,如果名字在该段文字中且存在这一罪名,

2021-02-27 22:10:52 3137 19

原创 Keras 生成器报错:Tensor object has no attrbute ‘assign‘

Tensor has no attrbute assign一、keras生成器重心二、keras生成器三、报错一、keras生成器重心我是在使用keras生成器时出现了这个报错并引发后续一系列报错keras生成器使用的是studyer_domi:《2020-12-11 keras通过model.fit_generator训练模型(节省内存)》链接: [l2020-12-11 keras通过model.fit_generator训练模型(节省内存)(https://blog.csdn.net/qingf

2021-02-02 13:47:24 1207

原创 python+keras汉字单字语音识别

python+keras单字语音识别一、两种思路二、代码更新三、汉字语音识别一、两种思路就当前学习所知,有两种语音识别的思路1、将语音文件提取mfcc,即转为二维张量形式,然后进行dense全连接层叠层训练,当然这个也可以使用传统机器学习方法。转为二维张量格式为:2、将语音文件提取mfcc转为三维张量形式即频谱图,然后进行cnn卷积神经网络训练,看了几个资料,这个似乎准确率更高,但是比较麻烦所以下文采取第一种方式进行尝试频谱图形式为:二、代码更新采取第一种思路的代码为大佬南方朗郎:《p

2021-01-29 22:13:58 1582 4

原创 Keras实现NNLM神经网络语言模型

Keras实现NNLM神经网络语言模型一、NNML的效果二、一些问题三、实现代码及解释四、最终效果一、NNML的效果较为权威的说法为:输入词序列,求出输出值的概率值,表示根据输入预测出下一个词概率。简单的说:预测下一个词实现效果:感觉与索引差不多,唯一不同可能是词向量的存在即索引该词的概率二、一些问题参照的文章为金多:《神经网络语言模型 NNLM (Keras实现)》链接: 神经网络语言模型 NNLM (Keras实现).总裁余(余登武):《NNLM语言模型python实现(例子:基于中文语

2021-01-27 13:57:09 642

原创 关于可视化神经网络中间层的详细说明

关于可视化神经网络中间层的详细说明一、对一些处理的意义的说明二、代码一、对一些处理的意义的说明activation_model = models.Model(inputs=model.input, outputs=layer_outputs)#此处的inputs是之前导入的模型,model = load_model('...(解释:自己的模型)') # 特征图的形状(1,宽,高,n_features)size = layer_activation.shape[1]# n_cols定义一个

2021-01-10 15:04:08 1265

原创 python《深度学习》keras基本理解

python《深度学习》keras初步理解一、Sequential()二、层与神经元一、Sequential()from keras import models#构架模型from keras import layers#神经网络层from keras.datasets import imdb#其中imdb是电影评论数据集,但是被处理过, 已被编码过了,所以只有index,而没有实际内容,需要进行转化model = models.Sequential()#网络结构决定了假设空间,这是线性堆叠方式

2021-01-06 18:17:10 904

原创 python机器学习基础教程第七章Traceback (most recent call last):OSError: [E050] Can‘t find model ‘en‘.

OSError: [E050] Can't find model 'en'.一、问题二、方法三、下载成功一、问题初次导入spacy的英语模型时报错:Traceback (most recent call last):File "... ...", line 12, in <module>en_nlp = spacy.load('en') File "D:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\si

2021-01-03 16:03:28 1417 1

原创 特征工程:交互特征与多项式特征理解

特征工程:交互特征与多项式特征理解一、理解二、测试代码比较一、理解交互特征与多项式特征与数据预处理中的MinMaxScaler是相似的,都是对数据进行缩放处理缩放处理、交互特征与多项式特征都是对原始数据进行缩放,缩放意义在于使得权重与偏置更具有敏感性,更易对数据预测二、测试代码比较from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.pre

2020-12-29 22:53:59 760

原创 python获取2020年国家统计局省市县三级数据

python获取2020年国家统计局省市县三级数据一、数据来源二、获取思路三、完整代码四、成果四、获取地址一、数据来源国家统计局2020年最新的数据二、获取思路寻找url的规律所有省份页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html城市页面:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/11.html失去页面:http://www.s

2020-12-28 12:27:42 2465

原创 人脸识别与天网系统

人脸识别与天网系统一、结果二、识别库三、实现代码一、结果识别对象第一个是名字,第二个是百度上的内容二、识别库face_recognition三、实现代码class Face_recognition():def __init__(self,pic,pics): self.pic = pic self.pics = pics self.name = ""def face_know(self,file): known_image = face_recogni

2020-10-31 21:43:10 2089

原创 裁判文书上诉理由分类统计

裁判文书上诉理由分类统计一、统计结果二、实现方法(一)裁判文书上诉理由提取1、分类标准2、裁判文书内容提取方式3、实现代码4、标签贴好后三、文本分类(一)文本分类源码来源(二)数据结构和修改的地方(三)预测过程四、结语一、统计结果对这12927份裁判文书进行清洗后,有效文书数量约为10858份,有效率约为84%。二、实现方法(一)裁判文书上诉理由提取1、分类标准不认罪、罪名异议、量刑过重,量刑异议、程序瑕疵、其它。这一上诉理由分类的依据为罪名、量刑、程序。即犯罪嫌疑人被告人的上诉理由为一审事

2020-10-31 21:32:04 826

原创 with open() 出现FileNotFoundError: [Errno 2] No such file or directory

@[TOC](with open() 出现FileNotFoundError: [Errno 2] No such file or directory)一、报错with open(output + "doc_to_docx_succuse.txt", "r", encoding="utf-8")as f1:FileNotFoundError: [Errno 2] No such file or directory: 'E:\\Firefox\\docxdoc_to_docx_succuse.txt'

2020-10-24 17:57:20 21518 2

原创 多线程、进程下载视频

多线程、进程下载视频一、结果展示二、使用的工具三、线程进程方法化多进程视频下载一、结果展示二、使用的工具视频下载使用you-get,多线程使用threading、多进程multiprocessing以下为三个库的简介you-get:threading:multiprocessing三、线程进程方法化from concurrent.futures import ThreadPoolExecutor as eimport time,sysfrom multiprocessin

2020-10-22 16:06:13 775

原创 庭审录播爬虫

庭审录播爬虫一、庭审直播网二、爬取对象三、爬取分析(一)视频地址获取(二)视频文件四、 视频下载五、成果六、问题一、庭审直播网二、爬取对象庭审公开网的内容包括直播与录播直播没有办法爬,只能看的时候进行录制所有选定的目标为录播三、爬取分析(一)视频地址获取首先录播视频的加载方式为点击查看更多后进行动态进行新内容的加载加载中url并不变化其中case_list中的就是视频的地址不点击see more不会加载后续内容因而此处使用selenium进行模拟点击(二)视频文件首先通

2020-09-22 15:51:26 3322

原创 爬虫修正:裁判文书网20200901更新增加登录系统

爬虫修正:裁判文书网20200901更新增加登录系统一、登录系统的增加二、增加登录函数三、一个比较纠结的地方一、登录系统的增加导致需要登录,直接是无法进入了。以往可以直接进入具体的类别如现在无法进入,点击该网址,后跳转到登录界面需要通过手机号进行注册后才可以进入二、增加登录函数 def login(self): """登录""" # 切换框架 wait = self.wait self.browser.refresh() frame

2020-09-04 15:31:35 4592 42

原创 text-cnn裁判文书分类

text-cnn裁判文书分类一、数据集二、训练过程三、成果一、数据集使用爬虫获取的26万份裁判文书,可以在链接: 裁判文书.训练模型源自链接: Text Classification with CNN and RNN.二、训练过程一共训练5轮数据格式为目录:标签名,文本为内容写入方法def wenshu_cut(): with open(r"J:\PyCharm项目\github项目\文本分类\罪名分类\罪名分类.json", "r")as f: train_text = {

2020-08-29 22:08:49 3423 18

原创 自动化之追踪热点

自动化之追踪热点一、成果二、主要思路:调api一、成果每天定时,主要是早上8点和晚上10点自动检测桌面的待办任务然后使用图片展示,如:1、桌面待做事项2、微博实时热点3、学术热点追踪二、主要思路:调api方法:这里的微博热点爬虫、以及cnki爬虫都是已经写好的程序,在此只是做了一些改写来符合调用的方式其中微博热点爬虫来自链接: Writeup001.而中国知网主要采取selenium通过手机知网的网址进行爬取用处:就是图片化强制关注,之前一直都在爬取微博热点但是从来没有看过;学

2020-08-25 22:22:31 2378

原创 twine上传的坑:pkg_resources.DistributionNotFound: The ‘docutils>=0.13.1‘ distribution was not found

twine上传的坑:pkg_resources.DistributionNotFound: The 'docutils>=0.13.1' distribution was not found一、制作pypi模块(一)注册pypi账号(二)设置setup.py(三)打包命令二、上传一、制作pypi模块(一)注册pypi账号(二)设置setup.pyfrom setuptools import setup, find_packagessetup(# pip install nnnname

2020-08-23 16:02:23 2479

原创 格式转化工具集之pdfkit错误

格式转化工具集之pdfkit错误: raise IOError("wkhtmltopdf exited with non-zero code {0}. error:\n{1}"一、报错三、解决过程(一)url(二)pdfkit版本(三)契机一、报错代码:OSError: wkhtmltopdf exited with non-zero code 1. error:这是一个不明原因的报错二、解决方法最终发现这源于转换的pdf文件名中不能有特殊字符转换代码:inport pdfkitpdf

2020-08-22 14:55:49 6591

原创 论文自动写作之自动添加参考文献

论文自动写作之自动添加参考文献一、成果展示二、简介三、实现过程(一)mammoth包将docx转为html(二)使用xpath提取(三)python-docx将脚注写入参考文献(四)完整的代码一、成果展示二、简介这是我试图将论文写作进行自动化处理的一个记录,这是开始的第一篇,根据已经写好的脚注进行参考文献的添加,使得自己不用一个一个的复制脚注到参考文献中去。在设想中不仅进行论文格式处理,如参考文献的自动添加、标题与正文字号的批量处理、脚注自动添加等形式上的问题,可能更进一步涉及实质内容例如提供词向量

2020-08-17 17:00:58 2890

原创 python打包apk闪退问题以及美化

python打包apk闪退问题以及美化一、闪退问题(一)闪退原因(二)解决方法(三)修改的地方二、美化问题(一)打包后的图标(二)运行界面三、完整的buildozer.spec文件一、闪退问题(一)闪退原因运行出现错误,可以尝试使用源文件在python环境中运行就会发现其错误(二)解决方法我此处的错误在于缺失了某些包,类似于Plaggable的这篇博客《Buildozer生成的APP闪退+PermissionError故障排除记录》,链接: Buildozer生成的APP闪退+Permiss

2020-08-14 17:13:02 5996

原创 wiki百科词向量训练资料及其模型

wiki百科词向量训练模型一、结果预览二、作用训练过程(一)下载问题解决下载方式一:下载方式二:下载方式三:(二)训练过程的问题一、结果预览目标为求取python相关的内容为:从结果上看,与python相关的内容为java、perl等编程语言二、作用个人简单理解:就是寻找相关的词,如上面的oython是一种编程语言,而perl、java等也是如此,但是又不是近义词,比如bash,bash是linux的命令处理器。扩展用途:通过相关联的词进行分类、推荐(如广告推荐)、比较相似度等等;(个人觉得

2020-08-08 14:24:57 2553

原创 python程序打包资源合集:.py打包.apk

python程序打包:.py打包.apk一、说明二,打包过程一、说明程序打包:python程序打包与kivy关系不大,python程序打包就是类似于利用pyinstaller将python程序打包为windows可执行的程序,即.py转变为.exe.程序制作:.py打包为.apk就是与上述内容一样,而kivy是制作app即.apk的模块,类似于pyqt、tkinter这样的kivy:然而这两者是有关的,即kivy制作的python程序才能够使用上述程序打包为.apk,即一般说的kivy=tki

2020-08-04 15:05:13 7985 3

原创 Django项目部署

Django项目部署一、成果结果二、部署过程(一)项目来源(二)项目修改(三)项目部署路径三、部署成功一、成果结果PC端手机上:二、部署过程(一)项目来源个人博客使用django制作的,原本我是在学习《python编程:从入门到实践》中完整的写完了,准备部署的,但是由于heroku注册的验证码需要搭个梯子,由于找合适的梯子(主要是免费的原因)而放弃了。由于各种原因导致原来写的django被删除了,所以本次的django项目是直接拿的别人的,这个项目来源于Github上的mazixiang,

2020-07-31 09:51:23 2022

原创 texthero的初次使用

texthero的初次使用一、下载一、下载最简单的就是直接pip下载pip install texthero但是有许多依赖库同时在初次使用时还会对一些数据进行下载,注意:对于这些数据的下载是需要挂上vpn的,否者下载不下来二、初次使用基本就是照搬texthero的示例,只是我用中文测试了一下中文测试内容来源:《对话|“我是讽刺那些假大师”,当武术表演遭遇网红行为艺术》澎湃新闻记者 蒲垚磊2020-07-27 15:39 来源:澎湃新闻选中的内容就是测试的内容 """简单的文本清

2020-07-28 14:08:26 2646 1

原创 语音交互程序:语音识别、语音输出、录音计算

语音交互程序预览一、简介二、构成说明(一)语音识别与语音输出(二)命令读取模块三、功能说明四、模块下载五、示例完整版本六、补充:实现交互等待即唤醒预览测试预览,这是完整版本的4倍速度(加速是一件比较麻烦的事,因为moviepy加速时只对视频加速,不对音频加速,因此需要提取无音频的视频进行加速、然后进行音频加速、最后合成) 语音控制程序示例(4倍快速剪辑版) 一、简介语音命令控制即通

2020-07-28 13:51:32 3736

原创 redis:creating server tcp listening socket 127.0.0.1:6379: bind No error

redis:creating server tcp listening socket 127.0.0.1:6379: bind No error一、解决方法二、成功一、解决方法解决链接:链接: ‘redis-server’ 不是内部或外部命令,也不是可运行的程序或批处理文件.按照步骤来一遍redis-clishutdownexitredis-server.exe J:\python_software\redis\redis.windows.conf ps这个redis.windows.co

2020-07-23 14:10:54 2782

原创 moviepy使用教程

moviepy使用教程一、剪辑成果二、遇到问题三、moviepy方法分享一、音频剪辑方法二、视频剪辑方法一、剪辑成果 未来 二、遇到问题尝试使用ffmpeg、moviepy、pydub,其中pydub主要是对音频的处理,moviepy对视频音频处理,ffmpeg视频、音频均可以,只是ffmpeg是命令行,在pycharm用起来不习惯,moviepy和pydub都是基于ffmpeg的p

2020-07-22 17:19:21 8462 1

原创 pandas依据多列数据生成某一列数据-兼pandas数据修改汇总

pandas依据多列数据生成某一列数据一、数据修改二、依据多列数据修改某一列一、数据修改网上pandas的数据修改大多是依据某一列数据进行修改或者生成了,几乎没有找到依据多列数据生成或者修改某一列的依据某一列数据修改某一列数据的方法:方法一:df.loc[df.a>=2,'b'] = 'new_data'来自chenpe32cp:《python pandas如何基于某一列修改某一列的值》,链接: python pandas如何基于某一列修改某一列的值.方法二:df["a"]=df["

2020-07-22 16:44:19 3541

原创 tushare报错之解决(亲测有效):websocket._exceptions,ValueError: No ‘:‘ found when decoding object value

tushare报错:websocket._exceptions,ValueError: No ':' found when decoding object value一、修改后结果二、报错三、成功获取一、修改后结果二、报错第一个报错:websocket._exceptions具体含义是websocket中缺失_exceptions,github上:pip uninstall websockerpip install websocket-client无效准确解决方法:换成1.2.5

2020-07-22 09:25:28 5094 4

原创 庭审各方情绪识别

庭审各方情绪识别caow 法学数据分析 今天一、引言在《有点玄乎!用Python分析《隐秘的角落》里微表情》这篇公众号文章中对《隐秘的角落》里进行了微表情分析。就是这个电视剧: 我一想不是可以用到庭审直播中去吗?于是去找大佬要源码!大佬没有理我,二、源码修改没关系,自己动手丰衣足食(那是不可能滴!!!!!!!!!!!) 在csdn中找到了一个进行了开源的大神的分享《表情识别与性别识别 实时识别模型附源代码 基于python的tensorflow与keras》愉快的下载下来

2020-07-19 14:19:48 2088

tensorflow1.15-whl-and-cpp-api-for-win-and-rtx3090-main.7z

适合rtx3060以上需要tensorflow1.0版本的人群,这是tensorflow1.15

2021-10-15

keras深度学习实战.7z

keras深度学习实战开源代码,感觉比较有用的是最用一张的非线性模型构建方式

2021-06-25

深度学习与围棋的源码.7z

深度学习与围棋开放代码

2021-06-25

law_profession.txt

法律分词库,主要是针对搜狗词库中较新的词库进行了整合,并添加了人名以及裁判文书中针对人名所作的隐私屏蔽。如王某之类的表述。

2021-06-17

数据库_权利告知相关law.model

权利告知主题词向量,主要通过规范性文件中的相应有关权利告知的法律文本进行word2vec词向量训练后的模型。

2021-05-01

研究资料xscpws.7z

已经进行docx处理,大致在16万份左右,可以直接用于后续研究。

2021-04-30

自然语言处理实战的源代码+数据集+引用PDF文件.7z

自然语言处理实战的源代码+数据集+引用PDF文件;适用于学习《自然语言处理实战》

2021-04-30

裁判文书提取import的一些文件

裁判文书提取import的一些文件

2021-03-21

自然语言处理,深度学习 代码

围绕自然语言处理和时序数据处理,介绍中的重要技术,包括word2vec、RNN、LSTM、GRU、seq2seq 和Attention 等。语言平实,结合大量示意图和Python代码,按照“提出问题”“思考解决问题的新方法”“加以改善”的流程,基于解决自然语言处理相关的各种问题,使读者在此过程中更深入地理解中的重要技术。

2020-11-14

中国裁判文书爬虫修正之登录函数.py

对之前下载selenium中国裁判文书网爬虫.zip的一个修正补充,需要将之前的爬虫函数变成类,然后加入这个登录函数即可

2020-09-04

speak_command-0.1.0-py3-none-any.whl

语音命令控制即通过语音实现对于相应任务的完成,此API接口主要实现语音交互式输出,即在语音提示下完成任务所需的人工信息;简单的说就是语音转文本;但是又不止于语音转文本,该模块包括了语音识别即语音转文本、语音输出即文本转语音以及录音判断功能

2020-08-02

speak_command-0.1.0.tar.gz

语音交互、语音命令控制即通过语音实现对于相应任务的完成,此API接口主要实现语音交互式输出,即在语音提示下完成任务所需的人工信息;简单的说就是语音转文本;但是又不止于语音转文本,该模块包括了语音识别即语音转文本、语音输出即文本转语音以及录音判断功能

2020-08-02

selenium中国裁判文书网爬虫.zip

使用selenium的裁判文书网爬虫,需要传入的参数在py文件中有说明,同时需要更改txt文件的路径,cb那个exe据说可以加速火狐浏览器,用过没有什么感觉,可能有! 如果没有积分的可以私信我

2020-06-29

固态硬盘管理工具.exe

ssd fresh是专为SSD固态硬盘提供的一款专业强大的优化工具,致力帮助用户延长SSD的使用寿命。在该软件中可随时随地的进行预览SSD的状态、动态分析、性能优化等功能,同时在对ssd的性能优化支持用户自定义设置索引功能、装置最佳化、时间戳记、休眠、索引碎片整理、AHCI设定等操作的开启和关闭,有效的帮助用户从SSD驱动器中获得更高的速度,减少了读取和写入操作的次数,更好的确保它们的使用寿命更长。新版本的ssd fresh 2020还专门对Windows 10用户们进行了优化,更好的支持Windows 10的操作系统,帮助更多的用户加强驱动器的使用寿命,并提高系统性能

2020-05-11

DirectX_Repair_win8_win10(c++).exe

DirectX修复工具是一款专用于修复系统异常的工具,DirectX修复工具还是一款使用简单易上手操作且绿色、可免安装的修复工具。使用DirectX修复工具可自动更新C++组件且完美修复0xc000007b问题异常。如果你的电脑出现了DirectX的异常问题,可直接下载DirectX修复工具进行修复解决。

2020-05-11

Win64OpenSSL-1_0_2u(win10可用).exe

OpenSSL 是一个安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能及SSL协议,并提供丰富的应用程序供测试或其它目的使用。 OpenSSL被曝出现严重安全漏洞后,发现多数通过SSL协议加密的网站使用名为OpenSSL的开源软件包。OpenSSL漏洞不仅影响以https开头的网站,黑客还可利用此漏洞直接对个人电脑发起"心脏出血"(Heartbleed)攻击。据分析,Windows上有大量软件使用了存在漏洞的OpenSSL代码库,可能被黑客攻击抓取用户电脑上的内存数据

2020-05-11

LaoMaoTao(+系统).exe

前期准备   1、准备一个4G以上的U盘   2、备份U盘重要文件,制作过程中会格式化U盘。   PS:本软件涉及对可移动磁盘的读写操作,部分杀毒软件和安全类软件会导致制作失败,运行程序前请关闭相关软件! 第一步 下载老毛桃u盘启动盘制作工具,下载完成后,如图是老毛桃的运行程序。 第二步 插入U盘后,双击打开老毛桃U盘制作工具,会出现如图所示U盘winpe系统制作界面。 第三步 选择普通模式选项卡,“请选择”中选择自身U盘设备名称(一般会自动识别)。模式选择USB—HDD,格式选择“NTFS” 第四步 点击“一键制作成USB启动盘”按钮,开始制作U盘winpe系统,过程中会格式化U盘上的数据,制作前请确认U盘是否已做好备份。 第五步 开始制作后软件下方会有进度条提醒,请耐心等待。 第六步 制作完成后,程序会提示您已制作成功,您可以选择模拟启动测试,若能够进入老毛桃winpe主菜单,即表示老毛桃U盘启动盘制作成功。

2020-05-09

feiniaokc_v2.4_from1.apk

飞鸟快传,国内首款“无广告”文件传输工具,秒杀蓝牙,极速实现数据传输及大文件传输,是手机必备传输神器!真正实现无需联网,即可跨平台与好友极速快传,分享手机中的应用、音乐、视频、照片以及其他格式文件。 传输0流量,无需网络面对面手机快传,支持多平台海量数据传输!相较于茄子快传、快牙、闪传、飞鸽传书等文件传输工具,飞鸟快传真正实现无广告快传,成为海内外上千万用户专属文件传输必备神器! 此外,飞鸟快传设有独立保险箱,帮您轻松应对隐私问题!通过设置照片锁,对手机相册中的照片、视频进行隐身加密,隐私照片不担心暴露,加密相册一键解决! 为什么选择飞鸟快传? 【零流量】无需联网,免费极速文件传输,超实用同步助手,您身边的无线伴侣; 【极速传】极速瞬间闪传,传输速度是蓝牙的150倍,1分钟可传200张无压缩照片、80首MP3、3部高清电影或5款重度手游; 【保险箱】通过设置独立密码,隐秘相册即刻诞生,手机相册加密让您永无后顾之忧! 【双平台】支持多平台互传,无需蓝牙配对,即刻开始文件传输。

2020-04-29

CSVEditorPro(精简).zip

CSV其实就是COMMA SEPARATED VALUE的缩写,出现在档案总管中的档案类型是「逗号分格」,依计算机原来的设定,如果直接点选该档案,计算机将以EXCEL的模式开启该档案。但建议您千万不要这么做,因为CSV档如果以EXCEL开启,由于计算机档案数据转换的原因,会将其CRC之数值改做科学记号方式储存,而造成档案中的CRC值发生错误。这也是小编初出茅庐时所得到的惨痛经验,小编建议您使用我们提供给你的这款CSV专用阅读器(CSV Reader)。WORDPAD或是记事本(NOTE也能开启,再则先另存新档后用EXCEL开启,也是方法之一。?

2020-04-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除