自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (5)
  • 收藏
  • 关注

原创 JS实现简单的网页文本转语音阅读

SpeechSynthesisUtterance主要用来构建语音合成实例,speechSynthesis大概用来触发浏览器语音模块,让浏览器把内容读出来。SpeechSynthesisUtterance实例有以下属性,可以通过设置一下属性调整发音。text – 要合成的文字内容,字符串。 lang – 使用的语言,字符串, 例如:"zh-cn" voiceURI – 指定希望使用的声音...

2020-05-01 08:21:08 2777

原创 python math库记录

导入mathimport math常用常数>>> math.pi3.141592653589793>>> math.e2.718281828459045幂函数和对数函数math.pow(x,y)返回x的y次幂>>> math.pow(2,4)16.0>>> math.pow(4,1/2)...

2020-04-29 12:41:29 232

原创 spark ansj中文分词

基于java的中文分词工具ansj,提供了多种模式,而ansj的一个优势是可以能够添加用户自定义辞典import org.ansj.splitWord.analysis._import org.ansj.recognition.impl.StopRecognitionimport org.ansj.library.DicLibrary第一个是导入ansj分词库;第二个导入停用...

2019-10-24 12:52:46 433

原创 python爬虫url出现中文

很多网页的url都会出现中文,这时如果直接使用该url,会出现错误web=urlopen("https://baike.baidu.com/item/蒙奇·D·路飞/726966?fromtitle=蒙奇·D·路飞&fromid=1347493")soup=bs(web,"lxml")print(soup)UnicodeEncodeError: 'ascii' codec ...

2019-09-09 11:39:47 730

原创 python中正则表达式的使用

正则表达式语法构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。1、非打印字符\f 匹配一个换页符。 \n...

2019-09-08 22:33:15 919

转载 Beautifulsoup常见用法

序号 解析库 使用方法 优势 劣势 1 Python标准库 BeautifulSoup(html,’html.parser’) Python内置标准库;执行速度快 容错能力较差 2 lxml HTML解析库 BeautifulSoup(html,’lxml’) 速度快;容错能力强 需要安装,需要C语言库 3 ...

2019-09-01 15:52:03 354

原创 使用requests和BeautifulSoup解析网页,中文出现乱码

import requests as refrom bs4 import BeautifulSoup as bsweb=re.get("http://www.xbiquge.la/13/13959/")soup=bs(web.text,"lxml")print(soup.title)使用上述代码时,中文标题出现乱码"D:\Program Files\Python\python...

2019-09-01 14:29:53 1497 1

原创 MySQL设置自增长:auto_increment

在学习爬虫时,需要将爬到的数据导入到数据库中,通过自增长给数据编号,这是我创建的表create table news(id int(3)primary key auto_increment,newsurl varchar(50) ,title varchar(50),newsfrom varchar(50),newsdate varchar(50),contents varchar(2000...

2019-04-18 22:33:13 699

原创 python导入WordCloud错误

刚开始接触python词云图,导入第三方库worldcloud出现错误,网上的解决方法很多,对我最有效的就是更改文件名,似乎是不能用第三方库名给自己的python文件命名import matplotlib.pyplot as pltimport jiebafrom wordcloud import WordCloud提示错误ImportError: cannot import ...

2019-04-05 12:35:59 2358 3

英文停用词,适用于分词、nlp等

适用于分词、nlp等过程的英文停用词。

2020-04-01

中文停用词,适用分词、nlp等过程

分词、自然语言处理中用的中文停用词。

2020-04-01

numpy-1.18.1+mkl-cp37-cp37m-win_amd64.zip

安装scipy、gensim库的必备库,我试验了很多次,最后是和gensim-3.8.1-cp37-cp37m-win_amd64.whl、scipy-1.4.1-cp37-cp37m-win_amd64.whl这两个版本配合才安装成功的。

2020-04-01

JAVA_API_1.8帮助文档google翻译

Java1.8的中文版帮助文档,google翻译,非人工翻译 Java1.8的中文版帮助文档,google翻译,非人工翻译

2020-02-05

Java1.8帮助文档中文版

Java1.8的中文版帮助文档,百度翻译,非人工翻译 Java1.8的中文版帮助文档,百度翻译,非人工翻译

2020-02-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除