自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 深度学习课程笔记》资料分享

《深度学习课程笔记》资料分享百度网盘下载地址:https://pan.baidu.com/s/1L6ZoBAqSyr9e1m_aibd5pg提取码:jmus小松鼠分享的这本电子书名字为深度学习课程笔记,该资料是针对吴恩达老师深度学习课程(deeplearn...

2019-09-01 13:50:55 501 1

原创 《keras中文文档》资料分享

《keras中文文档》资料分享小松鼠分享的这本电子书名字为keras中文文档, 该资料是针对keras-cn网站的在线版教材,将其制作为PDF版本以供离线学习使用。百度网盘下载地址:https://pan.baidu.com/s/1uNnTW_Ds0...

2019-09-01 13:41:33 1157 2

原创 处理海量数据思想准备

一、分而治之          对于上亿数据的排序,可以先依次读取10000个数据,将其排好序后,写入对应的文件,而后,只需将每个小文件的最小值进行比较,就能将上亿数据完成排序。...

2018-10-04 17:06:20 236

原创 scrapy从数据获取到数据入库(有小技巧哟!)

抓取目标网址:https://www.cn357.com/notice_300;https://www.cn357.com/notice_191由于该网站没有设置反爬,所以直接干!需要抓取的数据:以上是车辆信息列表接下来是车辆详细信息:抓取的信息包括所有车辆的详细信息和车辆的图片。首先,建立好工程:接下来我们在items里写好需要的数据项:impo...

2018-09-26 18:04:51 2761

原创 Python向数据库导入文本避免单双引号问题

调用pymysql.escape_string('向数据库插入的数据')

2018-09-21 17:29:48 1309

原创 尝试破解js加密

参考文章:Python爬虫之找出网页中加密内容的(入门篇)       小编一直在写爬虫,可是写久了之后,发现自己涉及的网站类型不够丰富,很少涉及到数据有加密类型的!所以今天就跟随大佬尝试破解一波js加密。       目标网站:谷歌学术镜像       获取目标:       按照惯例,第一步:查看该url是否在网页源代码里;第二步:如果没在网页源代码里,查看是否为ajax请...

2018-08-17 19:28:17 18853 9

原创 numpy 切片心得

对于一个二维矩阵,从中取出一个二维数组a[1:4,2:4]其中1:4代表从二维矩阵中取出1至3行2:4代表从二维矩阵中取出2至3列a[::2,::2]即对于二维矩阵行而言,步长为2对于二维矩阵列而言,步长也为2np.amax(score,axis=0)求每列的最大值axis的值为0,1,2...从矩阵的最内部不断向外增大。np.amin(array,axis=0...

2018-07-20 19:07:23 460 1

原创 对京东电子商品做词云

import jiebaimport jieba.posseg as psegfrom wordcloud import WordCloud,ImageColorGenerator,STOPWORDSimport matplotlib.pyplot as pltfrom PIL import Imagefrom scipy.misc import imreadimport numpy...

2018-05-31 16:37:53 246

原创 Xpath学习之路!

近期为了学习scrapy,回头来在W3C上学习Xpath。我会不断在自己博客上总结知识点,并附带自己的理解。首先,小松鼠也是刚起步,有些理解不到位的地方,请各位大佬多多指教。最开始在网上跟着大佬的博客试了试scrapy框架,那是对xpath的理解是:就像正则表达式一样,是一种对数据清洗的语言。我们来看看官方的定义:XPath 使用路径表达式在 XML 文档中进行导航XPath 包含一个标准函数库X...

2018-03-21 17:23:12 202

原创 对Python的if __name =="__main__"一些理解

早上起床后,看到公众号:Python那些事对if __name=="__main__"的一些讲解后,产生了一些自己的理解。首先。if __name =="__main__":这是一个判断句,即判断__name__和__main__是否相等。那么相等是什么情况,不相等又是什么情况呢?不急,看小松鼠慢慢道来。先看看这段代码,我们将次断代码的文件命名为song.py:print("这是模块外的输出")...

2018-03-18 11:10:03 169

原创 对Python装饰器的个人理解

在看了公众号Python那些事对装饰器的解释后,有了一些自己的理解。首先,装饰器的的返回值是接力棒。被当做参数的函数作为返回值返回到装饰器的内部函数,然后装饰器返回值是内部函数,即最终装饰器的返回值是当做参数的函数。装饰器的作用:由于在装饰器内部定义了新函数并且装饰器并不会改变作为参数的函数,即就可以在内部函数中添加一些新功能(这一点可以详细看公众号),最终实现在不改变原函数的前提下,提升原函数的...

2018-03-07 23:33:46 201

原创 Python的__new__与__init__区别

__new__:在创建对象时调用,会返回当前对象的一个实例__init__:在创建对象完成后调用,对当前对象的一些实例进行初始化,无返回值。如果在同一个类中,两者同时纯在,那么会优先调用__new__,也就是说,__new__的优先级高于__init__。前者有返回值,后者没有返回值。...

2018-03-06 19:20:56 140

原创 python的浅拷贝与深拷贝

python的浅拷贝没有拷贝子对象,子对象改变,拷贝的对象也会改变。而深拷贝是无论原对象怎么改变,深拷贝的对象始终不变。import copya = [1,2,3,["a","s","d"]]c = copy.copy(a)d = copy.deepcopy(a)print("浅拷贝对象、深拷贝对象与原对象比较")print(a)print(c)print(d)print("改变原对象后,对比原对...

2018-03-06 18:53:58 135

原创 python可变数据类型与不可变数据类型

Python的可变数据类型有列表和字典,不可变数据类型有整型(int),浮点型(float),字符串型(String)和元组型(tuple).不可变数据类型的不可变指的是变量引用的地址处的值是不可变的。例如int类型,改变该类型变量的值,实际是改变了该变量引用的地址值,即改变了该变量引用的队像,并没有改变之前引用的队像的值。不可变数据类型的优点是,不管内存中有多少个引用,相同的对象只占用一块内存;...

2018-03-06 18:38:12 2237

原创 Python的matplotlib库学习笔记第一篇

各位大佬,小松鼠有什么不对的地方,请大家赐教。matplotlib.pyplot是绘制各类可视化图形的命令字库,相当于Matplotlib库的快捷方式导入:import matplotlib.pyplot as pltply.plot(x,y,format_string,**kwargs)函数用于绘制二维的曲线图x,y:分别代表x,y轴,数值可以为列表或者数组,x可选,即当

2017-11-21 20:51:12 517

原创 numpy数据相关函数总结

存入文件:1、np.savetxt(frame,array,fmt='%.18e',delimiter = None)frame : 文件,字符串或者产生器,可以使.gz或者.bz2的压缩文件array:存入文件的数组fmt:写入文件的格式,比如:%d,%.2f等delimiter:分割字符串,默认是空格np.savetxt只能有效存一维和二维数组2、np.ar

2017-11-21 14:14:49 2409

原创 pyhton3去除文本中的换行符

with codecs.open("文件路径+文件名.txt","r",'utf-8') as f:i = f.readlines()for k in range(0,len(i),2):print(i[k].rstrip("\n"),end = "")其中0,2,4等下标是文本中换行符在i中的位置。之所以用codecs.open打开文件,是为了避免文档的编码问题。

2017-11-16 17:08:46 3410

原创 pymysql.connect()参数说明

pymysql.Connect()参数说明host(str): MySQL服务器地址port(int): MySQL服务器端口号user(str): 用户名passwd(str): 密码db(str): 数据库名称charset(str): 连接编码connection对象支持的方法cursor() 使用该连接创

2017-11-06 22:04:33 44580

原创 python3爬取淘女郎图片

python爬取淘女郎图片

2017-10-15 14:48:29 1036

python爬取淘女郎图片

该代码通过pyhton3实现对淘女郎的爬取,里面运用了requests,json,re,os库。最后在本地电脑上保存图片,每个相册里的图片对应一个相册文件夹。

2017-10-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除