自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (3)
  • 收藏
  • 关注

原创 网易云音乐上的所有!全部!随便爬!(Python爬虫&基于网易云音乐评论的用户推荐系统)

申明:本文纯属原创,有参考的地方都会在文中给出链接。如有转载,需征求本人同意。一、目标网站介绍网易云音乐是一款由网易开发的音乐产品,是网易杭州研究院的成果,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以歌单、DJ节目、社交、地理位置为核心要素,主打发现和分享。2017年11月17日,网易云用户突破4亿。知乎上有这样一个问题:你为什...

2019-02-01 21:30:45 9307 3

原创 斯坦福CS231n李飞飞计算机视觉

一 神经网络一、线性分类图像在计算机的样子:一张图片被表示成三维数组的形式,每个像素的值从0到255例如:3001003

2019-05-06 19:28:49 568

原创 Python高级变量类型

学习笔记目标列表元组字典字符串公共方法变量高级知识点回顾Python 中数据类型可以分为 数字型 和 非数字型数字型整型 (int)浮点型(float)布尔型(bool)真 True 非 0 数 —— 非零即真假 False 0复数型 (complex)主要用于科学计算,例如:平面场问题、波动问题、电感电容等问题非数字型...

2019-04-23 21:35:09 218 1

原创 Python函数进阶

学习笔记目标函数参数和返回值的作用函数的返回值 进阶函数的参数 进阶递归函数01. 函数参数和返回值的作用函数根据 有没有参数 以及 有没有返回值,可以 相互组合,一共有 4 种 组合形式无参数,无返回值无参数,有返回值有参数,无返回值有参数,有返回值定义函数时,是否接收参数,或者是否返回结果,是根据 实际的功能需求 来决定的!如果函数 内部处理的数据...

2019-04-23 21:34:33 196

原创 Python变量进阶

学习笔记目标变量的引用可变和不可变类型局部变量和全局变量01. 变量的引用变量 和 数据 都是保存在 内存 中的在 Python 中 函数 的 参数传递 以及 返回值 都是靠 引用 传递的1.1 引用的概念在 Python 中变量 和 数据 是分开存储的数据 保存在内存中的一个位置变量 中保存着数据在内存中的地址变量 中 记录数据的地址,就叫做 引用使...

2019-04-23 21:34:08 143

原创 Python基础综合应用 —— 名片管理系统

学习笔记目标综合应用已经学习过的知识点:变量流程控制函数模块开发 名片管理系统系统需求程序启动,显示名片管理系统欢迎界面,并显示功能菜单**************************************************欢迎使用【名片管理系统】V1.01. 新建名片2. 显示全部3. 查询名片0. 退出系统**********...

2019-04-23 21:33:35 179

原创 Python函数基础

学习笔记目标函数的快速体验函数的基本使用函数的参数函数的返回值函数的嵌套调用在模块中定义函数01. 函数的快速体验1.1 快速体验所谓函数,就是把 具有独立功能的代码块 组织为一个小模块,在需要的时候 调用函数的使用包含两个步骤:定义函数 —— 封装 独立的功能调用函数 —— 享受 封装 的成果函数的作用,在开发程序时,使用函数可以提高编写的效率以及代码...

2019-04-23 21:32:51 240

原创 Python循环

学习笔记目标程序的三大流程while 循环基本使用break 和 continuewhile 循环嵌套01. 程序的三大流程在程序开发中,一共有三种流程方式:顺序 —— 从上向下,顺序执行代码分支 —— 根据条件判断,决定执行代码的 分支循环 —— 让 特定代码 重复 执行02. while 循环基本使用循环的作用就是让 指定的代码 重复的执行...

2019-04-23 21:32:22 131

原创 Python运算符

学习笔记目标算数运算符比较(关系)运算符逻辑运算符赋值运算符运算符的优先级数学符号表链接:https://zh.wikipedia.org/wiki/数学符号表01. 算数运算符是完成基本的算术运算使用的符号,用来处理四则运算运算符描述实例+加10 + 20 = 30-减10 - 20 = -10*乘10 * 20 = ...

2019-04-22 20:46:17 119

原创 Python判断(if)语句

学习笔记目标开发中的应用场景if 语句体验if 语句进阶综合应用01. 开发中的应用场景生活中的判断几乎是无所不在的,我们每天都在做各种各样的选择,如果这样?如果那样?……程序中的判断if 今天发工资: 先还信用卡的钱 if 有剩余: 又可以happy了,O(∩_∩)O哈哈~ else: 噢,no。。...

2019-04-22 20:43:51 292

原创 Python变量的命名

学习笔记目标标识符和关键字变量的命名规则0.1 标识符和关键字1.1 标识符标示符就是程序员定义的 变量名、函数名名字 需要有 见名知义 的效果,见下图:标示符可以由 字母、下划线 和 数字 组成不能以数字开头不能与关键字重名思考:下面的标示符哪些是正确的,哪些不正确为什么?fromNo12from#12my_Booleanmy-BooleanOb...

2019-04-22 20:38:09 145

原创 Python程序执行原理(科普)

学习笔记目标计算机中的 三大件程序执行的原理程序的作用01. 计算机中的三大件计算机中包含有较多的硬件,但是一个程序要运行,有 三个 核心的硬件,分别是:CPU中央处理器,是一块超大规模的集成电路负责 处理数据/计算内存临时 存储数据(断电之后,数据会消失)速度快空间小(单位价格高)硬盘永久 存储数据速度慢空间大(单位价格低)...

2019-04-22 20:24:23 261

原创 Python注释

学习笔记目标注释的作用单行注释(行注释)多行注释(块注释)01. 注释的作用使用用自己熟悉的语言,在程序中对某些代码进行标注说明,增强程序的可读性02. 单行注释(行注释)以 # 开头,# 右边的所有东西都被当做说明文字,而不是真正要执行的程序,只起到辅助说明作用示例代码如下:# 这是第一个单行注释print("hello python")为了...

2019-04-22 20:20:21 1452

原创 PyCharm 的初始设置

PyCharm 的初始设置学习笔记目标恢复 PyCharm 的初始设置第一次启动 PyCharm新建一个 Python 项目设置 PyCharm 的字体显示PyCharm 的升级以及其他PyCharm 的官方网站地址是:https://www.jetbrains.com/pycharm/01. 恢复 PyCharm 的初始设置PyCharm 的 配置信息 是保存在 用户...

2019-04-22 20:02:09 1132

原创 第一个 Python 程序

第一个 Python 程序目标第一个 HelloPython 程序Python 2.x 与 3​​.x 版本简介执行 Python 程序的三种方式解释器 —— python / python3交互式 —— ipython集成开发环境 —— PyCharm01. 第一个 HelloPython 程序1.1 Python 源程序的基本概念Python 源程序就是一个特殊...

2019-04-22 20:00:57 193

原创 认识 Python

学习笔记认识 Python人生苦短,我用 Python —— Life is short, you need Python目标Python 的起源为什么要用 Python?Python 的特点Python 的优缺点01. Python 的起源Python 的创始人为吉多·范罗苏姆(Guido van Rossum)1989 年的圣诞节期间,吉多·范罗苏姆...

2019-04-22 19:58:15 186

原创 Python网络爬虫之数据存储

一、JSON简介什么是json?JSON(JavaScipt Object Notation,JS对象标记)是一种轻量级的数据交互格式。它基于ECMAScript(w3c指定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言,易于人阅读和编写,同时容易于机器解析和生成,并有效地提升网络传输效率。更多解释请见百度百科...

2019-04-22 13:21:40 628

原创 Python网络爬虫之数据解析(二)

八、正则表达式解析HTML网页8.18.2九、【实战】正则表达式之古诗文爬虫

2019-03-31 22:34:32 765

原创 Python网络爬虫之数据解析(一)

Note一、Xpath简介及工具安装1.1 简介XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。细节可以参考W3School官方文档:http://www.w3school.com.cn/xpath/index.aspXPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着...

2019-03-23 16:49:01 2761

原创 教女朋友学时间序列

时间序列时间戳(timestamp)固定周期(period)时间间隔(interval)一、创建时间序列1.1 date_range可以指定开始时间与周期H:小时D:天M:月import pandas as pdimport numpy as np从2016-07-01开始,周期为10,间隔为3天,生成的时间序列为下:rng = pd.date_range(...

2019-03-10 13:47:26 8646 3

原创 3分钟下载好网易云付费音乐

下载网易云付费音乐无需编程,三分钟下载好你想听的付费音乐,比如下载李荣浩的《不将就》:第一步:打开网址:不将就第二步:按直接按F12快捷键,如下图 。点击控制台的Network,r然后点播放音乐,可以看到很多文件跳出来,我们可以看到一个media或者.mp3为后缀的文件,那个就是你现在播放的音乐文件。第三步:转到标红的url,会跳出这样一个播放界面,可以直接听,也可以下...

2019-03-01 20:38:58 2275

原创 教女朋友学数据挖掘——泰坦尼克号获救预测

泰坦尼克号-数据挖掘案例解读数据挖掘流程:(一)数据读取:读取数据,并进行展示统计数据各项指标明确数据规模与要完成任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况影响统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性(四)建立模型特征数据与标签准备数...

2019-02-25 18:26:26 3250 1

原创 教女朋友学数据分析——可视化库Seaborn

可视化库SeabornNoteSeaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。一、 整体布局风格设置导入包,其中%matplotlib具体作用是当你调用matp...

2019-02-24 21:37:16 1730

原创 教女朋友学数据分析——数据可视化库Matplotlib

数据可视化库MatplotlibNoteMatplotlib 是一个0 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。一、折线图绘制数据文件’unrate.csv’:这份数据统计了美国从1948年1月到2016年8月每个月的失业率。读取数据:import pandas as pdunrate = pd.read_csv('unrate...

2019-02-20 10:49:28 1078

原创 教女朋友学数据分析———数据分析库Pandas

哦,不,这个:Pandas数据分析处理库pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。一、数据读取import pandasfood_info = pandas.read_csv("G:\\food_i...

2019-02-18 08:59:15 1619

原创 教女朋友学数据分析—科学计算库Numpy

科学计算库numpyNumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。一、IO文件操作numpy提供了一个打开txt文件的函数genfrontxt,文件...

2019-02-16 17:53:00 248

原创 Python网络爬虫之网络请求

一、urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。1.1 urlopen函数:在Python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面了,以先来看下urlopen函数基本的使用:from urllib import requestresp ...

2019-02-14 12:11:42 7040

原创 Python网络爬虫之爬虫前奏

爬虫前奏一、网络爬虫概述1.1 爬虫的实际例子:搜索引擎(百度、谷歌、360搜索等)。伯乐在线。惠惠购物助手。数据分析与研究(数据冰山知乎专栏)。抢票软件等。1.2 什么是网络爬虫:通俗理解:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。专业介绍:百度百科。1.3 通用爬虫和聚焦爬虫:通用爬虫:通用爬...

2019-02-11 20:59:05 303

旷视科技南京研究院负责人魏秀参 细粒度级别图像分析领域的现状与展望.pdf

旷视科技南京研究院负责人魏秀参,细粒度级别图像分析领域的现状与展望。 细粒度图像分类综述性PPT,对于研究图像分类会有很大帮助。

2020-03-04

An Introduction to Statistical Learning_with Applications in R

统计学习中相当经典的一本书籍,当当网上纸质版最便宜628元,美国发货,不退货,5-8周才到。书籍字迹很清晰,内容用PDF打开都可以复制,相当好的一本用于R语言实战和统计学习的一本书。一些统计专业的学生可能并不知道这本书,但是下载下来是绝不后悔的。

2019-02-15

复杂数据统计方法-基于R应用(第三版)

强烈推荐这本书,特别适合学习R的小盆友,吴喜之教授在统计学专业领域德高望重,他的书讲解特别明白,理论部分不需要担心。并且,这本书实战性特别强,带着例子学R编程,简易好掌握!

2019-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除