1 Mr. Donkey_K

尚未进行身份认证

暂无相关简介

等级
TA的排名 8w+

机器学习:循环神经网络

文章目录RNN概述RNN模型RNN前向传播算法RNN反向传播算法推导RNN小结参考文章:https://www.cnblogs.com/pinard/p/6509630.htmlRNN概述在前面讲到的DNN和CNN中,训练样本的输入和输出是比较的确定的。但是有一类问题DNN和CNN不好解决,就是训练样本输入是连续的序列,且序列的长短不一,比如基于时间的序列:一段段连续的语音,一段段连续的手写...

2019-08-26 14:02:49

数据分析:pandas

文章目录pandas创建Series数据类型Series基本操作Series运算特殊的where方法创建DataFrame数据类型DataFrame基础属性和整体情况查询文件的读取与写入分类与聚合(group_by)pandas创建Series数据类型"""Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数...

2019-08-26 12:00:52

数据分析:Numpy

文章目录numpy创建数组矩阵的转置numpy的索引和切片numpy中数值的修改花式索引数组形状修改数组拼接,分割数组元素的添加与删除numpy的统计函数numpy创建数组import numpy as np# 1). 创建数组: a, b, c创建的数组相同, 任选一种;a = np.array([1, 2, 3, 4, 5])b = np.array(range(1, 6))...

2019-08-26 11:49:53

数据分析:Matplotlib

文章目录什么是 matplotlib为什么要学习matplotlib什么是matplotlibmatplotlib基本要点Matplotlib 常用设置(折线图)设置图片大小调整 x 轴或者 y 轴上的刻度设置中文显示常用的统计图散点图条形图单个条形图的绘制多个条形图绘制直方图普通直方图![在这里插入图片描述](https://img-blog.csdnimg.cn/201908261124179...

2019-08-26 11:29:23

爬虫:Scrapy-redis分布式爬虫

文章目录scrapy - redis 简介优势缺点scrapy - redis 架构scrapy - redis 常用配置scrapy - redis 键名介绍scrapy - redis 简单实例scrapy - redis 简介scrapy-redis 是 scrapy 框架基于 redis 数据库的组件,用于 scrapy 项目的分布式开发和部署。官方文档:https://scrapy...

2019-08-26 11:00:55

爬虫:Scrapy爬虫框架

文章目录Scrapy简介通用爬虫框架流程Scrapy 框架流程Scrapy组件Scrapy运行流程Scrapy的安装Linux下的安装(包括mac)Windows下的安装基本命令项目文件说明项目案例项目介绍项目代码创建工程创建爬虫程序自动创建目录及文件编写爬虫文件(douban.py)编辑item文件编辑pipelines文件编辑settings文件项目效果Scrapy简介通用爬虫框架流程...

2019-08-26 10:31:22

机器学习练习:tensorflow_cnn_mnist

文章目录tensorflow_cnn_mnist执行逻辑tensorflow_cnn_mnist执行逻辑目的:通过卷积神经网络来实现手写数字识别验证

2019-08-19 13:47:02

机器学习:卷积神经网络

文章目录引入首先思考一个问题:我们如何识别一个熟人?第二个问题:计算机如何模拟人的行为进行识别RGB示例轮廓特征局部特征计算机处理图像识别的思路神经网络和卷积神经网络的联系卷积神经网络的原理卷积运算边缘检测灰度图Padding & Stride (填充和步长)卷积运算的缺点解决的方法 – 在做卷积运算前,对图像进行填充Vaild 和 Same 卷积运算Stride 步长卷积神经网络的总结和...

2019-08-19 11:29:54

机器学习:深度神经网络

文章目录基本概念神经网络的介绍神经元深度神经网络(大于两层就可以称为深度神经网络)感知器与神经网络感知器神经网络用符号标识神经网络一个神经元的数学表示一层神经元的数学表示神经网络计算流程激活函数为什么需要非线性激活函数常见激活函数激活函数的导数sigmoidtanhReLu和Leaky ReLu如何训练神经网络反向传播的理解计算图计算图的导数神经网络的梯度下降神经网络的传播过程神经网络的传播过程的...

2019-08-19 10:18:41

爬虫项目实战:简书用户动态信息

文章目录爬虫思路分析示例代码核心代码数据分析模块爬虫思路分析爬取的内容为简书笔者用户动态的信息(https://www.jianshu.com/c/22f2ca261b85),如图当首次打开该网页URL,选择热门,会发现网页URL并没有发生变化,如图所示,所以判断该网页采用了异步加载技术。打开Chrome浏览器的开发者工具(按 F12 键),单击Network选项卡,选中 ...

2019-08-16 20:05:19

爬虫:lxml库和Xpath语法

文章目录XPath简介选取节点谓语(Predicates)选取未知节点XPath的运算符lxml库解析 HTML 代码文件读取实例测试XPath简介XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进 行遍历。W3School官方文档:http://www.w3school.com.cn/xpath/index.a...

2019-08-15 15:51:18

爬虫:正则表达式

文章目录正则表达式简介为什么要学正则表达式什么是正则表达式正则表达式的作用正则表达式匹配规则案例1. 北美电话的常用格式:(eg: 2703877865)2. 匹配所有的qq邮箱, username必须是字母数字或者下划线re模块re 模块一般使用步骤compile 函数Pattern 对象match 方法Match 对象search 方法findall 方法与finditer 方法split 方...

2019-08-15 15:44:33

爬虫项目实战:拉钩网职位需求采集

文章目录需求分析项目简介职位需求页面分析PositionId 数据采集真实的URL获取请求头信息表单信息返回的JSON数据PositionId 页面解析数据分析可视化中文显示问题解决常见错误及解决方式在使用 fake_useragen 的时候出现如下错误:获取页面信息时出现请求频繁问题项目代码配置文件(config.py)数据分析模块(lagou.py)核心代码(run.py)需求分析知己知彼...

2019-08-15 15:19:17

爬虫项目实战:代理池监控维护器

文章目录项目背景项目需求项目技术细节代码实现工具模块(utils.py)配置文件(config.py)错误信息模块(errors.py)数据库模块(db.py)爬虫模块(spider.py)代理池过滤模块(ProxyPoolFilter.py)API模块(api.py)定时任务模块(scheduler.py)程序入口(run.py)项目背景在爬取一些大网站的时候,总会出现被反爬技术阻碍的情况,...

2019-08-15 14:25:59

机器学习项目实战:图片验证码识别

文章目录项目分析代码实现生成训练使用的验证码图片(150张)生成的图片效果展示生成图片代码图线清洗并切割清洗效果展示切割效果展示图片清洗切割代码实现数据处理,建模及测试建模效果展示测试效果展示数据处理,建模及测试代码实现项目分析基于逻辑回归和图像处理的项目输入:一个验证码图像输出:这个验证码图像中的数字(字母)步骤对图像进行处理(1)二值化:首先把图像从RGB3通道转化成Gray...

2019-08-12 11:53:19

机器学习:朴素贝叶斯

朴素贝叶斯是一个分类器我们现在用p1(x,y)表示数据点(x,y)属于类别1(圆)的概率,用p2(x,y)表示数据点(x,y)属于类别2(三角)的概率那么对于一个新的数据点(x,y) 我们可以用下面的规则来判断它的类型如果p1(x,y) > p2(x,y),那么类别为1如果p2(x,y) > p1(x,y),那么类别为2独立事件:在一次实验中,一个事件的发生不会影响到另一...

2019-08-12 11:26:34

机器学习:支持向量机

文章目录逻辑回归的改进支持向量机的决策边界:线性可分的例子向量内积性质的复习SVM决策边界SVM的核函数:用来使SVM能够处理非线性分类核函数和相似度例子:代码实现博主是初学者,学的很浅显,大家可以参考大佬的文章:https://blog.csdn.net/b285795298/article/details/81977271逻辑回归的改进支持向量机的决策边界:线性可分的例子向量...

2019-08-12 11:04:02

机器学习:聚类

文章目录无监督机器学习相似度聚类聚类原则K-Means聚类K-Means 改进K-Mediods二分K-MeansK-Means++Mini Batch K-MeansK-Means可以的优化参数选择适当的K值聚类的“相对误差”K均值损失函数求偏导K的选择Canopy聚类层次聚类分裂的层次聚类: DIANA凝聚的层次聚类: AGNES密度聚类DBSCAN密度可达谱和谱聚类谱聚类PCA降维效果图代码...

2019-08-12 10:34:46

机器学习:决策树与随机森林

文章目录决策树引入离散化决策树的生成:计算纯度的方式基尼系数决策树的分割方式:非线性单颗决策树的缺陷随机森林随机森林VS逻辑回归剪枝决策树做回归代码实现决策树随机森林决策树引入逻辑回归是一种线性有监督离散型分类模型决策树是一种非线性有监督离散型分类模型随机森林也是一种非线性有监督离散型分类模型离散化案例分析: 离散化数据类型离散的数据 需指明取值数量 2^M 种分割方式天...

2019-08-12 09:34:45

Web前端:jQuery练习(tab选项卡)

文章目录题目要求效果展示代码实现题目要求选项卡实现图片转换效果展示代码实现<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>Title</title> <style type="text/c...

2019-08-08 17:23:10

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。