1 zpc1219

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 43w+

动手学习深度学习(Pytorch版)Task 3:过拟合欠拟合及其解决方案和梯度消失、梯度爆炸学习总结

一、过拟合欠拟合及其解决方案过拟合和欠拟合是模型训练中经常出现的两类典型问题。在实践中,我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题,但在这里我们将要重点讨论两个因素:模型复杂度和训练数据集大小。最后将提出几种解决方案。欠拟合我们将模型无法得到较低的训练误差这一现象称作欠拟(underfitting)。让我们观察一下欠拟合现象:与正常拟合现象相比:我们可...

2020-02-17 13:18:52

动手学习深度学习(Pytorch版)Task 2:循环神经网络基础

循环神经网络本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量HHH,用HtH_{t}Ht​表示HHH在时间步ttt的值。HtH_{t}Ht​的计算基于XtX_{t}Xt​和Ht−1H_{t-1}Ht−1​,可以认为HtH_{t}Ht​记录了到当前字符为止的序列信息,利用HtH_{t}H...

2020-02-16 19:55:30

动手学习深度学习(Pytorch版)Task 2:语言模型

语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为TTT的词的序列w1,w2,…,wTw_1, w_2, \ldots, w_Tw1​,w2​,…,wT​,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:P(w1,w2,…,wT).P(w_1, w_2, \ldots, w_T).P(w1​,w2​,…,wT​).下面将介绍基于统计的语言模型,主要是nnn元语法...

2020-02-15 20:57:28

动手学习深度学习(Pytorch版)Task 2:文本预处理

文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,文本数据常见的预处理四个步骤如下:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本数据集:英文小说——H. G. Well的Time Machineimport collectionsimport redef read_time_mach...

2020-02-15 15:59:22

动手学习深度学习(Pytorch版)Task 2:文本预处理

文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,文本数据常见的预处理四个步骤如下:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本数据集:英文小说——H. G. Well的Time Machineimport collectionsimport redef read_time_mach...

2020-02-14 16:51:22

动手学习深度学习Task1:以Softmax回归与分类模型为例总结所学

Softmax回归与分类模型概念Softmax回归虽带有“回归”二字,但却是用来解决分类问题的。它可以用一个单层神经网络来形象化表示,如下图:在这里,输入层有四个特征x1、x2、x3、x4x_1、x_2、x_3、x_4x1​、x2​、x3​、x4​,输出层有三个输出神经元o1、o2、o3o_1、o_2、o_3o1​、o2​、o3​。由于输入层与输出层之间只有一层权重与偏置,我们一般称输入层为...

2020-02-12 15:10:50

浅谈文本情感分析

在大数据和人工智能的时代,机器能否拥有情感成为人们热议的话题。真正的人工智能系统不仅具有像人类的思考和推理能力,也需要能够感知和表达情感。还记得《魔幻手机》那部经典的国产电视剧中的傻妞么?在电视剧最后她和主人公相爱的故事,激起了我对人工智能拥有人类情感的无限想象。在未来,机器人走向千家万户,和手机一样成为人类生活的一部分是一种必然的趋势。那么你是愿意整天面对的是一丝不苟、冷冰冰地执行任务的毫无情...

2019-06-02 16:51:01

模拟登录丁香园获取全部回复

采用selenium与xpath结合,先模拟登录再进行相关信息爬取,不过我不是仅仅把上次爬取丁香园的代码强加上去,我把取得源代码的自定义函数去掉,用了selenium的get函数,url用的是登陆后的url,可以用这样直接得到登录之后爬取页的源代码,之后的解析就很简单了。源代码如下:![在这里插入图片描述](https://img-blog.csdnimg.cn/2019041220485...

2019-04-12 20:59:47

模拟登陆及IP知识相关学习

一、使用selenium模拟登陆163邮箱注意一定要用google浏览器,我刚开始默认浏览器为QQ浏览器,然后就出现错误,还有chromedriver要下浏览器对应版本,否则可能无法作用。我是把下载后的ChromeDriver的可执行文件拖到了Python的Scripts目录下了,此外当然可以采用另一种方法即单独将其所在路径配置到环境变量。好了,话不多说,直接上代码:为了不必不同的用户输入...

2019-04-11 18:35:10

爬虫学习(二)

import requestsfrom requests.exceptions import RequestExceptionimport jsonfrom bs4 import BeautifulSoupimport timedef get_one_page(url):try:headers = {‘User-Agent’: ‘Mozilla/5.0 (Macintosh; In...

2019-04-09 22:02:13

爬虫学习(一)

1.1(1)GET与POST请求:当我们在浏览器中直接输入URL并回车,这便发起了一个GET请求,请求的参数会直接包含到URL中。至于POST请求,它大多于表单提交时发起,其数据是以表单形式传输,并不会体现在URL中。二者区别:a、GET是请求页面并返回页面内容,其请求中的参数包含在URL中,数据可以在URL中看到,而POST请求的URL中不会包含这些数据,数据大都是通过表单形式传输的,会...

2019-04-06 23:43:58

决策树算法梳理

一、信息论基础(1)信息论:信息论最早来自于通信领域,也叫通信理论,主要研究信息的获取,变换,传输,处理。(2)信息熵与信息增益:信息熵表示的是不确定度。均匀分布时,不确定度最大,此时熵就最大。当选择某个特征对数据集进行分类时,分类后的数据集信息熵会比分类前的小,其差值表示为信息增益。信息增益可以衡量某个特征对分类结果的影响大小。(3)基尼不纯度:a、基尼值:基尼值 Gini(D) 反...

2019-04-03 17:44:41

逻辑回归算法梳理

一、逻辑回归原理逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量,将用户的特征属性,例如性别,年龄,注册时间等设置为自变量,根据特征属性预测购买的概率。它是以逻辑函数为联系函数的线性模型。逻辑函数也称为Sigmoid函数,表达式如下:Sigmoid(Sco...

2019-03-31 17:46:33

机器学习基础知识梳理

一、机器学习的基本概念1、定义:机器学习是指对于某个特定任务,从数据中学出一个模型,然后用某种衡量方式来表示该模型的性能。2、机器学习常见任务:a、分类 b、输入缺失分类 c、回归 d、转录 e、机器翻译 f、结构化输出 g、异常检测 h、合成和采样 i、缺失值填补 j、去噪 k、密度估计或概率质量函数估计3、性能度量:为了评估机器学习算法...

2019-03-29 20:44:21
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。