自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Frank.F.Wu

记录自己的成长历程,分享自己的心得体会,借鉴别人的成功经验。学术的交流,心灵的沟通。

  • 博客(15)
  • 收藏
  • 关注

原创 2、文本预处理;语言模型;循环神经网络基础

文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型import collectionsimport redef read_time_machine(): with open('/hom...

2020-02-14 20:55:19 130

原创 线性回归;Softmax与分类模型;多层感知机

线性回归的基本要素模型为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:price=warea⋅area+wage⋅age+b\mathrm{price} = w_{\mathrm{area}} \cdot \mathrm{area} + w_{\mathrm{ag...

2020-02-14 20:30:50 270

原创 新手入门数据分析

文章目录第一章 数字、数据、数学1、数字2、数据3、数字与数据4、数学第二章 分析、逻辑与思维1、描述、概括、分析2、逻辑思维第三章 大数据到底是什么第四章 数据分析与数据挖掘1、分析与挖掘第五章 如何做好数据分析1、EXCEL使用2、MySQL使用3、项目分析需掌握的知识技能真正决定我们的,不是我们的能力,而是我们的选择!最近刚看完《从1开始数据分析师成长之路-张旭东著》这本书,书中内容非常...

2019-05-07 14:48:56 326

原创 Python基础语法学习-Day6

海龟绘图库都适用(turtle库)turtle.setup(width, height, startx,starty) 默认左上角坐标原点,width窗口宽度,height高度,startx与starty设置窗口原点的位置(在屏幕中的坐标)turtle.goto(x,y)将海龟移动到坐标(x,y)的位置turtle.fd(d)/turtle.forward海龟向正前方移动d的长度turt...

2019-03-08 17:44:59 177

原创 Python爬虫学习-Day7

利用selenium模拟登陆,爬取帖子信息代码如下:import timefrom selenium import webdriverfrom lxml import etreeimport jsonbrowser = webdriver.Chrome()url = 'http://www.dxy.cn/bbs/index.html'browser.get(url)time....

2019-03-07 21:51:35 174

原创 Python基础语法学习-Day5

文章目录一、文件操作1、打开关闭文件2、文件的操作方法3、os模块二、datetime模块1、datetime模块包含的类2、datetime中常用的方法属性三、类和对象1、定义类2、创建对象3、__init__方法4、‘魔法’方法5、私有属性6、__del__方法7、继承8、多态8、类属性、实例属性9、静态方法和类方法四、正则表达式1、正则表达式介绍2、常用的匹配规则五、re模块1、match(...

2019-03-07 02:23:48 439

原创 Python爬虫学习-Day6

1、什么是IPIP,互联网协议地址(英语:Internet Protocol Address,又译为网际协议地址),缩写为IP地址(英语:IPAddress),是分配给用户上网使用的网际协议(英语:Internet Protocol, IP)的设备的数字标签。用来在网络中标记一台电脑的一串数字,每个IP地址包括两部分,网络地址和主机地址。网络地址的最高位必须是0。国际规定有一部分IP地址...

2019-03-06 21:45:13 108

原创 Python爬虫学习-Day5

1、安装selenium

2019-03-05 21:02:11 573

原创 Python爬虫学习-Day4

1、XML介绍XML指可扩展标记语言(EXtensible Markup Language)XML是一种标记语言,很类似HTMLXML的设计宗旨是传输数据和存储数据,而非显示数据,其焦点是数据的内容(与HTML的区别)XML的标签需要我们自行定义XML被设计为具有自我描述性XML是W3C的推荐标准每个元素以及属性都有一个父(Parent)元素节点可有零个、一个或多个子(Child...

2019-03-04 17:45:53 202

原创 Python基础语法学习-Day4

1、函数定义在程序开发时,需要某块代码多次使用,为了提升编码的效率以及代码的重用,所以把具有独立功能的代码块组织为一个小模块,这就是函数。python中利用关键字def来定义一个函数,并向python指出来函数名。还可能在括号内指出函数为其完成任务需要什么样的信息。最后定义以冒号结尾。在定义函数后,代码块部分第一行用三引号括起来的,是这个函数的文档说明,可以通过help(函数名)来查看...

2019-03-04 01:55:50 178

原创 Python爬虫学习-Day3

文章目录一、Beautiful Soup使用1、简介2、四大种类对象1)Tag2)NavigableString3)BeautifulSoup4)Comment3、遍历文档树1)直接子节点2)所有子孙节点3)节点内容4、搜索文档树1)name参数2)text参数5、CSS选择器1)通过对标签名查找2)通过类名查找3)通过id名查找4)获取内容二、丁香园评论爬取一、Beautiful Soup使用...

2019-03-03 21:43:34 271

原创 Python基础语法学习-Day3

一、字典1、字典介绍字典的每个元素由两部分组成,键:值,键是唯一的,不能重复,键、值的类型可以是任意类型。例如:info = {‘name’: ‘张三’, ‘年纪’: ‘23’,},info就是一个字典,存储张三的信息。字典和列表一样,能够存储多个数据。列表中找某个元素时,是根据下标进行的,字典中是根据键来查找,也就是用冒号前面的值。2、字典根据键查找根据键查找时,用方括号将键括起...

2019-03-03 16:45:26 394

原创 Python基础语法学习-Day2

今天来分享第二次内容的学习。1、列表:写在方括弧之间的,用逗号分隔的一串数据,可以是字符串类型、数值类型、字典类型、元组类型、集合类型等,也可各种类型混杂使用。下面介绍列表的一些方法。a、列表的创建:列表创建有两种方式,一种是直接给一个变量赋值一个空列表,另外一种是利用range函数创建一个列表。b、可以使用print打印列表:c、列表可以按照下标来进行索引和切片,如下:d、列表的...

2019-03-01 23:28:25 255

原创 Python爬虫学习-Day1

一、爬虫简介及网页知识 今天开始学习爬虫,用一周的时间强化学习,坚持下来就是胜利。 随着技术的不断发展,大数据的时代已经到来,数据的获取途径有两条,买数据或者利用工具爬取数据。 根据使用场景,爬虫分为通用爬虫和聚焦爬虫两种。通用爬虫是搜索引擎抓取系统的重要组成部分,例如谷歌、百度、雅虎等,主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。聚焦爬虫,是面向特定主题...

2019-03-01 21:31:07 368

原创 Python基础语法学习-Day1

为了跟上时代的步伐,利用业余时间学习python。1、python方便实用的一大优点就是第三方库众多,使用者可以不必从底层做起,重复造轮子。由于Anaconda集成了好多python第三方的库,对于初学者来说节省大量安装包的时间(有些包一直提示安装失败是会崩溃的),所以使用Anaconda来进行python语言的学习是初学者的最佳选择,下面来介绍下anaconda的安装。a、在Anaconda...

2019-02-26 02:13:23 342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除