自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (1)
  • 问答 (3)
  • 收藏
  • 关注

原创 Pandas教程整理

Pandas的详细教程,每个函数都包含了丰富的例子

2019-09-02 16:36:28 1351

原创 NumPy教程整理

NumPy的详细教程,每个函数都包含了丰富的例子

2019-08-16 21:57:18 833

原创 机器学习算法理论与实践——决策树

决策树的基本思想、数学推导和实例。

2019-08-08 15:45:29 665

原创 机器学习算法理论与实践——Logistic回归

Logistic回归的基本思想、数学推导和实例。

2019-07-31 16:55:37 557

原创 机器学习算法理论与实践——线性判别分析(LDA)

线性判别分析LDA的基本思想、数学推导和实例。

2019-07-24 22:50:50 1133

原创 地震数据爬取——Scrapy爬虫框架应用

使用Scrapy爬虫框架爬取"中国地震台网速报"近一年的地震速报,并简要分析

2019-06-19 20:52:10 2701

原创 简易代理IP池的搭建

简易代理IP池搭建

2019-05-11 17:09:42 6169

原创 批量查询号码归属地

一共有43万条数据,包括了最新的号段,比如电信的199,也包括了虚拟运营商的号段170

2019-05-08 17:58:34 3732 1

原创 爬取新浪微博关于ios12.1.2的内容——多线程爬虫的应用

2018年12月18日凌晨,苹果正式推送ios12.1.2,博主是前天才升级的,结果升完级后发现使用数据流量上网时的信号变差了,具体有两个事例:一是在地铁出口买早餐,刷不出付款码;二是玩游戏的时候很卡。这是升级系统前没有遇到的问题。

2018-12-28 17:18:37 1065

原创 机器学习十大经典算法之支持向量机(学习笔记整理)

支持向量机(SVM, Support Vector Machine)

2018-11-23 15:31:24 1259 1

原创 判断喜欢的电影类型——朴素贝叶斯模型的简单应用(2)

上一篇博客已经就**类型**和**制片国家**进行了建模,可初步判断一部电影是否是我喜欢的。但是我们可以看到爬取的还有一个重要的信息,那就是**剧情简介**。所以现在我们就用**剧情简介**再训练一个贝叶斯模型,用于判断是否喜欢一个电影。

2018-11-15 11:38:10 858

原创 判断喜欢的电影类型——朴素贝叶斯模型的简单应用(1)

之前我做了一个豆瓣电影信息的爬取 https://blog.csdn.net/weixin_43374551/article/details/84029439 ,共获得了8608部电影的概要信息。现在我们利用这些数据,可以做一些分析。首先我从这8608部电影中随机挑选了520部我已经看过的电影,挑选方法就是进度条随便拉到哪儿算哪儿,保证了一定的随机性。type这一列代表了我对这些电影的态度,1...

2018-11-14 14:02:33 1474 1

原创 爬取豆瓣电影8608部电影的信息-模拟Ajax请求的应用

一入爬虫深似海,回头还是在入门。

2018-11-13 15:15:47 3798 1

原创 机器学习十大经典算法之Logistic回归(学习笔记整理)

Logistic回归是一种广义线性回归模型,解决的是因变量为二分类变量的预测或判别问题。

2018-11-07 20:58:47 2276 1

原创 机器学习十大经典算法之岭回归和LASSO回归(学习笔记整理)

在线性回归模型中,其参数估计公式为$\beta=(X^TX)^{-1}X^Ty$,当$X^TX$不可逆时无法求出$\beta$,另外如果$|X^TX|$越趋近于0,会使得回归系数趋向于无穷大,此时得到的回归系数是无意义的。解决这类问题可以使用岭回归和LASSO回归,主要针对==自变量之间存在多重共线性==或者==自变量个数多于样本量==的情况。

2018-11-04 00:48:23 99648 29

原创 机器学习十大经典算法之线性回归(学习笔记整理)

一、一元线性回归一元线性回归模型也称为简单线性回归模型,模型中只含有一个自变量,数学表达式y=a+bx+εy=a+bx+\varepsilony=a+bx+ε其中a、b为回归系数,ε\varepsilonε为模型的误差项。要得到理想的拟合线,则要使误差ε\varepsilonε总体上最小,于是转换成了误差平方和最小的问题,此方法就是“最小二乘法”。推导过程:\begin{align}J(a...

2018-10-31 17:58:41 3567

原创 机器学习十大经典算法之朴素贝叶斯(学习笔记整理)

1.高斯贝叶斯分类器import pandas as pdfrom sklearn import model_selection,naive_bayes,metricsimport matplotlib.pyplot as pltdata=pd.read_excel(r'C:\Users\Administrator\Desktop\Skin_Segment.xlsx')#拆分为训练集和...

2018-10-28 12:43:12 1951

原创 机器学习十大经典算法之决策树(学习笔记整理)

一、决策树概述决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。最初的节点称为根节点(如图中的"颜色"),有分支的节点称为中间节点(如图中的"价格"),无分支的节点称为叶节点(如图中的"喜欢")优点:计算复杂度

2018-10-26 16:48:22 1703

原创 机器学习十大经典算法之K-近邻算法(学习笔记整理)

K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。...

2018-10-24 20:51:28 1701

原创 经典数字游戏——数独(Sudoku)解法的Python代码实现

用Python写了一个解数独的小程序

2018-10-16 18:10:35 3761

原创 抖音5×5一笔连线问题无解的证明

最近抖音上突然出现了一个一笔连游戏,经证明这个是无解的!

2018-10-15 17:50:18 61880 3

原创 抖音热门游戏Fill one-line puzzle game解法的Python代码实现

抖音热门游戏Fill one-line puzzle game解法的Python代码实现导语思路代码验证版权声明:原创文章,转载请注明出处导语最近刷抖音的时候,发现经常有人提问一个游戏的解法,于是去下载了这款游戏,发现还挺好玩的。这个游戏的玩法也很简单,就是一笔画成。比如像这样我以为这个游戏很火,其实AppStore的下载量才寥寥几千。趁它还没有完全火起来,用Python写了一个...

2018-10-10 23:40:09 2405

批量查询号码归属地

包括电信199号段等最新的号码归属地,43万条数据。可以支持单个查询和批量查询,单个查询直接显示查询结果,批量查询生成Excel表。

2019-05-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除