自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 杜凯杰教学数据分析:python百万级数据集中异常值、离群值查找及替换,快捷实用!

杜凯杰教学数据分析:python百万级数据集中异常值、离群值查找及替换,快捷实用!>点击下数据集<<之前有教过空值的处理方法,根据以往的经验,一般我们在处理小规模数据时都是用肉眼扫描的方式去查看数据中的异常值,即不科学,鲁棒性也不强,不适于中大规模数据集,本次着重介绍一下异常数据的查找及处理操作。第一步:打开数据集,查看文档内容信息import pandas as pd...

2019-08-26 16:49:48 17124

原创 杜凯杰教学数据分析:Logistic(逻辑回归)算法完整实例数据集建模处理,缺省值处理、类型转换、建模预测

基于病理数据集使用Logistic算法构建模型进行乳腺癌预测(良性2/恶性4)—杜凯杰数据来源:http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29实验采用 UCI 数据集中的 Wisconsin 医学院的 William H.Wolberg 博士提供的乳腺 癌 的 数据 样 本 。所有数...

2019-08-24 15:52:04 16941 1

原创 在百度云上免费搭建个人网站,小白2分钟学会,10分钟建成! ---杜凯杰

使用wordpress在百度云免费搭建个人网站,2分钟即可学会,10分钟即可建成!适用于任何大神与小白!–杜凯杰有人私信给我说,让我发点前端的知识,数据获取的一个重要渠道就是网站数据的爬取,写爬虫又必须了解些前端知识,这几天我就简单讲一下前端的相关知识,大家学习一下,方便数据的获取。今天先讲下如何快速搭建个人的网站,任何人都可以学会的,如需相关软件及操作可以关注并留言,我会逐一回复。一、申请...

2019-08-21 11:34:03 38099 6

原创 杜凯杰教学数据分析:python 图片爬取 爬取各校校花图片

python 图片爬取 爬取各校校花图片爬取十页校花图片(可按需求更改页数,爬取更多图片)#爬取各高校校花图片import requestsimport timefrom lxml import etreeimport pandas as pdstartUrl='http://www.xiaohuar.com/list-1-'#定义初始链接地址headers={ 'User...

2019-06-15 00:22:45 36311 24

原创 杜凯杰教学数据分析:python 数据提取及拆分

K线数据提取依据原有数据集格式,按要求生成新表:1、每分钟的close数据的第一条、最后一条、最大值及最小值,2、每分钟vol数据的增长量(每分钟vol的最后一条数据减第一条数据)3、汇总这些信息生成一个新表(字段名:[‘time’,‘open’,‘close’,‘high’,‘low’,‘vol’])import pandas as pd import time start=...

2019-06-15 00:16:27 23428

原创 杜凯杰教学数据分析:python pandas 添加、汇总、分类、条件判断、显示满足指定条件数据、操作集锦

**python pandas 操作集锦**载入数据集df = pd.DataFrame({ '学生姓名':['小红','小花','小明','小军','小雷'], '性别':['女','女','男','男','男'], '语文成绩':[58,78,96,64,85], '数学成绩':[90,69,45,35,57], '英语成绩':[68,80,46...

2019-06-14 23:53:06 15920

原创 简单线性回归-轻松入门人工智能

什么是回归算法• 回归算法是一种有监督算法• 回归算法是一种比较常用的机器学习算法,用于构建一个模型来做特征向量到标签的映射。在算法的学习过程中,试图寻找一个模型,最大程度拟合训练数据。• 回归算法在使用时,接收一个n维度特征向量,输出一个连续的数据值简单小案例输入:x 特征向量输出:h θ (x)即预测值在这里我们需要用到一个方法来计算出它的预估值最小二乘法(又称最小平方法)...

2019-01-15 07:38:39 11305

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除