0 杜凯杰

尚未进行身份认证

杜凯杰个人空间http://www.dukaijie.com

等级
TA的排名 8w+

杜凯杰教学数据分析:python百万级数据集中异常值、离群值查找及替换,快捷实用!

杜凯杰教学数据分析:python百万级数据集中异常值、离群值查找及替换,快捷实用!>点击下数据集<<之前有教过空值的处理方法,根据以往的经验,一般我们在处理小规模数据时都是用肉眼扫描的方式去查看数据中的异常值,即不科学,鲁棒性也不强,不适于中大规模数据集,本次着重介绍一下异常数据的查找及处理操作。第一步:打开数据集,查看文档内容信息importpandasaspd...

2019-08-26 16:49:48

杜凯杰教学数据分析:Logistic(逻辑回归)算法完整实例数据集建模处理,缺省值处理、类型转换、建模预测

基于病理数据集使用Logistic算法构建模型进行乳腺癌预测(良性2/恶性4)—杜凯杰数据来源:http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29实验采用UCI数据集中的Wisconsin医学院的WilliamH.Wolberg博士提供的乳腺癌的数据样本。所有数...

2019-08-24 15:52:04

在百度云上免费搭建个人网站,小白2分钟学会,10分钟建成! ---杜凯杰

使用wordpress在百度云免费搭建个人网站,2分钟即可学会,10分钟即可建成!适用于任何大神与小白!–杜凯杰有人私信给我说,让我发点前端的知识,数据获取的一个重要渠道就是网站数据的爬取,写爬虫又必须了解些前端知识,这几天我就简单讲一下前端的相关知识,大家学习一下,方便数据的获取。今天先讲下如何快速搭建个人的网站,任何人都可以学会的,如需相关软件及操作可以关注并留言,我会逐一回复。一、申请...

2019-08-21 11:34:03

杜凯杰教学数据分析:python 图片爬取 爬取各校校花图片

python图片爬取爬取各校校花图片爬取十页校花图片(可按需求更改页数,爬取更多图片)#爬取各高校校花图片importrequestsimporttimefromlxmlimportetreeimportpandasaspdstartUrl='http://www.xiaohuar.com/list-1-'#定义初始链接地址headers={'User...

2019-06-15 00:22:45

杜凯杰教学数据分析:python 数据提取及拆分

K线数据提取依据原有数据集格式,按要求生成新表:1、每分钟的close数据的第一条、最后一条、最大值及最小值,2、每分钟vol数据的增长量(每分钟vol的最后一条数据减第一条数据)3、汇总这些信息生成一个新表(字段名:[‘time’,‘open’,‘close’,‘high’,‘low’,‘vol’])importpandasaspdimporttimestart=...

2019-06-15 00:16:27

杜凯杰教学数据分析:python pandas 添加、汇总、分类、条件判断、显示满足指定条件数据、操作集锦

**pythonpandas操作集锦**载入数据集df=pd.DataFrame({'学生姓名':['小红','小花','小明','小军','小雷'],'性别':['女','女','男','男','男'],'语文成绩':[58,78,96,64,85],'数学成绩':[90,69,45,35,57],'英语成绩':[68,80,46...

2019-06-14 23:53:06

简单线性回归-轻松入门人工智能

什么是回归算法•回归算法是一种有监督算法•回归算法是一种比较常用的机器学习算法,用于构建一个模型来做特征向量到标签的映射。在算法的学习过程中,试图寻找一个模型,最大程度拟合训练数据。•回归算法在使用时,接收一个n维度特征向量,输出一个连续的数据值简单小案例输入:x特征向量输出:hθ(x)即预测值在这里我们需要用到一个方法来计算出它的预估值最小二乘法(又称最小平方法)...

2019-01-15 07:38:39
勋章 我的勋章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。