自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 算法进阶-回归

最小二乘意义下的参数最优解参数的解析式不可逆或是防止过拟合,增加扰动半正定对于任意实数大于0简便方法记忆结合线性回归的复杂度惩罚因子Ridge:岭回归LASSO:具有特征选择能力正则项与防止过拟合:正则化与稀疏:机器学习与数据使用:训练数据训练数据、测试数据(评判模型好坏)训练数据、验证数据(给定的参数就能找到相对应的值)、测试数据交叉验证:十折交叉验证Moore-Penrose广义逆矩阵(伪逆)SVD计算矩

2021-05-18 18:34:17 100

原创 小白学python-数据清洗

数据清洗:赔率、公路堵车模型的概念及应用主成分分析PCA:新的的特征组合

2021-04-03 17:32:03 283 1

原创 小白学python-逻辑回归

逻辑回归:线性回归的式子作为输入 解决二分类问题 能够得出概率值sigmoid函数:损失函数:均方误差:(不存在多个局部的特点)只有一个最小值对数似然损失:(有多个局部最小值)目前解决不了的问题其他代替解决方法:1、随机初始化,多次比较最小值结果;2、求解的过程中,调整学习率 这两种方法只能改善,但是不能彻底解决,尽管没有全局的最低点,但是局部最低点还是可以的采用梯度下降优化求解API:sklearn.linear_model.Logistic...

2021-04-02 17:10:02 122

原创 小白学python-线性回归

线性回归:定义:线性回归通过一个或者多个自变量与因变量之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合,称为迭代的算法一元线性回归:涉及到的变量只有一个多远线性回归:涉及到的变量两个或两个以上回归:可以无限去划分,目标值属于连续的问题 函数分类:离散型类似于散点图,序列回归解决的问题:房价预测、销售额预测、贷款额度预测线性关系:二维图像中呈现一条直线三维中:数据基本在一个图面上线性关系模型:通过一个属性组合来预测的函数对于多个.

2021-03-27 22:24:46 283 1

原创 小白学python-决策树和随机森林

决策树:定义:决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法信息的度量和作用:比特:通信数学原理,奠定现代信息论的基础信息熵:信息和消除不确定性是相联系的信息增益:决策树的划分依据信息增益表示得知特征X的信息而使得类Y的信息的不正确性减少的程度sklearn决策树API: classsklearn.tree.DecisionTreeClassifier(criterion=’..

2021-03-26 21:51:26 300

原创 小白学python-k-近邻算法

分类算法:k-近邻算法通过“邻居”来判断目标值的类型定义:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,该样本也属于这个类别KNN最早是由Cover与Hart提出欧式距离:两个样本的距离可以通过如下公式计算比较样本之间特征之间的远近,相似的样本也就是特征值之间的值相近值k-近邻需要进行标准化处理,k的取值大小会影响结果API: sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm

2021-03-25 21:31:12 227

原创 小白学python-数据降维

数据降维:定义:特征的数量减少特征选择:原因:1、冗余部分特征相关性高,容易消耗计算机性能2、噪声:部分特征对预测结果有负影响工具:1、Filter(过滤式):VarianceThreshold (sklearn.feature_selection.VarianceThreshold)2、Embedded(嵌入式):正则化、决策树3、Wrapper(包裹式)方差大小来考虑PCA:主成分分析:(sklearn. decomposition )PCA是..

2021-03-23 21:40:29 99

原创 小白学python-机器学习介绍

机器学习算法简介:图灵:人工智能之父、图灵测试Marvin Lee Minsky:人工智能实验室概念发展:人工智能-机器学习-深度学习两个阶段:硬件的计算能力达不到、数据(大小、代表性)、算法的发展机器学习、深度学习的用途:无人驾驶、医疗方面、图片的艺术化、智能手机(人脸识别)、自然语言处理、预测(信贷需求、店铺销量)概括:自然语言处理、图像识别、传统预测课程定位:算法、案例、基本浅显的数学知识、算法的推导原理目标:1、机器学习各种算法的原理2、熟练掌握算法的使用,能

2021-03-21 23:03:14 105

原创 小白学python-矩阵和线性代数

矩阵:SVD的提法:1、奇异值分解:突出的、奇特的、非凡的;称之为“优化分解”2、与特征值、特征向量的概念相对应线性代数:定义:方阵的行列式1、1阶方阵的行列式为该元素本身2、n阶方阵的行列式等于它的任一行或列的各元素与其对应代数余子式或乘积之和代数余子式伴随矩阵方阵的逆范德蒙行列式:数学归纳法、Newton\Lagrange插值法矩阵乘法矩阵模型:随机过程概率转移矩阵平稳分布矩阵和向量的乘法矩阵的秩秩和线性方程组的解的关系向量组等

2021-03-20 14:14:44 74

原创 小白学python-概率论与贝叶斯先验

概率论基础:统计数字的概率:1、给定某正整数N,统计从1-N!的所有数,首位数字出现1的概率2、进而,可以计算首位数字是2的概率,是3的概率,从而得到九点分布本福特定律:实际生活中得出的一组数据中,以1为首位出现概率约为总数的三成;是直观想象的三倍1、阶乘、素数数列、斐波那契数列首位2、住宅地址号码3、经济数据反欺诈4、选举投票反欺诈示例:商品推荐公路堵车概率模型:Nagel-Schreckenberg交通流模型概率公式:1、条件概率2、全概率公式

2021-03-19 21:39:54 412

原创 小白学python-机器学习与数学分析

机器学习与课程示例概述:定义:对于给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优质、大量的经验E,改程序对于任务T的性能逐步提高。示例:无人驾驶汽车人类的学习:如何从完全无知到掌握知识有监督学习无监督学习增强学习机器学习的内涵与外延:解决的问题:给定数据的预测问题1、数据的清洗和特征选择2、确定算法模型参数优化3、结果预测不能解决的问题:大数据存储并行计算、做一个机器人机器学习的一般流程:

2021-03-18 21:21:09 117

原创 小白学python-Mysql基本应用(四)

Mysql运算符:算数运算符:比较简单,和基本的算数规则相同比较运算符:=:是否相等<>、I=:是否不等于<=>:判断是否相等,可以判断是否等于NULL>、>=:判断是否大于等于<、<=:判断是否小于等于IS NULL或IS NOT NULL:判断是否等于NULLBETWEEN AND 或NOT BETWEEN :判断是否在范围内IN或NOT IN:判断是否在一个某一个固定的范围LIKE或NOT LIKE :判断

2021-03-16 23:13:11 73

原创 小白学python-Mysql的基本用法(三)

对于查询结果排序:ORDER BY :SELECT *FROM 表名 ORDER BY 字段 ASC/DSC默认升序:ASC降序为:DESC按照多个字段进行排序:按照字段的升序或是降序进行排序随机排序 :SELECT * FROM 表名 ORDER BY RAND()限制显示条数:LIMIT限制查询结果显示条数1、显示条数:SELECT * FROM 表名 LIMIT 数字(显示条数值)2、显示偏移量、显示条数3、查询显示表中的前一条数据:SELECT * F..

2021-03-16 16:34:41 87

原创 小白学python-Mysql基本用法(二)

如何创建数据表:完整性约束条件:1、主键:PRIMARY KEY2、自增长:AUTO_INCREMENT3、外键:FOREIGN KEY4、空键:NOT NULL5、唯一:UNIQUE KEY (可以有多个唯一)6、默认值:DEFAULT(具体的操作方法不在阐述)...

2021-03-15 15:22:08 142

原创 小白学python-mysql基本介绍(一)

数据库的简介:数据库的概念:方便数据的管理和储存数据库系统:比数据库大很多,由数据库、数据库管理系统、应用开发构成数据库管理系统:定义、管理、维护数据的软件MySQL数据库:选择mysql的原因:开放源代码、跨品台性、开源免费、功能强大安装及新特性(Mysql 5.6):1、安装:windows:二进制分发版(.msi)、官网下载安装包、免安装版bin目录:存储可执行文件data目录:存储数据文件include目录:存储包含的头文件lib目录:存储库文件...

2021-03-12 17:11:39 117

原创 小白学python-Linux的Shell基础编程

上节课遗漏:虚拟机启动后磁盘的修复:输入root的密码 然后输入:# fsck /dev/sda2 yes确认修复Shell基础编程:Shell的介绍:1、文本文件,批量的Linux命令集合:# more start-all.sh 检查脚本2、注释、判断语句、控制语句组成3、脚本是纯文件,通常是.sh后缀Shell程序:第一行:指定用哪个程序来编译和执行脚本#!/bin/bash #!/bin/sh使用#来进行注释变量命名:必修用字母和下划...

2021-03-09 21:52:40 84

原创 小白学python-Linux系统管理

Linux系统管理: 管理命令:unname:查看系统基本信息;查看服务器信息:# cat /proc/cpuinfo ;查看内存信息:# cat /proc/meminfo ;查看日期:# date 显示现在的时间显示日历表:# cal + 年份 (显示某一年的日历表)设置日期和时间(必须是root用户):# date -s磁盘信息:df -lh (显示分区磁盘、缓存)某个目录占磁盘的大小: # du -sh +文件名修复磁盘: # fsck ...

2021-03-09 17:26:12 54

原创 小白学python-Linux的基本命令

用户和组:在Linux系统上,创建用户的时候,默认情况下会创建一个用户组(名称与用户名相同)。文件的创建:1、使用touch命令;2、使用vi/vim:其中在vi查看的位置快捷键:dd来删除光标所在的内容;ZZ:表示的保存文件内容;x:表示光标所在的位置删除;o表示在光标的下一行插入内容;对文件的内容进行追加:echo +‘内容’+>> +位置查看文件内容的方式:1、cat:查看全部内容,文件内容比较少;2、more:翻页查看;3、tail:末尾内容,通常与-f参数连用,适合于查看.

2021-03-09 16:12:02 113

原创 小白学python-Linux基本环境

今天的学习任务主要是Linux的基础知识的学习,首先是Linux的安装,这个在网站上都有较为详细介绍,不再赘述,我的电脑装上虚拟机之后但是配置不上网络,这个暂时不用管了。目前Linux参考的标准是:在企业中用的比较多的是Centos 版本,使用的虚拟化工具是:VMWare:1、安装虚拟机(参考:http://blog.17baishi.com/682/);2、在虚拟机中加载Centos操作系统;也可以直接导入已经安装好的虚拟机。对于Linux的使用:系统支持多用户,分为超级管理用户root和普通用户

2021-03-08 21:33:14 75

原创 小白学python-使用matplotlib绘制散点图与条形图

matplotlib的基本知识就不用介绍了,主要是对于这个版块的应用,注意一些细节,上例题:假设通过爬虫你获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律a = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]b = [26,26,28,19,21,17,16,19,18,20,20,19,

2021-03-05 22:45:44 176

原创 小白学python-数据分析基本常识与matplotlib折线图的基本绘制

这一块基本主要是科学数据库的学习,主要matplotlib、numpy、pandas三个方面的学习,其实就是较大数据量的基本处理与数据的可视化,就不做介绍。首先就是matplotlib的学习,首先matplotlib的基本常识,主要是进行数据的可视化,使数据更加客观、更具有说服力。其中matplotlib的基本要点是数轴的基本要素,坐标轴、数轴、数据点等。其中涉及到一个案例:假设一天中每隔两个小时(range(2,26,2))的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,

2021-03-04 20:13:19 119 1

原创 小白学python日志(11)-模块

这几课主要讲的是模块的知识,也是第一阶段的最后一节课,中间也是遇到很多问题,试了很多次也是出现各种错误,暂时还没有办法解决,具体的操作流程是对着的。首先是模块化程序设计理念:在模块化和包概念的进化史中,随着数量的增加,管理方式也会发生本质的变化;旧的管理方式完全不合适,必须采用新的管理方式,这样程序越来越复杂,统一管理和调用,函数就出现,在变量和函数增多的时候,需要把同一个类型的函数聚类,就出现了类和对象,在对象和类逐渐增多的时候把类似功能的类放到一起出现了模块,最后出现包。需要记住以下几点:1、Py.

2021-01-04 16:56:14 74

原创 小白学python日志(10)-文件操作(IO技术)

这节课学的是关于文件的操作,完整的程序都包括数据的储存和读取,一般的程序数据都没有实际储存,在解释器执行完就消失了,需要从外部储存到介质中来读取数据,或是将程序生产的数据储存到文件中,实现持久化保存,储存的形式有基于数据库或是文件形式。文本文件和二进制文件:文本文件:python默认的是unicode字符集,可以使用记事本程序打开;二级制文件:把数据内容用字节进行储存,无法用记事本打开,必须使用专用的软件解码。...

2021-01-04 13:54:11 184

原创 小白学python日志(09)-异常与错误

这次的写有点多,年底课题组的事情比较多,看视频学习的时间相对较少,还好这几天忙完了,终于有时间把前面所有的课程总结一下了,首先是python中的异常和错误;在实际工作中我们所读取的数据库的数据可能是空的、文件格式不对、内存或是硬盘满了等问题,英文称为Exception,意思是例外,也叫做异常,用伪代码使用if处理程序中可能遇到的各种情况。if条件语句有两个好处:1、逻辑代码和错误处理代码放在一起;2、需要考虑的情况比较复杂,要求较高。异常机制的本质:异常程序运行过程中出现的非正常现象,比如用户输出错误、

2021-01-03 22:41:02 57

原创 小白学python日志(08)-面向对象进阶

这节课主要学习的是面向对象进一步深化学习,但是和上一节课一样出现较多的问题,学起来还是有点困难,在学习的过程中总是跟着老师敲代码,但是每一步代码不知道什么意思,就是简单跟着敲一遍,然后理一下逻辑思路,但是弄完过一会就不理解了。先是把目前学到的总结一下,首先是上一章节遗留的几个问题,方法没有重载:在其他的语言中,可以定义多个重名的方法,只要包含智能方法签名唯一即可,这里的方法签名主要包括:方法名、参数数量、参数类型。而在Python中,方法的参数没有声明类型,参数的数量也是可以有可变参数控制,所以Pyth

2020-12-22 18:25:58 104

原创 小白学python日志(07)-面向对象(初步)

今天上课的内容首先是把第五章中函数的最后两个用法介绍了一下,然后就开展了今天比较难而且全程走神状态的对象,真是是非常不好理解,也不知道是困了还是听不明白,反正对象这一块很多专有的名词都不是很好记,导致我都不理解其中各种名词的基本用法和区别。第五章最后的函数是nonlocal关键词:这个用来声明外层的局部变量和前面提到的global是用来声明全局变量的,可以对比记忆。#测试nonlocal\gobal关键词的用法a = 100def outer(): b=10 def inner

2020-12-18 18:50:07 112 1

原创 小白学python日志(06)-函数用法和底层分析

已经请了一个多月的假期,中间忙着项目的事情,终于有时间可以来学习Python了,耽搁的时间太久了,导致之前学习的内容基本上所剩无几,真是让我难受呀!不过还是东西还是要拾起来的,下午看了函数的用法的内容,有点一头雾水,之前学习的什么元组、字典、列表之类的感觉全忘完了,还是要把前面的只是好好回顾一下,一定要把前面的时间补回来。剩下的时间就把自己今天学习的内容做个笔记吧!说到函数其实在数学中是一点都不陌生,但是放到Python中就有点难理解了,函数是可以重复利用的程序代码块,还可以实现代码一致性,只要修改函数

2020-12-17 23:07:49 65

原创 小白学python日志(05)-循环结构中的各种语句以及简单函数的定义和调用

距离上次写的日志已经过了两天了,中间事情比较多,学习也就滞后了,确实不应该,这点应该向老师们道个歉,没有规划好自己的时间,导致现在已经有两天没有学习,昨天晚上熬夜补的,但是今天开了一天会也就耽搁了,导致现在才看完今天的一章。今天学习的是是接着上次的循环结构的知识点,上次无意中说多了就是for循环和可迭代对象遍历这一块,当时感觉比较陌生,但是看了案例之后也感觉就那样,就是个for in循环,遍历就是个元组或是列表,可迭代的对象包括序列、字典、迭代器对象、生成器函数、文件对象。接着学习了range()对

2020-10-26 23:00:23 216

原创 小白学python日志(04)- 字典、集合的概念及简单应用,控制语句的中选择、循环结构的基本使用

已经是第四次写日志了,这次的日志应该是昨天完成的,但是由于时间关系只能放到了今天上午,今天主要学习的内容是紧接着上次课学完列表、元组之后的内容即为字典和集合,这两部分内容相对来说比较少,结构也比较简单。字典的是有键值对的无序可变序列,主要组成部分是键和值,首先是字典的创建,可以通过{}和dict()来进行创建,也可以用zip()创建字典对象以及通过fromkeys创建值为空的字典。字典的访问汇总可以通过键来获得相对应的值,也可以用get()函数获得相对应的值还有就是通过a.items()来获得相对应

2020-10-24 09:23:20 283

原创 小白学python日志(03)-序列中列表和元组的基本应用

今天学习了序列中列表和元组两块知识点,相对来说和字符串的应用很相似,上节课学到的字符串中有很多零碎的知识点,我现在依旧是懵懵懂懂的状态,有些东西记不住,但是老师说了,我们不要在一个不理解的知识点上浪费太多时间,要尽快搭建我们的知识系统,这样之前不理解的地方随着我们的眼界的开阔自然而然就理解了,我觉得说的很有道理,所以不管字符串是否完全掌握住了,我们就直接看列表和元组的用吧!首先,我们要知道序列包括:字符串、列表、元组、字典、集合这几个,虽然现在只是学到了前三个,但是基本上所有的用法都是和字符串的应用差不

2020-10-22 17:17:26 208

原创 小白学python日志(02)-赋值、数据类型、运算符、字符串概念以及使用规则

这是第二次作业了,感觉比第一节课的作业难,而且有些问题需要反复观看视频才能理解,所讲的内容比之前抽象了不少。接着第一节,一开始讲了各种赋值,这个我之前有遇到过,主要包括链式赋值、系列解包赋值、常量的赋值规则,基本上把之前懵懂只知道print()的赋值系统的讲了一下。然后队医数据类型的种类:整数、浮点、布尔、字符串,这些在我大一学习vb的时候都是有说过的,相对比较好理解。至于运算符包括常用的加减乘除,还出现了证书除法、模(取余)、还有幂的取值,其中比较陌生的是divmod()同时取得商和余数。...

2020-10-21 14:53:56 112

原创 小白学python日志(01)-python结构讲解以及简单海龟代码的运行

第一次系统接触python还是比较激动的,以前总是嘴上说着我要用python做什么什么,但是只是拿着别人的代码来用,并不知道其中的所以然,然后就想着能给这师傅学习,就选择了培训班,目前感觉还不错,由于时间关系我不在过多赘述我这里学习python的感受。 跟着老师我了解的python的发展历程,也学会了怎么查找安装python,通过官网查一些资料,了解了python的更多的功能以及他的特点。以前一直不知道什么解释器和开发环境的区别,总觉得每个人用python是用的界面都不一样,现在完...

2020-10-19 08:47:35 173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除