自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 Matplotlib学习笔记

本文学习笔记整理内容import matplotlib.pyplot as pltimport numpy as npx = [1,2,3,4]y = [2,5,4,2]print(plt.plot(x,y)) #折线图print(plt.show()) #显示图形print(plt.style.use('seaborn-whitegrid')) #显示类型print(plt.savefig('1.png')) #保存1.折线图x = np.linspace(0,2*np.pi,1

2020-05-26 15:57:57 123

原创 Pandas学习笔记

本内容来自于学习笔记或者网络搜索资料,难免存在复制粘贴或者错误,请大家多多包涵1.Series 一维pd.Series(data,index,dtype)数据,索引,类型创建a = pd.Series([1,2,3,4])print(a)# 0 1# 1 2# 2 3# 3 4# dtype: int64b = np.arange(1,6)print(b)# [1 2 3 4 5]c = pd.Series(b)print(c)# 0 1#

2020-05-26 15:48:26 121

原创 Numpy学习笔记

import numpy as np1.创建数组np.array([[1,2,3,], [3,4,5], [4,,5,6]])np.arange(10) #0-10之间的整数,不包括10np.arange(2,10,2) #2-10之间的数,间隔为2,左闭右开

2020-05-26 15:26:16 121

原创 python 第五部分:面向对象 (学习笔记)

一、面向对象将编程当成一个事物,对外界来说,事物是直接使用的,不用去管他内部的情况,而编程就是设置事物能够做什么事。1.类和对象关系:用类去创建一个对象类:是对一系列具有相同特征和行为的事物的统称,是一个抽象的概念,不是真实存在的事物> 特征即是属性> 行为即是方法对象:是类创建出来的真实存在的事物2.定义类语法:新式类class 类名(): 代码注:类名要满足标识符命名规则,遵循大驼峰命名规则语法:经典类(不由任何内置类型派生出的类)class

2020-05-22 16:28:24 108

原创 python 第四部分函数(学习笔记)

一、推导式1.列表推导式作用:用一个表达式创建一个有规律的列表或控制一个有规律的列表list=[i for i in range(10)]print(list)list=[i for i in range(10) if i % 2 == 0]print(list)list=[(i,j) for i in range(1,3) for j in range(3)]print(list)2.字典推导式{xx1:xx2 for ... in....}3.集合推导式{xx for x

2020-05-22 12:03:15 105

原创 python第三部分 各类数据类型(学习笔记)

一.字符串 不可变数据类型1.书写方式''“”2.下标:从0开始3.切片语法:序列[开始位置下标:结束位置下标:步长]注:1.不包含结束位置下标对应的数据,正负整数均可 2.步长是选取间隔,正负整数均可,默认步长为1 4.查找 find():检测某个子串是否包含这个字符串中,如果在返回这个子串开始的位置下标,**否则返回-1**语法:字符串序列.find(子串,开始位置下标,结束位置下标)注:开始和结束位置下标可以省略,表示在整个字符串序列中查找index():

2020-05-21 22:36:33 92

原创 python 基础第二部分 条件语句

一 if语法1.if 条件: print()2.if 条件: print() else: print()3.if 条件1: print() elif 条件2: print() else: print()

2020-05-21 15:31:48 191

原创 python第一部分:基础的基础部分

一、定义变量变量名=值变量名自定义,要满足标识符命名规则标识符的命名规则:由数字、字母、下划线组成不能数字开头不能使用内置关键字严格区分大小写命名习惯:见名知义大驼峰小驼峰下划线:my_name二、数据类型数值:整数型int 、浮点型float布尔型:真、假字符串str列表list元组tuple集合set字典dict三、格式化输出%s:字符串%d:有符号的十进制整数%f:浮点数输出的书写方式%S或f’提示信息{变量}’转义字符:\n:换行\t

2020-05-21 14:52:45 110

原创 ADaBoost算法(学习笔记)

ADaBoost是分类算法中的集成算法原理:训练多个弱分类器,将其组合成一个强分类器

2020-05-20 23:21:16 112

原创 PageRank算法(学习笔记)

出链:链接出去的链接入链:链接进来的链接应用:网络关系的分析

2020-05-20 23:16:48 170

原创 EM聚类算法(学习笔记)最大期望算法

EM聚类:最大期望算法最大似然:最大可能性的意思最大似然估计:是一种通过已知结果,估计参数的方法EM算法就是一种求解最大似然估计的算法,通过观测样本,来找出样本的模型参数。相当于聚类框架,里面有不同的聚类模型。...

2020-05-20 23:05:37 444

原创 K-Means算法(学习笔记)

K-Means是一种非监督学习,解决的是聚类问题,本质是确定K类的中心点K-Means 的工作原理:1.选取 K 个点作为初始的类中心点,这些点一般都是从数据集中随机抽取的;2.将每个点分配到最近的类中心点,这样就形成了 K 个类,然后重新计算每个类的中心点;3.重复第二步,直到类不发生变化,或者你也可以设置最大迭代次数,这样即使类中心点发生变化,但是只要达到最大迭代次数就会结束。K-Means 和 KNN 这两个算法的区别:首先,这两个算法解决数据挖掘的两类问题。K-Means 是聚类算法,K

2020-05-20 22:52:31 154

原创 KNN算法(学习笔记)

KNN的工作原理1.计算待分类物体与其他物体之间的距离2.统计距离最近的K个邻居3.对于K个最近的邻居,他们属于哪个分类最多,待分类物体就属于哪一类计算距离的五种方法1.欧式距离2.曼哈顿距离3.闵可夫斯基距离4.切比雪夫距离5.余弦距离KD 树:是对数据点在 K 维空间中划分的一种数据结构。在 KD 树的构造中,每个节点都是 k 维数值点的二叉树。既然是二叉树,就可以采用二叉树的增删改查操作,这样就大大提升了搜索效率。...

2020-05-20 22:40:25 216

原创 SVM算法(学习笔记)

SVM:支持向量机,是监督的学习模型,常见的分类方法。监督学习:事先对数据打上标签,机器就知道数据属于哪个分类。无监督学习:数据没有分类标签SVM计算就是找到超平面的过程,超平面就是SVM分类器。分类间隔:极限位置到最优决策面之间的距离SVM就是求解最大分类间隔的过程。硬间隔:完全分类准确软间隔:允许一定量的样本分类错误非线性SVM:核函数的选择就是影响SVM最大的变量。核函数:将原有的样本空间通过核函数投射到一个高维的空间中,变得线性可分。SVM既可以做回归(SVR和LinearSVR

2020-05-20 22:28:07 306

原创 朴素贝叶斯分类(学习笔记)

先验概率:通过经验来判断事情发生的概率后验概率:发生结果后,推测原因的概率条件概率:事件A在另外一个事件B已经发生条件下的发生概率似然函数:把概率模型的训练过程理解为求参数估计的过程。朴素贝叶斯是一种简单但极为强大的预测建模算法。朴素贝叶斯模型由两种类型的概率组成:每个类别的概率P(Cj);每个属性的条件概率P(Ai|Cj)。朴素贝叶斯分类最适合的场景是文本分类、情感分类和垃圾邮件识别。sklearn 机器学习包sklearn 的全称叫 Scikit-learn,提供了 3 个朴素贝

2020-05-20 16:35:00 644

原创 Pandas笔记整理

Series 一维pd.Series(data,index,dtype)#数据,索引,类型创建a = pd.Series([1,2,3,4])print(a)> [1,2,3,4]b = np.arange(1,6) #1到6之间的整数,左闭右开print(b)> [1 2 3 4 5]c = pd.Series(b)print(c)dic = {'li':1,'liu':2,'wang':3} #字典h = pd.Series(dic)print(h)>

2020-05-19 17:23:33 141

原创 Numpy笔记总结

numpy是python中科学计算的基础包。1.创建数组np.array([1,2,3],[3,4,5],[4,5,6])

2020-05-19 17:13:06 65

原创 关联规则挖掘算法 (学习笔记)

关联规则挖掘是从数据集中发现项与项(item 与 item)之间的关系关联规则中的几个重要的概念1.支持度:某个商品组合出现的次数与总次数之间的比例。2.置信度:指购买了商品A,会有多大的概率购买B。3.提升度:指商品A的出现,对商品B的出现概率提升的程度提升度 (A→B)= 置信度 (A→B)/ 支持度 (B)用来衡量 A 出现的情况下,是否会对 B 出现的概率有所提升。所以提升度有三种可能:提升度 (A→B)>1:代表有提升;提升度 (A→B)=1:代表有没有提升,也没有下降;

2020-05-19 16:17:25 663

原创 SQL笔记整理(宝典)

**一.语句书写顺序**select:输出 (以列为单位)from:获取数据where:过滤 (一条条过滤,判断from中的信息,过滤列)group by:分组having:过滤order by:排序limit:限定个数 **二.语句执行顺序**from:获取数据where:过滤group by:分组select:输出having:过滤order by:排序limit:限定个数**三.逐个分析** 1. select 直接写出要输出列的名称,如果输出全部列则直接写*

2020-05-18 18:24:00 827

原创 #数据分析算法篇 ## 决策树(学习课程笔记)

数据分析算法篇之决策树做决策树的时候,会经历两个阶段:构造和剪枝构造构造的过程就是选择什么属性作为节点的过程。三种节点1.根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点2.内部节点:就是树中间的那些节点,比如说“温度”、“湿度”、“刮风”3.叶节点:就是树最底部的节点,也就是决策结果节点之间存在父子关系。比如根节点会有子节点,子节点会有子子节点,但是到...

2020-04-26 09:50:54 180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除