Fanshaoliang-CSDN博客

原创 sklearn机器学习入门第二章：白盒学习的典范——经典线性回归（原理与实战篇）

经典的线性回归指的是一元线性回归，但显然机器学习中的线性回归不仅仅是一元线性回归，还包括多元线性回归，因此这里的经典线性回归指的是使用最小二乘法求解的多元线性回归。

2023-10-30 19:08:28 71 1

原创 sklearn机器学习入门第二章：白盒学习的典范——决策树（代码篇）

决策树篇是本系列阐述sklearn机器学习算法模型所涉及的第一个算法模型，sklearn中的决策树构造简单、运行高效、性能尚可、清晰可解释，是入门sklearn机器学习的最佳选择。

2023-10-30 11:09:01 191 1

原创 sklearn机器学习入门第二章：白盒学习的典范——决策树（原理篇）

② 否则，按照的每个可能值，将D分为若干非空子集，将中实例个数最多的类别作为类标记，构建子结点，以结点和其他子结点构成T，并返回T。3）计算每个特征下的最优切分点，并比较在最优切分下的每个特征的基尼指数，选择基尼指数最小的那个特征，即最优特征；：生成过程中，对每个结点划分前进行估计，若当前结点的划分不能提升泛化能力，则停止划分，记当前结点为叶结点。① 若的信息增益比小于，则T为单结点树，记录D中实例个数最多的类别以此作为该结点的类标记，并返回T。为单结点树，记录实例类别，以此作为该结点的类标记，并返回。

2023-10-23 19:48:18 164

原创 sklearn机器学习入门第一章：机器学习中的任务和方法概述（本篇长期更新）

机器学习的过程通俗来说是算法模型在迭代计算中获取到了输入数据和输出数据中的某种联系，并根据这种联系预测新的输入数据会产生怎样的输出数据。

2023-10-20 15:08:28 101 1

原创 4.Random Variable__随机变量（3）混合分布

可见高斯分布与指数分布混合服从拉普拉斯分布。可见，泊松分布与伽马分布混合可得负二项分布。显然积分号内分布函数符合广义逆高斯分布，令。分布，即正态分布与伽马分布的混合分布可得。

2023-10-18 15:49:58 60 1

原创 3.Random Variable__随机变量（2）常见连续随机变量及其分布

属于广义逆高斯分布，未与先验分布（伽马分布）形成共轭，于是考虑更换先验分布条件为。常用语描述“电子元器件寿命”与“两次罕见事件的间隔时间”主要影响分布的散度状态，称作尺度参数；主要影响分布的峰起状态，称作形状参数；为正整数，会获得卡方分布。表示二阶修正的贝塞尔函数。都是贝塔分布，是共轭的。与先验分布形成共轭。

2023-10-18 13:38:48 58 1

原创 LSTM多输入时间序列预测之股价预测

使用TensorFlow的LSTM完成多输入时间序列预测实验，预测股价

2022-09-09 20:53:39 2344 2

原创使用PyMC3建立GMM似然函数

1. GMM的似然函数对于K=3 , μ=[(1,1)(3,3)(5,5)],cov=[(1−0.8−0.81)(10.80.81)(1−0.8−0.81)]K=3\ ,\ \mu=\begin{bmatrix} (1,1)\\(3,3)\\(5,5)\end{bmatrix}, cov=\begin{bmatrix}\begin{pmatrix}1&-0.8\\-0.8&1\end{pmatrix}\\\begin{pmatrix}1&0.8\\0.8&am

2021-08-21 14:28:45 888 2

原创 matplotlib seaborn 数据可视化（5）——2维高斯混合体（GMM）

目录高斯混合体的数学概念生成GMM分布模型检验模型代码高斯混合体的数学概念高斯混合体是由若干个高斯随机变量线性组合而成，表示为GMM=∑k=1Kαk⋅Gaussiank , ∑kαk=1 , αk>0 , ∀αk\text{GMM} = \sum_{k=1}^K \alpha_k \cdot Gaussian_k\ ,\ \sum_k \alpha_k =1\ ,\ \alpha_k>0\ ,\ \forall \alpha_kG

2021-08-07 00:18:14 789 1

原创 matplotlib seaborn 数据可视化（4）——2维数据表面描点图

import mathimport numpy as npimport matplotlib.pyplot as pltfrom matplotlib.image import NonUniformImage%matplotlib#幅度系数A = 4#均值mu = np.array([1, 1])#方差cov = np.array([[2, 0],[0, 2]])cov_inverse = np.linalg.inv(cov)#生成模型#按步长取点，以均值为中心，正负2个方差为范

2021-08-06 14:33:58 243

原创 matplotlib seaborn 数据可视化（3）——2维数据立体直方图（伪等高图）

利用numpy.histogram2d分箱，之后使用ax,bar3d输出3d条形图。from matplotlib.image import NonUniformImageimport matplotlib.pyplot as pltimport numpy as np%matplotlibmu = np.array([-1,1])cov = np.array([[1, 0.9],[0.9, 1]])step=0.1x = np.arange(mu[0]-3*cov[0,0],mu[0]+3

2021-08-06 10:43:37 600 1

原创 matplotlib seaborn 数据可视化（2）——2维数据平面直方图（伪等高图）

随机数据解析数据

2021-08-06 09:38:30 587

原创 matplotlib seaborn 数据可视化（1）——1维数据折线图、散点图、条形图、直方图

目录1. 折线图/描点图2. 散点图3. 柱状图/条形图4. 直方图1. 折线图/描点图即描点图，以给出的索引（或无索引，默认创建）绘制折线。import numpy as npimport mathimport matplotlib.pyplot as pltimport seaborn as snsimport pandas as pd%matplotlib#指定数量或步长num=1000x_1 = np.linspace(0,10,num)step=10/numx_2 =

2021-08-05 21:28:37 1258

原创 2.Random Variable__随机变量（1）

2.0 随机变量基础定义 2.1随机变量是一个可测映射：，该映射对每一个输出赋予实数值2.1 Distribution Function & Probability Density Function 分布函数与概率密度函数定义 2.2 （累积）分布函数（累积）分布函数：CDF，表示函数，定义为：.定理 2.1的CDF为，的CDF为...

2020-03-31 10:13:34 1640

原创 1.Probability__概率基础

1.1 Sample Space & Events : 样本空间与事件定义 1.1 Sample Space 样本空间样本空间是一次实验可能出现的结果的集合，的元素称为,的子集称为事件，对于集合，定义其补集（1）一串事件，是单增的，如果满足：，定义其极限：（2）一串事件，是单减的，如果满足：，定义其极限：【例1.1】1.2 σ-Field &amp...

2020-03-30 21:06:20 906

原创 C++11多线程学习笔记（2）——mutex

std::mutex（1）简述具有允许相互排斥（mutex）并发执行关键代码段的功能的标头，从而可以显式避免数据争用。它包含mutex类型，lock类型和其他函数：mutex 类型是lockabletypes(可锁定的类型)，用于保护对关键代码段的访问：锁定（lock）互斥量可防止其他线程锁定它（独占访问），直到被解锁（unlock）为止：mutex，recursive_mutex， ...

2019-11-09 14:36:25 247

原创 C++11多线程学习笔记（1）——std::thread

Thread只是一个类，Thread对象可以与实际运行的线程产生联系，利用thread对象对线程进行操作，但是实际线程的存亡与thread对象的存亡并无绝对的决定关系。1. 构造函数1、默认构造函数thread() noexept;//空的thread对象2、初始化构造函数template<class Fn,class…Args> explicit thread(Fn ...

2019-11-09 11:54:54 290

tensorflow-2.8.0 avx2版本

2022-12-06

give me some credit 原始数据集

cs-training.csv cs-test.csv

2022-03-19

pymc3部署指南.pdf

pymc3安装方法

2021-12-21

统计机器学习笔记.zip

1. Frequentist （频率派）： The Frequentist approach views the model parameters as unknown (constant) and estimate them by matching the model to the training data. Using an appropriate metric. 频率派观点认为，模型参数是未知的（常数），⽤恰当的准则，使得模型与训练数据相匹配来估计它们（参数）。 2. Bayesian （⻉叶斯派）：⻉叶斯派观点认为，模型参数是随机变量，通过给予参数以先验分布（通常是来⾃前⼈经验），基于⻉叶斯定理做最⼤的后验概率估计。 3. 对⽐对⽐频率派与⻉叶斯派，前者多在做优化（Optimization），后者多在做积分。 4. 参数模型与⾮参数模型对于参数模型，参数的数量是固定的，与训练数据的数量⽆关。对于⾮参数模型，参数的熟练不固定，⽽是随训练数据的增加⽽增加。

2020-07-09

机器学习导论中文笔记整理.zip

上海交大机器学习导论主讲教师：张志华主要内容包含： 1.再生核 2.数据降维 3.EM算法 4.多维标度 5.矩阵补充 6.聚类方法 7.判别分析 8.线性分类 9.生成模型 10.支持向量机 11.提升方法

2020-07-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人