自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 数据结构与算法——马踏棋盘(c++栈实现)

马踏棋盘问题是旅行商(TSP)或哈密顿问题(HCP)的一个特例。在国际棋盘棋盘上,用一个马按照马步跳遍整个棋盘,要求每个格子都只跳到一次,最后回到出发点。这是一个 NP问题,通常采用回溯法或启发式搜索类算法求解。在此采用栈进行回溯法求解#include <iostream>#include<stdlib.h>#include <stdio.h>#include <iomanip>using namespace std;const int .

2022-03-20 15:11:04 2921 1

原创 凝聚聚类与层次聚类

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。凝聚聚类算法简述凝聚聚类(agglomerative clustering)指的是许多基于相同原则构建的聚类算法,这一原则是:算法首先声明每个点是自己的簇,然后合并两个最相似的簇,直到满足某种停止准则为止。scikit-learn 中实现的停止准则是簇的个数,因此相似的簇被合并,直到仅剩下指定个数的簇。还有一些链接(linkage)准则,规定如何度量“最相似的簇”。这种度量总是定义在两个现有的簇之间。scikit

2022-03-06 11:53:34 3256

原创 K均值聚类

k均值聚类是最简单也最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心 。算法交替执行以下两个步骤:将每个数据点分配给最近的簇中心,然后将每个簇中心设置为所分配的所有数据点的平均值。如果簇的分配不再发生变化,那么算法结束。

2022-03-05 20:49:21 3677

原创 主成分分析与其在人脸识别中的应用

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。我们在利用无监督学习进行数据变换可能有很多种目的。最常见的目的就是可视化、压缩数据,以及寻找信息量更大的数据表示以用于进一步的处理。而主成分分析是最简单也是最常用的一种方法。主成分分析主成分分析(principal component analysis,PCA)是一种旋转数据集的方法,旋转后的特征在统计上不相关。在做完这种旋转之后,通常是根据新特征对解释数据的重要性来选择它的一个子集。下面将举例说明主成分分析

2022-03-03 19:33:38 3848

原创 数据预处理之数据缩放

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。在监督学习中,有神经网络和SVM等算法对数据缩放十分敏感。通常做法是对特征进行调节,使数据表示更适合于这些算法。通常来说,这是对数据的一种简单的按特征的缩放和移动。常用缩放方法下图为数据缩放的几种方法:上图中,最左边的是有两个特征的二分类原始数据集。而又边的四幅图则为四种数据变换的方法。其中StandardScaler确保每个特征的平均值为0,方差为1,这使得所有特征值都属于同一个量级,但这种方法无法保.

2022-01-11 23:57:53 3471 1

原创 朴素贝叶斯(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。第一部分参考自《统计学习方法》朴素贝叶斯原理如果我们可以通过训练集学习出联合概率分布P(X,Y),那么我们是不是就能预测输入向量的类标记了呢。打个比方,如果我们要通过年龄和身高来预测体重,我们令X=(年龄,身高),Y=体重;假如我们可以通过我们的训练集得知X和Y的联合概率分布,那么当我们要预测X1=(年龄=20,身高=180)的人的体重的话 ,我们只需要求得当X=X1时,P(X,Y)的最大值,而此时的Y就

2021-12-30 17:22:00 289

原创 监督学习各类算法快速总结

K-近邻 适用于小型数据集,是很好的基准模型,很容易解释。线性模型 非常可靠的首选算法,适用于非常大的数据集,也适用于高维数据。朴素贝叶斯 只适用于分类问题。比线性模型速度还快,适用于非常大的数据集和高维数据。精度通 常要低于线性模型。决策树 速度很快,不需要数据缩放,可以可视化,很容易解释。随机森林 几乎总是比单棵决策树的表现要好,鲁棒性很好,非常强大。不需要数据缩放。不适用 于高维稀疏数据。梯度提升决策树 精度通常比随机森林略高。与随机森林相比,训练速度更慢,但预测速度更快,需要..

2021-12-29 20:06:30 191

原创 神经网络(深度学习)(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。一类被称为神经网络的算法最近以“深度学习”的名字再度流行。虽然深度学习在许多机 器学习应用中都有巨大的潜力,但深度学习算法往往经过精确调整,只适用于特定的使 用场景。这里只讨论一些相对简单的方法,即用于分类和回归的多层感知机(multilayer perceptron,MLP),它可以作为研究更复杂的深度学习方法的起点。MLP 也被称为(普 通)前馈神经网络,有时也简称为神经网络。(摘于书中)神经网路模型MLP

2021-12-28 15:10:55 1029

原创 核支持向量机(SVM)(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。之前在逻辑回归与线性支持向量机中学习了可以用于分类的线性支持向量机(LinearSVC),而核支持向量机(SVM)可以用于更复杂的模型,这些模型无法被输入空间的超平面定义。对于支持向量机而言,它可以用于分类(SVC中实现)和回归(SVR中实现),本文只涉及分类。线性模型与非线性特征首先我们来看一下下面的数据集import mglearnimport matplotlib.pyplot as pltfro

2021-12-28 12:44:26 2754 1

原创 随机森林和梯度提升回归树(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。决策树集成集成(ensemble)是合并多个机器学习模型来构建更强大模型的方法。在机器学习文献中有许多模型都属于这一类,但已证明有两种集成模型对大量分类和回归的数据集都是有效的,二者都以决策树为基础,分别是随机森林(random forest)和梯度提升决策树 (gradient boosted decision tree)随机森林对于决策树而言,其存在对训练集过拟合的问题;而随机森林就是解决该问题的一种方法

2021-12-21 11:37:53 3908 1

原创 决策树(decision tree)(笔记)

决策树是广泛用于分类和回归任务的模型。本质上,它从一层层的 if/else 问题中进行学习,并得出结论。 想象一下,你想要区分下 面这四种动物:熊、鹰、企鹅和海豚。你的目标是通过提出尽可能少的 if/else 问题来得到 正确答案。你可能首先会问:这种动物有没有羽毛,这个问题会将可能的动物减少到只有 两种。如果答案是“有”,你可以问下一个问题,帮你区分鹰和企鹅。例如,你可以问这 种动物会不会飞。如果这种动物没有羽毛,那么可能是海豚或熊,所以你需要问一个问题 来区分这两种动物——比如问这种动物有没有鳍。 这一

2021-12-16 18:08:03 2659 2

原创 逻辑回归( LogisticRegression)和线性支持向量机(LinearSVC)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。线性分类模型线性模型不仅用于回归问题,也广泛应用于分类问题。我们首先来看二分类。这时可以利用下面的公式进行 预测:ŷ = w[0] * x[0] + w[1] * x[1] + …+ w[p] * x[p] + b > 0这个公式看起来与线性回归的公式非常相似,但我们没有返回特征的加权求和,而是为预 测设置了阈值0。如果函数值小于 0,我们就预测类别 -1;如果函数值大于 0,我们就预测类别 +1。对

2021-12-14 15:26:22 3816

原创 岭回归(Ridge)和Lasso 回归(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。对于回归问题,线性模型预测的一般公式如下:ŷ = w[0] * x[0] + w[1] * x[1] + … + w[p] * x[p] + b这里 x[0] 到 x[p] 表示单个数据点的特征(本例中特征个数为 p+1),w 和 b 是学习模型的 参数,ŷ 是模型的预测结果。岭回归岭回归也是一种用于回归的线性模型,因此它的预测公式与普通最小二乘法相同。但在岭 回归中,对系数(w)的选择不仅要在.

2021-12-13 21:13:40 9649

原创 线性回归(笔记)

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。对于回归问题,线性模型预测的一般公式如下:ŷ = w[0] * x[0] + w[1] * x[1] + … + w[p] * x[p] + b这里 x[0] 到 x[p] 表示单个数据点的特征(本例中特征个数为 p+1),w 和 b 是学习模型的 参数,ŷ 是模型的预测结果。对于单一特征的数据集,公式如下: ŷ = w[0] * x[0] + b线性回归线性回归,或者普通最小二乘法(ordinary

2021-12-13 20:22:35 1517

原创 K临近分类

最近在自学图灵教材《Python机器学习基础教程》,在csdn以博客的形式做些笔记。K-NN算法是最简单的机器学习算法。其模型的构建仅仅是保存训练集数据。想要对新数据点做出预测,算法会在训练集数据中找到最近的数据点,即“最邻近”点。K临近分类我们首先以只考虑一个临近的最简单版本来了解knn分类,也就是说预测结果为想要预测数据点最近的训练数据点,如下图所示:当然我们也可以考虑任意多个(k个)邻居,如下图:显然上述图对应的问题为二分类问题,但其方法也同样适用于多分类问题。接下..

2021-12-05 21:45:35 1244

原创 b站《双城之战》主题曲《孤勇者》视频评论爬取+简单数据分析+基本可视化(条形图,饼图,词云图)

双城之战更新啦!!!!!《孤勇者》也在b站上线了!!!!《孤勇者》 是真的好听!!!!没听的快给我去听;《双城之战》也是真的好看,没看到快给我去看!!!!今天我们主要是要对《孤勇者》的评论进行爬取,以及简单数据分析和可视化首先开始爬虫传统艺能,找url鼠标右键点检查,然后点击网络然后往下翻到评论区,右边搜索reply点开文件,找到url可以知道url="https://api.bilibili.com/x/v2/reply/main?callback...

2021-11-15 00:01:30 1506 7

原创 java的数据库应用——学生信息管理系统(swing界面)

import java.awt.*;import javax.swing.*;import javax.swing.border.EmptyBorder;import java.awt.event.ActionListener;import java.awt.event.WindowAdapter;import java.awt.event.WindowEvent;import java.sql.Connection;import java.sql.DriverManager;impor.

2021-11-14 20:06:23 1337 1

原创 爬取b站“开启一个时代”周杰伦mv《可爱女人》弹幕,以及词云制作

周杰伦yyds!!!!!!!!!!!周杰伦yyds!!!!!!!!!!!前几天学习了csdn榜一的EDG夺冠弹幕爬取以及词云图的制作,今天心血来潮就来举一反三爬取b站周杰伦《可爱女人》的弹幕制作词云图。打开b站搜索周杰伦,选取点击最多进入视频“亚洲流行音乐之王”映入眼帘接下来让我们把这些弹幕爬下来右击鼠标,选择检查点击“网络”然后刷新浏览器界面接下来只要找到弹幕的网络接口就好啦!但是现在b站已经很难找...

2021-11-10 14:06:32 854 1

原创 Swing固定窗口大小

this.setResizable(false);

2021-11-06 14:13:06 1687

原创 JAVA实现简易文本编辑器设计

废话不多说直接上代码import java.awt.*;import java.awt.event.*;import javax.swing.*;import javax.swing.event.DocumentEvent;import javax.swing.event.DocumentListener;import javax.swing.plaf.FontUIResource;import javax.swing.text.Document;import java.io.*;im

2021-11-06 12:00:50 2507

原创 C语言中For循环语句的一个大坑

通过学习c语言,想必大家都了解了for循环语句:for(条件一;条件二;条件三),但我们今天来讲讲for语句的一个坑for(条件一;条件二,条件三;条件四)对于for(条件一;条件二;条件三)想必大家手到擒来比如int main(){ int x,y; for(x=30,y=0;x>=10;x--,y++){ x/=2,y+=2; printf("x=%d,y=%d\n",x,y); } printf("x=%

2021-11-06 11:47:50 1713 2

原创 用python制作属于自己的逼格(中二)二维码

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言现如今形形色色的二维码出现在我们的生活中,有提示:以下是本篇文章正文内容,下面案例可供参考一、qrcode库示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as np import

2021-11-05 22:57:18 478

原创 c语言实现等价关系的判断以及等价类的输出

原理:设X={1,2,3,......,n},关系R的关系矩阵是M=(mij)判断等价关系(1)R是自反的<=>m11=m22=......=mnn=1 (2) R是对称的<=><=>mij=mji (3) R是传递的<=>tr(R)=R求等价类如果mij=1,即iRj,则算法:Step1 写出n元集合X上关系R的关系矩阵M=(mij)Step2 for i=1 to n 如果m...

2021-11-04 23:39:48 5129 1

原创 爬虫实战 ——百度翻译

使用post请求:requests.post(url,data, headers)寻找url:1.打开百度翻译,随便输入一段值:2.鼠标右击,打开检查选项,点击“网络”3.点击fetch/XHR4.在翻译面板里随便输入或删除一些字,比如把“早上好”的“好”删除我们发现删去“好”后多出了很多新东西,比如sug5,点击sug发现标头里有我们想要的URL:https://fanyi.baidu.com/sug于是我们把url找到了接下来...

2021-11-03 14:49:43 1523

原创 python爬虫requests.get()出现乱码问题

import requestsresponse=requests.get(url)print(response.text)上面是一般的爬虫方法,这样可能会出现乱码问题那么如何解决呢,很简单,只需要加入一行response.encoding = response.apparent_encoding正确代码如下import requestsresponse=requests.get(url)response.encoding = response.apparent_encodin.

2021-10-27 08:25:02 2294

原创 JAVA文件复制和文件加密存储

前言提示:本篇文章主要讲解一下Java如何复制文件,以及Java如何加密文件1.文件复制直接给出实例代码代码如下(示例):package file; import java.io.*; public class Copy { static boolean fileCopy(String src,String dest) { BufferedInputStream br=null;//创建缓冲流 ..

2021-10-26 18:43:24 1157

提示
确定要删除当前文章?
取消 删除