自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SuperFeng

专注于机器学习领域的在校生

  • 博客(55)
  • 收藏
  • 关注

原创 Docker 访问 Linux 宿主机的 localhost

Docker 镜像访问 Linux 宿主机的 localhost 需要使用 Linux 宿主机的 IP 地址。Linux 宿主机访问 Docker 镜像需要使用 Docker 的 IP 地址;

2023-08-11 14:34:56 191

原创 SpringBoot解决跨域问题

当交互的两个 url 协议、域名、端口三者之间任意一个不同即为跨域。

2023-07-07 22:13:55 314

原创 BIOS--INT 0x10

在没有操作系统的情况下,使用 BIOS 加载一个 x86 16 位汇编语言程序,在屏幕上显示一串字符串。该程序用到了 BIOS INT 0x10 中断,该中断的详细用法在以下链接处。https://blog.csdn.net/qq_40169767/article/details/101511805汇编语言代码:屏幕显示的结果:...

2022-07-04 11:14:41 1350 1

原创 Linux快速上手6:常用命令之压缩解压命令

举例:ps:举例:tar功能描述打包目录压缩后的格式语法tar [-选项(-zcf)] [压缩后文件名] [目录]-c:打包(c 是 create 的缩写)-v:显示详细信息(v 是 verbose 的缩写)-f:指定打包名(f 是 file 的缩写)-z:打包同时压缩(使用bzip 压缩)-x:解包(x 是 extract 的缩写)-j:使用 bzip2 压缩举例:.zipzip功能描

2022-07-01 10:24:28 158

原创 Linux快速上手5:常用命令之帮助命令

举例:ps:1 为命令的帮助,5 为配置文件的帮助通常 man 手册中的内容很多,可能不太容易找到你想要的结果,不过幸运的是你可以在 man 中使用搜索 ,查找完毕后你可以使用 键切换到下一个关键字所在处, 为上一个关键字所在处。使用 ,(vim 编辑器的移动键)进行向前向后滚动一行,按下 退出。Linux 中,手册通常被分为 8 个区段。举例:help功能描述获得 shell 命令帮助信息语法help [命令或配置文件]举例:ps:欢迎关注微信公众号「Su

2022-06-26 08:50:08 122

原创 Linux快速上手4:常用命令之权限管理命令

举例:文件与目录的读、写、执行权限内容rwx文件数据读取文件的内容修改文件的内容执行文件的内容目录文件名读取文件名修改文件名(包括对文件的删除)进入该目录的权限其他权限管理命令chown英文change file ownership功能描述改变文件或目录的所有者语法chown [用户] [文件或目录]举例:chgrp英文change file group ownership

2022-06-17 16:27:48 79

原创 Linux快速上手3:常用命令之文件处理命令

举例:ls -l 显示格式举例:cd英文change directory功能描述切换目录举例:ps: 代表当前目录; 代表当前目录下的上级目录举例:cp英文copy功能描述复制文件或目录语法cp [-选项] [要复制的文件] [要复制到的位置]-r:复制目录(r 是 recursive 的缩写)举例:mv英文move功能描述剪切文件或目录、改名语法mv [原文件或目

2022-06-10 09:46:00 101

原创 Linux快速上手2:文件名颜色的含义与目录结构

在 Linux 中,文件名颜色的含义如下:蓝色:目录白色:普通文件绿色:可执行文件红色:压缩文件浅蓝色:链接文件黄色:设备文件灰色:其他文件绿底:为目录且权限为其他人并拥有写权限......

2022-06-06 08:42:59 1480

原创 Linux快速上手1:初学者应当知道的事

Linux初学者应当知道的事。Linux 主要发行版本。虚拟机网络配置。

2022-06-03 10:17:52 83

原创 利用Python对整段文本去除空格和回车字符

先说一下写这篇文章的目的。最近在写论文,因此需要查阅大量的文献,在引用他人的文献时,需要复制文本,复制下来的文字经常会出现大量的乱码,如下图。手动处理格式,比如删除空格和回车字符十分令人头疼,成为了一个体力活,因此我想能不能利用 Python 写一个小程序自动处理文章格式,把文字中的空格和回车字符全部删去,最后的结果变成下图。下面开始动手做。思路是,先打开 txt 文件,按行读取其中的文本,保存为字符串,对字符串删除所有的空格与回车字符,然后将所有行的字符串拼接成为一个大字符..

2021-05-11 10:56:11 5127

原创 Java 安装 JDK 与环境变量 path 配置

1 下载 Java JDK下载 Java JDK,登录https://www.oracle.com/java/technologies/javase-downloads.html,选择最新 Java JDK 版本下载,我下载时最新版本为 Java 15。2 安装 Java JDK点击下一步 -> 下一步一直到安装结束。3 环境变量 path 配置右键点击此电脑进入属性。点击高级系统设置。进入环境变量。在系统变量中添加一个变量名为 JAVA_HOM

2021-01-07 17:41:26 557

原创 两数之和

题目来源LeetCode #1https://leetcode-cn.com/problems/two-sum/语言C/C++题目两数之和描述给定一个整数数组 nums和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。样例输入:...

2020-03-13 21:56:00 260

原创 迷宫的最短路径

题目来源挑战程序设计竞赛(第二版)语言C/C++题目迷宫的最短路径描述给定一个大小为 N * M 的迷宫。迷宫由通道和墙壁组成,每一步可以向邻接的上下左右四格的通道移动。请求出从起点到终点所需要的最小步数。请注意,本题假定从起点一定可以移动到终点。样例输入:N=10,M=10(迷宫如下所示。'#', '.', 'S', 'G' 分别表示墙壁、通道、起点和终点...

2020-03-05 20:53:40 1324 1

原创 部分和问题

题目来源挑战程序设计竞赛(第二版)语言C/C++题目部分和问题描述给定整数 a1, a2, ..., an,判断是否可以从中选出若干数,使它们的和恰好为 k。样例1输入:n = 4a = {1, 2, 4, 7};k = 13输出:Yes样例2输入:n = 4a = {1, 2, 4, 7};k = 15输...

2020-02-01 09:58:59 1659

原创 C源代码是如何跑起来的?

身为程序猿,C 语言大家一定都不陌生了,还记得当年在黑窗口中第一次显示出 hello, wordl! 时激动的心情吗?平时我们在写 C 程序时都用 IDE(集成开发环境),写好源代码之后点一下按钮,一键运行。但是不同的 IDE 会出现不同的按钮,甚至还有多个按钮,什么先点编译,后点运行(当时老师就是这么说的,咱也不知道为什么,照着做就是了)。随着越来越深入了解计算机,我逐渐地明白了其...

2019-12-17 10:48:36 2002

原创 我写了一个Python小项目

最近我写了一个 Python 练手小项目,它是一个 PC 桌面版的便签程序,很简陋。写这个小项目是为了熟悉一下用Python 进行一个完整的项目开发,进一步熟练 Python 的使用。界面是这样的:这个小项目所用到的技术有:1.前端图形化界面(GUI):wxPython + wxFromBuilder2.后端MySQL数据库 + Python开发这个便签小...

2019-09-25 14:54:16 3527

原创 XPath+requests库爬取猫眼电影

之前我们用正则表达式 + requests 库爬取猫眼电影 TOP 100,原文链接在这里:https://blog.csdn.net/S1998F/article/details/97916617但是正则表达式很复杂,也很难学,我们能不能不用正则表达式匹配想要的内容呢?答案是可以的,这次我们选用 XPath 来解析内容。要获取的内容还是排名、电影海报、电影名称、演员和上...

2019-08-01 10:57:46 703

原创 requests库+正则表达式爬取猫眼电影

我们用 requests 库 + 正则表达式构建一个简陋的爬虫,虽然这个爬虫很简陋,但是通过这个例子我们可以对爬虫有一个很好的了解。这次目的是爬取猫眼电影 TOP 100,要想爬取这些信息,我们首先要到猫眼电影 TOP 100 的页面上观察一下(也可以说踩点)。网址为:https://maoyan.com/board/4这就是我们要爬取的页面,现在我们来写一段代码自动访问这...

2019-07-31 15:43:30 853

原创 一定要知道的Python内置数据结构

我喜欢 Python 的原因之一是因为它简单,短短几行代码就可以做很多事情。Python 内置了很强大的数据结构,我们可以直接用,不必像其他语言一样先构造数据结构再使用。Python 内置了四种数据结构:列表、元组、字典、集合。只要掌握这四种内置数据结构,基本上就可以解决 80% 需要数据结构的问题了。在 Python 中,万物皆对象,因此存储在数据结构中的数据全部都可以按照对象来看待。这四种内置...

2019-07-09 11:06:10 208

原创 PyCharm的高效使用技巧

以前在写 Python 代码时,总觉得效率很低,因为要时不时地动动鼠标、调整一下格式。这一分神,思路就被打断了,再想接上刚才的思路又得花好长时间...但是自从知道了下面这几个 PyCharm 的使用技巧后,效率大幅提升,代码敲的也有感觉了(扶我起来,我还能写代码)。这几个 PyCharm 的使用技巧都是我亲身体会很常用且很好用的技巧,现在分享给大家。... ...1....

2019-07-05 11:40:16 1230

原创 机器学习系列25:随机梯度下降算法

如今机器学习的数据集动则几千万或上亿,如果运用我们之前学过的 Batch 梯度下降算法,就会发现效率很低,因为在梯度下降时,每次循环都要对所有的数据进行求和,这会浪费大量的时间。有没有更好的方法去处理大数据呢?答案是有的。我们在处理大数据时,会选择随机梯度下降算法(Stochastic gradient descent)。下面是随机梯度下降算法的代价函数:之后是随机梯度下降算法:...

2019-06-10 09:43:25 1707

原创 机器学习系列24:协同过滤

在上一次中,我们是先知道电影的特征,然后通过算法计算出用户的特征。下面我们来考虑一下能不能知道用户的特征,让算法学习出电影的特征呢?我们可以看到,这个算法与之前的算法是一样的,只不过传入的特征不同而已。我们可以先随机地求出一些用户特征 θ,用这些特征计算出电影的特征 x,通过电影的特征又能更好地计算出用户的特征,不断迭代... 最终会收敛到一个最优的位置,这时用户的特征和电影的特征被计...

2019-05-29 18:49:27 370

原创 机器学习系列23:基于内容的推荐算法

如今,推荐算法已经深入到我们生活的各个方面,比如说淘宝根据我们之前的浏览记录给我们推荐想要购买的商品;抖音不停地给我们推荐各种我们感兴趣的视频(虽然我个人不太喜欢抖音,觉得抖音会让我们丧失独立思考的能力,但是它的推荐算法还是很厉害的)。。。这些推荐算法极大地便捷了我们的生活,身为一个学习机器学习的同学,怎么能不关注一下推荐算法呢?下面来举个栗子:如今有一个电影推荐系...

2019-05-22 13:40:11 832

原创 机器学习系列22:异常检测

现在有一个网站,为了防止该网站被人恶意攻击,你采取了以下措施。给每个用户建立用户画像,记录他的一些操作,例如:打字速度,浏览时间,点击网页次数等等。。。可以将这些特征建立一个模型,让它有一个阈值,当低于这个阈值时,就可能是有人在恶意攻击你的网站,这时候你就要小心了。就像下图,如果超出蓝圈,那这个数据就有可能发生了异常:那么这个模型是怎么建立出来的呢?用到的是异常检测算法(Anomal...

2019-05-15 18:32:59 692

原创 机器学习系列21:降维

降维(Dimensionality Reduction)可以保持数据在原有特征的基础上对数据进行压缩,从 3D 降到 2D,使得数据的分布情况不发生改变,如下图:降维还有一个作用,就是能更好地可视化数据。比如说,现在有一个数据集,有 50 个特征,如果想通过图像来分析这个数据集,目前是做不到的,因为只能画出三维图像,也就是说特征数为 3。但是如果运用降维,把特征数从 50 降到 3,你就可...

2019-04-28 19:25:49 222

原创 python 中 numpy 的 shape 方法

numpy 中的 shape 方法返回的是一个数组的大小。我们定义了一个 numpy 数组:from numpy import *group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])使用 shape 方法查看该数组的大小:group.shape得到结果(4, 2)shape 方法还可以按维度进行...

2019-04-26 16:24:06 702

原创 C 语言中关于无符号整数的一些问题

身为一名程序员,或多或少都会了解一点 C 语言,我现在还清楚地记得,大一刚接触 C 语言时被它所支配的恐惧。C 语言无比强大,被称为「高级汇编语言」足以见得它的威力,也可以看出它经常与计算机底层打交道;它的指针部分更为精彩(也是最难的部分),那么我们就跳过它最难的部分,检查一下你对 C 语言掌握的程度。下面是一个函数 sum_elements( ),它的作用是对给定的数组中所有元素求和并...

2019-04-22 18:18:43 2790

原创 机器学习系列20: K-均值算法

在无监督学习中,我们会把没有标签的数据集交给算法,让它自动地发现数据之间的关系,聚类算法(Clustering algorithm)就是一种无监督学习算法。它会自动地将无标签的数据集进行分类,如下图:它会将这个数据集划分成两类,每一个绿圈就是一类。在聚类算法中,最常见的就是 K-均值算法(K-means algorithm),我们先来看看这个算法在下面这个数据集中是如何进行工作的...

2019-04-17 18:05:16 484

原创 机器学习系列19:将核函数应用于支持向量机

当我们在已知参数的情况下,如何用带有核函数的支持向量机(SVM)去训练假设函数呢?首先我们将样本做为标记:对于每一个 x,都要计算出它的特征 f,f 为一个向量:如果下式成立,就可以预测 y 等于 1,也就是为正样本:但是如何选取参数呢?我们最小化下面这个函数的时候,就可以得到参数向量:现在还有两个系数没有选择,C 和σ^2。C 相当于 1...

2019-04-10 17:14:11 447

原创 初识Python中matplotlib库

最近遇到个任务需要画一些坐标图,我就在想,用了这么长时间的 Python 了,能不能用 Python 画图呢?学习一门语言不能只为了学习语言而学习,要做到学以致用。Google 了一下,果然有新的发现,Python 中 matplotlib 库是专门用来画图的,操作了一番后,发现用 Python 画图真的爽,人生苦短,快用 Python!下面简单的介绍一下 matplotlib 库的用法,起到一个...

2019-04-04 22:58:29 408

原创 机器学习系列18:核函数

让我们来考虑这样一个问题,现在给定一个数据集,让你划分出决策边界,该怎么办呢?数据集中正样本为「叉」,负样本为「圈」,如下图:第一反应就是用一个高阶多项式去构造一个假设函数,当假设函数大于等于零时,我们就可以认为它为正样本,否则为负样本,类似下面这种形式:但是有一个问题出现了,我们不能确定构造的假设函数就是最符合这个例子的高阶多项式,可能还有其他的高阶多项式能够更好地符合这个例子。...

2019-04-04 14:50:16 332

原创 机器学习系列17:支持向量机

支持向量机(Support vector machine)是一种强大的机器学习算法,和神经网络相比,它在学习复杂的非线性方程时,能够提供更清晰和更加强大的方式。为了学习支持向量机,我们可以先从逻辑回归开始,看看如何经过小小的改动能得到支持向量机。在逻辑回归中,假设函数 h_θ(x) 为:图像为:对于一个样本来说,代价函数为:当 y =1 时,第二项为 0,只需要考...

2019-03-31 16:30:23 311 2

原创 机器学习系列16:机器学习系统设计

偏斜分类的误差评估举个例子,我们想训练一个模型去诊断患者是否患有癌症。在人群中,患有癌症是一个极小概率发生的事情,比如 1000 个人中患有癌症的只有 5 人。那么在这个样本中,患有癌症的人的概率为 0.5%,正常人的概率为 99.5%,这是一个偏斜类,正结果(设为 1 )占总样本数极小。如果我们训练的机器学习模型的正确率为 99%,看似这个正确率非常高,模型表现的很好,可是考虑下面...

2019-03-27 16:52:42 321

原创 机器学习系列15:学习曲线

我们在调试一个学习算法时,通常会用学习曲线(Learning Curves)观察机器学习算法是否为欠拟合或过拟合。随着样本数的不断增大,我们发现在高偏差(欠拟合)时交叉验证集代价函数J_cv(θ)和测试集代价函数J_test (θ)的图像如下,这个图像也叫做学习曲线(Learning Curves):在高偏差时,随着样本数目的增加,测试集的偏差与交叉验证集的偏差几乎...

2019-03-24 19:16:11 1621

原创 机器学习系列14:偏差与方差

在训练机器学习模型中,结果不能被很好地预测通常是因为高偏差(欠拟合)或高方差(过拟合)。把交叉验证集的代价函数和测试集的代价函数画在一个图像中:左面红色部分为高偏差(欠拟合),右边红色部分为高方差(过拟合)。对于如下模型,线性回归正则化的代价函数为:其中蓝色框为正则化项,λ 越大,代表对参数的惩罚就越大。训练集代价函数J_train (θ)、交叉验证集代价函数...

2019-03-21 18:10:06 390

原创 机器学习系列13:机器学习诊断法

在机器学习中,我们训练了一个模型,可能会发现这个模型得到的数据与实际数据偏差太大。这时,通常我们会在如下办法中选择去优化我们的算法: 得到更多的训练集; 减小特征的数目; 尝试去增加特征; 增加多项式; 增大 λ; 减小 λ。 以上这些步骤通常会花费你大量的时间,而且毫无目的地选择很可能会没有效果。为了防止以上的事情发...

2019-03-17 17:31:49 606

原创 机器学习系列12:反向传播算法

当我们要运用高级算法进行梯度下降时,需要计算两个值,代价函数和代价函数的偏导数:代价函数我们之前已经知道怎么求了,现在只需要求代价函数的偏导数即可。采用如下方法,先进行前向传播算法,然后再进行反向传播算法(Backpropagation Algorithm),反向传播算法与前向传播算法方向相反,它用来求代价函数的偏导数。具体过程看下图:用 δ 作为误差,计算方法为:...

2019-03-14 15:17:24 642

原创 机器学习系列11:神经网络

什么是神经网络(Neural Networks)呢?最开始科学家想用算法去模拟大脑达到人工智能。通过一系列的实验发现,大脑是通过神经元进行工作的,神经元之间通过电信号传递信息。于是他们就开始模拟神经元的工作过程,用算法去模拟神经元,这就形成了神经网络。神经网络可以用来学习复杂的非线性假设模型。如下图,蓝色圈模拟输入信息,黄色圈模拟神经元,假设函数h_θ(x)模拟输出信息,该函数就是我...

2019-03-11 17:38:16 226

原创 用 Python 对链表进行操作

学数据结构时,一直用 C 语言,C 语言中有指针,实现链表很方便,对链表进行操作只需要修改指针的指向即可。但是最近用 Python 刷 LeetCode 题,发现 Python 没有指针这个概念,刚开始确实不太适应,吃了不少苦头。好在查阅了大量的资料,理解了如何用 Python 对链表进行操作。因为 Python 是动态语言,不需要进行变量声明,可以直接把对象赋值给变量。Python ...

2019-03-09 10:30:05 940

原创 Python中连续赋值需要注意的事项

在 Python 批量连续赋值时,等号的右边为局部变量,不会因为等号左边值改变而改变。以 LeetCode 中 206.Reverse Linked List 题为例,要反转一个单链表,原来的顺序为:[1,2,3,4,5];现在的顺序为:[5,4,3,2,1]。class ListNode: def __init__(self, x): self.val = x ...

2019-03-08 22:33:14 3001

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除