自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (1)
  • 收藏
  • 关注

原创 tailwind css + vuejs3实现过渡(transition)效果

tailwind css + vue3 = easy and beautiful transitions不得不说,tailwind css 和vuejs可真是绝配,在transition效果的实现上也是如此。本文将简洁地分享使用tailwindcss 和 vuejs 3实现过渡的干货。以下的知识讲帮助读者更轻松地掌握文中的内容:vue.js3 与 tailwind css 的搭建与整合(使用vite)。css基础,尤其关于transition及transform的相关知识。代码话不多说,直接

2021-04-09 23:05:37 1655

原创 ASFG - AI可以帮你自动生成字幕文件

ASFG - 字幕文件自动生成系统与大数据文摘合作引进fastai课程期间,我第一次了解到了字幕生成和翻译的繁琐和困难,其中仅打时间轴这一项内容,随文字量需要花费原视频时长1.5-2.5倍的时间,日常看似不起眼的字幕制作需要花费幕后人员大量的功夫。如此繁重的工作,如今的AI能够做些什么呢?在这个想法的推动下,考研完我开始尝试这个项目。项目地址:github,欢迎星标 ????直接上手当前ASFG还处于裸奔阶段,尚未打包为可以独立运行的程序,因此需要python环境的支持(括号部分为构建程序运行环境

2021-02-15 22:50:27 3115 14

原创 Gradient Boost回归实例化解析

文章目录Gradient Boost特性 - 相对于AdaBoostGradient Boost原理Gradient Boost生成原理Gradient Boost 数学原理输入本文通过文字方式记录YT StatQuest关于Gradient Boost的系列讲解,方便总结回顾视频内容。理性前提为了解决策树和AdaBoost的相关内容。Gradient Boost有广泛的解释方法,此为最常用而且比较好理解的一种。多图预警Gradient Boost特性 - 相对于AdaBoostGradien

2020-08-11 11:47:51 833

原创 Adaboost实例化完全解析

文章目录什么是Adaboost?如何生成Adaboost?获得排序顺序category特征continual特征影响力分配总过程使用AdaBoost预测本文前提假设已了解决策树和随机森林。图片资源来自YT StatQuest。什么是Adaboost?Adaboost是由多个决策树桩(最简单的二分决策树)组成的森林体系(forest):相比于随机森林,Adaboost主要体现出了以下随机森林不具备的特性:全部使用weak leaners - 也就是决策树桩 - 来进行分类,每个特征对应一个树桩

2020-08-09 11:05:22 436

原创 fastai2019深度学习课堂笔记

文章目录deep learning pipeline获得源数据数据处理处理源数据data segmentationprogressive resizingnormalizationdatablocks模型构建16位浮点运算模型训练fit_one_cycle模型评估训练集误差和验证集误差模型调试实战经验作为自学党,走入深度学习所面临的主要问题不是理论知识多少,而是怎样理论结合实际,也就是说:怎么写代码。为此,基于pytorch高度封装的fastai是很好的选择,其相关课程内容也注重代码,能够比较好地帮助初学

2020-07-13 10:55:56 546 3

原创 使用Pseudo Labeling(伪标签)提高模型的分类效果

文章目录Pseudo Labeling原理实际应用Pseudo Labeling pipeline写在最后Pseudo Labeling原理目前为止,大部分的机器学习和深度学习分类问题都需要大量的数据进行训练,而人类往往通过认识几个新鲜事物就能够很好地进行判断,这主要是由于人类可以由自己的判断产生的结果进行推断和强化但是机器面对未知的对象却不行。这种相差巨大的判别机制让人们开始思考机器进行认知分类任务的原理能够有所改进,于是Pseudo Labeling应运而生。简而言之,Pseudo Labelin

2020-07-12 17:03:31 2383

原创 Windows 10 vscode settings sync报错

今天换电脑,把vscode装到D盘,却无论如何无法使用settings sync同步设置首先是无法连接网络登录GitHub,于是百度通过手动添加gist id和token实现了登录之后alt shift d还是只会弹出错误,分析一波错误信息,尝试把D盘上的code exe文件设置为通过管理员方式运行,再下载就OK了!也许把vscode安装到C盘上就不会有这样的问题~最后,下了几个插件不动了,卡在第五个插件就是无法再下载了。。。于是进入github gist 中手动强行删除了插件对应的文件内容。终于,除

2020-06-01 19:36:55 884

原创 词袋模型(bag-of-words)--- python自然语言处理基础

文章目录词袋模型词袋模型

2020-05-05 18:29:35 2594

原创 python机器学习 - 走进集成学习的世界(装袋法 - bagging,自适应增强 - adaptive boosting)

文章目录集成学习,who are you?多数投票集成学习,要你何用?source:python machine learning 3rd集成学习是机器学习领域相当重要的一个概念,本篇文章中所关注的集成学习就是使用多个模型,采用同一训练集进行训练后,对样本运行多数投票的方式来确定分类,如果你不关注多数投票而是渴求更加高深莫测的算法,那么这盘基础性的文章将不值得你花费时间集成学习,who ar...

2020-04-19 18:01:02 838

原创 一篇文章总结python机器学习类不平衡问题的处理-class imbalance(ROC,混淆矩阵,f1 score等)

文章目录迷惑矩阵准确度,召回率和f1 scoreROC多类分类问题-加权均分其它方法迷惑矩阵准确度,召回率和f1 scoreROC多类分类问题-加权均分其它方法

2020-04-15 16:19:07 1049

原创 一篇简明的python机器学习模型评估与超参数调试基础总结(交叉验证,学习曲线,网格搜索等)

文章目录交叉验证交叉验证原理选择Kpython实现分层交叉验证source:python machine learning 3rd高方差和高偏置是机器学习碰到的常见问题,而在高方差及高偏置之间寻找一个平衡点从而对模型进行准确的预测涉及到了我们对模型的评估(找到问题)和对超参数的调整(解决问题),其中最典型的超参数就是正则系数λ\lambdaλ,它的大小直接影响了模型在高方差和高偏置之间的表现。...

2020-04-13 18:06:01 975 1

原创 想知道最新的steam免费领取游戏?python爬虫来帮忙

文章目录前言代码特性源码还有更多前言疫情在家期间,玩玩游戏无疑是很好地放松休闲手段。而许多游戏在steam等平台上则通过限时免费领取的吸引更多玩家的参与,再加上上次差点就错过古墓丽影9的免费领取时间,看来我又需要python来做一个自动化爬虫小帮手了!爬取免费游戏界面当然可以直接爬取steam,但是epic等发行平台也有许多相当不错的免费游戏。想要全面地了解世界范围内的限时免费领取游戏?ep...

2020-04-11 19:35:14 1479 2

原创 简明KPCA及其python实现(核主成分分析)

文章目录KPCAKPCA, PCA与LDA核心方程RBF KPCApython实现KPCAsource:python machine learning 3rdKPCA核主成分分析-kernel principal component analysis,是一种用于非线性分类的降维工具,实现非线性映射降维右图维典型的非线性分类问题KPCA, PCA与LDAPCA:主要用于线性非监督学习...

2020-04-07 22:33:14 12601 6

原创 线性判别分析LDA(linear discriminant analysis)与二次判别分析QDA(quadratic discriminant analysis)

文章目录LDA与PCALDA python实现Source: Python Machine Learning 3rdLDA与PCALDA和PCA都用于数据维度降低LDA可以视为比PCA高级的分类技巧,但在实践情况下,使用PCA比使用LDA在图像识别等领域表现更好LDA用于监督学习,而PCA用于非监督学习PCA寻找最大方差的正交分量轴,LDA寻找优化分类的特征子空间LDA pyt...

2020-04-06 10:50:54 2226

原创 主成分分析-python机器学习实现(PCA)

文章目录numpy + pandas实现1. 标准化原始数据集2. 获得协方差矩阵3. 获得特征向量和特征值4. 按照特征值降序排列相应的特征向量5. 选择k个特征值最大的特征向量6. 获得k维矩阵,W7. 使用W实现维度转换sickit-learn直接实现代码思路来自Python Machine Learning 3rd,本人只是做了一些修改numpy + pandas实现我们以panda...

2020-04-01 17:39:03 1291 1

原创 python实现SBS(sequential backward selection)

文章目录什么是SBSSBS原理源码结语什么是SBSSBS是减少数据维度的最佳解决方案,它能够实现将数据的特征维度从m降到k的功能SBS原理降低一个维度,使用剩下的维度进行预测,获得结果分数重置维度,重复第一步,其中降低另一个维度,直到获得了所有的降低其中一个维度获得的分数选择第二步中得分最高的组合检查当前数据维度k是否等于目标维度,如果等于,当前特征组合则为目标特征组合,否则从第一...

2020-03-31 12:57:58 1570

原创 棒棒的二维数据可视化分类模型

文章目录源码优势局限代码实现原理预处理创建标记和颜色生成器确定坐标轴数据范围基于数据范围创建网格坐标获得预测机器网格坐标绘制绘制等高线图绘制样本分布散点图高亮测试集示例SVM最大边界设定截止参数的SVM源码源码来自Python Machine Learning 3rd,Chapter 3,自己加入了一些理解和修改优势适用于大多数分类算法模型,对不同参数的统一模型都能够绘制出不同的决策边界...

2020-03-29 13:22:13 1536

原创 python实现SGD(stochastic gradient descent)算法

文章目录源码知识点1. 实现参数(权重)矩阵初始化小值:2. 打乱数据3. 实现随机梯度下降4. 使用函数实现数据处理步骤5. 在保持初始化后权重不变的情况下实现训练6. 返回自己结果源码此为适应机使用随机梯度下降的python实现,代码主要来源于Python Machine Learning 3rd(此书包含大量python实现算法的源码,宜啃读)自己把代码又弄了一遍,欢迎想看或者看过这本...

2020-03-25 18:14:26 6613 2

原创 感知器和适应机(Perceptron & Adaline)

文章目录共同点区别点代码演示感知器适应机共同点感知器和适应机都是用于线性二元分类问题的模型感知器和适应机都需要使用阈值函数,确定分类标准图中θ\thetaθ为阈值都是逐步学习,优化参数区别点适应机使用激活函数对输入数据多进行了一次处理,再使用激活函数产生的误差值进行参数优化,感知器则是直接利用分类结果进行参数优化适应机通过使用误差能够对输入数据进行连续优化,并且通过激活函数...

2020-03-25 11:45:10 1103

原创 Andrew Ng带我漫步机器学习 - 第十一周 OCR

OCRpipelineOCR识别原理人工数据层级分析pipelinepipeline是解决一个机器学习任务的各项步骤及其执行顺序,以photo OCR为例:Photo OCR可以分为文本识别,字符分割和字符识别三个过程,依次完成,就如同管道一样,依次向前OCR识别原理选择一定像素长度和宽度的方框,自顶向下以几个像素单位逐渐扫描整个图片对识别出来的文本进行判断图中,y=1表...

2020-03-21 19:41:16 146

原创 Andrew Ng带我漫步机器学习 - 第十周 处理大数据

大数据大数据梯度下降随机梯度下降随机梯度下降算法算法评估随机梯度下降优化小批量梯度下降在线学习分布式计算机系统和数据平行大数据梯度下降机器学习近阶段的进步很大一部分来自数据集和算力的爆炸性增长,比如神经网络算法面对大数据时,仍然使用常规的梯度下价格算法会带来巨大的计算量根据学习曲线,减少数据集时可行的。随着训练样本增多,误差值越来越平稳,不需要重复计算随机梯度下降随机梯度下降算法...

2020-03-21 17:14:52 87

原创 Andrwe Ng带我漫步机器学习 - 第九周 异常检测模型和推荐系统

异常检测模型密度估计高斯分布(正态分布)密度估计算法单个样本样本集异常检测问题的目的是通过训练已知异常或正常的样本集,获得能够检测新样本正常与否的模型异常检测模型模型拥有明确的标签分类(异常/正常,合格/不合格),但是却主要用于非监督学习如图,寻找合适的数学模型计算样本特征值,获得概率p(x)p(x)p(x),根据概率是否满足阈值条件进行分类判断,如计算机性能检测和制造业异常检测密度估计...

2020-03-20 15:45:18 164

原创 Andrew Ng带我漫步机器学习 - 第八周 非监督学习K-means算法与PCA

非监督学习集群(clustering)K-means算法连续集群集群(clustering)非监督学习与监督学习的区别可以从以下几个考虑原始数据没有标签原始数据集没有明确关系或明显的分类特征原始数据集没有y面对非监督学习问题,集群是常用的方法集K-means算法集群种类为K,训练样本为x(i)...i=(1,m){x^{(i)}...i=(1,m)}x(i)...i=(1...

2020-03-19 10:51:00 180

原创 Andrew Ng带我漫步机器学习 - 第七周 支持向量机SVM

支持向量机优化目标模型转换代价函数假设方程模型原理数学边界最大间隔分类器数学原理 - 略,不略也看视频好些优化目标模型转换在y=0/1时,分别将逻辑回归模型曲线转换为近似的折线y=0时, 转折点在z=θTxz=\theta^Txz=θTx = -1处,z>−1z > -1z>−1时,cost > 0y=1时, 转折点在z=θTxz=\theta^Txz=θTx...

2020-03-17 11:44:31 154

原创 Andrew Ng带我漫步机器学习 - 第六周 机器学习应用指南

机器学习应用指南算法评估训练集与测试集多项式与交叉验证集方差与偏置多项式正则化学习曲线算法评估面对途中问题,随机尝试列举的解决方案并不合适,我们需要一套高效的评估方案来寻找到关键问题所在,对症下药,解决问题训练集与测试集评估机器学习算法的首要且必要步骤步骤就是将数据分割为训练集(training set)和测试集(test set)7:3(不一定)分割输入集为训练集和测试集对训练集...

2020-03-16 11:29:21 121

原创 Andrew Ng带我漫步机器学习 - 第五周 神经网络算法

神经网络算法代价函数参数分析反向传播梯度下降反向传播实现原理算法优化展开参数梯度检验随机初始化算法应用综析选择合适的神经网络结构训练神经网络算法神经网络实战-无人驾驶汽车-略代价函数相比逻辑回归代价函数,大概八成新J(Θ)=−1m∑i=1m∑k=1K[yk(i)log⁡((hΘ(x(i)))k)+(1−yk(i))log⁡(1−(hΘ(x(i)))k)]+λ2m∑l=1L−1∑i=1sl∑j...

2020-03-15 11:58:29 130

原创 Andrew Ng带我漫步机器学习 - 第四周 非线性假设-神经网络模型

非线性假设-神经网络为什么还需要神经网络?神经网络模型模型展示公式参数矩阵实现向前传播自学习特征多类分类一对多模型为什么还需要神经网络?线性回归和逻辑回归确实可以解决大量的监督学习问题,但是在非线性多项式假设方程中,随着样本集特征数的增多,参数会成指数级的增长,给算法带来几乎不显示的巨大计算压力,此时,我们需要引入神经网络最典型的神经网络问题就是计算机视觉,每个像素都是一个特征量,组成多项式...

2020-03-14 11:59:58 260

原创 Andrew Ng带我漫步机器学习 - 第三周 分类问题逻辑回归与过拟合及其正则化

分类逻辑回归与过拟合正则化分类问题假设方程决策边界逻辑回归模型代价函数梯度下降高级优化参数优化方法算法实践多类分类一对多模型过拟合什么是过拟合正则化原理正则化线性回归梯度下降正态方程正则化逻辑回归正则化代价函数正则化梯度下降分类问题分类问题满足二元判断,根据计算机二进制原理,只有0,1两种情况,比如有/无,对/错,是/否等分类问题需要设定阈值,高于/低于阈值对应二元分类问题的两种情况由于...

2020-03-13 20:14:55 134

原创 Andrew Ng带我漫步机器学习 - 第二周 线性回归

线性回归多元线性回归基础特征基础参数分析假设方程矩阵计算梯度下降多元线性回归优化特征缩放均值归一化学习因子α\alphaα多项式回归正态方程公式正态方程与梯度下降比较不可逆性Octave & Matlab教程 - 略多元线性回归基础拥有多个变量(>=3)的线性回归称为多元线性回归特征基础参数分析x(i) = 第i个输入训练样本xj(i)x_j^{(i)}xj(i)​ =...

2020-03-13 14:02:14 153

原创 Andrew Ng带我漫步机器学习 - 第一周 什么是机器学习?

什么是机器学习机器学习概念监督学习非监督学习模型及代价函数参数介绍模型展示代价函数一元函数寻找全局最小值二元函数寻找全局最小值梯度下降算法写在前面 - 课程最前面整个课程中我们将学习包括监督学习和非监督学习在内的诸多算法,以及如何使用它们机器学习概念关于机器学习还没有一个统一绝对的定义, 但我们仍然可以获得较为清晰的理解:“Field of study that gives comput...

2020-03-12 21:46:41 91

原创 electron 安装,卡在node install.js解决方法

今天在安装electron时碰到了一系列的麻烦,不在此赘述,总之,electron 碰到的问题是身处墙内通用的问题,于是我将记录一下通用的解决方法,实现流畅下载命令行运行npm install -g nrm 安装完成随后 nrm use taobao, 再 npm install electron 或者 npm install -g cnpm, 再使用cnpm代替npm运行命令行,如c...

2020-02-18 20:38:59 5830 1

原创 git push to github

prepare for GITif you just start to use git, open git bash and set configgit config --global user.email "...(your email)"git config --gloval user.name "...(your name)"set up a git reposito...

2020-02-08 17:17:09 230

原创 ... .indexOf is not a function at OnSelection

使用vue + bulma + fontawesome 设计app当在<i class="" ...>中加入@click监听时会出现报错:event.target.className ... .indexOf is not a function at OnSelection,在百度上不得答案,检查代码调试无数遍,花了一个多小时,最终锁定原因是方法没有被识别出来,js中没有任何方法被...

2019-12-02 12:56:17 600

原创 关于mobi书籍文件合并

前言:最近想把阿西莫夫的基地七部曲加到kindle中,可是一想这么多书多乱啊,于是乎内心的强迫症再次迫使我去研究这个问题尝试过网上在线的转换工具,效果都不理想,最后还是看着百度的回答决定去鼓捣calibre经过几个小时的奋斗,我结合网上的方法和自己的实际经验总结出了实现mobi和epub文件合并的步骤,其它的格式还没有试过步骤如下:需要pc一台,软件calib...

2019-11-04 19:30:19 9662 2

原创 python scrapy爬取imdbtop250

写在前面:国庆以来自己一直将主要的空闲精力放到了机器学习方面,跟着EliteDataScience的指导走,大部分时间都用于学习吴恩达的机器学习课程随着课程进入相对枯燥的阶段,手痒的我决定回到爬虫上做些小小的项目。之前我做的爬虫只要都用于控制台简单交互式的资源爬取上面,比如电影,美剧,字幕等,需要深度定制,很少使用框架由于实战中一直缺少scrapy的练习,因此这次我打算先从温习scrapy开...

2019-10-22 18:42:34 598 1

machine learning work-Andrew Ng.zip

包含了所有课程PPT资料和题目,练习答案不包括简单的第一二周作业,所有的练习答案都是满分,欢迎来看我关于Andrew Ng机器学习课程所做的系列博客笔记,期望共同进步

2020-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除