⊙月-CSDN博客

原创研究进步最快的程序员个体——王强

新东方狠人、神人一大堆，俞敏洪、王强、徐小平、周思成都是非常让人敬佩的白手起家者，其中对王强怎么学计算机的之前有所耳闻，我私认为其是入门最快的程序员，值得好好去研究下他：1962年，出生。 1980年-1984年，获得北京大学西方语系本科学位，俞敏洪的大学时候的班长。 1984年-1990年，毕业后留校任教于北京大学英语系。 1992年-1995年，获得美国纽约州立大学计算机硕士学位。此时30岁，放弃北大6年英语教职，来到美国，从零开始，3年时间，学完计算机几乎所有本科、硕士课程（PS: 一个30

2021-08-07 13:41:18 720

原创【汇总记忆：命令、语法、函数、等】

Linux常用操作查看磁盘空间：df -h 查看服务器显卡使用情况：nvidia-smi 遍历文件夹内所有子文件夹及其内容 import os# 遍历文件夹def walkFile(file): for root, dirs, files in os.walk(file): # root 表示当前正在访问的文件夹路径 # dirs 表示该文件夹下的子目录名list # files 表示该文件..

2021-07-09 11:53:03 248 2

原创【kaggle】AI Report 2023概览

(页17-18)

2023-10-20 17:52:37 289

原创内网穿透：远程访问内网IP中的电脑

家里电脑在路由器内网中，能连外网。想在外地时能ssh（也即vscode）访问家里的电脑。win11（Ubuntu流程也一模一样）具体流程。

2023-03-21 15:02:36 1866 1

原创 1080T、2080T、4070T显卡的深度学习性能测试和结论

1080T、2080T、4070T显卡的深度学习性能测试和结论

2023-02-24 10:06:54 8588 5

原创 ViT（vision transformer）原理快速入门

本专题需要具备的基础：了解深度学习分类网络原理。了解2017年的transformer。Transformer 技术里程碑：ViT简介时间：2020年CVPR论文全称：《An Image is Worth 16*16 Words: Transformers for Image Recognition at Scale》发明人：谷歌团队简介：论文中提出了 Vision Transformer (ViT)，能直接利用 Transformer 对图像进行分类，而不需要卷.

2021-12-09 10:08:38 16504 6

原创 CS131专题-8：图像纹理

目录1 什么是图像纹理1.1 不规则纹理1.2 规则纹理2 纹理描述（提取方法）3 纹理滤波器组4 一些滤波器提取的纹理效果5 使用高维向量描述纹理6 图像纹理提取的应用应用1：图像分类应用2：纹理特征图像检索应用3：通过纹理描述场景类别应用4：分割航空图像1 什么是图像纹理1.1 不规则纹理1.2 规则纹理2 纹理描述（提取方法）如果我们使用高斯偏导核，对图像进行卷积，x方向的偏导可以得到竖直纹理，y方向的偏导得到的是水平纹理

2021-12-06 15:23:52 2035

原创 CS131-专题7：图像特征（SIFT算法）

速记要点：SIFT是什么：全称Scale Invariant Feature Transform尺度不变特征转换，2004年的论文。可以检测出图像中的局部特征点。 SIFT算法特点：稳定性：SIFT是图像局部特征，对旋转、尺度、亮度、仿射、噪音都保持一定程度的稳定性。区分性：图像中检测到的这些局部特征各自区分性好，信息量丰富，适用于在海量特征数据库中进行快速、准确的匹配。多量性：即使少数的几个物体也可以产生大量的SIFT特征向量。高速性：经优化的SIFT匹配算法甚至可以达到实时的

2021-12-03 11:00:26 3540 3

原创 CS131专题-6：图像特征（Blob检测、LoG算子、Harris-Laplacian）

本专题介绍的技术应用已不广，但是这些有利于理解SIFT算法的原理，也有助于感悟CV传统技术的发展变迁，以及解决问题的思路。速记要点：blob是什么：blob是描述图像中局部区域的平均像素强度的特征。而图像中局部的平均像素强度具有尺度不变性。blob特征画在图像上就是个圆。blob特征有什么性质：具备光强强度、旋转不变性，但是不具备尺度和仿射不变性。blob检测的大概流程：用不同尺度的拉普拉斯核（需要归一化），对原图上每个像素点做卷积，如果某个结果有邻域内最大值，则这个像素点位置，就有个.

2021-12-01 17:10:12 2107 2

原创 CS131专题-5：图像特征——Harris角点

目录1 图像特征2 点特征——Harris角点2.1 角点2.2 数学描述2.3 公式推导2.4 公式的物理意义2.5 算法流程2.6检测效果2.7 Harris角点性质1 图像特征试想，从不同的距离，不同的方向、角度，不同的光照条件下观察一个物体时，物体的大小、形状、明暗都会有所不同。但我们依然可以判断它是同一个物体。这是因为什么呢？因为特征！计算机视觉中常用的图像特征包括：点、边缘、以及特有的组件等等。而其中点特征（不是指像素点，而是指图像.

2021-11-21 23:21:35 2390

原创 CS131专题-4：拟合（最小二乘、RANSAC、霍夫变换）

本专题目的：了解最小二乘、RANSAC、霍夫变换这3个算法的基本原理，能够做到脱口而出，并从零编程实现。目录1 前言2 最小二乘2.1 基本原理2.2 求解方法3 RANSAC 算法3.1 基本原理4 霍夫变换4.1 基本原理——检测直线4.1.1极坐标系4.1.2 找到参数空间中交点密集位置的方法4.1.3 一些效果图4.2 基本原理——检测圆4.3 霍夫变换的其他应用5 总结1 前言上一专题知道了如何提取图像中边缘像素，本专题我们.

2021-11-12 18:25:53 5135

原创 CS131专题-3：图像梯度、边缘检测（sobel、canny等）

目录1 前言2 图像梯度2.1 梯度公式的离散形式2.2 图像的梯度表示2.3 图像梯度的最简单计算方法2.4 直接应用梯度找图像边缘的问题以及解决方案3 边缘检测3.1 好的边缘检测器应具备的要素3.2 简单的边缘检测算子3.2.1——Prewitt（普鲁伊特）算子3.2.2——soble（索贝尔）算子3.2.3——Laplacian（拉普拉斯）算子3.2.4——Roberts罗伯特交叉算子3.2.5——上述4种算子的总结：3.3 Canny..

2021-11-10 19:59:56 5458 2

原创 CS131专题-2：高斯核、噪声、滤波

目录1 高斯核1.1 一维定义1.2 二维定义1.2.1 应用高斯核的过程1.2.2 不同σ值的高斯核情况1.2.3 不同核宽度情况1.2.4 高斯核（滤波）特性2 噪声和滤波2.1 椒盐噪声、脉冲噪声2.1.1 形成原因2.1.2 滤波方法2.1.3效果2.2 高斯噪声2.2.1 形成原因2.2.2 滤波方法2.2.3 效果1 高斯核高斯核在图像处理中有广泛应用（后面很多地方会用到），它用正态分布计算图像中每个像素的变换。1.

2021-11-08 19:30:40 4028

原创【部署类】专题：消息队列MQ、进程守护Supervisor

目录1 背景需求2 技术方案2.1 消息队列2.2 进程守护3 源码介绍3.1 supervisor部分3.1.1 supervisord.conf 内容3.1.2MM3D.conf 和 MM3D_2.conf 内容3.2算法程序（也就是我的主函数）1 背景需求某C端产品，前端嵌入式（安卓）将采集的数据发送给后端，后端服务器（Java）要负责将数据交到算法服务器（python，C++），算法服务器收到数据并处理完后将结果再返回给后端，后端拿着结果二次加工后..

2021-11-05 17:31:29 426

原创 CS131专题-1：卷积、互相关

前言：尽最大努力，把【卷积】和【互相关】的诞生、原理，及其物理意义搞清楚。目录1 卷积1.1 卷积是什么1.2 卷积公式的定义1.3 卷积运算的物理意义1.3.1 离散卷积例子：信号分析1.3.2 连续卷积例子：馒头的腐败量该例子总结：馒头的生产总量是一个‘输出信号’，馒头的腐败公式描述了‘食物腐败系统’的特性。利用卷积公式，我们能解决这个【信号和系统】问题。1.3.3 卷积在图像处理中例子：2 互相关2.1 互相关的定义2.2 互相关的例子——雷达回波分

2021-11-03 22:32:21 5496 5

原创并发编程之多进程编程（python版）

目录1 python多进程编程概述2 需求和方案背景：需求：解决思路：需要解决的问题和方案：3 完整代码1 python多进程编程概述python中的多线程无法利用多核优势，如果想要充分地使用多核CPU的资源，在python中大部分情况需要使用多进程。Python提供了multiprocessing。 multiprocessing模块用来开启子进程，并在子进程中执行我们定制的任务（比如函数），multiprocessing模块的功能众多：支持子进程、通信和共享数据、执

2021-10-28 18:04:02 296

原创监督学习：逻辑回归

目录1 逻辑回归理论知识逻辑回归算法是干什么的？逻辑回归模型的假设函数：决策边界（decision boundary）损失函数为什么用这损失函数？损失函数的求导：2 代码复现1 逻辑回归理论知识逻辑回归算法是干什么的？答：（单变量）线性回归算法是试图找到一条直线去拟合数据，而逻辑回归算法是试图找到一根线，去分隔数据，是一种分类算法，如下图：逻辑回归模型的假设函数：其中，X代表特征向量，g代表逻辑函数，一个常用的逻辑函数是sigmoid函数。为什

2021-10-12 10:49:57 196

原创监督学习：线性回归

目录1 单变量线性回归2 多变量线性回归3 numpy实现单变量线性回归1 单变量线性回归2 多变量线性回归3 numpy实现单变量线性回归GitHub - YM2025/machine_learning: 机器学习主要算法的代码实现...

2021-10-09 13:46:52 94

原创 GitHub上传代码、更新代码、token设置

准备工作：创建GitHub账号。在本机电脑安装git工具。 git配置用户名和邮箱打开git Bash，依此输入如下命令： git config --global user.name "XXXX"git config --global user.email "[email protected]" 通过git config --list查看配置是否正确。生成秘钥输入如下命令，然后连敲三个回车即可，然后查看系统盘用户目录下（一般在 C:Users你...

2021-10-08 19:21:41 1207

原创生成式对抗网络的原理和实现方法

GAN：generative adversarial network时间：2014年，Ian Goodfellow和Yoshua Bengio的实验室中相关人员。gan背后的想法是，你有两个网络，一个生成器GGG和一个鉴别器DDD，互相竞争。生成器生成传递给鉴别器的“假”数据。鉴别器还能看到真实的训练数据，并预测它接收到的数据是真的还是假的。GAN的作用：训练出一个“造假机器人”，造出来的东西跟真的几乎类似。GAN的实现原理：两个网络，一个生成器网络GGG和一个鉴别器网络DDD，两者互相竞争来提升自

2021-09-17 17:42:49 1486

原创什么是Encoder-Decoder、Seq2Seq、Attention？

1 简介发明时间：2014年由 [Bahdanau et al. 2014] 正式提出。作用： Attention机制可以让神经网络更多的关注到输入中相关的信息，并减少对无关信息的注意。就像当我们看一副图，我们往往会对其中感兴趣的那部分更加注意，Attention机制也以类似的方式帮助神经网络更好的利用输入的信息。有助于提升模型的可解释性。 1.1 Attention发明的背景2014年, Seq2Seq模型 [Sutskever et al. 2014] 正式提出, 并以其优异的表

2021-09-07 16:44:15 2241 1

原创一幅图真正理解LSTM、BiLSTM

1 前言本文不是RNN系列入门，而是对RNN、LSTM、BiLSTM的内部结构和输入输出做透彻的剖析。RNN：循环神经网络 LSTM：长短期记忆网络 BiLSTM：双向长短期记忆网络重要的先验知识：本质上单个RNN cell是在多个时间步上展开的形式，也可以理解为RNN是神经网络在时序上的权重共享（CNN相当于空间上的权重共享），LSTM也都是一样。1.1 RNN回忆与概览1.2 BiLSTM回忆与概览LSTM内部结构相对RNN做了改进，BiLSTM中Bi指的是Bi-di

2021-09-01 21:19:11 46160 23

原创 CenterNet算法快速入门

目录1 简介2 网络结构3 损失函数3.1 heatmap loss（改造的Focal Loss）3.2 长宽预测loss（L1损失函数）3.3 中心点偏移值loss（L1损失函数）4 扩展：关节点预测和3D任务4.1 人体关节点预测4.2 3D目标检测1 简介时间：2019年论文《Objects as Points》特点：不需要anchor、也不需要NMS，模型结构简单、速度快、精度高（比yolo3高4个点）！只需少量修改head，就可以改造成

2021-08-30 16:36:26 969

原创度量学习：ArcFace算法和工程应用总结

需要的基础：了解深度学习分类网络原理即可。主题和收获：以深度学习中的ArcFace算法为案例，获得对度量学习领域举一反三的领悟。1 度量学习简介度量学习（Metric Learning）通俗的说就是相似度学习。例如，如果要计算两张人脸图片的相似度，如何度量图片之间的相似度，并使得不同人的人脸图片相似度小而相同人的人脸图片相似度大就是度量学习的目标。综上，以人脸识别（不是人脸检测）为例子，用程序和算法实现此功能，要解决3个问题：用什么东西作为某一个人的人脸的特征基准？答案：因为不同的

2021-08-25 18:31:42 1730 5

原创 V2V-PoseNet算法和应用详解（3D关节点估计领域）

本文主要梳理V2V关节点估计算法的原理、网络结构、以及工程应用。虽然V2V是2017年的算法，但是其3D点云处理流程和效果还是很经典的，值得作为入门3D深度学习领域的一个窗口。1 算法部分V2V-PoseNet基本介绍发明时间：2017年功能：3D关节点估计（如应用于手掌关节点估计）输入数据：一张包含目标的depth图。（如用Kinect、realsense等传感器采集的的depth图）输出结果：目标物体关节点的X，Y，Z坐标值。两句话概括创新点：第一句话：传统方

2021-08-18 22:02:55 2282 6

原创 SSD算法详解

目录SSD算法在目标检测领域的位置：SSD算法口头概述：优缺点网络结构图正负样本选择：损失函数：其他细节：SSD算法在目标检测领域的位置：SSD算法口头概述：输入：300*300*3的图像。骨干网络：VGG 16 再加10个卷积层 6个特征图输出：从骨干网中6个不同深度位置抽取feature map，每个位置的feature map会经过两个输出路线，一个路线feature map经过1个卷积层，直接输出4或6个anchor框的坐标回归信息。另一个路线fea

2021-08-16 19:35:03 1984

原创 Yolo5算法详解

Yolo5核心的一些东西：输入端： mosaic、仿射变换等。自适应锚框计算。自适应图片缩放。（能提升37%推理速度） Backbone：Focus结构（提升推理速度）、新的CSP结构。 Neck：SPP、FPN+PAN的结构，输出端： 3个临近grid cell负责预测目标，相当于增加了2倍正样本量，极大加速收敛，并修改了预测框回归公式（具体见解析图）刚开始是边框回归用GIOU-Loss，后面版本又改成CIOU-Loss。其他细节改动：抛弃了基于max i

2021-08-12 14:43:53 1166

原创 Yolo4算法详解

图形化有助于更好的理解和记忆，图有点大7411 x 6078，内容有如下几个模块构成：Yolo4相对于Yolo3的改进总结。 Yolo4详细的网络结构。 Yolo4的输出物理意义。（跟YOLO3一样） Yolo4的anchor回归机制。（跟YOLO3一样） Yolo4的损失函数。（相对Yolo3，把其中定位损失部分，替换为CIOU-loss公式）介绍一些损失函数发展历史：定位损失：SmoothL1（Fast RCNN）, IOU（2016）, GIOU（2019）, DIOU（2020）

2021-08-10 18:09:04 277 1

原创入门强化学习（Q-learning→DQN→DDQN）

基础：只要具备CNN分类算法的基本认识。讲解内容：内容主要通过《飞翔小鸟》游戏为例，探究如下2个问题：强化学习原理：以Q-learning算法为例。深度强化学习原理：以DQN、DDQN算法为例。然后大概讲下DDQN算法，如何在更复杂的解锁任务中应用和设计。学完收获：认真看完所有细节内容，基本就能了解一种强化学习和一种深度强化学习的整个过程，其他算法可以举一反三。备注：由于资料大多从PPT中截取出来，转成文章可能会有一些不理解的地方，如有细节疑问可以留言提出来。0

2021-08-06 19:22:08 4344 1

原创 ROS系统——部署OpenVINO版Nanodet超轻量目标检测器

0 背景系统平台：Ubuntu 18.04，ROS系统计算资源：一个i5 CPU计算：4个realsense相机：RGB视觉检测、点云聚类、融合等。超声波避障、导航、路径规划等。拟采用的技术路线：常规的yolo4-tiny或yolo5s速度都还不够，调研了一下，发现一个Nanodet超轻量目标检测算法，其mAP和yolo4-tiny相当，但是其速度提升了300%！如果再使用OpenVINO推理加速，估计最终提速能达到普通推理yolo4-tiny的5倍左右。nanodet性能如

2021-07-31 22:11:20 1631 4

原创 Yolo3算法详解

形象化记忆还是比文字好。查阅了几十篇资料，认真剖析了Yolo3的网络结构、anchor回归机制、损失函数，如下：

2021-07-28 22:19:32 203

原创 Yolo2算法详解

2021-07-23 18:48:20 186

原创 ROS系统中实现点云聚类（realsense数据源）

本文主要介绍ROS系统中如何订阅并解码realsense点云数据，并对点云进行稀疏、去噪、聚类。环境配置见《ROS系统中从零开始部署YoloV4目标检测算法（3种方式）》需要安装的第三方库：PCLpackage文件结构程序结构：main.cpp（自己的聚类程序） CMakeLists.txt（创建package时自动生成的，需要改造内容） package.xml（创建package时自动生成的，需要改造内容） include 文件夹（创建package时自动生成的，空文件夹） sr

2021-07-19 10:23:03 2172 5

原创 ROS、realsense开发常用命令汇总

ROS部分创建Catkin工作空间 $ mkdir -p ~/catkin_ws/src　#直接创建了catkin_ws文件夹和src子文件夹。$ cd ~/catkin_ws/$ catkin_make #初始化工作空间，此命令必须在工作空间路径下执行。备注：catkin_ws是工作空间名字，可自定义。重要备注：创建工作空间后，还需要给工作空间进行注册，注册的目的是让各种命令能够找到这个工作空间（相当于win系统中设定path）。注册方法1（注册一次用一次）：每次新

2021-07-19 09:38:44 430

原创 AI视频行为分析系统项目复盘——技术篇4：deepsort原理图

初次接触deepsort时，快速了解过其多目标跟踪原理，记录了一篇《deepsort原理快速弄懂——时效比最高的》。但是其细节和重要参数项还是很模糊，应对具体

2021-07-13 19:29:10 2471

原创 AI视频行为分析系统项目复盘——技术篇3：tensorRT技术梳理

0 背景见《AI视频行为分析系统项目复盘——技术篇1》1 tensorRT 介绍NVIDIA®TensorRT™是一个深度学习平台，用于模型推理加速（仅支持NVIDIA自家GPU，CPU加速一般使用OpenVINO）。1.1 tensorRT 诞生意义深度学习计算量相对普通程序还是挺大的，目前CV落地还不是很普及其中一个点就是对硬件要求较高。其次，算法的计算速度直接影响产品的成本和体验，谁能在硬件成本限制下支撑起算法精度，谁就有产品竞争力。工程上，GPU上的模型推理，业界主流使用Te

2021-06-30 16:59:31 800

原创优达学城《DeepLearning》项目2：犬种分类器

在这个notebook中，你将迈出第一步，来开发可以作为移动端或 Web应用程序一部分的算法。在这个项目的最后，你的程序将能够把用户提供的任何一个图像作为输入。如果可以从图像中检测到一只狗，它会输出对狗品种的预测。如果图像中是一个人脸，它会预测一个与其最相似的狗的种类。下面这张图展示了完成项目后可能的输出结果。Step 0: 导入数据集 Step 1: 检测人脸 Step 2: 检测狗狗 Step 3: 从头创建一个CNN来分类狗品种 Step 4: 使用一个CNN来区分狗的品种(使用迁移学

2021-06-27 12:42:09 405 1

原创 AI视频行为分析系统项目复盘——技术篇2：视频流GPU硬解码

1 为什么不使用CPU解码？待撰写2 GPU解码当前主流方案有哪些？待撰写3 GPU硬解码技术全过程复现待撰写4 CPU解码和GPU解码的性能对比待撰写

2021-06-25 17:21:36 1454

原创优达学城《DeepLearning》2-5：风格迁移

这次我们将学习一种风格转换方法，该方法具体原来可见论文《Image Style Transfer Using Convolutional Neural Networks》，使用卷积神经网络进行图像风格转换，作者是Gatys。在本文中，我们使用19层的VGG网络中的特征提取层，该网络由一系列卷积层和池化层以及几个全连接层组成。在下图中，卷积层按堆栈及其在堆栈中的顺序命名。Conv1是图像在第一个堆栈中通过的第一个卷积层。Conv2_1是第二个堆栈中的第一个卷积层。网络中最深的卷积层是conv5_4。

2021-06-22 18:25:00 127

原创 AI视频行为分析系统项目复盘——技术篇1：Ubuntu 18.04部署编译OpenCV+contrib、TensorFlow2.1、CUDA10.1+cuDNN7.6.5、tensorRT6.0.1等

背景7台服务器，其中6台GPU服务器，一台调度服务器 100+摄像头（基本是1920*1080）牵涉的视觉技术：目标检测、目标跟踪、分类、GPU视频编解码、tensorRT等。GPU服务器环境部署大纲

2021-06-22 13:56:55 2611

opencv_python-4.4.0-cp37-cp37m-win_amd64.whl

WPF开发的类似Visio软件.zip

全球工业互联网发展动态监测 （2018年3月）

2018年度工业互联网优秀应用案例汇编

yolo.h5训练的源文件

空空如也

全球工业互联网发展动态监测（2018年3月）