- 博客(210)
- 收藏
- 关注
原创 3、目标跟踪:数据关联
二分图的定义:二分图是能分成两组(假设是 U 和 V),其中 U 上的点不能相互连通,只能连去 V 中的点;V 中的点也不能相互连通,只能连去 U 中的点二分图在跟踪中的理解:可以把二分图理解为视频中连续两帧中的所有检测框,第一帧所有检测框的集合称为 U,第二帧所有检测框的集合称为 V,同一帧的不同检测框不会为同一个目标,所以不需要互相关联,相邻两帧的检测框需要相互联通,最终将相邻两帧的检测框尽量完美地两两匹配起来。
2023-12-07 16:21:40 65
原创 12、pytorch 框架:评价指标
https://github.com/Lightning-AI/torchmetrics二、分类评价指标使用简介三、回归评价指标使用简介四、检测评价指标使用简介五、分割评价指标使用简介六、参考资料https://github.com/Lightning-AI/lightninghttps://github.com/Lightning-AI/torchmetrics
2023-11-15 16:55:11 282
原创 13、Pytorch 模型训练加速
例如下面的代码, 其中张量最初在 CPU 内存中创建 , 然后被移动到 GPU 显存。不同, 它能避免不必要的数据拷贝, 将数据转换为张量, 并在可能的情况下共享底层数据和保留。函数在 GPU 和 CPU 之间传输数据。通过直接在 GPU 上创建张量, 可以。:可跨多个 GPU 或机器实现分布式训练, 从而显著地提高计算能力并缩短训练时间。该方法在处理深度学习任务中涉及大量GPU操作时特别有效。” 装饰现有函数, 之后可以在现有代码中继续使用原始函数名。如果不想进行显式替换, 也可以使用“
2023-10-23 18:08:53 75
原创 HuggingFace 自然语言处理
是一个开源社区,提供了统一的AI 研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。准备数据集,定义模型,训练,测试;每个部分都提供了相应的工具集⽂字是⼀个抽象的概念,不是计算机擅长处理的数据单元,计算机擅长处理的是数字运算,所以需要把抽象的⽂字转换为数字,让计算机能够做数学运算。为了把抽象的⽂字数字化,需要⼀个字典把⽂字或者词对应到某个数字。⼀个⽰意的字典如下:# 字典:这只是⼀个⽰意的字典,所以只有 11 个词,在实际项⽬中的字典可能会有成千上万个词vocab = {
2023-10-07 10:37:32 211
原创 15、ONNX 使用简介
是一个开放的生态系统,使代码不被局限在框架和平台中,可以把模型()转为标准的 ONNX 格式(一种 protobuf 格式),然后再通过各种硬件设备进行部署onnx 的本质,是一种Protobuf格式文件(基于 protobuf 来做数据存储和传输),遵循Protobuf语法Protobuf则通过protoc 编译得到和或则是描述 onnx 文件如何组成的,具有什么结构,他是操作 onnx 经常参照的东西可用和代码来操作 onnx 模型文件,实现增删改。
2023-07-20 22:46:17 156
原创 4、Python 常见的内置函数
文章目录一、内置函数一览表二、输入输出2.1、input()2.2、print()三、输入输出四、输入输出五、输入输出六、输入输出七、输入输出八、输入输出九、输入输出十、输入输出十一、输入输出十二、输入输出十三、输入输出十四、输入输出十五、输入输出十六、输入输出十七、输入输出十八、输入输出待总结:异常处理:raise https://www.runoob.com/python3/python3-errors-execptions.html内置魔法方法和属性:Python内置属性和魔法方法
2023-05-01 22:14:06 25
原创 21、Python 进度条工具:tqdm
该模块的作用就是通过装饰任何可迭代的对象,使代码中的循环(loop)在运行过程中为用户展示进度条可以通过或来安装使用,官网效果图如下所示:tqdm 类简介。
2023-03-27 14:12:21 24
原创 22、Python 网络结构和超参数配置工具:yaml&yacs
深度学习调参过程中会遇到很多参数,为了完整保存一个项目的所有配置,推荐使用yaml工具进行配置(yaml标量(例如字符串,整数和浮点数),列表和关联数组(字典)yaml的基本语法特点为:大小写敏感缩进表示层级关系,不允许使用 tab,只允许使用空格,缩进的空格数不重要,只要相同层级的元素左对齐即可列表通过"-"表示,字典通过":"表示在同一个yaml文件中,可以用"---"来分段,这样可以将多个文档写在一个文件中注释使用"#"yacs。
2023-03-22 13:29:20 54
原创 19、Python 命令行解析工具:argparse
argparse是python自带的命令行参数解析模块,这个库可以让我们直接在命令行中就可以向程序中传入参数并让程序运行当你的代码需要频繁地修改参数的时候,使用这个工具可以将参数和代码分离开来,让你的代码更简洁,适用范围更广。
2023-03-20 14:28:32 30
原创 1、目标跟踪:简介
多目标追踪顾名思义就是跟踪视频画面中的多个目标,得到这些目标的运动轨迹(每一个目标分配一个 track id,这个 id在视频序列中具有唯一性);核心在于目标检测和数据关联,即在每一帧进行目标检测,再利用目标检测的结果来进行目标跟踪,后面一步一般称之为数据关联,数据关联更多依赖于手工特征提取(外观特征、运动特征、形状特征)基本原理:核心:轨迹处理和状态估计、关联问题(匈牙利匹配)、级联匹配、特征描述器。...
2022-08-05 22:13:47 36
原创 13、目标检测:YOLOv5
Activation:Mish/SiLU 激活函数。YOLOv5s 网络的深度如下图所示。YOLOv5s 网络的宽度如下图所示。相当于下采样,减少后续计算量。网络的深度和宽度设置。
2022-08-05 22:13:03 39
原创 7、目标检测:SSD 系列
的卷积核去处理已经融合的特征图(为了消除上采样的混叠效应),以生成最后需要的特征图。参考设置 3:通过 min_size 和 max_size 进行密集采样。,然后再进行一次反卷积操作(最近邻/双线性插值或可学习的方式)TDM 网络结构(类似 FPN)示例:只在最后一层做预测。参考设置 1:两个 min_size 进行密集采样;参考设置 2:两个 min_size 进行密集采样;构成自上而下和自下而上的特征金字塔。预测层的具体细节如下图所示。测试网络框架如下图所示。...
2022-08-05 22:11:44 43
原创 2、目标跟踪:状态估计与更新
卡尔曼滤波本质上是一个数据融合算法,将具有同样测量目的、来自不同传感器或模型、(可能) 具有不同单位 (unit) 的数据融合在一起(一般使用精度较高的测量值对模型预测的结果进行修正)得到一个更精确的估计值:首先,根据模型上一时刻的值来估计当前时刻的状态,得到模型在当前时刻的先验估计值(prediction)然后,使用当前时刻传感器的测量值()来更正(update)这个估计值,得到当前时刻的最优估计值最后,根据当前时刻的最优估计值和观测矩阵H,得到观测空间的最优估计值。...
2022-08-05 22:09:11 62
原创 ubuntu16.04 docker 和 nvidia-docker 的安装及 GPU 的调用
ubuntu16.04 docker 和 nvidia-docker 的安装及 GPU 的调用
2022-08-05 21:26:48 37
原创 11、图像质量评价(IQA)
图像质量评价-百度百科图像质量评估综述无参考图像质量评估 全参考图像质量评价方法整理与实用性探讨视频/图像质量评价综述Image Quality Assessment: A SurveyDeep CNN-Based Blind Image Quality Predictor in PythonAutomatic Image Quality Assessment in Pythonhttps://github.com/ocampor/image-qualityhttp://database.
2022-08-05 20:51:22 76
原创 1、C/C++ 代码规范
常用命名风格:unix like风格:单词用小写字母,每个单词直接用下划线_分割,例如Windows风格:大小写字母混用,单词连在一起,每个单词首字母大写。不过如果遇到大写专有用语时会有些别扭,例如命名一个读取RFC文本的函数,命名为看起来就没有unix like的清晰标识符的命名要有明确含义,使用完整的单词或大家基本可以理解的缩写,避免使人产生误解文件命名统一采用小写字符全局变量应增加g_前缀,静态变量应增加s_前缀,其它变量按照。...
2022-08-05 20:20:38 42
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人