自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(196)
  • 资源 (5)
  • 收藏
  • 关注

原创 以矩阵的形式,对点或线段或多边形绕固定点旋转方法

其中x,y旋转前横纵坐标,x’,y’为旋转后横纵坐标。θ旋转角度,单位为弧度,大于零表示逆时针旋转,小于零表示顺时针旋转。tx,ty表示旋转物体的中心点。k为缩放因子[0,+ ∞]。±表示翻转,第一行正负号表示水平翻转,第二行正负号表示垂直翻转。,其中x,y旋转前横纵坐标,x’,y’为旋转后横纵坐标。θ旋转角度,单位为弧度。等价于:x’ = xcosθ+ysinθ,y’=-xsinθ+ycosθ。注:此矩阵仅为旋转矩阵,不包含平移和缩放。二、旋转+平移+缩放+翻转。

2023-09-19 11:27:45 512

原创 叉积方法,求点与线段的相对位置

当 AP × BP > 0 时,点 P 在线段 AB 的顺时针方向;当 AP × BP < 0 时,点 P 在线段 AB 的逆时针方向;当 AP × BP = 0 时,点 P 在线段 AB 或其延长线上。线段两个端点坐标为 A(x1, y1), B(x2, y2),叉积可以用来判断一个点在一条线段的哪个方向。假设点 P 的坐标为 (px, py),

2023-09-04 21:04:28 261

原创 一元三次方程通用求解方法

一元三次方程求根通过方法。盛金公式求解一元三次方程根。

2022-08-10 16:49:49 570 1

原创 Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification论文解读

Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification论文解读

2022-07-22 18:55:46 2167

原创 Ultra Fast Structure-aware Deep Lane Detection论文解读

Ultra Fast Structure-aware Deep Lane Detection论文解读,论文及代码

2022-07-11 18:28:14 1598

原创 车道线检测——概述

车道线检测,是自动驾驶中重要的组成部分。该文主要对车道线检测做了简单的概括和总结。

2022-07-11 11:01:05 7987 1

原创 ViT-YOLO论文解读

ViT-YOLO论文解读

2022-07-01 19:18:54 3647 4

原创 TPH-yolov5论文解读

TPH-yolov5论文简介。

2022-06-27 19:14:33 13553

原创 python读取webp格式图像

使用python读取webp格式图像from PIL import Imageimport pdb;pdb.set_trace()filename = '000.webp'im = Image.open(filename)if im.mode == "RGBA": im.load() # required for png.split() background = Image.new("RGB", im.size, (255, 255, 255)) backgroun...

2022-05-26 16:01:56 1679

原创 使用代码转换文件夹中的视频成可网址查看的形式

此处需要和httpfileserver相结合,httpfileserver的安装可自行百度安装。#-*- coding:utf-8 -*-import dominatefrom dominate.tags import *from dominate.util import rawimport osimport sysreload(sys)sys.setdefaultencoding('gbk')class HTML: def __init__(self, web_dir,

2022-05-25 16:57:46 504

原创 使用代码转换文件夹中的图片成可网址查看的形式

此处需要和httpfileserver相结合,httpfileserver的安装可自行百度安装。#-*- coding:utf-8 -*-import dominatefrom dominate.tags import *import osimport sysreload(sys)#import importlib#importlib.reload(sys)#sys.setdefaultencoding('gbk')sys.setdefaultencoding('utf-8')

2022-05-25 16:48:44 579

原创 python实现pdf转化png脚本

功能:pdf转换png#coding:utf-8''' 功能:pdf文件转换成图片 作者:宋腾飞'''import ioimport osimport globfrom wand.image import Imagefrom wand.color import Colorfrom PyPDF2 import PdfFileReader, PdfFileWritermemo = {}def getPdfReader(filename): reader = memo.get(

2022-05-25 16:14:25 454 1

原创 md5工具查看两个文件是否一致

md5说明:任何一个文件都有唯一个md5值,一般可以通过该值去比对两个文件是否是同一个,只要md5值不一样,可以认为两个文件存在diff。命令Linux:md5 文件名Mac:md5sum 文件名比如:md5 aaa.jpgMD5 (aaa.jpg) = ebe5fdcb42495dd18c8c41b7e47e8eec其中ebe5fdcb42495dd18c8c41b7e47e8eec就是图片aaa.jpg的唯一名称...

2022-05-25 16:07:05 1931

原创 视频检测、视频分类等视频相关算法

ImageNet VID Benchmark (Video Object Detection) | Papers With Code

2022-05-25 11:41:16 1076

原创 ffmpeg工具使用说明

ffmpeg使用说明,用于忘记后查阅。

2022-05-25 11:32:40 88

原创 pytorch、cuda、python对应版本信息

cuda+python+torchhttps://download.pytorch.org/whl/torch_stable.html

2022-05-25 11:27:08 2672

原创 显卡信息查看,linux简单常用命令

1.显卡上,基于线程ID查看当前使用者:ls -l /proc/1044772.显卡上显存被占用,但是却无法看到对应进程,使用命令:fuser -v /dev/nvidia*,然后使用kill杀掉即可。查找某一文件夹下制定类别的文件,并保存到文件中:find.-typef-name"*.gz">1.txt快速从拥有大量文件的文件夹下获取所有文件的名称和绝对路径:linux下快速列出文件列表的方法 - shoufengwei - 博客园可用命令:tree -a...

2022-05-25 11:25:08 2467

原创 git使用说明

git工具的简单使用说明

2022-05-25 11:11:18 217

原创 xlsx文件读写操作、多线程操作、视频/图像下载、视频抽针

xlsx文件读写操作、多线程操作、视频/图像下载、视频抽针

2022-05-23 10:59:44 2315

原创 5. VOLO: Vision Outlooker for Visual Recognition

VOLO的整体流程很简单:主要分为两个阶段,第一个阶段使用outlookattention + MLP获取图像特征,第二阶段使用普通attention + MLP获取图像特征,对此时获取的图像特征再执行classAttention提取分类token特征,最后进行类别划分。outlookattention (unfold + matmul + fold操作)...

2022-01-05 19:19:36 1926

原创 1. attention is all in need

在视频和github中有相关作者非常详细的讲解,感觉受益匪浅,因此学习记录。讲解视频:从中文Transformer到BERT的模型精讲,以及基于BERT情感分类实战_哔哩哔哩_bilibili视频笔记 github:https://github.com/aespresso/a_journey_into_math_of_ml/blob/master/03_transformer_tutorial_1st_part/transformer_1.ipynb...

2021-11-15 21:03:31 290

原创 2. vit——vision transformer

了解vit之前可以先看论文 attention is all in need,主要看论文中transformer中的encode和decode部分。在vit中主要应用了transformer的encode部分。vit整体的网络框架结构图vit原理讲解的很好:ViT和DeiT的原理与使用 - 知乎vit原理:把图像使用patch(p*p*c),分隔为N等份。每份拉成一维向量D。N等份就有N*D维度。因为分隔图片的patch尺寸可能会拉成很长的一维向量(比如patch尺寸为32,3通道。

2021-11-15 21:02:19 2591

原创 3. deit——Training data-efficient image transformers & distillation through

deit是vit的改进,使用的网络框架基本一致。主要参考:ViT和DeiT的原理与使用 - 知乎参考:DeiT:使用Attention蒸馏Transformer知识蒸馏中的教师网络,可以使用其他非transformer形式的网络结构,比如卷积网络(resnet,efficientnet)等。个人总结:deit和vit形式一直,在网路结构中多了一个distillation token,类似于class token的形式。distillation toke

2021-11-15 21:01:46 2963

原创 4. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

论文:https://arxiv.org/abs/2103.14030分类代码:https://github.com/microsoft/Swin-Transformer检测代码:https://github.com/SwinTransformer/Swin-Transformer-Object-Detection语义分割代码:https://github.com/SwinTransformer/Swin-Transformer-Semantic-Segmentation摘要:作者.

2021-04-21 20:36:38 378

原创 第二章 线性代数之矩阵介绍

这里的学习记录是自己学习张宇老师考研数学的线性代数所做的笔记,现在保存下来以供将来自己学习回忆使用。章节布局中一般第一张图片都是该章节大纲介绍,之后图片就是大纲中每部分详细的介绍。本章节是第二章节,主要是行列式知识的介绍。...

2020-08-20 16:33:42 260

原创 EM算法的简介、推导以及C代码实现

EM算法是一个很经典的算法,有人成为上帝算法,可以可以在你不知道样本类别的情况下求出该样本的类别,前提你需要知道样本服从什么分布。平常我们求解最优问题,通常采用最小二乘法,梯度下降法,高斯牛顿法,牛顿法,拟牛顿法,列-马算法等等。但是在使用这些方法之前通常会使用极大似然估计或者拉格朗日乘子法作为前序,同样EM算法也是极大似然估计的后续。极大似然估计是把累乘问题通过对数似然函数转化为累加问题,然后用梯度下降法或者其他算法求解最值问题。拉格朗日乘子法主要是为了解决偏导为0无法求解的问题,通过引入拉格朗日乘子

2020-08-09 10:34:41 1271

原创 第一章 线性代数之行列式介绍

这里的学习记录是自己学习张宇老师考研数学的线性代数所做的笔记,现在保存下来以供将来自己学习回忆使用。章节布局中一般第一张图片都是该章节大纲介绍,之后图片就是大纲中每部分详细的介绍。本章节是第一章节,主要是行列式知识的介绍。...

2020-08-06 11:32:13 222

原创 记录李航 统计学习 一书中SVM章节的例题7.2的求解过程

本文是记录李航《统计学习》一书中SVM章节的例题7.2的求解及推导过程。主要是手写推导的,这里不再重新编辑公式了,就把之前推导过程的A4纸上传了,偷个懒吧。另外虽然书中已有讲解,可能也存在像我这种对细节不太理解的人,看的云里雾里,所以便有了这篇博客的求解过程更加详细的介绍。聪明人请绕行,对这篇博客请不喜勿喷。下面是该书中例题7.2的介绍:下面是我手写的推导及求解过程:至此推导完成,希望对你有帮助。...

2020-08-06 09:21:09 4847 4

原创 逻辑回归的推导及C代码实现

逻辑回归是一种常用的分类算法(注意逻辑回归不是回归哟)学习的时候借鉴了这个资料:https://zhuanlan.zhihu.com/p/74874291很好了的资料感谢作者的分享。

2020-07-30 19:32:52 552

原创 直线拟合的三种方法

直线拟合的三种方法:1. 最小二乘法。2.梯度下降法。3. 高斯牛顿法

2020-07-26 17:05:16 53889 5

原创 第十二章 初窥天机之文件操作

当前计算机存在的文件形式多种多样,比如txt,dat,word,xml,json等各式各样的文件形式。这些文件格式都是常见的,并且在将来的编程中经常使用的文件格式。今后我们主要讲解dat和txt文件格式的读写。当然我们现在讲解的都是最简单的文件操作。如果对于程序员见得最多的文件格式恐怕是“.c”文件,“.cpp”文件,“.exe”文件了,下面让我们详细了解一下什么是文件吧!12.1 文件什么是文件?文件在程序设计中表示存储在外部介质上数据的集合。外部介质有:硬盘,U盘,光盘等。数据是以文件的形.

2020-07-20 21:11:19 267

原创 归一化、标准化、单位化方法的总结

无论传统图像处理,还是深度学习,我们经常会听说存在L1 normalization,L2 normalization,那么这些归一化是什么呢?在统计学习中,归一化的具体作用是归纳归一样本的统计分布性。归一化在0~1之间是统计的概率分布,归一化在-1~+1之间是统计的坐标分布。即该函数在(负无穷,正无穷)的积分为1。下图为pytorch官网normalize的定义和实现方程从公式中可以看出这是一个Lp normalize,p表示1,2,...,n。sigma是一个极小的小数,为了防止分母为

2020-07-20 15:19:48 13321 1

原创 第十一章 初窥天机之数据类型为我所用

我们之前只了解C语言中的常用的数据类型,比如:int,float,double,char等基本的数据类型,如果我们想要使用另一个名字表示对应的数据类型呢?或者我们想定义一个不存在的数据类型该怎么办呢?学完这一节你就会明白如何做了,也会明白类型重定义的好处。类型重定义的目的:在写大程序的时候可能出现一些类型需要改变的情况,比如:要把int类型的数据改成float类型,那么所有数据进行更改否则会出现错误。当我们把int类型重新定义为一个新的类型比如:typedef int NEWDATA。这时如果要把.

2020-07-19 22:01:58 294

原创 yolov4论文及技术点总结

YOLOv4: Optimal Speed and Accuracy of Object Detection作者是来自俄罗斯的Alexey大神论文连接:https://arxiv.org/pdf/2004.10934.pdf源码:https://github.com/AlexeyAB/darknet摘要本文假设通用特征包括:加权残差连接(WRC),跨阶段部分连接(CSP),跨小批量规范化(CmBN),自对抗训练(SAT)和Mish激活。本文使用了新功能:WRC,CSP,CmBN.

2020-06-10 10:14:22 1299 1

原创 第十章 初窥天机之神用指针

10.1指针与指针变量10.1.1 指针是什么指针如何理解?对于现阶段来说,为了便于理解指针,可以把指针称为地址。什么是地址?有这样一个的例子:如果我们要在一栋楼里面找到不认识的某一家人,那么我们需要知道这家人的门牌号,然后通过门牌号找到这户家人,而我们所说的门牌号就是地址。又或者说我们在发信件时需要写下接收地址,那么通过接收地址就会发给需要接受的人。所以地址很重要,而地址就是指针。图10.1 内存中的数据存储形式要理解指针,我们需要知道数据具体是如何在内存中存储和读取的。...

2020-05-16 11:49:04 271

原创 RCNN的演变

详细信息可参考: http://zh.gluon.ai/chapter_computer-vision/rcnn.html1. 早期传统的目标检测或者图像分类,对整个图像或者图像滑窗截取的方式,计算对应的特征,获取特征的方式使用梯度计算,比如hog,lbp,sift,orb,surf等进行特征描述,获取特征后,把特征放入分类器,进行特征分类。如果是整幅图像放进去,就能够实现特征分类,如果是滑窗截取的方式就是目标检测。2. 接着是r-cnn(其中r表示region)的出现,在传统图像处理的思路上.

2020-05-09 15:41:52 343 1

原创 第九章 初窥天机之模块化程序设计

哲理:C语言共分为两类,一类是用户自定义函数,一类是库函数。用户自定义函数是程序员在开发时根据需要,自己开发的函数。我们将会在本章进行详细的讲解。而库函数就是别人已经写好的函数库,我们只需要拿过来用就行,比如printf函数,scanf函数,以及我们在上一章讲解的和字符串处理相关的函数。9.1 函数的概述9.1.1 什么是函数说到函数,很多不了解编程语言的人在脑中会立刻浮现出数学方面或物理方面的函数,输入变量x输出变量y。事实上,C语言函数并不是这样。“函数”是从function翻译过.

2020-05-08 21:43:55 692

原创 第八章 初窥天机之字符串处理

有关字符处理的话题,哲理,引用等信息。8.1 字符串简单处理函数在C语言函数库中提供了一些用来专门处理字符串的函数。几乎所有版本的C语言编译系统都会提供这些函数。比如与字符串链接相关的strcat和strncat函数,与字符串复制相关的strcpy和strncpy函数,与字符串比较相关的strcmp和strncmp函数,与字符串大小写转换相关的strlwr和strupr函数,与字符串转换成数值相关的atoi、atol与atof函数,与测量字符串长度的strlen函数等等,这些都只是字符串处理函数中的

2020-05-08 21:30:27 359

原创 第七章 初窥天机之数组处理

为什么要引用数组?我们此处引用一个经典的例子,那就是学生成绩记录问题。假如一个班有40名学生,每个学生都有一个学号,要把所有学生的学号保存起来,怎么办?根据之前章节的讲解我们可能会为每一个学生分配一个变量,用来保存学号。这样,就会有40个变量需要定义。可是,如果是全校成千上万个学生的学号呢?难道我们还是这样为每个学生分配一个变量吗?那么且不说后续的学号怎么使用,单单定义这些学号变量,是不是就会浪费...

2020-05-07 21:48:00 625

原创 C++ 类模板std::async, std::future, std::promise, std::packaged_task

C++ 类模板std::async, std::future, std::promise, std::packaged_task在C++多线程中常用到各种类模板,今天我们总结一下,下面几种类模板的使用:1. std::async2. std::future3. std::promise4. std::packaged_task5. std::future_statue...

2020-04-27 20:28:55 376

ffmpeg工具,用于视频相关的处理。

linux下视频工具ffmeg。

2022-05-23

ippicv_2014_2017.zip

编译opencv时需要的第三方工具,有ippicv2014和ippicv2017供大家下载使用。谢谢。

2020-04-12

C++11多线程加锁方式.doc

C++ mutex,lock_guard,unique_lock使用说明文档,详细属性介绍,简单使用介绍。

2020-02-28

win32小游戏之轿车躲闪,通过方向键控制

通过方向键移动轿车来躲避相向而来的轿车,使用win32程序开发,希望对学习win32开发的同学有所帮助。

2019-09-03

字母拼图-C语言

类似于A*算法的求解八宫格问题,实现字母拼图。通过按键盘来移动对应的字母。

2016-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除