自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 熟悉OCR的baseline并参加比赛

环境的配置:安装paddlepaddle-gpu,在安装好CUDA的情况下,可以直接通过pip安装,地址:https://www.paddlepaddle.org.cn/install/quick步骤1:下载比赛图片python3 down_image.py保存目录为train_data/tianchi/image,按照文件名进行保存,训练集和测试集存储在一起。步骤2:下载预测模型由于OCR包括多个步骤,此时我们只对其中检测的部署进行fientune,所以其他部署的权重也需要下载。mkdir

2021-07-16 21:24:06 181 1

原创 window 10安装 Docker

Docker三大基本概念Docker 包括三个基本概念镜像(Image)容器(Container)仓库(Repository)理解了这三个概念,就理解了 Docker 的整个生命周期。Docker镜像我们都知道,操作系统分为 内核 和 用户空间。对于 Linux 而言,内核启动后,会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像(Image),就相当于是一个 root 文件系统。比如官方镜像 ubuntu:18.04 就包含了完整的一套 Ubuntu 18.04 最小系统

2021-04-13 22:12:20 103

原创 cv比赛全流程体验

现在还是一直卡在Docler这里,电脑是windoew10系统的,还没搞定Docker

2021-02-22 00:35:12 114

原创 Haar特征描述算子-人脸检测器

3.3 算法理论介绍3.3.1 Haar-like 特征Haar(哈尔)特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如:脸部的一些特征能由矩形特征简单的描述,如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。对于图中的A,

2020-07-02 22:27:41 418

原创 特征描述算子-人脸检测

2.1 简介LBP指局部二值模式(Local Binary Pattern),是一种用来描述图像局部特征的算子,具有灰度不变性和旋转不变性等显著优点。LBP常应用于人脸识别和目标检测中,在OpenCV中有使用LBP特征进行人脸识别的接口,也有用LBP特征训练目标检测分类器的方法,OpenCV实现了LBP特征的计算,但没有提供一个单独的计算LBP特征的接口。也就是说OpenCV中使用了LBP算法,但是没有提供函数接口。2.3 算法理论介绍2.3.1 LBP原理介绍  LBP特征用图像的局部领域的联合分

2020-06-27 15:26:37 382

原创 Task01 Harris特征点检测

简介:在图像处理领域中,特征点又被称为兴趣点或者角点,它通常具有旋转不变性和光照不变性和视角不变性等优点,是图像的重要特征之一,常被应用到目标匹配、目标跟踪、三维重建等应用中。点特征主要指图像中的明显点,如突出的角点、边缘端点、极值点等等,用于点特征提取的算子称为兴趣点提取(检测)算子,常用的有Harris角点检测、FAST特征检测、SIFT特征检测及SURF特征检测。1.4 内容介绍1.4.1 基础知识1.角点使用一个滑动窗口在下面三幅图中滑动,可以得出以下结论:左图表示一个平坦区域,在各方向

2020-06-24 22:11:42 125

原创 Task03:字符识别模型

定义分类模型#定义分类模型class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, self).__init__() model_conv = models.resnet18(pretrained=True) model_conv.avgpool = nn.AdaptiveAvgPool2d(1) model_conv = nn.Sequential(*

2020-05-26 21:28:21 140

原创 零基础入门CV赛事-数据读取和增强

数据读取class SVHNDataset(Dataset): def __init__(self, img_path, img_label, transform=None): self.img_path = img_path self.img_label = img_label if transform is not None: self.transform = transform else:

2020-05-23 16:09:08 169

原创 街景字符编码识别-Baseline

baseline思路:使用CNN进行定长字符分类;运行系统要求:Python2/3,内存4G,有无GPU都可以线上得分取决于训练轮数,假设比赛数据路径为…/input

2020-05-21 11:19:22 1203

原创 图像处理(上)- Task06 边缘检测

Sobel算子我们可以使用3×33 \times 33×3 的卷积核来进行图像求导:KaTeX parse error: Undefined control sequence: \0 at position 58: …matrix}+1&+2&+1\̲0̲&0&0\-1&-2&-1\e…其中$ \mathbf {I}表示原图片,表示原图片,表示原图片...

2020-05-01 20:36:40 344

原创 图像处理(上)-Task04 图像滤波

4.4.1 均值滤波、方框滤波滤波分类线性滤波: 对邻域中的像素的计算为线性运算时,如利用窗口函数进行平滑加权求和的运算,或者某种卷积运算,都可以称为线性滤波。常见的线性滤波有:均值滤波、高斯滤波、盒子滤波、拉普拉斯滤波等等,通常线性滤波器之间只是模版系数不同。非线性滤波: 非线性滤波利用原始图像跟模版之间的一种逻辑关系得到结果,如最值滤波器,中值滤波器。比较常用的有中值滤波器和双边滤波器...

2020-04-27 19:24:40 398

原创 图像处理(上)-Task03 彩色空间互转

RGB与灰度图互转RGB(红绿蓝)是依据人眼识别的颜色定义出的空间,可表示大部分颜色。但在科学研究一般不采用RGB颜色空间,因为它的细节难以进行数字化的调整。它将色调,亮度,饱和度三个量放在一起表示,很难分开。它是最通用的面向硬件的彩色模型。该模型用于彩色监视器和一大类彩色视频摄像。RGB颜色空间 基于颜色的加法混色原理,从黑色不断叠加Red,Green,Blue的颜色,最终可以得到白色,如图...

2020-04-25 21:51:20 117

原创 图像处理(上)-Task02 几何变换

算法理论介绍变换形式先看第一个问题,变换的形式。与OpencV不同的是这里采取冈萨雷斯的《数字图像处理_第三版》的变换矩阵方式,关于OpenCV的策略可以看它的官方文档。根据冈萨雷斯书中的描述,仿射变换的一般形式如下:式中的T就是变换矩阵,其中 (v,w)为原坐标,(x,y) 为变换后的坐标,不同的变换对应不同的矩阵,这里也贴出来吧,一些常见的变换矩阵及作用如下表:坐标系变换再看第二...

2020-04-23 21:00:47 143

原创 图像插值算法

图像插值算法欢迎使用Markdown编辑器1.4.1 最近邻插值算法原理  最近邻插值,是指将目标图像中的点,对应到源图像中后,找到最相邻的整数点,作为插值后的输出。1.4.2 双线性插值  在讲双线性插值之前先看以一下线性插值,线性插值多项式为:f(x)=a1x+a0 f(x)=a_{1} x+a_{0} f(x)=a1​x+a0​1.4.3 映射方法向前映射法  可以将几何运...

2020-04-21 21:39:32 150

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除