海大-八哥-CSDN博客

原创熟悉OCR的baseline并参加比赛

环境的配置：安装paddlepaddle-gpu，在安装好CUDA的情况下，可以直接通过pip安装，地址：https://www.paddlepaddle.org.cn/install/quick步骤1：下载比赛图片python3 down_image.py保存目录为train_data/tianchi/image，按照文件名进行保存，训练集和测试集存储在一起。步骤2：下载预测模型由于OCR包括多个步骤，此时我们只对其中检测的部署进行fientune，所以其他部署的权重也需要下载。mkdir

2021-07-16 21:24:06 181 1

原创 window 10安装 Docker

Docker三大基本概念Docker 包括三个基本概念镜像（Image）容器（Container）仓库（Repository）理解了这三个概念，就理解了 Docker 的整个生命周期。Docker镜像我们都知道，操作系统分为内核和用户空间。对于 Linux 而言，内核启动后，会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像（Image），就相当于是一个 root 文件系统。比如官方镜像 ubuntu:18.04 就包含了完整的一套 Ubuntu 18.04 最小系统

2021-04-13 22:12:20 103

原创 cv比赛全流程体验

现在还是一直卡在Docler这里，电脑是windoew10系统的，还没搞定Docker

2021-02-22 00:35:12 114

原创 Haar特征描述算子-人脸检测器

3.3 算法理论介绍3.3.1 Haar-like 特征Haar(哈尔)特征分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如：脸部的一些特征能由矩形特征简单的描述，如：眼睛要比脸颊颜色要深，鼻梁两侧比鼻梁颜色要深，嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构，如边缘、线段较敏感，所以只能描述特定走向（水平、垂直、对角）的结构。对于图中的A,

2020-07-02 22:27:41 418

原创特征描述算子-人脸检测

2.1 简介LBP指局部二值模式(Local Binary Pattern)，是一种用来描述图像局部特征的算子，具有灰度不变性和旋转不变性等显著优点。LBP常应用于人脸识别和目标检测中，在OpenCV中有使用LBP特征进行人脸识别的接口，也有用LBP特征训练目标检测分类器的方法，OpenCV实现了LBP特征的计算，但没有提供一个单独的计算LBP特征的接口。也就是说OpenCV中使用了LBP算法，但是没有提供函数接口。2.3 算法理论介绍2.3.1 LBP原理介绍 LBP特征用图像的局部领域的联合分

2020-06-27 15:26:37 382

原创 Task01 Harris特征点检测

简介：在图像处理领域中，特征点又被称为兴趣点或者角点，它通常具有旋转不变性和光照不变性和视角不变性等优点，是图像的重要特征之一，常被应用到目标匹配、目标跟踪、三维重建等应用中。点特征主要指图像中的明显点，如突出的角点、边缘端点、极值点等等，用于点特征提取的算子称为兴趣点提取（检测）算子，常用的有Harris角点检测、FAST特征检测、SIFT特征检测及SURF特征检测。1.4 内容介绍1.4.1 基础知识1.角点使用一个滑动窗口在下面三幅图中滑动，可以得出以下结论：左图表示一个平坦区域，在各方向

2020-06-24 22:11:42 125

原创 Task03：字符识别模型

定义分类模型#定义分类模型class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, self).__init__() model_conv = models.resnet18(pretrained=True) model_conv.avgpool = nn.AdaptiveAvgPool2d(1) model_conv = nn.Sequential(*

2020-05-26 21:28:21 140

原创零基础入门CV赛事-数据读取和增强

数据读取class SVHNDataset(Dataset): def __init__(self, img_path, img_label, transform=None): self.img_path = img_path self.img_label = img_label if transform is not None: self.transform = transform else:

2020-05-23 16:09:08 169

原创街景字符编码识别-Baseline

baseline思路：使用CNN进行定长字符分类；运行系统要求：Python2/3，内存4G，有无GPU都可以线上得分取决于训练轮数，假设比赛数据路径为…/input

2020-05-21 11:19:22 1203

原创图像处理（上）- Task06 边缘检测

Sobel算子我们可以使用3×33 \times 33×3 的卷积核来进行图像求导：KaTeX parse error: Undefined control sequence: \0 at position 58: …matrix}+1&+2&+1\̲0̲&0&0\-1&-2&-1\e…其中$ \mathbf {I}表示原图片，表示原图片，表示原图片...

2020-05-01 20:36:40 344

原创图像处理（上）-Task04 图像滤波

4.4.1 均值滤波、方框滤波滤波分类线性滤波：对邻域中的像素的计算为线性运算时，如利用窗口函数进行平滑加权求和的运算，或者某种卷积运算，都可以称为线性滤波。常见的线性滤波有：均值滤波、高斯滤波、盒子滤波、拉普拉斯滤波等等，通常线性滤波器之间只是模版系数不同。非线性滤波：非线性滤波利用原始图像跟模版之间的一种逻辑关系得到结果，如最值滤波器，中值滤波器。比较常用的有中值滤波器和双边滤波器...

2020-04-27 19:24:40 398

原创图像处理（上）-Task03 彩色空间互转

RGB与灰度图互转RGB（红绿蓝）是依据人眼识别的颜色定义出的空间，可表示大部分颜色。但在科学研究一般不采用RGB颜色空间，因为它的细节难以进行数字化的调整。它将色调，亮度，饱和度三个量放在一起表示，很难分开。它是最通用的面向硬件的彩色模型。该模型用于彩色监视器和一大类彩色视频摄像。RGB颜色空间基于颜色的加法混色原理，从黑色不断叠加Red，Green，Blue的颜色，最终可以得到白色，如图...

2020-04-25 21:51:20 117

原创图像处理（上）-Task02 几何变换

算法理论介绍变换形式先看第一个问题，变换的形式。与OpencV不同的是这里采取冈萨雷斯的《数字图像处理_第三版》的变换矩阵方式，关于OpenCV的策略可以看它的官方文档。根据冈萨雷斯书中的描述，仿射变换的一般形式如下：式中的T就是变换矩阵，其中 (v,w)为原坐标，(x,y) 为变换后的坐标，不同的变换对应不同的矩阵，这里也贴出来吧，一些常见的变换矩阵及作用如下表：坐标系变换再看第二...

2020-04-23 21:00:47 143

原创图像插值算法

图像插值算法欢迎使用Markdown编辑器1.4.1 最近邻插值算法原理最近邻插值，是指将目标图像中的点，对应到源图像中后，找到最相邻的整数点，作为插值后的输出。1.4.2 双线性插值在讲双线性插值之前先看以一下线性插值，线性插值多项式为：f(x)=a1x+a0 f(x)=a_{1} x+a_{0} f(x)=a1x+a01.4.3 映射方法向前映射法可以将几何运...

2020-04-21 21:39:32 150

bage的博客