2 hh_2018

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 4w+

基于tesseract的二次训练过程

tesseract 是一个开源的文字检测工具,但是其语言包具有一定的共性,所以针对一些特定的情景并不能很好的满足需要所有此时就需要进行二次训练,针对该方式的训练字体使用的工具为jTessBoxEditorFX-2.0.1.zip,其训练过程如下:1. 打开jTessBoxEditor。然后点tools->Merge TIFF,生成对应的文件并保存2. 执行 tesseract c...

2019-10-14 20:40:12

基于linux的tesseract5.0安装

tesseract5.0拥有更高的准确度的同时可以使用白名单进行识别的筛选,基于windows目前有很多安装好的压缩包直接安装即可,具体可见https://digi.bib.uni-mannheim.de/tesseract/但是其基于linux的安装却需没有很好的安装包,需要从源码进行编译,其具体安装方式如下:1. git clone https://github.com/tessera...

2019-10-14 20:28:39

基于tesseract的文字识别

tesseract是谷歌开源的一款可以对图片进行ocr识别开源软件,使用时主要包括安装tesseract,下载语音库,自训练语音库几个部分。其安装方式和下载方式目前有许多介绍不做多的说明。一、tesseract基本操作过程1. 安装过程需要注意自己选取的版本,tesseract-4的版本虽然提高了准确度但是不支持配置的白名单,tesseract-3和tesseract-5的版本支持,另外基...

2019-09-01 15:31:43

深度学习框架之Keras

Keras是一个抽象层次高的API,其后台也支持tensorflow框架。他的目的是让大家能够更快的构建深度学习网络模型。他可以理解为在tensorflow的API上又封装的一层API。该模块具有编程简单,模块化清晰,门槛低等优点,但是该模块支持的语言有限,目前只支持Python语言。下面简单介绍一下如何使用该模块生成对应的卷积神经网络。1. 模块概述: Keras提供了两种模式范式...

2019-05-13 22:02:12

卷积计算过程中的减少计算量的优化方式

大卷积转化为小卷积:根据VGG的思想,对于大的卷积核可以转换为多个相同卷积串联的方式来减少。具体如下: 由图可以看出一个5X5的卷积核可以换成两个3X3的卷积,此时参数的个数由25变成了18(2X3X3),同理对于一个7X7的卷积核可以变成3个3X3的卷积,此时参数量由49变成了27。所以此时得到相同的效果使用了更少的参数。假设输入的特征大小是M,N,那...

2019-03-20 21:26:50

基于深度学习框架的超分辨率问题三之WDSR

WDSR是18年比较新的模型,现在又对应的官方pytorch版本,其链接为:https://github.com/JiahuiYu/wdsr_ntire2018WDSR(2018年冠军模型)模型架构主要由于目前使用的结构要么是丢失掉了浅层的信息,比如上述提到的网络,通过各种激活函数,当浅层信息传递到最后时已经丢失了;要么就是采用跳跃链接的方式比如SRDenseNet,此时虽然浅层信息通...

2018-12-24 11:49:29

基于深度学习框架的超分辨率问题二之EDSR

上篇主要介绍了一些基本的超分辨率的方法,这篇给大家介绍一下EDSR方法。EDSR和MDSR(17年冠军模型)模型架构EDSR的根本出发点还是希望增加网络的深度(卷积层的层数)和宽度(卷积核的通道数)来提高计算的准确度。而其更多的可以看作是对SRResNet的改进,去掉其对应的多余计算(主要是指BN和Relu)。其具体的Residual Block结构如右(图中a表示最原始的结构,c表示...

2018-12-24 11:32:55

基于深度学习框架的超分辨率问题一之基本模型架构

目前在调研基于深度学习的观点对超分辨率问题的解决,对于其中的一些方法进行了一个大概的综述,现将其总结如下:SRCNN模型架构SRCNN是深度学习用在超分辨率上的开山之作。首先将图片通过插值的方式放大到需要变换的尺寸。然后再将放大后的图片放入到一个3层的卷积神经网络中,最终输出一个较为清晰的图片。其对应的3层卷积网络结构如下:上述网络层次比较简单但是效果已经能够远远超过传统的方式...

2018-12-12 22:00:42

基于深度学的目标检测方法三之基于回归的方法

基于回归的方式就是彻底的去掉了region思想,也不使用RPN,直接在一个网络中进行回归和分类。其代表的方法主要有YOLO和SSD。由于减少了一个网络同时可以减少一些重复的计算,所以其在速度上有了较大的提升。YOLOYOLO的思想是将一幅图分成SxS个网格,然后让每个网格负责检测物体中心落在这个网格上的物体。                                        ...

2018-11-22 22:19:13

基于深度学的目标检测方法二之基于候选框的方法

 上篇内容介绍了一些基本的只是概念,这篇主要介绍一下运用这些基本概念产生的基于候选框的识别方法。 R-CNN该方法作为深度学习用于物体识别的开山之作,后续很多基于候选框为基础的方法都是在该方法上进行改进得到的。该方法的具体实现为:(1):输入一张图片(2):利用selective  search的方式从图中选出2000个左右的Region proposal 。(3):对...

2018-11-22 22:11:53

基于深度学的目标检测方法一之基本思想概念

 目前在研究基于深度学的目标检测方法,现在就目标检测涉及的一些基本概念总结如下: 一、基于图的图像分割(Graph  Based Image Segmentagion)该方法是基于图论中的最优树的思想,利用贪心算法对图像的区域进行聚类以达到对一副图找出对应候选框的方法。合并的标准是考察两个相连像素的不相似性,然后以同一个区域内最不相似的值为标准 ,以不同区域内最相似的值为依据 ,若:...

2018-11-22 22:06:03

深度学习中基于tensorflow_slim进行复杂模型训练三之TFRecords的介绍

一、TFRecords的数据结构TFRecords数据集是一种二进制的数据集,是tensorflow推荐的标准文件格式。Tensorflow通过ProtocolBuffers定义了TFRecords文件中存储的记录及其所含的字段结构,使用该方式可以将数据,标签以及和数据相关的信息通过key,value的形式存储在同一个文件中,并通过key,value的形式对存储的数据进行读取。该数据结构定义在...

2018-10-30 11:55:09

深度学习中基于tensorflow_slim进行复杂模型训练二之tensorflow_slim的使用

上篇博客主要介绍了tensorflow_slim的基本模块,本篇主要介绍一下如何使用该模块训练自己的模型。主要分为数据转化,数据读取,数据预处理,模型选择,训练参数设定,构建pb文件,固化pb文件中的参数几部分。一、数据转化:主要目的是将图片转化为TFrecords文件,该部分属于数据的预处理阶段,可以参考datasets中的download_and_conver_flower中的run函...

2018-10-29 19:19:11

深度学习中基于tensorflow_slim进行复杂模型训练一之tensorflow_slim基本介绍

最近在进行微表情识别,但是目前没有查到比较有效的模型方式,考虑使用inception_v3的模型进行开发,但是该模的构造过程比较复杂,训练更是麻烦,因此考虑基于tensorflow_slim的模块进行二次训练,首先介绍一下关于tensorflow_slim的基本模块。tensorflow_slim的模块主要包括以下几个部分deployment ,nets,dataset, preprocess...

2018-10-28 17:26:48

tensorflow之模型压缩

tensorflow的模型在移动端运行时往往需要进行模型压缩。这主要有于两方面的原因:1.模型过大不易加载和下载,运行时内存占用率太高。2.tensorflow的模型在训练的过程中可能为了训练会添加一些操作和节点,而tensorflow的移动端只专注于推理,这样在运行时就会产生一些内核不存在的错误。所以此时需要通过压缩来减少一些和输入及输出不相关的节点。下面介绍一下模型压缩的方式。一、环境需...

2018-09-17 20:19:32

Tensorflow之编译window平台下基于c/c++使用tensorflow

最近在考虑将tensorflow的工程迁移到window平台下进行,由于linux和mac平台在官网上有对应的c/c++接口的安装说明,而window平台则需要自己编译。所以现将编译过程记录如下:一、环境准备1. vs20152. swigwin-3.0.12。下载链接为  http://swig.org/download.html  。下载之后解压缩即可。3. Cmake  , ...

2018-07-31 20:44:15

tensorflow之编译使用c/c++动态链接库

tensorflow主流接口虽然是python,但是其也支持C语言的接口供大家调用,并且对于图像处理等方面c++是一种更为合适的语音。因此本文主要介绍一下如何安装并使用c版本的tensorflow。一、 编译。 编译的目的主要是为了产生对应的头文件和动态链接so文件。编译的方式有两种:1. bazel build --config=opt //tensorflow/tools/lib_...

2018-07-24 15:50:12

tensorflow之并行读入数据

最近研究了一下并行读入数据的方式,现在将自己的理解整理如下,理解比较浅,仅供参考。并行读入数据主要分1. 创建文件名列表2. 创建文件名队列3. 创建Reader和Decoder4. 创建样例列表5. 创建批列表(读取时可要可不要,一般情况下样例列表可以执行读取数据操作,但是在实际训练的时候往往需要批列表来分批进行数据的组织,提取)其具体流程如下: 一、 文...

2018-07-22 16:35:48

卷积神经网络之Inception Net

Goole Inception Net 首次出现在ILSVRC 2014 的比赛上,并且取得了当时比赛的第一名,当年的第二名是被VGGNet取得的。并且当时的Inception Net被称为Inception V1。inception  V1是一个22层的结构(卷积层),如果加上池化层大概有27层。在Inception网络中最基本的结构被称为Inception  model。我们可以通过Inc...

2018-07-19 12:08:45

tensorflow之源码编译及相关问题

最近研究模型速度问题,查了一些文献,有的文献说tensorflow本身的性能比其他的深度学习框架要低,但是tensorflow的开发团队加入了许多优化的设置,如果打开这些设置tensorflow的性能能够达到甚至超越现有的深度学习框架。但是现有的安装包为了平台的通用性往往在生成对应的wheel文件时会关掉一些配置,因此需要从源码编译安装包并且在编译的过程中自己打开一些需要的配置。基于上述原因,我采...

2018-07-11 17:52:29

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。