17 javastart

尚未进行身份认证

我要认证

专注于大数据 AI

等级
TA的排名 952

(附完整python源码)基于tensorflow、opencv的入门案例_发票识别三:发票数据集制作和cnn网络训练

1 制作数据集合1.1 在word上输入一行数字,我用的是Calibri字体,已经比较接近发票数字了。网友们可以自行定义字体。1.2 读入图片为灰度图,threshold化;并将图片颜色反转:字体为白背景为黑;对图像进行各种类型的膨胀,多样化数据。 # encoding: utf-8 import cv2 import numpy as np import os img0 = cv2.imre...

2020-07-31 18:32:16

如何提高OCR准确度(Acc)

说到文字识别--OCR技术,当下已被人们广泛使用, 许多公司通过采用OCR技术,将现有的工作流程和业务流程进行了极大的改进。人们在开源对技术上,不断推陈出新,OCR识别技术准确率也不断提升,在生产力方面取得效果也越来越突出。虽然提高OCR准确度不是一夜之间可以做到的事情,但人们肯定会在适当的时候尝试这样做。那么如何来微调(finetune)他们的OCR模型呢?嗯,有不同的方法来实现这一目标。我们Infrrd请记住以下提示:准确度可以在字符(字)级别实现。 ->characte...

2020-07-31 18:23:59

一文带你学会使用YOLO及Opencv完成图像及视频流目标检测(上)|附源码

计算机视觉领域中,目标检测一直是工业应用上比较热门且成熟的应用领域,比如人脸识别、行人检测等,国内的旷视科技、商汤科技等公司在该领域占据行业领先地位。相对于图像分类任务而言,目标检测会更加复杂一些,不仅需要知道这是哪一类图像,而且要知道图像中所包含的内容有什么及其在图像中的位置,因此,其工业应用比较广泛。那么,今天将向读者介绍该领域中表现优异的一种算算法——“你只需要看一次”(you only look once,yolo),提出该算法的作者风趣幽默可爱,其个人主页及论文风格显示了其性情,目前该算法已...

2020-07-31 14:04:09

形态学处理-腐蚀和膨胀

2020-07-31 13:44:49

Python Requests中异常总

1. 连接超时服务器在指定时间内没有应答,抛出 requests.exceptions.ConnectTimeoutrequests.get('http://github.com', timeout=0.001)# 抛出错误requests.exceptions.ConnectTimeout: HTTPConnectionPool(host='github.com', port=80): Max retries exceeded with url: / (Caused by ConnectT.

2020-07-28 14:17:03

OpenCV 4.4 发布!SIFT移到主库,新增YOLOv4 和 EfficientDet 推断支持

https://blog.csdn.net/bevison/article/details/107479275

2020-07-22 12:46:22

Halcon OCR--字符识别(CNN卷积神经网络)

https://blog.csdn.net/IntegralforLove/article/details/83756956

2020-07-20 18:21:50

2020 年 中英文拼写纠错开源框架梳理

一、中文:1、Pycorrector:https://github.com/shibing624/pycorrector当前主流的中文纠错框架,支持规则和端到端模型2、FASPell:https://github.com/iqiyi/FASPell/blob/master论文:https://www.aclweb.org/anthology/D19-5522.pdf使用bert进行预训练+微调,再经过CSD过滤器得到最终结果。支持简体中文文本; 繁体中文文本; 人类论文; OCR结...

2020-07-19 09:47:12

pycorrector 纠错工具安装

pycorrector中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。Demohttps://www.borntowin.cn/product/correctorQuestion中文文本纠错任务,常见错误类型包括:谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺...

2020-07-18 14:33:05

Soft-Masked BERT:文本纠错与BERT的最新结合

文本纠错,是自然语言处理领域检测一段文字是否存在错别字、以及将错别字纠正过来的技术,一般用于文本预处理阶段,同时能显著缓解智能客服等场景下语音识别(ASR)不准确的问题。本文将通过以下几个章节简要介绍文本纠错相关知识。1. 文本纠错示例与难点2. 文本纠错常用技术3. 如何将 BERT 应用于文本纠错4. 文本纠错最优模型:Soft-Masked BERT(2020-ACL)5. 立马上手的纠错工具推荐一.文本纠错示例与难点生活中常见的文本错误可以分为(1)字形相似引起的错误...

2020-07-18 11:26:19

场景文字检测模型PixelLink详解与使用

详解PixelLink模型与使用!觉得不错,请点【在看】支持!OpenVINO是英特尔推出基于CPU/GPU新一代视觉加速框架,可以对常见的各种检测模型与分割模型在CPU端侧实现10倍以上加速。其自带预训练模型库支持多种常见视觉感知与识别应用场景,可以快速搭建原型演示程序与极简应用。相关视频教程可以点击下面链接学习:首发 | OpenVINO开发配套视频教程发布了PixelLink模型详解OpenVINO支持的场景文字检测是基于PixelLink模型,该模型是浙大联合阿里提出,其核心.

2020-07-13 12:38:15

OpenCV—python 发票印章去除或分割(图像内容识别预处理)

前言在做发票内容识别时,发现发票的印章遮挡住文字信息,尤其在合计金额处,导致这一处的信息提取出问题,于是想到去除发票印章。思路一:通过颜色通道获取所需信息图(代码主要是参考http://www.deanhan.com/2018/06/15/channel/)读取原始图像A 提取图像的红色通道,得到红色通道灰度值图片B 计算B的统计直方图C,确定最佳的阈值threshold 根据阈值,对B进行二值化,得到最终图片D (可选)应用膨胀算子对D进行操作,得到图片E#去除印章i...

2020-07-10 12:42:24

OpenCV探索之路(二十六):如何去除票据上的印章(C++ )

最近在做票据识别的编码工作时遇到一些问题,就是票据上往往会有一些红色印章把一些重要信息区域给覆盖了,比如一些开发票人员盖印章时比较随意,容易吧一些关键区域给遮蔽了,这让接下来的票据识别很困难,因此,我们必须先对票据图像进行一定的预处理来移除印章干扰,再进行字符识别,这样子识别准确率才有保证。我们从简单例子说起,比如我们有以下一张票据,上面盖有红色印章,虽然该印章没有遮挡关键信息,但是我们还是打算将其移除,那该怎么办?首先想到的肯定移除红色像素点的方法,这种方法需要查到红色的颜色范围,然后遍历全图像...

2020-07-10 12:23:01

tesseract_OCR-优化技巧系列

一、基于tesseract_OCR+opencv实现图片中汉字辨识-汉字笔画优化https://blog.csdn.net/lipc_/article/details/80812258二、基于Tesseract实现图片文字识别-表格采用单元格识别https://www.cnblogs.com/yszd/p/12072145.html

2020-07-06 22:10:30

基于Tesseract的OCR识别--身份证

目录 需求背景 Tesseract简介及环境搭建 字库训练 Tesseract for iOS 总结 需求背景由于客户端内核的限制,市场上大多数身份证识别都会放在服务器校验,客户端一般只是负责抓取图片,将抓取到的图片上送到服务器识别。这样一来如果客户端抓取到的身份证图片的质量无法保障,服务器也很难识别得出来,会拖慢身份证识别进程,造成用户...

2020-01-29 11:53:53

两款开源的中文OCR工具

1.cnocrcnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。cnocr目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。cnocr是Python3下的中英文OCR包,通过pip命令安装后即可直接使用。pip install cnocr==1.1.0V1.1.0对代码做了很大改动,...

2020-07-04 16:38:50

关于tensorflow模型保存几种格式

ckpt常规模型保存,模型结构,数据,运算图分开保存。常用在训练阶段使用。h5keras前端保存的模型格式,有两种,纯数据和数据+网络结构,可以被tf调用。可以用软件查看内部数据,并进行修改。pb用于移动端端/server端都有使用,包括结构+数据,不可以修改内部,也就是为什么叫做凝固图了。可以做量化模型处理,目前只支持int8和float16两种格式量化。pbtxtpb的扩展格式,可以被修改内容,用记事本就可以修改。tflite一种实验的数据格式,也叫轻量化模型,多用.

2020-07-04 15:52:09

模型格式转换工具

一。keras_to_tensorflowhttps://github.com/amir-abdi/keras_to_tensorflow/blob/master/keras_to_tensorflow.py

2020-07-04 08:49:21

深度学习-模型压缩-PaddleSlim

PaddleSlim是一个模型压缩工具库,包含模型剪裁、定点量化、知识蒸馏、超参搜索和模型结构搜索等一系列模型压缩策略。对于业务用户,PaddleSlim提供完整的模型压缩解决方案,可用于图像分类、检测、分割等各种类型的视觉场景。 同时也在持续探索NLP领域模型的压缩方案。另外,PaddleSlim提供且在不断完善各种压缩策略在经典开源任务的benchmark, 以便业务用户参考。对于模型压缩算法研究者或开发者,PaddleSlim提供各种压缩策略的底层辅助接口,方便用户复现、调研和使用最新论...

2020-07-02 23:10:19

mycat 下载地址变更

http://dl.mycat.io 变更为以下地址:http://dl.mycat.org.cn/

2020-06-29 14:56:08

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。