cc_moe-CSDN博客

原创 DBNet实战：详解DBNet训练bug与理论解析（paddleOCR ）

paddleOCR DBnet bug以及解析

2022-06-13 10:56:46 2423

原创 sdmgr

sdmgr论文关键字Key information extractionDocument imagesGraph reasoningDual modality相关论文方法关键信息提取建模为命名实体识别问题。通过将文本连接为字符串，这些字符串被分类为预定义的类别，如订单ID、发票号码等。一种鲁棒的关键信息提取方法应该针对图像视图鲁棒，并利用空间邻域内的所有上下文，而不仅仅是同一条水平线。Cloudscan-a conﬁguration-free invoice analysis

2021-07-13 20:04:39 1347

原创增值税发票识别（调研ing）

参考链接：https://zhuanlan.zhihu.com/p/145312833

2021-07-12 21:08:29 2537

原创 DBNet理论知识（草稿）

检测方法：基于回归的方法（文本框）：基于分割（基于像素点的分类）的方法（DBNet）：分割：

2021-07-01 21:15:12 1072

原创 ANSI 编码格式与 UTF-8 不兼容问题

ANSI 编码格式与 UTF-8 不兼容，格式转换后任会出现空格行检测和去除不掉问题。解决方案（定位，手动清除）：with open(r"D:\pythonProject\xxxxx-pytorch-master\data\char_dict.txt", 'rb') as file: #读取文件，检测实际非空行数 #char_dict = {char.strip().decode('gbk','ignore'):num for num, char in enume

2021-01-06 14:21:49 1196

原创 OCR——阿里OCR方案

1. 文字定位定位⽂字在图像中的位置并表征成⾏（1）特征问题：背景等特征⼲干扰问题深度学习可以较好的解决特征问题（2）scale问题：物体定位的共性问题（3）成⾏行行问题：⽂文字定位特有问题2. 文字识别3.通用结构化4.系统效率...

2020-12-21 14:18:30 855 1

原创 OCR——论文分享

2020-12-12/星期六《CharacterRegionAwarenessforTextDetection》发表于CVPR（2019）。论文利用分割的思想，对单字符实例和字符间的连接关系进行检测，通过连接字符实例实现不规则(变形、弯曲)文本检测。链接：https://ieeexplore.ieee.org/document/89538462020-12-16/星期三《DeepRelationalReasoningGraphNetworkforArbitrary...

2020-12-18 11:09:23 296

原创 OCR——视觉会议调研

视觉会议：icpr2020：Challenge: 1EndoTect: A Competition on Automatic Disease Detection in the Gastrointestinal TractChallenge: 2The 2nd Grand Challenge of 106-Point Facial Landmark LocalizationChallenge: 3AcTiVComp20Competition on Superimposed Text De..

2020-12-16 19:18:17 3092

原创 OCR——数据集调研

2020-12-14调研数据集：icdar—— ic2015,2017,2019 CTW—— 1500https://zhuanlan.zhihu.com/p/60459597

2020-12-14 11:03:07 3412

原创 OpenCV计算机视觉（5）——直方图和傅里叶变换

直方图cv2.calcHist(images,channels,mask,histSize,ranges)images：原图像格式为uint8或float32，当传入函数时应用括号 [] 同一样括住表示，例如[img] channels：同样用[]括，它会告诉函数，我们统幅图像的直方图。如果传入图像是灰度图，它的值就是 [0] 如果是彩色图像的传入参数可以是 [0] [1] [2] 它们分别对应着R G B mask：掩膜图像。统整幅图像的直方图就把它为None。但是如果你想统图像某..

2020-12-14 10:10:09 755

原创 OpenCV计算机视觉（4）——卷积原理与操作

卷积（每次卷积完之后+Relu（非线性））卷积核的深度和输入图像深度一致，有多少个卷积核，就得到多少张特征图，也就是得到的特征图的深度。1个卷积核的卷积过程：stride越小得到的特征越丰富/多，但是考虑效率的问题，stride一般不会设置为1，stride太大会损失很多信心。padding能更好得利用边缘信息，特征图大小计算：权重共享，一个特征图，参数数量=filter大小+b，多个特征图=n*（filter+b）大小池化Pooling layer（对特征图压缩）（下

2020-12-12 14:44:00 345

原创 OpenCV计算机视觉（3）——opencv--文档扫描OCR识别

检测流程：边缘检测 -> 获得轮廓 -> 透视变换(即放平，包括平移旋转反转等) -> OCR识别一、边缘检测if __name__ == "__main__": # 读取输入 image = cv2.imread(args["image"]) # resize 坐标也会相同变化 ratio = image.shape[0] / 500.0 orig = image.copy() image = resize(orig, height = 500) # 同比

2020-12-11 11:43:44 2180 3

原创 OpenCV计算机视觉（2）——信用卡数字识别

信用卡数字识别-流程预览一、基础配置# 导入工具包from imutils import contoursimport numpy as npimport argparseimport cv2import myutils# 设置参数ap = argparse.ArgumentParser()ap.add_argument("-i","--image",default='./images/credit_card_01.png',help="path to input image

2020-12-10 17:02:17 2012 1

原创 OpenCV计算机视觉（1）——opencv 基础

环境配置Anaconda：https://www.anaconda.com/download/ Python：https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv 快速安装opencv： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv

2020-12-10 11:20:37 844

原创序列标注

自然语言处理中的序列标注问题在目前, 比较主流的技术是语言模型(如LSTM, BERT)+CRF(条件随机场)。想要了解CRF(条件随机场), 首先了解一下隐马尔可夫模型(Hidden Markov Model), 是一种概率图模型（CRF也是）, 只要理解了HMM模型和维特比解码算法(viterbi algorothm), 理解条件随机场就成了分分钟的事.1.NER(命名实体识别)问题概述;命名实体识别（英语：Named Entity Recognition，简称NER）, 是指识别文本中具有特定

2020-09-19 21:56:30 285

转载中文自然语言处理的完整流程

第一步：获取语料语料，即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以，人们简单地用文本作为替代，并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语料库（Corpus），当有几个这样的文本集合的时候，我们称之为语料库集合(Corpora)。（定义来源：百度百科）按语料来源，我们将语料分为以下两种：1.已有语料很多业务部门、公司等组织随着业务发展都会积累有大量的纸质或者电子文本资料。那么，对于这些资料，在允许的条件下我们稍加整合，把纸质的文本

2020-09-19 20:10:43 3796

原创设计模式（手写单例模式）

1.单例模式2.抽象工厂方法3.简单工厂方法4.观察者模式

2020-09-08 23:54:11 639

原创 VMware虚拟机下的Linux操作系统安装（Ubuntu）

->1.文件->新建虚拟机向导->自定义2.下一步3.安装程序光盘映像文件（选择已经下载好的Ubuntu文件地址）操作系统镜像4.选择存放位置和命名5.下一步6.7.内存推荐4G8.下一步9.下一步10.下一步11.下一步12.逻辑上划分200个g，实际用多少分多少。注意：立即分配所有磁盘空间不要选。13.下一步14.取消创建后开启此虚拟机。完成15.完成界面。点击...

2020-07-08 21:46:33 223

原创运行apt-get update后出现错误（failed to fetch ppa ）

类似错误：W: Failed to fetch http://ppa.launchpad.net/venerix/pkg/ubuntu/dists/raring/main/binary-i386/Packages 404 Not FoundE: Some index files failed to download. They have been ignored, or old one...

2019-04-20 17:44:18 2553

原创 LabelImg安装 Windows + Anaconda

https://blog.csdn.net/qq_32799915/article/details/790816591.先下载安装anaconda：https://www.anaconda.com/download/选择适合自己Python版本的。2.进入anaconda prompt创建环境conda create --name=labelImg python=3....

2019-04-18 17:06:44 1835

原创一些软件的安装教程

PyCharm 安装教程（Windows）http://www.runoob.com/w3cnote/pycharm-windows-install.htmlAnaconda安装教程（Windows）https://blog.csdn.net/ITLearnHall/article/details/81708148配置环境：我的安装路径为D:\Aconda3配置环境变量：...

2019-04-17 20:46:06 367

原创 ROS 编写简单的Service和Client (C++ catkin)

一.编写service节点这里，我们将创建一个简单的service节点("add_two_ints_server")，该节点将接收到两个整形数字，并返回它们的和。进入先前你在catkin workspace教程中所创建的beginner_tutorials包所在的目录：cd ~/catkin_ws/src/beginner_tutorials请确保已经按照creating th...

2019-03-19 22:21:43 536

原创 roscd beginner_tutorials（包）不用每次进终端都配置（一劳永逸）的办法

locate .bashrc(首先查找.bashrc文件)vim /home/用户名/.bashrc 在最后一行加入：source ~/catkin_ws/devel/setup.bash...

2019-03-19 20:43:06 252

原创 ROS 编写消息发布器和订阅器 &测试(Python catkin)

一.编写发布器节点talker进入之前创建的beginner_tutorials包//如果roscd进不了包export ROS_PACKAGE_PATH=~/catkin_ws/src:$ROS_PACKAGE_PATH$ roscd beginner_tutorials首先创建scripts目录存放Python代码：$ mkdir scripts$ cd scr...

2019-03-18 21:35:45 316

原创 ROS 编写消息发布器和订阅器 &测试(C++ catkin)

ROS入门教程-1.1.11 编写简单的消息发布器和订阅器 (C++ catkin)一.编写发布器节点talker "节点(Node)" 是ROS中指代连接到ROS网络的可执行文件的术语。 1.在beginner_tutorials package路径下创建src目录:mkdir -p ~/catkin_ws/src/beginner_tutorials/src 这个...

2019-03-18 17:12:05 403

原创 ROS 创建msgs srv 具体步骤

ROS入门教程-1.1.10 创建ROS消息和ROS服务消息(msg)和服务(srv)介绍 msg文件存放在package的msg目录下，srv文件则存放在srv目录下。在ROS中有一个特殊的数据类型：Header，它含有时间戳和坐标系信息。下面是一个msg文件的样例，它使用了Header，string，和其他另外两个消息类型。 Header header...

2019-03-18 11:42:55 826 3

原创 3ds-Max2016 安装无法正常打开win10

DirectX修复工具3.8 官方标准版http://www.onlinedown.net/soft/120082.htmwin10无法成功完成操作文件包含病毒解决办法解决：https://jingyan.baidu.com/article/84b4f565a6304560f6da321a.html3ds MAX中文语言怎么设置https://jingyan.baidu...

2019-03-17 02:37:01 1763

原创 Blender 下载&设置

https://www.blender.org/参考：https://www.jianshu.com/p/c52605b4b8e8energy(能量)主题：原作者：https://studiollb.wordpress.com/download/（https://www.3d66.com/popsoft_1.html）（3dsmax的不知道能不能行，试一下再告诉你们）1....

2019-03-16 20:26:37 3109 1

原创 rqt_graph工具报错 ROS学习

ROS使用过程中出现的问题：由于Anaconda的Python路径问题造成rqt_graph报错运行rosrun rqt_graph rqt_graph报错最近由于方向的需要,开始学习ros,载装ros_graph的时候遇到报错,没有catkin_pkg包啥的.经过咨询各路大牛,最终发现是由于自己的电脑安装了anaconda3的原因,解决方法也比较简单.首先:vi ~/.bas...

2019-03-11 20:54:58 2035

原创 ros 编译节点话题服务参数

编译ROS程序包（使用catkin_make）按照之前的创建一个ROS程序包教程，你应该已经创建好了一个catkin 工作空间和一个名为beginner_tutorials的catkin 程序包。现在切换到catkin workspace 并查看src文件夹：$ cd ~/catkin_ws/$ ls src效果：beginner_tutorials/ CMakeList...

2019-03-11 16:14:53 911

原创 Ros move_base

解决机器人导航问题

2019-03-05 18:47:35 191

原创 Ros tf in python

2019-03-05 18:37:45 645

原创 Ros tf in c++

2019-03-05 18:25:36 237

原创 ros tf tree 基础

tf(机器人坐标系变换) tree把啤酒瓶的xyz的坐标相对于眼睛的坐标转换到手上，在Ros里面，用URDF文件来定义它的各个联感和关节。URDF(统一机器人描述格式，定义了机器人模型，关节，长度，连接方式.....)例如，摄像头的关节连在底座上，相对这个底座有个transform，需要把坐标回溯到底盘，然后再相对于胳膊，再相对于夹子（关节可能定义不止这么多，传导了很多层），t...

2019-03-04 09:39:56 4702 1