自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 关键信息提取技术的发展

OCR深度学习模型识别文字,大语言模型提前信息。OCR+LLM是较易实现且效果稳定有保障的方法。弱点:存在不稳定性,性能良好的模型不容易训练。使用视觉大模型提取关键信息将是最终阶段。目前代表:读光 Doc Master。弱点:需要对不同的版面进行分类处理。目前代表:qwen-vl-max。百度飞桨的关键信息提取套件。弱点:只能适应固定版面格式。

2024-04-21 01:11:13 318 1

原创 PaddleOCR检测模型训练深度解析

b 指标数据漂亮 hmean 0.9以上,但你很难纠正模型固有的思维(除非拿近似级别的数据量去纠正),效果难达到预期。b 在开源数据集上训练,带有开源数据集的基本特征。因为官方模型或三方模型不能有效的达到项目检测目标,所以自训练能实现需求的模型。b 公开数据泛化强,针对弱。b 在一定精度上起步,精度指标天生高,对自有数据实际效果不明显。a 从0起步训练,对自有数据的效果明显,但提高训练精度指标难。b:基于PP-OCR模型的微调(官方训练出的基座模型上微调)a:从骨干网络基础上训练模型(自己训练基座模型)

2023-10-03 05:54:19 203

原创 paddle 安装报错无法加载核心,由于 libpddle.pyd 问题

paddle 安装报错

2022-12-08 16:45:43 1415 2

原创 conda下的python虚拟环境备份

conda基本操作

2022-01-07 19:49:15 534

原创 rattle安装问题GTK+:自下载、设置GTK环境包

rattle安装问题GTK+rattle是R环境中一个常用于简单数据挖掘的包。安装rattle一般不会出现问题,当你看到“去轻摇、晃动、翻滚你的数据”时,rattle已经安装成功。(图1)

2021-01-05 10:32:47 1496 1

原创 联想昭阳E46G笔记本识别4G内存问题

2010的老本E46G年代虽远,但办公用性能足够。而很多软件都不支持XP了,必须升级到win7。为了流畅运行win7,添了一根2G内存,和原来的2G组成双通道4G,提升性能。但都安好后,win7 64bit版的系统,仍然只认出2.9G,网上有的说是32位系统问题,有的说是msconfig引导问题。都试了遍,仍没解决。后来发现是bios问题,升级后可解决。现有BIOS版本为25cn32ww,要升级...

2018-12-11 13:29:43 3603 1

知网Hownet情感词典.zip

知网Hownet情感词典

2021-08-09

U盘数据恢复软件

U盘数据恢复软件,文件被误删除后,用软件可直接找回。

2018-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除