自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI公园

专注分享干货的AI公众号,图像处理,NLP,深度学习,机器学习,应有尽有.希望大家能在AI的乐园中快乐玩耍.

  • 博客(726)
  • 资源 (3)
  • 收藏
  • 关注

转载 马斯克的大语言模型Grok的发布声明

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:xAI编译:ronghuaiyang导读xAI的测试版大语言模型Grok的发布声明。Grok发布声明Grok是一款模仿《银河系漫游指南》的人工智能,其目的是回答几乎任何问题,甚至是提出应该问什么问题的建议!Grok被设计成以一些幽默感来回答问题,并带有一丝叛逆,所以如果你不喜欢幽默,请不要使用它!Grok的一个独特而基本的优势是,它通...

2023-11-07 09:01:40 327

转载 微调TrOCR,训练TrOCR能识别弯曲和模糊文本

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Sovit Rath编译:ronghuaiyang导读本文对TrOCR模型在弯曲和模糊文本数据集上进行了微调,并分析了每一步的代码和训练结果。TrOCR (Transformer based Optical Character Recognition)模型是最好的 OCR 模型之一,在之前的文章中,我们分析了这个模型在单行打印文本和手...

2023-09-17 10:00:04 820

转载 TrOCR:基于Transformer的OCR介绍和使用

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Sovit Rath编译:ronghuaiyang导读本文介绍了TrOCR的结构和使用方法,手把手从每一行代码教起。光学字符识别(OCR)在过去几年中出现了一些创新。它对零售、医疗、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和一些最先进的模型,研究人员仍在不断创新。与深度学习的许多其他领域一样,OCR也看到了transfor...

2023-09-15 08:56:33 2358

转载 使用Stable Diffusion图像修复来生成自己的目标检测数据集

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Rédigé par Gabriel Guerin编译:ronghuaiyang导读有些情况下,收集各种场景下的数据很困难,本文给出了一种方法。深度学习模型需要大量的数据才能得到很好的结果,目标检测模型也是一样。要训练一个YOLOv5的模型来自动检测你最喜欢的玩具,你需要拍几千张你的玩具在不同上下文中的照片,对于每张图,你需要标注玩具...

2023-09-05 09:01:00 554

转载 DETR解析第三部分:结构和细节

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读本文中,我们会学习DETR的模型结构。。DETR Breakdown Part 3: Architecture and Details在系列1种,我们理解了DETR诞生的原因和方式,关键的特点,以及他和之前的模型的区别。在系列2...

2023-08-16 09:00:59 183

转载 DETR解析第二部分:方法和算法

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读在本文中,我们会学习到DETR中应用的方法。这是DETR解析系列的第 2 部分。在之前的文章中,我们了解了哪些因素导致了DETR的诞生,添加了哪些部分,以及到底什么使得DETR 成为当今的超级目标探测器。DETR 的关键组成部分...

2023-08-03 09:00:21 98

转载 DETR解析第一部分:Detection Transformer的介绍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读在本系列中,我们将了解DETR,这是一种使用transformer的端到端可训练的深度学习架构,用于目标检测。DETR的介绍在这篇文章中,我们用 DETR 探索了目标检测的革命(整个架构如下图所示的交互图所示),这是一种采...

2023-07-28 09:01:17 161

转载 目标检测的后处理:NMS vs WBF

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Ching (Chingis)编译:ronghuaiyang导读对目标检测后处理中的NMS和WBF的解释和对比。目前,计算机视觉在许多地方都有重要的应用,例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测,它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能,研究人员和从业者开发了各种技术,例如模型集成...

2023-07-26 09:00:37 96

转载 扩散模型的基本内容介绍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:RyanO'Connor编译:ronghuaiyang导读本文从原理讲起,介绍了扩散模型的很多基础内容。扩散模型的迅速崛起是机器学习在过去几年中最大的发展之一。在这篇文章中,你能了解到关于扩散模型的一切。扩散模型是生成模型,在过去的几年里已经获得了显著的普及。仅在21世纪20年代发表的几篇开创性论文就向世界展示了扩散模型的能力,比如...

2023-04-04 09:00:47 3505

转载 如何解决“RuntimeError: CUDA Out of memory”问题

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Nitin Kishore编译:ronghuaiyang导读一些可以尝试的解决“RuntimeError: CUDA Out of memory”的方案。当遇到这个问题时,你可以尝试一下这些建议,按代码更改的顺序递增:减少“batch_size”降低精度按照错误说的做清除缓存修改模型/训练在这些选项中,如果你使用的是预训练模型,则最容...

2023-03-22 09:00:47 9187 3

转载 YOLO系列的演进,从v1到v7(三)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读在本文的前几部分中,我们回顾了 YOLO 家族的前 9 种架构。在最后一篇文章中,我们将介绍目前 3 种最新架构。YOLOR作者Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao (Taiwan).主要论文“You Only Learn...

2023-03-21 09:00:38 384

转载 YOLO系列的演进,从v1到v7(二)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读在上一部分中,我们研究了最古老的三种架构:YOLO,YOLOv2,YOLOv3。今天,我们将处理接下来的六种结构。YOLOv4, Scaled YOLOv4作者Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark LiaoJose...

2023-03-20 09:00:17 721

转载 YOLO系列的演进,从v1到v7

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读经典再回顾,本文介绍v1到v3。如果你需要速度快的目标检测器,那么 YOLO 系列的神经网络模型实际上是当今的标准。解决检测问题还有很多其他优秀的模型,但我们不会在这篇综述中涉及它们。目前,已经写了相当多的文章来分析 YOLO 各个版本的功能。本文的目的是对整个家族进行比较分析...

2023-03-17 09:00:14 296

转载 理解如何处理计算机视觉和深度学习中的图像数据

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Bikram Baruah编译:ronghuaiyang导读包括了适用于传统图像的数据处理和深度学习的数据处理。介绍:在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚至可能不需要深度学习模型,经过一些处理后一个简单的分类器可...

2023-03-13 09:00:16 350

转载 Debug图像分类模型:为什么模型会在生产环境中失效?

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Emad Ezzeldin编译:ronghuaiyang导读计算机视觉模型在训练、验证和测试集中可以正常工作,但在生产场景中失效。本文讨论模型在生产中失效的一些常见模式。错误模式1:变体分类器(观察到了错误的地方)模型预测了环境等虚假特征,而不...

2023-03-10 09:00:26 91

原创 卷积神经网络长尾数据集识别的技巧包

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对长尾数据集的tricks进行了分析和探索,并结合一种新的数据增强方法和两阶段的训练策略,取得了非常好的效果。Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks摘要:目前,在长尾分布的数据集上,在数据极端不均衡的...

2022-11-17 10:00:57 982

转载 纹理分析以及结合深度学习来提升纹理分类效果

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Trapti Kalra编译:ronghuaiyang导读纹理分析的介绍,各种纹理分析方法,并结合深度学习提升纹理分类。人工智能的一个独特应用领域是帮助验证和评估材料和产品的质量。在IBM,我们开发了创新技术,利用本地移动设备,专业的微型传感器...

2022-09-09 08:00:29 1632

原创 Equalized Focal Loss for Dense Long Tailed Object Detection 论文解读

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对Focal Loss做了改进,使之可以在一阶段物体检测器中适用于长尾分布数据集的场景。效果提升明显。摘要:最近的长尾目标检测的方法,都是用的2阶段的模式。而在实际的工业场景中,一阶段目标检测器是更常用的,应为它更加简单,更容易部署。但是,在长尾分布的场景中,这部分的工作并没有进行很深入的探索。本文,我们研究了是否一阶段的物体检测器也可...

2022-08-30 20:50:38 1381 4

转载 ​计算机视觉传感器&系统

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Mehdi Amine编译:ronghuaiyang导读捕捉和诠释光的旅程。从硬件到实现计算机视觉的系统,本文的概述侧重于广度而非深度。为了平衡这种方法,本文引导读者阅读具有指导性的参考文献,并提供了随时可以运行的源代码。我们从图像形成的机制开...

2022-08-26 19:00:59 538

转载 优化PyTorch的速度和内存效率(2022)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Jack Chih-Hsu Lin编译:ronghuaiyang导读你应该知道的18个PyTorch小技巧。调试深度学习的pipelines就像找到最合适的齿轮组合你为什么要读这篇文章?深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下,每个迭代的速度越快,整个模型的预测性能就越快。我收集了几...

2022-06-21 10:01:00 1241

原创 M-CenterNet:多中心点的CenterNet

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读本文针对小目标检测,在CenterNet上进行了改进,将CenterNet上的一个中心点改成了4个中心点,取得了不错的效果,改...

2022-03-08 10:00:00 1361 3

原创 TTFNet:改进CenterNet,使得训练时间缩短7倍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读本文是对CenterNet的一种改进,主要是增加了训练时参与回归的样本,提升了收敛速度,加快了训练时间,同时使用了椭圆高斯核来...

2022-03-01 10:00:00 4521

原创 《Revisiting the Sibling Head in Object Detector》论文解读,物体检测中的解耦检测头

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读这篇文章提供了一种使用不同proposal来分别做检测和分类的二阶段物体检测方法,相比之前的方法有稳定的performance...

2022-02-18 10:00:00 2705

原创 对物体检测中分类和定位的重新思考

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读这篇文章对物体检测器的head进行深入的研究,提出了Double-Head-Ext的方法,效果对比基线模型有明显的提升。论文...

2021-12-31 10:00:00 1537

原创 NAM: Normalization-based Attention Module,一种新的注意力计算方式,无需额外的参数...

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读本文介绍了一种新的计算注意力的方式,相比于之前的注意力机制,无需额外的全连接,卷积等额外的计算和参数,直接使用BN中的缩放因此...

2021-12-20 10:00:00 4363 3

原创 【论文解析】TOOD:任务对齐的一阶段物体检测器

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读显式的使用loss来对齐分类和定位任务。TOOD: Task-aligned One-stage Object Detecti...

2021-08-30 10:00:00 1158

原创 特征对齐的旋转目标检测:Align Deep Features for Oriented Object Detection

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对齐后的特征对于旋转目标的学习更有好处。后台发送“s2anet”获取论文和代码链接。1、介绍使用一阶段物体检测器来做旋转物体检...

2021-08-09 18:00:00 2552

转载 Github标星13.6k !一行代码从PDF提取Excel文件,牛逼炸了!

导 读相信大家在工作生活中经常会遇到表格识别的问题,比如导师说,把下面PDF文件里面的表格取出来整理成Excel表。也可能会遇到,公司领导或者客户发来一张截图,需要里面的表格取出来转成Ex...

2021-08-09 18:00:00 613

原创 用于小目标检测的一个简单高效的网络

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读以Tiny YOLOV3的速度达到YOLOV3的效果。论文链接:后台发送“小目标检测网络”获取论文链接。1. 介绍本文提出一种...

2021-07-28 10:00:00 795

原创 【论文解读】​YOLOX: Exceeding YOLO Series in 2021

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读旷视团队对YOLO系列的再一次超越。论文链接:后台发送“yolox”获取论文链接。1. YOLOX1.1 YOLOX-Dark...

2021-07-27 09:59:23 578

原创 【论文解读】基于CNN的使用面向目标的浅层特征和极小anchor的红外弱小目标检测算法...

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对于检测小目标有一定的借鉴意义。论文下载:后台回复“红外小目标检测”获取论文下载链接。1. 介绍红外小目标检测的几个困难点:1...

2021-07-26 10:00:00 3168

原创 Dynamic Head: 物体检测器Head的统一注意力框架

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读来自微软,在一个框架中集成了尺度注意力,空间注意力和通道注意力。公众号后台回复“d-head”,获取文章链接。摘要:这篇文章...

2021-07-13 10:00:00 721 2

转载 图像识别算法超低代码开发方案

三次登陆Github Daily全球趋势榜,2.1k 星标,图像分类、目标检测、语义分割、实例分割等视觉任务全覆盖,更重要的是简单!简单!简单!不需要数学基础,不需要是编程大牛,只要下载就...

2021-06-29 18:00:00 472

转载 BBAug: 一个用于PyTorch的物体检测包围框数据增强包

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Harpal Sahota编译:...

2021-06-29 18:00:00 502

转载 DSOD回顾:从头训练深度监督目标检测模型

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Sik-Ho Tsang编译:r...

2021-06-28 10:36:22 480

转载 每天2小时,吃透 985博士总结的这套保姆级TensorFlow + PyTorch笔记(20G高清/PPT/代码)...

作为一名AI工程师,掌握一门深度学习框架是必备的生存技能之一。自 TensorFlow 从 Google 中脱颖而出以来,它在研究和商业领域成为最受欢迎的开源深度学习框架,紧接着 从 Fa...

2021-06-23 10:00:00 192

转载 一个用可视化方法选择最优backbone的小测试

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Ishan Bhatt编译:ro...

2021-06-23 10:00:00 225

转载 全球首个开源图像识别系统上线了!

父老们,乡亲们!当今最热门前沿的技术是什么?没错儿,那必须是人工智能AI!而你随处可见的自动驾驶、刷脸支付、门禁识别、无人零售、还有方便我们疯狂剁手的拍照购物等应用,其中一个关键技术就是图...

2021-06-17 21:17:13 312

转载 每天2小时,吃透 985博士总结的这套保姆级TensorFlow + PyTorch笔记(20G高清/PPT/代码)...

作为一名AI工程师,掌握一门深度学习框架是必备的生存技能之一。自 TensorFlow 从 Google 中脱颖而出以来,它在研究和商业领域成为最受欢迎的开源深度学习框架,紧接着 从 Fa...

2021-06-09 10:16:36 155

转载 各种注意力机制,MLP,Re-Parameter系列的PyTorch实现

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:xmu-xiaoma666编译:...

2021-06-09 10:16:36 2540 1

matlab图像处理工具箱pdf,英文版

matlab的官方文档,英文版pdf,带目录,包括各种常用函数的使用,非常好用,可作为学习教材,也可作为技术手册查询。

2015-01-16

图论算法及其MATLAB实现

图论算法及其MATLAB实现,北京航空航天大学出版社出版,非常清晰版

2015-01-16

freescale,imx6,Vivante.2D.API

freescaler的imx6芯片中GPU2D的api相关文档

2014-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除