ronghuaiyang-CSDN博客

转载马斯克的大语言模型Grok的发布声明

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：xAI编译：ronghuaiyang导读xAI的测试版大语言模型Grok的发布声明。Grok发布声明Grok是一款模仿《银河系漫游指南》的人工智能，其目的是回答几乎任何问题，甚至是提出应该问什么问题的建议！Grok被设计成以一些幽默感来回答问题，并带有一丝叛逆，所以如果你不喜欢幽默，请不要使用它！Grok的一个独特而基本的优势是，它通...

2023-11-07 09:01:40 327

转载微调TrOCR，训练TrOCR能识别弯曲和模糊文本

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Sovit Rath编译：ronghuaiyang导读本文对TrOCR模型在弯曲和模糊文本数据集上进行了微调，并分析了每一步的代码和训练结果。TrOCR (Transformer based Optical Character Recognition)模型是最好的 OCR 模型之一，在之前的文章中，我们分析了这个模型在单行打印文本和手...

2023-09-17 10:00:04 820

转载 TrOCR：基于Transformer的OCR介绍和使用

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Sovit Rath编译：ronghuaiyang导读本文介绍了TrOCR的结构和使用方法，手把手从每一行代码教起。光学字符识别（OCR）在过去几年中出现了一些创新。它对零售、医疗、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和一些最先进的模型，研究人员仍在不断创新。与深度学习的许多其他领域一样，OCR也看到了transfor...

2023-09-15 08:56:33 2358

转载使用Stable Diffusion图像修复来生成自己的目标检测数据集

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Rédigé par Gabriel Guerin编译：ronghuaiyang导读有些情况下，收集各种场景下的数据很困难，本文给出了一种方法。深度学习模型需要大量的数据才能得到很好的结果，目标检测模型也是一样。要训练一个YOLOv5的模型来自动检测你最喜欢的玩具，你需要拍几千张你的玩具在不同上下文中的照片，对于每张图，你需要标注玩具...

2023-09-05 09:01:00 554

转载 DETR解析第三部分：结构和细节

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Aritra Roy Gosthipaty and Ritwik Raha编译：ronghuaiyang导读本文中，我们会学习DETR的模型结构。。DETR Breakdown Part 3: Architecture and Details在系列1种，我们理解了DETR诞生的原因和方式，关键的特点，以及他和之前的模型的区别。在系列2...

2023-08-16 09:00:59 183

转载 DETR解析第二部分：方法和算法

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Aritra Roy Gosthipaty and Ritwik Raha编译：ronghuaiyang导读在本文中，我们会学习到DETR中应用的方法。这是DETR解析系列的第 2 部分。在之前的文章中，我们了解了哪些因素导致了DETR的诞生，添加了哪些部分，以及到底什么使得DETR 成为当今的超级目标探测器。DETR 的关键组成部分...

2023-08-03 09:00:21 98

转载 DETR解析第一部分：Detection Transformer的介绍

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Aritra Roy Gosthipaty and Ritwik Raha编译：ronghuaiyang导读在本系列中，我们将了解DETR，这是一种使用transformer的端到端可训练的深度学习架构，用于目标检测。DETR的介绍在这篇文章中，我们用 DETR 探索了目标检测的革命（整个架构如下图所示的交互图所示），这是一种采...

2023-07-28 09:01:17 161

转载目标检测的后处理：NMS vs WBF

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Ching (Chingis)编译：ronghuaiyang导读对目标检测后处理中的NMS和WBF的解释和对比。目前，计算机视觉在许多地方都有重要的应用，例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测，它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能，研究人员和从业者开发了各种技术，例如模型集成...

2023-07-26 09:00:37 96

转载扩散模型的基本内容介绍

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：RyanO'Connor编译：ronghuaiyang导读本文从原理讲起，介绍了扩散模型的很多基础内容。扩散模型的迅速崛起是机器学习在过去几年中最大的发展之一。在这篇文章中，你能了解到关于扩散模型的一切。扩散模型是生成模型，在过去的几年里已经获得了显著的普及。仅在21世纪20年代发表的几篇开创性论文就向世界展示了扩散模型的能力，比如...

2023-04-04 09:00:47 3505

转载如何解决“RuntimeError: CUDA Out of memory”问题

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Nitin Kishore编译：ronghuaiyang导读一些可以尝试的解决“RuntimeError: CUDA Out of memory”的方案。当遇到这个问题时，你可以尝试一下这些建议，按代码更改的顺序递增：减少“batch_size”降低精度按照错误说的做清除缓存修改模型/训练在这些选项中，如果你使用的是预训练模型，则最容...

2023-03-22 09:00:47 9187 3

转载 YOLO系列的演进，从v1到v7（三）

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Maxim Ivanov编译：ronghuaiyang导读在本文的前几部分中，我们回顾了 YOLO 家族的前 9 种架构。在最后一篇文章中，我们将介绍目前 3 种最新架构。YOLOR作者Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao (Taiwan).主要论文“You Only Learn...

2023-03-21 09:00:38 384

转载 YOLO系列的演进，从v1到v7（二）

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Maxim Ivanov编译：ronghuaiyang导读在上一部分中，我们研究了最古老的三种架构：YOLO，YOLOv2，YOLOv3。今天，我们将处理接下来的六种结构。YOLOv4, Scaled YOLOv4作者Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark LiaoJose...

2023-03-20 09:00:17 721

转载 YOLO系列的演进，从v1到v7

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Maxim Ivanov编译：ronghuaiyang导读经典再回顾，本文介绍v1到v3。如果你需要速度快的目标检测器，那么 YOLO 系列的神经网络模型实际上是当今的标准。解决检测问题还有很多其他优秀的模型，但我们不会在这篇综述中涉及它们。目前，已经写了相当多的文章来分析 YOLO 各个版本的功能。本文的目的是对整个家族进行比较分析...

2023-03-17 09:00:14 296

转载理解如何处理计算机视觉和深度学习中的图像数据

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Bikram Baruah编译：ronghuaiyang导读包括了适用于传统图像的数据处理和深度学习的数据处理。介绍:在过去几年从事多个计算机视觉和深度学习项目之后，我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时，甚至可能不需要深度学习模型，经过一些处理后一个简单的分类器可...

2023-03-13 09:00:16 350

转载 Debug图像分类模型：为什么模型会在生产环境中失效？

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Emad Ezzeldin编译：ronghuaiyang导读计算机视觉模型在训练、验证和测试集中可以正常工作，但在生产场景中失效。本文讨论模型在生产中失效的一些常见模式。错误模式1：变体分类器(观察到了错误的地方)模型预测了环境等虚假特征，而不...

2023-03-10 09:00:26 91

原创卷积神经网络长尾数据集识别的技巧包

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读对长尾数据集的tricks进行了分析和探索，并结合一种新的数据增强方法和两阶段的训练策略，取得了非常好的效果。Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks摘要：目前，在长尾分布的数据集上，在数据极端不均衡的...

2022-11-17 10:00:57 982

转载纹理分析以及结合深度学习来提升纹理分类效果

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Trapti Kalra编译：ronghuaiyang导读纹理分析的介绍，各种纹理分析方法，并结合深度学习提升纹理分类。人工智能的一个独特应用领域是帮助验证和评估材料和产品的质量。在IBM，我们开发了创新技术，利用本地移动设备，专业的微型传感器...

2022-09-09 08:00:29 1632

原创 Equalized Focal Loss for Dense Long Tailed Object Detection 论文解读

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读对Focal Loss做了改进，使之可以在一阶段物体检测器中适用于长尾分布数据集的场景。效果提升明显。摘要：最近的长尾目标检测的方法，都是用的2阶段的模式。而在实际的工业场景中，一阶段目标检测器是更常用的，应为它更加简单，更容易部署。但是，在长尾分布的场景中，这部分的工作并没有进行很深入的探索。本文，我们研究了是否一阶段的物体检测器也可...

2022-08-30 20:50:38 1381 4

转载计算机视觉传感器&系统

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Mehdi Amine编译：ronghuaiyang导读捕捉和诠释光的旅程。从硬件到实现计算机视觉的系统，本文的概述侧重于广度而非深度。为了平衡这种方法，本文引导读者阅读具有指导性的参考文献，并提供了随时可以运行的源代码。我们从图像形成的机制开...

2022-08-26 19:00:59 538

转载优化PyTorch的速度和内存效率（2022）

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Jack Chih-Hsu Lin编译：ronghuaiyang导读你应该知道的18个PyTorch小技巧。调试深度学习的pipelines就像找到最合适的齿轮组合你为什么要读这篇文章？深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下，每个迭代的速度越快，整个模型的预测性能就越快。我收集了几...

2022-06-21 10:01:00 1241

原创 M-CenterNet：多中心点的CenterNet

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读本文针对小目标检测，在CenterNet上进行了改进，将CenterNet上的一个中心点改成了4个中心点，取得了不错的效果，改...

2022-03-08 10:00:00 1361 3

原创 TTFNet：改进CenterNet，使得训练时间缩短7倍

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读本文是对CenterNet的一种改进，主要是增加了训练时参与回归的样本，提升了收敛速度，加快了训练时间，同时使用了椭圆高斯核来...

2022-03-01 10:00:00 4521

原创《Revisiting the Sibling Head in Object Detector》论文解读，物体检测中的解耦检测头

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读这篇文章提供了一种使用不同proposal来分别做检测和分类的二阶段物体检测方法，相比之前的方法有稳定的performance...

2022-02-18 10:00:00 2705

原创对物体检测中分类和定位的重新思考

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读这篇文章对物体检测器的head进行深入的研究，提出了Double-Head-Ext的方法，效果对比基线模型有明显的提升。论文...

2021-12-31 10:00:00 1537

原创 NAM: Normalization-based Attention Module，一种新的注意力计算方式，无需额外的参数...

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读本文介绍了一种新的计算注意力的方式，相比于之前的注意力机制，无需额外的全连接，卷积等额外的计算和参数，直接使用BN中的缩放因此...

2021-12-20 10:00:00 4363 3

原创【论文解析】TOOD：任务对齐的一阶段物体检测器

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读显式的使用loss来对齐分类和定位任务。TOOD: Task-aligned One-stage Object Detecti...

2021-08-30 10:00:00 1158

原创特征对齐的旋转目标检测：Align Deep Features for Oriented Object Detection

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读对齐后的特征对于旋转目标的学习更有好处。后台发送“s2anet”获取论文和代码链接。1、介绍使用一阶段物体检测器来做旋转物体检...

2021-08-09 18:00:00 2552

转载 Github标星13.6k ！一行代码从PDF提取Excel文件，牛逼炸了！

导读相信大家在工作生活中经常会遇到表格识别的问题，比如导师说，把下面PDF文件里面的表格取出来整理成Excel表。也可能会遇到，公司领导或者客户发来一张截图，需要里面的表格取出来转成Ex...

2021-08-09 18:00:00 613

原创用于小目标检测的一个简单高效的网络

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读以Tiny YOLOV3的速度达到YOLOV3的效果。论文链接：后台发送“小目标检测网络”获取论文链接。1. 介绍本文提出一种...

2021-07-28 10:00:00 795

原创【论文解读】YOLOX: Exceeding YOLO Series in 2021

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读旷视团队对YOLO系列的再一次超越。论文链接：后台发送“yolox”获取论文链接。1. YOLOX1.1 YOLOX-Dark...

2021-07-27 09:59:23 578

原创【论文解读】基于CNN的使用面向目标的浅层特征和极小anchor的红外弱小目标检测算法...

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读对于检测小目标有一定的借鉴意义。论文下载：后台回复“红外小目标检测”获取论文下载链接。1. 介绍红外小目标检测的几个困难点：1...

2021-07-26 10:00:00 3168

原创 Dynamic Head: 物体检测器Head的统一注意力框架

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”导读来自微软，在一个框架中集成了尺度注意力，空间注意力和通道注意力。公众号后台回复“d-head”，获取文章链接。摘要：这篇文章...

2021-07-13 10:00:00 721 2

转载图像识别算法超低代码开发方案

三次登陆Github Daily全球趋势榜，2.1k 星标，图像分类、目标检测、语义分割、实例分割等视觉任务全覆盖，更重要的是简单！简单！简单！不需要数学基础，不需要是编程大牛，只要下载就...

2021-06-29 18:00:00 472

转载 BBAug: 一个用于PyTorch的物体检测包围框数据增强包

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Harpal Sahota编译：...

2021-06-29 18:00:00 502

转载 DSOD回顾：从头训练深度监督目标检测模型

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Sik-Ho Tsang编译：r...

2021-06-28 10:36:22 480

转载每天2小时，吃透 985博士总结的这套保姆级TensorFlow + PyTorch笔记（20G高清/PPT/代码)...

作为一名AI工程师，掌握一门深度学习框架是必备的生存技能之一。自 TensorFlow 从 Google 中脱颖而出以来，它在研究和商业领域成为最受欢迎的开源深度学习框架，紧接着从 Fa...

2021-06-23 10:00:00 192

转载一个用可视化方法选择最优backbone的小测试

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：Ishan Bhatt编译：ro...

2021-06-23 10:00:00 225

转载全球首个开源图像识别系统上线了！

父老们，乡亲们！当今最热门前沿的技术是什么？没错儿，那必须是人工智能AI！而你随处可见的自动驾驶、刷脸支付、门禁识别、无人零售、还有方便我们疯狂剁手的拍照购物等应用，其中一个关键技术就是图...

2021-06-17 21:17:13 312

转载每天2小时，吃透 985博士总结的这套保姆级TensorFlow + PyTorch笔记（20G高清/PPT/代码)...

作为一名AI工程师，掌握一门深度学习框架是必备的生存技能之一。自 TensorFlow 从 Google 中脱颖而出以来，它在研究和商业领域成为最受欢迎的开源深度学习框架，紧接着从 Fa...

2021-06-09 10:16:36 155

转载各种注意力机制，MLP，Re-Parameter系列的PyTorch实现

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”因公众号更改了推送规则，记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者：xmu-xiaoma666编译：...

2021-06-09 10:16:36 2540 1

matlab图像处理工具箱pdf，英文版

图论算法及其MATLAB实现

freescale，imx6，Vivante.2D.API

空空如也