自动驾驶小学生-CSDN博客

原创几位无人驾驶领域的杰出科学家

本文介绍几位全球杰出的无人驾驶科学家们，大家可以关注他们的主页，及时的了解无人驾驶行业最新动态。（还有很多杰出的科学家，这里不一一列举了，暂时只列举出4位科学家，3位外国科学家+1位中国科学家）目录1.Sebastian Thrun2.Andreas Geiger3.Raquel Urtasun4.Huang Yu1.Sebastian Thrun关于Sebastian Thrun的资料，网上资料比较多，谷歌无人车之父，现在是UDACITY创始人，国内有很多自动驾驶工程师.

2020-06-29 23:55:42 2287

原创常用工具整理：数学，论文，代码等

Mathpix（图转数学公式工具）https://mathpix.com/Python开发常用工具和文档

2020-06-21 23:21:28 820 1

原创 Python开发常用工具库

Pythonhttps://www.python.org/doc/numpyhttps://numpy.org/devdocs/pytorchhttps://pytorch.org/docs/stable/index.htmlscikit-imagehttps://scikit-image.org/docs/stable/picklehttps://docs.p...

2020-04-12 21:40:42 980

原创 BEV目标检测论文串讲：知识蒸馏（CMKD、TiG-BEV、UniDistill、RadarDistill、CRKD）

大家好，今天和大家分享五篇知识蒸馏在BEV目标检测中应用的论文。关于知识蒸馏，大家可以看一下这个视频，对常见的知识蒸馏方法进行了很好的介绍。

2024-03-29 19:53:51 731

原创 Camera & Radar Fusion 论文集（2024-03-29）

1. DetectionCVPR2024 - RadarDistill: Boosting Radar-based Object Detection Performance via Knowledge Distillation from LiDAR Features;Paper;CVPR2024 - RCBEVDet: Radar-camera Fusion in Bird’s Eye View for 3D Object Detection ;Paper;CodeICCV2023 - CRN: C

2024-03-26 19:41:39 224

原创（已开源）详解毫米波雷达与图像融合3D感知多任务模型CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception

本文介绍一篇毫米波雷达与图像融合的3D感知多任务模型CRN，收录于ICCV2023，网上已经有很多对论文第一版的解读，本文解读的是这篇论文的第二版。。

2024-03-03 09:28:39 486

转载面向端到端自动驾驶的稀疏感知通用架构探索

在Sparse4D中，最重要的一个模块是Deformable 4D Aggregation可并行的4D特征聚合模块。这个模块主要负责Instance和时序图像特征之间交互。如图所示，主要包括三个步骤：第一点是4D关键点生成。

2023-11-04 16:39:29 348

转载基于征程5芯片的BEV感知方案与部署实践

随着2021年征程5芯片的发布，我们基于征程5芯片设计了 BEV的感知原型方案，输入的是车载多视角的图像序列或者多模信号，在网络内部进行时空双维度的中融合（middle fusion），使得神经网络能够原生输出鸟瞰视角下的动静态感知、预测结果。下面是一个框架图。绿底部分表示纯视觉的信号处理，输入的是各摄像头的图像，经过第一阶段的模型提取图像特征，通过视角转换做 BEV视角下的多视角空间融合；再对BEV的特征进行时序融合，进而送入第二阶段做BEV上的特征提取；最后，输入到head部分做感知要素的输出。

2023-09-07 21:50:27 1363

原创地平线J5芯片部署参考算法（2024.01.22）

本文主要是记录地平线官方提供的可在J5芯片上的参考算法。

2023-07-27 22:28:50 2178

原创详解KITTI视觉3D检测模型CMKD: Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection

论文收录于。

2023-05-29 21:44:59 1043

转载基于征程5芯片的Transformer量化部署实践与经验

杨志刚首先介绍了Transformer发展趋势及在嵌入式智能芯片上部署的问题，之后重点讲解了以征程5为例的嵌入式智能芯片的算法开发流程，并对以SwinT为例的量化精度提升和部署性能优化做了详细解读，最后分析了如何在征程5上既快又好地部署Transformer模型。3月28日，智东西公开课组织的「自动驾驶新青年讲座」第16讲顺利完结。在这一讲中，地平线工具链核心开发者杨志刚以。本次讲座分为主讲和Q&A两个环节，点击阅读原文可观看完整直播回放。为主题进行了直播讲解。

2023-05-03 15:09:32 1279 1

原创视觉BEV经典算法：LSS详解与代码

本文介绍一篇视觉BEV经典算法：LSS，论文收录于，本文通过显示的进行完成目标语义分割，重点是。

2023-03-06 21:58:43 3982 11

原创详解视觉BEV3D检测模型: Fast-BEV: A Fast and Strong Bird‘s-Eye View Perception Baseline

本文介绍一篇视觉BEV3D检测模型:，论文收录于。目前大多数现有的BEV感知方案要么需要相当多的资源来执行车端推理，要么性能不高。本文提出了一种简单而有效的框架，称为，它能够在车载芯片上执行更快的BEV感知。为了实现这一目标，本文通过试验发现，其中，(1)和(3)使Fast-BEV能够在车载芯片上快速推理和方便部署，(2)，(4)和(5)确保Fast-BEV具有竞争力的性能。这些都使得Fast-BEV成为自动驾驶车载芯片上高性能、快速推理和易于部署的解决方案。

2023-02-05 22:01:02 3203

转载 nullmax纽劢科技:《行泊一体中的感知方案介绍》

如何设计和高效利用 Memory Bank，在工程中是极有挑战的一项工作。

2023-02-04 11:30:39 1428

原创详解多视角3D检测模型 BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection

论文收录于。在这篇文章中，作者提出了一种新的具有的三维物体检测器。本文提出的BEVDepth通过利用来提高图像深度估计的可信度。作者引入了，以增强深度预测能力。此外，针对不精确特征投影带来的副作用，设计了一种新的。此外借助定制的高效体素池化和多帧机制，BEVDepth在nuScenes测试集上实现了60.9%NDS，NDS得分首次达到60%。

2022-12-30 16:24:03 1074 2

原创视觉BEV语义分割模型 Simple-BEV: What Really Matters for Multi-Sensor BEV Perception?

本文介绍一篇简单的BEV语义分割模型，这篇文章出彩的是，分析了哪些因素对BEV语义分割影响比较大，此外还分析了如何更好使用Radar数据提高感知性能。

2022-12-18 18:57:29 1789

原创单目3D物体检测模型（CaDDN）： Categorical Depth Distribution Network for Monocular 3D Object Detection

论文收录于。单目3D物体检测的主要挑战在于，由于缺乏直接的距离测量，因此必须根据物体和场景线索来推断物体深度。过去许多方法试图直接估计深度来辅助3D检测，但由于深度预测不准确，性能都比较有限。本文提出了(CaDDN)，通过预测每个像素的分类深度分布，将丰富的上下文特征信息投影到3D空间中合适的深度区间。然后，本文使用计算效率高的来产生最终的输出检测。本文将CaDDN设计为一种完全可微的端到端方法，用于。

2022-12-18 11:02:26 1029

转载 2022百度ApolloDay技术开放日：文心大模型在自动驾驶感知中的落地应用

2数据处理大模型技术是自动驾驶行业近年的热议趋势，但能否落地应用、能否用好是关键难题。百度自动驾驶依托文心大模型特色优势，率先实现技术应用突破。百度自动驾驶技术专家王井东表示：文心大模型-图文弱监督预训练模型，背靠文心图文大模型数千种物体识别能力，大幅扩充自动驾驶语义识别数据，如：特殊车辆（消防车、救护车）识别、塑料袋等，自动驾驶长尾问题解决效率指数级提升；此外，得益于文心大模型-自动驾驶感知模型10亿以上参数规模，通过大模型训练小模型，自动驾驶感知泛化能力显著增强。百度认为传感器融合是实现L4自动驾驶的必

2022-12-06 22:29:54 616

转载自动驾驶之心：毫米波雷达-视觉融合感知方法（前融合/特征级融合/数据级融合）

4D毫米波雷达的兴起未来会促进相机与毫米波雷达的感知能力。之前在两个不同的4D毫米波雷达数据集上进行测试发现，一个数据集中平均每帧4D毫米波雷达会包含330个3D点，一个数据集中平均每帧会返回2700个3D点，点数远远多于传统的3D毫米波雷达，且同时还提供高度信息，无疑会大幅提高二者融合感知能力。

2022-11-13 21:16:32 3802

原创详解4D毫米波雷达数据集（VOD）Multi-class Road User Detection with 3+1D Radar in the View-of-Delft Dataset

论文收录于。下一代毫米波雷达除了提供和外，还会提供信息。

2022-10-18 21:31:42 5748 16

原创重读经典（CLIP下）：《Learning Transferable Visual Models From Natural Language Supervision》

这里使用OpenAI提供的notebook演示CLIP。安装CLIP导入需要的库，PyTorch['RN50','RN101','RN50x4',''''''{'''.sum([int('''.'''('''.'''))'''for'''in'''.'''()]):,}'''下面是图片预处理，即preprocess然后是文本预处理，得到77个tokens") ''''''{}{[]}{[,]:.2f}下面进行zero-shot分类，这里使用CIFAR100{}

2022-10-04 22:38:45 751

原创重读经典（CLIP上）：《Learning Transferable Visual Models From Natural Language Supervision》

CLIP自从去年2月底提出就立马火爆全场，它的方法出奇的简单、但是效果又出奇的好，很多结果和结论都让人瞠目结舌。比如作者说CLIP的迁移学习能力是非常强的，预训练好的这个模型能够在任意一个视觉分类的数据集上取得不错的效果；而且最重要的是它是zero-shot的，意思就是说它完全没有在这些数据集上去做训练，就能得到这么好的效果。论文里做了非常多的实验，在超过30个数据集上去做了测试，涵盖的面非常广，包括了OCR、视频动作检测、还有坐标定位和许多细分类任务。在所有这些结果之中，其中最炸裂的一条就是在。

2022-09-17 10:15:00 1181

转载地平线：面向规模化量产的智能驾驶系统和软件开发

7月27日，地平线在智东西公开课开设的「地平线自动驾驶技术专场」第3讲顺利完结，地平线智能驾驶应用软件部负责人宋巍围绕》这一主题进行了直播讲解。本次分享主要分为以下4个部分：1、智能驾驶应用软件技术拆解2、软件视角的“软硬结合”与“软硬解耦”3、智能驾驶软件开发平台Horizon TogetherOS Bole™4、智能驾驶应用软件开发趋势展望。...............

2022-08-07 13:21:49 965 1

原创详解自动驾驶仿真数据集 SHIFT：A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation

SHIFT：A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation本文介绍一个新的自动驾驶仿真数据集：，论文收录于 CVPR2022。是所有自动驾驶系统要面临的挑战。然而，现有的图像和视频驾驶数据集。论文作者介绍了一个。在和、、等方面呈现离散和连续的变化。数据集包含综合的传感器套件和多种注释，可以在不断增加的域变化水平上，促进的研究。数据集主页：https://www.vis.xyz/shift/......

2022-07-03 11:36:09 1842 1

转载机器学习编译第2讲：张量程序抽象

02 张量程序抽象【MLC-机器学习编译中文版】课程主页：https://mlc.ai/summer22-zh/在本章中，我们将讨论对单个单元计算步骤的抽象以及在机器学习编译中对这些抽象的可能的变换。在上一章的概述中，我们介绍到机器学习编译的过程可以被看作。一个典型的机器学习模型的执行包含许多步将输入张量之间转化为最终预测的计算步骤，其中的每一步都被称为。在上面这张图中，。特别的是，许多不同的抽象能够表示（和实现）同样的元张量函数（正如下图所示）。我们可以选择调用已经预先编译的框架库（如 torch.a

2022-07-03 10:24:34 705 1

原创重读经典：《The Craft of Research（1）》

跟读者建立联系【研究的艺术·一】这一次李沐博士给大家精读的是一本关于论文写作的书籍。这本书总共包含四个大的章节，本期视频李沐博士介绍的是第一个章节：Research，Researchers，and Readers。视频开头，李沐博士介绍到：在学生年代，我的语文和英语基本上徘徊在及格线的边缘，所以在做论文写作的时候一直是不那么自信的，以至于我花了很多时间去学习怎么样做比较好的写作。但后来我发现两件事情：好的写作能给你带来至少两个好处：好消息是说论文写作其实并不难，至少比做研究本身要容易很多。在这期视频和接下

2022-06-25 21:10:02 2384 2

转载机器学习编译第1讲：机器学习编译概述

MLC-机器学习编译-第一讲-机器学习编译概述课程主页：https://mlc.ai/summer22-zh/机器学习应用程序已经无处不在。我们的智能家居设备由自然语言处理（NLP）和语音识别模型驱动，自动驾驶技术依赖于计算机视觉模型作为支柱，还有推荐系统帮助我们在探索时发现新内容。同样有趣的是AI应用的部署环境是非常丰富的。推荐系统算法通常由大型公司部署在云平台上；当我们谈论自动驾驶时，我们首先想到的是强大的 GPU 或车辆上的专用计算设备；我们使用手机上的智能应用程序来识别花园中的花朵以及如何照料它

2022-06-20 19:58:57 785

原创 Coursera自动驾驶课程第21讲：Dynamic Object Interactions

1. Motion Prediction2. Map-Aware Motion Prediction3. Time to Collision

2022-06-19 18:04:33 700

原创重读经典：《End-to-End Object Detection with Transformers》

DETR 论文精读【论文精读】这一次朱毅博士给大家精读的论文是，是目标检测领域里程碑式的一个工作，文章收录于。是的缩写，使用简化了目标检测流程，不再需要操作，直接将目标预测看作是。这篇论文在2020年5月第一次挂到上的时候，就引起了计算机视觉圈的强烈反响，网上很多人都觉得这篇论文应该是的最佳论文。从20年5月到22年5月两年的时间的引用呢就已经超过了2000，而且它的官方代码呢也有将近 9000个star。如果跟去年大火的相比，的官方代码到现在也只有8000个star，所

2022-06-11 20:40:25 1664

原创 Coursera自动驾驶课程第20讲：Mission Planning in Driving Environments

1. Creating a Road Network Graph2. Dijkstra’s Shortest Path Search3. A-Star Shortest Path Search

2022-06-04 12:12:44 854 4

原创自动驾驶开源软件和算法库

github：https://github.com/carla-simulator/carladoc：https://carla.readthedocs.io/en/latest/website：http://carla.org/2. Kalman-and-Bayesian-Filters-in-Python （卡尔曼和贝叶斯滤波教材）github：https://github.com/rlabbe/Kalman-and-Bayesian-Fil

2022-05-20 10:42:13 2177

原创 Coursera自动驾驶课程第19讲：Mapping for Planning

1. Occupancy Grids2. Populating Occupancy Grids from LIDAR Scan Data (Part 1)3. Populating Occupancy Grids from LIDAR Scan Data (Part 2)4. Occupancy Grid Updates for Self-Driving Cars5. High Definition Road Maps

2022-05-16 20:56:33 869 1

转载地平线：上帝视角与想象力——自动驾驶感知的新范式

导读 3月28日，在「地平线自动驾驶技术专场」上，地平线自动驾驶系统架构师刘景初博士围绕《上帝视角与想象力——自动驾驶感知的新范式》这一主题进行了直播讲解。本次课程主要分为以下4个部分：1、自动驾驶结构演化提出算法新需求2、软件2.0下新的感知范式3、BEV感知的十八般武艺4、端云一体的BEV感知开发视频链接为：https://apposcmf8kb5033.pc.xiaoe-tech.com/detail/l_6239aa1ee4b01a4851e78f86/4?fromH5=true..

2022-05-08 14:20:52 1348

转载地平线：面向规模化量产的自动驾驶感知研发与实践

导读4月27日，地平线智能驾驶感知研发部负责人苏治中就《面向规模化量产的自动驾驶感知研发与实践》这一主题进行了直播讲解。本次课程内容分为4个部分：1、地平线自动驾驶环境感知量产实践2、软硬协同的自动驾驶感知算法设计3、实现规模化量产的“最后一公里”4、感知技术的发展趋势1. 地平线自动驾驶环境感知量产实践首先，为大家简单介绍下自动驾驶分级，上图左边来自于SAE，是大家提到自动驾驶分级时最广泛看到或最广泛引用的权威来源。从定义上来看，L3级以上才算是自动驾驶。L3级自动驾驶功能里，汽..

2022-05-07 23:03:25 1153

原创详解3D物体检测模型：Focal Sparse Convolutional Networks for 3D Object Detection

论文链接为：https://arxiv.org/abs/2204.12463项目链接为：https://github.com/dvlab-research/FocalsConv

2022-04-29 10:32:36 4582 3

原创 Coursera自动驾驶课程第18讲：The Planning Problem

1. Driving Missions, Scenarios, and Behaviour2. Motion Planning Constraints3. Objective Functions for Autonomous Driving4. Hierarchical Motion Planning

2022-04-18 17:33:18 1220

原创详解3D物体检测模型: Voxel Transformer for 3D Object Detection

论文链接为：https://arxiv.org/pdf/2109.02497.pdf项目链接为：https://github.com/PointsCoder/VOTR

2022-04-13 17:22:00 6119 5

原创 Coursera自动驾驶课程第17讲：An Autonomous Vehicle State Estimator

1. State Estimation in Practice2. Multisensor Fusion for State Estimation3. Sensor Calibration - A Necessary Evil4. Loss of One or More Sensors

2022-04-07 11:36:20 1235

原创重读经典（点云深度学习开山之作）：《Deep learning on point clouds for 3D scene understanding》(持续更新中)

本文介绍的是 PointNet 作者的博士论文：3D场景理解中的点云深度学习。从上图可以看到，整个博士论文主要贡献有两块：一是点云深度学习的网络架构（PointNet 和 PointNet++）；二是在3D场景理解中的应用（frustum-pointnets 和 FlowNet3D）。在本文中，将会按照博士论文篇幅顺序对 PointNet 和 PointNet++ 再进行一次解读。关于后面两章其应用感兴趣的朋友可以看论文原文，这里就不在介绍了。Abstract参考文献论文链接：Deep L.

2022-03-13 22:38:01 3229

原创详解协同感知数据集OPV2V: An Open Benchmark Dataset and Fusion Pipeline for Perception with V2V Communication

在《详解自动驾驶仿真框架OpenCDA: An Open Cooperative Driving Automation Framework Integrated with Co-Simulation》一文中介绍了自动驾驶仿真框架 OpenCDA。本文将介绍论文作者另一篇最新工作 OPV2V，论文收录于 ICRA2022。OPV2V 数据主要 feature 有：提出了首个多车协同感知大型数据集，在相同的时间戳下包含着多辆自动驾驶汽车的3D点云与相机RGB图像；囊括了73个不同的场景，6种道路类型.

2022-02-17 20:47:32 5313 9

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

停车位检测数据集PSV。

KITTI数据集可视化源码，对应教程为：https://blog.csdn.net/cg129054036/article/details/119516704

139分钟学会Latex.zip

Coursera无人驾驶课程PPT

《动手学无人驾驶（1）：交通标志识别》训练集和测试集

空空如也