- 博客(136)
- 资源 (10)
- 收藏
- 关注
原创 MWSIS: Multimodal Weakly Supervised Instance Segmentation with 2D Box Annotations for Autonomous
1.现状目前还没有仅使用2D框,同时对2D、3D进行实例分割2.提出提出多模态弱监督实例分割MWSIS:结合用于2D和3D模态的各种细颗粒度标签校正模块新的多模态交叉监督方式3.具体贡献2D伪标签生成分支 IPG:利用自监督校正的预测生成伪标签3D伪标签生成分支:SPG通过结合点云的空间先验信息生成伪标签为了进一步细化生成的伪标签,PVC模型利用历史预测进行校正Ring Segment-based Label Correction(RSC)模块,利用点云的深度先验信息来细化预测。
2023-12-17 03:48:00 899
原创 [Paking Slot系列]Vision-based parking-slot A benchmark and a learning-based approach( IEEE TIP2018)
提出DeepPS公开了数据集ps2.0
2022-03-31 14:40:13 3918 2
原创 [目标检测系列]ATSS: Bridging the Gap Between Anchor-based and Anchor-free Detection via ATSS(CVPR2020)
文章主要是在寻找造成 anchor-based 和 anchor-free 之间性能差异的主要因素,并指出该因素为正负样本的定义。假如采用相同的定义,那么回归方法对最后的结果产生的影响是较小的。
2022-03-29 20:48:18 3471
原创 [ZSS系列]Prototypical Matching and Open Set Rejection for Zero-Shot Semantic Segmentation(ICCV 2021)
提出了零镜头语义分割,其目的不仅是识别训练中包含的已知类,还包括从未见过的新类。
2022-03-29 02:04:39 4086
原创 SOLOv2训练自己数据集(实例分割,停车位/牛分割)
1. 环境搭建 2. 修改配置文件下载权重 3. 修改配置文件 4. 自定义数据集转COCO格式5. 实验结果
2022-03-20 01:46:36 9259 36
原创 PifPaf: Composite Fields for Human Pose Estimation
发表于arxiv, 一个bottom-up的方法, 用来预测单张图片中多个人体的关节点位置, 已开源
2022-03-05 02:11:00 3480
原创 mmsegmentation训练自定义数据集(语义分割,Upernet,Swin-T)
mmsegmentation训练自定义数据集(语义分割,Upernet,Swin-T)1. 论文复现1.1. 原文结果1.2. 复现结果1.3. Test阶段速度:2. Mmsegmentation Trick2.1. Pipeline(加载数据、数据增强)2.2. 损失函数选择2.3. 学习率策略2.4. 其他trick3. 训练FRFL相机数据集3.1. 修改配置文件:3.2. 实验参数修改3.3. 消融实验3.3.1 参数作用3.3.2. 消融实验3.3.3. 实验精度3.4.分割效果(白色或紫色为
2022-03-04 16:11:31 7781 32
原创 MMSegmentation 训练测试全流程
MMSegmentation 训练测试全流程1.按照执行顺序的流程梳理Level 0: 运行 Shell 命令:Level 1: 在 tools/train.py 内:Level 2: 转进到 mmseg.apis 模块的 train_segmentor 函数内:Level 3: 转进到 mmcv/runner/iter_based_runner.py 内的 IterBasedRunner 类的 run 函数内部:Level 4: 转进到 IterBasedRunner 类的 train 函数内部Level
2022-02-17 12:00:35 5581 1
原创 CVPR2021 | 2D目标检测论文解读
CVPR2021 | 2D目标检测论文解读1. UP-DETR:——《UP-DETR: Unsupervised Pre-training for Object Detection with Transformers(Oral)》2. OWOD——《Towards Open World Object Detection(Oral)》3. YOLOF——《You Only Look One-level Feature》4. DeFCN——《End-to-End Object Detection with Fu
2021-08-22 02:03:45 2695 1
原创 Oriented R-CNN:面向旋转目标检测的 R-CNN(ICCV2021)
本文提出一种通用的两阶段旋转目标检测器,具有良好的准确性和效率,表现SOTA!性能优于Mask OBB、SCRDet等网络,代码现已开源!作者单位:西北工业大学
2021-08-14 01:59:53 7511
原创 盘点CVPR2021中5篇数据扩增论文
数据扩增一直是竞赛中非常重要的一环,在CVPR 2021论文中有不少的数据扩增方法,本文将对其中通用的论文进行介绍。
2021-08-10 01:37:36 2857 2
原创 IDM:用于域自适应行人Re-ID的中间域模块(ICCV2021)
即插即用!本文提出一种用于无监督域自适应行人Re-ID的中间域模块:IDM,表现SOTA!性能优于SpCL、GLT和UNRN等网络,代码刚刚开源!作者单位:北京大学, SUTD, 旷视, 新加坡国立大学, 鹏城实验室
2021-08-07 19:48:42 2044 1
原创 如何在数学建模比赛中稳拿奖——个人100%获奖经验分享
1. 和谁组队:2. 负责算法的赛前准备:3. 负责数据分析的赛前准备:4. 负责论文的赛前准备:1. 评委的评分方式2.优秀论文特点:
2020-11-09 15:08:31 112946 59
原创 2020研究生数学建模E题--AlexNet深度网络解法(大雾能见度估计与预测)(含代码)
3.1 数据预处理3.2 AlexNet深度网络(1)AlexNet结构图:(2)AlexNet结构细分图:(4)各层的作用(5)Python+Tensorflow程序实现AlexNet网络(6)AlexNet网络解题(MATLAB)3.3 运行结果4.1 使用Relu作为激活函数4.2 局部相应归一化(Local corresponding normalization)4.3 Dropout4.4 层叠池化
2020-10-24 00:35:27 8409 14
原创 Detection of ADHD based on Eye Movements during Natural Viewing论文代码复现
https://github.com/aeye-lab/ecml-ADHD
2024-03-31 19:35:36 304
原创 成功解决RuntimeError: Input type (torch.cuda.HalfTensor) and weight type (torch.cuda.FloatTensor) should
x = self.reduce_conv(x)
2024-03-25 11:33:36 691
原创 MIM4D: Masked Modeling with Multi-View Video for Autonomous Driving Representation Learning
MIM4D,一种新的基于双掩码图像建模(MIM)的预训练范式
2024-03-16 19:29:26 799
原创 成功解决RuntimeError: OpenSSL 3.0‘s legacy provider failed to load
OpenSSL 3.0's legacy provider failed to load
2024-03-15 16:26:30 673
原创 Learning Unsupervised World Models For Autonomous Driving Via Discrete Diffusion
通过Diffusion学习自动驾驶中的无监督世界模型
2024-03-03 19:31:58 868
原创 DALL·E 3:Improving Image Generation with Better Captions
DALL·E 3 是一个由OpenAI开发的新一代图像生成模型,与文本描述之间建立关联。这个模型巧妙结合ChatGPT的能力,具有降低提示词门槛、更强的语义理解和更高的绘画技巧等特性,能够以惊人的准确度呈现复杂的图像和创意表达
2024-02-26 19:22:07 453
原创 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection
半监督3D检测文章,微伪标签生成策略
2024-02-23 15:33:21 431
原创 DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models
清华&理想 | DRIVEVLM:自动驾驶和大型视觉语言模型的融合最新SOTA!
2024-02-23 15:25:04 1424
原创 ViT-WSS3D:A Simple Vision Transformer for Weakly Semi-supervised 3D Object Detection
基于点注释的弱半监督3D物体检测(华科&百度)
2024-02-21 23:22:49 971
原创 Mix-Teaching:A Simple,Unified and Effective Semi-Supervised Learning Framework for Monocular 3D Obj
第一个用于单目3D目标检测的统一半监督学习框架!
2024-02-21 21:01:26 891
原创 Fisheye Camera and Ultrasonic Sensor Fusion For Near-Field Obstacle Perception in Bird’s-Eye-View
第一个端到端鱼眼相机和超声波多模态融合模型
2024-02-18 07:18:52 895
原创 OpenAI全新发布文生视频模型:Sora!
利用对视频和图像潜在代码的时空Patches进行操作的Transformer架构,最大的模型Sora能够生成一分钟的高保真视频
2024-02-18 03:35:29 2400
原创 LMDrive: Closed-Loop End-to-End Driving with Large Language Models
第一个利用LLM实现闭环端到端自动驾驶的工作
2024-02-16 05:36:39 1015
原创 Editable Scene Simulation for Autonomous Driving via Collaborative LLM-Agents
ChatSim:首个通过大语言模型实现可编辑逼真3D驾驶场景的仿真
2024-02-15 02:15:45 954
原创 [深度估计]RIDERS: Radar-Infrared Depth Estimation for Robust Sensing
融合毫米波雷达和单目红外热成像相机实现鲁棒的度量深度估计,应对恶劣的天气, 包括雾霾、灰尘、雨雪和黑暗
2024-02-14 22:16:20 999
原创 2024美赛数学建模C题思路&源码——网球选手的动量
这题挺有意思,没具体看比赛情况,打过比赛的人应该都知道险胜局(第二局、第五局逆转局)最影响心态的,导致第3、5局输了模型结果证明这样的现象,会更可靠。
2024-02-01 22:35:22 4187 1
2020研究生数学建模——大雾能见度估计与预测(E题)AlexNet深度网络解法MATLAB代码
2020-10-29
2020研究生数学建模——大雾能见度估计与预测(E题)第二题机场视频截图分类文件
2020-10-29
2020华为杯研究生数学建模比赛赛题
2020-10-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人