- 博客(2965)
- 资源 (77)
- 收藏
- 关注
转载 CVPR 2024 | LiDM:首个可以根据多模态条件生成逼真的激光雷达场景方法,加速107倍...
关注公众号,发现CV技术之美本篇文章分享 CVPR 2024 论文LiDAR Diffusion:Towards Realistic Scene Generation with LiDAR Diffusion Models,利用激光雷达扩散模型生成逼真场景。详细信息如下:论文链接:https://arxiv.org/abs/2404.00815代码链接:https://github.com/han...
2024-04-23 13:46:21 1
转载 项目合作 | 视频监控&球赛预测 APP 开发,
关注公众号,发现CV技术之美52CV 的一位粉丝现在正寻找视频监控项目开发的合作伙伴。项目一:视频分析视频分析软件,主要包括以下功能:绊线检测(越线检测):识别视频中的人或车等物体是否越过了特定的线条或区域。火焰识别:检测视频中的火焰,以防止火灾或其他安全问题。物体移动检测:识别视频中的物体,并跟踪它们的移动。演示示例:line crossing detectionFire detection物体...
2024-04-22 22:39:18 3
转载 解锁 OCR 世界:开源工具包与数据集一网打尽
日常生活中,你是否经常通过微信识图,获取图片中的文字信息?除此之外,还有拍照搜题、拍照翻译、证件信息提取、物流信息识别等等,都归功于 OCR 技术的支持。随着深度学习技术的不断发展,智能 OCR 算法与应用日益丰富,对相关数据的需求也随之增加。本文将介绍几个 OCR 开源工具包和数据集,以帮助开发者们更好地进行文字识别相关的工作。SuryaSurya 是多语言文档 OCR 工具包,可进行准确的文本...
2024-04-19 15:21:38 183
转载 ICPR 2024 | 资源受限下的红外小目标检测挑战赛
关注公众号,发现CV技术之美ICPR 2024是国际模式识别会议,由国际模式识别协会(The International Association for Pattern Recognition, IAPR)主办,ALPCORD NETWORK活动和会议管理公司(ALPCORD NETWORK event &conference management company, ALPCORD NET...
2024-04-18 23:05:12 35
转载 拿什么拯救你——大模型数学能力?XTX Markets:拿一千万美元!
关注公众号,发现CV技术之美分享一个Kaggle新上比赛,组织方下血本的那种!AI 数学奥林匹克奖(AIMO)是一项新的Kaggle系列赛,总奖金高达 1000 万美元,旨在推动AI技术社区一起开发能够像国际数学奥林匹克(IMO)顶尖人才一样表现的 AI 模型!本期竞赛旨在利用人工智能模型解决国家级数学难题,共包括 110 个类似于中级高中数学挑战的问题。这些问题的 Gemma 7B 基准在公共和...
2024-04-16 13:34:58 27
转载 谷歌更新了transformer新架构!
Transformer模型,作为深度学习领域中的一次重大突破,为自然语言处理(NLP)领域的发展注入了新的活力。ChatGPT和Sora这两个应用便是Transformer强大能力的生动体现,它们分别将Transformer应用于对话生成和文本到视频的转换,展现了Transformer的广泛适用性和巨大潜力。我们邀请到英国某名校博士,top一区期刊最佳论文获奖者Henry老师为我们带来——引爆顶会...
2024-04-16 13:34:58 33
转载 PRCV 2024 广域红外小目标检测挑战赛
关注公众号,发现CV技术之美第七届中国模式识别与计算机视觉大会(The 7th Chinese Conference on Pattern Recognition and Computer Vision PRCV 2024)将于2024年10月18日-20日在乌鲁木齐举办。PRCV2024由中国自动化学会(CAA)、中国图象图形学学会(CSIG)、中国人工智能学会(CAAI)和中国计算机学会(CC...
2024-04-15 12:38:40 96
转载 生图超级外挂!贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT4+DALLE3王炸组合
关注公众号,发现CV技术之美更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,香港中文大学终身教授贾佳亚团队提出的这款多模态模型Mini-Gemini堪称绝绝子,相当于开源社区的GPT4+DALLE3的王炸组合!Mini-Gemini还提供了2B小杯到34B的超大杯,最强模型在多个指标上相比Google Gemini Pro甚至GPT-4V都不遑多让。目前,...
2024-04-15 12:38:40 25
转载 CVPR 2024 | 文本或图像提示精准编辑3D场景,美图&信工所&北航&中大联合提出3D编辑方法CustomNeRF...
关注公众号,发现CV技术之美美图影像研究院(MT Lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了3D场景编辑方法——CustomNeRF,同时支持文本描述和参考图像作为3D场景的编辑提示,该研究成果已被CVPR 2024接收。背景自2020年神经辐射场(Neural Radiance Field, NeRF)提出以来,将隐式表达推上了一个新的高度。作为当前最前沿的技术之一...
2024-04-12 19:05:51 25
转载 CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
关注公众号,发现CV技术之美本文转自机器之心。第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分...
2024-04-11 13:30:10 33
转载 小红书社区增长技术团队热招中,5大岗位方向可选!
我们是谁?小红书社区增长技术团队致力于利用科学高效多元的触达手段,帮助更多用户认识小红书、进入小红书,让用户在小红书玩起来、玩得好,探索更大的世界。我们的核心目标是促进DAU(日活跃用户数)的增长,过程中挑战和成就感并存。欢迎有技术和业务追求的人,与我们一起推动业务增长,冲击更高目标!业务场景增长技术团队专注于推动小红书用户规模的高质量增长与体系化成长。团队构建了完整的增长工程链路,结合业内先进的...
2024-04-10 12:15:12 29
转载 8.3K Stars!《多模态大语言模型综述》重大升级
关注公众号,发现CV技术之美去年 6 月底,我们在 arXiv 上发布了业内首篇多模态大语言模型领域的综述《A Survey on Multimodal Large Language Models》,系统性梳理了多模态大语言模型的进展和发展方向,目前论文引用 120+,开源 GitHub 项目获得 8.3K Stars。自论文发布以来,我们收到了很多读者非常宝贵的意见,感谢大家的支持!论文链接:h...
2024-04-10 12:15:12 83
转载 只要捞“偏门”,篇篇都是顶刊!
有些研究生,即使告诉他方法,也发不了顶会顶刊!因为能发顶会或者高区位会议的文章,idea必须有创新性。而一个科研新人几乎不具备独立提炼idea的能力。很多发了十几篇A会的科研大牛都在使用“简化、结合、迁移、解释分析”这4个高效的idea提炼方法。但是科研新人,即使知道了方法,也依旧无法挖掘到好的idea。所以,一个学生要想顺利完成第一篇SCI/CCF或者顶会顶刊,有人手把手带着完整做一遍是最有效的...
2024-04-09 12:33:49 24
转载 超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片
关注公众号,发现CV技术之美本文转自机器之心。北大团队联合兔展发起的 Sora 复现计划,现在有了新成果。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初,北大团...
2024-04-09 12:33:49 19
转载 揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
关注公众号,发现CV技术之美本文转自机器之心。GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。然而,近期很多工作发现 GPT-4V 在很多基本能力上却意外的出现短板。例如,在微软一篇长达 166 页的技术报告《The Dawn of LMMs:Preliminary Explorations w...
2024-04-08 12:20:22 24
转载 2024“智衡屋”AI挑战赛火热进行中!27.5万元奖金等你来拿!
全国人工智能计量技术委员会、中国计量测试学会“智能感知与认知计量专业委员会”、北京航天计量测试技术研究所等权威机构携手举办的2024年度“智衡屋”AI挑战赛火热进行中,总奖金额高达27.5万元!期待勇于挑战、锐意创新的选手前来参与!本次大赛不仅是一场技术的较量,更是一次智慧的碰撞!大赛面向全国范围内的高校学生、科研机构研究人员、企业创新团队等优秀人才,期待各位参赛选手能够在本次比赛中展现出在AI领...
2024-04-08 12:20:22 44
转载 Mamba入局遥感!RS-Mamba:首次使用SSM进行大遥感图像的语义分割与变化检测
关注公众号,发现CV技术之美本文为粉丝投稿。Mamba在大语言模型大放异彩,以其线性复杂度和媲美transformer的表现,被认为是transformer的有力替代。近期工作Vim和VMamba将Mamba引入到视觉图像领域,引爆了视觉领域的众多领域,涌现出大量使用Mamba进行视觉任务的研究。RS-Mamba首次将Mamba引入到遥感进行超高分辨率遥感图像的密集预测任务,利用它的线性复杂度和全...
2024-04-07 14:16:03 97
转载 征稿| CVPR 2024 Workshop | 第一届用于机器人和自动驾驶的虚拟人
关注公众号,发现CV技术之美CVPR 2024 Workshop | 第一届 Virtual Humans for Robotics and Autonomous Driving(用于机器人和自动驾驶的虚拟人)探索虚拟人(数字人)赋能机器人与自动驾驶领域的前沿问题在探讨未来科技与人类社会交互的背景下,智能机器如自动驾驶车辆和机器人的发展至关重要。这些技术在人口密集的环境中的有效运作,不仅要求它们拥...
2024-04-03 12:31:37 47
转载 CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT...
关注公众号,发现CV技术之美本文转自机器之心。目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练一个 243 帧的 VPT 模型通常需要花费好几天的时间,严重拖慢了研究的进度,并成为了该领域亟待解...
2024-04-02 22:40:47 52
转载 Change-Agent:可交互的遥感变化解译智能体
关注公众号,发现CV技术之美本文为粉丝投稿。本文将为大家介绍Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning(遥感变化智能体:从变化检测和变化描述迈向可交互的全面变化解译与分析),数据集和代码即将...
2024-04-01 15:33:12 78
转载 RSMamba:性能SOTA的遥感图像分类Mamba,已开源
关注公众号,发现CV技术之美本文为粉丝投稿。本文将为大家介绍“RSMamba: Remote Sensing Image Classification with State Space Model”(基于状态空间模型的遥感图像分类),性能SOTA,代码已开源。Title:RSMamba: Remote Sensing Image Classification with State Space Mo...
2024-03-31 11:45:32 131
转载 Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
关注公众号,发现CV技术之美本文为粉丝投稿。近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天GitHub即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。目前 Champ 已经开源推理代码与权重,用户可以直接从 Github 上下载使用。官方 Hugging Face 的 Demo 已经...
2024-03-30 11:05:11 35
转载 超多技术岗!小红书2025届实习生招聘等你来战!
关注公众号,发现CV技术之美听劝,明年毕业的小伙伴一定要来小红书实习前端 / 后端 / 客户端 / 算法 / 测试 / 安全 / 运维等超多技术方向岗位等你来!✅转正机会多,提前锁定秋招offer!✅平台前景好,交易和商业化营收持续增长!✅深度参与项目实践,助你快速成长!✅技术大咖多,与优秀的技术团队并肩前行!内推码是:FOQOWMM9ONGX快戳“阅读原文”,投递简历吧!...
2024-03-27 23:51:34 45
转载 可生成两分钟1200帧的长视频:StreamingT2V,代码将开源
关注公众号,发现CV技术之美本文转自机器之心,编辑Panda。广阔的战场,风暴兵在奔跑……prompt:Wide shot of battlefield, stormtroopers running...这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成的痕迹依然浓重,但我们必须承认,其中的人物和场景具有相当不错的一致性。这是如何办到的呢?要...
2024-03-27 23:51:34 79
转载 大模型的门槛,又被打下来了!
随着AI大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有超高年薪,挖掘AI大模型人才!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑程序员核心竞争力(不限年龄!不限岗位!IT人都可学习...
2024-03-26 13:53:10 37
转载 西湖大学&浙江大学提出 Cobra,基于状态空间语言模型扩展的多模态大语言模型,更大规模、更轻量级...
关注公众号,发现CV技术之美本文分享论文Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference,由西湖大学&浙江大学联合提出一种基于状态空间语言模型扩展的多模态大语言模型。作者:赵晗,张敏,赵伟,丁鹏翔,黄思腾,王东林单位:西湖大学、浙江大学原文链接:https://arxiv.o...
2024-03-26 13:53:10 59
转载 神奇!AI扩图&改图还能这么玩?
关注公众号,发现CV技术之美最近,靠着出其不意的扩图效果,“AI扩图”功能凭借搞笑的补全结果频频出圈,火爆全网。网友们踊跃尝试,180度的大反转也让网友们直呼离谱,话题热度高居不。在带来欢笑和热度的背后,也代表人们在时刻关注着AI究竟能不能真正帮助他们解决实际问题,优化使用体验。但可以预见的是,随着AIGC技术的快速发展,正在加速推动AI应用场景落地,我们也将迎来一场全新的生产力变革。近日,美图公...
2024-03-25 18:54:46 35
转载 PSLNet | 西工大&广西师大&港中文联合提出一种基于感知自监督卷积神经网络的噪声图像去水印方法...
关注公众号,发现CV技术之美本文分享论文Perceptive self-supervised learning network for noisy image watermark removal,由西工大&广西师大&港中文联合提出一种基于感知自监督学习网络的噪声图像去水印方法。作者:田春伟,郑梦华,李波,张艳宁,张师超,张大鹏单位:西北工业大学、空天地海一体化大数据应用技术国家工程...
2024-03-23 09:03:40 38
转载 CVPR 2024 | GLEE 华科与字节跳动联手打造全能目标感知基础模型
关注公众号,发现CV技术之美近年来,LLM在文本处理的领先地位和视觉模型如CLIP在多模态任务上优秀的泛化表现,展示了基础模型在推进多模态感知、理解、生成方面的强大潜力。基础模型通过大规模预训练获得了强大泛化性,不断推动着整个领域的进步。我们能否构建一个针对目标感知领域的基础模型,突破训练规模限制,促进所有感知任务呢?在这一命题上,最近的一项研究 GLEE 取得了进展。GLEE是是华中科技大学白翔...
2024-03-21 13:23:38 116
转载 CVPR2024满分论文出炉!这些方向爆火!
计算机视觉(CV)一直是目前深度学习领域最热的研究领域,其是一种交叉学科包括计算机科学,从刚出炉的CVPR2024来看,目标检测、三维重建、自动驾驶、SAM、图像分类等依旧是时下大热门!为了让大家进一步了解CV热门领域,我们联合高校教授、博导、顶会审稿人/workshop、大厂算法研究员,打造了2024CV最新热点系列课程,包含SAM、自动驾驶、三维重建、AIGC等热门方向,更有经典CV论文带读课...
2024-03-21 12:26:15 164
转载 7B 最强多模态文档理解大模型 mPLUG-DocOwl 1.5
关注公众号,发现CV技术之美多模态大模型 Multimodal LLM (MLLM) 相关研究致力于实现通用的图片理解,其中类别多样、文字丰富且排版复杂的文档图片一直是阻碍多模态大模型实现通用的痛点。当前爆火的多模态大模型QwenVL-Max, Gemini, Claude3, GPT4V都具备很强的文档图片理解能力,然而开源模型在这个方向上的进展缓慢,距离这些闭源大模型具有很大差距 (例如Doc...
2024-03-21 12:26:15 148
转载 CVPR 2024 | 百度提出视觉新骨干ViT-CoMer,刷新密集预测任务SOTA
关注公众号,发现CV技术之美本文分享 CVPR 2024 论文ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions,由百度提出视觉新骨干 ViT-CoMer,刷新密集预测任务 SOTA。论文链接:https://arxiv.org/pdf/2403...
2024-03-20 15:15:50 197
转载 征稿 | CVPR 2024 Workshop | 神经渲染智能
关注公众号,发现CV技术之美近年来,神经渲染(NeRF,3DGS)在各个领域显示了显著的成功,包括计算机视觉、计算机图形学和机器人。目前,神经渲染的范围和定义已大幅扩展,不仅仅包括对特定场景进行建模和拟合,同时也包含具有泛化能力的3D重建和生成。因此,来自德国马普所,苏黎世联邦理工,和美国麻省理工学院的学者将在CVPR 2024组织研讨,讨论神经渲染的发展和渲染智能的涌现,包括3D大模型和基础模型...
2024-03-19 13:03:48 31
转载 SWCNN | 西工大&哈工大& 台湾清华大学联合提出一种基于自监督卷积神经网络的图像去水印方法...
关注公众号,发现CV技术之美本文分享论文A self-supervised CNN for image watermark removal,由西工大& 哈工大&台湾清华大学联合提出一种基于自监督卷积神经网络的图像去水印方法。作者:田春伟,郑梦华,焦天才,左旺孟,张艳宁,林嘉文单位:西北工业大学、空天地海一体化大数据应用技术国家工程实验室、哈尔滨工业大学、国立清华大学原文链接:htt...
2024-03-19 13:03:48 41
转载 说到便宜又好用,推荐这个GPU云服务平台
关注公众号,发现CV技术之美“最近我最长一次等机器差不多花了5个小时”。越来越多的深度学习者反馈道。尤其是在某些知名的平台此类现象更加是层出不穷。不难发现AI研发对算力需求明显上升,在当下社会,租用GPU云服务已经成为了在AI研发中降低成本的必然选择。针对平台的选择,我只关注3个问题:1)多样化机型,充足算力支持;2)性价比高,便宜!又好用!才是硬道理;3)快速搭建学习环境,不繁琐,立马用;强...
2024-03-19 13:03:48 28
转载 CVPR 2024 | SVGDreamer: 北航&港大发布全新文本引导的矢量图形可微渲染方法
关注公众号,发现CV技术之美本篇分享 CVPR 2024 论文SVGDreamer: Text Guided SVG Generation with Diffusion Model,由北航&港大发布全新文本引导的矢量图形可微渲染方法,SVGDreamer。0论文地址:https://arxiv.org/abs/2312.16476项目地址:https://ximinng.github.io...
2024-03-18 13:11:55 102
转载 小红书春招开始啦!
最近,美团、字节、小红书等各个大厂都相继启动了春季校园招聘,看了一圈,发现小红书今年春招的技术岗还真不少。技术类1技术类2技术类3建议还没拿offer的和秋招已经拿上offer的同学投投看,毕竟小红书这几年作为互联网企业是真的处在上升期,校招生的待遇也是直冲Top1梯队了。快点击“阅读原文”,去官网投投看吧~...
2024-03-17 16:20:07 32
转载 实习 | 华为诺亚方舟实验室招聘,自动驾驶视觉感知方向
关注公众号,获取更多AI领域发展机会招聘自动驾驶视觉感知算法实习生。关于我们华为诺亚方舟实验室自动驾驶项目属于2012实验室中央研究院,是世界领先的AI实验室。我们以长期的、有影响力的研究为驱动,致力于推动人工智能领域技术的创新和发展,并为华为的产品和服务提供技术支持。团队成员主要由国内外一流高校的业界知名技术专家和资深算法工程师组成,积累了大量的核心技术与经验。我们注重算法研究与业务落地并行,每...
2024-03-16 12:24:29 70
转载 DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
关注公众号,发现CV技术之美本文转自机器之心。近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。DenseSSM 在保持训练并行性和推理效率的同时,通过密集连接实现了性能提升。该方法可广泛应用于各种 SSM 类型,如 Mamba 和 RetNet。随着...
2024-03-16 12:24:29 39
转载 年薪96w!真心建议大家冲一冲新兴领域,工资高前景好
如果问你:2024年,程序员必须掌握哪项技术?AI一定是榜首!从去年起,AI大模型已是程序员的必备工具——编程提效:编写更快,程序更稳定;代码更优:测试数、BUG对应减少;项目爆单:训练模型,接&做项目更快;输入prompt指令和搭建AI大模型开发框架,AI就能迅速批量完成工作,甚至比人工更出色。知名大厂都在布局AI市场,懂AI的程序员年薪甚至翻到80w-...
2024-03-16 12:24:29 20
“中兴捧月”一种电信设备命令报文监视器界面的设计与实现附件(请不要下载)
2010-06-12
“中兴捧月”软件测试自动化附件
2010-06-12
支持基本RichText编辑功能的消息应用程序附件
2010-06-09
数学建模个人经验谈共九个部分
2010-05-19
2010成都信息工程学院研究生数模赛题
2010-05-19
经过裁剪预处理的面部表情识别研究用JAFFE数据库
2010-05-12
人脸表情识别预处理人脸裁剪系统Face Cropping人脸裁切
2010-05-12
人脸识别预处理人脸裁剪系统Face Cropping人脸裁切
2010-05-12
handwriten digit recognition by combined classifiers
2010-09-25
Automatic visual/IR image registration
2010-09-25
Statistical Pattern Recognition:A Review
2010-09-25
流形学习问题manifold study
2010-06-29
贝叶斯决策理论机器学习数据挖掘
2010-06-29
MathematicalProblemsinImageProcessing
2010-06-25
OpenCV1.0安装文件
2010-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人