- 博客(2943)
- 资源 (78)
- 收藏
- 关注
转载 超多技术岗!小红书2025届实习生招聘等你来战!
关注公众号,发现CV技术之美听劝,明年毕业的小伙伴一定要来小红书实习前端 / 后端 / 客户端 / 算法 / 测试 / 安全 / 运维等超多技术方向岗位等你来!✅转正机会多,提前锁定秋招offer!✅平台前景好,交易和商业化营收持续增长!✅深度参与项目实践,助你快速成长!✅技术大咖多,与优秀的技术团队并肩前行!内推码是:FOQOWMM9ONGX快戳“阅读原文”,投递简历吧!...
2024-03-27 23:51:34 4
转载 可生成两分钟1200帧的长视频:StreamingT2V,代码将开源
关注公众号,发现CV技术之美本文转自机器之心,编辑Panda。广阔的战场,风暴兵在奔跑……prompt:Wide shot of battlefield, stormtroopers running...这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成的痕迹依然浓重,但我们必须承认,其中的人物和场景具有相当不错的一致性。这是如何办到的呢?要...
2024-03-27 23:51:34 5
转载 大模型的门槛,又被打下来了!
随着AI大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有超高年薪,挖掘AI大模型人才!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑程序员核心竞争力(不限年龄!不限岗位!IT人都可学习...
2024-03-26 13:53:10 7
转载 西湖大学&浙江大学提出 Cobra,基于状态空间语言模型扩展的多模态大语言模型,更大规模、更轻量级...
关注公众号,发现CV技术之美本文分享论文Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference,由西湖大学&浙江大学联合提出一种基于状态空间语言模型扩展的多模态大语言模型。作者:赵晗,张敏,赵伟,丁鹏翔,黄思腾,王东林单位:西湖大学、浙江大学原文链接:https://arxiv.o...
2024-03-26 13:53:10 6
转载 神奇!AI扩图&改图还能这么玩?
关注公众号,发现CV技术之美最近,靠着出其不意的扩图效果,“AI扩图”功能凭借搞笑的补全结果频频出圈,火爆全网。网友们踊跃尝试,180度的大反转也让网友们直呼离谱,话题热度高居不。在带来欢笑和热度的背后,也代表人们在时刻关注着AI究竟能不能真正帮助他们解决实际问题,优化使用体验。但可以预见的是,随着AIGC技术的快速发展,正在加速推动AI应用场景落地,我们也将迎来一场全新的生产力变革。近日,美图公...
2024-03-25 18:54:46 6
转载 PSLNet | 西工大&广西师大&港中文联合提出一种基于感知自监督卷积神经网络的噪声图像去水印方法...
关注公众号,发现CV技术之美本文分享论文Perceptive self-supervised learning network for noisy image watermark removal,由西工大&广西师大&港中文联合提出一种基于感知自监督学习网络的噪声图像去水印方法。作者:田春伟,郑梦华,李波,张艳宁,张师超,张大鹏单位:西北工业大学、空天地海一体化大数据应用技术国家工程...
2024-03-23 09:03:40 10
转载 CVPR 2024 | GLEE 华科与字节跳动联手打造全能目标感知基础模型
关注公众号,发现CV技术之美近年来,LLM在文本处理的领先地位和视觉模型如CLIP在多模态任务上优秀的泛化表现,展示了基础模型在推进多模态感知、理解、生成方面的强大潜力。基础模型通过大规模预训练获得了强大泛化性,不断推动着整个领域的进步。我们能否构建一个针对目标感知领域的基础模型,突破训练规模限制,促进所有感知任务呢?在这一命题上,最近的一项研究 GLEE 取得了进展。GLEE是是华中科技大学白翔...
2024-03-21 13:23:38 48
转载 CVPR2024满分论文出炉!这些方向爆火!
计算机视觉(CV)一直是目前深度学习领域最热的研究领域,其是一种交叉学科包括计算机科学,从刚出炉的CVPR2024来看,目标检测、三维重建、自动驾驶、SAM、图像分类等依旧是时下大热门!为了让大家进一步了解CV热门领域,我们联合高校教授、博导、顶会审稿人/workshop、大厂算法研究员,打造了2024CV最新热点系列课程,包含SAM、自动驾驶、三维重建、AIGC等热门方向,更有经典CV论文带读课...
2024-03-21 12:26:15 75
转载 7B 最强多模态文档理解大模型 mPLUG-DocOwl 1.5
关注公众号,发现CV技术之美多模态大模型 Multimodal LLM (MLLM) 相关研究致力于实现通用的图片理解,其中类别多样、文字丰富且排版复杂的文档图片一直是阻碍多模态大模型实现通用的痛点。当前爆火的多模态大模型QwenVL-Max, Gemini, Claude3, GPT4V都具备很强的文档图片理解能力,然而开源模型在这个方向上的进展缓慢,距离这些闭源大模型具有很大差距 (例如Doc...
2024-03-21 12:26:15 27
转载 CVPR 2024 | 百度提出视觉新骨干ViT-CoMer,刷新密集预测任务SOTA
关注公众号,发现CV技术之美本文分享 CVPR 2024 论文ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions,由百度提出视觉新骨干 ViT-CoMer,刷新密集预测任务 SOTA。论文链接:https://arxiv.org/pdf/2403...
2024-03-20 15:15:50 76
转载 征稿 | CVPR 2024 Workshop | 神经渲染智能
关注公众号,发现CV技术之美近年来,神经渲染(NeRF,3DGS)在各个领域显示了显著的成功,包括计算机视觉、计算机图形学和机器人。目前,神经渲染的范围和定义已大幅扩展,不仅仅包括对特定场景进行建模和拟合,同时也包含具有泛化能力的3D重建和生成。因此,来自德国马普所,苏黎世联邦理工,和美国麻省理工学院的学者将在CVPR 2024组织研讨,讨论神经渲染的发展和渲染智能的涌现,包括3D大模型和基础模型...
2024-03-19 13:03:48 9
转载 SWCNN | 西工大&哈工大& 台湾清华大学联合提出一种基于自监督卷积神经网络的图像去水印方法...
关注公众号,发现CV技术之美本文分享论文A self-supervised CNN for image watermark removal,由西工大& 哈工大&台湾清华大学联合提出一种基于自监督卷积神经网络的图像去水印方法。作者:田春伟,郑梦华,焦天才,左旺孟,张艳宁,林嘉文单位:西北工业大学、空天地海一体化大数据应用技术国家工程实验室、哈尔滨工业大学、国立清华大学原文链接:htt...
2024-03-19 13:03:48 19
转载 说到便宜又好用,推荐这个GPU云服务平台
关注公众号,发现CV技术之美“最近我最长一次等机器差不多花了5个小时”。越来越多的深度学习者反馈道。尤其是在某些知名的平台此类现象更加是层出不穷。不难发现AI研发对算力需求明显上升,在当下社会,租用GPU云服务已经成为了在AI研发中降低成本的必然选择。针对平台的选择,我只关注3个问题:1)多样化机型,充足算力支持;2)性价比高,便宜!又好用!才是硬道理;3)快速搭建学习环境,不繁琐,立马用;强...
2024-03-19 13:03:48 8
转载 CVPR 2024 | SVGDreamer: 北航&港大发布全新文本引导的矢量图形可微渲染方法
关注公众号,发现CV技术之美本篇分享 CVPR 2024 论文SVGDreamer: Text Guided SVG Generation with Diffusion Model,由北航&港大发布全新文本引导的矢量图形可微渲染方法,SVGDreamer。0论文地址:https://arxiv.org/abs/2312.16476项目地址:https://ximinng.github.io...
2024-03-18 13:11:55 62
转载 小红书春招开始啦!
最近,美团、字节、小红书等各个大厂都相继启动了春季校园招聘,看了一圈,发现小红书今年春招的技术岗还真不少。技术类1技术类2技术类3建议还没拿offer的和秋招已经拿上offer的同学投投看,毕竟小红书这几年作为互联网企业是真的处在上升期,校招生的待遇也是直冲Top1梯队了。快点击“阅读原文”,去官网投投看吧~...
2024-03-17 16:20:07 20
转载 实习 | 华为诺亚方舟实验室招聘,自动驾驶视觉感知方向
关注公众号,获取更多AI领域发展机会招聘自动驾驶视觉感知算法实习生。关于我们华为诺亚方舟实验室自动驾驶项目属于2012实验室中央研究院,是世界领先的AI实验室。我们以长期的、有影响力的研究为驱动,致力于推动人工智能领域技术的创新和发展,并为华为的产品和服务提供技术支持。团队成员主要由国内外一流高校的业界知名技术专家和资深算法工程师组成,积累了大量的核心技术与经验。我们注重算法研究与业务落地并行,每...
2024-03-16 12:24:29 33
转载 DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
关注公众号,发现CV技术之美本文转自机器之心。近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。DenseSSM 在保持训练并行性和推理效率的同时,通过密集连接实现了性能提升。该方法可广泛应用于各种 SSM 类型,如 Mamba 和 RetNet。随着...
2024-03-16 12:24:29 25
转载 年薪96w!真心建议大家冲一冲新兴领域,工资高前景好
如果问你:2024年,程序员必须掌握哪项技术?AI一定是榜首!从去年起,AI大模型已是程序员的必备工具——编程提效:编写更快,程序更稳定;代码更优:测试数、BUG对应减少;项目爆单:训练模型,接&做项目更快;输入prompt指令和搭建AI大模型开发框架,AI就能迅速批量完成工作,甚至比人工更出色。知名大厂都在布局AI市场,懂AI的程序员年薪甚至翻到80w-...
2024-03-16 12:24:29 12
转载 CVPR 2024 | 提升生成式零样本学习能力,视觉增强动态语义原型方法
关注公众号,发现CV技术之美本文转自机器之心。虽然我从来没见过你,但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。为了达到这个目的,在传统的图像识别任务中,人们在带有不同类别标签的大量图像样本上训练算法模型,让模型获得对这些图像的识别能力。而在零样本学习(ZSL)任务中,人们希望模型能够举一反三,识别在训练阶段没有见过图像样本的类别。生成式零样本学习(GZSL)是实现...
2024-03-15 23:52:03 21
转载 玩不到 Sora,先提前了解一下文生视频的提示词?
关注公众号,发现CV技术之美在数字媒体和⼈⼯智能技术飞速发展的今天,视频内容的创作和表达⽅式正经历着翻天覆地的变化。Sora的出现不仅代表了⽂本到视频转换技术的重⼤进步,更开启了视频创作的全新时代。想象⼀下,只需通过简单的⽂字描述,就能⽣成⽣动、⾼质量的视频,这将为故事讲述、沉浸式体验和内容创作带来⾰命性的变⾰。然⽽,这项激动⼈⼼的技术发展背后,有⼀个关键要素不容忽视——那就是“提⽰词”。提⽰词...
2024-03-12 13:44:18 18
转载 基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了
关注公众号,发现CV技术之美本文转载自机器之心。这个模型和 Sora 一样采用了 DiT 框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。于是关键的问题来了:我们能以怎样的方式将这些新元素高效地整...
2024-03-10 23:54:35 24
转载 终于被CCF A类会议AAAI录用了!
当代科研人现状:导师放养,但要求的工作量却一样不少,开始害怕写不完影响自己毕业;比放养更离谱的是导师课题乱指导、数据不把关、实验做不出来不让改条件...同组卷生卷死,而自己想发高质量的sci论文,却苦于没有idea,不知从何下笔...尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量和质量无疑是最好的背书。手握一篇甚至多篇高质量的论文,就是学术成果最好...
2024-03-07 13:45:14 40
转载 算力加速人脸识别技术发展:一文了解人脸识别开源库和数据集
人脸识别在我们的生活中随处可见,例如在大楼门禁系统中,它取代了传统的门禁卡或密码,提高了进出的便捷性和安全性。在商场安保方面,人脸识别被广泛应用于监控系统,有助于识别和跟踪潜在的犯罪嫌疑人或失踪人员,提升了安全防范的能力。另外,手机解锁也是人脸识别技术的重要应用之一,它为用户提供了一种快捷、便利的身份验证方式,替代了传统的密码或指纹识别。人脸识别技术涉及大规模图像和视频数据的处理和分析,为了确保准...
2024-03-07 13:45:14 116
转载 不容错过的 CVPR 2024 论文,研究方向一网打尽,代码链接一键获取!
关注公众号,发现CV技术之美CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉领域的顶级会议之一,每年吸引着全球学者的瞩目。为了帮助研究者更好地追踪这一顶会的论文动态,52CV特别推出了 CVPR 论文分类汇总项目。CVPR 2024 项目已更新:https://github.com/52CV/CVPR-2024-Pa...
2024-03-06 23:27:04 514
转载 CVPR Workshop PBDL2024 | 第四届基于物理的视觉与深度学习国际研讨会招募开始啦
关注公众号,发现CV技术之美Call for Challenge: Low-Light Enhancement and Detection ChallengeFollowing the success of previous workshops, we propose the 4rd workshop using the same title and topics with CVPR2024, 1...
2024-03-06 23:27:04 37
转载 不止有SORA!一文带你了解 AI 视频生成技术的探索与趋势
随着科技的不断进步,生活中所见的一切已经不再局限于现实。在这个数字化时代,无论是图片、视频,还是其他形式的媒体内容,都有可能是通过 AI 算法生成的。精彩的场景、动人的情节,甚至栩栩如生的角色,都可能是由 AI 算法创造出来的。当你观看一段视频时,你是否曾思考过这个问题:这是一个真实的视频,还是由 AI 算法生成的呢?前几天 Sora 横空出世震撼全场,今天 Stable Diffusion 3 ...
2024-03-05 13:44:27 29
转载 CVPR2024满分论文出炉!分割万物再次火爆AI界
去年4月,Meta公布了一款名为SAM(Segment Anything Model)的技术,这是一个用于图像分割的AI大模型,会对图像进行观察、感知、思考、逻辑推理、得出结果,且操作极其简单。我们邀请到台湾交通大学博士,多篇顶会一作作者Shawn老师为我们带来——“分割万物”的超强SAM模型,详解SAM模型的过去和未来的优化改进方向!扫码免费参与课程赠导师推荐50+最新SAM论文&ppt...
2024-03-05 13:44:27 310
转载 2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
关注公众号,发现CV技术之美丰色 发自 凹非寺量子位 | 公众号 QbitAI只需2张图片,无需测量任何额外数据——当当,一个完整的3D小熊就有了:这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。有网友实测,拍两张照片,真的就重建出了他家的厨房,整个过程耗时不到2秒钟!(除了3D图,深度图、置信度图和点云图它都能一并给出)惊得这位朋友直呼:大伙先忘掉sora吧,...
2024-03-04 23:56:38 21
转载 CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法...
关注公众号,发现CV技术之美本文转自机器之心。单目动态场景(Monocular Dynamic Scene)是指使用单眼摄像头观察并分析的动态环境,其中场景中的物体可以自由移动。单目动态场景重建对于理解环境中的动态变化、预测物体运动轨迹以及动态数字资产生成等任务至关重要。随着以神经辐射场(Neural Radiance Field, NeRF)为代表的神经渲染的兴起,越来越多的工作开始使用隐式表征...
2024-03-04 23:56:38 44
转载 基于扩散模型的图像编辑:首篇综述
关注公众号,发现CV技术之美AIGC 大模型最火热的任务之一——基于 Diffusion Model 的图像编辑(editing)领域的首篇综述。长达 26 页,涵盖 297 篇文献!本文全面研究图像编辑前沿方法,并根据技术路线精炼地划分为 3 个大类、14 个子类,通过表格列明每个方法的类型、条件、可执行任务等信息。此外,本文提出了一个全新 benchmark 以及 LMM Score 指标来对...
2024-02-29 12:53:09 31
转载 Sora模型问世!惊艳全球AI界!
继推出ChatGPT后,就在前几天,OpenAI公司又推出了最新的逆天人工智能(AI)模型——Sora。目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。我们邀请到美国Top10 CS博士,40余篇论文一作作者Paul老师带来——惊艳的文本生成视频模型Sora,带我们深入了解Sora背后所用到的创新及突破...
2024-02-28 12:55:57 51
转载 NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞
关注公众号,发现CV技术之美克雷西 发自 凹非寺量子位 | 公众号 QbitAI扩散模型,迎来了一项重大新应用——像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层!这就是新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构最新开源的研究成果。具体来说,研究团队提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。用它来生成网络参数,速度比直接训练最多...
2024-02-28 12:55:57 27
转载 CVPR 2024 Workshop | 首届短视频质量评价学术竞赛已启动+大型数据集KVQ
关注公众号,发现CV技术之美CVPR NTIRE Workshop是计算机视觉领域极具影响力的国际学术研讨会之一,通常涵盖增强、修复、质量评价等底层视觉比赛内容,对于视觉信号处理领域的发展发挥着重要的作用。为推动短视频领域的发展,建立短视频的质量评价标杆,智能媒体计算实验室(中国科学技术大学)联合快手音视频技术部(快手科技有限公司)在第九届NTIRE研讨会 (即CVPR NTIRE 2024)上举...
2024-02-21 15:00:24 272
转载 NTIRE 2024双目/光场图像超分辨率挑战赛正式开赛 | 验证平台已上线!
关注公众号,发现CV技术之美双目图像超分辨率挑战赛(Stereo Image Super-Resolution Challenge)和光场图像超分辨率挑战赛 (Light Field Image Super-Resolution Challenge)将分别作为 NTIRE 研讨会的一部分与CVPR 2023一起举办。NTIRE 全称 New Trends in Image Restoration ...
2024-02-20 13:23:03 236
转载 CVPR 2024 Workshop | AIGC质量评价挑战赛启动!
关注公众号,发现CV技术之美NTIRE (New Trends in Image Restoration and Enhancement) 是近年来计算机视觉领域中具有广泛影响力的全球性研讨会之一,其涵盖了绝大部分底层视觉任务并提供了相应挑战赛。其中,NTIRE 2024 AIGC质量评价挑战赛由上海交通大学刘笑宏、闵雄阔、翟广涛教授团队与华为技术有限公司共同主办。第九届NTIRE研讨会将于202...
2024-02-19 15:45:35 976
转载 Bunny-3B: 多模态小模型新 SOTA,性能媲美 LLaVA-13B
关注公众号,发现CV技术之美近期,Microsoft、Google、StabilityAI 等机构发布了多款小语言模型,并由此衍生出了一系列多模态小模型,揭开了多模态小模型全面竞赛的序幕。在此背景下,BAAI 发布了新一代多模态小模型 Bunny 系列。特别是对高质量数据的探索,有效地挖掘了小模型的潜能,进而促进 Bunny-3B 取得全新 SOTA,在多个基准上媲美流行的 LLaVA-v1.5-...
2024-02-08 23:35:07 82
转载 医疗版SAM开源!医学影像的通用分割模型来了!
医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒,随着近期SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域,各式通用医学图像分割模型也随之涌现。我们邀请到台湾交通大学博士,多篇顶会一作作者,Shawn老师,为我们带来——通用跨模态医学图像分割新SOTA,为我们详解医学图像分割任务。扫码参与课程(赠老师授课PPT)免费领导师推荐M...
2024-02-06 14:46:01 65
转载 谁是最强多模态模型?评测框架 VLMEvalKit 全方位揭秘多模态能力
关注公众号,发现CV技术之美随着 OpenFlamingo, LLaVA, MiniGPT-4 等一系列多模态理解先驱项目的推出,我们见证了超过一百种创新多模态模型和众多评测数据集的诞生。面对这一领域的迅速扩张,我们意识到一个挑战:不同的多模态模型通常会提供不同评测集上的测试结果,但迄今为止,尚无一个统一的开源评测框架来全面覆盖这些多样化的模型和评测集。为此,OpenCompass 团队开发了 V...
2024-02-06 14:46:01 104
转载 NeurIPS2023 | Weight Decay 的前世今生和隐藏缺陷
关注公众号,发现CV技术之美本文为粉丝投稿,原文链接:https://zhuanlan.zhihu.com/p/672650395。本 blog 是我组的 NeurIPS2023 论文On the Overlooked Pitfalls of Weight Decay and How to Mitigate Them: A Gradient-Norm Perspective延伸开来的关于经典算法W...
2024-02-05 13:26:24 37
转载 今年的 AAAI会议有点猛....
AAAI是国际顶级人工智能学术会议,属于CCF A类,在人工智能领域享有盛誉。今年的AAAI 会议投稿量突破了历史记录,共有12100篇投稿(主赛道),最终录用2342篇,录用率23.75%。对比前几年有了很大的提升:在AIGC领域,会议论文比起期刊论文有高能见度;高影响力;高品质;审稿周期短;更具时效性等特点。这意味着投中会议期刊不但能获得与顶尖研究人员和学者交流科研成果和想法的机会,作者的研究...
2024-02-04 16:33:14 38
“中兴捧月”一种电信设备命令报文监视器界面的设计与实现附件(请不要下载)
2010-06-12
“中兴捧月”软件测试自动化附件
2010-06-12
支持基本RichText编辑功能的消息应用程序附件
2010-06-09
数学建模个人经验谈共九个部分
2010-05-19
2010成都信息工程学院研究生数模赛题
2010-05-19
经过裁剪预处理的面部表情识别研究用JAFFE数据库
2010-05-12
人脸表情识别预处理人脸裁剪系统Face Cropping人脸裁切
2010-05-12
人脸识别预处理人脸裁剪系统Face Cropping人脸裁切
2010-05-12
handwriten digit recognition by combined classifiers
2010-09-25
Automatic visual/IR image registration
2010-09-25
Statistical Pattern Recognition:A Review
2010-09-25
流形学习问题manifold study
2010-06-29
贝叶斯决策理论机器学习数据挖掘
2010-06-29
MathematicalProblemsinImageProcessing
2010-06-25
OpenCV1.0安装文件
2010-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人