- 博客(4390)
- 收藏
- 关注
转载 北京内推 | 微软亚洲研究院机器学习与工业创新组招聘研究型实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院机器学习组从理论、算法、应用等不同层面推动机器学习的前沿。我们的研究兴趣包含:深度学习、强化学习、图学习、预训练、动态学习、学习理论等。同时, 我们也在积极探索人工智能在产业应用中的价值,从而为传统工业赋能。在过去的十几年间,我们在顶级国际会议和期刊...
2024-03-28 13:12:15 13
转载 ICRA 2024 | RGBManip:仅基于单目RGB相机的机器人自主环境感知和操纵
导读学界解决机器人操纵任务往往依赖于带有深度信息的环境感知,如使用深度相机捕捉物体的三维坐标。然而,能否仅用一个 RGB 相机让机器人自主感知环境并完成操纵任务?北京大学董豪团队和香港中文大学窦淇团队联合发表在 ICRA 2024 的最新成果 RGBManip 证明了这个命题的可行性。这个问题难在哪?环境感知在几乎所有机器人任务中都是极其重要的一环。机器人需要对环境中的物体、障碍等各项因素有着精确...
2024-03-28 13:12:15 16
原创 WWW 2024 | 通用可识别、可解释认知诊断框架:开创全新学习者能力建模范式
©PaperWeekly 原创 ·作者 |李佳桐单位 |中国科学技术大学论文标题:Towards the Identifiability and Explainability for Personalized Learner Modeling: An Inductive Paradigm论文作者:Jiatong Li, Qi Liu, Fei Wang, Jiayu Liu, Zhenya ...
2024-03-28 13:12:15 419
转载 深入解析大模型主流微调方法:从LoRA、QLoRA到Flash Attention、增量学习
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据处理、新的开源模型的理解等,几乎每天都有新的发展。作为算法工程师,面对如此飞快的技术迭代,是否感觉到自己的学习步伐有点跟不上技术的发展?而且对这些新兴技术的理解仅仅停留在应用层面上,实际上对背后的原理没有具体剖...
2024-03-28 13:12:15 10
转载 博士申请 | 香港科技大学(广州)骆昱宇教授招收数据科学方向全奖博士生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)2022年6月29日,国家教育部宣布依法批准正式设立香港科技大学(广州)。香港科技大学(广州)融合内地与香港优质教育资源,探索前沿交叉学科建设,创新人才培养模式,对于培养具有国际视野的创新型人才,推动国家高等教育综合改革,促进内地与香港教育融合发展,服务粤港...
2024-03-27 12:37:03 27
转载 加速十倍,前向传播立大功!基于神经网络的偏微分方程求解器新突破
©作者 |任维络单位 |字节跳动近年来,基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中,量子变分蒙特卡洛方法(NNVMC)在量子化学领域异军突起,对于一系列问题的解决展现出超越传统方法的精确度 [1, 2, 3, 4]。北京大学与字节跳动研究部门 ByteDance Research 联合开发的计算框架 Forward Laplacian 创新地利用 Laplace 算子前向传播...
2024-03-27 12:37:03 16
原创 视觉特征在语言空间中如何分布?武大、上海交大提出统一多模态自回归建模框架...
©PaperWeekly 原创 ·作者 |彭天硕单位|武汉大学本科生研究方向 |多模态理解与生成大型语言模型(LLMs)通过在大规模未注释文本语料库上执行自回归建模方法,展现出强大的感知和推理能力。然而,将自回归建模扩展到多模态场景以构建大型多模态模型(LMMs)时,存在一个很大的困难,即图像信息在 LMM 中被处理为连续的视觉嵌入,无法获得离散的监督标签用于进行分类损失计算。在本文中,...
2024-03-27 12:37:03 399
原创 简单好用!北大、普林斯顿联合提出即插即用的大语言模型加速方法
©PaperWeekly 原创 ·作者 |何震宇单位 |北京大学博士生研究方向|大语言模型最近,大语言模型(LLM)生成过程的加速技术,例如投机解码、Medusa(美杜莎)等,都带来了令人印象深刻的速度提升。这些方法通常依赖于将 LLM 与一个小型的草稿模型配对。小型的草稿模型试图在每个解码步骤中以更低的延迟预测多个草稿 token,并让 LLM 并行验证它们,从而减少了 LLM 的解码...
2024-03-27 12:37:03 595
原创 浙大/华科提出EVE-NeRF,基于“视角-极线”信息纠缠的可泛化隐式神经辐射场
最近来自浙江大学和华中科技大学的研究人员提出 EVE-NeRF 模型,一种具有泛化能力神经辐射场模型用于少样本的 3D 视图合成。模型以一种纠缠的方式聚合视角-极线特征,并引入场景不变的外观连续性和几何一致性先验,在泛化性 3D 视图合成测试中达到 SOTA,并且在真实世界中具有多种应用场景。在 AR、VR、场景设计、自动驾驶以及电影制作等多个领域中,神经辐射场 NeRF 已经成为一种革命性的技术...
2024-03-26 13:08:49 915
转载 多模态融合再度领跑ICLR 2024!这56种创新SOTA方案必看
大家好,今天分享一个我认为未来最好发论文的方向:多模态融合。我总结了56个多模态融合的创新点,并整理了对应论文,来自ICLR 2024、AAAI 2024等顶会。想发论文的同学们赶快扫下方二维码下载资料合集,找到你的顶会idea!下滑查看全部56个多模态融合创新点多模态融合的渐进式融合多模态学习中的正交序列融合视听融合中多任务学习的集成框架量化半监督多模态学习中的交互基于Hypergraph的自监...
2024-03-26 13:08:49 29
转载 WWW 2024 | 阿里等提出GraphTranslator,将图模型对齐大语言模型
©作者 |莫燕虎、孙铭蔚来源 |北邮 GAMMA Lab论文链接:https://arxiv.org/pdf/2402.07197.pdf代码链接:https://github.com/alibaba/GraphTranslator引言图模型(GM)如图神经网络(GNN),利用节点特征和图结构来学习表征并预测,在多种领域表现出色,但 GM 通常局限于预定义任务如节点分类,难以适应新的类别和任务...
2024-03-26 13:08:49 33
转载 北京/上海内推 | 小红书智能创作团队招聘多模态大模型算法工程师/实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书智能创作团队以AI及多媒体技术为核心,主要负责小红书发布侧的产品研发,并向公司内部各业务线(推荐、发布、增长、生态、直播、电商、商业化广告)提供业界领先的内容创作、内容理解、互动体验等技术能力及解决方案。团队技术方向涵盖多模态AIGC 、多模态大语言模型、计算机视觉...
2024-03-26 13:08:49 10
转载 CCL2024-Eval | 第二届汉语框架语义解析评测正式开启,诚邀各界专家学者参与
简介框架语义解析(Frame Semantic Parsing,FSP)是基于框架语义学进行语义分析的任务,其目标是从句中提取框架语义结构,实现对句子中事件或情境的深层理解。框架语义解析对阅读理解、文本摘要、关系抽取等下游任务具有重要意义。在自然语言中,大部分情况下以词为单位传达含义,但也存在很多词汇意义聚合现象,即组成的短语出现了新的含义。如:“爱买不买”,整个短语表示说话者对另一方是否要购买...
2024-03-25 20:02:52 26
转载 博士申请 | 哈尔滨工业大学(深圳)万佳教授招收计算机视觉方向博士生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!哈尔滨工业大学(深圳)哈尔滨工业大学始建于1920年,1951年被确定为全国学习国外高等教育办学模式的两所样板大学之一,1954年进入国家首批重点建设的6所高校行列,被誉为“工程师的摇篮”。学校于1996年进入国家“211工程”首批重点建设高校,1999年被确定为国家首批“98...
2024-03-25 20:02:52 45
原创 时空之章:将Attention视为平方复杂度的RNN
©PaperWeekly 原创 ·作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络近年来,RNN 由于其线性的训练和推理效率,重新吸引了不少研究人员和用户的兴趣,隐约有“文艺复兴”之势,其代表作有 RWKV [1]、RetNet [2]、Mamba[3]等。当将 RNN 用于语言模型时,其典型特点就是每步生成都是常数的空间复杂度和时间复杂度,从整个序列看来就是常数的空间复杂度...
2024-03-25 20:02:52 1002
转载 CVPR 2024 | 闻声识人黑科技!从音频中想象出说话人脸,FaceChain团队出品
本文提出了一个新的说话人脸生成任务,即直接从音频中想象出符合音频特征的多样化动态说话人脸,而常规的该任务需要给定一张参考人脸。具体来说,该任务涉及到两个核心的挑战,首先如何从音频中解耦出说话人的身份(性别、年龄等语义信息以及脸型等结构信息)、说话内容以及说话人传递的情绪,其次是如何根据这些信息生成多样化的符合条件的视频,同时保持视频内的一致性。为了解决上述问题,我们首先挖掘了三个人脸相关要素之间的...
2024-03-25 20:02:52 21
原创 中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响
大型视觉语言模型在近期发展迅速(LVLMs),他们使用图像-文本对进行预训练或使用专门的视觉指导调整数据集进行微调,将大语言模型(LLM)拓展为了处理文本和图像的多模态模型。尽管这些模型擅长理解复杂的视觉模式并将其转化为语言,来自中科院,CMU,阿里巴巴,squirrel AI 以及 Meta AI 的研究人员揭示了一个显著问题。由 LVLMs 生成的内容在很大程度上偏向于在预训练期间使用的底层 ...
2024-03-24 21:06:52 964
转载 北京内推 | 北京智源人工智能研究院招聘NLP算法实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!智源人工智能研究院北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)是人工智能领域的新型研发机构。2018年11月14日,在科技部和北京市支持下,联合北京多家人工智能领域优势单位共建。作为新型研发机构,智源研...
2024-03-24 21:06:52 30
转载 CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
©作者 |机器之心编辑部来源 |机器之心近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。为了解决这个问题,来自华中科技大学和字节跳动的研究团队提出了一个针对视觉目...
2024-03-24 21:06:52 82
转载 博后招募 | 香港理工大学姚岱教授课题组招聘人工智能方向博士后
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学(The Hong Kong Polytechnic University) 是一所位于中国香港的公立综合性研究型大学,坐落于香港九龙红磡湾。香港理工大学是香港地区的顶尖高校之一,并长期入选“QS世界百强大学”及“泰晤士高等教育世界百强大学”。在202...
2024-03-22 13:27:22 35
转载 曾经火出圈的提示工程要死了吗?危!大模型能自己优化Prompt了
©作者 |Panda来源 |机器之心人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。简而言之,提示工程就是寻找一种编辑查询(query)的方式,使得大型语言模型(LLM)或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕过这些模型的安保措施。现在的互联网上...
2024-03-22 13:27:22 17
转载 不会吧!还有人不知道小红书25届实习生招聘开始了吗!
注意注意!小红书2025届实习生招募正式开启啦!海量转正机会等你来战~更有超多专薯福利等着你小红书期待你的加入共同探索无限可能!▼ 点击「阅读原文」,立即投递...
2024-03-22 13:27:22 18
原创 WWW 2024 | 港理工等联合提出线性时间图神经网络,适用于大规模推荐系统
©PaperWeekly 原创 ·作者 |张嘉淏单位 |香港理工大学研究方向 |图神经网络、推荐系统论文题目:Linear-Time Graph Neural Networks for Scalable Reommendations论文链接:https://arxiv.org/pdf/2402.13973.pdf代码链接:https://github.com/QwQ2000/TheWebC...
2024-03-22 13:27:22 737
转载 港科大(广州)开源智慧交通新成果,用AI大模型控制红绿灯
©作者 |LLMLight团队来源 |量子位大模型“上路”,干起了交通信号控制(TSC)的活~模型名为 LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交通状况分析,进而确定最好的信号灯配置。该模型由香港科技大学(广州)的研究团队提出,其背后关键是一个名为 LLMLight 的框架。该框架向智能体提供详细的实时交通状况,并结合先验知识构成提示,利用大模型卓越的泛化能力,采用符合人类...
2024-03-21 13:16:50 33
原创 能否在追问中坚持判断?揭秘大语言模型的判断一致性挑战
©PaperWeekly 原创 ·作者 |谢淇名单位 |南京理工大学研究方向 |大语言模型多轮对话中大语言模型在做出正确判断后,如果面对追问中的质疑、否定、误导等干扰它还能坚持先前的正确判断吗?最近来自南京理工大学(NJUST)的研究者们发现大语言模型(LLMs)在面对追问时经常会在其判断上动摇,即使原始判断是正确的。这种判断的不一致性为生成可靠回应和建立用户信任带来了重大挑战。论文标题:...
2024-03-21 13:16:50 872
转载 AAAI录用率涨至23.75%!大模型这些方向再次卷疯了
2024年,大模型再次卷疯了!就在今日,Anthropic发布的Claude 3系列模型,已经实现了对最新大模型的全面超越。大模型(LLMs)是一种人工智能模型,旨在理解和生成人类语言。大模型通过在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。为了更好地让大家了解大模型时下爆火热点并抓住机遇,我们邀请顶会审稿人/workshop、高效教授/博导、大厂算法研究员等大...
2024-03-21 13:16:50 26
转载 杭州/深圳内推 | VIVO影像算法研究部招聘AIGC+计算摄影方向算法工程师/实习生...
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!VIVOVIVO影像算法研究部是公司的核心算法部门,负责VIVO中高端旗舰手机的核心影像算法的研发,包括手机拍照的全套ISP流程、后处理优化等,聚焦于对照片的影调、色彩和画质等关键属性的全方位提升,和高通联发科等芯片厂商合作订制算法专属芯片。部门的3D影像与技术预研中心,负责研...
2024-03-21 13:16:50 168
转载 多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告...
在科学研究及其应用中,科学文献分析的重要性不言而喻,它使研究人员得以在前人的基础上进行进一步的探索。然而,随着科学的快速迭代发展,科学文献的数量急剧增加,使得深入分析文献的难度和所需的时间大幅提升。为了提高信息检索的效率,SciFinder 和 Reaxys 等专业的科学文献数据库应运而生。然而它们的作用仅限于普通的检索,缺乏信息提取和知识理解的能力,用户仍需阅读和分析检索到的文档,以提取确切答案...
2024-03-20 13:22:59 17
原创 TPAMI 2024 | 针对节点的融合全局-局部信息的图谱滤波方法
论文题目:Node-oriented Spectral Filtering for Graph Neural Networks论文作者:Shuai Zheng, Zhenfeng Zhu, Zhizhe Liu, Youru Li, Yao Zhao作者单位:北京交通大学源码链接:https://github.com/SsGood/NFGNN/论文链接:https://ieeexplore.iee...
2024-03-20 13:22:59 725
转载 CVPR 2024 | 通过细粒度人类反馈对齐数据,提高多模态大模型可信度
多模态技术是 AI 多样化场景应用的重要基础,多模态大模型(MLLM)展现出了优秀的多模态信息理解和推理能力,正成为人工智能研究的前沿热点。然而,与大语言模型一样,多模态大模型也依然受到“幻觉”问题的困扰,即模型在回答中出现与图片信息不符的内容。经过测试发现,即便是 GPT-4V 也会在 45.9% 的图片回答中出现明显的“幻觉”。大模型出现“幻觉”的症结之一在于未经人类对齐时发生的“过泛化”情况...
2024-03-20 13:22:59 75
转载 博士申请 | 香港大学陈怡老师课题组招收计算机安全方向全奖博士/博后
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学(The University of Hong Kong,简称HKU)作为亚洲最为著名的高等学府之一,香港排名第一的大学,自其成立以来一直是学术研究和创新的先驱。在2023年的QS世界大学排名中,香港大学位列全球21位,在英国泰晤士报高等教育THE世界大学排名中...
2024-03-20 13:22:59 58
转载 CVPR最佳论文颁给自动驾驶大模型!LLM能突破行业技术“天花板”吗?
2024年开始,将是高阶自动驾驶关键节点。大模型、端到端、OCC这些技术正逐步走向量产。今天就为大家盘点200+篇自动驾驶论文与代码,来自ICCV、NeurIPS等顶会,涉及大模型自动驾驶、端到端、BEV感知、检测、OCC等10余个研究方向。本论文合集涵盖的研究方向全面,内容充实。能帮助大家一览自动驾驶发展路线与前沿趋势。扫码下载全部论文PDF与代码。长按二维码下载自动驾驶200+论文代码合集大模...
2024-03-19 13:17:11 14
原创 CVPR 2024 | 港理工联合OPPO提出统一且通用的视频分割大模型
尽管统一图像分割取得了很不错的进展,但开发统一视频分割模型仍然是一个挑战。这主要是因为不同视频分割任务的侧重点不同,这使得使用相同架构处理不同任务变得异常困难,尤其在保持物体时序一致性方面。具体来说,类别为导向的视频分割任务更侧重检测并跟踪视频中特定类别的对象,而以提示为导向的 VS 任务侧重于在根据视觉/文本提示在视频中重新识别目标。近日, 由香港理工大学和 OPPO 研究院提出了一种新颖且简洁...
2024-03-19 13:17:11 538
转载 北京内推 | 微软亚洲研究院WWE大模型团队招聘大模型研究实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软WWE (Windows & Web Experience) 大模型团队致力于large language model方向的研究,包括通用LM、math、coder、agent等方向,并在ICLR、ACL、EMNLP、NeurLPS等国际顶级会议上发表...
2024-03-19 13:17:11 25
转载 陶大程团队联合港大等发布最新综述:374篇文献全面解析大模型知识蒸馏
©作者 |机器之心编辑部来源 |机器之心大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距,因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LL...
2024-03-19 13:17:11 45
原创 哈工大发布最新综述:大语言模型时代的表格推理技术
©PaperWeekly 原创 ·作者 |张玄靓单位 |哈尔滨工业大学研究方向 |自然语言处理、表格推理介绍表格推理(Table Reasoning)任务要求模型根据给定表格完成用户的要求(如图 1 所示,包括表格问答、表格事实判断等)。表格推理在自然语言处理(Natural Language Processin, NLP)领域是一项重要的任务,它显著提升了人们从大量表格中获取和处理数据的...
2024-03-18 18:24:58 735
转载 总奖金4万美元!亚马逊KDD Cup 2024大模型在线购物竞赛正式启动
想拥有一个准确理解购物意图还能陪你实时交流的购物助手吗?亚马逊KDD Cup 2024大模型在线购物竞赛3月18日正式启动!奖金丰厚,诚邀各位AI人才踊跃参与!01竞赛简介KDD Cup是ACM知识发现与数据挖掘国际会议(KDD)的竞赛项目,是最具影响力和最受欢迎的数据挖掘竞赛之一。自1997年以来,每一届KDD Cup都吸引了世界各地的数据科学家、研究人员和工程师,在严格的比赛条件下,通过数据挖...
2024-03-18 18:24:58 85
转载 ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍
©作者 |机器之心编辑部来源 |机器之心Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利,但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的文本检测方法 ——Fast-DetectGPT,无需训练,直接使用开源小语言模型检测各种大语言模型...
2024-03-18 18:24:58 26
转载 CVPR 2024 | 上交大、上海AI Lab联合提出StoryGen: 开放式视觉故事生成
近年来,以扩散模型为代表的生成式 AI 模型能力日新月异,尤其是近期 OpenAI 的文本到视频的生成模型 Sora,展现出了惊人的超长上下文关注能力,实现了连贯一致的长视频生成。针对视频/图像序列生成过程中的一致性这一难题,上海交通大学与上海人工智能实验室联合团队提出了利用 AIGC 技术进行故事讲述,探索了一项新颖且极富挑战性的任务——开放式视觉故事生成(open-ended visual s...
2024-03-17 13:14:51 121
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人