自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(4460)
  • 收藏
  • 关注

转载 ​AAAI 2024 | 杭电等提出MINDS,基于序列超图和对抗学习增强多尺度扩散预测

©PaperWeekly 原创 ·作者 |焦鹏飞单位|杭州电子科技大学研究方向|复杂网络、图机器学习论文作者:焦鹏飞、陈虹茜、鲍青、张旺、吴华明作者单位:杭州电子科技大学、天津大学论文链接:https://ojs.aaai.org/index.php/AAAI/article/view/28701/29358论文代码:https://github.com/cspjiao/MINDS摘要...

2024-04-19 13:12:16 2

转载 博士申请 | 美国亚利桑那大学杨幻睿老师招收机器学习方向全奖博士/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!亚利桑那大学亚利桑那大学 (University of Arizona,简称UA) 建立于1885年,是亚利桑那州的核心公立大学 (R1 University)。该校被誉为“公立常春藤”之一。该校的附属医院为全州最大的医疗机构。该校与亚利桑那州立大学 (ASU) 同属亚利桑那校...

2024-04-19 13:12:16 6

转载 GPT超越扩散!视觉生成迎来Scaling Law时刻!北大&字节提出VAR新范式

©作者 |机器之心编辑部来源 |机器之心新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力:▲论文标题: "Visual Autoregressive Modeli...

2024-04-19 13:12:16 1

转载 开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE

OneKE 是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE 以开源形式贡献给 OpenKG 开放知识图谱社区。大语言模型目前已显著提升了人工智能系统处理世界知识的能力,然而,以大语言模型为代表的生成式人工智能依然存在推理能力不足、事实知识匮乏、生成结果不稳定等问题,这些都极大的阻碍了大语言模型的产业化落地。...

2024-04-18 18:34:59 40

转载 改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

©作者 |机器之心编辑部来源 |机器之心随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。为此,北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。论文题目:PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large L...

2024-04-18 18:34:59 30

原创 ICLR 2024 | 阐明扩散模型中的曝光偏差问题,一行代码大幅提升生成质量

论文链接:https://arxiv.org/abs/2308.15321代码连接:https://github.com/forever208/ADM-ES摘要扩散模型在图像生成方面非常成功,但其曝光偏差(exposure bias)的问题(训练和采样过程的输入存在偏差)缺乏深入的探索。在本文中,我们通过首先对真实的采样分布进行分析,并找出了暴露偏差问题的根本原因。此外,我们讨论了该问题一些潜在解...

2024-04-18 18:34:59 492

转载 北京内推 | ​OPPO AI中心大模型算法部招聘NLP算法工程师

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!OPPOOPPO 于 2004 年正式成立,是全球领先的智能设备创新者。目前我们的足迹已遍及60 多个国家和地区,通过 260000 多个全球零售店数量及 3100 多个线下客户服务门店,与全球用户共享科技之美。OPPO 在全球布局八大智能制造中心并在伦敦设有全球设计中心,携手...

2024-04-18 18:34:59 38

原创 ICLR 2024 | 持续近端策略优化算法:人类反馈的持续强化学习

©PaperWeekly 原创 ·作者 | 张晗单位 | 哈尔滨工业大学(深圳),鹏城实验室研究方向 | 大模型人类价值观对齐,持续学习简介人类反馈强化学习(RLHF)作为提升大语言模型(LLM)与人类偏好对齐的重要手段。现有 RLHF 方法在处理不断变化的人类偏好时,往往需要对 LLM 进行全参数重新训练,这在实际应用中面临着时间、计算成本及数据隐私等方面的巨大挑战。依托哈尔滨工业大学(深圳)...

2024-04-17 13:39:47 565

转载 博士申请 | 香港科技大学郭嵩教授招收大语言模型/边缘智能等方向全奖博士/RA/博后...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学香港科技大学,自 1991 年创立以来,便以其卓越的教育质量和科研实力迅速崛起,成为亚洲乃至全球瞩目的高等学府。短短三十年间,科大已跻身“QS 世界百强大学”、“泰晤士高等教育世界百强大学”及“美国新闻与世界报道世界百强大学”之列,更荣获泰晤士高等教育世界第二年轻大...

2024-04-17 13:39:47 33

转载 发论文到底是实验重要还是idea重要?

在发表过几十篇顶会顶刊的大佬看来:要发表一篇顶会,最重要的就是选题和 idea创新点设计。因为能发顶会/高区会议的文章,idea必须具有创新性,一个好的idea就能决定文章是CCF A会的水平还是CCF C会的水平。但是作为学生,科研经验本就比较弱。几乎不具备独立提炼idea的能力。所以,一个学生要想顺利完成第一篇SCI/CCF或者顶会顶刊,十分建议你选一位有经验有能力的“学术领路人”。鉴于此,给...

2024-04-17 13:39:47 28

转载 ICLR 2024 | Twin-sight:标签稀缺下的联邦模型鲁棒训练范式

©作者 |杨智钦单位 |TMLR group, HKBU来源|将门创投本文提出了一种新型联邦半监督学习训练范式,Twin-sight。首先分析了现有联邦半监督学习由于单一模型下的多目标函数优化,导致模型更新时的梯度冲突,降低了联邦学习系统对无标签知识的有效利用。基于孪生视角的 Twin-sight 双模型训练范式,将多目标函数问题解耦,从根本上杜绝了梯度冲突的发生。大量的实验证明,Twin...

2024-04-17 13:39:47 20

原创 NAACL 2024 | 阿里提出大语言模型对齐框架Reward Learning on Policy (RLP)

©PaperWeekly 原创 ·作者 |郎皓单位 |阿里巴巴论文标题:Fine-Tuning Language Models with Reward Learning on Policy论文作者:郎皓、黄非、李永彬收录会议:NAACL 2024论文链接:https://arxiv.org/abs/2403.19279代码和数据:https://github.com/AlibabaResea...

2024-04-16 18:09:50 960

转载 一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构设计方法...

©作者 |机器之心编辑部来源 |机器之心以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,稳定网络训练,提高计算效率。目前,经典的网络架构设计方法包括人工设计、神经网络架构搜索(NAS)[1]、以及基于优化的网络设计方法 [2]。人工设计的网络架构如 ResNet 等;神经网络架构搜索则通过搜索或...

2024-04-16 18:09:50 33

转载 价值观罗盘:如何让大模型与人类价值观对齐?

编者按:随着人工智能技术的快速发展和能力的不断增强,大模型已经逐步应用于人们的日常生活。但这同时也带来了很多新的潜在风险,进一步凸显了大模型与人类价值观对齐问题的紧迫性。然而,人工智能应该与哪些价值观进行对齐?又该如何对齐?这些问题至今还没有明确的答案。为了解决这些挑战,微软亚洲研究院提出了价值观罗盘(Value Compass)项目,从交叉学科的角度切入,充分借鉴伦理学和社会学中的理论,以解决...

2024-04-16 18:09:50 25

转载 上海期智研究院诚聘人工智能、信息安全、量子智能及相关方向海内外顶尖人才...

TopTalentRecruitment诚聘海内外顶尖人才人工智能/信息安全/量子智能上海期智研究院上海期智研究院是上海市新型研发机构之一,由图灵奖得主姚期智于 2020 年创建。研究院以建设世界顶尖基础科学研究机构为使命,打造上海科创中心建设新标杆。01研究院优势高水平人才汇聚集聚全球顶尖人才,目前参与科研人员 100 余人,从事原创性、前瞻性的科学研究与技术攻关。院校紧密合作与清华大学、上...

2024-04-16 18:09:50 45

转载 博士申请 | 香港理工大学林婉瑜老师招收可信AI/生成式AI方向全奖博士/博后

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学(The Hong Kong Polytechnic University) 是一所位于中国香港的公立综合性研究型大学,坐落于香港九龙红磡湾。香港理工大学是香港地区的顶尖高校之一,并长期入选“QS世界百强大学”及“泰晤士高等教育世界百强大学”。在202...

2024-04-15 13:01:59 45

转载 Mamba入局遥感!RS-Mamba:首次使用SSM进行大遥感图像的语义分割与变化检测

©作者 |赵思杰单位 |南京大学硕士生研究方向 |语义分割Mamba 在大语言模型大放异彩,以其线性复杂度和媲美 transformer 的表现,被认为是 transformer 的有力替代。近期工作 Vim 和 VMamba 将 Mamba 引入到视觉图像领域,引爆了视觉领域的众多领域,涌现出大量使用 Mamba 进行视觉任务的研究。本文首次将 Mamba 引入到遥感,构建了 RS-Mam...

2024-04-15 13:01:59 40

原创 ​CVPR 2024 | PromptSG:开启语言引导行人检索新纪元,实现精准语义捕捉

©PaperWeekly 原创 ·作者 |吴大衍单位 |中国科学院信息工程研究所研究方向 |多媒体大数据分析借助对语义信息的深度挖掘,行人重识别技术取得了令人瞩目的进展。这些方法专注于提取图像中与语义紧密相关的部分,如人体的姿态、服饰等细节,从而实现了更加精准的对齐和匹配。然而,当前的方法仍受限于单一图像模态的利用,缺乏直观且有效的语义引导。这导致模型在关注区域时,往往只聚焦于某些特定的局...

2024-04-15 13:01:59 714 3

转载 一文全面盘点算法工程师大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并制作了大模型微调技能图谱,希望可以帮助大家将知识体系梳理清楚,为未来在大模型的工作与科研道路上节省时...

2024-04-15 13:01:59 28

转载 博后招募 | 医疗大数据与医学智能实验室招聘博士后/青年教师/访问学生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!医疗大数据与医学智能实验室医疗大数据与医学智能实验室 (HDMI LAB) 由华南理工大学长聘教授、博士生导师,人工智能与数字经济广东省实验室(广州)研究员许言午教授创立。实验室长期从事医学图像分析、多模态医疗数据融合等方向的理论和应用研究。实验室在眼科疾病AI智能分析领域已经...

2024-04-14 22:05:04 40

转载 Github揽获8.6K星!《多模态大语言模型综述》重大升级

去年 6 月底,我们在 arXiv 上发布了业内首篇多模态大语言模型领域的综述《A Survey on Multimodal Large Language Models》,系统性梳理了多模态大语言模型的进展和发展方向,目前论文引用 120+,开源 GitHub 项目获得 8.6K Stars。自论文发布以来,我们收到了很多读者非常宝贵的意见,感谢大家的支持!论文链接:https://arxiv.o...

2024-04-14 22:05:04 42

转载 ICLR 2024 | 谁说大象不能起舞!重编程大模型实现跨模态交互的时序预测

©作者 |机器之心编辑部来源 |机器之心最近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角:高效重编程大语言模型进行通用时序预测——其提出的 Time-LLM 框架无需修改语言模型即可实现高精度时序预测,在多个数据集和预测任务中超越了传统的时序模型,让 L...

2024-04-14 22:05:04 47

原创 生成扩散模型漫谈:信噪比与大图生成

©PaperWeekly 原创 ·作者 | 苏剑林单位 |科学空间研究方向 | NLP、神经网络盘点主流的图像扩散模型作品,我们会发现一个特点:当前多数做高分辨率图像生成(下面简称“大图生成”)的工作,都是先通过 Encoder 变换到 Latent 空间进行的(即 LDM,Latent Diffusion Model [1] ),直接在原始 Pixel 空间训练的扩散模型,大多数分辨率都不超...

2024-04-14 22:05:04 706

转载 NLPCC 2024“大语言模型监管”评测任务发布,诚邀各界专家学者参与

简介大语言模型已经展现出令人瞩目的能力并在多种任务上达到甚至超越人类的表现。然而,随着这些模型在社会中的应用越来越广泛,它们可能产生的负面影响也引起了人们的关注。确保模型的安全并负责任地部署,监管大语言模型成为了一个关键环节。鉴于此,浙江大学和新加坡国立大学学者在NLPCC 2024上组织了大语言模型监管评测任务(Task10),包含多模态大语言模型幻觉检测和大语言模型解毒两个子任务,促进大语言模...

2024-04-12 18:12:36 38

转载 业界首个!厦大北大联合深势科技发布XtalNet,从PXRD实验数据直接预测晶体结构...

近年来,人工智能在图像生成领域的显著进展引发了对扩散模型等方法的广泛关注。通过学习大量图像数据,这些先进的模型能够从随机噪声中生成高度逼真的图像。现在,深势科技与协作者将这一概念应用于晶体结构的预测上,从X射线粉末衍射(PXRD)数据中“扩散”出材料的精确晶体结构。晶体结构的准确预测对材料的性质理解和新材料的开发至关重要,当前的确定方法涉及复杂的实验和分析过程,效率低且易受人为误差影响。XtalN...

2024-04-12 18:12:36 34

原创 NUS、NTU等联合提出Dysen-VDM,利用LLM协助增强视频扩散模型的时间动态感知能力...

文本到视频(T2V)合成这一研究方向受到越来越热切的关注,其中最近以扩散模型为代表的方法,展现出了非常强大的视频生成能力,比如 1 个月前 OpenAI 发布的 Sora 系统。尽管现有的绝大部分开源的扩散模型能够实现高分辨率的视频生成,即画面高清;但实际上对于视频合成,建模视频中所涉及到的复杂时序动态能力,T2V 关键的重点和难点问题,却没有良好解决。也因此大部分的视频扩散模型存在诸如视频过渡不...

2024-04-12 18:12:36 614

转载 博士申请 | 香港科技大学(广州)汤南教授招收数据科学方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)2022年6月29日,国家教育部宣布依法批准正式设立香港科技大学(广州)。香港科技大学(广州)融合内地与香港优质教育资源,探索前沿交叉学科建设,创新人才培养模式,对于培养具有国际视野的创新型人才,推动国家高等教育综合改革,促进内地与香港教育融合发展,服务粤港...

2024-04-12 18:12:36 57

转载 北京/杭州内推 | ​阿里通义灵码团队招聘大语言模型方向研究型实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室-通义灵码团队,推进大模型在智能化软件工程,智能编码领域的应用,主要技术包括:1)代码大模型;2)AI Agents;3) 结合软件工程领域特征的高效训练,微调等。通义灵码产品介绍:https://tongyi.aliyun.com/lingma团...

2024-04-11 13:31:16 47

原创 拷打大模型!首个基于弱智吧贴文的大模型谬误理解评测基准

论文题目:When LLMs Meet Cunning Questions: A Fallacy Understanding Benchmark for Large Language Models论文链接:https://arxiv.org/abs/2402.11100数据及代码链接:https://github.com/THUKElab/FLUB研究动机大语言模型(LLM)已经显示出理解人类语言...

2024-04-11 13:31:16 494

转载 导师放养,偷偷发了顶会。。。

最近经常收到读者的留言 : 抱怨科研真是太难了,竞争压力大,导师不给指导、不开组会,一年见不到导师几次,对于论文初稿、毕业论文毫无建议!无论什么专业的研究生,面对这样的灵魂拷问,很有可能都要陷入沉思。万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!然而,导师时常无法抽出时间指导,想写论文却无人指点……没有不想顺利毕业的科研人,只是.........

2024-04-11 13:31:16 33

转载 西工大等提出大模型多智能体框架CRSEC,揭开AI社会的社交奥秘

©作者 |任思玥单位 |西北工业大学在日常生活中,早晨起床后的洗漱穿衣、驾车通勤时的靠右行驶、工位上的耳机随手一戴…… 这些看似普通的举动其实都是一系列行为标准(即社会规范,social norm)在悄悄指导着我们。它们就像生活中的“隐形导航”,让我们不假思索地知道在什么时间、在什么场合该做什么事情。但是,试想一下,如果没有这些规范,我们可能会在社交活动中因为不知所措而倍感困惑,最终引发各种各...

2024-04-11 13:31:16 23

原创 ​一个大模型建模所有图结构关系!港大等发布最新图大语言模型HiGPT

导读异质图在各种领域,如推荐系统、知识图谱、社交网络分析和生物网络等获得了广泛的关注和应用。这些图包含了各种类型的实体和多种复杂关系,使得它们能够充分表示复杂系统。异质图学习的重点就是为这些图中的节点和边衍生出有意义的表征。这些表征旨在捕捉图内复杂的关系语义,以便更深入地理解底层的结构异质性。近年来,人们越来越认识到异质图神经网络(HGNNs)在捕捉异质图结构中复杂和多样的信息方面的巨大潜力。HG...

2024-04-10 13:07:06 515

转载 奖金丰厚!AI4S Cup系列比赛—“超声CT成像中的声场预测”报名启动

????点击“阅读原文”,即可跳转至比赛主页

2024-04-10 13:07:06 26

转载 博士申请 | 香港中文大学(深圳)陈锐老师招收2024 Fall优化方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培养与科学研究。学院在统计学、运筹学、计算机科学等基础领域以及机器学习、运营管理、决策科学等应用领域有着系统的教学体系,为学生提供完整且前沿的理论与实践相结合的教育。学院强调产学研结合,秉承香港中文大学...

2024-04-10 13:07:06 75

转载 CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

©作者 |机器之心编辑部来源 |机器之心第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被 CVPR 2024 接收。引言大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分...

2024-04-10 13:07:06 43

转载 发了两篇水刊,会成为学术污点吗?

学弟研三了,小论文还没发出来。他很着急。想偷偷发1篇水刊毕业,又担心过不了导师那关——导师要求他们发顶会顶刊。学弟问我发顶会有什么经验。idea没思路,关键还是顶会paper读的少。我花了3个月的时间整理了包括CVPR 2023/2024、ECCV 2023、ICML 2023、ICLR 2024/2023、NeurIPS 2023、ACL 2023、EMNLP 2023、AAAI 2024/20...

2024-04-09 13:08:27 52

转载 北京内推 | 智谱AI招聘Agent算法工程师/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!智谱AI北京智谱华章科技有限公司(简称“智谱AI”)致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。同时,团队还打造了AIGC模型及...

2024-04-09 13:08:27 67

转载 通用文档理解新SOTA!华科、金山提出全新多模态大模型TextMonkey

©作者 |机器之心编辑部来源 |机器之心最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR 2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。论文地址:https://arxiv.org/abs/2403...

2024-04-09 13:08:27 66

原创 ICLR 2024 | 知易行难:探索大模型价值观的全新动态评测范式

©PaperWeekly 原创 ·作者 |段士童单位 |复旦大学硕士研究生研究方向 |大语言模型价值观对齐摘要近年来,大型语言模型(LLMs)取得了前所未有的突破。然而,LLMs 在日常应用中可能会生成不道德内容,从而引发社会风险。虽然当前研究对特定问题如偏见、毒性等内容进行了广泛研究,但从道德哲学的角度探讨 LLMs 的内在价值观的工作仍然较少。本研究通过道德基础理论深入探讨 LLMs ...

2024-04-09 13:08:27 533

转载 揭秘AI幻觉!GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

©作者 |机器之心编辑部来源 |机器之心GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。然而,近期很多工作发现 GPT-4V 在很多基本能力上却意外的出现短板。例如,在微软一篇长达 166 页的技术报告《The Dawn of LMMs:Preliminary Explorations wi...

2024-04-08 13:04:38 30

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除