- 博客(90983)
- 资源 (6)
- 收藏
- 关注
原创 AI人工智能大模型中——数据集就是一切 The dataset is everything
我认为对计算乘数的搜索比任何不严格遵守缩放定律的人想象的要普遍得多:实际上,机器学习领域的每一位不研究现有技术的新应用的科学家都应该执行计算效率扫描以确保他们的发现确实相关。不过,随着训练的进行,这些机制会“上线”:当您需要提高学习更复杂的数据分布层的能力时,它们就会提供有意义的价值。更重要的是,认识到像 GPT-4 或 DALL-E 3 这样的巨大模型仍然存在根本性缺陷,这表明试图从 Llama 2 或 Stable Diffusion 等相对较小的模型中获得真正智能的行为是没有希望的。
2024-04-25 03:17:14 28
原创 【AI大模型应用开发实战】大型语言模型评估指南白皮书(LLM Eval)
近年来,大型语言模型(LLM)在自然语言处理领域取得了重大进展,例如 GPT-3 和 Chat-GPT。这些模型经过大型数据集的训练,在文本相关任务中表现出卓越的能力,甚至超越了人类。本文将简要介绍如何验证 LLMs 性能的评估指标。自然语言处理(NLP)是人工智能的一个领域,涉及计算机和人类语言之间的交互。NLP 的基本任务之一是语言建模 (LM),它涉及构建统计模型来分析和生成自然语言。LM 已成为推进机器语言智能的关键方法,使机器能够执行机器翻译、情感分析和对话系统等任务。
2024-04-24 23:14:44 139 3
原创 Transformer模型的预训练与微调技术
介绍了自然语言处理技术的发展历程,特别是Transformer模型的崛起,并详细介绍了Transformer模型的核心概念、算法原理和应用场景。自然语言处理技术是人工智能领域的重要研究方向,其目标是使计算机能够理解和处理人类语言。近年来,随着深度学习技术的兴起,NLP领域取得了显著的进展。Transformer模型是一种基于自注意力机制的深度学习模型,它采用编码器-解码器架构,并通过多头注意力机制来捕捉输入序列中不同位置之间的依赖关系。
2024-04-24 12:03:24 483 8
原创 强化学习在自动驾驶中的应用
随着科技的发展,自动驾驶已成为汽车行业的热门话题。它旨在通过智能系统实现车辆的自主导航,减少人为错误造成的交通事故,并提高交通效率。强化学习作为机器学习的一种,凭借其模仿人类学习方式,即通过反复试错和奖励机制优化行为的能力,正逐步成为推动自动驾驶技术的重要驱动力。未来,强化学习将在自动驾驶领域发挥更大作用,实现更高级别的自动化。然而,挑战依然存在,如数据隐私保护、安全性验证、法律法规的适应性以及应对未知环境的能力。随着技术的进步,这些挑战有望得到解决,从而推动自动驾驶技术迈向更高的成熟度。
2024-04-11 14:35:48 1050 1
原创 基于transformer的端到端语音识别模型解析
语音识别作为人机交互的重要技术之一,在近年来得到了飞速的发展。传统的语音识别系统通常由声学模型、语言模型和解码器三个主要部分组成,需要进行复杂的管道式处理。随着深度学习技术的不断发展,出现了基于端到端(end-to-end)的语音识别模型,能够直接从原始语音信号中输出文本序列,大大简化了系统结构。其中,基于Transformer的端到端语音识别模型在近年来取得了突破性的进展,在多个公开数据集上取得了领先的识别性能。
2024-04-08 11:59:05 518
原创 RAG 提示词工程最佳实践
虽然目前网络上关于提示工程的相关资料已经多如牛毛,然而 RAG (检索增强生成) 任务中提示工程如何进行的资料相对而言却较少。不少朋友之前也热烈的讨论过 RAG 场景下提示词的运用,因此 Zen 禅与计算机程序设计艺术 特别推出 RAG 任务下的提示词实践经验系列分享。RAG 是检索增强生成(Retrieval Augmented Generation)的简称,是当前最火热的企业级LLM应用方案。
2024-04-06 11:17:08 103 2
原创 Ilya Sutskever: 元学习和自我对弈 OpenAI Meta-Learning & Self-Play | MIT Artificial General Intelligence AGI
欢迎来到 通用人工智能,今天我们有伊利亚 sutskever 联合创始人和研究开放人工智能总监,他在多伦多的 amel 小组开始工作,杰弗里·辛顿 (Geoffrey Hinton) 随后与安嘉莹一起在斯坦福大学工作,作为 Google Brain 的研究科学家,共同创立了 DNN 研究三年,并最终共同创立了开放 AI。
2024-04-02 00:01:29 63 2
原创 神经网络基础:从生物神经元到人工神经元
人工智能领域中,神经网络作为一种重要的机器学习模型,已经广泛应用于计算机视觉、自然语言处理、语音识别等众多领域,取得了令人瞩目的成就。神经网络的核心思想源于人类大脑中神经元之间的信息传递与处理机制。通过模拟生物神经元的结构和功能,人工神经网络得以实现对复杂问题的高效学习和处理。本文将从生物神经元的基本构造和工作原理出发,系统地介绍人工神经元的核心概念,并深入探讨神经网络的基本算法原理、最佳实践、应用场景以及未来发展趋势。希望能够帮助读者全面理解神经网络技术的来龙去脉,为进一步学习和应用打下坚实的基础。
2024-04-01 00:55:11 792
原创 词嵌入:基础知识教程 Word Embedding: Basics
GloVe 基于强大的直觉,即单词的真正含义源自两个单词相邻出现的预期概率的差异。上表显示,在我们的语料库中,“a”后面跟着“penny”两次,而单词“earned”、“saved”和“wise”各跟随“penny”一次。在一个美妙的数学推导中,新矩阵的单元格是原始矩阵的行和列之间的点积的结果。这些方法是基于预测的,因为它们提供了单词的概率,并被证明是单词类比和单词相似度等任务的最先进技术。Google 科学家发表的一篇论文 Word2Vec 的前提是,如果经过训练来预测单词的出现,单词嵌入会更加准确。
2024-03-27 13:13:49 63
原创 霍普菲尔德神经网络和大脑神经网络系统 Hopfield nets and the brain
目录Why are Hopfield nets so interesting and intriguing?为什么霍普菲尔德网如此有趣且令人着迷?What is a hopfield net and how do they work?什么是霍普菲尔德网以及它们如何工作?How do they learn? 他们如何学习?How feedforward works in hopfield nets?hopfield 网络中前馈如何工作?The “energy” function of a Hopfield n
2024-03-21 00:55:36 718 1
原创 循环神经网络背后的直觉 The intuition behind recurrent neural networks
目录Why a new post about RNN?为什么要写一篇关于 RNN 的新文章?Before you start 在你开始之前Neural networks and deep learning神经网络和深度学习Neural Networks and Deep Learning is a free online book. The book will teach you about: Neural networks, a beautiful…神经网络和深度学习是一本免费的在线书籍。这本书将教您:神
2024-03-21 00:46:27 733
原创 【AI大模型应用开发实战】逐步推导反向传播计算原理 Backpropagation step by step
不过,输出层的大小将为 10,因为我们有从 0 到 9 的 10 个可能的标签。当训练网络时,我们输入一个数字为零的图像,我们希望第一个神经元值接近于尽可能接近 1,其余尽可能接近 0。在我们的玩具网络中,我们只有一组权重。由于权重均为正,并且输入本身为正,因此神经元的结果也为正,在这种情况下,RELU 是恒等函数。简而言之,反向传播计算梯度下降以最小化成本函数,但由于神经网络中层的排列方式使它们成为复合函数,反向传播只不过是计算链式法则后的链式法则以获得导数的值成本函数相对于网络各层深处的权重。
2024-03-21 00:19:34 1128
原创 【AI大模型应用开发实战】神经网络核心算法原理与学习过程
随着计算机技术的飞速发展,人工智能逐渐成为了当今科技领域的热门话题。人工智能旨在让计算机能够模拟人类的思维方式,从而实现智能化的决策和行为。在这个过程中,神经网络作为一种模拟人脑神经元连接的计算模型,成为了实现人工智能的关键技术之一。yfw⋅xbyfw⋅xbE12∑i1nyi−ti2E21∑i1nyi−ti2反向传播:δiLyi−tif′ziLδiLyi−ti。
2024-03-19 18:01:05 996 6
原创 【模型精调LoRA】LoRA 低秩适应微调的工作原理和代码实现示例 What is LoRA? Low-Rank Adaptation for finetuning LLMs EXPLAINED
LoRA 是一种有效的大模型微调技术,可以提高推理效率并保持良好的性能。LoRA 在许多下游任务中都取得了良好的效果,包括文本分类、机器翻译和问答。
2024-03-11 12:59:38 862
原创 【ChatGPT模型精调训练】AI 大模型精调 Fine-Tuning (微调)训练图文代码实战详解
选择预训练模型:选择一个在类似任务上已经训练好的模型作为起点。数据准备:准备并预处理你的数据集,使其适合模型的输入格式。微调:在你的特定数据集上继续训练模型,调整模型的权重。评估:评估微调后模型的性能。应用:将微调后的模型部署到实际应用中。Fine-Tuning(精调)是指在预训练模型的基础上,对模型进行微调,使其适应特定任务。预训练模型通常在大量无标签数据上进行训练,以学习通用的语言表示。通过 Fine-Tuning,我们可以在较小的标签数据集上训练模型,以便模型能够更好地解决特定任务。
2024-03-09 11:39:09 385 1
原创 第二章:AI大模型的基础知识2.1 机器学习与深度学习基础2.1.3 神经网络的基本结构
自从人工智能(AI)成为可能的研究领域以来,研究人员一直在尝试模拟生物神经网络中的行为,从而产生可编程的计算机系统。人类大脑中的神经元被认为是执行计算的基本单位,这些单位以非常高效的方式组合在一起,形成复杂的网络来处理信息。自然界中的生物神经网络已经存在数百万年,并且已经演变成了一种非常强大和高效的信息处理系统。因此,模仿生物神经网络并将其应用到计算机系统中可能是一个重大飞跃。人工神经网络(ANN)是一种由简单的处理单元(neurons)组成的网络,它们是通过可训练的连接相互连接的。
2024-02-01 15:00:57 137
原创 AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练,以实现高性能的预测和生成能力。近年来,随着计算能力的提高和数据量的增加,AI大模型在各种任务中取得了显著的成果,如自然语言处理、计算机视觉和强化学习等。模型压缩与加速:随着模型规模的增加,计算资源和存储需求也在不断增加。未来的研究需要关注如何压缩和加速大模型,以适应更多的应用场景。数据效率与迁移学习:当前的大模型通常需要大量的数据和计算资源进行训练。
2024-01-28 03:18:50 1044 1
原创 【ChatGPT核心原理实战】《提示工程指南》 | Prompt Engineering Guide
提示工程是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计和研发出强大的技术,实现和大语言模型或其他生态工具的高效接轨。本指南介绍了提示词相关的基础知识,帮助用户了解如何通过提示词和大语言模型进行交互并提供指导建议。
2024-01-05 01:17:04 1030 1
原创 【ChatGPT核心原理实战】手动求解 Transformer:分步数学示例 | Solving Transformer by Hand: A Step-by-Step Math Example
手动求解 Transformer:分步数学示例Understanding Transformers: A Step-by-Step Math Example — Part 1了解 Transformer:分步数学示例 — 第 1 部分I understand that the transformer architecture may seem scary, and you might have encountered various explanations on…我知道变压器架构可能看起来很可怕,并且
2023-12-22 02:23:09 2592 6
原创 3知识图谱存储与查询优化
*3知识图谱存储与查询优化1.背景介绍1.1 知识图谱概述知识图谱(Knowledge Graph)是一种结构化的知识表示形式,它将现实世界中的实体(Entity)、概念(Concept)、事件(Event)等以及它们之间的关系(Relation
2024-04-26 13:58:12 148
原创 宝石目录中的关系数据库:存储和查询复杂数据模式
"宝石目录中的关系数据库:存储和查询复杂数据模式"1.背景介绍1.1 宝石行业的复杂数据结构在宝石行业中,每一颗宝石都拥有独特的属性和特征,例如颜色、净度、切工、重量等。这些属性相互关联,形成了
2024-04-26 13:57:40 227
原创 宝石目录中的微调:通过微小调整参数来改进性能
"宝石目录中的微调:通过微小调整参数来改进性能"1.背景介绍1.1 什么是微调?微调(Fine-tuning)是一种迁移学习技术,它通过在大型预训练模型的基础上进行少量数据的进一步训练,从而使模型适应特定的
2024-04-26 13:57:09 234
原创 拨开迷雾:什么是元学习(MetaLearning)?
拨开迷雾:什么是元学习(Meta-Learning)?1. 背景介绍1.1 机器学习的挑战在过去几十年中,机器学习取得了令人瞩目的进展,但它也面临着一些固有的挑战。传统的机器学习算法需要大量的数据和计算资源来训练
2024-04-26 13:56:38 210
原创 超级微调在计算机视觉中的应用:识别对象和检测异常
超级微调在计算机视觉中的应用:识别对象和检测异常1. 背景介绍1.1 计算机视觉的重要性计算机视觉是人工智能领域的一个关键分支,旨在使机器能够从数字图像或视频中获取有意义的信息。随着深度学习技术的不断发展,计算机视
2024-04-26 13:56:06 151
原创 电商领域AI应用的未来趋势
1. 背景介绍1.1 电商行业的快速发展与挑战电子商务近年来经历了爆炸式的增长,已经成为人们日常生活中不可或缺的一部分。从最初的线上购物平台,到如今涵盖社交电商、直播带货、O2O 等多种模式,电商行业不断创新,为消费者提供更加便捷、丰富的购物体验。然而,随着行业的快速发展,电商企业也面临
2024-04-26 13:55:35 141
原创 电商美妆行业AI导购代理系统中环境影响的重要性
电商美妆行业AI导购代理系统中环境影响的重要性1.背景介绍1.1 电商美妆行业概况电子商务美妆行业近年来经历了爆炸式增长,成为零售业中最具活力和创新的领域之一。随着消费者对个性化体验和便利购物的需求不断增加,美妆品牌和电
2024-04-26 13:55:04 128
原创 电商推荐系统评估指标:准确率召回率F1值
1. 背景介绍在电子商务领域,推荐系统扮演着至关重要的角色。它们通过分析用户的浏览记录、购买历史和其他行为数据,为用户推荐感兴趣的商品或服务。有效的推荐系统不仅能够提高用户体验,还可以增加销售额和用户粘性。然而,评估推荐系统的性能并非一件易事,需要使用适当的指标来衡量其准确性和效率。在本文中,我们将重点探讨三个常用的评估指标:准确率
2024-04-26 13:54:32 262
原创 电商知识图谱数据来源:挖掘数据的宝藏
电商知识图谱数据来源:挖掘数据的宝藏1.背景介绍1.1 电商知识图谱的重要性在当今数字时代,电子商务已经成为了一个不可忽视的巨大产业。随着电商平台的不断发展和用户数量的激增,海量的数据被持续产生和积累。这些数据蕴含着宝贵的商业
2024-04-26 13:54:01 348
原创 电商B侧运营中的强化学习
1. 背景介绍随着电子商务的蓬勃发展,B2B(企业对企业)电商平台日益成为企业采购和销售的重要渠道。在B2B电商平台的运营中,如何高效地进行客户管理、订单处理、库存管理等成为了平台运营者面临的挑战。传统的运营方式往往依赖于人工经验和规则,难以适应复杂多变的市场环境。而强化学习作为一种人工智能技术,能够通过与环境的交互学习最优策略,在B2B电商运营中
2024-04-26 13:53:30 292
原创 电子商务中的人工智能:常见困惑
1. 背景介绍电子商务的蓬勃发展,催生了海量的数据和复杂的业务场景。为了应对这些挑战,人工智能 (AI) 技术逐渐融入到电子商务的各个环节,从个性化推荐到智能客服,从供应链优化到欺诈检测,AI 都扮演着越来越重要的角色。然而,在 AI 应用过程中,也伴随着一些困惑和误解。1.1 人工智能
2024-04-26 13:52:58 387
原创 电子商务中的人工智能:常见难题
1. 背景介绍随着互联网技术的不断发展,电子商务已经成为人们生活中不可或缺的一部分。从传统的实体店购物到如今的线上购物,电子商务的便捷性和高效性已经深入人心。然而,随着电子商务规模的不断扩大,也面临着诸多挑战,例如:信息过载: 海量的商品信息和用户数据使得消费者难以快速找到自己想要的商品
2024-04-26 13:52:27 469
原创 电子商务中的人工智能:企业案例研究
1. 背景介绍电子商务的蓬勃发展催生了海量的数据,也为人工智能(AI)的应用提供了肥沃的土壤。AI 技术正在深刻地改变着电子商务的各个环节,从个性化推荐到智能客服,从供应链优化到欺诈检测,AI 都在发挥着越来越重要的作用。1.1 电子商务的挑战传统电子商务面临着诸多挑战,包括:
2024-04-26 13:51:56 147
原创 对抗攻击:提升推荐系统鲁棒性
对抗攻击:提升推荐系统鲁棒性1. 背景介绍1.1 推荐系统的重要性在当今信息过载的时代,推荐系统已经成为帮助用户发现感兴趣的内容和产品的关键工具。无论是在线视频、音乐、电子商务还是社交媒体等领域,推荐系统都扮演着至关重要的角色。它们通过
2024-04-26 13:51:24 575
原创 对抗生成网络:创造力的源泉
对抗生成网络:创造力的源泉1. 背景介绍1.1 人工智能的新时代人工智能(AI)已经成为当今科技领域最令人兴奋和具有变革性的发展之一。从语音识别到自动驾驶,从医疗诊断到金融分析,AI正在彻底改变我们生活和工作的方式。在这个不断进化的领域中
2024-04-26 13:50:53 226
原创 多模态学习:融合视觉语言与其他感官信息
1. 背景介绍在人工智能领域,我们一直致力于让机器像人类一样思考和学习。人类的学习过程是多模态的,我们通过视觉、听觉、触觉等多种感官来感知世界,并综合这些信息来理解周围的环境。然而,传统的机器学习模型通常只关注单一模态的数据,例如图像或文本,这限制了它们对真实世界的理解能力。多模态学习应运而生,它旨在打破这种限制,让机器能够像人类一
2024-04-26 13:50:22 548
原创 反向传播算法在信号处理中的应用:滤波器设计和信号压缩
反向传播算法在信号处理中的应用:滤波器设计和信号压缩1. 背景介绍1.1 信号处理概述信号处理是一门研究信号表示、变换、传输和处理的学科,广泛应用于通信、控制、多媒体等领域。随着数字技术的发展,数字信号处理已成为信号
2024-04-26 13:49:51 359
原创 服装知识图谱驱动的智能库存管理
1. 背景介绍随着电商行业的蓬勃发展,服装企业面临着日益复杂的库存管理问题。传统库存管理方式往往依赖人工经验和简单的统计分析,难以应对海量商品、快速变化的市场需求和多渠道销售带来的挑战。智能库存管理技术应运而生,它利用人工智能、大数据等技术手段,对库存数据进行深度分析和预测,帮助企业实现精细化库存管理,降低库存成本,提高运营效率。服
2024-04-26 13:49:19 333
原创 附录:系统配置和部署说明
下面是《附录:系统配置和部署说明》这篇技术博客文章的正文内容:1. 背景介绍在现代软件开发过程中,系统的配置和部署是确保应用程序顺利运行的关键环节。无论是小型项目还是大规模企业级应用程序,都需要经过适当的配置和部署流程,以确保系统的稳定性、可靠性和高效性。本文将探讨系统配置和部署的重要性,并提供详细的指南和最佳实践,帮助读者更好地理
2024-04-26 13:48:48 118
原创 个性化治疗:AI语言模型和知识图谱在药物发现中的作用
1. 背景介绍1.1 药物发现的挑战传统的药物发现过程漫长而昂贵,往往需要花费数十亿美元和超过十年的时间才能将一种新药推向市场。这个过程涉及多个阶段,包括靶点识别、先导化合物发现、先导化合物优化和临床试验。每个阶段都存在着巨大的挑战,例如:靶点识别
2024-04-26 13:48:17 189
原创 构建可扩展和可伸缩的知识图谱平台
构建可扩展和可伸缩的知识图谱平台1.背景介绍1.1 知识图谱的重要性在当今的数据驱动时代,知识图谱已经成为各大科技公司和企业的核心资产之一。知识图谱是一种结构化的知识库,它以图的形式表示实体之间的关系,并将这些信息与现实世界中的概念和
2024-04-26 13:47:45 90
ClickHouse 高性能、可扩展和低成本的OLAP数据库 陈光剑 20230912
2023-09-14
Will AI Fix Work? 工作节奏超过了我们的跟上能力 人工智能有望创造一种全新的工作方式
2023-05-17
THE AI INDEX REPORT 人工智能指数报告 Measuring trends in Artificial Inte
2023-04-06
Kotlin Coroutines by Tutorials (1st Edition)
2021-04-28
Principles of programming languages by Gilles Dowek (auth.) (z-lib.org).pdf
2021-04-28
A Brief History of Artificial Intelligence
2021-04-28
An introduction to functional programming through lambda calculus.PDF.zip
2019-09-22
《Kotlin项目实战开发》第3章+类型系统与可空类型
2017-09-30
2024 年可以实现 AGI 吗?
2024-01-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人