- 博客(59998)
- 资源 (6)
- 收藏
- 关注
原创 词嵌入:基础知识教程 Word Embedding: Basics
GloVe 基于强大的直觉,即单词的真正含义源自两个单词相邻出现的预期概率的差异。上表显示,在我们的语料库中,“a”后面跟着“penny”两次,而单词“earned”、“saved”和“wise”各跟随“penny”一次。在一个美妙的数学推导中,新矩阵的单元格是原始矩阵的行和列之间的点积的结果。这些方法是基于预测的,因为它们提供了单词的概率,并被证明是单词类比和单词相似度等任务的最先进技术。Google 科学家发表的一篇论文 Word2Vec 的前提是,如果经过训练来预测单词的出现,单词嵌入会更加准确。
2024-03-27 13:13:49 5
原创 霍普菲尔德神经网络和大脑神经网络系统 Hopfield nets and the brain
目录Why are Hopfield nets so interesting and intriguing?为什么霍普菲尔德网如此有趣且令人着迷?What is a hopfield net and how do they work?什么是霍普菲尔德网以及它们如何工作?How do they learn? 他们如何学习?How feedforward works in hopfield nets?hopfield 网络中前馈如何工作?The “energy” function of a Hopfield n
2024-03-21 00:55:36 651 1
原创 循环神经网络背后的直觉 The intuition behind recurrent neural networks
目录Why a new post about RNN?为什么要写一篇关于 RNN 的新文章?Before you start 在你开始之前Neural networks and deep learning神经网络和深度学习Neural Networks and Deep Learning is a free online book. The book will teach you about: Neural networks, a beautiful…神经网络和深度学习是一本免费的在线书籍。这本书将教您:神
2024-03-21 00:46:27 667
原创 【AI大模型应用开发实战】逐步推导反向传播计算原理 Backpropagation step by step
不过,输出层的大小将为 10,因为我们有从 0 到 9 的 10 个可能的标签。当训练网络时,我们输入一个数字为零的图像,我们希望第一个神经元值接近于尽可能接近 1,其余尽可能接近 0。在我们的玩具网络中,我们只有一组权重。由于权重均为正,并且输入本身为正,因此神经元的结果也为正,在这种情况下,RELU 是恒等函数。简而言之,反向传播计算梯度下降以最小化成本函数,但由于神经网络中层的排列方式使它们成为复合函数,反向传播只不过是计算链式法则后的链式法则以获得导数的值成本函数相对于网络各层深处的权重。
2024-03-21 00:19:34 1029
原创 【AI大模型应用开发实战】神经网络核心算法原理与学习过程
随着计算机技术的飞速发展,人工智能逐渐成为了当今科技领域的热门话题。人工智能旨在让计算机能够模拟人类的思维方式,从而实现智能化的决策和行为。在这个过程中,神经网络作为一种模拟人脑神经元连接的计算模型,成为了实现人工智能的关键技术之一。yfw⋅xbyfw⋅xbE12∑i1nyi−ti2E21∑i1nyi−ti2反向传播:δiLyi−tif′ziLδiLyi−ti。
2024-03-19 18:01:05 906 6
原创 【模型精调LoRA】LoRA 低秩适应微调的工作原理和代码实现示例 What is LoRA? Low-Rank Adaptation for finetuning LLMs EXPLAINED
LoRA 是一种有效的大模型微调技术,可以提高推理效率并保持良好的性能。LoRA 在许多下游任务中都取得了良好的效果,包括文本分类、机器翻译和问答。
2024-03-11 12:59:38 726
原创 【ChatGPT模型精调训练】AI 大模型精调 Fine-Tuning (微调)训练图文代码实战详解
选择预训练模型:选择一个在类似任务上已经训练好的模型作为起点。数据准备:准备并预处理你的数据集,使其适合模型的输入格式。微调:在你的特定数据集上继续训练模型,调整模型的权重。评估:评估微调后模型的性能。应用:将微调后的模型部署到实际应用中。Fine-Tuning(精调)是指在预训练模型的基础上,对模型进行微调,使其适应特定任务。预训练模型通常在大量无标签数据上进行训练,以学习通用的语言表示。通过 Fine-Tuning,我们可以在较小的标签数据集上训练模型,以便模型能够更好地解决特定任务。
2024-03-09 11:39:09 266 1
原创 第二章:AI大模型的基础知识2.1 机器学习与深度学习基础2.1.3 神经网络的基本结构
自从人工智能(AI)成为可能的研究领域以来,研究人员一直在尝试模拟生物神经网络中的行为,从而产生可编程的计算机系统。人类大脑中的神经元被认为是执行计算的基本单位,这些单位以非常高效的方式组合在一起,形成复杂的网络来处理信息。自然界中的生物神经网络已经存在数百万年,并且已经演变成了一种非常强大和高效的信息处理系统。因此,模仿生物神经网络并将其应用到计算机系统中可能是一个重大飞跃。人工神经网络(ANN)是一种由简单的处理单元(neurons)组成的网络,它们是通过可训练的连接相互连接的。
2024-02-01 15:00:57 89
原创 AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练,以实现高性能的预测和生成能力。近年来,随着计算能力的提高和数据量的增加,AI大模型在各种任务中取得了显著的成果,如自然语言处理、计算机视觉和强化学习等。模型压缩与加速:随着模型规模的增加,计算资源和存储需求也在不断增加。未来的研究需要关注如何压缩和加速大模型,以适应更多的应用场景。数据效率与迁移学习:当前的大模型通常需要大量的数据和计算资源进行训练。
2024-01-28 03:18:50 980 1
原创 【ChatGPT核心原理实战】《提示工程指南》 | Prompt Engineering Guide
提示工程是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计和研发出强大的技术,实现和大语言模型或其他生态工具的高效接轨。本指南介绍了提示词相关的基础知识,帮助用户了解如何通过提示词和大语言模型进行交互并提供指导建议。
2024-01-05 01:17:04 978 1
原创 【ChatGPT核心原理实战】手动求解 Transformer:分步数学示例 | Solving Transformer by Hand: A Step-by-Step Math Example
手动求解 Transformer:分步数学示例Understanding Transformers: A Step-by-Step Math Example — Part 1了解 Transformer:分步数学示例 — 第 1 部分I understand that the transformer architecture may seem scary, and you might have encountered various explanations on…我知道变压器架构可能看起来很可怕,并且
2023-12-22 02:23:09 2190
原创 融合知识图谱的大语言模型架构设计与实现
融合知识图谱的大语言模型架构设计与实现作者:禅与计算机程序设计艺术1. 背景介绍近年来,大语言模型(Large Language Model,LLM)在自然语言处理领域掀起了一股热潮。这些模型通过在大规模文本数据上进行预训练,能够学习到丰富的语义知识,在各种自然语
2024-03-28 14:17:35 185
原创 循环神经网络RNN和LSTM应用
循环神经网络RNN和LSTM应用作者:禅与计算机程序设计艺术1. 背景介绍在机器学习和深度学习的发展历程中,循环神经网络(Recurrent Neural Network, RNN)是一类非常重要的神经网络模型。与传统的前馈神经网络不同,RNN能够处理序列数据,并在处理
2024-03-28 14:17:04 209
原创 注意力机制:增强模型的关注力
注意力机制:增强模型的关注力作者: 禅与计算机程序设计艺术1. 背景介绍近年来,注意力机制(Attention Mechanism)在深度学习领域备受关注,它为各种模型带来了显著的性能提升。注意力机制的核心思想是让模型能够自动学习关注输入序列中的重要部分,从而更好地捕捉信息间
2024-03-28 14:16:32 180
原创 循环神经网络的数学基础与实战技巧
循环神经网络的数学基础与实战技巧作者:禅与计算机程序设计艺术1. 背景介绍近年来,随着人工智能技术的快速发展,深度学习在自然语言处理、语音识别、时间序列预测等领域取得了突破性进展。其中,循环神经网络(Recurrent Neural Network, RNN)作为一类特
2024-03-28 14:16:01 172
原创 商品属性错误纠正与标准化方法
商品属性错误纠正与标准化方法作者:禅与计算机程序设计艺术1. 背景介绍电子商务行业的快速发展带来了海量的商品数据,这些商品数据中普遍存在着各种错误和不规范的属性信息。商品属性错误和不标准化会严重影响搜索体验、推荐系统以及供应链管理等关键环节,因此如何有效地纠正和规范化商品属
2024-03-28 14:15:30 216
原创 图书信息抽取与知识图谱构建
图书信息抽取与知识图谱构建1. 背景介绍在数字化时代,海量的书籍和文献资料蕴含着丰富的知识和信息。如何有效地提取和组织这些信息,构建面向特定应用场景的知识图谱,一直是研究人员和从业者关注的重点问题。图书信息抽取和知识图谱构建技术,为实现信息的智能检索、关联分析和知识服务提供了基础支撑。
2024-03-28 14:14:58 205
原创 卷积神经网络:图像分类实战教程
卷积神经网络:图像分类实战教程作者:禅与计算机程序设计艺术1. 背景介绍图像分类是计算机视觉领域的一个核心任务,它旨在从给定的图像中识别和分类出图像的内容。随着深度学习技术的发展,卷积神经网络(Convolutional Neural Network, CNN)成为了解决图
2024-03-28 14:14:27 121
原创 食品类目商品评论情感分析与评价体系构建
食品类目商品评论情感分析与评价体系构建作者:禅与计算机程序设计艺术1. 背景介绍随着电子商务的蓬勃发展,消费者在购买商品时越来越依赖于商品的评论信息。这些评论不仅反映了消费者的使用体验,也影响着其他消费者的购买决策。因此,如何准确地分析和挖掘商品评论中蕴含的情感信
2024-03-28 14:13:56 405
原创 药品类目商品的数字化营销策略
药品类目商品的数字化营销策略作者:禅与计算机程序设计艺术1. 背景介绍在当今瞬息万变的市场环境下,企业要想在激烈的市场竞争中立于不败之地,必须紧跟时代发展的步伐,积极拥抱数字化转型。这对于传统行业如药品零售业来说尤为重要。药品作为特殊商品,其销售和推广需要遵守一系列法规和行
2024-03-28 14:13:24 567
原创 图神经网络:非欧几里德数据的深度表示
图神经网络:非欧几里德数据的深度表示作者: 禅与计算机程序设计艺术1. 背景介绍近年来,随着人工智能和机器学习技术的快速发展,图神经网络(Graph Neural Networks, GNNs)作为一种有效的非欧几里德数据表示学习方法,引起了广泛关注。与传统的基于欧几
2024-03-28 14:12:53 551
原创 视觉模型的硬件加速及其边缘部署
视觉模型的硬件加速及其边缘部署作者:禅与计算机程序设计艺术1. 背景介绍近年来,随着计算机视觉技术的快速发展,视觉模型在各行各业得到了广泛应用,从图像分类、目标检测、图像分割到视频分析等,视觉模型已成为人工智能领域的重要组成部分。然而,这些复杂的视觉模型往往需要大量的计算
2024-03-28 14:12:22 511
原创 神经网络在时间序列预测中的应用实践
非常感谢您提供如此详细的要求和期望,我会尽我所能撰写一篇高质量的技术博客文章。我将遵循您提供的大纲和约束条件,以专业、深入和实用的方式来阐述神经网络在时间序列预测中的应用实践。让我们开始吧!1. 背景介绍时间序列预测是一个广泛应用的机器学习领域,在金融、气象、交通等众多行业中都有重要的应用。传统的时间序列预测方法,如ARIMA模型,
2024-03-28 14:11:50 196
原创 珠宝类目商品的A_B测试实践与案例
珠宝类目商品的A/B测试实践与案例作者:禅与计算机程序设计艺术1. 背景介绍电子商务行业一直是A/B测试的重要应用场景之一。作为一个高度数据驱动的行业,电商企业需要不断优化网站、App以及营销策略,以提升转化率和用户体验。在众多电商品类中,珠宝类商品一直是A/B测试的热
2024-03-28 14:11:19 478
原创 图书商品知识图谱构建的关键技术与实践
图书商品知识图谱构建的关键技术与实践作者:禅与计算机程序设计艺术1. 背景介绍图书商品知识图谱是当前电子商务和图书行业中一项重要的技术创新。随着数字化时代的到来,海量的图书商品数据不断涌现,如何有效地组织和管理这些数据,挖掘其中蕴含的知识和价值,已经成为亟待解决的关
2024-03-28 14:10:48 70
原创 强化学习在电商动态定价中的应用
《强化学习在电商动态定价中的应用》作者:禅与计算机程序设计艺术1. 背景介绍在当今瞬息万变的电商市场环境中,如何快速响应市场变化、合理调整商品价格是电商企业面临的一大挑战。传统的静态定价策略已经无法满足电商行业的需求。相比之下,动态定价通过利用大数据和智能算法,能够实时分析市场状况,自动调整商品价格,从而更好地满足消
2024-03-28 14:10:17 253
原创 食品类目商品信息抽取与结构化知识库构建方法
食品类目商品信息抽取与结构化知识库构建方法作者:禅与计算机程序设计艺术1. 背景介绍随着电子商务的迅速发展,各类电商平台上的商品数据呈爆发式增长。如何有效地从海量的商品信息中提取有价值的结构化数据,并构建高质量的商品知识库,已经成为电商企业面临的重要挑战。传统的人工标注方法效率低下,难以满足实时更新的需求。因此,迫切
2024-03-28 14:09:45 75
原创 循环神经网络在时间序列预测中的应用
循环神经网络在时间序列预测中的应用作者:禅与计算机程序设计艺术1. 背景介绍时间序列预测是一个广泛应用于各个领域的重要课题,包括金融市场分析、天气预报、销量预测等。传统的时间序列预测方法,如自回归移动平均(ARIMA)模型,虽然在一些简单场景中效果不错,但在处理复杂的
2024-03-28 14:09:14 221
原创 知识图谱与机器学习的深度融合
知识图谱与机器学习的深度融合作者:禅与计算机程序设计艺术1. 背景介绍近年来,知识图谱和机器学习两大技术在信息处理和智能应用领域都取得了长足进步。知识图谱可以有效地组织和表示复杂的语义信息,为机器学习提供了更加丰富的知识基础。与此同时,机器学习技术的不断创新也极大地增强了知
2024-03-28 14:08:43 130
原创 社交媒体在图书营销中的应用
非常感谢您提供如此详细的任务要求和约束条件。我将以最专业和负责任的态度来完成这篇技术博客文章。社交媒体在图书营销中的应用1. 背景介绍在当今数字化时代,社交媒体已经成为人们获取信息、表达观点、传播内容的主要渠道之一。对于图书出版行业而言,社交媒体为图书营销开辟了全新的机遇和挑
2024-03-28 14:08:11 191
原创 图像处理:计算机视觉的基础
"图像处理:计算机视觉的基础"作者:禅与计算机程序设计艺术1. 背景介绍图像处理是计算机视觉的基础,它涉及对数字图像进行各种操作和分析,以提取有价值的信息。随着人工智能和机器学习技术的飞速发展,图像处理在各个领域都发挥着越来越重要的作用,从医疗诊断、自动驾
2024-03-28 14:07:40 301
原创 深度学习的挑战:过拟合与欠拟合
深度学习的挑战:过拟合与欠拟合作者:禅与计算机程序设计艺术1. 背景介绍深度学习是机器学习领域近年来的一个重要突破,在计算机视觉、自然语言处理等众多领域取得了巨大的成功。与传统的浅层机器学习模型相比,深度学习模型能够自动学习数据的高层次特征表示,从而大幅提高了模型的性能。
2024-03-28 14:07:09 80
原创 神经网络压缩在边缘设备中的优化
感谢您提供如此详细的任务说明和格式要求。作为一位世界级的人工智能专家和计算机领域大师,我将尽我所能撰写一篇高质量的技术博客文章。神经网络压缩在边缘设备中的优化1. 背景介绍随着人工智能技术的快速发展,神经网络模型在各个领域得到广泛应用,从图像识别、自然语言处理到语音合成等
2024-03-28 14:06:38 201
原创 神经网络架构搜索的前沿进展
神经网络架构搜索的前沿进展作者:禅与计算机程序设计艺术1. 背景介绍深度学习在近年来取得了巨大的成功,在计算机视觉、自然语言处理、语音识别等众多领域取得了突破性进展。这些成就的背后离不开神经网络架构的创新。传统的神经网络架构设计主要依赖于人工经验和反复试验,这种方法效率低下,
2024-03-28 14:06:06 218
原创 深度学习在物流与供应链中的应用
深度学习在物流与供应链中的应用作者:禅与计算机程序设计艺术1. 背景介绍随着电子商务的快速发展和消费者需求的不断升级,现代物流和供应链管理面临着前所未有的挑战。如何利用先进的人工智能技术,特别是深度学习,来提高物流和供应链的效率和灵活性,已经成为业界关注的热点话题。
2024-03-28 14:05:35 114
原创 食品类目知识图谱在食品营销中的应用实践
我理解您的要求。作为一位世界级人工智能专家,程序员,软件架构师,CTO,世界顶级技术畅销书作者,计算机图灵奖获得者,计算机领域大师,我将以专业的技术语言,结合丰富的实践经验,为您撰写这篇题为《食品类目知识图谱在食品营销中的应用实践》的技术博客文章。我会严格遵循您提供的约束条件,确保文章内容逻辑清晰、结构紧凑、简单易懂,并针对每个核心章节深入探讨相关的技术概念、算法原理、最佳实
2024-03-28 14:05:04 582
原创 药品类目商品的仓储配送与物流管理
药品类目商品的仓储配送与物流管理作者:禅与计算机程序设计艺术1. 背景介绍医药行业作为国民经济的重要组成部分,其供应链管理在整个产业链中扮演着关键角色。药品作为一种特殊的商品,其生产、储存、运输和销售都需要遵循严格的监管要求,同时还要确保药品质量、安全性和有效性。因此,
2024-03-28 14:04:32 174
原创 图神经网络:非结构化数据分析
图神经网络:非结构化数据分析作者:禅与计算机程序设计艺术1. 背景介绍在大数据时代,人工智能和机器学习技术的蓬勃发展,给我们带来了前所未有的数据分析能力。然而,传统的机器学习算法大多针对结构化数据,而在处理非结构化数据如图像、语音、视频等方面存在局限性。图神经网络作为一种新兴的深度学习模型,通过对数据间复杂关系的建模
2024-03-28 14:04:01 312
原创 面向垂直行业的大型语言模型微调方法论
1. 背景介绍近年来,大型语言模型(Large Language Model, LLM)在自然语言处理领域取得了巨大的成功,在多个垂直行业应用中发挥了重要作用。然而,如何有效地将通用的大型语言模型微调(Fine-tuning)应用于特定的垂直行业,一直是业界和学术界关注的重点问题。本文将从理论和实践两个角度,探讨面向垂直行业的大型语言模型微调方法论
2024-03-28 14:03:29 555
原创 增强现实中的几何变换与重建
感谢您提供如此详细的任务说明和要求。我会尽我所能按照您的指引和约束条件,以专业的技术语言和清晰的结构来撰写这篇专业的技术博客文章。增强现实中的几何变换与重建作者:禅与计算机程序设计艺术1. 背景介绍增强现实(Augmented Reality, AR)是一种将
2024-03-28 14:02:58 649
ClickHouse 高性能、可扩展和低成本的OLAP数据库 陈光剑 20230912
2023-09-14
Will AI Fix Work? 工作节奏超过了我们的跟上能力 人工智能有望创造一种全新的工作方式
2023-05-17
THE AI INDEX REPORT 人工智能指数报告 Measuring trends in Artificial Inte
2023-04-06
Kotlin Coroutines by Tutorials (1st Edition)
2021-04-28
Principles of programming languages by Gilles Dowek (auth.) (z-lib.org).pdf
2021-04-28
A Brief History of Artificial Intelligence
2021-04-28
An introduction to functional programming through lambda calculus.PDF.zip
2019-09-22
《Kotlin项目实战开发》第3章+类型系统与可空类型
2017-09-30
2024 年可以实现 AGI 吗?
2024-01-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人