爱吃牛油果的璐璐-CSDN博客

原创借助知识图谱和Llama-Index实现基于大模型的RAG

对于语言模型（LLM）幻觉，知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息，减少了LLM中出现幻觉的可能性。这种优越性源于它们能够提供关于实体之间关系的精确细节，而不仅仅是表示相似性，支持更复杂的查询和逻辑推理。向量数据库以其数字数组在相似性搜索和最佳匹配场景中表现出色。最终，两者之间的选择取决于项目的需求，包括数据的性质、关系探索的需要以及预期的查询类型。

2024-03-12 18:51:59 1263

原创关于图在推荐系统中的研究

为了提高知识图谱的完整性，使解释路径多样化，论文从图像中提取的特征信息合并到知识图谱中，在五个最先进的 SR 模型（即 GRU4REC、NARM、GCSAN、SR-GNN、SASRec）中实例化了 PR4SR，并将其与其他可解释的 SR 框架进行比较，通过在四个数据集上使用这些方法进行大量实验来证明 PR4SR 对推荐和解释任务的有效性。事实证明，这两种方法都可用于对行为数据中的复杂关系进行建模，从而在个性化排名和物品推荐任务中取得不错的结果，同时保持良好的可扩展性。推荐系统中的偏见也可能为数据引入噪声。

2024-03-12 18:48:53 882

原创 Claude是何方圣神，多项评分超GPT4

当 AI 能力达到的时候，不用强行推广，自然而然就契合市场了，就像 ChatGPT，从来没打广告，却让全世界的人口口相传。当 AI 能力达不到的时候，老板、产品、销售就算把 AI 工程师逼死，也搞不出成果来。（忘了在哪里看到的了）Claude 3 系列模型在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准。

2024-03-10 21:41:27 773

原创再度拆解Transformer(图解)，深挖自注意力、编码器-解码器注意力、注意力分数以及内部结构

Transformer的大脑多头注意力是Transformer的大脑，请先记住这句话并耐心看完本篇文章，希望看完后你会理解这句话。Transformer 中如何使用 Attention注意力机制在 Transformer 中的三个地方发挥作用：编码器中的自注意力——输入序列关注自身解码器中的自注意力——目标序列关注自身 Decoder中的Encoder-Decoder-attention——目标序列关注输入序列注意力输入参数查询、键和值注意力层以三个参数的形式获取输入

2024-03-10 21:02:22 931

原创大模型也有风险

事实证明，大模型完全有能力生成明显侵犯版权和商标的内容，这一点该如何解决，一定是需要在各个场景考虑的，是简单地删除侵犯版权的内容，还是拿到许可的版权，还是其他的解决办法，是任何一家企业都需要考虑的。其实，上面的问题早在大模型出现之前就存在了，只是大模型的出现充分将这些问题暴露出来，既然存在问题，就应该相对应的解决办法，不论是技术手段还是非技术手段，这既是充满挑战的，也是充满机遇的。这种近乎原样照搬的输出称为“抄袭输出”，这是因为如果同样的情况发生在人类身上，那其行为就属于典型的抄袭行为。

2024-02-27 23:21:48 341

原创谷歌开源Gemma，AI大模型时代强势来临

2024年，2月21日，谷歌正式对外发布开源大模型Gemma。谷歌发布的Gemma包含Gemma 2B 和 Gemma 7B，参数规模分别为20亿和70亿，参数规模并不大，谷歌将这两个模型归为轻量级开放模型系列，2B版本甚至可直接在笔记本电脑上运行。在此之前，谷歌在2023年12月首次对外发布Gemini大模型时，对外公布了Ultra、Pro、Nano三个版本，并称“这些是进入Gemini时代第一个模型，也是Google DeepMind成立时的愿景。

2024-02-27 20:56:35 1000

原创大模型之可解释理论框架InContextLearning

大模型的ICL过程，也被称为情景学习和上下文学习，该过程的一个显著特性是其可以从少量的示例集合中学习新规则，并且泛化到新的查询样本中。例如，我们给定一些输入示例：“Apple->Red、Lime->Green”，提示模型对新的查询“Corn->”产生输出为“Yellow”，如下图所示，模型可以仅基于两个示例就学习到了用户的目标映射关系。此外，作者也提到本文的方法与软提示（soft-prompt）方法类似，

2024-02-21 13:59:23 869

原创大模型LLM之混合专家模型MoE（上-基础篇）

大模型的发展已经到了一个瓶颈期，包括被业内所诟病的罔顾事实而产生的“幻觉”问题、深层次的逻辑理解能力、数学推理能力等，想要解决这些问题就不得不继续增加模型的复杂度。

2024-02-21 10:07:16 932

原创从数学角度分析L1为什么容易产生稀疏解

引入L2正则时，代价函数在0处的导数仍是d0，无变化。而引入L1正则后，代价函数在0处的导数有一个突变。从d0+λ到d0−λ，若d0+λ和d0−λ异号，则在0处会是一个极小值点。因此，优化时，很可能优化到该极小值点上，即w=0处。L2正则化相当于为参数定义了一个圆形的解空间，而L1正则化相当于为参数定义了一个菱形的解空间。L1、L2都是对损失函数的优化，L范式都是为了防止模型过拟合，所谓范式就是加入参数的约束。假设L(w)在0处的倒数为d0，即 { ∂L(w)/∂w∣(w=0) } = d0。

2024-02-18 12:15:08 361

原创借助知识图谱和Llama-Index实现基于大模型的RAG

编写一个查询，指定要探索的模式或关系。下面是一个简单的示例，展示了如何查询图数据库：假设你有一个代表社交网络的图数据库，其中用户是节点，而它们的关系（例如友谊）由连接节点的边表示。例如，知识图谱可以告诉你“埃菲尔铁塔”是“巴黎”的地标，而向量数据库只能表示这两个概念的相似程度。以下是查询向量数据库的简单示例：假设你有一个包含客户配置文件的向量数据库，这些配置文件表示为高维向量，你想找到与给定参考客户相似的客户。最终，两者之间的选择取决于项目的需求，包括数据的性质、关系探索的需要以及预期的查询类型。

2024-02-18 12:06:54 992

sinat_19559525的博客

原创借助知识图谱和Llama-Index实现基于大模型的RAG

原创关于图在推荐系统中的研究

原创 Claude是何方圣神，多项评分超GPT4

原创再度拆解Transformer(图解)，深挖自注意力、编码器-解码器注意力、注意力分数以及内部结构

原创大模型也有风险

原创谷歌开源Gemma，AI大模型时代强势来临

原创大模型之可解释理论框架InContextLearning

原创大模型LLM之混合专家模型MoE（上-基础篇）

原创从数学角度分析L1为什么容易产生稀疏解

原创借助知识图谱和Llama-Index实现基于大模型的RAG

原创 Sora 最全面的技术报告

原创意图识别那些事儿

原创 python 代码静态检查工具及使用

原创说说 sigmod、softmax 那些事儿

原创朴素贝叶斯文本分类

原创机器学习的一些笔记

抢单机器人的调研

爱上单片机

空空如也