自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 资源 (2)
  • 收藏
  • 关注

原创 RAG必读的一篇论文:面向大语言模型的检索增强生成技术调查

原文:https://arxiv.org/abs/2312.10997https://www.toutiao.com/article/7353475944348205620/主要作者:Yunfan Gao、Yun Xiong、Xinyu Gao、Kangxiang Jia、Jinliu Pan、Yuxi Bi、Yi Dai,特别鸣谢 Jiawei Sun 和 Haofen Wang 所属机构:1. 同济大学上海智能自主系统研究院;2. 复旦大学计算机科学学院,数据科学上海重点实验室;3. 同济大学设计与

2024-04-10 09:01:47 368

原创 llamaindex pack中的 resume screener 改造

最近在试JD匹配简历,发现llamaindex自带了llama hub的resume screener组件,但其与最新版llamaindex有些方法过期了,试图改造resume screener pack源代码。

2024-04-08 13:51:16 118

原创 llamaIndex 基于GPU加载本地embedding模型

【代码】llamaIndex 基于GPU加载本地embedding模型。

2024-03-17 20:39:09 522

原创 Llama_index利用本地大模型工具ollama(CPU)

【代码】Llama_index利用本地大模型工具ollama(CPU)

2024-03-15 20:46:08 503

原创 利用Langchain 0.1 AzureOpenAI 基于文本问答示例

【代码】利用Langchain 0.1 AzureOpenAI 基于文本问答示例。

2024-03-14 21:48:22 356

原创 Langchain 学习04 LCEL 01

【代码】Langchain 学习04 LCEL 01。

2024-03-07 21:18:55 322

原创 Langchain 学习03 RAG基础

【代码】Langchain 学习03 RAG基础。

2024-03-07 21:07:27 333

原创 Langchain 学习02 , basic example02

【代码】Langchain 学习02 , basic example02。

2024-03-07 20:44:09 342

原创 Langchain0.1 学习笔记 01

【代码】Langchain0.1 学习笔记 01。

2024-03-07 20:24:11 324

原创 llama index with azure openai API

import sys。

2024-03-05 21:13:00 362

原创 centos7.5下superset3.0 单机安装

最近想试用开源BI superset,网上好多文章很好,但版本低,照之安装易错。记录一路安装过程中的问题,已安装成功。运行环境:Centos7.5+miniconda+pythom3.9+superset3.0。

2023-09-29 22:48:40 673 2

翻译 在IDEA下运行flink环境及web ui,debug调试

即使有一个很好的入门或一个伟大的(和免费的)实践培训,也总是有关于如何开始、如何调试问题或如何在 IDE 中启动项目的问题。在本文中,我们介绍了在本地环境中使用 Apache Flink 的基础知识和一些典型陷阱。在本地运行作业时,日志级别非常详细,可能很难在 Flink 消息之间找到您的消息。有关更多信息,请参阅 官方文档中的测试 Flink 作业。你也可以在官方的 Flink 训练测试中找到很好的例子。在 IDE 中运行 Flink 作业的好处之一是能够像往常一样使用断点调试 Flink 作业。

2023-09-19 16:47:20 510

原创 flink&paimon开发之一:创建catalog

【代码】flink&paimon开发之一;创建catalog。

2023-09-19 12:35:04 338

原创 【黑苹果升级到ventura13】 Y7000P-2018升级到 ventura13

1. 用当前的EFI进系统,点击在线升级,若第一次不成功,再点击,多试几次。刚开始是3.92G,不成功时,再点击,将会看到12G的升级包。网上能轻松找到Y7000P-2018的EFI,但是里面没有WIFI驱动。3. 升级成功后,将EFI中的WIFI驱动替换。2. 在升级时,会重启4次。我的EFI包上传百度网盘。

2022-11-01 12:35:46 2075 7

转载 SQL 递归查询所有父子节点

原 SQL 递归查询所有父子节点 ...

2019-07-26 12:04:38 818

转载 mysql 直接的递归查询

目前的mysql版本中并不支持直接的递归查询,但是通过递归到迭代转化的思路,可以在一句SQL内实现树的递归查询下面给一个小示例,后续在贴上调用的代码(代码会贴在最后请注意)MySQL递归查询所有子节点,树形结构查询--表结构CREATE TABLE `address` (`id` int(11) NOT NU...

2019-07-26 12:03:02 772

转载 ArchiMate教程

ArchiMate教程OpenGroup ArchiMate语言提供了一种用于表示企业体系结构的图形化语言,包括策略,转换和迁移规划,以及架构的动机和基本原理。该标准的设计尽可能紧凑,但仍可用于大多数企业体系结构建模需求。下图显示了ArchiMate Core框架的元素。什么是ArchiMate?ArchiMate规范是一种建模语言,它使企业架构师能够使用易于理解的视觉表示来描述,分析和...

2019-05-20 13:20:22 991

转载 企业架构研究总结(20)——TOGAF架构开发方法(ADM)之架构愿景阶段

1.2 架构愿景(Architecture Vision)企业架构开发方法各阶段——架构愿景1.2.1 目标确保架构开发循环的进展被企业管理层认知和支持,并取得必要的管理线的支持和承认。在预备阶段中明确的架构框架的整体背景之下定义和组织架构开发循环。验证业务原则、业务目标、组织的战略业务驱动力,以及企业架构的主要性能指标(KPIs)。定义基线架构的范围,明确其所包含的组件以...

2019-05-16 17:26:40 459

转载 企业架构研究总结(19)——TOGAF架构开发方法(ADM)之准备阶段

1.1 准备阶段(Preliminary)企业架构开发方法各阶段——预备阶段1.1.1 目标      预备阶段的目标是:对进行企业架构活动的组织的背景和环境进行审查。明确企业架构的赞助人,以及其他将被创建企业架构这项业务指令所影响的主要干系人,并确定他们的需求和优先级、他们与组织的关系,以及他们之间所需的工作行为。确保所有将要被涉...

2019-05-16 17:21:50 316

转载 企业架构研究总结(18)——TOGAF总论及架构开发方法(ADM)概述

      TOGAF(The Open Group Architecture Framework)可以说是当前最为流行的企业架构框架理论了,截止到作者写本书之时,福布斯排行榜上排名前50的企业中已经有很大一部分在使用这一企业架构框架了,并且中国企业对它的认可度也超过了50%。TOGAF可以说是企业架构理论从政府进入到社会各研究机构的一个典型案例,...

2019-05-16 17:17:06 381

转载 企业架构研究总结(10)——写在中间的感想

      好几天没有接着更新这篇企业架构研究总结了,除了忙于其他事物之外,关于之前几篇文章的几条评论也让我思考良久,我觉得在继续对企业架构和企业架构框架理论进行进一步的介绍之前,有必要停下来对一些概念进行进一步的阐明。不过,这篇文章只是基于我个人理解而来,恐有所偏失,但欢迎批评指正。      对于企业架构是否仅对大型组织或企业才有意...

2019-05-16 17:13:57 321

转载 企业架构研究总结(9)——联邦企业架构之CIO委员会的企业架构实施指南(下)

开发基线企业架构      在开发基线企业架构这一过程中,各个企业或组织需要根据已经确定的架构目标、范围和所采用的架构框架对当前自身的状态进行各种制品的开发,这既包括针对核心架构制品的开发,也包括对支持性架构制品的开发,同时还包括针对其他由于特定需求而单独定义的架构制品(简报图表、会谈纪要等)的开发。在这份CIO委员会的这份联邦企业架构指南中,关于企业架构核...

2019-05-16 17:12:50 223

转载 企业架构研究总结(8)——联邦企业架构之CIO委员会的企业架构实施指南(上)

企业生命周期      FEAF为联邦企业架构的建设提供了方法论,但是该框架还只是在概念层面提出了联邦企业架构建设过程的各组成部分以及他们之间的关系,而对于如何以步进式的方式建设企业架构,FEAF的详细程度还是不够的。那么该如何使用架构框架理论为联邦政府以及各个机构建设企业架构呢?企业架构的建设、维护和使用又该如何融入到各个机构中?面对这些问题,2001年CIO委员...

2019-05-16 17:11:49 287

转载 企业架构研究总结(7)——联邦企业架构之FEAF的出现和构成(下)

企业架构研究总结(7)——联邦企业架构之FEAF的出现和构成(下)      基于前述关于FEAF第一粒度层次的描述,在第二粒度层次中原来模型中的架构驱动力、当前架构、目标架构以及架构模型的内容被进一步从业务和设计两个方面进行了细化:FEAF第二层粒度示意图      在第二粒度层次的细...

2019-05-16 17:10:19 298

原创 企业架构研究总结(6)——联邦企业架构之FEAF的出现和构成(上)

      美国联邦政府可以说是企业架构应用的先行者和最大倡导者。通过企业架构的发展历史我们可以看出,早在上世纪九十年代以来,美国军方就对这种全局性的信息共享的理论开始了研究,并开发出符合其特色企业架构框架理论(DoDAF)。除此之外,在Zachman框架引入到美国联邦政府各部门之后,首先是美国国家技术标准研究所(NIST)于1989年发布了NIST企业架构模型(NI...

2019-05-16 17:05:24 352

转载 企业架构研究总结(5)——Zachman框架

      Zachman框架起源于John Zachman先生在1987年完成的那篇著名的信息系统架构论文(《A framework for information systems architecture》 ),并一直发展至今。在这篇论文中Zachman先生以修建房屋为例从两个维度将与信息系统架构设计相关的各种元素归纳到如下表格之中:表格中的每一行代...

2019-05-16 17:04:11 285

转载 企业架构研究总结(4)——企业架构与企业架构框架概论

      通过企业架构的发展历程我们可以看出,经过几十年的发展业界已经涌现出了很多企业架构以及企业架构框架理论。在本章中,笔者将挑选几种主要的企业架构和企业架构框架理论进行详细阐述。需要注意的是,虽然本章定名为“企业架构与企业架构框架”,但是由于企业架构的特性所致,其真实形态在不同的企业之间差异很大,即便是联邦企业架构也只是提供了五层参考模型而已,所以对于企业架构的...

2019-05-16 17:02:42 346

转载 企业架构研究总结(3)——企业架构的发展历程

企业架构研究总结(3)——企业架构的发展历程       学习任何一项理论,我认为最好的入门方式就是探究其历史根源以及发展进程,借此阐明该理论产生的真实原因,避免读者一开始陷入各种理论所共有的晦涩之漩涡而不能自拔,最终连为什么而学都理不清楚。学习企业架构和企业架构框架理论亦然。企业架构是自上个世纪七、八十年代发展起来的一套理论,在...

2019-05-16 17:01:32 685

转载 企业架构研究总结(2)——问题的由来和基本概念

企业架构研究总结(2)——问题的由来和基本概念       自上世纪中后叶以来,随着信息技术的发展,各个工业、制造业领域,甚至是在人们的日常生活领域中,自动化以及效率提升等方面均得到了长足的发展,因此各个领域也纷纷加大了对信息技术的投资,从而形成了一个良性的循环。可以说,借助于信息技术的发展,人们的工作方式得以从传统的“蓝领式...

2019-05-16 16:56:36 471

转载 企业架构研究总结(1)——参考资料列表

企业架构研究总结(1)——参考资料列表   在2010年公司有幸参与到了某公司的企业架构建设项目之中,但对于一直从事于企业信息化建设的我们来说,由于一贯以来的努力都集中于企业的数据建模、管理和访问这些方面,像企业架构这样一门牵涉颇广的学问对我们来说还比较陌生,因而一条漫长的学习曲线是无法避免了。笔者有幸参与到这一项目之中,在漫长的学习过程中,笔者感触...

2019-05-16 16:54:41 275

转载 MLAPP 第四章 高斯模型

 第四章 高斯模型4.1 介绍本章主要开始介绍多变量的高斯模型或者叫做多变量的正态模型(MVN),在整本书中,可以说这个模型是非常常见的。这一章的数学的要求是比较高的,涉及到很多的线性代数和矩阵运算。我会尽量把我会的一些计算过程详细的写出来,因为书中有些计算过程可能作者看上去比较的简单,但是我们看的时候还是会比较吃力。4.1.1 符号符号这里就...

2019-04-10 15:17:51 2305

转载 偏差-方差

学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).首先抛开机器学习的范畴, 从字面上来看待这两个词:...

2019-04-08 15:23:08 3962 1

转载 周志华西瓜书六 神经网络二

如果你喜欢本文的话,不妨点赞、分享或者关注公共号「数据搬瓦工」,上面会同步更新文章。如何有错误之处,还望大家指点,我将及时修改。本文重点讲解神经网络的「反向传播算法(BP)」首先定义一些变量:L = 神经网络的层次数 = 第 l 层包含的单元数(不包括偏置单元)K = 输出层的单元数m = 样本数代价函数代价函数 J(θ) 度量的就是这个神经网络对...

2019-04-08 08:31:50 376

转载 周志华西瓜书五 神经网络一

如果你喜欢本文的话,不妨点赞、分享或者关注公共号「数据搬瓦工」,上面会同步更新文章。神经网络当我们有一个包含许多特征的复杂假设时,神经网络则是一种解决复杂假设问题的模型。神经元神经元是神经网络中最基本的单位。神经元是一个计算单元,神经元接收到来自其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,然后通过激活函数的计算以产生神经元的输出。...

2019-04-08 08:30:47 654

转载 周志华机器学习四 过拟合与正则化

上图表示了拟合数据三种情况:欠拟合(左 2 图)、较好的拟合(左 3 图)、过拟合(左 4 图)欠拟合(Underfitting):模型没有很好地捕捉到数据特征,不能够很好地拟合数据。其产生原因通常是假设函数过于简单或者使用的特征不够。其中增加特征项是欠拟合的一种解决方案。过拟合(Overfitting):由于假设函数过度拟合训练集数据而失去了泛化能力,导致对新的数据预测不好...

2019-04-08 08:29:36 422

转载 周志华西瓜书笔记一 机器学习介绍

前言我是一个机器学习的入门者。看了很多前辈大神的推荐,从西瓜书(周志华老师《机器学习》)或者 Coursera 吴恩达机器学习视频入门比较好。我比较喜欢书籍,因为做起笔记比较方便。有输入同时有输出才能让学习效率更加好,所以边读边做笔记。下面我将按照西瓜书的章节来,如果有不对的地方,还望指导学习。正文首先,通过思维导图来描述一下西瓜书第一章的知识内容与结构。...

2019-04-08 08:25:05 1207

转载 线性代数

  前言AI(人工智能)现在火的一塌糊涂,其实在AI领域,机器学习已广泛应用在搜索引擎、自然语言处理、计算机视觉、生物特征识别、医学诊断、证券市场分析等领域,并且机器学习已经是各大互联网公司的基础设施,不再是一个新鲜的技术。但当你真的开始学习机器学习的时候,就会发现上手门槛其实还挺高的,这主要是因为机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂...

2019-04-04 14:03:43 1693

转载 概率统计

机器学习为什么要使用概率概率学派和贝叶斯学派何为随机变量和何又为概率分布?条件概率,联合概率和全概率公式:边缘概率独立性和条件独立性期望、方差、协方差和相关系数常用概率分布贝叶斯及其应用中心极限定理极大似然估计概率论中的独立同分布?机器下学习为什么要使用概率我们借助概率论来解释分析机器学习为什么是这样的,有什么依据,同时反过来借助概率论来推导出更多机器学习算法。很多...

2019-04-04 14:02:23 2148

转载 机器学习理论篇:机器学习的数学基础

一、概述我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学习涉及到的一些最常用的的数学知识。 二、线性代数2-1、标量一个标量就是一个单独的数,一般用小写的的变量名称表示。2-2、向量一个向量就是一列数,这些数是有序排列的。用过次...

2019-04-04 14:00:36 1929

转载 机器学习中的数学——EM算法与高斯混合模型(GMM)

前言:期望极大(Expectation Maximization)算法,也称EM算法,是一种迭代算法,由Dempster et. al 在1977年提出,用于含有隐变量的概率参数模型的极大似然估计,或极大后验概率估计。EM算法作为一种数据添加算法,在近几十年得到迅速的发展,主要源于当前科学研究以及各方面实际应用中数据量越来越大的情况下,经常存在数据缺失或者不可用的...

2019-04-04 13:52:55 573

基于司法案例的知识图谱构建技术研究

基于司法案例的知识图谱构建技术研究

2019-04-23

Pro apache Hadoop

Pro apache hadoop 原版书

2016-01-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除