自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

XD的博客

一直努力,千万别急

  • 博客(66)
  • 资源 (1)
  • 收藏
  • 关注

原创 windows11获取笔记本电脑电池健康报告

可以看到当前完全充电的容量是大于电池设计容量的,如果 完全充电的容量不足设计容量的30%的话,可能电池需要换了。测量误差:可能是由于测量设备或方法的不准确导致的误差。更新的设计容量:电池可能经过了技术更新,制造商提高了电池的设计容量,但用户所知的设计容量信息还未更新。电池老化补偿:一些智能设备或电池管理系统(BMS)可能会尝试通过算法补偿电池老化导致的容量损失,从而使得显示的完全充电容量看起来比实际设计容量要高。

2024-05-08 13:52:29 235

原创 首发!Llama3纯本地部署攻略!中文方法!

完成了LLAMA3的模型部署,从测试的结果可以看到, llama3的基础模型对于中文的支持并不好,我们的问题是中文,它却返回了英文的结果,原因可能是因为它的训练集有15个T但是其中95%是英文,想要它支持中文更好,还需要使用中文的训练集进行微调,可喜的是,微调llma系列的中文训练集并不少(可能是因为llama系列都有这个问题),后续我会接着对llama3进行微调, 待续。。。

2024-04-22 14:07:30 3174 4

原创 安装CUDNN详细过程

cuDNN(CUDA Deep Neural Network library)是由NVIDIA开发的深度学习GPU加速库。cuDNN包含了许多针对神经网络操作进行高度优化的函数,旨在使深度学习框架能够在NVIDIA的GPU上实现最佳性能,这个库提供了高效计算和加速,支持包括卷积神经网络在内的多种深度学习网络,并兼容多种常见的深度学习软件,如CNTK、Caffe、Theano、Keras、TensorFlow等。

2024-04-15 17:24:46 958

原创 triton入门实战

这篇文章主要讲的是基于官方镜像及, pytorch script 格式模型,构建tritonserver 服务。

2024-04-15 15:22:59 1127

原创 微信签名和微信名真的反应人的性格吗?

微信签名仿佛成了一种心理暗示,反映出人们对美好品质的向往和追求,同时也揭示了他们在现实生活中所缺乏的。经过我多年的观察和总结,发现微信签名或者微信名有个特点,好像生活中越缺少什么,签名就会越写什么。签名是财源广进,八方来踩的可能是缺钱。签名是心静如水的通常生活中容易着急。签名是海纳百川的通常生活中很狭隘。签名是自强不息的通常生活中很懒惰。有的人签名是一首诗,可能文化不高。签名是知足常乐的通常生活中很贪。签名是舍得,这个人生活中很抠门。

2024-04-04 18:35:25 101

原创 paddlepaddle模型转换onnx指导文档

因为安装 完成paddlepaddle后还需要安装其他依赖,所以我们加上 -i 指定国内的pip源。cuda驱动版本为516.94。报错内容: cudnn没有装!成功生成onnx文件。

2024-04-04 17:13:33 741

原创 tensflow模型转onnx实践

TensorFlow™是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief [1]。Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究 [1-2]。

2024-04-03 17:07:20 1028

原创 glm2大语言模型服务环境搭建

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。

2024-04-03 16:22:22 930

原创 GLM论文研读

目前已经发展出多种预训练模型,包括自编码模型(如BERT)、自回归模型(如GPT)和编码器-解码器模型(如T5)。然而,这些模型并未在自然语言理解(NLU)、无条件生成和条件生成这三类任务中都达到最佳表现。为此,我们提出了一个基于自回归式空格填充的通用模型(GLM)以应对这一挑战。GLM通过加入二维位置编码,并允许以任意顺序预测片段,优化了空格填充预训练,这使得其在NLU任务上的性能优于BERT和T5。同时,GLM可以通过调整空白数量和长度,针对不同类型的任务进行预训练。

2024-04-02 11:16:35 1683 3

原创 基于Pytorch+昇腾NPU部署baichuan2-7B大模型

Baichuan 2 是百川智能推出的新一代开源大语言模型,采用2.6 万亿Tokens 的高质量语料训练。Baichuan 2 在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。它基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。项目地址预训练模型modelscope硬件要求:NPU:8 x Ascend NPUsModelLink旨在为华为昇腾芯片。

2024-04-02 11:12:23 1376 9

原创 昇腾glm3大模型lora微调及推理

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:更强大的基础模型,更完整的功能支持,更全面的开源序列。

2024-03-29 17:31:26 958

原创 pytorch快速入门中文——07(TensorBoard)

在中,我们向您展示了如何加载数据,如何通过定义为nn.Module子类的模型提供数据,如何在训练数据上训练该模型以及在测试数据上对其进行测试。为了了解发生的情况,我们在模型训练期间打印一些统计数据,以了解训练是否在进行中。但是,我们可以做得更好:PyTorch 与 TensorBoard 集成在一起,TensorBoard 是一种工具,用于可视化神经网络训练运行的结果。本教程使用说明了其某些功能,可以使用将其读入 PyTorch。我们将从。

2023-06-29 09:58:39 1459

原创 pytorch快速入门中文——06(torch.nn)

现在,我们有了一个通用的数据管道和训练循环,您可以将其用于使用 Pytorch 训练许多类型的模型。要了解现在可以轻松进行模型训练,请查看示例笔记本。当然,您需要添加很多内容,例如数据扩充,超参数调整,监控训练,迁移学习等。这些功能可在 fastai 库中使用,该库是使用本教程中所示的相同设计方法开发的,为希望进一步推广其模型的从业人员提供了自然的下一步。我们承诺在本教程开始时将通过示例分别说明torch.nnDataset和DataLoader。

2023-06-29 09:40:19 798

原创 pytorch快速入门中文——05

在幕后,每个原始的 Autograd 运算符实际上都是在张量上运行的两个函数。正向函数从输入张量计算输出张量。反向函数接收相对于某个标量值的输出张量的梯度,并计算相对于相同标量值的输入张量的梯度。在 PyTorch 中,我们可以通过定义的子类并实现forward和backward函数来轻松定义自己的 Autograd 运算符。然后,我们可以通过构造实例并像调用函数一样调用新的 Autograd 运算符,并传递包含输入数据的张量。在此示例中,我们将模型定义为而不是,其中是三次的勒让德多项式。

2023-06-29 09:30:00 590

原创 pytorch快速入门中文——04(训练图片分类器)

之前从“神经网络”部分复制神经网络,然后对其进行修改以获取 3 通道图像(而不是定义的 1 通道图像)。让我们使用分类交叉熵损失和带有动量的 SGD。

2023-06-28 17:32:21 1523

原创 pytorch快速入门中文——03

您只需要定义forward函数,就可以使用autograd为您自动定义backward函数(计算梯度)。您可以在forward函数中使用任何张量操作。模型的可学习参数由返回让我们尝试一个32x32随机输入。注意:该网络的预期输入大小(LeNet)为32x32。要在 MNIST 数据集上使用此网络,请将图像从数据集中调整为32x32。注意torch.nn仅支持小批量。整个torch.nn包仅支持作为微型样本而不是单个样本的输入。例如,nn.Conv2d将采用的 4D 张量。如果您只有一个样本,只需使用。

2023-06-28 17:20:34 975

原创 pytorch快速入门中文——02

是 PyTorch 的自动差分引擎,可为神经网络训练提供支持。在本节中,您将获得有关 Autograd 如何帮助神经网络训练的概念性理解。

2023-06-28 17:02:36 1124

原创 pytorch快速入门中文——01

无缝替换NumPy,并且通过利用GPU的算力来实现神经网络的加速。通过自动微分机制,来让神经网络的实现变得更加容易。

2023-06-28 16:56:08 1206

原创 python中的函数——笔记

不仅Python函数是真正的对象,任何Python对象都可以表现得像函数。为此,只需实现实例方法__call__。实现__call__方法的类是创建函数类对象的简便方式,此时必须在内部维护一个状态,让它在调用之间可用,例如BingoCage中的剩余元素。装饰器就是这样。装饰器必须是函数,而且有时要在多次调用之间“记住”某些事[例如备忘(memoization),即缓存消耗大的计算结果,供后面使用。创建保有内部状态的函数,还有一种截然不同的方式——使用闭包。

2023-03-07 09:58:06 403 1

原创 python的文本和字节序列

可以肯定的是,某些字节流不是ASCII,因为其中包含大于127的字节值,而且制定UTF-8和UTF-16的方式也限制了可用的字节序列。因此,从Python 3的str对象中获取的元素是Unicode字符,这相当于从Python 2的unicode对象中获取的元素,而不是从Python 2的str对象中获取的原始字节序列。:编码是在码位和字节序列之间转换时使用的算法。一种重要的编码,是其他编码的基础,例如cp1252和Unicode(注意,latin1与cp1252的字节值是一样的,甚至连码位也相同)。

2023-03-06 10:12:26 545

原创 python字典和集合——笔记

也就是说,如果有一个类继承了dict,然后这个继承类提供了__missing__方法,那么在__getitem__碰到找不到的键的时候,Python就会自动调用它,而不是抛出一个KeyError异常。如果给这个类一个映射,它会返回一个只读的映射视图。因为Python会设法保证大概还有三分之一的表元是空的,所以在快要达到这个阈值的时候,原有的散列表会被复制到一个更大的空间里面。1.1如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现__hash__( )方法。

2023-03-05 12:49:31 543

原创 python中的序列——笔记

ABC语言时一个致力于为初学者设计编程环境的长达十年的研究项目。Python也从ABC那里继承了用统一的风格去处理序列数据这一特点。不管是哪种数据结构,字符串、列表、字节序列、数组、XML元素,抑或是数据库查询结果,它们都共用一套丰富的操作:迭代、切片、排序,还有拼接。在切片和区间操作里不包含区间范围的最后一个元素是Python的风格,这个习惯符合Python、C和其他语言里以0作为起始下标的传统。这样做带来的好处如下。

2023-02-28 21:03:59 1062

原创 【论文学习】RNN Encoder–Decoder机器翻译

在本文中,作者提出了一种称为RNN编码器-解码器的新型神经网络模型-由两个循环解码器组成神经网络。一个RNN作为编码器将一系列符号编码为固定长度的向量表示,另一个RNN作为解码器将固定长度的向量表示形式解码为另一个符号序列。所提出模型的编码器和解码器是联合训练的,最大化在给定源序列的情况下得出目标序列的条件概率。通过使用RNN编码器- 解码器计算的短语对的条件概率作为现有对数线性中的附加功能模型。

2022-10-11 14:56:36 1308

原创 torch.nn中GRU使用

【代码】torch.nn中GRU使用。

2022-10-10 13:56:26 3070

原创 torch.nn中LSTM使用

【代码】torch.nn中LSTM使用。

2022-10-09 18:27:58 3107 4

原创 随笔记录——gensim word2vector使用

实现例子:这里是处理文本翻译数据集,这里使用word2vec进行词嵌入。

2022-10-09 16:09:24 392

原创 机器学习——朴素贝叶斯

朴素贝叶斯

2022-08-19 15:16:57 327

原创 torch.nn.utils.rnn下面pack_padded_sequence和pad_packed_sequence方法

这个函数主要做了两件事: pad 和封装,因为在rnn模型中,一般先将batch中的数据按照一个时间步一个时间步喂入模型的,这个包的主要作用就是将按照样本堆叠的数据,抽取出时间步这个维度重新堆叠。batch_first: batch 是否在第一位,默认值是False,上面的例子指定为了True,因为是二维,方便观察理解,一般放入lstm或者gru是需要时间步放在第一位的。需要注意的是,默认条件下,我们必须把输入数据按照序列长度从大到小排列后才能送入 pack_padded_sequence ,否则会报错。.

2022-08-11 11:14:06 1088

原创 随笔记录——pytorch词嵌入方法

一般先将原始的文本数据进行初步的词嵌入,再进行模型训练, pytorch也提供了基本的词嵌入方法。

2022-08-03 15:30:09 503

原创 随笔记录——pandas 中 Dataframe.to_dict()

在工作中,使用pandas时,常常需要将dataframe中的数据按照指定的格式输出给下游使用,很多时候,下游指定的格式并不是很特别,而是比较常见的,这时,我们就不需要自己专门定义方法去处理了,可以先看一下有没有现成的方法可以调用,会节省我们很多时间,提高我们程序的效率。下面我介绍一下dataframe的一个格式化输出的方法,to_dict()1、 使用默认的to_dict()格式化输出df = pd.DataFrame({'col1': [1, 2], 'col

2022-03-30 14:21:30 2722

原创 使用torch随机初始化参数

1、从均匀分布中生成值w = torch.zeros(3, 5)wOut[75]: tensor([[0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.]])torch.nn.init.uniform_(w, a=10, b=15)Out[76]: tensor([[11.8949, 11.0836, 10.6348, 13.4524, 12.8051], [14.5289

2022-03-21 18:09:46 2690

原创 随笔记录——pytorch创建tensor函数

1、通过复制数据构造张量1.1 torch.tensor()torch.tensor([[0.1, 1.2], [2.2, 3.1], [4.9, 5.2]])Out[111]: tensor([[0.1000, 1.2000], [2.2000, 3.1000], [4.9000, 5.2000]])torch.tensor([0, 1]) Out[112]: tensor([0, 1])torch.tensor([[0.11111, 0.222222, 0.

2022-03-21 15:23:01 2055

原创 随笔记录——pytorch一元通用函数

1、获取一维tensor中的最大值import torcha = torch.randn(1, 3)aOut[4]: tensor([[-0.6893, -0.3273, 0.6810]])torch.max(a)Out[5]: tensor(0.6810)1.1、 二维或者更多维数据中,获取各个维度的最大值a = torch.randn(4, 4)aOut[7]: tensor([[ 0.0531, 0.1278, 0.0252, -0.7423], [ 0

2022-03-16 18:40:20 3379

原创 随笔记录——混淆矩阵(机器学习)

正确率在分类问题中最常见的指标是正确率(Accuracy),表示模型预测正确的样本比例。 正确率的定义如下:Accuracy=TP+TNTN+FN+FP+FNAccuracy = \frac{TP + TN}{TN+FN+FP+FN}Accuracy=TN+FN+FP+FNTP+TN​正确率指标在样本不均衡的时候不是一个很好的度量模型好坏的指标。例如在文本情绪分类数据集中,正面的样本占比为80%,负面的内容占比只有20%。如果一个分类模型将所有的样本都预测为正面,这个模型显然是一个无用的模型,但是它的.

2022-03-16 11:21:48 1037

原创 pytorch错误——Torch not compiled with CUDA enabled

在Mac上面调试textCNN 分类模型,在调试时发现运行到这一句报错:报错内容为: Torch not compiled with CUDA enabled调查发现, 是跟pytorch和cuda版本不兼容有关, 但是我想到我的mac上并没有显卡,所以这里不应该这么调用cuda,只需要指定下使用cpu。device = torch.device('cpu')s = torch.from_numpy(ndarray).long().to(device)完结。。。...

2022-03-15 11:25:05 4664 1

原创 pyahocorasick使用(ac自动机)

一、简介pyahocorasick是一个快速高效的库,用于精确或近似的多模式字符串搜索,这意味着您可以在一些输入文本中同时找到多个关键字字符串。字符串“索引”可以提前构建,并保存(作为pickle)到磁盘,以便以后重新使用。该库提供了一个ahocarasick Python模块,您可以将其用作Trie之类的普通dict,或者将Trie转换为自动机,以实现高效的Aho-Carasick搜索。二、安装pip install pyahocorasick三、使用1.新建自动机可以将Automaton类

2022-03-15 10:54:20 2040

原创 随笔记录(扩展)——np.where

where基本使用15.1、使用where 按照条件查询出两个字段的值xarr = np.array([1, 2, 3, 4, 5])yarr = np.array([-1, -2, -3, -4, -5])cond = np.array([True, False, True, False, False])np.where(cond, xarr, yarr)Out[174]: array([ 1, -2, 3, -4, -5])15.2、使用where在原有的array中填充常数a

2022-03-14 14:48:07 1271

原创 随笔记录——torch.squeeze/torch.unsqueeze

使用squeeze()移除输入的tensor中,大小为1的维度import torchx = torch.zeros(2, 1, 2, 1, 2)y = torch.squeeze(x)y.shapetorch.Size([2, 2, 2])使用squeeze()移除输入的tensor中,指定维度的大小为1的维度y = torch.squeeze(x, 0)y.shapetorch.Size([2, 1, 2, 1, 2])y = torch.squeeze(x, 1)y.sha

2022-03-08 14:42:19 165

原创 随笔记录——numpy.pad()

1.直接对列表两端进行填充a = list(range(1, 6))np.pad(array=a, pad_width=(2, 3), mode='constant', constant_values=(100, -100))Out[12]: array([ 100, 100, 1, 2, 3, 4, 5, -100, -100, -100])其中array: 需要pad的列表pad_width: 填充到每个轴边缘的数值,在这里,就是说在 左边填充两个元素,

2022-03-07 15:56:02 2778

原创 随笔记录——python中的日期和时间数据处理

一、标准库中的日期和时间处理1、使用datetime包计算时间1.1 使用datetime包获取当前时间from datetime import datetimenow = datetime.now()nowOut[3]: datetime.datetime(2022, 3, 4, 17, 16, 55, 703231)now.year, now.month, now.dayOut[4]: (2022, 3, 4)1.2、计算两个datetime的时间差delta = datet

2022-03-04 18:24:33 600

使用python语言编程, 使用matplotlib做可视化,將排序算法用图像的方式展现出来排序过程

Matplotlib 是一个 Python 的绘图库,它提供了一个类似于 MATLAB 的绘图框架,并且对用户非常友好。它能够生成多种格式的图形,包括交互式的图形和动画,以及用于打印的高质量图形。Matplotlib 广泛应用于数据可视化领域,是 Python 数据分析和科学计算中不可或缺的一部分。 以下是 Matplotlib 的一些主要特点: 多格式输出:支持多种输出格式,包括 PNG、JPEG、SVG、PDF、EPS 等。 多种图形类型:可以生成线图、散点图、柱状图、3D 图形、直方图、功率谱图、错误条形图、散点图矩阵、等高线图等多种图形。 自定义性强:提供了丰富的 API,允许用户对图形的各个方面进行自定义,如颜色、线型、标记样式、坐标轴刻度、图例、标题等。 交互式功能:通过集成如 PyQt 或者 IPython 等工具,Matplotlib 可以生成交互式的图形。 动画支持:Matplotlib 的动画模块允许用户创建帧动画,显示数据随时间的变化。 跨平台:可在多种操作系统上运行,包括 Windows、macOS 和 Linux。

2024-05-08

适合初学者学习的优秀项目:c/c++/python/java等等

入门编程语言的学习项目对于初学者来说非常重要,它们可以为学习者提供必要的基础和实践机会,帮助他们更好地理解编程概念和提高编程技能。以下是一些入门学习项目对于编程学习的重要性: 1. **理论与实践相结合**:学习项目可以帮助初学者将理论知识应用到实际问题中,加深对编程概念的理解。 2. **培养解决问题的能力**:通过解决实际问题,学习者可以培养分析问题和解决问题的能力,这是编程中的核心技能。 3. **提高编程技能**:完成项目需要编写、测试和调试代码,这些过程可以提高学习者的编程技能和代码质量。 4. **增强学习动力**:完成一个项目可以给学习者带来成就感,从而增强他们继续学习的动力。 5. **理解编程语言的特性**:通过项目实践,学习者可以更深入地了解所学编程语言的特性和最佳实践。

2024-04-30

python语言学习-python编程100练,在代码中实际进行练习

Python 是一种高级的、解释型的编程语言,它以其简洁明了的语法和强大的标准库而闻名。Python 由 Guido van Rossum 创建,并在 1991 年首次发布。以下是 Python 语言的一些主要特点: 1. **易于学习和使用**:Python 的设计哲学强调代码的可读性和简洁性。它支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。 2. **可移植性**:Python 是一种跨平台的语言,可以在许多操作系统上运行,包括但不限于 Windows、macOS、Linux 等。 3. **强大的标准库**:Python 的标准库非常广泛,提供了许多用于处理文件、系统调用、网络通信、文本处理等的模块。 4. **开源**:Python 是一个开源项目,拥有活跃的社区,这意味着它不断地得到改进,并且有许多第三方库可供使用。 5. **自动内存管理**:Python 有自动内存管理和垃圾回收功能,这使得内存管理更加方便。 6. **多用途**:Python 可用于各种应用开发,从简单的脚本到复杂的应用程序,如网站、游戏、桌面应用、科学计算和数据分析等。

2024-04-30

elasticsearch查询模版-模糊查询,多字段查询,相似度计算等

Elasticsearch(简称ES)是一个基于Apache Lucene构建的开源、分布式、RESTful风格的搜索和数据分析引擎。它允许你以前所未有的速度和规模,即时地存储、搜索和分析大量数据。Elasticsearch通常用于全文搜索、结构化搜索、分析以及将这三者结合起来的复杂搜索需求。 以下是关于Elasticsearch的一些关键特点和概念: 1. **分布式和高可用性**:Elasticsearch自动将数据分片并在集群中的多个节点之间分布这些分片。它可以在节点失败时自动复制和重新分配数据,以保持服务的可用性。 2. **实时搜索**:Elasticsearch能够在文档被索引后几秒内提供近乎实时的搜索。 3. **多样的搜索能力**:Elasticsearch支持多种类型的搜索,包括结构化、非结构化、地理位置、指标聚合等。 4. **水平可扩展性**:随着数据量的增加,您可以简单地增加更多的节点,Elasticsearch会自动平衡集群的负载。 5. **易于集成**:Elasticsearch提供了丰富的RESTful API,可以轻松地与各种编程语言进行集

2024-04-29

神经网络与深度学习课件和pdf文件

神经网络(Neural Networks)和深度学习(Deep Learning)是机器学习领域中的重要概念,它们之间存在密切的联系。下面是对这两个概念的基本介绍: ### 神经网络 1. **定义**:神经网络是受人脑结构启发的计算模型,它通过模仿人脑神经元的连接和交互来处理信息。 2. **组成**:一个神经网络由多个层组成,包括输入层、隐藏层和输出层。每一层由多个神经元组成,神经元之间通过权重连接。 3. **工作原理**:数据在网络中前向传播,通过每一层的加权和、激活函数转换,最终在输出层产生预测结果。 4. **学习过程**:通过反向传播算法(Backpropagation)调整权重,以最小化预测误差,这个过程通常需要大量的数据和计算资源。 ### 深度学习 1. **定义**:深度学习是机器学习的一个子领域,特指使用深层神经网络(具有多个隐藏层的神经网络)的算法。 2. **特点**:深度学习模型能够学习数据中的复杂模式,并且通常在图像和语音识别、自然语言处理等任务中表现出色。 3. **关键技术**:包括非线性激活函数、梯度下降优化算法、正则化技术等。

2024-04-29

python世界银行公开数据下载爬虫

世界银行(The World Bank)是世界银行集团的简称,也常被称为国际复兴开发银行(International Bank for Reconstruction and Development, IBRD),是联合国系统下的多边开发机构之一。世界银行的主要目标是为发展中国家提供长期贷款和技术支持,以促进它们的经济发展和社会进步。 世界银行集团包括五个机构:国际复兴开发银行(IBRD)、国际开发协会(International Development Association, IDA)、国际金融公司(International Finance Corporation, IFC)、多边投资担保机构(Multilateral Investment Guarantee Agency, MIGA)和国际投资争端解决中心(International Centre for Settlement of Investment Disputes, ICSID)。

2024-04-29

设计模式python模版

设计模式是在软件工程中解决常见问题的通用、可重用的解决方案。它们是在多年的软件开发实践中逐渐被发现、抽象化和总结出来的。设计模式可以帮助程序员以优雅、高效的方式解决软件开发中的问题,提高代码的可读性、可维护性和可扩展性。 设计模式主要分为三大类: 创建型模式(Creational Patterns):这类模式关注对象的创建过程,主要有以下几种: 单例模式(Singleton):确保一个类只有一个实例,并提供一个全局访问点。 工厂方法模式(Factory Method):定义一个接口用于创建对象,但让子类决定实例化哪个类。 抽象工厂模式(Abstract Factory):创建一系列相关或相互依赖对象的接口,而无需指定它们的具体类。 建造者模式(Builder):将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建不同的表示。 原型模式(Prototype):通过复制现有的实例来创建新的实例,而不是通过构造函数。 结构型模式(Structural Patterns):这类模式关注类和对象的结构,主要有以下几种: 适配器模式(Adapter):允许将一个类的接口转换成客户期望

2024-04-29

斯坦福cs223-数据结构课件

数据结构是计算机科学中的一个重要概念,它指的是计算机中存储、组织数据的方式。良好的数据结构可以有效地支持数据的插入、删除、搜索和排序等操作。数据结构通常与算法一起讨论,因为它们紧密相关——算法可以看作是对数据结构进行操作的方法。 常见的数据结构包括: 1. **数组(Array)**:一种基础的数据结构,用于存储一系列有序的元素。数组的特点是元素可以通过索引快速访问。 2. **链表(Linked List)**:由一系列节点组成,每个节点包含数据和一个或多个指向其他节点的引用(链接)。 3. **栈(Stack)**:遵循后进先出(LIFO)原则的数据结构。栈支持两种主要操作:push(压栈)和pop(出栈)。 4. **队列(Queue)**:遵循先进先出(FIFO)原则的数据结构。队列支持两种主要操作:enqueue(入队)和dequeue(出队)。 5. **树(Tree)**:一种分层数据结构,用于模拟具有层次关系的数据。常见的树结构包括二叉树、平衡树(如AVL树)、红黑树等。 6. **图(Graph)**:用于表示物件之间的多对多关系。图由节点(或顶点)和边组成,边可以是

2024-04-28

强化学习经典课程-斯坦福大学cs234课件

CS234是斯坦福大学开设的一门关于强化学习的课程,全称为“Reinforcement Learning”。这门课程由著名学者Emma Brunskill和Chelsea Finn共同授课,旨在为学生提供强化学习的基础知识、核心算法以及最新进展。 CS234课程涵盖了强化学习的基础理论,包括马尔可夫决策过程(MDP)、动态规划、蒙特卡洛方法、时序差分学习、同轨策略和离轨策略等。此外,课程还会介绍一些高级主题,如函数近似、梯度策略方法、探索与利用的平衡、稳定性和收敛性等。 课程结构通常包括讲座、作业、项目等部分。作业和项目旨在让学生通过实践来加深对强化学习理论和方法的理解。CS234课程适合对强化学习感兴趣的研究生和高级本科生,要求学生具备一定的机器学习基础和编程能力。 CS234课程在强化学习领域享有很高的声誉,它的教学大纲、讲义、作业和项目等资源通常会在课程网站上公开,供全球的学习者免费学习。通过这门课程,学生能够掌握强化学习的基本原理,学会如何设计、分析和实现强化学习算法,并为进一步的研究或应用强化学习打下坚实的基础。

2024-04-28

学生成绩管理系统-C++版本

学生成绩管理系统是一种用于管理和跟踪学生学术成绩的软件系统。它通常被教育机构,如学校、大学和培训机构所使用,以简化成绩的记录、存储、分析和报告过程。一个典型的学生成绩管理系统可能包含以下功能: 学生信息管理:录入和编辑学生的基本信息,如姓名、性别、年龄、班级等。 课程管理:设置和管理课程信息,包括课程名称、学分、授课教师等。 成绩录入与修改:录入学生的考试成绩、平时成绩等,并提供修改功能。 成绩查询:学生和教师可以查询特定课程或全部课程的成绩。 统计分析:对成绩进行统计分析,如计算平均分、最高分、最低分等。 报表生成:生成成绩单、班级排名、学期总结等报表。 用户权限管理:设置不同用户的操作权限,如学生、教师、管理员等。 数据备份与恢复:定期备份数据,以防数据丢失,并提供数据恢复功能。 安全性与隐私保护:确保数据的安全性,防止未授权访问,并保护学生的隐私。 学生成绩管理系统可以是基于桌面应用的、网络应用的,也可以是移动应用。在开发这样的系统时,需要考虑到用户界面的友好性、系统的稳定性、数据的准确性和安全性等因素。此外,随着技术的发展,一些系统还可能集成数据分析、人工智能等功能,以提供更

2024-04-28

llama3优秀的prompt-优秀的prompt堪比微调效果

大语言模型通常指的是使用深度学习技术训练的、能够生成和理解自然语言文本的模型。这些模型可以应用于各种任务,如文本生成、机器翻译、文本摘要、情感分析等。在处理这些任务时,通常会使用一个“提示”(prompt)来指导模型生成响应。 提示(prompt)是一个给模型输入的文本,用于引导模型生成相关的输出。在大语言模型中,提示的设计非常重要,因为它直接影响到模型的输出质量和相关性。一个好的提示应该清晰、具体,并且与模型的训练数据和任务目标相匹配。 例如,如果你想让一个大语言模型写一个故事,你可以提供一个包含故事背景和主要角色的提示,如:“在一个遥远的星球上,住着一个喜欢冒险的小猫,它的名字叫…”。模型会根据这个提示生成一个故事。 在设计提示时,还应该考虑到模型的上下文理解能力。大语言模型通常能够理解一定长度的上下文,因此,你可以提供一些上下文信息,帮助模型更好地理解提示和生成输出。 总之,提示是大语言模型生成和理解自然语言文本的重要输入,设计一个好的提示可以帮助模型生成更高质量和更相关的输出。

2024-04-28

正则表达式学习-正则语法

正则表达式(Regular Expression,简称:Regex)是一种文本模式的表示方法,它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式常用于字符串的搜索、替换、分割和校验等操作。 正则表达式由普通字符(例如,字母和数字)和特殊字符(称为“元字符”)组成。以下是一些常用的正则表达式元字符和它们的作用: .:匹配除换行符以外的任意字符。 []:匹配括号内的任意一个字符(字符集)。 [^]:匹配不在括号内的任意一个字符(否定字符集)。 *:匹配前面的子表达式零次或多次。 +:匹配前面的子表达式一次或多次。 ?:匹配前面的子表达式零次或一次。 {m,n}:匹配前面的子表达式至少m次,至多n次。 ^:匹配输入字符串的开始位置。 $:匹配输入字符串的结束位置。 \:转义字符,用于匹配一些特殊字符。 |:选择,匹配符号左边的子表达式或右边的子表达式。 ():标记一个子表达式的开始和结束位置,可以捕获匹配的文本。 正则表达式在不同的编程语言和工具中都有广泛的应用,例如Python、JavaScript、Perl、grep、sed等。

2024-04-28

总结的学习资料nlp算法原理-word2vector-bert等

word2vec是一种计算模型,它将词汇表中的每个词映射到一个固定大小的向量。这个模型由托马斯·米科洛夫(Tomas Mikolov)等人在谷歌开发,用于捕捉词汇的语义和语法特征。word2vec模型有两种架构:连续词袋(CBOW)和Skip-Gram。 连续词袋(CBOW):CBOW模型通过一个词的上下文(即周围的词)来预测这个词。它考虑了一个词的上下文窗口内的所有词,然后尝试预测这个中心词。 Skip-Gram:与CBOW相反,Skip-Gram模型是通过一个词来预测其上下文。它试图使用一个词作为输入,预测在它的上下文窗口中可能出现的词。 word2vec的主要优点是它能够捕捉到词之间的语义关系。例如,如果有一个向量表示“国王”,另一个表示“男人”,那么“国王”向量与“男人”向量减去“女人”向量的结果应该接近“皇后”向量。这种关系可以用于各种自然语言处理任务,如文本分类、情感分析、机器翻译等。 word2vec的另一个重要特性是它能够将词嵌入到一个连续的向量空间中,这样就可以使用数学方法来比较和处理词。这些向量可以用于计算词之间的相似度,或者作为机器学习模型的输入特征。 wo

2024-04-28

jena语义网络开发框架

Jena是一个免费的、开源的Java平台上语义网开发框架。最初是由惠普实验室(HPL)的BrianMcBride开发,后来Jena称为Apache开源项目之一。 jena 结合整体架构图和Jena的官方文档,可以看到Jena框架共分为几大模块: RDF API(RDF模型操作相关) Ontology API(OWL本体模型操作相关) ARQ(SPARQL标准的实现) Inference API(本体推理的实现) TDB(RDF数据的存储数据库) 此外Jena还提供了非常实用的命令行工具(例如SPARQL查询、批量导入RDF数据等)和一个基于Jena框架构建的Web应用程序Fuseki。 学习Jena框架,一定要结合对于的语义技术的知识,这样才能更加快速地上手。

2024-04-27

经典书籍-强化学习源码实现

《强化学习》是一本全面系统地介绍强化学习理论的书籍。这本书内容丰富,不仅包括理论阐述和公式推导,还涵盖了丰富的典型案例,将理论与实践紧密结合。书中详细描述了强化学习的起源、背景和分类,讲解了各类强化学习算法的原理和实现方式,以及这些算法之间的关系,为读者构建了一个完整的强化学习知识体系。 本书的案例包括各类迷宫寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等,通过详细的案例说明和代码描述,帮助读者深入理解各类强化学习算法的精髓。书中的代码简洁易懂,注释详细,便于读者学习和应用。 《强化学习》适用于高等院校计算机、自动化及相关专业的本科生和研究生作为教材,同时也适合对强化学习感兴趣的研究人员和工程技术人员阅读参考。这本书由邹伟、鬲玲和刘昱杓合著,他们在机器学习、数据挖掘、计算几何、知识工程、语义检索、自然语言处理等领域具有丰富的研究和实际应用经验 3 。 另一本值得推荐的强化学习书籍是《强化学习(第2版)》,由Richard Sutton和Andrew Barto合著。这本书被业内公认为强化学习基础理

2024-04-27

python3经典代码模版-cookbook源码

《Python Cookbook》第三版是由David Beazley编写的,这本书在Python社区中非常受欢迎。它主要聚焦于Python编程的方法和技巧,帮助读者深入理解Python语言,并将这些技巧应用于实际项目中。书中的内容从基础如字符串、列表、字典、文件IO和排序,到进阶主题如函数、面向对象编程、数据库和数据持久化、XML处理和Web编程,再到更高级的内容如描述符、装饰器、元类、迭代器和生成器等都有涵盖。 每个知识点都配有案例和解决方案,书中的代码和方法具有很高的实用性,可以方便地应用到实际项目中。这本书不仅提供了问题的解决方案,还展示了专家的思维方式和良好的编程习惯。它适合那些想深入理解Python语言机制和现代编程风格的Python程序员,也适合有一定基础并想深入学习Python的爱好者。

2024-04-27

机器学习经典-统计学习方法主要章节ppt

统计学习方法》是李航所著的一本关于统计学习的专业书籍,第二版于2019年5月由清华大学出版社出版。这本书全面系统地介绍了统计学习的主要方法,内容分为监督学习和无监督学习两篇。 在监督学习部分,书中介绍了决策树、感知机、支持向量机、最大熵模型与逻辑斯谛回归、推进法、多类分类法、EM算法、隐马尔科夫模型和条件随机场等多种方法。无监督学习部分则包括了聚类、奇异值分解、主成分分析、潜在语义分析等内容。每一章节都详细介绍了一到两种方法,便于读者深入理解。 这本书不仅是统计机器学习及相关课程的教学参考书,也适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,同时也适合计算机应用等专业的研发人员参考。

2024-04-27

整理的关于少儿编程的学习路径,以及如何在小升初,初升高和大学充分的利用起来编程经验的优势

信奥的好处: ——参加国际赛,并获奖,可以直接保送985. —— 参加国赛获奖,获奖有机会直接报送 —— 国赛二等奖以上, 只要分数线国本一线,可以直接上985等名校 ### CSP的好处 小升初, 部分省市有政策,需要具体看官网或者咨询教育机构 信息奥林匹克,通常指的是国际信息学奥林匹克竞赛(International Olympiad in Informatics,简称IOI)。这是一项面向全世界中学生的计算机科学竞赛,旨在通过竞赛活动培养青少年对信息科学的兴趣和解决问题能力,推动信息科学教育在青少年中的普及。 IOI的主要竞赛内容包括算法、数据结构、编程和数学问题解决等。竞赛通常分为两天的比赛,每天参赛者需要解决三到四个问题。这些题目往往需要参赛者运用高效的算法和编程技巧,在有限的时间内完成。 竞赛使用的编程语言通常包括但不限于C、C++、Pascal和Python。参赛者需要在规定的时间内编写程序,通过给定的数据测试,并且尽可能优化算法的时间和空间复杂度。 IOI自1989年起开始举办,每年举办一次,每次大约有80个国家的代表队参加。

2024-04-26

meta(原facebook)开源无限token大模型-MEGALODON

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不佳。 长文本是大语言模型一直在努力的方向。近日,谷歌提出的 Infini-Transformer 引入有效方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到无限长输入,而不增加内存和计算需求,吸引了人们的关注。 几乎就在同时,Meta 也提出了一种无限长文本技术。 在 4 月 12 日提交的一篇论文中,来自 Meta、南加州大学、CMU、UCSD 等公司、机构引入了 MEGALODON,一种用于高效序列建模的神经架构,上下文长度不受限制。 MEGALODON 继承了 MEGA(带有门控注意力的指数移动平均)的架构,并进一步引入了多种技术组件来提高其能力和稳定性,包括复数指数移动平均(CEMA)、时间步归一化层、归一化注意力机制和具有两个特征的预归一化(pre-norm)残差配置。

2024-04-24

由meta开源llama模型 ,系列论文,包括llama1, llama2, tinyllama

llama系列模型由meta(原Facebook)的AI Research团队在2023年开发。Llama模型的特点是具有较低的延迟和较高的吞吐量,这使得它在实时应用场景中具有很大的潜力。 Llama模型采用了稀疏注意力机制和旋转位置编码技术,这使得它能够有效地处理长文本序列。与传统的Transformer模型相比,Llama模型在计算复杂度、内存占用和能耗方面都有显著的优势。 Llama模型已经在多个自然语言处理任务中取得了很好的效果,包括文本分类、机器翻译、问答等。它的出现为自然语言处理领域提供了一种新的选择,有望推动该领域的发展。

2024-04-24

llama3-中文微调训练集,让llama3更懂中文

Llama-3是由Meta(Facebook)AI发布的最新一代大型语言模型。它具有两种参数规模:80亿(8B)和700亿(70B),并且还有一个超过4000亿参数的版本正在训练中。Llama-3在多个行业标准测试中展现了卓越的性能,特别是在对话类应用中,其表现超过了许多现有的开源聊天模型。 在技术方面,Llama-3采用了优化的自回归Transformer架构,这种架构专为处理复杂的文本生成任务设计,能够有效提升生成文本的连贯性和相关性。它还结合了监督式微调(SFT)和带人类反馈的强化学习(RLHF),这种混合方法不仅增强了模型的帮助性,也提高了安全性,使得模型在实际应用中更加可靠和符合用户预期。 Llama-3使用了超过15万亿令牌的公开在线数据进行预训练,这些数据是前代Llama-2的七倍。此外,Llama-3支持8K长文本,具有128K token的词汇量,这有助于实现更好的性能。其主要亮点还包括增强的推理和代码能力,以及训练效率比Llama-2高3倍。 Meta表示,Llama-3在多个关键的基准测试中性能优于业界先进同类模型,能够进行复杂的推理,更遵循指令,并能够可视化想法

2024-04-22

BEG模型原始论文:C-Pack: Packaged Resources To Advance General Chinese

BGE(北京智源人工智能研究院提出的embedding模型)可能是指北京智源人工智能研究院开发的一种新型的嵌入(embedding)技术或模型。在自然语言处理(NLP)中,嵌入技术是用来将词汇、句子或文档转换为高维空间中的向量表示,这些向量能够捕捉到词汇之间的语义关系。 由于您提供的信息有限,我将基于常见的嵌入模型的一般性质来续写: 北京智源人工智能研究院提出的BGE模型可能具有以下特点: 1. **高维表示**:BGE模型可能使用了一种先进的算法来将词汇映射到高维空间中,使得语义上相似的词汇在向量空间中距离较近。 2. **上下文感知**:该模型可能能够根据词汇的上下文环境动态调整其嵌入表示,以更好地捕捉词汇的多义性和上下文依赖性。 3. **预训练能力**:BGE可能在大规模语料库上进行了预训练,以学习语言的通用特征和模式。 4. **可扩展性**:模型设计可能考虑了可扩展性,允许在不同的语言或领域中进行定制和微调。 5. **计算效率**:为了适应不同的应用场景,BGE可能在设计时考虑了计算效率,以便于在资源受限的设备上运行。 6. **多语言支持**:该模型可能

2024-04-18

EetroMAE原论文

EetroMAE(Efficient Transformer-based Multi-Modal AutoEncoder)是一种基于Transformer的多模态自编码器模型,旨在有效地处理和融合来自不同模态的数据,例如文本、图像和音频。该模型采用了自编码器的架构,其中编码器和解码器都是基于Transformer的模型,可以同时处理多种类型的数据。 EetroMAE模型的主要特点包括: 多模态数据处理:EetroMAE可以同时处理来自不同模态的数据,例如文本、图像和音频。这使得它非常适合于需要同时分析多种类型数据的应用场景,例如多媒体内容理解、语音识别和图像描述生成等。 高效性:EetroMAE采用了高效的Transformer架构,可以快速地处理大量数据。同时,该模型还可以通过模型剪枝和量化等技术进一步减小模型大小和计算复杂度,使其适用于资源受限的环境。 自编码器架构:EetroMAE采用了自编码器的架构,其中编码器用于将输入数据编码为低维表示,解码器则用于将低维表示解码回原始数据。这种架构可以帮助模型学习到数据的有用特征,并减少噪声和冗余信息的影响。

2024-04-18

国内可以用的chatgpt网站汇总以及各个网站的优劣对比,速度对比,性能对比

ChatGPT 是一个人工智能聊天机器人程序,由 OpenAI 于 2022 年 11 月推出。该程序基于大型语言模型 GPT-3.5,使用指令微调(Instruction Tuning)和基于人类反馈的强化学习技术(RLHF)训练而成。 ChatGPT 的使用场景包括: 1. 文案写作:可以帮助写文章、邮件、简历等各种类型的文本。 2. 代码调试:可以帮助理解代码,找出错误并提供解决方案。 3. 机器翻译:可以将一种语言翻译成另一种语言。 4. 角色扮演:可以模拟任何角色,与用户进行对话。 5. 知识查询:可以回答大多数关于科学、技术、历史、文化等方面的问题。 ChatGPT 的优点包括: 1. 流畅性:可以生成流畅、自然的对话。 2. 知识面广:由于使用了大量的数据训练,因此具有广泛的知识面。 3. 可定制性:可以通过指令调整其行为。 ChatGPT 的局限性包括: 1. 时效性:由于训练数据只到 2023,因此对于此之后发生的事件可能不太了解。 2. 知识准确性:由于其生成内容基于统计概率,因此无法保证所有内容都是准确无误的。 3. 道德和伦理:可能会生成不道德或不符合伦理的内容

2024-04-17

sql server2008安装教程-带详细图片和每一步讲解

SQL Server 2008 是微软公司推出的一款关系型数据库管理系统,它是 SQL Server 数据库管理系统家族中的一个重要版本,于2008年发布。它提供了广泛的企业级数据管理功能,包括数据库引擎、分析服务、报表服务以及集成服务等。 以下是 SQL Server 2008 的一些关键特性: 1. **安全性**:SQL Server 2008 提供了高级的安全特性,如透明数据加密(TDE)、加密的备份、SQL Server Audit等,帮助用户保护他们的数据不受未授权访问和篡改。 2. **性能和可伸缩性**:它包含了许多性能增强特性,比如资源监控器、备份压缩、分区表和索引等,帮助用户优化性能并支持大规模的数据处理。 3. **高可用性**:通过数据库镜像、故障转移群集等功能,SQL Server 2008 可以提供高可用性的解决方案,减少系统故障时的停机时间。 4. **商业智能**:SQL Server 2008 集成了强大的商业智能工具,如 Analysis Services、Reporting Services 和 Integration Services,支持数据挖

2024-04-17

MySQL安装配置教程-带详细配置图片版本

【我真的不允许】还有人不懂MySQL!速看这篇教程! 啊啊啊啊啊啊啊!!你们知道吗?最近我在学习MySQL,简直打开了新世界的大门! 以前我对数据库一窍不通,但现在,我可以说:“MySQL,我来了!” 这篇教程超级详细,从安装到配置,每一步都有图解,简直小白友好到哭! 我跟着教程一步步操作,居然一次成功了!这不科学啊! 家人们,你们还在等什么?赶紧学起来,让我们一起成为MySQL大师吧! 这篇教程真的是宝藏,我压箱底推荐给你们! 记住,停止摆烂,从今天开始学习MySQL! #MySQL #数据库 #编程小白 #学习心得

2024-04-15

水仙花数问题代码,里面含有解读和解题思路

水仙花数题目解读,解题思路, 代码,代码解读,优化思路,优化代码。 水仙花数问题介绍 定义:水仙花数(有时也称为阿姆斯特朗数)是指一个n位数,它是其每个位上的数字的n次幂之和。 示例:153是一个三位的水仙花数,因为 $1^3 + 5^3 + 3^3 = 153$ 用途:水仙花数是数学中的一个有趣现象,常用于编程练习和教育中,以增强对数字操作和循环结构的理解。它们也是数学娱乐和探索数字属性的一个有趣领域。 水仙花数的检测 要检测一个数是否为水仙花数,可以遵循以下步骤: 确定位数:首先确定数字的位数n。 分解数字:将数字分解为其各个位上的数字。 计算幂和:计算每个位上数字的n次幂之和。 比较:如果这个幂和等于原始数字,则该数字是水仙花数。 Python代码实现

2024-04-11

Sora 关于大型视觉模型的背景、技术、局限性和机会的回顾

Sora,一款由OpenAI公司开发的文本转视频的AI模型,自发布以来便在科技界引起了广泛关注。这款模型的独特之处在于其能够根据文本描述快速生成长达一分钟的高质量视频内容,这不仅展示了AI在视频生成领域的进步,也标志着人工智能在理解和模拟现实世界方面迈出了重要一步。 Sora的推出,被视为AI领域的又一爆炸性新闻,其能力之强大,甚至被业内人士评价为“小型核爆炸”。这一技术的出现,不仅推动了生成式AI的发展,也为多个行业带来了潜在的颠覆性变革。从生物医学到化学物理研究,Sora的潜在应用场景广泛,其算力甚至有望帮助人类推演尚未掌握的自然规律。 Sora的核心技术在于其“世界模拟器”的概念,这是OpenAI首次提出并实践的理念。通过这一模型,AI不仅能够学习信息,更能灵活运用这些信息,模拟出一个接近真实的虚拟世界。Sora展现出的实力,让现有的其他AI模型望尘莫及,同时也引发了关于AI未来发展方向的讨论。 尽管Sora的潜力巨大,但也存在一些质疑的声音。有专家指出,像Sora这样仅根据文字提示生成逼真视频的能力,并不能完全代表模型理解了物理世界。

2024-04-11

chatgpt提示词工厂,专业,准确,方便的得到自己想要的答案

想让ChatGPT更好地为你服务吗?快来试试最新的提示词项目吧!这些精心设计的提示词可以帮助你更精准地引导AI,解锁更多有趣、实用的对话场景。无论是写故事、提问题还是日常交流,提示词项目都能助你一臂之力!赶快加入我们,体验AI助手的无限可能! ChatGPT提示词项目,是由OpenAI团队精心研发的一项创新技术。这个项目通过训练大规模语言模型,使其能够理解人类的语言,并根据提示词生成相应的回答。这意味着,无论是需要写一篇精彩的文章、解决一个复杂的问题,还是希望有一个有趣的对话伙伴,ChatGPT提示词项目都能为你提供卓越的体验。 这个项目的优势在于其强大的语言理解和生成能力。它不仅能够理解你的问题,还能够根据你的提示词,生成富有创意和逻辑性的回答。这无疑为我们的生活、工作和学习带来了极大的便利。想象一下,当你需要快速获取某个信息时,只需向ChatGPT提问,就能立刻得到满意的答案;当你需要写一篇文章或做一份报告时,ChatGPT提示词项目能帮你整理思路、生成大纲,甚至直接撰写文章。这将极大地提高你的工作效率,让你有更多的时间去做自己喜欢的事情。

2024-04-11

大模型微调经典论文Qlora

QLORA(Quantization-aware Low-Rank Adaptation)是一种高效的微调方法,专为大型语言模型(LLMs)设计,以减少在微调过程中所需的内存使用。这项技术允许在单个48GB GPU上微调具有650亿参数的模型,同时保持与16位微调相当的性能水平。 QLORA的核心创新包括4位NormalFloat(NF4)量化和双重量化技术,这些技术使得模型能够在保持性能的同时显著降低内存占用。此外,QLORA还引入了分页优化器(Paged Optimizers),以管理内存峰值,从而使得在单个GPU上微调大型模型成为可能。 通过QLORA,研究人员成功训练了名为Guanaco的模型系列,这些模型在Vicuna基准测试中表现出色,其中最大的模型达到了ChatGPT性能水平的99.3%,仅需在单个GPU上微调24小时即可达到这一水平。此外,QLORA的高效性使其能够在小型高质量数据集上实现最先进的结果,甚至在使用较小模型的情况下也能与以前的最先进模型相媲美。

2024-04-10

实体关系抽取经典方法tplinker

Tplinker(Token Pair Linking for Chinese NER)是一种用于中文命名实体识别(NER)的神经网络模型,由华为诺亚方舟实验室在2020年提出。Tplinker模型的特点在于它能够有效地识别中文文本中的实体,并且能够处理实体之间的重叠问题,这是中文NER任务中的一个挑战。 Tplinker模型的主要特点包括: 1. **实体边界感知**:Tplinker模型设计了一种边界感知的机制,能够准确地识别实体的起始和结束位置。这对于处理中文文本中实体的复杂性尤为重要。 2. **实体关系建模**:Tplinker模型不仅能够识别实体,还能够建模实体之间的关系。它通过一种基于图的方法来表示实体之间的潜在关系,从而提高了识别的准确性。 3. **重叠实体处理**:在中文文本中,实体之间可能会出现重叠的情况,例如一个实体可能是另一个实体的子字符串。Tplinker模型通过特殊的标注策略和模型设计来处理这种重叠,提高了模型的鲁棒性。 4. **全局和局部信息融合**:Tplinker模型通过融合全局和局部信息来提高实体识别的准确性。全局信息指的是整个句子或文本的上下文

2024-04-04

T5模型,经典模型原理

T5(Text-to-Text Transfer Transformer)是由Google Research在2020年提出的一种自然语言处理模型。T5模型的核心思想是将所有的NLP任务都转化为文本到文本的问题,即输入和输出都是文本的形式。这种统一的框架使得T5模型能够使用相同的模型架构、损失函数和训练过程来处理不同的NLP任务,从而简化了模型的训练和应用。 T5模型的主要特点包括: 1. **文本到文本的框架**:T5模型将所有的NLP任务,如文本分类、机器翻译、问答、摘要等,都重新格式化为文本到文本的任务。例如,对于文本分类任务,模型的输入是将文本和任务特定的前缀拼接在一起,输出是分类标签的文本表示。 2. **预训练和微调**:T5模型首先在大规模的文本语料库上进行预训练,学习通用的语言表示。然后,针对特定的NLP任务,使用任务特定的数据集进行微调。这种两阶段的训练策略使得T5模型能够在不同的任务上取得很好的性能。 3. **Transformer架构**:T5模型基于Transformer架构,这是一种基于自注意力机制的模型,能够有效地处理序列数据并捕捉长距离依赖。T5模型在T

2024-04-04

实体关系抽取的经典方式-casrel

CasRel(Cascade Relational Proposal Network)是一种用于关系抽取的神经网络模型,由复旦大学自然语言处理实验室在2019年提出。关系抽取是自然语言处理中的一个重要任务,旨在从文本中识别实体之间的语义关系。CasRel模型采用了一种级联的框架,将关系抽取分为两个步骤:实体识别和关系分类。 CasRel模型的主要特点包括: 1. **级联框架**:CasRel模型首先使用一个实体识别模块来检测文本中的所有实体,然后对于每一对实体,使用关系分类模块来判断它们之间是否存在某种特定的关系。这种级联的方式允许模型更加专注于实体之间的相互作用,而不是单独考虑实体或关系。 2. **三元组表示**:CasRel模型输出的是一种三元组的形式,即(头实体,关系,尾实体)。这种表示方式更加直观和符合自然语言中的关系描述。 3. **关系分类的注意力机制**:在关系分类阶段,CasRel模型使用了一种注意力机制来选择与特定关系相关的文本片段。这种机制可以帮助模型更好地理解实体之间的上下文关系。 4. **端到端训练**:CasRel模型可以端到端地进行训练,即实体识别和关

2024-04-04

软件测试中需要构建测试数据,项目内包含构建测试数据的原则和一些方法包

测试数据构建是软件开发过程中的一个关键环节,它涉及到创建用于测试软件系统的数据集合。这些数据需要能够覆盖各种可能的场景,以确保软件在不同条件下的稳定性和可靠性。一个良好的测试数据构建项目通常包含以下几个关键方面: 需求分析: 在开始构建测试数据之前,首先需要理解软件的需求和预期行为。 分析软件的功能点、业务流程以及可能的异常情况。 测试策略制定: 根据需求分析的结果,制定详细的测试计划和策略。 确定需要测试的不同场景,包括正常流程、边界条件、异常流程等。 数据模型设计: 设计测试数据的结构,确保它们能够模拟真实世界的使用情况。 包括输入数据、预期输出、数据库记录、文件内容等。 数据生成: 根据设计的数据模型,使用自动化工具或编写脚本来生成测试数据。 可以包括随机生成、基于模板生成、基于规则生成等方法。 数据验证: 对生成的测试数据进行验证,确保它们符合预期的格式和内容。 可以通过编写验证脚本来检查数据的正确性。

2024-04-03

chatgpt-本地部署项目

ChatGPT的本地部署项目通常指的是将GPT系列模型,如ChatGPT,放置在个人或组织的本地服务器上,以便在不需要联网的情况下使用其功能。这样的部署方式可以提供更好的数据隐私保护,减少对外部服务的依赖,并在一定程度上提高响应速度和可用性。以下是对ChatGPT本地部署项目的详细描述

2024-04-03

基于php的酒店管理系统

项目名称:基于PHP的酒店管理系统 项目概述: 基于PHP的酒店管理系统是一个Web应用程序,旨在帮助酒店业者高效地管理其业务运营,包括房间管理、预订管理、客户关系管理、财务报表等。该系统提供了一个用户友好的界面,使得酒店工作人员能够轻松处理日常任务,提升客户服务质量,同时优化酒店的业务流程。 项目功能: 房间管理:管理房间的类型、状态、价格和设施,包括添加新房间、编辑房间信息、设置房间的可用性等。 预订管理:创建、编辑和查看客户预订,包括预订时间、入住和退房日期、房间分配、客户信息和支付状态。 客户关系管理:维护客户信息,包括个人信息、预订历史、特殊需求和反馈,以提升客户满意度和忠诚度。

2024-04-03

基于SVM算法的DDos攻击识别

项目名称:基于SVM算法的DDoS攻击识别系统 项目概述: DDoS(分布式拒绝服务)攻击是一种常见的网络攻击手段,它通过占用目标系统的资源,使得合法用户无法获得服务。为了有效识别和防御DDoS攻击,本项目将利用支持向量机(SVM)算法开发一个DDoS攻击识别系统。该系统通过对网络流量进行实时监控和分析,判断是否存在DDoS攻击行为,从而及时采取措施,保障网络安全。

2024-04-03

基于java语言SSM框架,在线考试系统

在线考试系统是一种利用计算机网络技术实现在线答题、自动阅卷和成绩管理的系统。它可以帮助学校、企业或培训机构提高考试效率,降低管理成本。以下是使用Java语言和SSM(Spring、Spring MVC、MyBatis)框架开发的在线考试系统的项目描述。 项目名称:在线考试系统 项目概述 在线考试系统是一个基于B/S架构的Web应用程序,使用Java作为后端开发语言,结合SSM框架进行开发。该系统旨在提供一个方便、高效、公平的在线考试环境,支持多种题型,自动阅卷和成绩管理。

2024-04-03

javascript语言编写,医院管理系统

医院管理系统是一种用于管理医院运营的软件系统,它能够提高医院的工作效率,优化患者的就医体验。以下是使用JavaScript编写的医院管理系统项目介绍。 项目名称:智慧医院管理系统 项目概述 智慧医院管理系统是一个基于Web的应用程序,它使用JavaScript作为主要编程语言,结合HTML和CSS构建用户界面。该系统旨在帮助医院实现信息化管理,提升医疗服务质量,降低运营成本

2024-04-03

招聘系统,源码和项目描述,C#项目

招聘系统是一个用于帮助企业或组织进行招聘流程管理的软件系统。该系统可以简化招聘流程,提高招聘效率,减少人力成本。下面是一个简单的招聘系统项目描述和部分C#代码示例。 项目描述 招聘系统通常包括以下功能: 职位发布与管理:允许企业发布新的职位,编辑或删除现有职位。 简历管理:候选人可以上传简历,企业可以查看、筛选和管理简历。 招聘流程管理:包括安排面试、发送面试通知、跟踪面试状态等功能。 通知与沟通:系统可以通过邮件或短信通知候选人面试安排或其他相关信息。 统计分析:提供招聘数据的统计和分析,帮助企业了解招聘效果,优化招聘策略。

2024-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除