人工智能小a-CSDN博客

原创 tensorflow加载大型词嵌入模型（＞2G）

tensorflow加载词嵌入模型

2022-07-18 17:45:54 257 1

Q-learning算法实现from random import randomfrom gym import Envimport gymfrom gridworld import *class Agent(): def __init__(self,env: Env): self.env = env #个体持有环境的引用 self.Q = {} #个体维护一张行为价值表 self.state = None #个体当前的观测 d

2022-01-24 13:42:25 270

原创 Sarsa(lambda)算法实现

Sarsa(lambda)算法实现

2022-01-24 13:39:20 334

原创 Sarsa算法实现

Sarsa算法from random import randomfrom gym import Envimport gymfrom gridworld import *class Agent(): def __init__(self,env: Env): self.env = env #个体持有环境的引用 self.Q = {} #个体维护一张行为价值表 self.state = None #个体当前的观测 def perf

2022-01-24 13:35:27 223

原创强化学习（格子世界）

格子世界程序（策略评估、策略迭代、价值迭代）import ramdomS = [i for i in range(16)] //定义状态空间A = ["n","e","s","w"] //定义动作空间ds_actions = {"n":-4,"e":1,"s":4,"w":-1}V = [0 for _ in range(16)] //定义初始价值def dynamics(s,a): s_prime = s if (s<=3 and a=="n") or (s>=

2021-11-28 09:29:36 916

原创神经网络前向反向传播

神经网络前向反向传播前向传播输入： a[L−1]a^{[L-1]}a[L−1]输出：a[L]a^[L]a[L]、z[L]z^{[L]}z[L]传播过程：Z[L]=W[L]∗A[L−1]+b[L]Z^{[L]}=W^{[L]}*A^{[L-1]}+b^{[L]}Z[L]=W[L]∗A[L−1]+b[L]A[L]=g[L](Z[L])A^{[L]}=g^{[L]}(Z^{[L]})A[L]=g[L](Z[L])反向传播输入：da[1]da^{[1]}da[1]输出：da[L−1]da

2021-11-23 09:09:14 510

原创神经网络中的矩阵维度

多层神经网络单样本神经网络第一层：Z[1]=W[1]∗X+b[1]Z^{[1]}=W^{[1]}*X+b^{[1]}Z[1]=W[1]∗X+b[1]各矩阵维度：Z[1]:(n[1],1):(3,1)X:(n[0],1):(2,1)W[1]:(n[1],n[0]):(3,2)b[1]:(n[1],1):(3,1)Z^{[1]}: (n^{[1]},1):(3,1)\\X:(n^{[0]},1):(2,1)\\W^{[1]}:(n^{[1]},n^{[0]}):(3,2)\\b^{[1

2021-11-22 10:07:25 1183

原创神经网络向量化

神经网络向量化多层神经网络是由单层神经网络叠加而成的，所以形成了成的概念，常见的多层神经网络由如下结构：输入层（Input Layer）：由众多神经元（Neuron）组成，用来接收输入信息，输入的信息成为输入向量输出层（Output Layer）：信息通过神经元链接传输、分析、权衡，形成输出结果，输出的信息称为输出向量隐藏层（Hidden Layer）：简称：“隐层”，是输入层和输出层之间众多神经元和链接组成的各层，隐层可以有一层或者多层，隐层的结点（神经元）数目不定，数目越多神经网络的非线性越显

2021-11-20 17:09:18 1334

原创模块化搭建神经网络（Keras）

模块化搭建神经网络（keras）搭建步骤import ：导入相关模块train、test：指定训练数据集的输入特征x_train和训练集的输入标签y_train，测试集的输入特征x_test和测试集的输入标签y_testmodel = tf.keras.models.Sequential：搭建网络结构，定义前向传播model.compile：配置训练参数，定义优化器、损失函数、评测指标等model.fit：执行训练过程，输入训练集和测试集的输入特征及标签，定义Batch值和数据集训练

2021-11-10 09:11:10 401

原创 tensorflow学习记录

tensorflow张量的创建创建张量//格式tf.constant(张量内容， dtype=数据类型(可选))//示例tf.constant([1,5], dtype=tf.int64)数据转换//格式tf.convert_to_tensor(数据名, dtype=数据类型(可选))//示例a = np.arange(0, 5)b =tf.convert_to_tensor(a, dtype=tf.int64)特殊张量//创建全0张量tf.zeros(维度)//创建全

2021-11-02 09:22:58 74

原创神经网络参数优化器

神经网络参数优化器符号及含义w：待优化参数loss：损失函数lr：学习率batch：一次迭代数量的多少t：当前迭代的总系数迭代步骤(1) 计算 t 时刻损失函数关于当前参数的梯度：gtg_tgt

2021-10-31 21:41:04 433

原创机器学习模型评价指标（准确率、精度、召回率）

模型评价指标（准确率、精度、召回率）机器学习中我们常常使用准确率、精度、召回率三大指标评价一个模型训练的好坏，那么这三大参数分别代表什么意义？在介绍评价指标前，需要先明确几个计算指标：真正例（True Positive，TP）：模型将测试样本中True类型的样本预测为True的样本数量假负例（False Negative，FN）：模型将测试样本中True类型的样本预测为False的样本数量假正例（False Positive，FP）：模型将测试样本中False类型的样本预测为True的样本数量

2021-10-19 21:57:41 6920

原创神经网络学习记录（模型保存、准确率计算、断点续训）

神经网络学习模型保存当我们搭建好神经网络的学习过程，传入训练数据进行训练，那么如何将训练完成的模型保存以备之后预测时直接使用呢？因此，在神经网络的训练框架中我们还需要定义模型的保存模块，使用tensorflow实现程序如下：saver = tf.train.Saaver()with tf.Session() as sess: for i in range(STEPS): if i%轮数 == 0: //定义一定轮数保存模型 saver.save(sess, os.path.join(MO

2021-10-12 10:42:19 1148

原创神经网络学习记录（学习率、滑动平均、正则化）

神经网络优化学习率(learning_rate)学习率表示的是神经网络参数更新的幅度：Wn+1=Wn−learning_rate∗▽Wn+1 = Wn - learning\_rate*▽Wn+1=Wn−learning_rate∗▽其中，Wn+1表示更新后的参数，Wn表示当前参数，learning_rate即定义的学习率值，▽表示损失函数的梯度（导数）。学习率在某种程度上代表了神经网络训练中信息学习的速度，学习率如果定义过大则神经网络将振荡不收敛，过小则收敛速度慢，如下图所示：在实际神经

2021-10-12 10:29:54 806

原创模块化搭建神经网络

搭建神经网络（构造数据集、前向传播、反向传播）前向传播前向传播搭建神经网络，设计整体网络结构，创建forward.py：//定义神经网络结构def forward(x,regularizer): //传入参数：x:输入，regularizer:正则化权重 w= //定义权重参数 b= //定义偏置参数 y= //定义输出 return y//初始化权重参数def get_weight(shape,regulerizer): w = tf.Variable() tf.add_to_co

2021-10-07 09:32:43 275

原创搭建神经网络(Tensorflow)

搭建神经网络准备准备阶段包括常量定义、构建输入数据集等。import tensorflow as tfimport numpy as npBATCH_SIZE = 8seed = 23455//构造输入数据rng = np.random.RandomState(seed)X = rng.rand(32,2)Y = [[int(x0 + x1 < 1)] for (x0,x1) in X]print(X)print(Y)前向传播定义输入、参数和输出等。//定义神经网络的

2021-10-05 15:14:32 160

原创 BERT模型实体关系抽取实战(医学领域)

BERT实体关系抽取序言项目参考了BioBERT、https://github.com/yuanxiaosc/Entity-Relation-Extraction两个BERT应用模型，BioBERT 是一种生物医学语言表示模型，专为生物医学命名实体识别、关系提取、问答等生物医学文本挖掘任务而设计。由于本项目是BERT在生物医学领域的研究与应用，因此使用了BioBERT训练好的模型作为初始模型，在Entity-Relation-Extraction项目上进行微调实现实体关系抽取。项目部署环境要求Py

2021-09-27 14:11:29 10554 10

原创神经网络学习记录（张量）

神经网络知识点记录张量定义：张量（Tensor）是一个定义在一些向量空间和一些对偶空间的笛卡尔积上的多重线性映射，其坐标是|n|维空间内，有|n|个分量的一种量，其中每个分量都是坐标的函数，而在坐标变换时，这些分量也依照某些规则作线性变换。r 称为该张量的秩或阶（与矩阵的秩和阶均无关系）。通俗理解：张量实际上是不同维度数组的总称，如：0阶张量表示的是一个标量，1阶张量表示的是一个向量，2阶张量表示的是一个矩阵等。标量（Scalar）：标量是一个独立存在的数，比如在线性代数中一个实数 5 就

2021-09-26 13:11:32 176

原创神经网络学习记录（深度学习）

神经网络学习人工神经网络人工神经网络（Artificial Neural Networks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（Connection Model），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。神经元的概念神经元是神经网络中最基本的结构，也可以说是神经网络的基本单元，它的设计灵感完全来源于生物学上神经元的信息传播机制。我们学过生物的同学都知道，神

2021-09-20 14:34:27 410

原创一文读懂BERT模型（程序篇）

Google Bert模型程序精讲环境与安装环境要求Google Bert模型下载地址：https://github.com/google-research/bert环境要求：TensorFlow 1.11.0和、Python2 和或Python3（TensorFlow 1.12.0、python3.6实测可运行）项目部署首先，在github上下载相关文件，包括：bert程序的压缩包、预训练模型（根据实际需求下载相应的预训练模型，本文使用模型：）、相关数据集（根据实际需求下载对应任务的数据集，本

2021-09-19 11:41:45 1337

原创一文读懂BERT模型（理论篇）

BERT模型理论解读序言BERT（Bidirectional Encoder Representations from Transformers）是一个语言表达模型（language representation model）。在《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》一文中被提出，它是Transformer模型中的encoder部分，通过pretraining和finetunin

2021-09-17 18:43:39 1586

原创 Transformer模型详细解读（理论篇）

Transformer模型架构梳理《Attention is all you need》是Google提出的一篇关于Attention应用实践的论文，论文中提出了基于Attention机制的Transformer模型，以及大量使用了多头注意力机制（Multi-Head）,该模型已被广泛运用在机器翻译，问答系统，实体识别等NLP相关领域。Transformer模型总体框架如下图所示：Input Embedding...

2021-09-08 16:22:02 5576 2

a_123zxy的博客