ziuno-CSDN博客

原创【ziuno】强化学习入门—超级马里奥

强化学习入门—超级马里奥对象抽取：马里奥、金币、板栗仔（蘑菇怪）术语智能体-Agent：马里奥状态（S或s）-State：当前游戏画面动作（A或a）-Action：智能体（马里奥）的，左、右、跳（简化）策略-Policy：根据状态，决定该采取的动作奖励（R或r）-Reward：执行动作后，游戏给予奖励，例如吃金币加分轨迹-Trajectory：包括每一步的状态、动作、奖励。智能体循环该过程：根据状态s，采取策略，执行动作a，获得奖励r，状态变化。策略-PolicyPol

2022-03-23 16:01:12 3615

原创 Inner Product (IP) Topk

faiss的检索功能确实强大，尤其是在使用HNSW或PQ等功能时，确实无法比拟（HNSW不适合在gpu上运行），但如果仅论IP内积计算，faiss未必有优势，可能反而不如使用cuda版本的torch计算速度快，且faiss的检索计算精度与torch略有差异，具体测试可以参考我之前的。（faiss-gpu面对过大corpus也无法存储完整，也需要分块，且搜索时需先加载成cpu再转移到gpu上，加载过程时间消耗大，直接在cpu上计算与加载到gpu后总计算时间相当，因此可以直接使用faiss-cpu）

2023-04-26 11:21:41 300

原创 faiss与torch的Topk

faiss与torch的topk

2023-04-22 15:37:48 304

原创 FirstP&LongP

Truncates input to be shorter than about 512 tokens.Process long documents directly.

2023-03-22 10:13:12 92

转载【转载】在Linux服务器间快速传输大型文件

原文链接

2023-03-21 15:25:27 210

原创 DistributedDataParallel的eval与save

（虽然训练结束后不同进程上的模型参数应该是相同的，eval过程理论上可以拆分到几个进程上并行再合并以提速，但实际会导致，与加载存储的模型再eval的结果不一致，即模型参数存在差异）同样的，eval时也只能用相应local_rank为0的模型（与save过程的local_rank保持一致即可），否则将会导致结果不同，不可复现问题。DDP的save通常只能存储一个进程的模型，例如只存储local_rank为0的模型。torch的DistributedDataParallel（简称DDP）

2022-10-14 10:06:08 275

原创 transformers模型加载与seed随机状态

torch随机状态恢复不一致的问题

2022-09-18 15:50:14 819

原创 Python入门

Python入门

2022-06-22 10:21:22 230

原创 reinforcement_q_learning—解读

reinforcement_q_learning—解读原理讲解gymReplayMemoryDQNselect_action(state)optimize_model注意：Torch官网reinforcement_q_learning源码下文中不提供源码，需一边阅读一边对照源码，仅针对部分必要源码变量进行分析原理讲解如果不了解大致符号和理论定义，参考强化学习入门—超级马里奥简单来说，定义一个模型，输入是整个画面，输出是每个动作带来的未来价值（维度与动作数相同）计算两个神经网络对象，

2022-04-25 15:55:04 1237 1

转载【转载】Ubuntu20.04配置开机自启动脚本

【转载】Ubuntu20.04配置开机自启动脚本https://blog.51cto.com/u_3436241/5090917

2022-04-11 19:52:01 1319

原创 PyLucene安装

PyLucene安装（系统自带与envs中Python2&3）

2022-03-03 16:36:52 1011 1

原创 spaCy & pytorch-lightning 报错

注意在pl.LightningModule中，不可以使用spaCy进行分词等操作，否则会报错1. 在forward过程中使用...File "spacy/pipeline/trainable_pipe.pyx", line 75, in spacy.pipeline.trainable_pipe.TrainablePipe.pipe...可能由于pl框架内自动对模型内所有对象进行了状态转换，使其全部尽可能变为可训练对象，同样的，使原本的Pipe也转换为TrainablePipe，会报错，其中有

2021-11-09 21:08:12 1352

原创 Neo4j-修改存储位置

修改Neo4j数据存储位置由于mac本存储有限，需要存储大型图数据，则考虑将数据存储到移动硬盘中，仅数据转移到移动硬盘中，而其他信息仍在本中，即只要连上移动硬盘就能读取数据步骤创建一个图GraphOpen Folder，得到数据库所在位置，installation-……文件夹文件夹中有一个data文件夹，将data文件夹copy到自定义的位置（比如移动硬盘），我是复制到了/Volumes/WinBackup里（WinBackup是移动硬盘里我用来存windows备份的分区），Volumes前

2021-07-29 10:14:34 2003

原创论文笔记—HopRetriever—AAAI

PaperHopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions.DefinationSymbolFunctionRetriever依据检索模块Reader答案抽取模块qqq问题KKK知识Dp=D_p=Dp=Retriever(q,K)(q, K)(q,K)用于回答问题qqq的多个文档a=a=a=Reader(q,Dq)(q,D_q)(q,Dq)答

2021-05-26 13:24:35 204

原创 AllenNLP—笔记—json

AllenNLP—json&命令行&自定义模型—对应关系dirpackage_name_fatherpackage_name_child__init__.pymodel.pyjsonjson{ "type": "model-name"}model.pyfrom allennlp import [email protected]("model-name")class ModelClass(AllenNLPCl

2021-05-15 14:32:47 164

原创自己实现LSTM—报错思考—小记

解决方法（任选一个）implemented using pytorch模型继承Module，每次输入LSTM一个词向量，生成的state信息用list存储，结果取最后[-1]，缺点是效率较低，需要存储过多无用信息（即不覆盖之前生成的hidden和cell）模型继承Function，定义一个层，把LSTM看作一个函数，forward中累计保存对w和x等变量的梯度，可以避免存储无用的信息，backward中直接返回相应的梯度（直接实现函数Function，手动求导，可以无视是否覆盖已生成的变量）

2021-05-15 11:09:23 211

原创 AllenNLP—笔记—TokenEmbedder

TokenEmbedder—自定义Embedderclass GloVeEmbedding(TokenEmbedder):function与Embedding用法相同，代码是完全照着Embedding写的word vector将word分成单个char，char vector=sum(vector)/counter(char)：词向量和/字符出现次数原Embedding实现中，权重是随机的，对于GloVe中有的词，才替换成GloVe中的词向量，对于没有的词，还是原来的随机的GloVeEmbed

2021-05-15 10:54:37 365

原创 NLP-问答-榜单

有维护榜单榜top1 模型em(exact match)f1accmrrscoreGrailQAOverallReTraCk58.13665.285-Compositional GeneralizationReTraCk61.49970.911-Zero-shot GeneralizationArcaneQ49.96458.844PubMedQA-Baseline Model52.7268.08

2021-04-23 17:06:33 294

原创 NLP-2021-调研

NLP-调研会议EACL7^{7}7: 2020/10/7ACL1−A^{1-A}1−A: 2021/1/25ICML3−A^{3-A}3−A: 2021/1/28SIGIRA^{A}A: 2021/1/28IJCAI10−A^{10-A}10−A: 2021/1/13EMNLP2−B^{2-B}2−B: 2021/5/10NeurIPS2−A^{2-A}2−A: 2021/5/19linkGoogleScholarRank−CCFRank^{GoogleScholarRank-CC

2021-04-20 14:23:38 197 1

原创 NLPCamp-SpellCorrection

SpellCorrection# 词典库vocab = set([line.rstrip() for line in open('vocab.txt')])# 需要生成所有候选集合def generate_candidates(word): """ word: 给定的输入（错误的输入）返回所有(valid)候选集合 """ # 生成编辑距离为...

2020-04-21 11:21:46 189

原创 NLPCamp-Project1

Project1Part 1: 搭建一个分词工具Part 1.1 基于枚举方法来搭建中文分词工具此项目需要的数据：综合类中文词库.xlsx：包含了中文词，当做词典来用以变量的方式提供了部分unigram概率 word_prob举个例子：给定词典=[我们学习人工智能人工智能未来是]，另外我们给定unigram概率：p(我们)=0.25, p(学习)=0.15, ...

2020-04-14 15:13:31 635

原创 NLP模型笔记 — 分布式表示

NLP模型笔记 — 分布式表示 [总结]概念名称分布式表示别名Distributed representation介绍若干元素的连续表现形式，将词的语义分布式地存储在各个维度中，与之相反的是独热向量。原理非分布式表示图形水平矩形垂直矩形水平椭圆垂直椭圆水平矩形1000垂直矩形0100水平椭圆0...

2020-03-08 19:52:50 3913

原创《机器学习》阅读笔记（五）

《机器学习》阅读笔记（五）5 神经网络5.1 神经元模型神经网络(neural networks)：由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应对比描述生物神经网络每个神经元与其他神经元相连，当它“兴奋”时，就会向相连的神经元发送化学物质，从而改变这些神经元内的电位；如果某神经元的电位超过了一个“阈值...

2020-03-08 09:01:08 469

原创《机器学习》阅读笔记（三）

《机器学习》阅读笔记（三）3 线性模型(linear model)3.1 基本形式ddd：属性个数x=(x1;x2;… ;xd)\boldsymbol{x}=(x_1;x_2;\dots;x_d)x=(x1;x2;…;xd)：xix_ixi是x\boldsymbol{x}x在第iii个属性上的取值线性模型f(x)=w1x1+w2x2+⋯+wdxd...

2020-03-08 09:00:00 230

原创《机器学习》阅读笔记（二）

《机器学习》阅读笔记（二）2 模型评估与选择2.1 经验误差与过拟合术语en描述错误率error rate分类错误的样本数占样本总数的比例（mmm个样本中有aaa个样本分类错误，则错误率E=a/mE=a/mE=a/m）精度accuracy精度=1-错误率（1−a/m1-a/m1−a/m）误差error学习器的实际预测输出与样本的真实输出之间的差...

2020-03-08 08:59:11 407 1

原创 NLP模型笔记 — 独热编码

NLP模型笔记 — 独热编码 [总结]P.S.

2020-03-07 22:52:04 609

原创 NLP模型笔记 — 总结

NLP模型笔记目录独热编码分布式表示深度学习基础语言模型HMMMLPSkipGramCBOW层次表示RNNNNLMDensity EstimationNADEGRULSTMBI-LSTMDeep BI-LSTMSeq2SeqELMoDAEAutoEncoderAttentionSelf-AttentionTransformerBERTXLN...

2020-03-07 16:26:00 297

原创 BERT-中文-Classifier-实战

BERT-中文-Classifier-实战目录[单标签]bert(google-research)pytorch-pretrained-bert(pypi)transformers(huggingface)[多标签]pytorch-pretrained-bert(pypi)ENVP.S.运行问题框架问题总结结果汇总参考单标签[TOP]t...

2019-12-04 17:32:42 1457 3

原创《吴恩达机器学习》笔记——12 机器学习系统设计

《吴恩达机器学习》笔记——12 机器学习系统设计1 确定执行的优先级构建一个垃圾邮件分类器监督学习输入输出符号xxxyyy描述email的特征-选择选择100个词来表明是否为垃圾邮件x∈R100x\in\mathbb{R}^{100}x∈R100xj={1若单词j出现在邮件中0其他x_j=\left\{\begin{matrix}1 &若...

2019-11-17 15:38:41 112

原创《吴恩达机器学习》笔记——11 应用机器学习的建议

《吴恩达机器学习》笔记——11 应用机器学习的建议1 决定下一步做什么问题算法改进产生较大误差1. 使用更多训练样本2. 尝试选用更少特征3. 获取更多特征4. 增加多项式特征5. 增大或减小λ\lambdaλ2 模型评估与选择评估单个模型多个模型选择数据集训练集(70%)测试集(30%)训练集(60%)交叉验证集(20%)测试集(20...

2019-11-16 20:30:43 132

原创《吴恩达机器学习》笔记——10 神经网络参数的反向传播算法

《吴恩达机器学习》笔记——10 神经网络参数的反向传播算法1 代价函数参数表达训练集{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))}\{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),\dots,(x^{(m)},y^{(m)})\}{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))}...

2019-11-16 16:01:41 114

原创《吴恩达机器学习》笔记——9 神经网络学习

《吴恩达机器学习》笔记——9 神经网络学习1 非线性假设

2019-11-15 15:53:17 106

原创《吴恩达机器学习》笔记——8 正则化

《吴恩达机器学习》笔记——8 正则化1 过拟合问题解决过拟合问题具体减少选取变量的数量人为选择保留的特征模型选择算法正则化保留所有特征，但减小θj\theta_jθj的数量级或值2 代价函数正则化代价函数J(θ)=12m[∑i=1m(hθ(x(i))−y(i))2+λ∑j=1nθj2]J(\theta)=\frac{1}{2m}\left[\s...

2019-11-14 15:04:09 103

原创《吴恩达机器学习》笔记——7 Logistic回归

《吴恩达机器学习》笔记——7 Logistic回归1 分类分类yyy负类0正类1若hθ(x)h_\theta(x)hθ(x)预测yyy⩾0.5\geqslant0.5⩾0.51<0.5<0.5<0.502 假设陈述-表达式hθ(x)h_\theta(x)hθ(x)g(θTx)...

2019-11-14 10:53:13 114

原创《吴恩达机器学习》笔记——5 多变量线性回归

《吴恩达机器学习》笔记——5 多变量线性回归1 多功能符号定义nnn特征量的数目x(i)=[x1(i);x2(i);… ;xn(i)]x^{(i)}=[x^{(i)}_1;x^{(i)}_2;\dots;x^{(i)}_n]x(i)=[x1(i);x2(i);…;xn(i)]第iii个训练样本的输入特征值xj(i)x^{(i)}_jxj(i)第ii...

2019-11-13 14:09:00 163

原创 Neo4j-CQL W3C 笔记

Neo4j - CQL简介命令CQL命令含义用法CREATE创建创建节点，关系和MATCH匹配检索有关节点，关系和属性数据RETURN返回返回查询结果WHERE哪里提供条件过滤检索数据DELETE删除删除节点和关系REMOVE移除删除节点和关系的属性ORDER BY排序排序检索数据SET组添加或更...

2019-11-01 19:40:26 201

原创《吴恩达机器学习》笔记——2 单变量线性回归

吴恩达机器学习——2 单变量线性回归1 模型描述符号定义mmm训练样本数量xxx”输入”变量/特征yyy“输出”变量/“目标”变量(x,y)(x,y)(x,y)一个训练样本(x(i),y(i))(x^{(i)},y^{(i)})(x(i),y(i))第iii个训练样本hhh假设函数模型hθ(x)=θ0+θ1xh_\t...

2019-10-17 14:48:12 204

原创《机器学习》阅读笔记（一）

《机器学习》阅读笔记2019.9.61 绪论1.2 基本术语术语en描述数据集data set记录的集合（每条记录是关于一个事件或对象的描述，称为一个“示例”(instance)或“样本”(sample)）属性/特征attribute/feature反映事件或对象在某方面的表现或性质的事项属性值attribute value属性上的取值属...

2019-09-07 12:58:49 177

原创基于Tensorflow的无向图二维顶点坐标生成

基于Tensorflow的无向图二维顶点坐标生成基于Tensorflow的无向图二维顶点坐标生成无向图可视化原理原始数据的处理神经网络设计函数使用Version基于Tensorflow的无向图二维顶点坐标生成本文将介绍如何导入并处理无向图和设计Tensorflow神经层各项参数，仅使用训练过程，最终导出训练的中间结果，即无向图中所有顶点的二维坐标点(x, y)。无向图可视化目前，实现无向图...

2018-12-24 22:23:16 893

空空如也

空空如也