HHVic-CSDN博客

原创 Windows环境下VSCode安装PlatformIO Cero报错ERROR: HTTP error 403 while getting

VSCode: 1.81.0PIO IDE: v3.3.1System: Windows_NT, 10.0.19044, x64%23 Exception判断问题尝试访问https://pypi.tuna.tsinghua.edu.cn/simple/platformio/成功点击文件后报错如下：Pip文件文件路径：C:\Users\（你的用户名）\AppData\Roaming\pip文件名字 pip.ini (如果没有可以自行创建)

2023-08-04 15:53:07 2641 2

原创一步步读懂Pytorch Chatbot Tutorial代码(五) - 定义模型

文章目录自述有用的工具代码出处目录头更大了代码及说明 Define ModelsEncoderEncoderforwardDecoderdot_socreforward自述我是编程小白，别看注册时间长，但从事的不是coding工作，为了学AI才开始自学Python。平时就是照着书上敲敲代码，并没有深刻理解。现在想要研究chatbot了，才发现自己的coding水平急需加强，所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的，只是把自己不理解的写出来，将来也可以作为资料备查。最后还要重申一

2021-12-03 22:04:55 901

原创一步步读懂Pytorch Chatbot Tutorial代码(四) - 为模型准备数据

文章目录自述有用的工具代码出处目录头大代码 Prepare Data for Models参数追踪inputVar自述我是编程小白，别看注册时间长，但从事的不是coding工作，为了学AI才开始自学Python。平时就是照着书上敲敲代码，并没有深刻理解。现在想要研究chatbot了，才发现自己的coding水平急需加强，所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的，只是把自己不理解的写出来，将来也可以作为资料备查。最后还要重申一下，我没有系统学过编程，写这个系列就是想突破自己，各位

2021-12-03 11:20:43 1471

原创一步步读懂Pytorch Chatbot Tutorial代码(三) - 创建字典

文章目录自述有用的工具代码出处目录代码 Load and trim data类 class_ _ init _ _ 初始化实例变量for word in sentence.split(' ')自述我是编程小白，别看注册时间长，但从事的不是coding工作，为了学AI才开始自学Python。平时就是照着书上敲敲代码，并没有深刻理解。现在想要研究chatbot了，才发现自己的coding水平急需加强，所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的，只是把自己不理解的写出来，将来也可以作为资

2021-11-25 21:13:26 1546

原创一步步读懂Pytorch Chatbot Tutorial代码(二) - 数据处理

文章目录自述代码出处目录代码 Create formatted data file （为了方便理解，把代码的顺序略微改一下）1. `loadLines` 将文件的每一行拆分为一个字段字典（lineID、characterID、movieID、character、text）encoding='iso-8859-1'values的值：（删掉‘+++$+++’）enumerate修改字典lines[lineObj['lineID']] = lineObj2. `loadConversationsloadLine

2021-11-20 15:45:21 981

原创 NLP十大Baseline论文简述(十) - sgm

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要4. 研究意义前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：SGM: Sequence Generation Model for Multi-Label Classification使用序列生成模型做多标签文本分类2. 背景介绍多标签文本分类是自然语言处理的重要任务，多标签文本分类可以用到文本分类，推荐以及信息检索中。但是目前的多标签文本分类模型存在两个问题：没

2021-11-16 11:25:48 1024

原创一步步读懂Pytorch Chatbot Tutorial代码(一) - 加载和预处理数据

文章目录自述代码来源1. Preparations1）from _ _ future _ _ import2. Load & Preprocess Data1) os.path.join函数2）def自定义函数3）with open as 读写文件自述我是编程小白，别看注册时间长，但从事的不是coding工作，为了学AI才开始自学Python。平时就是照着书上敲敲代码，并没有深刻理解。现在想要研究chatbot了，才发现自己的coding水平急需加强，所以开这个系列记录自己一行行扣代

2021-11-16 11:19:55 1810

原创 NLP十大Baseline论文简述(九) - han_attention

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Hierarchical Attention Networks for Document Classification使用层次注意力网络做文档分类2. 背景介绍相对于传统的统计机器翻译，基于Encoder-Decoder机制的神经机器翻译有很多优点。但是之前关于Encoder-Decoder的方法都是使用Encode

2021-11-02 10:46:15 609

原创局域网服务器上配置Jupyter notebook (简化实用版本)

文章目录起因1. 创建notebook configuration file2. 设置登陆密码 `jupyter notebook password`3. 修改notbook configuration file起因众所周知，我自己建了双GPU的服务器，也装了docker，本来跑跑玩具模型都没啥问题，结果在一次比赛中，train数据的时候jupyter notebook就提示died。一时查不到原因，就想着是不是docker都问题，所以打算在服务器上直接装Anconda跑Jupyter Notebook

2021-10-30 20:17:09 291

原创如何修改docker容器的shmsize共享内存大小

文章目录报错原因解决方法：报错原因在跑train时提示如下RuntimeError: DataLoader worker (pid 6209) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.解决方法：停止docker// 停止docker服务s

2021-10-29 15:47:24 740

原创 AttributeError: module ‘enum‘ has no attribute ‘IntFlag‘

文章目录报错原因报错解决报错原因由于Python3.6，安装pip install grad-cam报错如下AttributeError: module 'enum' has no attribute 'IntFlag'报错解决卸载enum34库pip uninstall enum34

2021-10-29 14:36:45 82

原创 Error response from daemon: OCI runtime create failed: container_linux.go:380

文章目录报错原因报错如下：报错解决方法：删除新版内核自建多GPU服务器可以参考 https://blog.csdn.net/landian0531/article/details/120242839报错原因意外停电导致Ubuntu服务器重启，docker里面的容器无法通过docker ps -aq | xargs -I {} docker start {}命令启动报错如下：gpu@gpu-workstation:~$ docker ps -aq | xargs -I {} docker star

2021-10-29 09:58:57 1743

原创 NLP十大Baseline论文简述(八) - attention_nmt

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要4. 研究成果及意义前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Neural Machine Translation by Jointly Learning to Align and Translate联合学习对齐和翻译的神经机器翻译模型2. 背景介绍相对于传统的统计机器翻译，基于Encoder-Decoder机制的神经机器翻译有很多优点。但是之前关于Enco

2021-10-21 16:15:50 250

原创 NLP十大Baseline论文简述(七) - deep_nmt

文章目录前言：1. Paper：2. BlEU介绍3. 背景介绍4. 论文摘要5. 研究意义前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Sequence to Sequence Learning with Neural Networks使用神经网络来做序列到序列的学习2. BlEU介绍如何评价机器翻译结果的好坏人工评价：通过人主观对翻译进行打分优点：准确缺点：速度慢，价格贵机器自动评价：通过设置指标对机器翻译结果

2021-10-18 13:26:06 249

原创 NLP十大Baseline论文简述(六) -fasttext

文章目录前言：1. Paper：2. 动机介绍3. 背景介绍4. 论文摘要5. 研究成果6. 研究意义7. Fasttext模型8. Fasttext模型优缺点9. 论文总结前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Bag of Tricks for Efficient Text Classification对于高效文本分类的一揽子技巧2. 动机介绍结合深度学习的文本分类模型和机器学习的文本分类模型的优点，达到：速度

2021-10-13 16:43:23 301

原创 Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same

常规解决方案从报错问题描述中可以找到错误原因输入的数据类型为torch.cuda.FloatTensor，说明输入数据在GPU中模型参数的数据类型为torch.FloatTensor，说明模型还在CPU问题原因搞清楚了，模型没加载到CPU，在代码中加一行语句就可以了model = model.cuda()model = model.to('cuda')model.cuda()model.to('cuda')上面四行任选一问题是加在哪里一般在summary模型的时候提示错误，所以可以

2021-10-13 09:26:36 488

原创 NLP十大Baseline论文简述(五) - chartextcnn

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要4. 研究成果4. 研究意义5. CharTextCNN模型优缺点6. 论文总结前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Character-Level Convolutional Networks for Text Classification使用字符级别的卷积神经网络来做文本分类任务2. 背景介绍文本分类是自然语言处理的基础任务之一，目前大多数文本分类任务

2021-10-12 15:38:54 211

原创 NLP十大Baseline论文简述(四) -textcnn

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要4. 研究成果5. 研究意义前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Convolutional Neural Networks for Sentence Classification基于卷积神经网络的句子分类2. 背景介绍深度学习，词向量和卷积神经网络的发展3. 论文摘要使用简单的CNN模型在预训练词向量基础上进行微调就可以在文本分类任务上得到很好的结果

2021-10-08 15:38:15 298

原创 Ubuntu 查看系统（CPU，内存）占用工具htop

sudo apt install htop直接运行htop即可

2021-10-01 00:00:02 529

原创 Ubuntu 报错 make: c++: Command not found

尝试安装fasttext的时候，输入make命令后报错c++ -pthread -std=c++11 -march=native -O3 -funroll-loops -DNDEBUG -c src/args.ccmake: c++: Command not foundmake: *** [Makefile:30: args.o] Error 127运行以下命令解决：sudo apt-get install build-essential...

2021-09-30 23:46:30 1071

原创 jieba中文分词库的使用

文章目录“结巴”中文分词：Python 中文分词组件四种分词模式：算法主要功能代码示例Paddle模式全模式和精确模式：通过Viterbi算法新词识别搜索引擎模式自定义字典调整词典更多内容参考[Github](https://github.com/fxsjy/jieba)“结巴”中文分词：Python 中文分词组件四种分词模式：精确模式，试图将句子最精确地切开，适合文本分析；全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；搜索引擎模式，在精确模式的基础上，对长词再

2021-09-29 21:58:11 235

原创 NLP十大Baseline论文简述(三) - C2W

文章目录前言：1. Paper：2. 背景介绍3. 论文摘要4. C2W模型前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：Finding function in form: Compositional character models for open vocabulary word representation从字符中生成嵌入：用于开放词表示的组合字符模型2. 背景介绍词向量的学习对于自然语言处理的应用非常重要，词向量可

2021-09-26 22:03:29 314

原创 NLP十大Baseline论文简述(二) - GloVe

文章目录前言：1. Paper：2.论文摘要3.研究成果4.GloVe模型前言：如果需要对基础概念不了解，可以参考这里。我汇总了论文中涉及的大部分概念，以便更好的理解论文。1. Paper：GloVe: Global Vectors for Word Representation 基于全局信息的单词向量表示2.论文摘要Recent methods for learning vector spacerepresentations of words have succeededin ca

2021-09-23 23:06:04 370

原创 NLP十大Baseline论文简述(一) - Word2vec

文章目录前言：1. Paper：2.论文摘要：3. 论文介绍：4. 论文原理4.1 CBOW模型：4.2 Skip-gram模型：4.3 降低复杂度 - Hierachical Softmax （层次Softmax） “五星重点”4.4 降低复杂度 - Negative Sampling （负采样） “五星重点”4.5 降低复杂度 - Subsampling of Frequent Words (多重采样）“五星重点”5. 模型复杂度5.1 NNLM的QQQ5.2 RNNLM的QQQ5.3 Skip-g

2021-09-18 21:05:09 1358

原创 NLP Baseline 论文基础知识汇总（持续更新）

文章目录语言模型统计语言模型统计语言模型中的平滑操作马尔科夫假设语言模型评价指标：困惑度（Perplexity）词的表示方法 - One Hot（独热编码）本来旨在对概念有个基本了解，方便听课时不至于像天书一样。建议关注，此文会持续更新~语言模型LM的目的是为一个句子或词序列赋予一个概率。LM预测下一个词的概率，也就是说它预测下面最有可能出现的一个词。任何一个具有上面任务的模型称为语言模型。如word2vec通过当前词预测上下文词，或通过上下文词预测当前的目标词。统计语言模型统计语言模型是

2021-09-15 22:58:06 450

原创 The Fun Of Algorithm - Day14 - 个人所得税

问题描述要求输入金额，输出应缴的个人所得税起征点为2000元不超过500元，征收5%超过500-2000元的部分，征收10%超过2000-5000元的部分，征收15%超过5000-20000元的部分，征收20%超过20000-40000元的部分，征收25%超过40000-60000元的部分，征收30%超过60000-80000元的部分，征收35%超过80000-100000元的部分，征收40%超过100000元的部分，征收45%问题分析根据列表和元祖的相关知识，这里可以同时使用列

2021-09-14 22:21:10 50

原创 Python列表常用操作方法

命令说明list.append(x)添加元素，将元素x添加到列表list的尾部list.extend(aList)添加元素，将列表aList中的所有元素添加到列表list的尾部list.insert(index,x)添加元素，在列表list中的指定位置index处插入元素xlist.remove(x)删除元素，删除并范围列表list中指定位置index处的元素，默认是最后一个元素list.clear()删除元素，删除列表中的所有元素，并不是删除列表对象...

2021-09-14 21:32:30 139

原创 The Fun Of Algorithm - Day13 - 求车速

问题描述一辆以固定速度行驶的汽车，司机在上午10点看到里程表上的读数是一个对称数（即这个数从左向右读和从右向左读是完全一样的），为95589。连个小时候里程表上出现了一个新的对称数，该数仍为5位数，问该车的速度是多少，新的对称数是多少？问题分析假设所求对数为i，并设其初值为95850，使i的值依次递增。对每个取值分解，确保第一位和第五位，第二位和第四位比较并相等。算法设计需要对一个5位数进行分解并保存成数组，比较数字也就是比较下标。Code# !/user/bin/python3# -*-

2021-09-14 21:19:11 212

原创从0开始搭建深度学习多GPU服务器 Ubuntu20.04 Sever + Docker

文章目录背景介绍操作系统SSH登录客户端一些命令查看系统信息安装ZFS1. 安装和配置 zfs2. 创建zfs pool禁止Ubuntu内核更新安装显卡驱动下载及安装CUDA安装Docker安装Nvidia-Docker2Docker 管理面板Portainer创建容器最终验证服务器意外重启，如何手动启动docker和container如何传输在服务器和容器间传输数据（已有数据卷和容器情况下）如何将Windows文件上传到Ubuntu20.04服务器上背景介绍机缘巧合手里拿到了一台工作站，所以终于可以

2021-09-14 18:58:19 2202 1

空空如也

空空如也