自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(113)
  • 收藏
  • 关注

原创 Windows环境下VSCode安装PlatformIO Cero报错ERROR: HTTP error 403 while getting

VSCode: 1.81.0PIO IDE: v3.3.1System: Windows_NT, 10.0.19044, x64%23 Exception判断问题尝试访问https://pypi.tuna.tsinghua.edu.cn/simple/platformio/成功点击文件后报错如下:Pip文件文件路径:C:\Users\(你的用户名)\AppData\Roaming\pip文件名字 pip.ini (如果没有可以自行创建)

2023-08-04 15:53:07 2641 2

原创 一步步读懂Pytorch Chatbot Tutorial代码(五) - 定义模型

文章目录自述有用的工具代码出处目录头更大了代码及说明 Define ModelsEncoderEncoderforwardDecoderdot_socreforward自述我是编程小白,别看注册时间长,但从事的不是coding工作,为了学AI才开始自学Python。平时就是照着书上敲敲代码,并没有深刻理解。现在想要研究chatbot了,才发现自己的coding水平急需加强,所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的,只是把自己不理解的写出来,将来也可以作为资料备查。最后还要重申一

2021-12-03 22:04:55 901

原创 一步步读懂Pytorch Chatbot Tutorial代码(四) - 为模型准备数据

文章目录自述有用的工具代码出处目录头大代码 Prepare Data for Models参数追踪inputVar自述我是编程小白,别看注册时间长,但从事的不是coding工作,为了学AI才开始自学Python。平时就是照着书上敲敲代码,并没有深刻理解。现在想要研究chatbot了,才发现自己的coding水平急需加强,所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的,只是把自己不理解的写出来,将来也可以作为资料备查。最后还要重申一下,我没有系统学过编程,写这个系列就是想突破自己,各位

2021-12-03 11:20:43 1471

原创 一步步读懂Pytorch Chatbot Tutorial代码(三) - 创建字典

文章目录自述有用的工具代码出处目录代码 Load and trim data类 class_ _ init _ _ 初始化实例变量for word in sentence.split(' ')自述我是编程小白,别看注册时间长,但从事的不是coding工作,为了学AI才开始自学Python。平时就是照着书上敲敲代码,并没有深刻理解。现在想要研究chatbot了,才发现自己的coding水平急需加强,所以开这个系列记录自己一行行扣代码的过程。当然这不是从0开始的,只是把自己不理解的写出来,将来也可以作为资

2021-11-25 21:13:26 1546

原创 一步步读懂Pytorch Chatbot Tutorial代码(二) - 数据处理

文章目录自述代码出处目录代码 Create formatted data file (为了方便理解,把代码的顺序略微改一下)1. `loadLines` 将文件的每一行拆分为一个字段字典(lineID、characterID、movieID、character、text)encoding='iso-8859-1'values的值:(删掉‘+++$+++’)enumerate修改字典lines[lineObj['lineID']] = lineObj2. `loadConversationsloadLine

2021-11-20 15:45:21 981

原创 NLP十大Baseline论文简述(十) - sgm

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要4. 研究意义前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:SGM: Sequence Generation Model for Multi-Label Classification使用序列生成模型做多标签文本分类2. 背景介绍多标签文本分类是自然语言处理的重要任务,多标签文本分类可以用到文本分类,推荐以及信息检索中。但是目前的多标签文本分类模型存在两个问题:没

2021-11-16 11:25:48 1024

原创 一步步读懂Pytorch Chatbot Tutorial代码(一) - 加载和预处理数据

文章目录自述代码来源1. Preparations1)from _ _ future _ _ import2. Load & Preprocess Data1) os.path.join函数2)def自定义函数3)with open as 读写文件自述我是编程小白,别看注册时间长,但从事的不是coding工作,为了学AI才开始自学Python。平时就是照着书上敲敲代码,并没有深刻理解。现在想要研究chatbot了,才发现自己的coding水平急需加强,所以开这个系列记录自己一行行扣代

2021-11-16 11:19:55 1810

原创 NLP十大Baseline论文简述(九) - han_attention

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Hierarchical Attention Networks for Document Classification使用层次注意力网络做文档分类2. 背景介绍相对于传统的统计机器翻译,基于Encoder-Decoder机制的神经机器翻译有很多优点。但是之前关于Encoder-Decoder的方法都是使用Encode

2021-11-02 10:46:15 609

原创 局域网服务器上配置Jupyter notebook (简化实用版本)

文章目录起因1. 创建notebook configuration file2. 设置登陆密码 `jupyter notebook password`3. 修改notbook configuration file起因众所周知,我自己建了双GPU的服务器,也装了docker,本来跑跑玩具模型都没啥问题,结果在一次比赛中,train数据的时候jupyter notebook就提示died。一时查不到原因,就想着是不是docker都问题,所以打算在服务器上直接装Anconda跑Jupyter Notebook

2021-10-30 20:17:09 291

原创 如何修改docker容器的shmsize共享内存大小

文章目录报错原因解决方法:报错原因在跑train时提示如下RuntimeError: DataLoader worker (pid 6209) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.解决方法:停止docker// 停止docker服务s

2021-10-29 15:47:24 740

原创 AttributeError: module ‘enum‘ has no attribute ‘IntFlag‘

文章目录报错原因报错解决报错原因由于Python3.6, 安装pip install grad-cam报错如下AttributeError: module 'enum' has no attribute 'IntFlag'报错解决卸载enum34库pip uninstall enum34

2021-10-29 14:36:45 82

原创 Error response from daemon: OCI runtime create failed: container_linux.go:380

文章目录报错原因报错如下:报错解决方法: 删除新版内核自建多GPU服务器可以参考 https://blog.csdn.net/landian0531/article/details/120242839报错原因意外停电导致Ubuntu服务器重启,docker里面的容器无法通过docker ps -aq | xargs -I {} docker start {}命令启动报错如下:gpu@gpu-workstation:~$ docker ps -aq | xargs -I {} docker star

2021-10-29 09:58:57 1743

原创 NLP十大Baseline论文简述(八) - attention_nmt

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要4. 研究成果及意义前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Neural Machine Translation by Jointly Learning to Align and Translate联合学习对齐和翻译的神经机器翻译模型2. 背景介绍相对于传统的统计机器翻译,基于Encoder-Decoder机制的神经机器翻译有很多优点。但是之前关于Enco

2021-10-21 16:15:50 250

原创 NLP十大Baseline论文简述(七) - deep_nmt

文章目录前言:1. Paper:2. BlEU介绍3. 背景介绍4. 论文摘要5. 研究意义前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Sequence to Sequence Learning with Neural Networks使用神经网络来做序列到序列的学习2. BlEU介绍如何评价机器翻译结果的好坏人工评价:通过人主观对翻译进行打分优点:准确缺点:速度慢,价格贵机器自动评价: 通过设置指标对机器翻译结果

2021-10-18 13:26:06 249

原创 NLP十大Baseline论文简述(六) -fasttext

文章目录前言:1. Paper:2. 动机介绍3. 背景介绍4. 论文摘要5. 研究成果6. 研究意义7. Fasttext模型8. Fasttext模型优缺点9. 论文总结前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Bag of Tricks for Efficient Text Classification对于高效文本分类的一揽子技巧2. 动机介绍结合深度学习的文本分类模型和机器学习的文本分类模型的优点,达到:速度

2021-10-13 16:43:23 301

原创 Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same

常规解决方案从报错问题描述中可以找到错误原因输入的数据类型为torch.cuda.FloatTensor,说明输入数据在GPU中模型参数的数据类型为torch.FloatTensor,说明模型还在CPU问题原因搞清楚了,模型没加载到CPU,在代码中加一行语句就可以了model = model.cuda()model = model.to('cuda')model.cuda()model.to('cuda')上面四行任选一问题是加在哪里一般在summary模型的时候提示错误, 所以可以

2021-10-13 09:26:36 488

原创 NLP十大Baseline论文简述(五) - chartextcnn

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要4. 研究成果4. 研究意义5. CharTextCNN模型优缺点6. 论文总结前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Character-Level Convolutional Networks for Text Classification使用字符级别的卷积神经网络来做文本分类任务2. 背景介绍文本分类是自然语言处理的基础任务之一,目前大多数文本分类任务

2021-10-12 15:38:54 211

原创 NLP十大Baseline论文简述(四) -textcnn

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要4. 研究成果5. 研究意义前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Convolutional Neural Networks for Sentence Classification基于卷积神经网络的句子分类2. 背景介绍深度学习,词向量和卷积神经网络的发展3. 论文摘要使用简单的CNN模型在预训练词向量基础上进行微调就可以在文本分类任务上得到很好的结果

2021-10-08 15:38:15 298

原创 Ubuntu 查看系统(CPU,内存)占用工具htop

sudo apt install htop直接运行htop即可

2021-10-01 00:00:02 529

原创 Ubuntu 报错 make: c++: Command not found

尝试安装fasttext的时候,输入make命令后报错c++ -pthread -std=c++11 -march=native -O3 -funroll-loops -DNDEBUG -c src/args.ccmake: c++: Command not foundmake: *** [Makefile:30: args.o] Error 127运行以下命令解决:sudo apt-get install build-essential...

2021-09-30 23:46:30 1071

原创 jieba中文分词库的使用

文章目录“结巴”中文分词:Python 中文分词组件四种分词模式:算法主要功能代码示例Paddle模式全模式和精确模式:通过Viterbi算法新词识别搜索引擎模式自定义字典调整词典更多内容参考[Github](https://github.com/fxsjy/jieba)“结巴”中文分词:Python 中文分词组件四种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再

2021-09-29 21:58:11 235

原创 NLP十大Baseline论文简述(三) - C2W

文章目录前言:1. Paper:2. 背景介绍3. 论文摘要4. C2W模型前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:Finding function in form: Compositional character models for open vocabulary word representation从字符中生成嵌入:用于开放词表示的组合字符模型2. 背景介绍词向量的学习对于自然语言处理的应用非常重要,词向量可

2021-09-26 22:03:29 314

原创 NLP十大Baseline论文简述(二) - GloVe

文章目录前言:1. Paper:2.论文摘要3.研究成果4.GloVe模型前言:如果需要对基础概念不了解,可以参考这里。我汇总了论文中涉及的大部分概念,以便更好的理解论文。1. Paper:GloVe: Global Vectors for Word Representation 基于全局信息的单词向量表示2.论文摘要Recent methods for learning vector spacerepresentations of words have succeededin ca

2021-09-23 23:06:04 370

原创 NLP十大Baseline论文简述(一) - Word2vec

文章目录前言:1. Paper:2.论文摘要:3. 论文介绍:4. 论文原理4.1 CBOW模型:4.2 Skip-gram模型:4.3 降低复杂度 - Hierachical Softmax (层次Softmax) “五星重点”4.4 降低复杂度 - Negative Sampling (负采样) “五星重点”4.5 降低复杂度 - Subsampling of Frequent Words (多重采样)“五星重点”5. 模型复杂度5.1 NNLM的QQQ5.2 RNNLM的QQQ5.3 Skip-g

2021-09-18 21:05:09 1358

原创 NLP Baseline 论文基础知识汇总(持续更新)

文章目录语言模型统计语言模型统计语言模型中的平滑操作马尔科夫假设语言模型评价指标:困惑度(Perplexity)词的表示方法 - One Hot(独热编码)本来旨在对概念有个基本了解,方便听课时不至于像天书一样。建议关注,此文会持续更新~语言模型LM的目的是为一个句子或词序列赋予一个概率。LM预测下一个词的概率,也就是说它预测下面最有可能出现的一个词。任何一个具有上面任务的模型称为语言模型。如word2vec通过当前词预测上下文词,或通过上下文词预测当前的目标词。统计语言模型统计语言模型是

2021-09-15 22:58:06 450

原创 The Fun Of Algorithm - Day14 - 个人所得税

问题描述要求输入金额,输出应缴的个人所得税起征点为2000元不超过500元,征收5%超过500-2000元的部分,征收10%超过2000-5000元的部分,征收15%超过5000-20000元的部分,征收20%超过20000-40000元的部分,征收25%超过40000-60000元的部分,征收30%超过60000-80000元的部分,征收35%超过80000-100000元的部分,征收40%超过100000元的部分,征收45%问题分析根据列表和元祖的相关知识, 这里可以同时使用列

2021-09-14 22:21:10 50

原创 Python列表常用操作方法

命令说明list.append(x)添加元素,将元素x添加到列表list的尾部list.extend(aList)添加元素,将列表aList中的所有元素添加到列表list的尾部list.insert(index,x)添加元素,在列表list中的指定位置index处插入元素xlist.remove(x)删除元素,删除并范围列表list中指定位置index处的元素,默认是最后一个元素list.clear()删除元素,删除列表中的所有元素,并不是删除列表对象...

2021-09-14 21:32:30 139

原创 The Fun Of Algorithm - Day13 - 求车速

问题描述一辆以固定速度行驶的汽车,司机在上午10点看到里程表上的读数是一个对称数(即这个数从左向右读和从右向左读是完全一样的),为95589。连个小时候里程表上出现了一个新的对称数,该数仍为5位数,问该车的速度是多少,新的对称数是多少?问题分析假设所求对数为i,并设其初值为95850,使i的值依次递增。对每个取值分解,确保第一位和第五位, 第二位和第四位比较并相等。算法设计需要对一个5位数进行分解并保存成数组,比较数字也就是比较下标。Code# !/user/bin/python3# -*-

2021-09-14 21:19:11 212

原创 从0开始搭建深度学习多GPU服务器 Ubuntu20.04 Sever + Docker

文章目录背景介绍操作系统SSH登录客户端一些命令查看系统信息安装ZFS1. 安装和配置 zfs2. 创建zfs pool禁止Ubuntu内核更新安装显卡驱动下载及安装CUDA安装Docker安装Nvidia-Docker2Docker 管理面板Portainer创建容器最终验证服务器意外重启, 如何手动启动docker和container如何传输在服务器和容器间传输数据(已有数据卷和容器情况下)如何将Windows文件上传到Ubuntu20.04服务器上背景介绍机缘巧合手里拿到了一台工作站,所以终于可以

2021-09-14 18:58:19 2202 1

原创 通过ngrok远程ssh家里的服务器(命令行模式)

文章目录环境在Ubuntu服务器上安装ngrok客户端登录环境Ubuntu 20.04 Server 版,无GUI桌面在Ubuntu服务器上安装ngroksudo snap install ngrokgpu@gpu-workstation:~$ sudo snap install ngrokngrok 2.3.40 from Kyle Wenholz (kyle-ngrok) installedgpu@gpu-workstation:~$ ./ngrok authtoken 1y00THH

2021-09-12 09:36:59 1088

原创 一行命令生成requirements.txt,轻松重建依赖包

生成requirements.txt文件pip freeze > requirements.txt安装requirements.txt依赖pip install -r requirements.txt

2021-09-10 21:32:57 104

原创 The Fun Of Algorithm - Day12 - 出售金鱼

问题描述小明将养的一缸金鱼分5次出售:第一次卖出全部的一半加1/2条,第二次卖出余下的三分之一加1/3条,第三次卖出余下的四分之一加1/4条,第五次卖出余下的五分之一加1/5条, 最后卖出余下的11条,求出原来鱼缸中有多少条金鱼。问题分析假设第j次卖鱼前金鱼总数为x, 则第j次卖鱼后鱼缸中还剩下金鱼的条数为x-(x+1)/(j+1), 而且第四次卖鱼后鱼缸中剩下的金鱼条数为11.而且 x+1 必然能整除 j+1Code# !/user/bin/python3# -*- coding: utf-

2021-09-09 15:55:02 513

原创 The Fun Of Algorithm - Day11 - 三色球

问题描述一个口袋中放有12个球,已知其中3个红的,3个白的,6个黑的,现从中任取8个,问共有多少种可能的颜色搭配?问题分析可设任取的8个球中红球为m个,白球为n个,则黑球为8-m-n个。已知12个球中有3个红球,3个白球,6个黑球。因此m的取值范围[0,3], n的取值范围为[0,3], 黑球的个数小于等于6,即8-m-n<=6。算法设计利用循环结构检测m,n范围内的所有可能取值,再代入8-m-n<=6验证Code# !/user/bin/python3# -*- coding:

2021-09-09 13:35:09 136

原创 The Fun Of Algorithm - Day10 -数制转换

问题描述给定一个M进制的数x, 实现对x向任意一个非M进制的数的转换问题分析概念:基数: 在一种数制中,只能使用一组固定的数字来表示数的大小。具体使用多少个不同数字来表示一个数值的大小,就称为该计数制的基数(base)。如十进制基数为10,二进制基数为2等。权:又称为位权或权值, 即每一个数位都有一个固定的基值与之相对应。如十进制的个位对应的权值为1(10010^0100),十位对应的权值为10(10110^1101),百位对应的权值为100(10210^2102),对于一个M进制的数来说,小数点

2021-09-09 13:20:26 63

原创 The Fun Of Algorithm - Day9 - 折半查找

问题描述N个有序整数数列已放在一维数组中, 利用二分查找法查找整数m在数组中的位置。 如果找到,则输出其下标值,反之,则输出‘Not be found!’问题分析二分法只适用于有序序列基本算法是:每次查找前先确定数组中待查的范围。假设指针low和high(low<high)分别知识待查范围的下届和上界,指针mid知识待查范围的中间位置,即mid=(low+high)/ 2 ,把m与中间位置mid上元素的值进行比较,如果m的值大于中间位置上的元素的值, 则下一次的查找范围放在中间位置之后的元素中

2021-09-08 16:43:32 90

原创 The Fun Of Algorithm - Day8 - 冒泡排序

问题描述对N个整数(数据由键盘输入)进行升序排列问题分析利用数组进行存储,利用两个相邻元素间进行比较交换的过程将一个无序表变成有序表。假设数组元素的个数为n, 最糟的情况下需要比较的次数为((n-1)+(n-2)+…+2+1)=n(n-1)/2算法设计Code# !/user/bin/python3# -*- coding: utf-8 -*-# @author: HHVic# @desc: 冒泡排序import time# add timer to calculate the

2021-09-07 22:55:00 81

原创 The Fun Of Algorithm - Day7 - 最佳存款方案

问题描述假设银行一年整存零取的月息为0.63%,现在某人手中有一笔钱, 他打算在今后5年中每年年底取出1000, 到第5年时刚好取完,请算出他存钱时应该存入多少?问题分析第5年年初存款数=1000/(1+12X0.0063) 据此推算第4年年初存款数=(第5年年初存款数+1000)/(1+12X0.0063)…第1年年初存款数=(第2年年初存款数+1000)/(1+12X0.0063)算法设计for循环4次Code# !/user/bin/python3# -*- coding: ut

2021-09-07 13:44:32 130

原创 The Fun Of Algorithm - Day6 - 打鱼还是晒网(日期问题)

问题描述某人从1990年1月起便开始‘三天打鱼两天晒网’,问这个人在以后的某一天是‘打鱼’还是‘晒网’问题分析计算从1990年1月到指定日期共有多少天打鱼和晒网周期为5天,计算出的天数用除以5根据余数判读判断是打鱼还是晒网, 若余数是1,2,3 则他在打鱼,否则在晒网。算法设计首先考虑闰年,闰年二月为29天,平年二月为28天。判断闰年方法:能被4整除并不能被100整除或者能被400整除,即是闰年。算法的核心是得到指定日期距离1990年1月1日的天数totalDay=1990年

2021-09-07 13:16:25 70

原创 The Fun Of Algorithm - Day5 - 借书方案

问题描述小明有5本书,要借给A,B,C三位小朋友,若每人只能借1本,则可以有多少种不同的借法?问题分析从5个数中取3个不同的数的排列组合,同时由于一本书不能借给一个以上的人,因此只有三人所选的编号必须不同。算法设计依然用穷举循环方法实现,根据条件限制 if a!=b and a!=c and c!=b 进行判断。另外performance版本,如果前两个人所选书号相同,无论第三个人所选书号与前两个人相同与否,都是无效的借阅方法。可在执行第三个循环之前先判定前两个人的编号是否相同,进而提高效率。

2021-09-07 09:56:32 45

原创 The Fun Of Algorithm - Day4 - 百钱百鸡问题

问题描述中国古代数学家张丘建在他的《算经》中提出了一个著名的‘百钱百鸡问题’:一只公鸡值5钱,一只母鸡值三钱,三只小鸡值一钱,现在要用百钱买百鸡,请问公鸡,母鸡,小鸡各多少只?问题分析公鸡 cock 母鸡 hen 小鸡 chicken问题化解成不定方程组:cock+hen+chicken=1005 X cock+3 X hen +chicken/3 = 100算法设计利用穷举循环的方法来解决...

2021-09-07 09:24:32 110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除