自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 ubuntu20.04一开机就显示logo,而没有显示桌面,重装gnome环境

重装gnome环境昨天晚上不小心把gnome环境给卸载了,今天打开电脑就只出现一个华硕奢侈之眼。用手机查了一些资料,现在记录一下。按 ctrl + alt + F4进入命令行模式输入 sudo apt-get update输入 sudo apt-get install ubuntu-desktop安装好后,就可以进入Ubuntu界面了。...

2020-07-22 15:19:43 2647

原创 cs224n-Assignment01

Assignment011 基于计数的词向量1.1 实现 dicintct_words1.2 实现compute_co_occurrence_matrix1.3 实现 reduce_to_k_dim1.4 实现 plot_embeddings1.5 共现打印分析参考1 基于计数的词向量大多数词向量模型都是基于一个观点:You shall know a word by the company it keeps (Firth, J. R. 1957:11)大多数词向量的实现的核心是 相似词 ,也

2020-07-06 22:10:23 163

原创 datawhale-cs224n-task04

task-04单词的表示对不知道的单词使用词向量的建议单词表示的两大问题单词表示的解决方法:TagLM - "Pre-ELMo"Named Entity Recognition(NER)CoVe单词的表示前面我们已经学习了Word2Vec,GloVe, fastText对不知道的单词使用词向量的建议常见方法:训练时:Vocab = {words occurring, say, ≥ 5 times} ∪ { < UNK >} 即:将所有罕见的词(数据集出现次数小于5)都映射为&

2020-07-03 20:54:48 107

原创 datawhale:Task 3: Subword Models

Subword Models1 人类语言声音:语音学和音系学Morphology: Parts of words2 单词之下的书写系统纯粹的字符级别的模型3 子单词模型:两个趋势Hybrid architectures:主要的模型含有单词,一些其他的含有字符字节对的编码4 字符级来构建单词级Character-based LSTM to build word rep’nsBi-LSTM构建单词表示5 FastText embeddings1 人类语言声音:语音学和音系学Phonetics 语音学是一种

2020-06-30 21:51:25 140

原创 cs224n-task02

Word Vectors and Word Senses1 Word2vecWord2vec的作用word2vec的主要思想Word2vec的参数和计算1 Word2vecWord2vec的作用word2vec的作用就是学习词向量的一个方法word2vec的主要思想对语料库的每个单词进行迭代使用词向量预测上下文单词更新词向量来让预测更加的准确Word2vec的参数和计算每行代表一个单词的词向量,点乘后得到的分数通过softmax映射为概率分布,我们得到的概率分布式是在该中心词的

2020-06-27 23:33:39 73

原创 cs224n-task01 introduction and word2vec

第一讲目录人类语言与单词含义人类语言单词含义法一:法二: 离散符号代表单词法三:使用词的上下文的来表示单词词向量Word2vec介绍Word2vec简述人类语言与单词含义人类语言这一部分主要是介绍了人类语言就要什么功能?以及人类语言和写作在人类发展中发挥着重要作用。单词含义课程中提到我们人类一般是通过一个词、词组、语言、符号、作品、艺术等来表达自己的观点和思想。 那我们怎么在计算机中来表达我们的想表达的概念、意思。法一:WordNet, 把同义词集和上位词收集在一起的列表WordNet缺点

2020-06-24 23:20:17 141

原创 DataWhale-CV-task05 模型集成

模型集成1 集成学习方法2 深度学习中的集成学习2.1 Dropout2.2 TTA(Test Time Augmentation)2.3 Snapshot1 集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度。常见的集成学习方法有Stacking, Bagging和Boosting,同时这些集成学习方法与具体验证集集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不好,就可以用留出法,如果需要追求进度可以使用交叉验证的方法。2 深度学习中的集成学习2.1 Dropo

2020-06-02 21:52:56 130

原创 DataWhale-CV-task04 模型训练与验证

模型训练与验证1 成熟的深度学习训练流程2 构造验证集3 模型训练与验证4 模型调参流程5 参考1 成熟的深度学习训练流程在训练集上进行训练,并在验证集上进行验证模型可以保存最优的权值,并读取权重记录下训练集和验证集的精度,便于调参2 构造验证集为什么需要验证集?深度学习训练的时候,模型是非常容易出现过拟合,即在训练阶段的loss是非常小的,但是在测试集中loss是非常大。为了提供模型的泛化能力, 我们就构建一个与测试集极可能分布一致的验证集。划分验证集的方式?留出法:直接在训练集

2020-05-30 15:14:13 133

转载 DataWhale-CV-task03 字符识别模型

@[TOC](基于CNN的字符识别模型)1 学习目标学习CNNj基础和原理使用pytorch框架构建CNN模型,并完成训练2 CNN介绍卷积神经网络(CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现的很好,精度和速度比传统计算学习算法高很多,特比是计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。CNN每一层有众多的卷积核组成,每个卷积核对输入的像素进行卷积操作, 得到下一次的输入。随着网络层增加卷积核,会逐渐扩大感受野,并缩减

2020-05-26 17:05:14 191

原创 DataWhale-CV-task02 数据读取与数据扩增

数据读取与数据扩增1 数据读取与数据扩增1.1 学习目标1.2 图像读取1.2.1 Pillow1 数据读取与数据扩增1.1 学习目标学习python和pytorch中图像读取学会扩增方法和pytorch读取赛题数据1.2 图像读取python中有很多库可以完成图像数据的读取,比较常见的是Pillow和OpenCV1.2.1 PillowPillow简介 分函数实例markdown的书写:无序列表...

2020-05-23 16:39:04 163

原创 DataWhale-CV-task01赛题理解

Task01 赛题理解1 前言2 赛题背景3 赛题数据4 数据标签5 评测指标6 读取数据7 解题思路7.1 思路1 定长字符识别7.2 思路2 不定长字符识别7.3 思路3 检测再识别8 总结1 前言 第一次写博客,markdown编译器也不是很会用,只会使用一些结点的语法,所以博客的样式肯定做的不是很好,希望下一次任务的时候,可以比这个写的博客进步一点。这个学习笔记主要是记录我在安装pytorch运行环境中踩过的坑(居然忘记截图了),以及我对街景字符编码识别赛题的理解,主要是遇到一个计算机视觉

2020-05-20 17:09:41 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除