ENTRopYYY-CSDN博客

原创博文The Illustrated Transformer 的PDF格式

广受好评的The Illustrated Transformer一文以图解的形式清晰讲解了Transformer的各个细节，但原博是外网的，我在网上搜了下并没有发现该篇文章的PDF格式，故自己把该文拔下来制作成PDF格式，以供不能科学上网的同学使用：百度网盘链接：https://pan.baidu.com/s/1voOGQ8lNO0-3A7lq0hopVQ 提取码：t8yv ...

2021-02-19 21:25:08 310

原创 CBAM非官方代码及官方代码

非官方代码两大模块:class ChannelAttention(nn.Module): def __init__(self, in_planes, ratio=16): super(ChannelAttention, self).__init__() self.avg_pool = nn.AdaptiveAvgPool2d(1) self.max_pool = nn.AdaptiveMaxPool2d(1) self.fc1..

2020-11-05 00:36:29 7300 2

原创简单高效的模型小挂件——CBAM

论文传送门: CBAM: Convolutional Block Attention Module代码(Pytorch): https://github.com/Jongchan/attention-module介绍卷积神经网络发展到现在已在三大视觉任务(分类, 检测, 分割)上取得不错的成绩. 从早期的LeNet到现在常见的带有残差结构的网络, 模型结构变得越来越深并有强大的表达能力. VGGNet堆砌跟多相同的模块而获得不错的结果; ResNet利用残差模块和远跳连接的拓扑结构创造出更深更优秀的网

2020-11-01 09:48:28 2460 1

原创＜论文解读＞YOLOv1:You Only Look Once

论文传送门: You Only Look Once: Unified, Real-Time Object DetectionAbstract作为one-stage算法的开篇, YOLOv1提出使用回归的方法得到bbox. 相较于tow-stage算法把提取bbox(bounding box)和分类分开来做, YOLOv1直接从图片中回归出bbox并进行分类. 因为用的beckbone比较简单, 主要特点就是快, 速度方面能轻松超越其他state-of-the-art算法, 可以做到端到端的实时检测(45

2020-09-25 01:35:57 302

原创【datawhale】学习小组打卡博客5

比赛链接：零基础入门 CV 赛事 - 街景字符编码识别打卡任务：模型集成多模型集成四种最常用的多模型集成方法假设共有 N 个模型待集成，对某测试样本xx, 其预测结果为 N 个 C 维向量，（C 为数据的标记空间大小）：s1,s2,⋯,sN直接平均直接平均不同模型产生的类别置信度得到最后预测结果加权平均在直接平均法基础上加入权重调整不同模型输出的重要程度wi 作为第 i 个模型的权重，需满足：高准确率的模型权重较高，低准确率模型可设置稍小权重投票多数表决法 (ma

2020-06-02 22:35:16 238

原创【datawhale】学习小组打卡博客4

比赛链接：零基础入门 CV 赛事 - 街景字符编码识别打卡任务：模型训练与验证数据集训练集：用来训练模型内参数的数据集，Classfier 直接根据训练集来调整自身获得更好的分类效果。验证集：用于在训练过程中检验模型的状态，收敛情况。验证集通常用于调整超参数，根据几组模型验证集上的表现决定哪组超参数拥有最好的性能。同时验证集在训练过程中还可以用来监控模型是否发生过拟合，一般来说验证集表现稳定后，若继续训练，训练集表现还会继续上升，但是验证集会出现不升反降的情况，这样一般就发生了过拟合。所以验证集也

2020-05-30 23:15:16 118

原创【datawhale】学习小组打卡博客3

比赛链接：零基础入门 CV 赛事 - 街景字符编码识别打卡任务：字符识别模型模型选择采用常规分类模型：resnet50、densenet121、EffientNet这里我选用EfficientNetfrom efficientnet_pytorch import EfficientNetdef net(num_class, model_name, pretrain=True): if name == "efficientnet": model = EfficientNet.from_

2020-05-26 22:10:21 128

原创【datawhale】学习小组打卡博客2

初步分析利用json文件中的标签信息，将ground truth还原，以便进一步分析数据def plot_rectangle(root_path, img_list, type): # 新建文件夹，将画出GT的图像另存 if not os.path.exists("data_bb"): os.mkdir("data_bb") if not os.path.exists("data_bb/train_bb") and type == "train": os

2020-05-23 22:45:01 203

原创【datawhale】学习小组打卡博客1

【datawhale】学习小组打卡比赛链接：零基础入门 CV 赛事 - 街景字符编码识别打卡任务：赛题理解赛题数据赛题来源自 Google 街景图像中的门牌号数据集（The Street View House Numbers Dataset, SVHN），并根据一定方式采样得到比赛数据集。数据集报名后可见并可下载，该数据来自真实场景的门牌号。训练集数据包括 3W 张照片，验证集数据包括 1W 张照片，每张照片包括颜色图像和对应的编码类别和具体位置；为了保证比赛的公平性，测试集 A 包括 4W 张

2020-05-20 17:04:32 116

转载解决测试阶段显存增大问题

转自简书：解决 pytorch 在训练时由于设置了验证集导致 out of memory (同样可用于测试时减少显存占用)问题描述在跑pytorch的时候，在训练阶段监控到显存占用2.7G左右，但到了验证阶段发现占用了3.65G左右，对于我4G显存的显卡来说很容易爆掉。解决方法假设一开始训练和验证阶段如下：# 训练for i, (train_data, train_label) in...

2020-02-04 23:00:17 1713

原创 cv2加载图像

导入模块import cv2import numpy as npimport torchfrom torch.autograd import Valiable格式转换img = cv2.(img_path)img = np.resize(img, (32, 32, 3)img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # BGR转RGBimg...

2019-11-26 22:12:16 287

weixin_45612763的博客