不死谷神-CSDN博客

原创 Show, Ask, Attend, and Answer: A Strong Baseline For Visual Question Answering论文阅读

文章目录摘要介绍MehtodQuestion embeddingStacked attention摘要本文主要的研究内容是VQA,视觉问题回答，就是输入一张图片和一个问题，让计算机针对图片的内容进行一个回答。本文是要作为一个baseline，所提出的方法相对比较简单，参数较少，但效果不错。我对这个领域也是接触不多，主要是为了拓宽对于视觉研究内容的理解，所以对这篇文章的阅读进行一些记录。介绍...

2019-08-14 13:57:14 1424

原创 tf.train.Saver()和tf.train.ExponentialMovingAverage()的理解

tf.train.Saver()和 tf.train.ExponentialMovingAverage()是tensorflow的两个类，第一个是用来保存模型和参数的，第二个是使用的滑动平均模型，

2019-07-29 17:22:10 451

原创 Fast Spatio-Temporal Residual Network for Video Super-Resolution阅读理解

introduction现在有很多使用深度学习来做超分辨率的，直接用这些方法做视频的超分辨率会有问题，忽略了时间的相关性，使画面闪烁。现有的方法使用时域融合技术来提取时间信息，比如运动补偿（参考 Detail-revealing deep video super-resolution），但是会有巨大计算开销并要人为设计结构。为了能自动计算时空的信息，就会使用三维卷积，但是会引入大量参数，所以...

2019-07-24 16:02:52 1648

原创 DPED和WESPE详解

论文阅读嘎嘎嘎嘎嘎过过过过过过过过

2019-07-19 15:04:20 1907

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人