- 博客(4)
- 收藏
- 关注
原创 Show, Ask, Attend, and Answer: A Strong Baseline For Visual Question Answering论文阅读
文章目录摘要介绍MehtodQuestion embeddingStacked attention摘要本文主要的研究内容是VQA,视觉问题回答,就是输入一张图片和一个问题,让计算机针对图片的内容进行一个回答。本文是要作为一个baseline,所提出的方法相对比较简单,参数较少,但效果不错。我对这个领域也是接触不多,主要是为了拓宽对于视觉研究内容的理解,所以对这篇文章的阅读进行一些记录。介绍...
2019-08-14 13:57:14 1424
原创 tf.train.Saver()和tf.train.ExponentialMovingAverage()的理解
tf.train.Saver()和 tf.train.ExponentialMovingAverage()是tensorflow的两个类,第一个是用来保存模型和参数的,第二个是使用的滑动平均模型,
2019-07-29 17:22:10 451
原创 Fast Spatio-Temporal Residual Network for Video Super-Resolution阅读理解
introduction现在有很多使用深度学习来做超分辨率的,直接用这些方法做视频的超分辨率会有问题,忽略了时间的相关性,使画面闪烁。现有的方法使用时域融合技术来提取时间信息,比如运动补偿(参考 Detail-revealing deep video super-resolution),但是会有巨大计算开销并要人为设计结构。为了能自动计算时空的信息,就会使用三维卷积,但是会引入大量参数,所以...
2019-07-24 16:02:52 1648
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人