- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 Chapter 7. n-step Bootstrapping
文章目录7.1 n-step TD Prediction7.2 n-step Sarsa7.3 n-step Off-policy Learning by Importance Sampling7.1 n-step TD Prediction输入:策略 :π\piπ算法参数:步长 α∈(0,1]\alpha \in (0,1]α∈(0,1],正整数 nnn对 s∈Ss \in \math...
2019-09-05 17:00:32 201
原创 Chapter 6. Temporal-Difference Learning
文章目录6.1 TD Prediction6.1 TD Prediction
2019-09-05 14:25:50 98
原创 Chapter 5. Monte Carlo Methods
文章目录5.1 Monte Carlo Prediction5.2 Monte Carlo Estimation of Action Values5.3 Monte Carlo Control5.4 Monte Carlo Control without Exploring Starts5.5 Off-policy Prediction via Importance Sampling5.6 Inc...
2019-09-04 23:56:08 177
原创 Chapter 4. Dynamic Programming
@[TOC]强化学习Chapter 4. Dynamic Programming(4.1)v(s)=maxaE[Rt+1+γv(St+1)∣St=s,At=a] =maxa∑s′,rp(s′,r∣s,a)[r+γv∗(s′)] \begin{aligned} v_(s)& = \max a\mathbb{E}[R{t+1}+\gamma v_(S_{t+1}) |...
2019-09-03 11:59:24 174
原创 macOS + python-igraph安装 亲测有效
https://pypi.org/project/python-igraph/#files直接去这里下载 tar那个文件,然后 pip install python-igraph-0.7.1.post6.tar.gz(根据你下载的文件改名字)如果不行,就换pip2 pip2.7之类的试下...
2019-01-30 09:37:12 851 7
原创 VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION阅读笔记
网上的翻译总结不计其数了,所以直接对阅读过程中出现的一些问题进行总结 3 CLASSIFICATION FRAMEWORK 3.1 TRAINING训练图像是如何得到的(224*224) 对一张训练图像,首先进行rescale,比如可以用双线性插值,得到短边为S的图像。然后在得到的图像中裁剪一部分,这部分的大小是224*224。one crop per image per SGD itera
2017-12-29 10:57:41 163
原创 AsTensorError: ('Cannot convert Tensor("mul:0", shape=(19, 19, 5, 80), dtype=float32) to TensorType'
在做deeplearning.ai 第四课第三周的作业Autonomous driving application - Car detection 时出现的问题,原因是我的后端是theano,需要切换成keras.切换一下就可以了,切换方法
2017-12-20 16:13:36 3826
原创 win10+tensorflow环境搭建
我的python2 和 python3 是共存的,首先装了anaconda2,在anaconda2的虚拟环境中装了anaconda3,具体方法见 http://blog.csdn.net/infin1te/article/details/50445217命令行常用命令打开anaconda prompt, 查看Python版本 (D:\ProgramFiles\Anaconda) e:\>py
2017-12-13 09:54:08 287
原创 聚类算法总结
http://blog.csdn.net/alex_luodazhi/article/details/47125149机器学习聚类算法——K-means聚类 http://blog.csdn.net/victoriaw/article/details/60141918
2017-08-10 00:33:37 166
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人