自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 David silver 的 reinforcement learning 课程笔记(二):马尔科夫决策过程

最近在学增强学习,边看课程视频编写的总结。希望和大家一起讨论学习…Markov Process状态 ss是马尔科夫的但且仅当: P(S(t+1)|St)=P(St+1|S1,...,St)P(S_{(t+1)}|S_t)=P(S_{t+1}|S_1,...,S_t) 一个马尔科夫过程可以用一个二元组(S,P) (S,P) 定义,其中S为有限的状态的集合,P为转移矩阵。对于一个马尔科夫过程一个样

2017-02-27 21:27:11 651

删数得最大数

【问题描述】 给定一个r位(r<1000)正整数C,去掉其中任意s个数字后将剩余的数字按原来的左右顺序组成一个新的正整数,使得新组成的数的值最大。 【输入形式】 从标准输入读入n+1行,其中第一行是正整数s(s<800),以下n行是正整数C的各位数字,以及可能的空格符和换行符。 【输出形式】 将计算结果写到标准输出上,每50个数字一行,每5个数字之间由一个空格符分隔。 【输入样例1】 2 123 321

2013-11-24

小数,无限循环小数化为分数

小数,无限循环小数化为分数。 【问题描述】 将给定的小数转换为最简分数。 【输入形式】 从标准输入读入给定的小数。 输入有两种形式: 1. 有限小数,如2.12,5.69,0.618; 2. 无限循环小数,如0._1,3.5_142851,其中“_”后的数字表示循环节。 小数部分(不含下划线)的位数不超过8位。 【输出形式】 将结果写到标准输出,占一行。形式为:x/y。x、y为整数,分别表示分子与分母。 【输入样例】 3.5_142857

2013-11-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除