• 等级
  • 2675 访问
  • 12 原创
  • 5 转发
  • 1140396 排名
  • 2 评论
  • 2 获赞

2018-7-10-深度学习中关于(1,1)卷积的理解

—布局:帖子标题:关于1 * 1卷积的理解和应用副标题:日期:2018-7-10作者:度朝腾header-img:img / dragon.jpg目录:true标签: - python - - 1.什么是1 * 1卷积?在我最近的学习中吧,经常看到一个叫做1 * 1的卷积核,众所周知,一般来说,我们在所用到的卷积核大小会是3 * 3呀或者5 * 5之类的,越是大的卷积核代表着更大...

2018-07-26 14:53:02

井字棋讲解

井字棋讲解 井字棋最重要的部分便是AI的训练部分,现在我确实还一知半解,如何决策步骤的保留进行探索,我还处于一脸懵逼状态。以下是实现代码: 1.库函数等准备 from __future__ import print_function #把下一个版本应用到当前版本 import numpy as np #数据处理函数 import pickle #数据储存模块 BOARD_R...

2018-05-15 13:08:22

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(八)

2.2 行动价值法(Action-value Methods) ​ 我们首先仔细研究一些简单的方法来估计行动的价值和用估计值做出行动选择决策。 回想一下,行动的真正价值是选择行动时的平均回报。 估计这种情况的一种自然方法是平均实际收到的回报: Qt(a)≐sumofrewardswhenatakenpriortotnumberoftimesatakenpriortot=∑t−1i=1Ri⋅...

2018-05-11 14:43:13

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(七)

Part I: 表格解决方法 ​ 在本书的这一部分中,我们以最简单的形式描述了几乎所有强化学习算法的核心思想:算法中的状态和动作空间足够小,可以将近似值函数表示为数组或表格。 在这种情况下,这些方法通常可以找到确切的解决方案,也就是说,他们经常可以找到最佳的价值函数和最优策略。这与本书下一部分描述的近似方法形成对比,后者只找到近似解, 但是作为回报可以有效应用于更大的问题。 ​ 本书的...

2018-05-08 19:05:20

2018-4-26-Linux进程通信

LInux实现 System V 信号量进程通信(共享内存) 一、利用System V实现进程通信所需要的库 //common.h #ifndef _COMMON_H_ #define _COMMON_H_ #include <stdio.h> //输入输出的标准库函数 #include <stdlib.h> //动态内存的分配库函数 #includ...

2018-04-27 11:53:53

Linux内核模块编程(列出系统中所有内核线程的程序名、PID 号、进程状态及进程优先级、父进程的PID)

(1) 设计一个模块,要求列出系统中所有内核线程的程序名、PID 号、进程状态及进程优先级、父进程的PID。 1.首先,我们开始编写模块代码,这是Linux内核编程的核心代码,代码如下: #include <linux/init.h> #include <linux/module.h> #include <linux/kernel.h> #include...

2018-04-21 10:51:21

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(六)

强化学习导论 1.6小结 转载自:https://blog.csdn.net/thousandsofwind/article/details/79775711 好吧,没得看了,后面的又得自己翻译了○| ̄|_ 强化学习是一种理解和自动进行目标导向学习和决策的计算方法。它与其他计算方法不同之处在于它强调了代理与环境的直接交互学习,而不依赖于监督或完整的环境模型。在我们看来,强化...

2018-04-16 18:29:02

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(五)

强化学习导论 1.5 拓展例子:井字棋 https://blog.csdn.net/thousandsofwind/article/details/79745086 (注:尝试了很多次就是没有办法发全文,迷) 为了说明强化学习的一般概念,并与其他方法进行对比,我们接下来将更详细地考虑一个示例。 ​ 想想我们熟悉的孩子玩的井字棋。棋手在三行三列的棋盘上博弈,一个棋...

2018-04-16 18:28:12

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(四)

强化学习导论 局限性与适用范围 转载自:https://blog.csdn.net/thousandsofwind/article/details/79725198 从前面的讨论中,应该清楚的是,强化学习很大程度上依赖于状态的概念。他既作为对策略和值函数的输入,也作为模型的输入和输出。非正式地,我们可以把状态看作是传达给代理的某种特定时期“环境如何”的信号。状态的形式定义在第3章...

2018-04-16 18:27:39

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(三)

强化学习导论 1.3 强化学习的要素 转载自:https://blog.csdn.net/thousandsofwind/article/details/79718730 在代理和环境之外,强化学习系统一般有四个主要元素:一个策略,收益信号,价值函数,和一个可选的环境模型。 ​ 策略定义了学习代理在给定时间内的行为方式。简单来说,政策是从环境到在这些状态下采取的行动的映射...

2018-04-16 18:26:46

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(二)

强化学习导论 妈耶,有现成的部分翻译,转载自:https://blog.csdn.net/thousandsofwind/article/details/79710209 1.2 例子 思考其发展中的一些例子和可能的应用是理解强化学习的一个好方法。 象棋大师落字。这个决定既出于他的计划——期待的回复和逆向回复,也出于对特定位置和移动及时直觉的判断。 自适应控制器实时调节炼油厂...

2018-04-16 18:25:46

强化学习导论(Reinforcement Learning:An Introduction)学习笔记(一)

Introduction ​ 我们在思考学习本质时首先想到的可能就是通过与我们的环境进行交互从而学习。当一个婴儿玩耍时,挥动着他的手臂,虽然看起来,他没有明确的老师,但他确实与他的环境有直接的感觉联系。并且这种联系可以产生大量关于因果,行为后果以及为了实现一个目标我们要做什么等信息。在我们的整个生活中,这种交互无疑是我们了解环境和自己的主要知识来源。无论我们是在学习驾驶汽车还是进行对话,我们...

2018-04-15 21:42:10

操作系统内核编译

操作系统编译内核 1.安装必须的支持 sudo apt-get install libncurses5-dev libssl-dev sudo apt-get install build-essential openssl sudo apt-get install zlibc minizip sudo apt-get install libidn11-dev libidn1...

2018-04-15 21:31:32

栈与队列实现停车场问题

使用栈和队列实现停车场问题 申明:代码我是运行成功了的,但是直接复制粘贴是肯定运行不了的,嘻嘻嘻。没想到吧O(∩_∩)O。那么接下来我将为大家介绍代码内容。 首先,实现栈与队列的基本功能。 实现栈与队列的首要条件便是结构体的配置,以下是带了注释的配置。(我们此处采用的是链表栈已经顺序队列) 队列图示 栈图示 /* * To change thi...

2018-04-15 21:23:30

树的基础

树与二叉树 1.什么是树? ​ 树是由一个集合以及定义在该集合上的一种关系构成的。集合中的元素称为树的结点,所定义的关系为父子关系。父子关系在树的结点之间建立了一个层次结构。 2.树的基本概念和术语 与树相关的基本概念和术语较多也比较重要哦! 结点的度:一个结点的子结点的个数称为该结点的度。 树的度:指该树中结点的最大读数。 叶结点:树中度为0的结点。 ...

2018-04-15 21:22:44

约瑟夫环双向链表

约瑟夫环双向链表,略微麻烦的一部分 #include <malloc.h> /*该约瑟夫环使用的是循环链表*/ /*构建结构体*/ typedef struct Node{ int Num; struct Node *next; struct Node *pre; }JoseNode, *PNode, *HNode;//这个结构代表一个数据域和指针域的结点...

2018-04-15 21:21:26

数据结构顺序表

数据结构顺序表算法C语言实现 准备-函数结果状态码 #include <stdlib.h> #include <malloc.h> //函数结果状态代码 #define TRUE 1 #define FALSE 0 #define OK 1 #define ERROR 0 #define OVERFLOW -1 #define LIST_INIT_SIZE ...

2018-04-15 21:20:17

剑魄未改

怨去吹箫,狂来说剑,两样销魂味。
关注
  • 计算机软件
  • 中国 浙江省 杭州市
奖章
  • 持之以恒