8 rufanchen_

尚未进行身份认证

暂无相关简介

等级
TA的排名 2w+

强化学习(十三) 策略梯度(Policy Gradient)(源码)

    在前面讲到的DQN系列强化学习算法中,我们主要对价值函数进行了近似表示,基于价值来学习。这种Value Based强化学习方法在很多领域都得到比较好的应用,但是Value Based强化学习方法也有很多局限性,因此在另一些场景下我们需要其他的方法,比如本篇讨论的策略梯度(Policy Gradient),它是Policy Based强化学习方法,基于策略来学习。    本文参考了Sut...

2019-07-09 09:52:39

强化学习(十四) Actor-Critic

在强化学习(十三) 策略梯度(Policy Gradient)中,我们讲到了基于策略(Policy Based)的强化学习方法的基本思路,并讨论了蒙特卡罗策略梯度reinforce算法。但是由于该算法需要完整的状态序列,同时单独对策略函数进行迭代更新,不太容易收敛。    在本篇我们讨论策略(Policy Based)和价值(Value Based)相结合的方法:Actor-Critic算法。...

2019-07-08 20:16:07

一文打尽人工智能和机器学习网络资源,反正我已经收藏了

大数据文摘作品  的确,如今学习人工智能最大的困难不是找不到资料,更多同学的痛苦是:网上资源太多了,以至于没法知道从哪儿开始搜索,也没法知道搜到什么程度。  为了节省大家的时间,我们搜遍网络把最好的免费资源汇总整理到这篇文章当中。这些链接够你学上很久,而且你看完本文一定会再次惊叹:现在网上关于机器学习、深度学习和人工智能的信息真的非常多。  本文罗列了以下几个方面的学习资源,供大家收藏...

2018-09-15 17:37:19

转载:chatbot聊天机器人技术路线

https://blog.csdn.net/tian_panda/article/details/80664578聊天机器人实现的技术途径大约可分为以下4种:(其中第一种是属于“调用第三方API”,也就是说核心代码和数据库不掌握在自己手里)(第二、三、四种属于开源框架,也就是说我们可以下载其源码,采用,相对快速的自己搭建一个聊天机器人,核心代码和数据库都掌握在自己手里)http://hom...

2018-09-15 16:20:21

十个经典Chatbot框架

chatbot是场交互革命,也是一个多技术融合的平台。简单地说chatbot = NLU(Natural Language Understanding) + NLG(Natural Language Generation)。目前在做的开源项目也不少,下面列举十个经典框架,供大家参考。 1.  Artificial Intelligence Markup Language    网址:...

2018-09-15 15:24:01

C语言中内存分配

http://blog.csdn.net/pzhsunxu/article/details/7798382c语言中的内存分配一个经过编译的 C/C++ 的程序占用的内存分成以下几个部分:1 、栈区( stack ):由编译器自动分配和释放 ,存放函数的参数值、局部变量的值等,甚至函数的调用过程都是用栈来完成。其操作方式类似于数据结构中的栈。2 、堆区( heap

2014-07-18 19:07:49

linux内核input子系统解析

作者:刘洪涛,华清远见嵌入式学院讲师。       Android、X windows、qt等众多应用对于linux系统中键盘、鼠标、触摸屏等输入设备的支持都通过、或越来越倾向于标准的input输入子系统。    因为input子系统已经完成了字符驱动的文件操作接口,所以编写驱动的核心工作是完成input系统留出的接口,工作量不大。但如果你想更灵活的应用它,就需要好好的分析下input

2014-07-04 15:07:19

C++ 扩展和嵌入 Python

http://wenku.baidu.com/view/01fa40116edb6f1aff001fce.htmlBOOST_PYTHON_MODULE(pyUtil) { 

2013-10-22 10:38:42

数据挖掘领域十大经典算法初探

数据挖掘领域十大经典算法初探 http://blog.csdn.net/v_july_v/article/details/6142146译者:July   二零一一年一月十五日-----------------------------------------参考文献:国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法:C4

2013-10-10 09:26:16

异步消息的传递-回调机制

https://www.ibm.com/developerworks/cn/linux/l-callback/陈家朋 (japen@vip.sina.com), 系统架构师和技术顾问, 杭州迈可行通信技术有限公司简介: 软件模块之间总是存在着一定的接口,从调用方式上,可以把他们分为三类:同步调用、回调和异步调用。同步调用是一种阻塞式调用,调用方要等待对方执行

2013-09-04 16:07:13

使用C/C++扩展Python zz

http://blog.163.com/snoopy_puppy/blog/static/3005666520100170415642/来自http://blog.csdn.net/lwj1396/archive/2009/12/03/4924423.aspx翻译: gashero 如果你会用C,实现Python嵌入模块很简单。利用扩展模块可做很多Python不方便做的事情,他们可以直

2013-08-28 09:07:20

三、对象到底如何创建

http://blog.csdn.net/debugm/article/details/8241769一、二 文中知道,无论PyObject还是PyXXXObject,都包含有那么几样东西。具体举个例子来说,PyIntObject里面有三东西:int ob_refcnt;//引用计数struct _typeobject *ob_type; //一堆信息long

2013-08-20 15:29:01

使用C语言扩展Python(一)

http://www.cnblogs.com/phinecos/archive/2010/05/17/1737033.html开发环境:Ubuntu9.10,python2.6,gcc4.4.11,ubuntu下的python运行包和开发包是分开的,因此需要在新利得里面安装python-all-dev,从而可以在代码中引用python的头文件和库。2.下面是一个最简单的

2013-08-20 11:11:55

C++ string 用法详解

https://www.byvoid.com/blog/cpp-stringC++ string 详解任何人对本文进行引用都要标明作者是Nicolai M.Josuttis///////////////////////////////////////////////////////////////////////////////////C++ 语言是个十分优秀的语言,但优秀并不

2013-07-10 15:36:09

探索Android中的Parcel机制(上)

http://blog.csdn.net/caowenbin/article/details/6532217一.先从Serialize说起         我们都知道JAVA中的Serialize机制,译成串行化、序列化……,其作用是能将数据对象存入字节流当中,在需要时重新生成对象。主要应用是利用外部存储设备保存对象状态,以及通过网络传输对象等。 二.Android中的新的序列

2013-07-10 15:17:30

关于Android NDK中调用第三方的动态库

http://blog.csdn.net/canjianfantasy/article/details/8554182因为最近在整合Android 上RTSP播放器的网络库,因需要调用自己编译的网络库,调用一直出现问题,开始时是直接在Android.mk 中加入LOCAL_SHARED_LIBRARIES := libxxx,以为是直接调用成功了,结果后面的各种测试,结果悲剧了,查出是

2013-06-26 10:27:27

Android.mk的用法和基础

http://blog.csdn.net/zhandoushi1982/article/details/5316669     一个Android.mk file用来向编译系统描述你的源代码。具体来说:该文件是GNU Makefile的一小部分,会被编译系统解析一次或多次。你可以在每一个Android.mk file中定义一个或多个模块,你也可以在几个模块中使用同一个源代码文件。选项参

2013-06-26 10:26:29

打印 GCC编译动态和静态链接库

http://club.topsage.com/thread-2275296-1-1.html我们通常把一些公用函数制作成函数库,供其它程序使用。函数库分为静态库和动态库两种。静态库在程序编译时会被连接到目标代码中,程序运行时将不再需要该静态库。动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入,因此在程序运行时还需要动态库存在。本文主要通过举例来说明在L

2013-06-21 15:56:15

native-activity 工程完全注解

http://blog.csdn.net/flash129/article/details/8506348来源:http://wzhnsc.blogspot.com/2011/10/android-ndk-r5bsamplesnative-activity.html// android-ndk-r5b/samples/native-activity一、n

2013-06-05 16:43:26

详解 Android 的 Activity 组件

http://www.ibm.com/developerworks/cn/opensource/os-cn-android-actvt/简介: 本文详细介绍了 Android 应用编程中 Activity 的生命周期、通信方式和 Intent Filter 等内容,并提供了一些日常开发中经常用到的关于 Activity 的技巧和方法。通过本文,你可以进一步了接

2013-06-05 16:07:16

查看更多

勋章 我的勋章
    暂无奖章