4 cute_Lily

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 4w+

逻辑回归(Logistics Regression)

逻辑回归(Logistics Regression)的目的其实是分类,它的本质是一种二分类方法。1、Sigmoid 函数逻辑回归的思想其实非常巧妙,既然我们希望做二分类,那就令这两类的标签为 {0,1}\{0,1\}{0,1}(这里令1为正例,0为负例),对所有的样本 xxx,令 xxx 用来分类的变换值为 zzz (通常 z=wTx+bz=w^Tx+bz=wTx+b),令 yyy 为样本 x...

2019-12-22 16:19:30

朴素贝叶斯分类器

朴素贝叶斯分类器是经典的机器学习算法之一,它是一种基于概率论的分类算法。它的基本思想就是基于概率和误判损失来选择最优的类别标记,常用于垃圾邮件过滤等。1、贝叶斯公式贝叶斯公式是朴素贝叶斯分类器的基础,该公式中最重要的两个因素是先验概率和后验概率,首先来介绍一下先验概率和后验概率的概念:先验概率:是指根据以往经验和分析得到的概率;后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引...

2019-12-15 20:16:10

8 Planning and Learning with Tabular Methods

【上一节 [Multi-step Bootstrapping] (https://blog.csdn.net/coffee_cream/article/details/81053960)】本节创建了一种统一的方法视图,其中既包括需要一个环境模型)的方法(如动态编程、启发式搜索等,也包括一些不依赖于模型的方法(如蒙特卡洛、temporal-difference等),这里将前者视为是一种 plan...

2018-09-16 14:45:55

解决Windows Task Scheduler执行exe时 can't open Files

问题描述自己用C#编写一个exe,希望利用windows task schedule定时执行这个exe,其中这个exe读取了同一个文件夹中自己写的config.ini数据,在文件夹中点击exe完全正常,但是windows task schedule在run这个exe时总是说“can’t open config.ini”问题的原因代码中的config.ini引用的是相对路径,window...

2018-07-15 16:27:43

7 Multi-step Bootstrapping

【上一节Temporal-Difference (TD) Learning 】1、n-step TD PredictionTD 和 蒙特卡洛方法在原理上是有一定区别的,例如利用在给定规则 ππ{\pi} 下产生的样本 episodes 来估计 vπvπv_{\pi},蒙特卡洛方法会基于整个 episode 结束之后的 reward 来对每个状态进行更新。而 one-step TD 方法...

2018-07-15 16:11:30

Windows10 下安装 Glide 包

Windows10 下安装 Glide 包初次学习go语言,因为要用glide,但是github上关于Windows安装的方法又出了bug,弄了半天才弄好,写个教程记录一下~一、已有的安装环境1、已经安装好了 go 2、设置好了环境变量 GOPATH,下面均用 $GOPATH 代表这个路径二、下载文件 在https://github.com/Masterminds/glide/releases上

2017-11-09 19:49:47

6 Temporal-Difference (TD) Learning

Temporal-difference (TD) learning

2017-04-16 11:35:49

5 蒙特卡洛方法 (Monte Carlo Method)

蒙特卡洛(MonteCarlo,MC)方法——增强学习方法之一

2017-03-27 15:36:07

4 动态编程(Dynamic Programming, DP)

动态编程

2017-03-17 17:31:10

特征选择

特征选择方法介绍

2017-03-11 18:41:18

LVW(Las Vegas Wrapper)特征选择算法简单介绍

LVW(Las Vegas Wrapper)特征选择方法

2017-03-11 17:56:03

Relief 特征选择算法简单介绍

Relief(Relevant Features)算法简单介绍

2017-03-11 16:56:11

3 有限马尔可夫决策过程(Finite Markov Decision Processes)

有限马尔可夫过程初步介绍

2017-03-05 20:26:21

2 从Multi-arm Bandits问题分析 - RL进阶

从k-armedBandit问题进行分析,进一步理解RL问题的解决思想

2017-02-27 16:35:04

1 强化学习(Reinforcement Learning, RL)初步介绍

强化学习概念介绍

2017-02-25 17:59:46

Python使用Ckan API查询用户的私有数据集

Python使用Ckan API查询用户的私有数据集

2016-07-29 13:48:36

Python使用Ckan API查找并展示特定的resource内容

Python使用Ckan API查找并展示特定的resource内容

2016-07-29 11:29:13

Python使用Ckan API获得CKAN的group列表

Python使用Ckan API获得CKAN的group列表

2016-07-29 11:23:13

Python使用Ckan API创建并上传resource

Python使用Ckan API创建并上传resource

2016-07-29 11:18:36

Python使用Ckan API创建CKAN的package

Python使用Ckan API创建package

2016-07-29 11:12:28

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。