自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 决策树原理图表详解

决策树的原理,一个图表就很清楚了,首先,还是要牢记,条件熵是一种最优路径,是概率图模型中,两个随机变量之间的最优条件路径。也就是所有路径熵的期望。 H(Y|X) = -sigmaP(X,Y)logP(Y|X) = -sigmaP(X=xi)P(Y|X=xi)logP(Y|X=xi)=-sigmaP(X=xi)H(Y|X=xi)好了,废话少说,下图是决策树原理 特征A D1 D2 D

2016-08-19 11:55:01 2759

原创 PLSA隐变量主题模型的公式推导解惑

PLSA隐变量主题模型,公式推导网上也好,还是书上也好,都属于从略。但是无论对于新手来说,还是老手,从略是不合适的,这不是一个科学对待的态度。机器学习就这么几个模型,从略是不是也对不起自己了好了,闲话少说:这是第一步,都是使用的条件概率公式,当然,分母p(di,wj)的分解,使用的是CK方程,一会再说。要使第一步成立,则如图所示,p(wj|zk,di)必须等于p(wj|zk

2016-08-04 14:58:13 825

原创 最大熵疑难辨析

如果所示一般的,对模型目的都没有疑问,可能有问题的是后面的特征函数与约束条件,为什么要这么搞。比如约束条件中,为什么是p(x,y)而非p(x|y),特征函数为什么是f(x,y)个人看法,要统计p(x|y),就没法做sigma,因为对X求和,就等于1了,等于固定了Y。这样不能体现全局的统计意义。

2016-07-30 21:52:28 357

原创 条件熵的辩疑

条件熵的形式如下: (8.8)这个形式与熵的定义形式,咋一看是冲突的,因为不是p(x|y),而是p(x,y)但是,这个式子是没有问题的,请看下图上面得到的计算公式是针对y为一个特殊值y时求得的熵。也就是说,对条件概率p(x|y)求西格玛x, 西格玛y的时候,首先是固定y,对西格玛X求和这也符合条件概率的定义,p(x|y) 如果求西格玛,好像不能先固定X,对Y

2016-07-30 19:52:00 696

原创 朴素贝叶斯里面的一个比较容易误导人的地方

贝叶斯定理:      这个地方一般都很清晰,没人闹不明白这个则根据贝叶斯定理有如下推导:      到这儿,就有点容易让人蒙圈。因为我们知道,概率里面p(x)是对x这个值的所在集合,求概率。但是这个地方不是,p(x|yi)中的x,不是一个集合,而是一个联合分布。不是P(x)=P(x1)+..P(xi),而是P(x)=P(

2016-07-30 08:41:37 417

原创 pandas的to_csv方法

pandas.DataFrame.to_csvDataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None

2016-07-06 16:30:07 75270 2

原创 tensorflow读取数据之CSV格式

tensorflow要想用起来,首先自己得搞定数据输入。官方文档中介绍了几种,1.一次性从内存中读取数据到矩阵中,直接输入;2.从文件中边读边输入,而且已经给设计好了多线程读写模型;3.把网络或者内存中的数据转化为tensorflow的专用格式tfRecord,存文件后再读取。其中,从文件中边读边输入,官方文档举例是用的CSV格式文件。我在网上找了一份代码,修改了一下,因为他的比较简略

2016-07-06 13:56:09 23080 2

原创 关于tensorflow 的数据读取线程管理QueueRunner

TensorFlow的Session对象是可以支持多线程的,因此多个线程可以很方便地使用同一个会话(Session)并且并行地执行操作。然而,在Python程序实现这样的并行运算却并不容易。所有线程都必须能被同步终止,异常必须能被正确捕获并报告,回话终止的时候, 队列必须能被正确地关闭。所幸TensorFlow提供了两个类来帮助多线程的实现:tf.Coordinator和 tf.Que

2016-07-05 16:08:16 17095 6

原创 mac上安装docker + tensor flow

tensor flow官方文档明确指出,可以用docker进行安装。因此尝试了一下。首先直接下载docker安装包,因为用命令是链接不上的,被墙。地址如下 http://wiki.jikexueyuan.com/project/tensorflow-zh/faq.html然后再下载tensor flow的打包镜像,同样被墙,我是用pansoso搜了一个百度网盘下载。

2016-06-29 19:15:33 1679

原创 tensorflow示例代码注释5

06_autoencoder.pyimport tensorflow as tfimport numpy as npimport input_datamnist_width = 28n_visible = mnist_width * mnist_widthn_hidden = 500corruption_level = 0.3# create n

2016-06-29 14:40:57 952

原创 tensorflow示例代码注释4

05_convolutional_net.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_databatch_size = 128test_size = 256def init_weights(shape):    return tf.Varia

2016-06-28 15:02:25 626

原创 tensorflow示例代码注释3

04_modern_net.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_datadef init_weights(shape):    return tf.Variable(tf.random_normal(shape, stddev=0.01))

2016-06-28 14:10:33 563

原创 tensorflow示例代码注释2

02_logistic_regression.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_data//random_normal返回一个tensor其中的元素的值服从正态分布,stddev标准差def init_weights(shape):

2016-06-28 10:47:45 2155

原创 tensorflow示例代码注释1

#!/usr/bin/env pythonimport tensorflow as tf//导入numpy科学计算包import numpy as np//numpy.linspace(start,stop, num=50, endpoint=True, retstep=False, dtype=None),分配从-1到1中间的101个数,包含-1和1,构成

2016-06-28 10:01:28 703

原创 caffe安装过程记载

前言:网上很多CAFFE安装教程,自己装的过程跟网上还是有出入,把各种问题都记录下来,方便以后查找首先,是学习了寒老师的安装教程, 地址https://www.zybuluo.com/hanxiaoyang/note/364680我使用的是centos7.2, 符合教程中的要求。安装到教程中第5步,出现了numpy安装不上的问题,多安装两边就装上了。这一个环节是

2016-06-24 10:18:30 344

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除