sunquan_ok-CSDN博客

原创决策树原理图表详解

2016-08-19 11:55:01 2759

原创 PLSA隐变量主题模型的公式推导解惑

PLSA隐变量主题模型，公式推导网上也好，还是书上也好，都属于从略。但是无论对于新手来说，还是老手，从略是不合适的，这不是一个科学对待的态度。机器学习就这么几个模型，从略是不是也对不起自己了好了，闲话少说：这是第一步，都是使用的条件概率公式，当然，分母p(di,wj)的分解，使用的是CK方程，一会再说。要使第一步成立，则如图所示，p(wj|zk,di)必须等于p(wj|zk

2016-08-04 14:58:13 825

原创最大熵疑难辨析

如果所示一般的，对模型目的都没有疑问，可能有问题的是后面的特征函数与约束条件，为什么要这么搞。比如约束条件中，为什么是p(x,y)而非p(x|y),特征函数为什么是f(x,y)个人看法，要统计p(x|y)，就没法做sigma,因为对X求和，就等于1了，等于固定了Y。这样不能体现全局的统计意义。

2016-07-30 21:52:28 357

原创条件熵的辩疑

条件熵的形式如下：（8.8）这个形式与熵的定义形式，咋一看是冲突的，因为不是p(x|y),而是p(x,y)但是，这个式子是没有问题的，请看下图上面得到的计算公式是针对y为一个特殊值y时求得的熵。也就是说，对条件概率p(x|y)求西格玛x, 西格玛y的时候，首先是固定y,对西格玛X求和这也符合条件概率的定义，p(x|y) 如果求西格玛，好像不能先固定X，对Y

2016-07-30 19:52:00 696

原创朴素贝叶斯里面的一个比较容易误导人的地方

贝叶斯定理：这个地方一般都很清晰，没人闹不明白这个则根据贝叶斯定理有如下推导：到这儿，就有点容易让人蒙圈。因为我们知道，概率里面p(x)是对x这个值的所在集合，求概率。但是这个地方不是，p(x|yi)中的x,不是一个集合，而是一个联合分布。不是P(x)=P(x1)+..P(xi),而是P(x)=P(

2016-07-30 08:41:37 417

原创 pandas的to_csv方法

pandas.DataFrame.to_csvDataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None

2016-07-06 16:30:07 75270 2

原创 tensorflow读取数据之CSV格式

tensorflow要想用起来，首先自己得搞定数据输入。官方文档中介绍了几种，1.一次性从内存中读取数据到矩阵中，直接输入；2.从文件中边读边输入，而且已经给设计好了多线程读写模型；3.把网络或者内存中的数据转化为tensorflow的专用格式tfRecord,存文件后再读取。其中，从文件中边读边输入，官方文档举例是用的CSV格式文件。我在网上找了一份代码，修改了一下，因为他的比较简略

2016-07-06 13:56:09 23080 2

原创关于tensorflow 的数据读取线程管理QueueRunner

TensorFlow的Session对象是可以支持多线程的，因此多个线程可以很方便地使用同一个会话（Session）并且并行地执行操作。然而，在Python程序实现这样的并行运算却并不容易。所有线程都必须能被同步终止，异常必须能被正确捕获并报告，回话终止的时候，队列必须能被正确地关闭。所幸TensorFlow提供了两个类来帮助多线程的实现：tf.Coordinator和 tf.Que

2016-07-05 16:08:16 17095 6

原创 mac上安装docker + tensor flow

tensor flow官方文档明确指出，可以用docker进行安装。因此尝试了一下。首先直接下载docker安装包，因为用命令是链接不上的，被墙。地址如下 http://wiki.jikexueyuan.com/project/tensorflow-zh/faq.html然后再下载tensor flow的打包镜像，同样被墙，我是用pansoso搜了一个百度网盘下载。

2016-06-29 19:15:33 1679

原创 tensorflow示例代码注释5

06_autoencoder.pyimport tensorflow as tfimport numpy as npimport input_datamnist_width = 28n_visible = mnist_width * mnist_widthn_hidden = 500corruption_level = 0.3# create n

2016-06-29 14:40:57 952

原创 tensorflow示例代码注释4

05_convolutional_net.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_databatch_size = 128test_size = 256def init_weights(shape): return tf.Varia

2016-06-28 15:02:25 626

原创 tensorflow示例代码注释3

04_modern_net.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_datadef init_weights(shape): return tf.Variable(tf.random_normal(shape, stddev=0.01))

2016-06-28 14:10:33 563

原创 tensorflow示例代码注释2

02_logistic_regression.py#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npimport input_data//random_normal返回一个tensor其中的元素的值服从正态分布,stddev标准差def init_weights(shape):

2016-06-28 10:47:45 2155

原创 tensorflow示例代码注释1

#!/usr/bin/env pythonimport tensorflow as tf//导入numpy科学计算包import numpy as np//numpy.linspace(start,stop, num=50, endpoint=True, retstep=False, dtype=None)，分配从-1到1中间的1０１个数，包含-1和1，构成

2016-06-28 10:01:28 703

原创 caffe安装过程记载

前言：网上很多CAFFE安装教程，自己装的过程跟网上还是有出入，把各种问题都记录下来，方便以后查找首先，是学习了寒老师的安装教程, 地址https://www.zybuluo.com/hanxiaoyang/note/364680我使用的是centos7.2, 符合教程中的要求。安装到教程中第5步，出现了numpy安装不上的问题，多安装两边就装上了。这一个环节是

2016-06-24 10:18:30 344

sunquan_ok的博客