Chen_SL-CSDN博客

原创 Python中import语句用法详解

Python中模块导入主要有import ... 和 from ... import ... 两种方式。二者之间的主要区别是：导入模块后，命名空间的变化...

2022-12-28 20:26:59 18504

原创对Python中可迭代对象、迭代器、生成器等概念的理解

“迭代”是程序设计中的一个非常重要概念，它可以简单地理解为“重复地做一些事情”。Python提供了迭代器和生成器的功能，但这些概念不易掌握。这篇文章主要是总结下我个人的一些理解。不对之处，恳请各位批评指正。下面所有代码的运行环境为Python 3.6.8。一. 迭代的必要性Python程序设计中，我们为什么要学习迭代？首先，采用迭代可以方便地遍历集合类对象（list、tuple、range...

2019-10-16 16:54:10 537

原创 Ubuntu 18.04 + Docker + Nvidia Docker + Deepo 从零搭建深度学习环境

Ubuntu 18.04 系统安装完成后，我们从零开始搭建基于docker 的深度学习环境。整个安装过程主要分为4步：（1）安装nvidia驱动（2）安装docker （3）安装nvidia docker （4）拉取Deepo镜像。最后，我们通过tensorflow运行一个MNIST手写字符识别的例子来进行验证。一. 安装nvidia驱动1. 首先禁用nouveau驱动把 nouve...

2019-10-09 11:14:02 1550 1

背景我们生活中总是产生大量的文本，分析这些观察到的语料库是如何生成的就需要对文本进行建模。常见的文本建模方法包括：Unigram、PLSA、LDA 、词向量模型（CBOW、Skip-gram）等。LDA模型是一种主题模型（topic model），属于词袋（不关心词与词之间的次序）模型。模型描述人类所产生的所有语料文本我们都可以看成是上帝抛骰子生成的。我们观察到的只是上帝玩这个游戏的结果——词序列构

2018-01-13 10:02:33 5670

原创共轭先验分布

背景贝叶斯估计贝叶斯参数估计的思考过程可以用下面这个公式说明：先验分布+数据的知识=后验分布 (∗)先验分布+数据的知识=后验分布\ \ \ \ \ (*)共轭先验分布的提出当没有任何观察数据时，随机变量 θ\theta 服从概率分布 P(θ)P(\theta)当观测到新的数据 XX 时，有如下问题：可否根据新观测到的数据XX，更新参数 θ\theta

2018-01-11 15:23:54 3677 1

原创 Gamma分布、Beta分布、Dirichlet分布

Γ\Gamma 函数Γ\Gamma 函数是阶乘在实数上的推广，定义为： Γ(x)=∫+∞0tx−1e−t dt\Gamma(x) = \int_{0}^{+\infty} t^{x-1} e^{-t} \ dt Γ\Gamma 函数的性质： Γ(x+1)=xΓ(x)\Gamma(x+1) = x \Gamma(x) Γ(n)=(n−1)!\Gamma(n) = (n-1)!Gam

2018-01-10 18:47:51 24265 1

原创 Gibbs采样

背景之前介绍了Metropolis-Hastings采样算法，只考虑了一元概率分布的样本生成问题。本文讨论如何将MH算法扩展到多元分布上，重点讨论Gibbs采样算法。Blockwise updatingBlockwise updating 是将MH扩展到多元分布上最简单的方法，就是选择一个和目标分布有相同维度的建议分布。例如如果要生成 NN 元概率分布的样本，我们就采用一个 NN 元的建议分布（pr

2017-12-29 10:25:48 1041

原创 MCMC

背景给定一个的概率分布 p(x)p(x), 我们希望产生服从该分布的样本。前面介绍过一些随机采样算法（如拒绝采样、重要性采样）可以产生服从特定分布的样本，但是这些采样算法存在一些缺陷（如难以选取合适的建议分布，只适合一元随机变量等）。下面将介绍一种更有效的随机变量采样方法：MCMC 和 Gibbs采样，这两种采样方法不仅效率更高，而且适用于多元随机变量的采样。如果一定条件下，马尔可夫链可以收敛到平稳

2017-12-26 20:24:27 15232 8

原创马尔可夫链

背景马尔科夫性定义设 X(t),t∈T{X(t),t \in T} 是一个随机过程，如果 X(t),t∈T{X(t),t \in T} 在 t0t_{0} 时刻所处的状态已知，它在时刻 t>t0t>t_{0} 所处的状态的条件分布于其在 t0t_{0} 之前所处的状态无关。通俗地说，就是在知道过程现在的条件下，其将来的条件分布不依赖于过去，则称随机过程 X(t),t∈T{X(t

2017-12-26 11:23:26 4521

原创随机变量采样

背景概率图模型通常很复杂，难以精确求解。随机模拟等近似算法是处理复杂概率图模型的一种有效手段。许多近似算法的一个关键步骤是生成符合特定分布的样本。对于一些标准的概率分布（如均匀分布、正太分布、指数分布等），通常容易进行采样（例如Matlab 的 Statistics Toolbox 支持许多标准的概率分布）。但是对于复杂的概率分布，很难直接进行采样，因此，我们需要借助其他的手段。下面介绍两种针对复杂

2017-12-25 21:37:10 1976

原创蒙特卡罗模拟

背景随机模拟也可以叫做蒙特卡罗模拟(Monte Carlo Simulation)。这个方法的发展始于20世纪40年代，和原子弹制造的曼哈顿计划密切相关，当时的几个大牛，包括乌拉姆、冯.诺依曼、费米、费曼、Nicholas Metropolis，在美国洛斯阿拉莫斯国家实验室研究裂变物质的中子连锁反应的时候，开始使用统计模拟的方法并在最早的计算机上进行编程实现。均匀分布随机模拟中有一个重要的问题

2017-12-24 10:27:05 3365

原创 SVDFeature

SVDFeature 是由上海交大Apex Data & Knowledge Management Lab(APEX)开发的一个推荐系统工具包。他们提出了一种基于feature 的矩阵分解的框架。SVDFeature使设计推荐算法变得非常简单，只需在此框架内增加一些新的feature(如neighborhood特征、时间特征等)。SVDFeature 曾在KDDCup’11 track 1中取得单模

2017-11-06 20:29:19 4059 1

apache-maven-3.3.9-bin

2017-11-07

Recommender Systems Handbook

Recommender Systems Handbook.pdf 完整版 22.7M 推荐系统手册　

2017-11-06

IMDB影评倾向分类数据集

常用数据集IMDB影评倾向分类数据集。本数据库含有来自IMDB的25,000条影评，被标记为正面/负面两种评价。影评已被预处理为词下标构成的序列。

2017-09-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

chenshulong的博客