10 JasonCcccc

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 2w+

编译安装nginx并配置ssl加密的代理服务

编译安装nginx并配置ssl加密的代理服务前期准备安装编译需要的gcc和gcc-c++ yum install -y gcc gcc-c++ 安装nginx依赖pcre-devel、openssl-devel、zlib-devel yum install -y pcre pcre-devel openssl openssl-devel zlib zlib-devel 准备源码...

2018-04-02 10:15:02

理解皮尔逊相关系数(Pearson Correlation Coefficient)

要理解Pearson相关系数,首先要理解协方差(Covariance),协方差是一个反映两个随机变量相关程度的指标,如果一个变量跟随着另一个变量同时变大或者变小,那么这两个变量的协方差就是正值,反之相反,公式如下:cov(x,y)=∑ni=1(xi−xμ)(yi−yμ)n−1cov(x,y)=∑i=1n(xi−xμ)(yi−yμ)n−1cov(x,y)=\dfrac{\sum_{i=1...

2018-03-13 01:24:57

随机森林算法小结

随机森林算法1.随机森林原理介绍Random Forest 是 ensemble learning (集成学习?)算法的一种,它利用多棵树对样本进行训练并预测的一种分类器,同样也可用户回归,其输出的类别是由个别树输出的类别的众数而定。 该算法最早由Leo Breiman和Adele Cutler提出, 而”Random Forests”是他们注册的商标。

2017-01-12 10:41:39

决策树、ID3、C4.5以及CART算法小结

决策树、ID3、C4.5以及CART算法决策树模型在监督学习中非常常见,可用于分类和回归。虽然将多棵弱决策树的Bagging、Random Forest、Boosting等tree ensemble 模型更为常见,但是“完全生长”决策树因为其简单直观,具有很强的解释性,也有广泛的应用,而且决策树是tree ensemble 的基础,值得好好理解。

2017-01-02 19:56:52

Data Visualization - Dot Lang & Graphviz

Data Visualization - Dot Lang & Graphviz

2016-12-28 13:52:41

Huffman树与Huffman编码

Huffman树与Huffman编码Huffman树的定义Huffman Tree(哈夫曼/霍夫曼树)即最优二叉树,特点为给定n个权值作为n个叶子结点构造一棵二叉树,使得带权路径长度达到最小。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。在树的基本定义中,树的带权路径长度为树中所有叶子结点的带权路径长度之和

2016-12-20 22:10:10

Ubuntu Linux GUI desktop

原文地址: https://linuxconfig.org/how-to-install-gui-desktop-environment-on-ubuntu-linux-14-04-lts-trusty-tharHow to install GUI desktop environment on Ubuntu Linux 14.04 LTS (Trusty Thar)

2016-12-20 10:26:35

Python 的 input() 与 raw_input()

Python 的 input() 与 raw_input()Python中用于接收键盘输入的方法有input()与raw_input()。

2016-12-13 11:48:35

Apache Kafka:下一代分布式消息系统

原文:http://www.wtoutiao.com/p/Ef6Jmn.htmlKafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注Kafka的应用以及发展,“Kafka剖析”专栏将会从架构设

2016-09-21 17:19:39

Hadoop Job 中 Map 与 Reduce 数量控制

在Hadoop 中提交的job 时常需要对其运行时的map task 和reduce task数量进行控制,reduce的数量可以通过setNumReduceTasks() 函数简单设置,但map task 数量并不简单由 setNumMapTasks() 控制。具体会影响到map task 数量的因素(参数)有: blockSize: HDFS block大小,默认为64MB totalSiz

2016-09-05 21:31:51

Python 内置函数 zip()

zip()是Python的一个内建函数,它接受一系列可迭代的对象作为参数,将对象中对应的元素按顺序组合成一个tuple,每个tuple中包含的是原有序列中对应序号位置的元素,然后返回由这些tuples组成的list。若传入参数的长度不等,则返回list的长度和参数中长度最短的对象相同。在所有参数长度相同的情况下,zip()与map()类似,没有参数的情况下zip()返回一个空list。

2016-08-22 12:32:30

大数据 - 从理论到实践

原文: What is Big Data – Theory to ImplementationJava Code Geeks联合创始人Byron Kiourtzoglou发表文章,从理论到实践剖析了大数据的4个V,并于文章最后分享了Java工程师可能会需要的13个主流开源大数据工具。

2016-08-22 10:29:18

Python 中的 file.flush() 与 os.fsync()

在Python 官方文档https://docs.python.org/2/library/stdtypes.html?highlight=file%20flush#file.flush 关于file.flush() 的说明中写道:“ flush() does not necessarily write the file’s data to disk. Use flush() followed by

2016-08-14 23:28:48

Python 中的线程安全(threadsafe) 与 GIL

Python 中的线程安全(thread-safe)与 GIL线程安全是在多线程的环境下,能够保证多个线程同时执行时程序依旧运行正确, 而且要保证对于共享的数据可以由多个线程存取,但是同一时刻只能有一个线程进行存取。多线程环境下解决资源竞争问题的办法是加锁来保证存取操作的唯一性。通常加锁也有2种不同的粒度的锁: 1. fine-grained(细粒度),程序员需要自行加/解锁来保证线程安全 2.

2016-08-14 22:40:51

Python 的 with ... as ... 语句

Python 的 with … as … 语句with从Python 2.5就有,需要from __future__ import with_statement,自python 2.6开始,成为默认关键字。 with 语句作为 try/finally 编码范式的一种替代,用于对资源访问进行控制的场合,确保不管使用过程中是否发生异常都会执行必要的“清理”操作,释放资源,比如文件使用后自动关闭、线程中

2016-08-04 15:58:40

Python iterable, iter(), __iter__, iterator, itertools

Python迭代器与iter()迭代器是在版本2.2被加入到python的,它为类序列对象提供了一个类序列的接口。Python的迭代无缝地支持序列对象,而且它还允许迭代非序列类型,包括用户定义的对象。 迭代器用起来很灵巧,可以迭代不是序列但表现出序列行为的对象,例如字典的键、一个文件的行,等等。使用循环迭代一个对象条目时,几乎分辨不出它是迭代器还是序列。开发者不必关注这些,因为Python让它像一

2016-08-04 13:46:23

Python list 之 append 和 extend

Python list 之 append 和 extend 的区别append和extend都仅只可以接收一个参数,append 任意,甚至是tuple,extend 只能是一个列表>>> myList = [1,2.0,'a']>>> myList[1, 2.0, 'a']>>> myList.append('APP')>>> myList[1, 2.0, 'a', 'APP']>>>

2016-08-04 13:45:25

Python 中的 set 与 frozenset

set与frozenset的区别ref : https://docs.python.org/2.4/lib/types-set.html 同多数语言一样,set表示集合,最重要的特性就是无序,所以Python中的set不支持indexing,但支持len(set),x in set 等操作。 set有两种类型,set和frozenset。 set是可变的,有add(),remove()等方法。

2016-08-04 13:43:06

进程与线程

多任务简单地说就是操作系统可以同时运行多个任务(或者叫应用程序,Application)。比如打开一个浏览器就是启动一个浏览器进程,打开一个播放器就是启动一个播放器进程。一个进程(Process)中可能同时处理多个任务,比如播放器要同时播放视频和音频,那么进程内的子任务称为线程(Thread)。一个进程至少包含一个线程。大部分操作系统(如Windows、Linux)的任务调度是采用时间片轮

2016-08-02 14:14:40

SciPy Hierarchical Clustering and Dendrogram Tutorial

ref: https://joernhees.de/blog/2015/08/26/scipy-hierarchical-clustering-and-dendrogram-tutorial/This is a tutorial on how to use scipy's hierarchical clustering.One of the benefits of hi

2016-07-11 16:58:10

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 分享精英
    分享精英
    成功上传11个资源即可获取