自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一个奋斗者的专栏

有技术走遍天下!

  • 博客(22)
  • 收藏
  • 关注

翻译 大规模时间序列数据自动异常检测架构

Yahoo大规模时列数据异常检测技术及其高性能可伸缩架构本文已经在InfoQ首发本文是Yahoo在ACM国际会议上发布的一篇关于时序数据自动异常检测上的学术论文,对在智能监控尤其是趋势预测、异常数据监测和报警等方面的技术同学具有一定研究和参考价值,以下是中文翻译,部分内容进行了删改,附录是该论文的英文原文,方便读者查阅。

2017-09-05 11:34:46 42183

原创 微博广告Hubble系统:秒级大规模分布式智能监控平台架构实践

Hubble(哈勃,其含义是数据如浩瀚宇宙之大,Hubble如太空望远镜,能窥见璀璨的星辰,发现数据的真正价值)平台定位为微博广告智能全景监控、数据透视和商业洞察。微博广告 Hubble 平台每日处理 TB 级别的监控数据和万级别的报警规则,Hubble 平台利用机器学习技术进行趋势预测和报警阈值的智能调整,保证商业产品上千台服务器和数百个系统及服务的正常运行。

2017-07-15 11:12:29 2762

原创 IPOPT工具解决非线性规划最优化问题使用案例

ipopt是一个解决非线性规划最优化问题的工具集,当然,它也可以用于解决线性规划问题的求解。它提供了c/c++接口,非常易于使用。

2014-07-25 16:52:06 24817 2

原创 C语言面试题英文版

链接地址:http://www.iready.info/?p=196

2013-11-03 19:15:54 1832

原创 Google技术知多少

Google技术知多少posted by Andrew([email protected])google技术都具有标杆作用,也是体现了目前互联网各个技术的最高水平,其论文更是开源界的参考依据。下面从文件系统,分布式存储及高性能计算方面总结一下google的各大技术。文件系统GFS即Google File System,是google的分布式文件系统。GFS采用主从

2013-03-09 18:15:15 1201

翻译 Cassandra vs MongoDB vs CouchDB vs Redis vs Riak vsHBase vs Couchbase vs Neo4j vs Hypertable vsElast

Cassandra vs MongoDB vs CouchDB vs Redis vs Riak vsHBase vs Couchbase vs Neo4j vs Hypertable vsElasticSearch vs Accumulo vs VoltDB vs Scalariscomparison(Yes it's a long title, since people kept as

2013-03-04 13:07:59 2819

原创 搜索引擎中的查询模型

搜索引擎中的查询模型posted by Andrew ([email protected])2013-03-03搜索排序也是搜索引擎的核心部分,技术已经比较成熟,其中的查询检索模型主要有以下几个:1.布尔模型布尔模型是最简单的查询模型,文档包含查询词标记为1,否则为0,最后通过使用与或关系进行匹配。如用户查询词A && B && (C || D),假设只有4个文档,包

2013-03-03 13:26:21 1673

原创 压缩算法之Elias Gamma Coding & Elias Delta Coding

压缩算法之Elias Gamma Coding & Elias Delta CodingPosted by Andrew([email protected])2013-02-24基本概念压缩算法一般根据应用场景不同可分为文本压缩和索引压缩,后者是搜索引擎的核心技术之一。压缩的本质是对数据进行重新编码,编码依据是数据的分布特性,一般是概率分布情况,比如对于倒排索引中的数字编

2013-02-24 18:51:30 4480 1

转载 Sphinx

Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。Sphinx 单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0

2013-02-23 09:56:33 526

转载 Nginx 和Apache的思考

不断有人跟我说Nginx比Apache好、比Apache快之类。Nginx更主要是作为反向代理,而非Web服务器使用。我翻译过一本关于反向代理的技术书籍,同时精通Apache API开发,对Nginx和Apache的工作原理都略有了解,粗谈一下看法。  不管是Nginx还是Squid这种反向代理,其网络模式都是事件驱动。事件驱动其实是很老的技术,早期的select、poll都是如此。后来基于内

2013-02-23 09:53:30 493

原创 memcached常用命令

首先,需要了解Memcached协议,如果不清楚可参考《Memcached 协议中英文对照》。  1、数据存储(假设key为zhangyan,value为12345)printf "set zhangyan 0 0 5\r\n12345\r\n" | nc 127.0.0.1 11211 STORED  2、数据取回(假设key为zhangyan)printf "get z

2013-02-23 09:52:40 438

转载 MySql中的InnoDB与MyISAM类型解释

InnoDB和MyISAM是许多人在使用MySQL时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定。基本的差别为:MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持。MyISAM类型的表强调的是性能,其执行数度比InnoDB类型更快,但是不提供事务支持,而InnoDB提供事务支持已经外部键等高级数据库功能。  以下是一些细节和具体实现的差别:  ◆1.InnoD

2013-02-23 09:49:40 439

翻译 TOKYO TYRANT (TTSERVER)AND REDIS比较

服务端处理模型  在 tt server 中,是以多线程的方式向客户端提供服务的:一个主线程负责 accept 客户端的socket,一定数目的线程(可以指定)进行读写服务,同时,也有一定数目的timer线程,专门用来负责定时的任务,比如一些定时的 Lua 脚本,同时,如果是slaver,则会有专门一个timer线程,定时负责 do slave 的工作。  而在 Redis

2013-02-23 09:47:13 621

转载 Nginx+PHP

本文转自http://ixdba.blog.51cto.com/2895551/806622一、什么是 FastCGIFastCGI是一个可伸缩地、高速地在HTTP server和动态脚本语言间通信的接口。多数流行的HTTP server都支持FastCGI,包括Apache、Nginx和lighttpd等,同时,FastCGI也被许多脚本语言所支持,其中就有PHP。FastCGI

2013-02-23 09:45:14 528

原创 LevelDB参考资料

http://www.cnblogs.com/andrewzzb/archive/2013/01/09/2852543.html

2013-02-23 09:43:12 539

原创 玩转tokyotyrant

玩转tokyotyrant一 部署tokyocabinet是存储引擎DBMtokyo tyrant是一个可持久化的缓存服务器,类似memcachedb,tokyo tyrant本身是个缓存服务器,但需要tokyo cabinet作为存储引擎,就像memcachedb中的memcache需要berkeley db一样.当做为Hash表数据库使用时,每个key必须是不同的,因此无法存储

2013-02-23 09:41:52 576

转载 10个出色的NoSQL数据库

虽然NoSQL流行语火起来才短短一年的时间,但是不可否认,现在已经开始了第二代运动。尽管早期的堆栈代码只能算是一种实验,然而现在的系统已经更加的成熟、稳定。不过现在也面临着一个严酷的事实:技术越来越成熟——以至于原来很好的NoSQL数据存储不得不进行重写,也有少数人认为这就是所谓的2.0版本。这里列出一些比较知名的工具,可以为大数据建立快速、可扩展的存储库。1. Casssandra

2013-01-14 17:02:55 597

转载 vector clock algorithm (forward)

Vector Clock是Amazon’s Dynamo用来捕捉同一数据不同版本的对象的因果关系的一种算法。根据Dyanmo paper的描述,矢量时钟实际上是一个(node,counter)对列表(即(节点,计数器)列表)。矢量时钟是与每个对象的每个版本相关联。通过审查其向量时钟,我们可以判断一个对象的两个版本是平行分枝或有因果顺序。如果第一个时钟对象上的计数器在第二个时钟对象上小于或等于其他所

2013-01-14 16:55:51 725

转载 Cassandra简介及其压缩机制

本文转自:http://blog.nosqlfan.com/html/3258.htmlApache Cassandra是一套开源分布式Key-Value存储系统。它最初由Facebook开发,用于储存特别大的数据。Facebook目前在使用此系统。主要特性:分布式基于column的结构化高伸展性Cassandra的主要特点就是它不是一个数据库,而是由一堆数

2013-01-12 10:59:31 1940

转载 数据库缓存

本文的主要内容来源于MongoDB官方博客,由NoSQLFan补充说明,本文对传统的分布式Cache系统进行了分析,指出了其在缓存重建中会对数据库产生巨大压力的问题。并分析了MongoDB的mmap方案是如何规避这一问题的。如下图的架构,在数据库前端加上分布式的Cache(比如我们常用的Memcached),让客户端在访问时先查找Cache,Cache不命中再读数据库并将结构缓存在Cache中

2012-03-13 20:35:48 615

转载 32位系统迁移到64位系统注意事项(总结)

新近的64位平台在二进制上与32位应用程序兼容,这意味着可以非常简单地移植现有的程序。许多目前在32位平台上运行良好的程序也许不必移植,除非程序有以下要求:·需要多于4GB的内存。·使用的文件大小常大于2GB。·密集浮点运算,需要利用64位架构的优势。·能从64位平台的优化数学库中受益。否则,只需简单地重新编译一下,就已经足够了。大多数编写良好的程序不费吹灰之力就可移植到64位

2012-02-14 10:12:52 1101

原创 等待多时的博客计划启动了

终于开始写博客了,以往都是在QQ记事本里写些东西,今天百感交集,在CSDN上面写我的第一篇博客。写这一篇文章主要还是报个名,希望在博客中能够记录更多好的东西。

2012-02-08 20:37:47 375

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除