自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

romandion的专栏

创新缔造未来,专注铸就卓越

  • 博客(352)
  • 资源 (4)
  • 收藏
  • 关注

原创 高性能服务系列【十二】终篇:等待的代价

高性能服务系列的核心关键是减少等待时间,提升有效的CPU时间。假设一切都是正常的,没有低级错误,那么影响性能的几个因素,在之前几个篇章都提到过,这里做下总结。

2024-04-02 22:51:27 349

原创 高性能服务系列【十一】主题匹配

主题匹配核心算法就是字符串匹配,虽然是体现在应用层面上,但该算法效率最终会影响到服务性能,所以仍然有讨论的必要。

2024-03-26 13:25:52 483

原创 高性能服务系列【十】无锁队列

无锁结构本身就是为了提高性能,减少多线程互锁切换,导致的性能损失。因此,基于固定长度数组实现的无锁队列最为流行。无锁队列对于多读多写的算法虽然十分复杂,但原理可以从自旋锁进行推演出来。

2024-03-21 12:37:29 255

原创 高性能服务系列【九】内外网之分

反向代理和网关一样,是内外网的一个重要边界,通常运行在传输层之上的应用层。所以,性能就会受到两个重要因素的影响,网络IO和应用层编解码性能。如果将nginx作为内网的API网关,那么就是另外一个考量,现代网络传输技术,对其有巨大的加成。

2024-03-19 11:38:29 327

原创 高性能服务系列【八】C10M时代,网络IO库需要重建

现代网卡已经普遍支持10Gb,100Gb也不少见。为了解决C10K问题而提出的多路复用iocp/epoll解决方案已经无法提升性能的需求。内核TCP/IP协议栈延迟的占比就凸显出来,内核已经不是解决问题,而是问题本身。C10M时代已经到来了。

2024-03-14 12:34:45 376

原创 高性能服务系列【七】网络的延迟构成

在网络中,点到点的延迟,最大因素是物理距离。其次是RTO,超时重传。还有滑动窗口和拥塞控制算法。在高速网络中,比如40Gbps,甚至100Gbps的网络,网络传输速度已经和芯片内部的传输速度相差无几,对程序提出更苛刻的要求。

2024-03-13 14:06:57 395

原创 高性能服务系列【六】网络的有效载荷

网卡标注的是物理层比特流速度,并不是网络层的网速。要计算应用层的有效载荷,先根据网速计算出PPS,再扣去以太网帧,链路层,IP层、TCP层这些固定损耗,就能得出每个数据包最大和最小有效载荷。对于TCP稍微要麻烦点,因为有些ACK包,还有重传包,同样也会消耗掉有效载荷。

2024-03-10 19:45:21 416

原创 高性能服务系列【五】进程

进程是操作系统管理分配资源的基本单位,线程是操作系统调度CPU的基本单位,进程之间,是没有直接关系的。所以,一个进程的崩溃不会影响到另外一个进程的运行。基于这个特性,在追求高可靠的系统中,往往会采用多进程模型。

2024-03-07 13:39:56 309

原创 高性能服务系列【四】线程

线程之间同步采用互斥锁的粒度太大,容易导致等待,以及上下文切换。再后来又出现读写锁,减少锁的几率。自旋锁这种更低粒度的锁,避免线程切换的同时,也能避免内核态和用户态的切换,减少性能损失。

2024-03-05 11:12:37 319

原创 高性能服务系列【三】CPU和内存2

随着现代服务器主板上挂载的CPU越来越多,一个很显然的限制,就是FSB和北桥芯片的带宽跟不上,于是NUMA架构被提出。NUMA的几个特点,就是为了解决FSB和北桥芯片的瓶颈问题。

2024-03-03 22:29:20 335

原创 高性能服务系列【二】CPU和内存

在物理核上,主要有L1和L2高速缓存,L3高速缓存目前是片内共享的,即整个CPU内部共享的。更早之前,L2和L3是集成在主板上。L1高速缓存被拆分成L1d和L1i,即数据缓存和指令缓存。

2024-03-02 22:09:34 325

原创 高性能服务系列【一】序言

从最基础的硬件开始,到操作系统,到线程、进程,再到网络,顺带磁盘存储。以这些内容为基础,扩展分布式系统。中间穿插讲解一些关键技术的理解。

2024-03-02 21:51:51 415

原创 微服务讲堂--【6】系统稳定性

稳定性,通常是以可靠性来衡量,即我们常说的几个9,这个主题在之前各个系列文章中已经提到过,本来没有打算单独写一篇。前几天一个老同事在群里发出一个灵魂之问,“如何解决生产环境更新系统后的稳定性问题”。因此,觉得有必要再专门就这个主题做一个论述,也考虑这个主题内容实在太多了,以列举核心内容和纲要为主。在所有论述之前,必须深刻认识到两个核心原则:1、任何系统都会出错。要将可靠性从99%提高到99.9%,虽然只提高0.9%可靠性,但故障率降低了10倍,研发成本需要慎重考虑,极大可能也是要增加10倍。2、

2021-02-09 22:55:56 583

原创 微服务讲堂--【5】系统自举

这里的“系统自举”借用了操作系统的概念。在操作系统启动之前,计算机要先加载自举程序,再由自举程序加载操作系统的启动程序。整个详细过程不在这里描述,可以在网络查阅相关资料。 为什么要在微服务系统中特别提及系统自举这个概念呢,因为这内容很重要,而且常常被忽略,以至于很多人对这个过程一无所知。这个部分过程之所以重要,因为他是整个微服务系统的起点。在微服务首次部署或者迁移、扩容的时候,都会面临一个问题,如何在一个空操作系统里,快速部署并启动一个微服务。 当一套应用系统,不论他是否是微服务...

2021-01-25 22:58:22 991 1

原创 微服务讲堂--【4】风洞系统

一、系统特性风洞是以人工的方式产生并且控制气流,用来模拟飞行器周围气体的流动情况,并可测量气流对飞行器的作用效果以及观察物理现象的实验设备。这个定义来自百度百科,微服务和飞行器压根就搭不上边,之所以要在微服务架构中借用风洞的概念,用于形象描述一种自动化测试的解决方案,主要在于风洞有这么几点特性和这个解决方案极为相似。以下称飞行器模拟测试环境为【风洞】,称微服务模拟测试系统为【风洞系统】...

2020-04-28 15:29:31 1113

原创 如何利用qpid构建分布式总线

和所有基于Broker总线一样,qpid本身架构是联邦制的总线集群,这意味着,一份数据需要在多个broker之间互相备份。这个架构是AMQP定义的,本身并没有什么问题,因为AMQP是为交易而生的,对数据准确可靠的要求远远超过对性能的要求。我们看到在很多公有云中,也经常使用AMQP的另外一个实现RabbitMQ。和qpid一样,这两者之间基本可视为等价,知识每个供应商有所偏好,但各项指标...

2020-03-31 18:55:02 633

原创 微服务讲堂---【3】分布式架构

在写下其他文字之前,必须先声明下,这篇文章不是介绍讨论关于分布式技术的,而是讨论分布式架构在微服务架构中的价值和弊端。分布式技术经过多年的发展,已经相对很成熟,相关文章很多,所以不是本文的重点。在阅读下文之前,我推荐先阅读以下三篇文章,特别是最后一篇,有比较完整的阐述。http://2012.33degree.org/pdf/JamesLewisMicroServices.pdf htt...

2020-03-29 13:34:16 214

原创 落地系统解决方案探讨

落地系统的高收入让很多开发商趋之若鹜,但同样高昂的开发和维护成本,让很多开发商伤不起。扣去功能研发外,如何降低成本,是落地系统的解决方案不得不面对的关键。落地系统的最佳解决方案就是不落地,这话可不是在开玩笑,而是一个朴素的道理,能不落地的,尽量不落地。落地系统之所以有难度,主要在于以下几点痛点:1、落地系统是被部署于一个封闭的环境中,难以及时获取实时信息,运维和监控难度较大。这一点有点类似...

2020-02-16 22:48:24 756

原创 金融信息破局刍议【4】长尾效应

谷歌的搜索引擎改变了广告方式,让门户网站和传统媒体很受伤;亚马逊让实体书店哀鸿遍地。这些企业在细微处改变了生活,让生活更加便利。携巨大的用户量,改变原来行业的游戏规则,让马车消失的是汽车,而不是其他马车。阿里巴巴收购大润发后,黄明端发文表示:他战胜了所有对手,却输给了时代。这个感慨犹如巨钟之音,震耳发聩。任何企业再大,竞争门槛再高,都离不开用户规模。金融信息本身并...

2019-10-26 17:24:09 346

原创 自研还是外购?

一、正反案例在软件公司,特别容易发生自己研发还是采购外部软件的争议,根源在于大家都喜欢表现一下,展示一下水平。这两种选择其实很难有个标准答案,因时因势而异;大到国家之间,小到个人生活,包括社会生活,甚至自然环境,但是原则却是一样的。淘宝初期,马云用信用卡采购现成社区网站,十年之后,发展到能支撑双十一,冠绝全球;京东自建物流仓储,提高用户体验;腾讯自研QQ、微...

2019-10-24 16:44:27 3729

原创 上海滨江健走有感

2019年3月8日一轮明月升云端,两行足印向远方。车马喧嚣夜正酣,漕舫争流为谁忙?几度寒暑离爹娘,谁人锦衣归故乡?岁月更新上海滩,碧水长流黄浦江。...

2019-03-12 14:11:21 344

原创 微服务讲堂---【2】审视RESTful

一、前因后果在写后续文字之前,首先申明两点:1、无意于引起编程语言和架构设计之争;2、对网页开发和使用Java、Python的程序员没有鄙视链。本文仅仅从自身经历过的事情,来讨论RESTful。我在金融软件开发领域工作多年,主要开发交易行情类和资讯类系统。经常遇到互联网领域,特别是做网页的同事,与此讨论关于系统架构的设计,是件令人头疼的事情。以行情发布系统为例,这系统不是像新浪财经,分钟级...

2019-03-06 12:18:04 341

原创 msvcrt-vs2017的编译机制

vs对于C/C++开发者来说,还是比较易用和友好的IDE。虽然我经常开发linux下的服务,也用过vi、kdeveloper、qtcreator等Linux下的IDE环境,但从开发效率而言,最终还是选择在VS下开发调试,再到linux下编译运行。跨平台部分可以简单地采用boost或者自己写一些简单地封装。vs的c++实现还算可以,但在posix c部分,差得很远。导致原生linux下的代码,在...

2019-03-01 12:28:03 1244

原创 qpid-lite,一个清晰版的qpid-amqp

        qpid是一个伟大的软件,apache社区的顶级项目绝非徒有虚名。从2012年开始使用至今,在线上从未发生过事故,一直稳定运行。但从一个20年职业老鸟的角度来看源码的话,还是存在不少问题。一个直观的判断,qpid项目组应该是一群写java的程序员转行写c++代码,我在qpid项目源码中,看到太多java的编程技巧,或者他们是c++深度践行者。一、源码结构问题    1、代码...

2019-02-19 20:59:47 652

原创 数据亲和架构--流式计算

       关于计算有很多名词,比如实时计算、分布式计算,以及这里提到流式计算等等。他们是从计算形势的不同维度来描述,不必争议孰优孰劣。流式计算主要从数据的形态来定义的一种计算方式,顾名思义,这种数据如流水一般,没有终点。一个有争议的特征的是,流式数据之间是否具有时序性,我赞同流式数据之间应该假定为具有时序性,并由此引申出,计算是有状态的,具有上下文关系。虽然可以通过各种手段,将状态依赖降到零,...

2018-12-04 11:40:59 621

原创 数据亲和架构--领域语言

       在IT届,一谈起编程语言之间的优劣,可以掀起一场世界大战。即使已经封神的Torvalds也不能免俗,对C++数度开火,更别人说其他语言,压根就不在火力范围内。就我个人而言,启蒙是C语言,用的多是C++,工作范围主要网络、应用系统底层框架、高性能低延迟的应用,所以即使是写C++代码,感觉也类似C语言,很少用高级特性。java、python、lua、php等都用过,因为要做的工作不多,所...

2018-11-16 13:31:10 209

原创 数据亲和架构--事件矩阵

       事件模型对于提高系统性能起到关键的作用,特别是网络IO模型,如EPOLL和IOCP已经深入人心。还有比较少为人知的事件处理引擎,用于高性能的商业逻辑实现。网络IO模型位于系统底层,深入研究的人为数不多,幸好接口很简洁,绑定句柄和事件,当事件触发时,会通知上层应用。在网络IO模型中,可以管理大量的句柄,但事件却只能是有限的几种,一个EPOLL句柄只能算一个观察者。        在...

2018-11-07 11:54:13 545

原创 windows下qpid-cpp 1.38.0编译实录

一、编译环境1、vs2017社区版15.5.3 ,.NET Framework 4.7.030562、从www.boost.org上下载boost 1.68.0源码3、从qpid.apache.org下载qpid proton 0.26.0 ,qpid c++ broker 1.38.04、从www.cmake.org上下载windows版的压缩包,直接解压就可以了。我下载的是3....

2018-10-27 09:17:26 783 3

原创 数据亲和架构--失败恢复

       数据亲和架构在设计上,要确保数据和程序的亲和性,在程序需要的时候,就可以自动得到所需要的数据。基于数据同步技术,会在多个地方保存数据,在程序失效的场景下,并不会引起数据丢失。失败恢复在数据亲和架构下,不会成为一个关键问题。因此,我们这里要讨论的,不是如何正确失败恢复,而是如何在正确失败恢复情况,做到最快恢复。        从数据规模来看,规模越大的,恢复难度越高。就在不久前,一...

2018-10-27 09:14:36 173

原创 油腻中年

       今年40岁了,已经到了古人说的不惑之年,冯唐戏称的油腻中年。油腻中年也确实油腻,特别是码农,经常加班熬夜,最近买了洗面奶每天去油,感觉清爽了很多。        人到中年最大的感受是无力感。身体大不如前,啤酒肚如影随形,计划每天去健身跑步,都要靠毅力支撑,还会三天两头的中断。家有女儿初长成,都市人多,好学校少,竞争压力大。即使心急如焚,也得保持着微笑,讲解自己都被绕晕的奥数。家庭...

2018-09-27 14:46:03 463 2

原创 马云之退休

       阿里巴巴宣布马云明年的今天退休了,不幸的是,正好赶在这几天刘强东的明州事件,事情就显得有点诡谲。作为中国极少数几个互联网巨头之一,甚至荣登首富宝座的马云,54岁的他正当企业家的壮年,连55周岁的女性退休年龄都未达到,就想着退休,确实令人费解。从常人的理解和我们受到的教育来说,一个有追求的人,都应该倒在自己的工作岗位上,才能够谈得上退休。君不见,李嘉诚90岁了,才在今年宣布退休;任正非...

2018-09-10 17:41:58 427

原创 微服务讲堂--【1】前世今生

       对于微服务,有很多说法,最权威的来自于Martin Fowler  的文章。对于微服务有很多讨论,有很多实践,也遇到很多问题。包装了很多新鲜的名词和概念,让人云里雾里。但我要说的是,太阳底下没有新鲜事,关于微服务的理念,实际上并不是横空出世,而是自然而然发展出的产物,历史上已经有类似的发展脉络。Martin Fowler同样也说,它可以追溯到unix设计原则。一、单进程的发展历史...

2018-09-08 14:55:32 269

原创 数据亲和架构--一致性

        数据亲和架构强调数据和应用的绑定,这意味着,同一份数据是分布在多个服务的内存中,因此系统是分布式架构。关于分布式系统中,如何管理数据一致性的讨论和文章已经够多了,在此没有必要花太多文字复述一遍。这里更多的是从实践的角度来分析数据一致性问题。        在一个进程中,多个线程对同一个数据修改,顺序不同,会导致最终结果的不同。锁的机制实际上就确保线程按照顺序对数据进行修改,使得...

2018-09-04 15:31:03 335

原创 数据亲和架构--子集筛选

        之前谈到数据同步,但我们知道,业务服务使用的数据和存储的数据是不完全一样。服务用到的数据是存储数据集合或者混合衍生集合的子集。因此,进程之间数据的同步更像是物化视图的同步。除了Oracle外,mysql对物化视图并没有很好的支持。而且文件和NoSQL类的数据管理系统,也有类似的子集同步需求。        子集同步本身,我们需要将这个过程分成几个步骤。首先是内存中数据同步,其次...

2018-08-27 14:23:05 276

原创 软件工业

      软件工业和软件产业、软件行业等词的定义不同,而是将软件开发过程等同于和其他制造业一样的性质。这个定义会让很多从业人员感到很不舒服。至少在多数人看来,软件开发人员都是在空调房中,舒舒服服,轻轻松松的敲着键盘,和流水线上,只需初中学历就可以干的活是有本质上的区别。但是让我们把时间拉长一点来看这件事情,会发现这个趋势是不可避免的。        在计算机出现之初,从业人员都是需要专门培训...

2018-08-23 09:18:48 670

原创 金融信息破局刍议【5】平台陷阱

        乐视是不错的例子,贾跃亭以乐视生态的概念,靠着PPT,硬生生的把估值拉到千亿,不可谓不NB。但从另一方面来,一个生态链就是一个帝国,掌握生态链就帝王无异,躺着赚钱的节奏。这个想象空间,绝对能令很多人的荷尔蒙过量分泌。苹果的app store,马云的宝宝军团,马化腾的QQ微信帝国,以及诸多大型公司都是生态链模式下的顶级掠食者,都是满满的正能量。于是作为生态链的承载,平台就是必然的选项...

2018-08-20 17:22:42 193

原创 数据亲和架构--数据同步

      数据亲和架构核心要解决数据和程序的绑定问题,那么数据在进程间同步就尤为重要。因为性能的关系,增量同步是首选,全量同步只有在初始化或者出现异常的情况下,才会考虑。在流数据中,因为有时序,比较容易实现,而在静态数据中,比如文件或者数据库中,通常没有严格的时序,只有快照,要做增量比较困难。        以物理时间流动为参照系,任何一个数据集都可以分为某个时间点的快照,以及后续的变更。而...

2018-08-20 08:55:16 540

原创 数据亲和架构--核心目标

      数据亲和架构的核心目标,是为了解决微服务中的业务逻辑和数据绑定问题。使得业务逻辑在使用数据时,无需更多关注数据的传输和管理细节,确保数据在需要的时候,就能够使用。即使在微服务在异地重启或者多实例重启,数据也能够自动迁移和同步,无需被业务逻辑感知。如此一来,对于微服务来说,实现上与单实例没有太大差别。        在很多场合中,讲解微服务的优势,都要和单体架构比较。在实现业务单元时...

2018-07-23 16:42:38 316

原创 数据亲和架构--缘起

         数据亲和架构并没有否定其他架构,尤其是微服务架构的合理性,而是从另外一个视角来重新审视整个架构,做出补充。让数据和业务逻辑具备更强的亲和性,故命名为数据亲和。        微服务架构提出了一个理念,每个服务划分成更细粒度的服务单元。每个单元的职能更加单一,降低了服务单元的复杂度和耦合性,但它同时增加系统整体复杂度,对运维体系提出更高的要求。        K8S和Docker解...

2018-07-13 10:42:59 285

原创 金融信息破局刍议【3】寻找切入点

当一个行业已经形成垄断,并构筑足够深的护城河,要打破这个局面,难度不小,不是靠一腔热情就能成事。纵观中国历史,在中原地域已经建立起一个强大的王朝,在之后的历史中,只有三种情况才能实现王朝更迭。第一种情况,王朝腐败,人民起义,建立一个新的王朝;如中国几千年的封建王朝更迭。第二种情况,在中原之外,建立一个新的王朝,如北方的游牧民族,等中原王朝国力衰败,入侵中原;如元朝和清朝,如罗马时期的野蛮人入侵。这...

2018-06-29 09:35:52 204

C++编码规范

基于谷歌的C++编码规范,将其翻译为中文,并做一定的扩展。

2012-07-12

Lua 的实现,Lua使用者不能不看,脚本语言的经典啊。

关于Lua是如何的实现,英文版本。Lua使用者不能不看,脚本语言的设计经典啊。

2009-03-20

云风的大世界架构,介绍基础的大型网游的服务端架构。

云风是网易的开发经理,在业界影响颇大。这个pdf是他关于大世界理念的基础介绍。

2008-09-11

资源管理软件设计.pdf

这是一个比较完整的UML软件设计文档案例

2008-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除