自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (20)
  • 收藏
  • 关注

原创 分布式场景下的CAP

CAP:一致性(Consistency):读取数据一致,读取到的是最近写入的数据或者返回错误,不会读取到国旗数据可用性(Availibility):系统可以正常使用,请求会得到响应,不会返回错误,也不会失去响应,但不保证数据是最新的分区耐受性(Patition Tolerance):因为网络导致的整体系统服务之间的小题通信延迟或者丢失所导致的系统分区,系统依然是可以操作的对于一个分布式系统...

2020-01-30 14:32:08 169

原创 流式计算

Stormnimbus :Master,负责集群管理、任务分配supervisor : Slave,完成计算,每个 supervisor 启动多个 worker 进程,每个 worker 上运行多个 task,而 task 就是 spout 或者 bolt。zookeepr:supervisor 和 nimbus 通过 ZooKeeper 完成任务分配、心跳检测等操作。FlinkFl...

2020-01-30 13:36:24 177

原创 hbase

hbase伸缩架构HRegion:数据以 HRegion 为单位进行管理,应用程序通过和 HRegion 通信完成数据通信HRegionServer:启动、管理HRegionHRegion如果大小超过阈值与之会分裂为多个HRegion,通过负载均衡策略,在整个集群进行迁移。HRegion存储一段key范围内的数据。HMaster:存储HRegion信息,如key区间范围、所在HRegi...

2020-01-30 09:54:43 114

原创 spark的执行过程

1、spark应用程序启动(driver)2、调用spark context初始化配置和输入数据3、spark context启动DAGSchedule构造DAG图,切分任务4、Driver向Cluster Manager请求计算资源5、Cluster Manger根据Driver的主机地址等信息同志集群的所有计算节点Worker6、Worker收到信息,根据Driver的主机地址,向...

2020-01-29 23:15:30 289

原创 hive

hive架构Hive 内部预置了很多函数,Hive 的执行计划就是根据 SQL 语句生成这些函数的 DAG(有向无环图),然后封装进 MapReduce 的 map 和 reduce 函数中。其中MetaStore一般对应的是关系型数据库,其中存入hive表的元信息,Compiler负责对提交的hive查询语句进行语法的解析。...

2020-01-29 19:38:38 324

原创 yarn框架

2020-01-29 12:11:41 186

原创 Hadoop 1的MapReduce执行流程&shuffle

流程shuffle

2020-01-29 10:31:46 90

原创 大数据存储

曾经负责过一款底层存储系统的测试工作,最近看hdfs的文章发现,从架构上真心没啥特别大的区别。组成如下:zookeeper:节点注册、选主name node:元数据存储data node:block数据存储备份:3?区别:hdsf更多的与其他的计算框架如Mapreduce进行配合使用,也就是大数据存储+大数据计算。而我送负责的底层存储系统更多的是面上中、小文件,如视频、图片、文件等,显...

2020-01-29 00:29:58 256

原创 RAID

RAID 0:N个磁盘,写入数据分N份存入;读写速度都有提升,但是一块磁盘坏了,文件就读不了了。RAID 1:写一个文件,分别存入两个磁盘;读写速度没啥提升,但是任意一个磁盘坏了,还可以进行读写,数据也可以恢复。RAID 10:RAID 0+RAID1,N个磁盘,分两组,组内相当于RAID 0,组间相当于RAID 1。RAID 3:N个磁盘,1个校验盘,N-1个数据盘;任意一个磁盘坏了,数...

2020-01-28 23:11:20 96

原创 大数据框图

google三篇论文:分布式文件系统 GFS大数据分布式计算框架 MapReduceNoSQL 数据库系统 BigTable一句话概括即使分布式!通过大量廉价的机器构建集群,完成海量数据、存储计算的那些事儿后来有了Hadoop:HDFS+Mapreduce,Yahoo很早就开始实用Hadoop(搜索主要干两个事,爬网页存起来,建索引,Hadoop可以说完美的解决了早起的搜索引擎的那些...

2020-01-16 22:23:39 260

原创 x86架构

基础概念cpu:命令的执行内存:中间结果保存、进一步计算,cpu无法保存太多的中间结果总线:连接cpu、内存、显卡、磁盘空盒子器、usb控制器进程:可以理解为实例化的程序,程序是存在硬盘的,而进程是要讲程序加载到内存,不同进程的内存空间是隔离的。进程空间粗略的分有代码段和数据段。cpu包含两个寄存器,分别存放当前处理进程的代码段的起始地址和数据段的起始地址,进程切换会切换这两个寄存器存储的...

2020-01-16 17:51:01 557

原创 转:张小龙:信息互联的七个影响

近日,2020 年微信公开课在广州开课,这一次,最受期待的张小龙并没有出现在微信公开课现场,而是通过视频演讲的方式隔空发表了演讲,并分享了他关于信息互联的 7 个思考,包括隐私的出让、信息获取的被动、社会关系的扩大和复杂、信息传播的快速,信息选择的困难、信息的多样性、搜索的困难。具体内容如下。隐私的出让从历史看,科技越发达,个人隐私就会越少。人们在获取便利性的同时,其实也在不知不觉地一点一点...

2020-01-15 10:59:54 172

原创 如何衡量测试人员的价值

引子相信大多数的测试人员都是从做业务或者技术产品的测试工作开始的,那么你们知道如何提升自己的价值吗?衡量业务测试人员的指标一般有下面几个:提交bug数测试周期漏测业务case自动化程度CI自动化case的代码覆盖率、分支覆盖率加分项:跨部门沟通、协作平台化测试环境相关on call以上仅限于我写文章打字的时候,临时想到的一些点,如果后续我有其他的思考,我再补充进来...

2019-12-20 15:29:22 505

原创 css selector

选择器例子Type selectorh1 { }Universal selector* { }Class selector.box { }id selector#unique { }Attribute selectora[title] { }Pseudo-class selectorsp:first-child { }Ps...

2019-09-25 09:57:45 178

原创 AtomicLong与LongAdder如何选择,用于生成request id

最近想实现一个能够生成全局唯一id的工具方法,最先想到的AtomicLong类的getAndIncrement方法,对于调用者来说,底层细节都不用关心,调用getAndIncrement或incrementAndGet就行了,很简单。但是本着程序员好奇心,特地看了下该方法的实现: public final long getAndIncrement() { return unsaf...

2019-09-17 18:11:21 277

Go语言编程

本书七牛的ceo写的,我也看过其他的go语言书籍,说实在的写的太复杂,这本书给人的感觉很舒服,说的明白,能到点上,希望能给广大go语言的学习者提供到不错的帮助,解惑

2018-02-27

openrtb接口文档2-3

最近3年,广告实时竞价(RealTimeBidding)模式逐渐流行起来。 2012年大致了解过,最近一段时间,重新温习下。 下图摘自 OpenRTB_API_Specification_Version2.0_FINAL 半壁江山 生态系统总的来说分为2个部分,卖方和买方。 卖方:媒体,即拥有广告资源的人,如新浪这个媒体有很多用户访问,有很多广告位。 买方:广告主,即有钱人,准确的说是花钱买广告位置的人,如淘宝等电商,就需要把自己的商品和品牌推广出去,需要花钱买广告。 传统的模式 传统模式有2个重要的角色:广告投放服务器(Ad Server)和网盟(Ad Network)。 根据服务的对象(买方和卖房)又分为2类:Advertiser Ad Server,Publisher Ad Server,Advertiser Ad Network,Publisher Ad Network。 即为广告主服务的投放服务器、网盟和为媒体服务的广告投放服务器、网盟。 广告投放 对媒体来说,广告投放就是把自己的广告位资源管理起来,把广告投放出去,达到广告主的要求,然后收钱。 对广告主来说,广告主可能自己负责投放广告,把买的广告位管理起来。(这个不太熟悉,总感觉很怪) 网盟 媒体网盟,把众多媒体的资源统一“买”过来,然后与广告主“谈判”,量大了容易达到广告主的要求。广告投放之后,收广告主的钱,把一部分的收入分给参与合作的媒体。 广告主网盟,与媒体网盟类似。这个不太熟悉,总感觉很奇怪。 代理商 鉴于广告投放的复杂性,制作广告创意和排期等工作,广告主一方有专门的代理公司。 新兴的模式 通过一个广告交易系统这个平台,把买方和卖方联系起来。 广告售卖由批量售卖,转变为单次售卖。 单次售卖是有依据的,随着技术的发展和数据的积累,出现了DMP(数据管理平台)和Data Broker(数据经纪商)。 每一次曝光,都有特定的受众和环境。 通过提高每一次的曝光价值,合理地保证广告资源的价值。 广告主不必花钱去买不必要的曝光,媒体通过节约广告资源也可以获得更高的收益。 数据管理平台 DMP专门收集用户等有价值的数据,比如用户的基本信息、兴趣爱好、浏览行为、搜索行为。 收集用户数据的途径 1.百度/Google等搜索引擎可以收集用户的搜索行为。 2.互联网服务提供方,收集用户的注册信息。 3.QQ、开心网等可以收集用户的社交信息和人群关系。 4.HTTP协议等可以获得IP库、浏览器、操作系统等很多信息。 5.在线调研,收集人群数据。

2017-09-13

计算机类发明技术交底书范例

写专利用的,一般都要先写个交底书,这里提供一个范例,供大家参考使用。我们公司写交底书都是参考这个,所以专业性,规范性完全没有问题,希望对大家有用

2016-05-13

Oracle数据库精讲与疑难解析.part7

网上这个资源需要较多的积分,我重新上传一下

2012-04-10

Oracle数据库精讲与疑难解析.part6

网上这个资源需要积分较多,我重新上传一下

2012-04-10

Oracle数据库精讲与疑难解析.part5

网上这个资源需要较多的积分,我重新上传一下

2012-04-10

Oracle数据库精讲与疑难解析.part4

网上这个资源需要太多的积分了,我重新上传一下

2012-04-10

Oracle数据库精讲与疑难解析.part3

网上这个资源需要的积分很多,我在这里重新上传一下

2012-04-10

Oracle数据库精讲与疑难解析.part2

网上这个资源很多,不过积分太多了,我这里给大家重新上传一下

2012-04-10

opencms中文手册

opencms是一个开源项目,据说有很多的世界五百强的企业都是在这个框架的基础上开发网站,这个框架不适合小型网站的使用,但是对于设计大型复杂的网站开发,还是非常有用的

2012-04-08

Axure RP Pro 6.0.0.2876

 Axure RP Pro于2011年4月11日发布6.0.0.2876版,Axure RP Pro允许程序设计者为程序或者网站制作动态的线框图、流程图、以及其他所需的图表。 规范的图标文档让您在交流、记录,设计上更容易被接受,使用Axure RP 建立更简单、更专业的数据表

2012-02-17

Demo Builder 8

Demo Builder 是一个用来创建交互式Flash 影片,展示应用程序和系统如何运作的工具。它为用户提供了一个系统,允许用户截取目标应用程序的一系列的可编辑的屏幕截图,以制作Flash 模拟和交互式演示。Demo Builder 给予用户对组成影片的元素的完全控制权,方便地修改、编辑和更新。输出文件可以为 Flash (SWF) 或者可执行文件(EXE) ,而且Demo Builder 可以通过内置的功能将输出文件以电子邮件方式发送,输出到磁盘或者上传到FTP。并且可以输出Flash 文件为HTML 格式。最终得到的是高质量的演示或者教程,可以轻松的通过网络、光盘或者电子邮件共享,使企业、组织、和个人为软件或系统提供可视的软件帮助、使用指导甚至电子学习方式。

2012-02-17

at命令

at命令是个好东西啊,具体干啥的我也不知道,孩子们看吧

2012-02-15

用TCP_IP进行网际互联第三卷

本书还有前两卷,有兴趣的可以搜搜,TCP_IP是网络上比较通用的体系,因此对于学习网络知识,本书是必不可少的

2011-11-23

winshark使用教程

Wireshark 是网络包分析工具。网络包分析工具的主要作用是尝试捕获网络包, 并尝试显示包的尽可能详细的情况。 你可以把网络包分析工具当成是一种用来测量有什么东西从网线上进出的测量工具,就好像使电工用来测量进入电信 的电量的电度表一样。(当然比那个更高级) 过去的此类工具要么是过于昂贵,要么是属于某人私有,或者是二者兼顾。 Wireshark 出现以后,这种现状得以改变。 Wireshark 可能算得上是今天能使用的最好的开元网络分析软件。

2011-09-29

WINDOWS网络编程技术1

windows 网络编程第一章 传输网络的API netbios

2009-09-02

哈工大选修课之--创业的行动计划

大学生就业是很重要的问题 每个大学生往往缺乏的就是行动的计划啊,所以我推荐啊

2008-10-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除