3 AIOps智能运维

尚未进行身份认证

我要认证

百度智能运维团队利用大规模分布式、大数据和机器学习等技术为百度各产品提供智能化运维服务,在此与大家分享智能运维领域的前沿技术、交流各种问题。

等级
TA的排名 4w+

云原生之微服务新观

微服务架构可谓是当前软件开发领域的技术热点,它在各种博客、知识媒体和业界知名会议演讲上的出镜率非常之高,无论是做基础架构还是做业务系统的工程师,对微服务都相当关注,而这个现象与热度已经持...

2020-09-27 19:00:56

2020,百度20

新年快乐!我们迎来了21世纪的第3个10年。站在一个重要的时间节点上,人类总会情不自禁地回望过去,畅想未来。一年是一个时间节点,10年是一个更大的节点。20年前,站在“千禧年”节点上的人...

2020-01-03 18:04:08

知了 | 基于NLP的智能问答推荐系统

作者简介苗贝贝 百度高级研发工程师负责百度智能运维客服平台ChatOps,在时序数据异常检测、文本模式识别、相似度网络等方向也有广泛的实践经验。干货概览通常,客服系统主要有两种应答...

2019-12-27 18:33:29

聊聊AIOps落地监控报警的应对之策

作者简介周伟 百度高级研发工程师负责百度智能运维(Noah)监控报警系统、通告平台;在精准报警、精准通告、报警收敛、公/私有云监控等方向具有广泛的实践经验。干货概览监控报警是故障发...

2019-12-20 19:34:53

AIOps对监控报警架构的挑战

作者简介周伟 百度高级研发工程师负责百度智能运维(Noah)监控报警系统、通告平台;在精准报警、精准通告、报警收敛、公/私有云监控等方向具有广泛的实践经验。干货概览监控报警是故障发...

2019-12-13 19:00:45

3分钟了解黄金指标异常检测

作者简介王博 百度高级架构师从事有关AIOps智能运维领域的工作,通过算法解决IT运维领域的痛点问题。重点关注异常检测、故障诊断方向的相关工作。干货概览故障管理是运维工程师消耗时间...

2019-12-06 19:25:29

架构演进的两大方向,一个是Serverless,另一个是什么?

这么说吧,掌握了Service Mesh,你就选择了一条未来技术框架的道路。至于这条道路会怎么发展,还要再观察。这篇文章将解释什么是Service Mesh,为什么需要Service Mesh,以及Service Mesh的现状如何。Service Mesh很新,最早在2016年9月29日由开发Linkerd的Buoyant公司提出。时间回到2016年10月,Alex Leong开始在Buoy...

2019-11-22 19:09:52

日志监控实践 | 多维度数据采集

作者简介赵朋川 百度高级研发工程师负责百度智能运维产品(Noah)数据采集Agent程序的设计研发工作,在运维数据采集方向有着丰富的实践经验。干货概览前期文章《监控数据从哪来?(入门篇)》介绍采集程序的架构和不同场景下数据的采集方式。本文我们将针对日志监控,介绍一下多维度数据采集方面的思考和实践。多维度数据多维度数据目前已经成为大数据分析和处理领域的基...

2019-04-04 19:09:12

揭开NoahV智能运维前端框架的神秘面纱

作者简介莫海艳 百度资深前端研发工程师百度智能运维(Noah)产品前端技术方向负责人,在运维数据可视化、中后台前端解决方案等方向上,有着丰富的实践经验。干货概览众所周知,前端有三大主流框架:Vue、React、Angular,这些前端框架可以帮助我们快速搭建项目,但是我们在实际项目中往往还需要投入很大精力去使用其他代码库与应用作为补充支持(如:需要一些基础的UI组件库,需要H...

2019-11-20 16:35:28

微服务之监控初探

作者简介刘伟伟 百度高级研发工程师负责百度智能运维产品(Noah)监控平台的设计和研发工作,在系统监控、业务监控等方向有广泛的实践经验。多年之后,这名少年站在无数聚光灯前,准会想起那个遥远的下午。这天,少年所要接手的系统是公司最新研发的某金融类产品,摆在面前的是一张画满了各种形状和符号的A4图纸,顺着箭头的方向,他依次看到了“服务注册”、“服务发现”、“负载均衡”以及“服务网关”等熟悉的词汇...

2019-11-15 19:29:33

百度万亿流量的转发引擎BFE开源了!

BFE(Baidu Front End,百度统一前端)是百度的统一七层流量转发平台。BFE平台目前已接入百度大部分流量,每日转发请求接近1万亿,峰值QPS超过1000万。在2019年百度春晚红包活动中,BFE平台在超大用户压力、数次流量波峰下平稳运行,保证了春晚红包活动的顺利进行。作为综合的流量转发平台,BFE平台集成了以下4大功能:流量接入和转发:支持HTTP、HTTPS、HTTP/2、QUIC...

2019-11-15 19:29:33

百度大规模战略性混部系统演进

将在线服务和离线任务混合混部到相同物理资源上,通过资源隔离、调度等控制手段 , 充分使用资源,同时保证服务的稳定性,我们称这样的技术为“混部”。百度从 2012 年就开始尝试进入混部技术领域,研发并推广了代理计算(BVC/IDLE)系统,大规模重构后演进成为一套通用的在离线混部系统(千寻)。目前公司混部的整体技术迈向成熟,并在大搜索、Feed、凤巢等机器上实现了规模化运用。本文整理自百度基础架构部...

2019-11-08 21:41:37

站点监控 | 外科医生的实战

作者简介梁飞 百度高级研发工程师负责百度云监控(BCM)系统的研发和可用性建设相关工作,在云监控、系统可用性方面有广泛的实践经验。网站无法访问、网站内容返回错误、网站响应慢等场景。针对以上场景,本文将从技术角度探究如何实现站点监控。根据之前文章的介绍,设计一个站点监控系统,需要满足以下两个方面需求:支持多种站点监控需求支持多种协议类型,比如HTTP、HTTPS等;支持站点可用性监控,比如域名...

2019-11-01 17:59:55

揭开NoahV智能运维前端框架的神秘面纱

作者简介莫海艳 百度资深前端研发工程师百度智能运维(Noah)产品前端技术方向负责人,在运维数据可视化、中后台前端解决方案等方向上,有着丰富的实践经验。干货概览众...

2019-10-25 18:55:09

流量异常检测之算法选择器

作者简介时祎瑜 百度高级研发工程师负责百度智能运维产品(Noah)的策略研发工作,在异常检测方向有大量实践经验。干货概览人体就像是一个布满了传感器的监控系统,每时每...

2019-10-18 19:23:00

云原生基础架构最佳状态,就是没有基础架构 | 技术前沿

温馨提示:本文3000字,估计阅读时间12分钟。云原生基础架构是通向云原生时代的基石,对于很多架构师来说,上云之后,架构为什么成为了云原生架构而不是传统的架构,两者有何区...

2019-10-11 20:46:12

被变更逼疯的我,是如何成功自救的?

作者简介陈云 百度资深研发工程师负责百度智能运维产品(Noah)的算法设计研发工作,在服务变更及网络故障发现、定位等方向有大量实践经验。干货概览作为一个合格的码农,...

2019-09-27 18:04:57

百度智能云IaaS市场再创佳绩

一周之内,百度智能云在中国市场中的头部地位两次获国内外机构认可。9月19日,国内机构艾瑞咨询发布《中国云服务业发展洞察基础云服务篇》报告,百度智能云2018年在中国公有云...

2019-09-20 18:03:25

从0到1构建CMDB

作者简介刘冰 百度资深研发工程师负责百度智能运维产品(Noah)的CMDB、监控系统相关的设计研发工作,在平台架构、监控业务分析等方面有大量实践经验。干货概览在前文...

2019-09-07 18:00:00

2019百度云智峰会:拉开中国AI工业化大幕

8月29日,“ABC SUMMIT 2019百度云智峰会”在北京国家会议中心举行。此次大会以“AI工业化,加速产业智能”为主题。百度副总裁、智能云事业群组总经理尹世明表示...

2019-08-30 18:00:00

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。