自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yanggd1987的专栏

当才华还撑不起野心时,那就应该静下心来学习。

  • 博客(277)
  • 资源 (8)
  • 收藏
  • 关注

原创 蓝鲸社区:解决小伙伴们插眼关注的一个需求

整个开发过程比较重要的是“对不同事件结果数据的封装”,除了部分开发经验外,就是要不断的试错,这样才能保证我们完成对最终的数据格式的解析,从而更好的匹配下游运维子系统!

2023-07-01 09:23:49 430

原创 服务器生命周期管理,运维有话说!

基础设施的管理虽然看似简单,但还是有很多意想不到的问题会挡住我们前进的道路,正所谓”技术都是现成的,剩下都是管理问题“,同时也利用这个机会来检验团队直面困难的魄力。

2023-03-08 20:14:12 1057 1

转载 血与泪的教训,虚拟机如何降低应用中断风险?

VMware vSphere的文档很齐全,但因缺少故障场景的适配,我们一般不会去做进一步的配置,因此在后续运维过程中要对故障场景多做复盘,团队集思广益去寻找最佳实践。

2023-02-20 21:42:10 396

原创 应用上K8S:K8S集成Java应用

通过对Java应用运行依赖的JVM参数、运行目录等内容的分析,需要分别通过K8S内置环境变量、Configmap、PV/PVC等功能进行不同程度的集成。

2023-01-08 11:35:27 1726 1

原创 应用上K8S:Gradle打包

相对于Maven打包过程,Gradle打包的配置更简单,但是其官网文档对gradle docker plugin的描述过于简单,导致某些更细节的配置摸索起来比较麻烦。

2023-01-01 14:28:36 857 4

原创 业务流程监控:让多维度监控有了灵魂

图形化的业务流程监控给我们运维打开了另一个维度的监控思路。

2022-12-11 10:50:14 1291 1

原创 Git分支管理,运维知道吗?

如果没有一个统一的代码仓库的管理规范,无论在测试阶段还是在生产上线过程中都将会是“一地鸡毛”。在此我们选择开源分布式版本控制系统Git作为代码仓库,并给大家介绍下已在企业生产实践中经过验证的Git分支管理规范。

2022-12-05 19:51:02 828

原创 传统架构应用快速横向扩容PK容器!

本次PK,传统架构虽然输了,但也并不是一败涂地。至少让我发现只要细心,坚持标准化、原子化、场景化的原则,我们还是有很大空间可以提升的。容器给了我们目标和方向,剩下就要看我们自己了。

2022-11-14 10:02:42 500

原创 让运维理直气壮的用数据说话!

在DevOps中有研发效能,如今放到运维自动化中,我们也需要重视下运维效能,运维也要理直气壮的用数据说话!

2022-10-16 19:33:48 495

原创 容器云平台建设,运维痛并快乐着!

在项目的开始阶段,我们需要投入更多的精力去分析需求、总结现有数据、确定需求、为寻找解决方案做规划,因此非常重要,只要保持一个清晰的思路,相信我们就成功了一半。而后续方案交流中的技术细节,我们需要做的是选择题,找出一套适合我们的方案即可。

2022-09-23 20:51:04 1305

原创 可视化业务流程监控,是解决方案更是运维之道!

`监控和业务分离`一直是我们所忽略的问题,随着架构和业务规模不断发展,一般情况下的多维度监控虽然可以在业务应用可用性方面发挥重要的作用,但是无法做到和业务流程进行有效关联。此时就需要更懂或者更了解业务的相关人员进一步判断,这无疑大大延长了故障时间,严重影响了我们的SLA。

2022-09-17 15:26:48 1079

原创 流水线:如何做到应用分钟级上线交付?

通过流水线我们实现了应用的分钟级交付,整个过程涉及到了基础的标准规范、配置管理工具、流水线等,因此需要在前期做大量的基础规划工作。另,通过容器化的解决方案其实可以将整个过程提升到秒级交付,这对传统应用来说简直是一个降维打击。因此企业最终推动容器化进程,向云原生领域迈进将是大势所趋。

2022-09-02 08:13:59 847

原创 运维累了:该故障自愈出场了

磁盘类告警只是我们诸多告警中的冰山一角,虽然我们有值班人员甚至是运维团队支撑,但是也不能因为这种小问题就分散注意力,这时我们就需要考虑如何通过自动化实现。

2022-08-20 15:36:07 655

原创 令人拍手叫绝的运维小技巧

细心的人往往会通过自己特有的方式来快速处理,不禁让人拍手叫绝。

2022-08-20 15:29:43 485

原创 漏了监控:Zabbix对Eureka instance状态监控

由于Eureka Server服务发现状态异常,此时是无法正常对外提供服务的。如果运维不及时检查Eureka管理界面每个client状态时,那么就会差生一起生产事故。

2022-07-04 22:11:11 729

原创 Bug:Zabbix对Kafka topic积压数据监控

《Zabbix监控Kafka topic积压数据》一文的目的是通过Zabbix自动发现实现对多个消费者组的Topic及Partition的Lag进行监控。因在实际监控中发现有问题,为给感兴趣的读者不留坑,特通过此文对监控进行优化调整。...

2022-06-30 22:21:33 839

原创 运维:CMDB好用和用好,差别还是挺大的!

CMDB 在运维体系中承担管理基础设施,为上层应用场景提供可靠的数据支撑的角色。CMDB虽然能够将基础设施进行统一纳管,并且可以和业务应用进行关联,在一定程度上是利好运维的,但"CMDB成为摆设、花瓶"的现象还是存在的。...

2022-06-20 09:35:02 8447

原创 Ansible实现等保安全合规基线,运维尽力了!

对于安全合规基线,我们肯定希望能够对所有纳管的服务器进行批量更新,最好还可以根据最新的标准不断进行持续优化更新。因此我们使用`Ansible Playbook`进行统一管理,一方面安全合规基线配置是系统标准初始化的一部分,另一方面其也可以对基线进行单独的执行。...

2022-06-15 08:40:46 1679

原创 Zabbix监控Kafka topic积压数据

KafkaApache Kafka是一个分布式发布-订阅消息系统和一个强大的队列,可以处理大量的数据,并使您能够将消息从一个端点传递到另一个端点。Kafka适合离线和在线消息消费。Kafka消息保留在磁盘上,并在群集内复制以防止数据丢失。Kafka构建在ZooKeeper同步服务之上。它与Apache Storm和Spark非常好地集成,用于实时流式数据分析。需求虽然我们在生产环境中可以使用Kafka对业务进行解耦,但这并不意味着业务系统就高枕无忧了。消费者的消费速度是否能够匹配生产速度、过多的消

2022-05-24 08:27:53 1937

原创 基于等级保护梳理服务器安全合规基线

背景作为运维,当对新上架的服务器装完操作系统后,第一步就是对操作系统进行初始化配置来保证配置合规,此时你可能就会有疑问:我们应该初始化哪些参数,有没有相关标准参考呢?要想真正了解进行初始化配置的目的,我们先来普一下法:《中华人民共和国网络安全法》第二十一条规定,国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的要求,履行下列全保护义务:保障网络免受干扰、破坏或者未经授权的访问,防止网络数据泄露或者被窃取、篡改。《中华人民共和国网络安全法》规定,等级保护是我国信息安全保障的基本制

2022-05-18 20:12:24 1688

原创 运维从零认识IaC

如果没有相应的 IaC 实践,那么管理现今这样大规模的基础架构会变得越来越困难。IaC 可以帮助我们管理 IT 基础架构需求,同时提高一致性并减少错误和手动配置。

2022-05-07 11:40:57 1511

原创 Linux高危命令,运维人手一份

如果我们的生产服务器没有做到开发、运维、测试人员的权限分离,那么本次的高危命令总结就可以派上用场了。

2022-04-23 09:39:00 2144

原创 运维:对数据要有敬畏之心

简述“对数据要有敬畏之心”这个主题是同事在一个早会分享时提出的,却直接引起我心中的共鸣。前几年各种删库跑路事件、Facebook宕机事件仍不绝于耳,虽然大家将“删库跑路”当作一个调侃与谈资,但上升到“对数据要有敬畏之心”的高度,作为运维我们就要居安思危,防患于未然。数据的定义从运维的角度,数据不是独立存在的,它存在于日常运维过程中的各个环节,如例行维护、变更、故障处理等。因此如果我们只考虑数据本身则意义不大,要从数据存在的各个环节去分析。在此我们将其大体概括为:数据备份文件系统+例行维护数据

2022-04-16 08:56:05 689

原创 运维从零认识云原生

无论我们所在的企业是否已经开启了云原生建设,我们都需要去充分的认识云原生,不断的储备和云原生相关的知识点。

2022-04-11 09:28:31 1118

原创 容器解决方案周边

无论是学习云原生相关技术栈还是了解容器云相关解决方案,我们都可能看见这些热词:`一致性认证、CKA、可信云、信创`等,那它们都有什么作用?个人可以学习哪些认证?云厂商都需要哪些认证?通过以下内容的介绍,我们就会对这些热词有一定的了解,从而帮助我们做更好的选择。

2022-04-06 08:57:40 455

原创 Pipeline支撑运维自动化:Zabbix屏蔽/恢复监控

屏蔽/恢复告警 只作为系统监控级模块的原子操作,我们可以灵活地将其复用到其他流水线中,很好的满足了我们对不同场景的需求。

2022-03-21 19:47:05 1815

原创 Python+Celery实现基于Fastnetmon异常流量清洗

背景FastNetMon+Influxdb+Grafana+GoBGP可搭建一套基于 NetFLOW / sFLOW 的流量统计报告系统,其中:FastNetMon 是一个基于多种抓包引擎(NetFlow, IPFIX, sFLOW, netmap, PF_RING, PCAP)的DoS/DDoS攻击高效分析工具,可以探测和分析网络中的异常流量情况,同时可以通过外部脚本通知或阻断攻击;InfluxDB 是一款开源开源时序型数据库,和FastNetMon集成,用于将数据统计进行存储;Grafana

2022-03-12 18:51:29 3719 1

原创 Pipeline支撑运维自动化:sftp原子模块

随着对接的渠道越来越多,繁杂的sftp的权限配置将成为我们的一个负担,因此我们将此需求提取成一个原子模块,通过Pipeline编排的形式来处理。

2022-02-26 15:53:32 1066

原创 后话:PipeLine支撑运维自动化

Pipelin支撑起了各个动作的具体实现,各条Pipeline还可以被其他Pipeline调用,非常的灵活。

2022-02-23 08:24:03 854

原创 Jenkins 和 CMDB 优雅的互动

CI/CD参数中需提前知道目标主机的IP,对执行构建人员来说很不友好。那么我们能不能参照DNS的套路,通过特定的名称查询CMDB来获取IP呢?*

2022-01-12 20:29:49 1249

原创 CI/CD支撑运维自动化:系统监控级原子模块

通过pipeline对以上原子模块进行编排来满足不同场景的需求。

2021-12-28 08:34:34 777

原创 Apollo:分布式配置管理中心

Apollo(阿波罗)是一款可靠的分布式配置管理中心,诞生于携程框架研发部,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性,适用于微服务配置管理场景。

2021-12-23 21:04:44 925

原创 CI/CD如何支撑运维自动化

CI/CD不仅能够在企业DevOps进程中发挥重要作用,其实在运维自动化过程中也能做到足够有效的支撑。因此如果我们只将其当作成一个打包工具就大错特错了,其带给我们思想上的转变则更加有意义。

2021-12-06 16:41:04 1688

原创 运维思索:自动化运维体系如何入手

需求运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手?其实前期《运维思考》一系列文章已经给我们答案了,就是从运维框架入手分层建设、打好基础,记住“万丈高楼平地起,勿在浮沙筑高台”。运维框架通常讲到运维建设,我们脑海中首先浮现的是“一团麻”,因为这不是一个人、一个岗位的工作,而是一整个团队的工作;所以我们将“这团麻”进行由底层向上可划分为:IT基础设施层IT基础

2021-11-29 09:30:35 4768 1

原创 运维思考:Java进程管理规范

需求无论是在spring boot 还是spring cloud 项目中,随着应用的不断增多,JVM参数的统一管理的重要性就会凸显出来,否则你可能会遇到几个问题:Java进程出现性能问题,无GC日志支撑提供重要信息;OOM异常频发,无法通过dump文件进行分析定位;JVM堆内存设置规格不一致,被动等待出问题时发现;作为运维,虽然没有超强的能力去最终的定位、分析、排查问题,但并不意味着我们就可以袖手旁观,那么我们能做什么呢?首先,我们要知道Java进程默认参数启动并不会打印某些我们需要的日

2021-09-30 18:24:49 405

原创 基于Nginx+Lua自建Web应用防火墙

简介对于信息类网站,总是会被各种不同目的的爬虫、采集器等不断的抓取或恶意访问,这些会让网站不堪重负,导致页面无法正常访问,极大的影响用户体验。针对此种情况,我们就需要对所有的访问来进行访问控制。此时Web应用防火墙(Web Application Firewall,简称 WAF)就可以助我们一臂之力,它可以为网站提供一站式安全防护。WAF可以有效识别Web业务流量的恶意特征,在对流量进行清洗和过滤后,将正常、安全的流量返回给服务器,避免网站服务器被恶意入侵导致服务器性能异常等问题,保障网站的业务安全和数

2021-09-12 19:17:11 1673

原创 docker-compose编排实现java多环境交付

简介Jenkins+Docker+git多分支实现springboot项目多环境快速交付一文我们介绍了CI/CD交付springboot项目过程中的环境校验、发版/回滚/重启、操作校验等步骤,在实际应用过程中有几点思考:构建前的运行参数定义构建前我们只按规范定义了APP_NAME(项目名)、IMAGE_NAME(镜像名)、MONITOR_URL(健康检查URL),相关的JVM参数、端口映射等与实际运行的参数仍然需要在后续的容器运行时手动修改,增加了配置难度,因此我们考虑将其提取到环境变量统一设置,

2021-08-28 13:18:29 831

原创 基础运维神器:开源的裸金属服务器管理平台RackShift

需求最近前同事问我有没有免费或者开源的硬件运维管理平台,通过此平台可以实现包括自动抓取服务器配置、带外管理、开关机、bios配置、固件升级等等功能。虽然我们可以通过IPMI标准监视接口跨不同的操作系统、固件和硬件平台,智能的监视、控制和自动回报大量服务器的运作状况,以降低服务器管理成本;但是服务器厂商都有自己的硬件管理平台,如华为的BMC、戴尔的iDRAC,没有一个统一的管理平台服务可以兼容各家厂商。解决方案现在我们有了一个靠谱的开源解决方案:RackShift。RackShift 是开源的裸金属

2021-08-17 21:39:49 4337 1

原创 Jenkins+Ansible:助力基础设施建设

这是我参与8月更文挑战的第11天。简述《ansible自动化:操作系统初始化具体实现》《ansible自动化:基础软件的自定义安装》两篇文章我们虽然通过ansible在字符界面满足了操作需求,但是这并不友好。我们希望团队内每个人都能直接上手无缝使用,因此就需要一个图形化界面来提高可操作性。在此我们借助Jenkins+Ansible 来实现图形化的参数化构建过程:我们在输入IP后,根据选择的PLAYBOOK(剧本),再进一步选择不同的TAG(标签),就可以按需自动化实现我们的需求。下面就来讲解下我

2021-08-13 22:02:08 2584 2

原创 ansible自动化:基础软件的自定义安装

这是我参与8月更文挑战的第10天。《ansible自动化:操作系统初始化具体实现》一文实现了对操作系统的交付,接下来我们就需要根据研发、运维需求定制各种基础软件,用于日后的系统上线。在此我的实现方式是通过ansible playbook 进行基础软件的自定义安装,后续也可结合jenkins 进行按需持续集成。需求基础软件的需求通常有以下场景:java项目jdk、tomcat、应用日志目录、环境变量及其他订制需求;python项目python3、anaconda、supervisor、p

2021-08-12 21:21:09 597

Huawei_iBMC.zip

Zabbix监控模板,用于zabbix通过iBMC监控华为服务器的硬件状态。iBMC系统默认支持V3版本的SNMP服务,SNMP V1和SNMP V2C由于自身机制存在安全隐患,默认是不开启的。

2020-11-12

pacemaker on centos7

centos7上配置pacemaker+corosync+drbd主从/双主

2016-01-27

apache内存计算

此脚本可以计算出当前httpd进程的个数和占用内存,来为我们配置apache工作模式提供参考

2015-12-03

svn源码泄露漏洞工具

在使用SVN管理本地代码过程中,会自动生成一个名为.svn的隐藏文件夹,其中包含重要的源代码信息。但一些网站管理员在发布代码时,不愿意使用‘导出’功能,而是直接复制代码文件夹到WEB服务器上,这就使.svn隐藏文件夹被暴露于外网环境,黑客可以借助其中包含的用于版本信息追踪的‘entries’文件,逐步摸清站点结构。

2015-08-28

Remote Desktop Organizer

win8版本下的远程桌面管理工具,最好用的管理远程桌面工具

2015-08-28

msvcr90.dll

py2exe打包的程序需要9.0.21022.8这个版本的MSVCR90.DLL,否则将打包后的程序发布到其他windows服务器上后无法运行

2015-08-28

check_logfiles

日志监控插件,结合nagios能够很好的实现日志监控

2015-05-18

magent-0.5.tar.gz

如果大家在google上下载不到,可以在这里下载magent 0.5稳定版

2015-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除