-
Traefik mesh:更方便的服务网格
所属栏目:[经验] 日期:2021-05-26 热度:61
Traefik mesh没有通过sidecar的形式进行流量拦截或者修改,那是怎么实现的呢? 它其实是借助于CoreDNS,它通过修改CoreDNS的少量配置,让用于允许使用Mesh端点而[详细]
-
系统管理员爱不释手的6款服务器监控工具
所属栏目:[经验] 日期:2021-05-26 热度:101
Conky能在多个的平台上运行,像Windows,Linux,Mac OS,大多数BSD都可以。它有简单的文本、总线进度条,图形窗口不同字体和颜色来显示信息,用户界面简单,300[详细]
-
核心网运维的困难
所属栏目:[经验] 日期:2021-05-26 热度:156
维护人员既要做分析、又要去操作,可能最后分析没做好、操作无法落实。维护人员就是解决设备问题。现有的运维机制是:设备产生告警、监控收告警派工单、维护人员[详细]
-
从基础搭建一个自动化运维体系
所属栏目:[经验] 日期:2021-05-26 热度:61
DevOps的出现有其必然性。在软件开发生命周期中,遇到了两次瓶颈。第一次瓶颈是在需求阶段和开发阶段之间,针对不断变化的需求,对软件开发者提出了高要求,后来[详细]
-
怎样在 CentOS/RHEL 系统中操作带 VLAN 标记的以太网卡
所属栏目:[经验] 日期:2021-05-26 热度:123
在某些场景中,我们希望在 Linux 服务器(CentOS/RHEL)的同一块以太网卡(NIC)上分配来自不同 VLAN 的多个 IP。这个可以通过使用 VLAN 标记接口来实现。但是要[详细]
-
Saltstack批量管理文件和实现
所属栏目:[经验] 日期:2021-05-26 热度:164
使用场景 在维护大量服务器的时候,系统一般初始化并上线以后,我们希望所有的服务器系统的某些配置文件一样,这时候我们需要一种工具来批量管理这些文件,保证[详细]
-
Kubernetes上对应用程序进行故障解决的方案
所属栏目:[经验] 日期:2021-05-26 热度:128
从 Docker 迁移到 Docker Swarm,再到 Kubernetes,然后处理了多年来的所有各种 API 更改之后,我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下[详细]
-
大数据理解:Docker虚拟化解析
所属栏目:[经验] 日期:2021-05-26 热度:86
一款产品从开发到上线,从操作系统,到运行环境,再到应用配置。作为开发+运维之间的协作我们需要关心很多东西,这也是很多互联网公司都不得不面对的问题,特别[详细]
-
你要偷偷学会排查线上CPU飙高的情况,然后吓坏所有人!
所属栏目:[经验] 日期:2021-05-26 热度:120
通过上面的堆栈信息,可以看出, 占用CPU资源的线程主要是卡在JDBC底层的TCP套接字读取上 。连续执行了很多次,发现很多线程都是卡在这个地方。 通过分析调用链[详细]
-
如何更好地做好运维管理?
所属栏目:[经验] 日期:2021-05-26 热度:62
如果你已经在做运维管理工作或是正想往运维管理方向发展,那么请搬上板凳,带好瓜子听我娓娓道来。我能给出一些个人的建议,让你在运维管理的道路上少走弯路。如[详细]
-
浅谈监控,可观测性与数据存储
所属栏目:[经验] 日期:2021-05-26 热度:61
在实践中,所有这些概念/术语,目标都是增强工程师对于线上系统运行情况的了解。 对工程师而言,监控/可观测性工程存在的意义,是帮助工程师发现问题,定位问题[详细]
-
无数据,不上班!运维“数据思维”至关重要?
所属栏目:[经验] 日期:2021-05-26 热度:168
信通院的一些分析数据表明,企业IT的信息化历程逐渐完成,同时企业对IT的精益运行的需求越来越迫切,在这个场景下,数据的思维和使用能力成为制约提升IT生产效率[详细]
-
优秀的 Nginx 极简教程,覆盖了常用场景
所属栏目:[经验] 日期:2021-05-26 热度:117
nginx 的使用比较简单,就是几条命令。 常用到的命令如下: nginx-sstop快速关闭Nginx,可能不保存相关信息,并迅速终止web服务。 nginx-squit平稳关闭Nginx,保[详细]
-
关于故障复盘的一些经验
所属栏目:[经验] 日期:2021-05-25 热度:181
有句话说,常在河边走,哪有不湿鞋。我身边经常会看到不少数据故障。每每碰到这些问题,原因都是让人唏嘘不已。 而碰到故障的时候,除了通常都会说的后续改进,[详细]
-
怎样从基础思考设计你的 DevOps 运维服务体系?
所属栏目:[经验] 日期:2021-05-25 热度:153
原始阶段,运维工程师与各部门无数的磨合、探索下,慢慢形成了最初的体系,其无形的规范着运维的工作和注意事项,工程师通过这个纲领开展日常工作并保障业务的健[详细]
-
Linux中这些优秀命令,每一条都应该掌握!
所属栏目:[经验] 日期:2021-05-24 热度:50
Linux命令是对Linux系统进行管理的命令。对于Linux系统来说,无论是中央处理器、内存、磁盘驱动器、键盘、鼠标,还是用户等都是文件,Linux系统管理的命令是它正[详细]
-
运维:终于不用时刻准备着数万实例的Redis集群了!
所属栏目:[经验] 日期:2021-05-24 热度:110
1、资源隔离 当前的Redis Cluster部署在物理机集群上,为了提高资源利用率节约成本,多业务线的Redis集群都是混布的。由于没有做CPU的资源隔离,经常出现某Redis[详细]
-
麻利地排查各类系统故障的运维方法
所属栏目:[经验] 日期:2021-05-24 热度:154
今天准备谈下对于IT人员面对技术类问题分析和解决的一些思路和实践总结,在很早以前我就谈到过,对于开发人员在后期需要的不是简单的新业务功能的设计和开发能力[详细]
-
值得使用的Kubernetes日志监控工具
所属栏目:[经验] 日期:2021-05-24 热度:131
谈到优秀实践,Zebrium最近还帮助Sweetwater将事件跟踪时间从3小时减少到只有几分钟。Zebrium甚至可以发现以前未发现的隐藏问题。这是一项出色的功能,因为它可[详细]
-
分析Shell脚本中有关getopts的应用方法
所属栏目:[经验] 日期:2021-05-24 热度:69
1. getops getopts是一个解析脚本选项参数的工具。 (1) 语法格式:getopts [option[:]] [DESCPRITION] VARIABLE (2) option:表示为某个脚本可以使用的选项. (3)[详细]
-
在技术团队里,怎样实现DevOps共识?落地好难
所属栏目:[经验] 日期:2021-05-24 热度:94
每个企业想要完善或升级自身的运维体系,都必须问自己这些问题才能开始使用DevOps,并且每个企业的答案都不同。进行自我询问和回答的过程可以知道什么有效,什么[详细]
-
在Fedora上实现SSH端口转发
所属栏目:[经验] 日期:2021-05-24 热度:63
关于端口 标准 Linux 系统已分配了一组网络端口,范围是 0 - 65535。系统会保留 0 - 1023 的端口以供系统使用。在许多系统中,你不能选择使用这些低端口号。通常[详细]
-
分析EFK搭建途中及ES的生命周期管理
所属栏目:[经验] 日期:2021-05-24 热度:137
1、部署 #rpm --importhttps://artifacts.elastic.co/GPG-KEY-elasticsearch #vim/etc/yum.repos.d/kibana.repo =============================================[详细]
-
怎样利用NTS保证NTP的稳定
所属栏目:[经验] 日期:2021-05-24 热度:95
许多计算机使用 网络时间协议 Network Time Protocol (NTP)通过互联网来同步系统时钟。NTP 是少数几个仍在普遍使用的不安全的互联网协议之一。攻击者如果能够[详细]
-
使用你经常用的编程语言,将基础设施作为代码进行配置
所属栏目:[经验] 日期:2021-05-24 热度:162
Pulumi 将其状态存储在后端。默认的后端是 Pulumi 的软件即服务(它有一个针对个人用户的免费计划),但在这个例子中,我使用替代的文件后端。文件后端将在你的[详细]