菜鸟经验:揭示新版systemd的运作细节以及与旧版SystemV的区别

Posted Posted in Linux, 系统, 经验, 菜鸟

systemd是初始化程序(init)和 SystemV 初始化脚本的现代替代者。此外,它还有更多功能。

当我想到 init 和 SystemV 初始化时,像大多数系统管理员一样,我想到的是 Linux 的启动和关闭,而不是真正意义上的管理服务,例如在服务启动和运行后对其进行管理。像 init 一样,systemd 是所有进程之母,它负责使 Linux 主机启动到可以做生产性任务的状态。systemd 设定的一些功能比老的初始化程序要广泛得多,它要管理正在运行的 Linux 主机的许多方面,包括挂载文件系统、管理硬件、处理定时器以及启动和管理生产性主机所需的系统服务。

….[阅读全文]

微软Azure云 IAAS故障排除与实战101:修改Azure虚拟机端口实战以及故障排除方法

Posted Posted in Azure, Windows, 云计算, 系统, 经验, 菜鸟

为了避免一些端口暴露在公网上被扫描和破解,一些用户选择修改默认端口的方法提升安全性。在Azure云的虚拟机中我们同样可以做这样的操作,但是由于某些原因,客户可能会忘记在操作系统防火墙中添加自定义端口开放,这直接造成了无法连接虚拟机的状况。本次实验以Azure云的Windows虚拟机为测试环境,修改默认的3389端口,并介绍一些简单的快速的故障排除方法。

….[阅读全文]

MTU的作用以及定义,MTU故障与解决方法案例

Posted Posted in 经验, 菜鸟

最大传输单元(Maximum Transmission Unit,MTU)是指一种通信协议的某一层上面所能通过的最大数据报大小(以字节为单位)。最大传输单元这个参数通常与通信接口有关(网络接口卡、串口等)。
Internet协议允许IP分片,这样就可以将数据报分成足够小的片段以通过那些最大传输单元小于该数据报原始大小的链路了。这一分片过程发生在IP层(OSI模型的第三层,即网络层),它使用的是将分组发送到链路上的网络接口的最大传输单元的值。原始分组的分片都被加上了标记,这样目的主机的IP层就能将分组重组成原始的数据报了。

….[阅读全文]

老鸟总结:Linux故障定位以及问题解决的方法与思路,看这一篇就够了 by Lucien_168

Posted Posted in Linux, 系统, 经验, 菜鸟

前言:在LINUX中有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务器进一步深入分析问题的根源。那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题。所以,分析问题和踩坑是非常锻炼一个人的成长和提升自我能力。如果我们有一套好的分析工具,那将是事半功倍,能够帮助大家快速定位问题,节省大家很多时间做更深入的事情。

….[阅读全文]

老鸟经验:Linux操作系统常见故障处理之ext4文件系统超级块损坏修复实例

Posted Posted in Linux, 系统, 经验, 菜鸟

      前天外面出差大数据测试环境平台有7台服务器挂了,同事重启好了五台服务器,但是还有两台服务器启动不起来,第二天回来后我和同事再次去机房检查,发现两台服务器都显示superblock的报错,经过一番处理后两台服务器都正常进系统了,现决定重现superblock故障并将此类问题故障处理思路写下来方便后面新同事参考。

….[阅读全文]

老鸟经验:Linux中强大的strace调试命令用法以及详解操作实战

Posted Posted in Linux, 系统, 经验, 菜鸟

按照strace官网的描述:strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。

strace底层使用内核的ptrace特性来实现其功能。

本篇文章主要介绍了Linux系统中strace命令的使用以及strace命令用于追踪和统计系统调用信息,需要的朋友可以参考下。

….[阅读全文]

老鸟经验:在Linux上使用strace命令来输出系统调用细节

Posted Posted in Linux, 系统, 经验, 菜鸟

Strace即为system trace的缩写,在Linux系统里进行调试时所用。

使用 strace 跟踪用户进程和 Linux 内核之间的交互。在运维的日常工作中,故障处理和问题诊断是个主要的内容,也是必备的技能。strace作为一种动态跟踪工具,能够帮助运维高效地定位进程和服务故障。它像是一个侦探,通过系统调用的蛛丝马迹,告诉你异常的真相。

….[阅读全文]

如何修改Linux内核参数,用于减少TCP中的TIME-WAIT连接

Posted Posted in 经验, 菜鸟

一台服务器CPU和内存资源额定有限的情况下,如何提高服务器的性能是作为系统运维的重要工作。要提高Linux系统下的负载能力,当网站发展起来之后,web连接数过多的问题就会日益明显。在节省成本的情况下,可以考虑修改Linux 的内核TCP/IP参数来部分实现;如果通过修改内核参数也无法解决的负载问题,也只能考虑升级服务器了。

Linux系统下,TCP/IP连接断开后,会以TIME_WAIT状态保留一定的时间,然后才会释放端口。当并发请求过多的时候,就会产生大量的 TIME_WAIT状态的连接,无法及时断开的话,会占用大量的端口资源和服务器资源(因为关闭后进程才会退出)。这个时候我们可以 ….[阅读全文]