systemd稳定性增强

systemd稳定性增强

Systemd是系统和服务的管理器,作为PID 1运行并启动系统的其余部分,它已经是主流发行版的默认INIT、是使用最广泛的INIT;它的应用场景广,包括物理机、虚拟机、容器等;它涉及的技术点多,包括几乎所有kernel特性、大部分用户态组件等。它和kernel一起作为OS的基石。
云场景对systemd提出了迫切的需求:服务器经常运行好几年都不重启,而且上面跑着成百上千的虚拟机/容器,需要systemd稳定性高,支持长时间运行而不宕机、不泄漏资源。
本文介绍了阿里云在systemd的稳定性增强方面的实践,实现了systemd热升级、根治了若干集群抖动性能问题、资源泄漏问题、systemd与容器的兼容性问题,让systemd可以支持双十一等严苛场景。