linux服务器系统卡死怎么处理?
当Linux系统卡死时,可以按照以下步骤进行排查和解决:
一、尝试切换虚拟终端(TTY)
1、进入命令行界面
按下 Ctrl + Alt + F1-F6 切换到虚拟终端(如 F1 或 F3)。
2、登录并检查进程
使用 top、htop 或 ps aux 查看资源占用情况。
找到占用过高CPU或内存的进程,用 kill <PID> 终止进程(若无效则用 kill -9 <PID>)。
二、强制安全重启(REISUB组合键)
1、触发安全重启
依次按下(间隔1秒):
Alt + SysRq (Print Screen) → R → E → I → S → U → B
作用:逐步终止进程、卸载磁盘、重启系统,减少数据损坏风险。
2、若无效:强制关机(最后手段)。
三、图形界面卡死的处理
1、重启显示管理器
sudo systemctl restart gdm3 # GNOME
sudo systemctl restart lightdm # XFCE/LXDE
2、重启Xorg服务
按下 Ctrl + Alt + Backspace(需启用该快捷键)。
四、检查系统日志
1、查看近期日志
journalctl -b -0 -p 3 # 本次启动的错误日志
dmesg | tail -n 50 # 内核日志
2、常见日志路径
/var/log/syslog
/var/log/kern.log(内核错误)
五、硬件与资源排查
1、检查磁盘空间
df -h # 查看磁盘使用
df -i # 检查inode是否耗尽
2、内存检测
重启后运行 memtest86+(需安装)。
3、硬盘健康检查
sudo smartctl -a /dev/sda
六、驱动与内核问题
1、回滚内核或驱动
在GRUB启动菜单中选择旧内核启动。
卸载最近更新的驱动(如NVIDIA驱动)。
2、更新系统
sudo apt update && sudo apt upgrade
七、文件系统修复
1、强制重启后检查磁盘
sudo fsck -y /dev/sda1 # 替换为实际分区
八、禁用问题服务或硬件
1、进入恢复模式
在GRUB中选择 Advanced Options → Recovery Mode。
2、排查外设
拔掉USB设备、外接硬盘等,排除硬件冲突。
九、预防措施
1、配置监控工具
使用 cron 定时任务监控资源(如 nmon、glances)。
2、启用SysRq功能
sudo sysctl -w kernel.sysrq=1 # 临时启用
永久生效:在 /etc/sysctl.conf 添加 kernel.sysrq = 1。
总结流程
1、优先尝试 Ctrl+Alt+F1 终止问题进程。
2、若完全卡死,使用 REISUB 安全重启。
3、检查日志、硬件、资源占用,修复文件系统。
4、更新/回滚驱动或内核,排查外设问题。
根据具体情况选择合适步骤,逐步缩小问题范围!