设为首页
收藏本站
开启辅助访问
切换到宽版
充值积分
登录
立即注册
论坛
BBS
工程师导航
电子学堂
服务器下载
视频教程汇总
软件汇总
老吴B站
封装搜索
论坛小店
任务升级
在线电子书
搜索
搜索
每日签到
视频汇总
PCB展
原理图
PCB培训
安装包
维修图纸
个人中心
科技新闻
新手上路
每日签到
PCB论坛
单片机
充值升级
积分转换
论坛小店
FPGA论坛
封装汇总
链接6
封装搜索
链接2
链接3
链接4
链接5
链接6
本版
用户
芯片制造中的阻挡层沉积技术介绍
接地搭接电缆布局屏蔽!!!
北美液冷生态解码:超微spuermicro,24年营
SK海力士全球首发HBM4-16层堆叠、2.0TB/s
2纳米Nanosheet技术及其以后的选择性层减薄
24小时热门
(抢先版)Cadence Allegro17.4羊皮卷
7天热门
Allegro超强最全模仿PADS快捷键实现Z切换层
机械臂驱动板,个人PCB设计分享指点
PADS和ALLEGRO 零基础-6层板课堂录像申请免费学
求助,allegro如何添加过孔
--- MPH100电源板
--------采集器-模块
C.02175-J5ARA-460S-电源板
ADC368x_18位_低噪声和极低功率双通道ADC
光源驱动电路demo新手任务
逆天PCB论坛
»
论坛
›
综合论坛
›
逆天资讯
›
Linux系统死机的软硬件问题分析
返回列表
发新帖
Linux系统死机的软硬件问题分析
[复制链接]
1388
|
0
|
2015-9-22 16:57:33
|
显示全部楼层
|
阅读模式
通知:本站禁止用系统自带的Edge浏览器下载资料。否则下载失败浪费积分。
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
[paragraph]
时间:2015-09-18 来源: 作者:
系统出现死机,一般分为两种情况:一是硬件问题;二是软件问题。
一、硬件问题
可以考虑分析以下几点:
1、不要超频CPU,如果已经超频的先回复到原来的频率
虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了。特别是Linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的。
2、确认电源供电充足
必须确保在高负载的状态下,电源可以满足负载。
3、使用memtest86检查内存状态
4、恢复BIOS到默认状态
对于服务器,可以使用自带的监测工具进行测试,也是一个不错的排错方法。
二、软件问题
如果已经基本排除硬件问题,那我们就必须考虑从软件上去获得死机状态的系统信息了。
1、运气足够好的话,系统死机不一定是完全死掉(此时键盘可能还能响应),那我们就可以使用Sysrq大法。
前提是我们必须先打开sysrq功能:
#echo "1" > /proc/sys/kernel/sysrq
#setterm-blank
这样,当系统出现问题的时候,我们可以使用:
引用
Alt+Sysrq-T 获得进程系统堆栈信息
Alt+Sysrq-M 获得内存分配信息
Alt+Sysrq-W 获得当前寄存器信息
更多的热键可以参考系统上的/usr/src/linux/Documentaion/sysrq.txt
其中,setterm -blank可以关闭字符下定时黑屏保护,方便记录屏幕信息。
2、为了让屏幕显示更多的内核调试信息,可以修改控制台的显示模式为80x25,在/boot/grub/menu.lst中对应的kernel一行最后,增加vga=0x305,如:
引用
kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root="/LABEL"=/1 vga="0x305"
3、万一键盘也不幸死掉了,那我们只能采用串口方式,把系统信息发送到另一台系统上,方法:
修改/boot/grub/menu.lst文件,在kernel一行最后增加核心参数"console=ttyS0 console="tty1"",如:
引用
kernel /boot/grub/vmlinuz-2.4.21-9.30AXsmp ro root="/LABEL"=/1 console="ttyS0" console="tty1"
然后,修改/etc/sysconfig/syslog,加入klogd选项"-c 7",如:
引用
KLOGD_OPTIONS="-x -c 7"
重启服务器;进行测试:
1)使用串口直连线连接客户机和服务器,在客户机上运行:
cat /dev/ttyS0
服务器上运行:
echo hi > /dev/ttyS0
如果客户机有"hi"输出即可。
2)服务器上运行:
echo w > /proc/sysrq-trigger
看看客户机上是否有相应的内核信息输出
3)服务器上运行:
modprobe loop
看看客户机上是否有相应的内核信息输出
如果测试都通过的话,那么在客户机上运行:
cat /dev/ttyS0 | tee /tmp/result
当死机出现的时候,我们就可以从客户机上看到需要的内核信息了(查看/tmp/result)。
三、总结
一般造成Linux系统死机的原因有:
系统硬件问题(SCSI卡,主板,RAID卡,HBA卡,网卡,硬盘等)
外围硬件问题(网络等)
软件问题(系统、应用软件)
驱动bug(找新的驱动)
核心系统bug(到LKML看看,或更换核心再试)
系统设置(恢复到缺省状态,关闭防火墙等)
《《《 点击这里展开全文 》》》
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
项目开源
作品文件展(二级)
DataSheet | 规格书 | 数据手册
社区居民
拥有帐号并登录即可获得此勋章.
huyafan
36
主题
7
回帖
172
积分
二级逆天
二级逆天, 积分 172, 距离下一级还需 9828 积分
二级逆天, 积分 172, 距离下一级还需 9828 积分
积分
172
加好友
发消息
回复楼主
返回列表
逆天资讯
51单片机 | STM32 | AVR
FPGA | CPLD | DSP
ARM论坛
数 | 模电子
拆机 | DIY | 维修
程序开发
手机平板论坛
Layoutguide指南 | Checklist
维修图纸固件程序
DataSheet | 规格书 | 数据手册
综合论坛
图文推荐
申请第4节课,谢谢
4 天前
申请第三节课录像
4 天前
5.1 申请第四节课录像
4 天前
申请第二阶段的录像
4 天前
申请allegro第三课培训录像
4 天前
热门排行
1
PADS9.5完整版+破解文件+安装教程 免费下载(2021年更新)
2
PADS 9.5 破解版 破解文件下载,注册文件下载,和谐
3
逆天PCB论坛-服务器大量共享资料
4
PADS 9.5 全中文版本出来了,PADS9.5 完整版免费下载
5
新手必学的原理图
6
pads9.5实战攻略与高速pcb设计.pdf 高清扫描版[完整
7
论坛会员人数20万,发一波福利,500个名额,每人80金币
8
史上最强精品PADS视屏,电子,PDF各种格式教程大全
9
回帖奖励-每人100金币-先到先得-200个名额
10
PADS9.5 视频教程百度网盘高速下载,在线看[精讲]-重新补充