负载过大时,e1000_watchdog 反复 UP、DOWN 的问题
做 NAT 服务器,当负载过大时,总出现
Oct 17 14:56:04 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:08 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex
Oct 17 14:56:09 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:15 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex
网卡反复 UP、DOWN,甚至导致系统自动重启
这个 e1000_watchdog 是做什么用的?为何有如此现象?如何不让他自动 UP、DOWN ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(9)
复制代码
[ 本帖最后由 platinum 于 2005-11-3 14:24 编辑 ]
复制代码
这段话什么意思?什么情况会导致 link = 0 ?
如果删除了 else 后面的东西重新编译驱动,会不会有副作用?
watchdog这个好像是检测到坏桢认为可能硬件出现故障复位硬件,不过e1000吃不住流量的情况应该不大,估计是线制作的不合格导致大流量时坏桢严重,或者有电气干扰等。
对了,ifconfig看一下是不是相应网卡出现很多errors的包
很奇怪呢,RX-ERR RX-DRP RX-OVR,这三项都是 0
是这样的,这台机器上还运行其他服务,CPU 一直比较高,会不会是没有过多的 CPU 来负责处理数据包造成的?
还有,我如果修改源代码,注释掉硬件复位那段代码可不可以?会不会有副作用?
cat /proc/interrupts 看下是否和这相似,注释掉硬件复位那段代码没问题,
CPU0 CPU1 CPU2 CPU3
0: 347275720 347745526 340396987 340996245 IO-APIC-edge timer
1: 284 789 878 556 IO-APIC-edge i8042
8: 0 0 0 1 IO-APIC-edge rtc
9: 0 0 0 0 IO-APIC-level acpi
14: 1 0 20 19 IO-APIC-edge ide0
15: 87104 399199 5819 328406 IO-APIC-edge libata
169: 0 0 0 0 IO-APIC-level uhci_hcd
177: 0 0 0 0 IO-APIC-level uhci_hcd
185: 0 0 0 0 IO-APIC-level ehci_hcd
209: 186220 5466568 211081 5950435 IO-APIC-level ioc0
217: 27184131 0 0 157 IO-APIC-level eth0
225: 0 0 51742411 29 IO-APIC-level eth1
NMI: 0 0 0 0
LOC: 1376397708 1376397707 1376397706 1376397705
ERR: 0
MIS: 0
这样正常吗?
不会是负载过大的原因.我们单位做iptv,负荷比你重多了吧,也是e1000
e1000 是千兆的网卡, 100M应该没事呀?
watchdog 好象是用来检测什么东东的一个计时, 我觉得是不是你的 switch 受不了呀? 因为 switch 如果不行了, 网卡一样会认为网络 down 呀.