FastNetMon

Tuesday 6 March 2012

Что означает ошибка "BUG: soft lockup - CPU#0 stuck for Xs!" ?

Она означает, что на данном ядре не происходила операция reschedule в течение X секунд. Иными словами (на моем уровне понимания), один процесс все это время монопольно занимал все ядро целиком и другие процессы не могли от него получить процессорного времени (то есть, как раз выполнить тот самый решедулинг - приостановить один процесс и предоставить процессорное время другому). Иными словами, это блокировка, которая блокирует работу одного/нескольких ядер. Чем вызвана - причин множество, в том числе баг ядра.

Источник: http://www.cs.fsu.edu/~baker/devices/lxr/http/source/linux/kernel/softlockup.c

Проблема никак не фиксится. Если у Вас OpenVZ и 2.6.32 ядро, то обновитесь до упора, но если жто не решит проблем со стабильностью - откатывайтесь на centos 5, могу помочь с полным рецептом для этого дела.

No comments :

Post a Comment

Note: only a member of this blog may post a comment.