#702 closed задача (готово)
Перезапуск по Watchtog
Reported by: | san | Owned by: | alx |
---|---|---|---|
Priority: | высокий | Milestone: | 1 очередь |
Component: | sw | Keywords: | |
Cc: |
Description
У пользователя в сети несколько блоков периодически перезапускаются по Watchdog.
Он выслал логи и просит помочь определить причину перезапусков.
Логи блоков здесь:
xchange\alx\Test_and_bugs\перезапуск_WD\Горназоводск24\
Change History (3)
comment:1 by , 4 months ago
Resolution: | → готово |
---|---|
Status: | new → closed |
comment:2 by , 4 months ago
в логе регулярно встречаются записи о том, что пользователь monitoging записывает конфигурацию в платы SM-02, однако в логе нет записей о последующем рестарте платы (пропадании и последующем появлении платы в блоке), хотя для применения записанной в плату конфигурации требуется выполнить рестарт платы.
Поясню, что это пользователь нажимает кнопку Опрос в окне платы.
comment:3 by , 4 months ago
Пользователь сообщил, что после обновления ПО плат проблема перестала воспроизводиться.
Плата SW-01 с адресом 192.168.20.34
В логах за период с 23 января по 25 июля обнаружена одна перезагрузка по причине watchdog reset. Этой перезагрузке непосредственно предшествовало сообщение об Aignment trap:
Alignment trap - это исключение, возникающее при попытке обратиться к памяти с нарушением выравнивания (например попытке прочитать из памяти слово по нечетному адресу). В данном конкретном случае, видимо, была попытка прочитать или записать 32-битное слово, и при этом адрес не был кратен четырем. Причиной подобного может быть как программная ошибка, так и аппаратный сбой.
Результатом возникновения такого исключения является аварийное завершение процесса swd, которое, в свою очередь, приводит к срабатыванию таймера watchdog и последующей перезагрузке.
В процессе анализа замечены следующие необычные обстоятельства:
Плата SW-01 с адресом 192.168.20.35
В логах за период с 23 мая по 25 июля обнаружена одна перезагрузка по причине watchdog reset. Как и в плате с адресом 192.168.20.34, этой перезагрузке непосредственно предшествовало сообщение об Aignment trap.
Результатом возникновения такого исключения является аварийное завершение процесса swd, которое, в свою очередь, приводит к срабатыванию таймера watchdog и последующей перезагрузке.
В процессе анализа замечены следующие необычные обстоятельства:
Плата SW-01 с адресом 192.168.20.36
В логах за период с 7 февраля по 25 июля обнаружено девять перезагрузок по причине watchdog reset. Однако все перезагрузки произошли в период с 23 по 25 июля. В трех из этих случаев перезагрузке непосредственно предшествовало сообщение об Aignment trap. В остальных случаях по косвенным признакам можно предположить, что также имело место аварийное завершение процесса swd, однако записи о его причине в логе нет. Наиболее вероятной причиной подобного аварийного завершения является программная ошибка.
Аварийные завершения процесса swd привели к срабатываниям таймера watchdog и последующим перезагрузкам платы.
Концентрация всех девяти перезагрузок в интервале трех дней наводит на мысль о том, что в районе 23 июля произошли какие-то изменения условий эксплуатации платы (например увеличился трафик в сети, интенсивность запросов к плате, изменились какие-то настройки), однако предположить, что именно могло измениться, на основании записей в логе не представляется возможным.
В процессе анализа замечены следующие необычные обстоятельства:
Рекомендации пользователю