Opened 6 years ago

Closed 4 years ago

#377 closed улучшение (fixed)

Firmware activation timeout

Reported by: san Owned by: alx
Priority: средний Milestone: 2 очередь
Component: sw Keywords:
Cc:

Description

Перенес alx из ve:#309:

В последнее время заметил что иногда при штатном обновлении ПО платы VE-01, веб интерфейс сообщает об ошибке "Firmware activation timeout", хотя обновление проходит успешно. Такое поведение может ввести пользователя в заблуждение и заставить его усомниться в том что обновление прошло успешно.

Как воспроизвести такую ситуацию я не знаю, на заказ не воспроизводится, подозреваю что просто таймаут где-то на грани и может быть имеет смысл просто увеличить таймаут?

Change History (7)

comment:1 by alx, 6 years ago

Увеличить, конечно, можно, но непонятно, какое значение устаносить. Из каких соображений исходить...

Когда плата SW-01 посылает команду, она ждет ответ в течение некоего (на данный момент константного) промежутка времени. Если ответа нет, повторяет запрос, удваивая таймаут после каждого запроса. То есть таймаут растет экспоненциально. Если максимальное число перепосылок исчерпано, запрос считается неуспешным, и отображается сообщение "Firmware activation timeout".

Можно тупо увеличить число перепосылок еще на одну, что удвоит время ожидания ответа, но, с другой стороны, время на активацию платой прошивки нигде не ограничено, и это не гарантирует, что когда-нибудь мы не столкнемся с данной проблемой опять...

Version 0, edited 6 years ago by alx (next)

comment:2 by alx, 5 years ago

Resolution: не будем делать
Status: newclosed

Измерил время активации прошивки платы VE-02-01 (а ее прошивка на 20% больше чем прошивка платы VE-01!). Время активации от передачи команды до получения ответа составило 33 секунды (напомню, что в процессе активации платы VE-01/VE-02-01 скачивают файлы прошивки из SW-01, вычисляют и проверяют их контрольные суммы, записывают файлы в ПЗУ, после чего отправляют ответ на запрос активации).

Время же ожидания ответа составляет 50.8 с ±10%. Даже если взять предельный случай (когда все таймауты оказались -10%), это составит 45.7 с. Это очень большой запас по сравнению с фактическим временем активации, и пока я не вижу оснований для его увеличения.

Думаю, что увеличенное (по сравнению с нормальным) время активации прошивки могло быть вызвано какими-то внешними причинами, например передача прошивки осуществлялась через внешнюю сеть (а не напрямую от SW-01 к VE-01), при этом в сети имели место задержки и/или потери пакетов...

comment:3 by alx, 5 years ago

Поскольку в роутинге между SW-01 и VE-01/VE-02-01 через внешние маршрутизаторы никакого криминала нет, равно как внешняя сеть не обязана быть быстрой, при любом значении таймаута есть шанс, что SW-01 не дождется окончания активации и сообщит о таймауте. Может просто надо в руководство добавить уточнение, что надпись "Firmware activation timeout" не обязательно означает, что активация прошивки закончилась неудачей, это на самом деле просто предупреждение, что мы не дождались его завершения, при этом процесс активации в плате может продолжаться... ?

comment:4 by san, 5 years ago

В последних экспериментах не замечал сообщений о таймауте, обновления проходят штатно, возможно действительно были какие-то внешние причины...

Может просто надо в руководство добавить уточнение, что надпись "Firmware activation timeout" не обязательно означает, что активация прошивки закончилась неудачей, это на самом деле просто предупреждение, что мы не дождались его завершения, при этом процесс активации в плате может продолжаться... ?

Наверное это может быть полезным, насколько я помню о возможных результатах обновления VE в РЭ ничего не сказано.

comment:5 by san, 4 years ago

Если прошивать одновременно несколько плат VE-01 сразу, то вероятность не успеть за таймаут увеличивается.
Я обновляю сразу 4 платы в кассете и это гарантированно приводит к ошибке ошибка: firmware activation timeout на всех платах. Видимо плата SW-01 не успевает отдать прошивку сразу всем за время таймаута.

in reply to:  5 comment:6 by alx, 4 years ago

Resolution: не будем делать
Status: closedreopened

Replying to san:

Я обновляю сразу 4 платы в кассете и это гарантированно приводит к ошибке ошибка: firmware activation timeout на всех платах. Видимо плата SW-01 не успевает отдать прошивку сразу всем за время таймаута.

Хорошо, увеличу таймаут. :)

comment:7 by alx, 4 years ago

Resolution: fixed
Status: reopenedclosed

In 1985/sw:

Таймаут ожидания результата активации прошивки платы увеличен до ~102 секунд.
Closes #377.

Note: See TracTickets for help on using tickets.