Opened 7 years ago
Closed 6 years ago
#269 closed баг (не будем делать)
FS Calling, хотя трубка телефона положена.
Reported by: | san | Owned by: | alx |
---|---|---|---|
Priority: | средний | Milestone: | 2 очередь |
Component: | VE-01 | Keywords: | |
Cc: |
Description
В результате эксперимента #267
Одно из окончаний FS осталось в состоянии Calling, хотя трубка телефона подключенного к этому каналу была положена.
В таком состоянии окончание пребывало достаточно долго, более минуты, после поднятия трубки на телефоне и опускания обратно - окончание приняло статус Iddle.
Удалось воспроизвести два раза
эксперимент 1
эксперимент 2
Attachments (6)
Change History (23)
by , 7 years ago
by , 7 years ago
by , 7 years ago
by , 7 years ago
by , 7 years ago
by , 7 years ago
comment:1 by , 7 years ago
comment:2 by , 7 years ago
Лог первого эксперимента описанную ситуацию не подтверждает. В логе присутствует шесть случаев, когда канальное окончание FXS ts=29 получает сообщение о размыкании шлейфа, и после каждого из них вызов снимается, и канальное окончание переходит в состояние Idle. В конце лога есть еще один (седьмой?) вызов, который начинается с замыкания шлейфа, инициируется вызов, затем вызов отклоняет удаленная сторона, и канальное окончание FXS переходит из состояния Calling в Busy, что правильно. На этом лог кончается, сообщения о размыкании шлейфа канальному окончанию не приходит.
Прошу уточнить, какой именно из семи имеющихся в логе вызовов является "проблемным", в процессе которого плата, предположительно, работала неправильно.
comment:3 by , 7 years ago
В конце лога второго эксперимента вижу примерно то же самое, что и с конце лога первого (см. comment:2). Просто снятий/опусканий трубки там огромное количество, я не стал изучать их все...
Резюме: логи обоих экспериментов не подтверждают описание экспериментов. Либо логи неполные (не записаны до конца или имеют место пропуски строк в логах), либо описание проблемы неточное...
comment:4 by , 7 years ago
Думаю что имеет смысл изучать последний вызов в логе, т.к. файл лога был получен после "скриншотов" без проведения новых вызовов
follow-up: 6 comment:5 by , 7 years ago
Replying to san:
В таком состоянии окончание пребывало достаточно долго, более минуты,
Судя по этому уточнению, в обоих экспериментах "проблемным" являлся именно последний вызов, так как только он длился более минуты (3 минуты в каждом эксперименте). Но ни в одном из логов не зафиксировано последующее снятие вызова поднятием и опусканием трубки. Оба вызова были сняты сообщением DISCONNECT от удаленной стороны (стороны вызываемого абонента). Думаю, что DISCONNECT был отправлен по таймауту. После получения DISCONNECT окончание FXS перешло из состояния Calling в состояние Busy.
Саша, уточни, пожалуйста, на основании каких внешних признаков ты сделал вывод о том, что "окончание приняло статус Idle". Также уточни, пожалуйста, произошло ли это уже после того как вызов завершился, и окончание перешло из Calling в Busy, или раньше.
comment:6 by , 7 years ago
Replying to alx:
Саша, уточни, пожалуйста, на основании каких внешних признаков ты сделал вывод о том, что "окончание приняло статус Idle". Также уточни, пожалуйста, произошло ли это уже после того как вызов завершился, и окончание перешло из Calling в Busy, или раньше.
Со слов Саши уточняю: поднятие и опускание трубки, после которого окончание FXS переходило в Idle, выполнялось уже после завершения снятия лога.
Предположительно причина бага в том, что при опускании трубки (размыкании шлейфа) не приходит событие CAS. Возможные причины:
неисправность телефона (не сработал рычаг размыкателя, после повторного опускания трубки сработал);неисправность/баг FS-08 (не изменила состояние СУВ при размыкании шлейфа);- баг MSP платы VE-01 (не передал сообщение об изменении СУВ);
- баг CSP (теряется сообщение уже после его получения из MSP).
comment:7 by , 7 years ago
comment:8 by , 7 years ago
Как показал новый эксперимент, во время активности вызова СУВ А равен единице (согласно показаниям в таблице коммутации веб-интерфейса). Таким образом, неисправность телефонного аппарата можно исключить. И неисправность FS-08 тоже.
follow-up: 11 comment:9 by , 7 years ago
Для подтверждения/исключения бага MSP предлагается следующий эксперимент:
На плату VE-01 необходимо установить tcpdump, после чего запустить его следующим образом:
tcpdump -i eth1 -pnves0 ether[24:2]=0xb780
и воспроизвести баг. Для надежности вывод tcpdump лечше записать в файл. Вывод tcpdump должен показать все сообщения об изменении СУВ канальных окончаний.
comment:10 by , 7 years ago
Остается загадкой, почему проблема всегда возникает у одного и того же канального окончания...
comment:11 by , 7 years ago
Replying to alx:
tcpdump -i eth1 -pnves0 ether[24:2]=0xb780
Наверное даже лучше так:
tcpdump -i eth1 -pnves0 ether[24:2]=0xb780 and ether[28:2]=0x1d00
тогда будет выводиться только индикация изменения СУВ канала 30.
comment:12 by , 7 years ago
Возникла ещё теория, что воспроизведение бага связано с перегревом платы, проверяем...
comment:13 by , 7 years ago
Эксперимент с tcpdump'ом проведен. Как показал tcpdump, сообщение о размыкании шлейфа из MSP не пришло. Следовательно, виноват либо сам MSP, "забывший" известить CSP об изменении СУВ, либо какие-то проблемы в драйвере ved (например переполнилась очередь пакетов)...
follow-up: 16 comment:15 by , 7 years ago
Как показала статистика CSME_STATS, запрошенная у MSP после воспроизведения бага, счетчик пакетов, не отправленных из-за переполнения очереди, равен нулю. Думаю, переполнения очереди не возникало, и придется сделать вывод, что имеет место чистый баг MSP.
Предлагается реализовать workaround: периодически перезапрашивать состояние СУВ.
comment:16 by , 6 years ago
Replying to alx:
Предлагается реализовать workaround: периодически перезапрашивать состояние СУВ.
Как показали эксперименты, функция GET_INGRESS_SIGNALING
, предназначенная для запроса состояния принимаемых СУВ, не реализована в MSP (возвращает ответ 0xffad: "API is not supported"). Следовательно, реализовать предложенный workaround не представляется возможным.
Так как неполучение индикации изменения СУВ не приводит к катастрофическим отказам (например нахождение в состоянии Calling ограничено таймаутом, а в состоянии Connected соединение может быть завершено удаленным абонентом, или если местный абонент сделает дополнительное размыкание шлейфа), а также учитывая, что подобная ситуация возникает крайне редко, предлагаю оставить все как есть ©.
Если в ближайшее время никто не придумает другого решения, тикет закрою.
comment:17 by , 6 years ago
Resolution: | → не будем делать |
---|---|
Status: | new → closed |
приложил логи выше