У пользователя во время работы может возникать сообщение:

После чего рабочий режим либо восстанавливается, либо нет.

В сообщении достаточно ясно описана возникшая ситуация, но необходимо понимать, что по другую сторону экрана пользователя, ландшафт системы может быть несколько сложнее, чем он себе представляет. И сервер «с которым потеряно соединение» может быть не только сервер 1С:Предприятия.

Например, когда подключение к серверу 1С:Предприятия осуществляется через веб-сервер, а для балансировки нагрузки еще используется сервер балансировки, то в этом случае, отсутствие связи или сбой в работе любой из 3-х зон(смотри рисунок) — будет сопровождаться одной и той же ошибкой у пользователя текст которой мы видели выше.

Ландшафт серверной инфраструктуры 1С:Предприятия

Ландшафт серверной инфраструктуры 1С:Предприятия

Но, если у пользователя текст ошибки будет одинаков, то в технологическом журнале информации будет больше. Чтобы в этом убедиться необходимо включить его с событиями EXCP.

О том, как это сделать описано в Настройка и сбор логов для анализа проблем производительности систем 1С на Linux.

Итак, проанализируем записи в технологическом журнале.

В случае любой из нижеперечисленных ошибок решением является последовательная диагностика состояния сервера, служб, сети в каждой зоне ландшафта оборудования.

Разрыв соединения или сбой в работе сервера может наблюдаться в зонах:

Зона 1. Кластер серверов балансировки Nginx.

Необходимо проанализировать логи Nginx:

Зона 2. Кластер веб-сервeров Apache.

Необходимо проанализировать логи Apache:

Зона 3. Кластер серверов 1C:Предприятия.

Проверка работы служб серверов 1С:Предприятия описана в Проверка рабочих процессов сервера 1С на Linux.

При необходимости  — собрать более подробный технологический журнал и проанализировать его.