Skip to main content

Диагностика отказа Мониторинга

Назначение

Инструкция описывает диагностику отказа Мониторинга в Принтум. Мониторинг отвечает за: управление системой, SNMP-мониторинг, пользователей, синхронизацию, статистику и отчеты.

Признаки проблемы

  • Недоступен веб-интерфейс;
  • Ошибки синхронизации;
  • Не обновляется статистика;
  • Ошибки Встроенного приложения;
  • Недоступна панель администратора.

Последовательность диагностики SSH → гипервизор → перезагрузка → backup

Шаг 1. Проверка SSH-доступа

Попробуйте подключиться к серверу по SSH:

ssh admin@server

Если подключение успешно, проверьте состояние контейнеров:

sudo docker ps -a

Шаг 2. SSH недоступен — подключение через гипервизор

Подключитесь к виртуальной машине через гипервизор. Если вход выполнен:

  • Проверьте сетевой стек.
  • Проверьте DNS-настройки.
  • Исправьте найденные ошибки.

Шаг 3. В терминал войти не удалось — перезагрузка ВМ

  1. Выполните перезапуск виртуальной машины.
  2. Дождитесь загрузки ОС.
  3. Проверьте контейнеры:
sudo docker ps -a

Шаг 4. ОС не загрузилась — восстановление из резервной копии

  1. Выполните попытки связи с ответственным инженером.
  2. При отсутствии результата восстановите ВМ из резервной копии.

Диагностика при успешном SSH-доступе

Проверка логов контейнеров

cd /opt/printum
docker-compose logs -f --tail=100

Проверить: ошибки PostgreSQL, ошибки DNS, SSL errors, traceback, connection refused.

Проверка ресурсов

htop
df -h

Проверка DNS

ping monitoring.local
cat /etc/resolv.conf

Перезапуск контейнеров Мониторинга

Если ошибок инфраструктуры нет:

cd /opt/printum
docker-compose down
docker-compose up -d

Если проблема сохраняется — перезагрузите ОС. Если проблема сохраняется после перезагрузки — обратитесь к Руководству администратора, раздел «Работа с логами».

Высокая загрузка CPU / RAM

  1. Подключиться по SSH.
  2. Определить процесс с высокой нагрузкой:
htop

Если нагружает вспомогательный сервис (например, антивирус):

systemctl stop <имя_сервиса>

Если остановка не выполнена, найти PID:

ps aux | grep <имя_сервиса>

Завершить принудительно:

kill -9 <PID>

Проверить, что статусы сервисов в HAProxy зелёные.

Типовые проблемы

СимптомВозможная причина
restart loopDNS/NFS
Нет UIКонтейнер API не работает
Ошибки syncPostgreSQL
SSL errorsСертификаты
timeoutNetwork issue

Что важно помнить

  • Мониторинг не участвует напрямую в обработке печати.
  • ПринтМенеджер может продолжать локальную работу.
  • Большинство проблем связано с инфраструктурой.
  • DNS является критически важной зависимостью.