Диагностика отказа Мониторинга
Назначение
Инструкция описывает диагностику отказа Мониторинга в Принтум. Мониторинг отвечает за: управление системой, SNMP-мониторинг, пользователей, синхронизацию, статистику и отчеты.
Признаки проблемы
- Недоступен веб-интерфейс;
- Ошибки синхронизации;
- Не обновляется статистика;
- Ошибки Встроенного приложения;
- Недоступна панель администратора.
Последовательность диагностики SSH → гипервизор → перезагрузка → backup
Шаг 1. Проверка SSH-доступа
Попробуйте подключиться к серверу по SSH:
ssh admin@server
Если подключение успешно, проверьте состояние контейнеров:
sudo docker ps -a
Шаг 2. SSH недоступен — подключение через гипервизор
Подключитесь к виртуальной машине через гипервизор. Если вход выполнен:
- Проверьте сетевой стек.
- Проверьте DNS-настройки.
- Исправьте найденные ошибки.
Шаг 3. В терминал войти не удалось — перезагрузка ВМ
- Выполните перезапуск виртуальной машины.
- Дождитесь загрузки ОС.
- Проверьте контейнеры:
sudo docker ps -a
Шаг 4. ОС не загрузилась — восстановление из резервной копии
- Выполните попытки связи с ответственным инженером.
- При отсутствии результата восстановите ВМ из резервной копии.
Диагностика при успешном SSH-доступе
Проверка логов контейнеров
cd /opt/printum
docker-compose logs -f --tail=100
Проверить: ошибки PostgreSQL, ошибки DNS, SSL errors, traceback, connection refused.
Проверка ресурсов
htop
df -h
Проверка DNS
ping monitoring.local
cat /etc/resolv.conf
Перезапуск контейнеров Мониторинга
Если ошибок инфраструктуры нет:
cd /opt/printum
docker-compose down
docker-compose up -d
Если проблема сохраняется — перезагрузите ОС. Если проблема сохраняется после перезагрузки — обратитесь к Руководству администратора, раздел «Работа с логами».
Высокая загрузка CPU / RAM
- Подключиться по SSH.
- Определить процесс с высокой нагрузкой:
htop
Если нагружает вспомогательный сервис (например, антивирус):
systemctl stop <имя_сервиса>
Если остановка не выполнена, найти PID:
ps aux | grep <имя_сервиса>
Завершить принудительно:
kill -9 <PID>
Проверить, что статусы сервисов в HAProxy зелёные.
Типовые проблемы
| Симптом | Возможная причина |
|---|---|
| restart loop | DNS/NFS |
| Нет UI | Контейнер API не работает |
| Ошибки sync | PostgreSQL |
| SSL errors | Сертификаты |
| timeout | Network issue |
Что важно помнить
- Мониторинг не участвует напрямую в обработке печати.
- ПринтМенеджер может продолжать локальную работу.
- Большинство проблем связано с инфраструктурой.
- DNS является критически важной зависимостью.