# Диагностика отказа Мониторинга

## Назначение

Инструкция описывает диагностику отказа Мониторинга в Принтум. Мониторинг отвечает за: управление системой, SNMP-мониторинг, пользователей, синхронизацию, статистику и отчеты.

## Признаки проблемы

- Недоступен веб-интерфейс;
- Ошибки синхронизации;
- Не обновляется статистика;
- Недоступна панель администратора.

## Последовательность диагностики SSH → гипервизор → перезагрузка → backup

### Шаг 1. Проверка SSH-доступа

Попробуйте подключиться к серверу по SSH. Если подключение успешно, проверьте состояние контейнеров:

```
sudo docker ps -a
```

### Шаг 2. SSH недоступен — подключение через гипервизор

Подключитесь к виртуальной машине через гипервизор. Если вход выполнен:

- Проверьте сетевой стек.
- Проверьте DNS-настройки.
- Исправьте найденные ошибки.

### Шаг 3. В терминал войти не удалось — перезагрузка ВМ

1. Выполните перезапуск виртуальной машины.
2. Дождитесь загрузки ОС.
3. Проверьте контейнеры:

```
sudo docker ps -a
```

### Шаг 4. ОС не загрузилась — восстановление из резервной копии

1. Выполните попытки связи с ответственным инженером.
2. При отсутствии результата восстановите ВМ из резервной копии.

## Диагностика при успешном SSH-доступе

### Проверка логов контейнеров

```
cd /opt/printum
```

```
docker-compose logs -f --tail=100
```

Проверить: ошибки PostgreSQL, ошибки DNS, SSL errors, traceback, connection refused.

### Проверка ресурсов

```
htop
```

```
df -h
```

### Проверка DNS

```
ping monitoring.local
```

```
cat /etc/resolv.conf
```

### Перезапуск контейнеров Мониторинга

Если ошибок инфраструктуры нет:

```
cd /opt/printum
docker-compose down
docker-compose up -d
```

Если проблема сохраняется — перезагрузите ОС. Если проблема сохраняется после перезагрузки — обратитесь к Руководству администратора, раздел «Работа с логами».

## Высокая загрузка CPU / RAM

1. Подключиться по SSH.
2. Определить процесс с высокой нагрузкой:

```
htop
```

Если нагружает вспомогательный сервис (например, антивирус):

```
systemctl stop <имя_сервиса>
```

Если остановка не выполнена, найти PID:

```
ps aux | grep <имя_сервиса>
```

Завершить принудительно:

```
kill -9 <PID>
```

Проверить, что статусы сервисов в HAProxy зелёные.

## Типовые проблемы

|Симптом|Возможная причина|
|:---|:---|
|restart loop|DNS/NFS|
|Нет UI|Контейнер API не работает|
|Ошибки sync|PostgreSQL|
|SSL errors|Сертификаты|
|timeout|Network issue|

## Что важно помнить

- Мониторинг не участвует напрямую в обработке печати.
- ПринтМенеджер может продолжать локальную работу.
- Большинство проблем связано с инфраструктурой.
- DNS является критически важной зависимостью.