Диагностика проблем NFS и DNS
Назначение
DNS и NFS являются критическими зависимостями Принтум. Проблемы с ними могут вызывать: restart loop контейнеров, отказ ПринтМенеджера, ошибки синхронизации, недоступность очередей, проблемы Встроенного приложения.
Диагностика проблем DNS
Проверка resolv.conf
cat /etc/resolv.conf
Убедиться: DNS-серверы доступны, нет ошибочных записей. При необходимости скорректировать файл /etc/resolv.conf.
Проверка hostname resolution
ping monitoring.local
Проверить: hostname резолвится, IP корректный.
Типовые признаки DNS-проблем
| Симптом | Возможная причина |
|---|---|
| restart loop | hostname не резолвится |
| timeout | DNS unavailable |
| sync errors | неверный hostname |
| SSL errors | mismatch hostname |
Диагностика проблем NFS
Проверка доступности порта
telnet <hostname_nfs> 2049
Проверка stunnel:
telnet <hostname_nfs> 20490
Проверка mount
df -h
Проверить точку монтирования:
ls /var/lib/docker/volumes/printmanager_media/_data
Убедиться: volume mounted, нет stale mount, нет readonly mode.
Проверка volumes
ls /var/lib/docker/volumes/
Проверка сервисов на сервере NFS
Подключиться по SSH к серверу NFS.
Проверить место:
df -h
Проверить сервисы:
systemctl status nfs-server.service
systemctl status stunnel.service
Перезапуск сервисов NFS
systemctl restart nfs-server.service
systemctl restart stunnel.service
Проверить зелёный статус сервисов в HAProxy.
Что делать при restart loop контейнеров
Проверить: DNS, NFS и stunnel, точки монтирования, сетевую связность.
После исправления:
sudo docker-compose down
sudo docker-compose up -d
Если проблема на нескольких серверах ПринтМенеджера — остановку и запуск выполнить на всех нодах. Убедиться, что статусы в HAProxy зелёные. Если проблема сохраняется — восстановить сервер из резервной копии.
Нехватка места на диске
Очистка журналов ОС
sudo journalctl --vacuum-size 1M
sudo rm -rf /var/log/messages-*
df -h
Поиск больших логов Docker
sudo du -ch /var/lib/docker/containers/*/*-json.log
sudo truncate -s 0 <путь_к_файлу>
sudo df -h
Что важно помнить
- DNS — одна из самых частых причин отказов.
- NFS критичен для работы ПринтМенеджера.
- Большинство restart loop связано с инфраструктурными зависимостями.
- Проверка DNS и NFS должна быть первым шагом диагностики.