Skip to main content

Диагностика проблем NFS и DNS

Назначение

DNS и NFS являются критическими зависимостями Принтум. Проблемы с ними могут вызывать: restart loop контейнеров, отказ ПринтМенеджера, ошибки синхронизации, недоступность очередей, проблемы Встроенного приложения.

Диагностика проблем DNS

Проверка resolv.conf

cat /etc/resolv.conf

Убедиться: DNS-серверы доступны, нет ошибочных записей. При необходимости скорректировать файл /etc/resolv.conf.

Проверка hostname resolution

ping monitoring.local

Проверить: hostname резолвится, IP корректный.

Типовые признаки DNS-проблем

СимптомВозможная причина
restart loophostname не резолвится
timeoutDNS unavailable
sync errorsневерный hostname
SSL errorsmismatch hostname

Диагностика проблем NFS

Проверка доступности порта

telnet <hostname_nfs> 2049

Проверка stunnel:

telnet <hostname_nfs> 20490

Проверка mount

df -h

Проверить точку монтирования:

ls /var/lib/docker/volumes/printmanager_media/_data

Убедиться: volume mounted, нет stale mount, нет readonly mode.

Проверка volumes

ls /var/lib/docker/volumes/

Проверка сервисов на сервере NFS

Подключиться по SSH к серверу NFS.

Проверить место:

df -h

Проверить сервисы:

systemctl status nfs-server.service
systemctl status stunnel.service

Перезапуск сервисов NFS

systemctl restart nfs-server.service
systemctl restart stunnel.service

Проверить зелёный статус сервисов в HAProxy.

Что делать при restart loop контейнеров

Проверить: DNS, NFS и stunnel, точки монтирования, сетевую связность.

После исправления:

sudo docker-compose down
sudo docker-compose up -d

Если проблема на нескольких серверах ПринтМенеджера — остановку и запуск выполнить на всех нодах. Убедиться, что статусы в HAProxy зелёные. Если проблема сохраняется — восстановить сервер из резервной копии.

Нехватка места на диске

Очистка журналов ОС

sudo journalctl --vacuum-size 1M
sudo rm -rf /var/log/messages-*
df -h

Поиск больших логов Docker

sudo du -ch /var/lib/docker/containers/*/*-json.log
sudo truncate -s 0 <путь_к_файлу>
sudo df -h

Что важно помнить

  • DNS — одна из самых частых причин отказов.
  • NFS критичен для работы ПринтМенеджера.
  • Большинство restart loop связано с инфраструктурными зависимостями.
  • Проверка DNS и NFS должна быть первым шагом диагностики.