Skip to main content

Модель диагностики Принтум

Что такое модель диагностики

Диагностика в Printum строится по трёхшаговой модели. Цель модели — не перебирать логи наугад, а сначала сузить зону поиска, потом определить конкретное звено в цепочке компонентов, и только затем смотреть логи именно там.

Главный принцип: сначала понять, где проблема — в системе или в инфраструктуре. Потом в какой части системы. Потом смотреть логи.

Три шага модели

| Шаг | Вопрос | Результат | | ------------------------- | -------------------------------------------------- | -------------------------------------------------------- | | Шаг 1. Локализация | Система или инфраструктура? | Понимаем, стоит ли вообще смотреть в Printum | | Шаг 2. Сценарий и условия | Что именно происходит, у кого, при каких условиях? | Паспорт инцидента: сценарий, масштаб, воспроизводимость | | Шаг 3. Карта системы | Какие компоненты участвуют в этом сценарии? | Конкретный контейнер или служба, которую нужно проверить | | Шаг 4. Логи | Что написано в логах целевого компонента? | Причина проблемы или следующая гипотеза |

Почему именно в таком порядке

Если начать с логов без локализации — потратите время на правильные логи, в которых нет ошибки, потому что проблема вообще за пределами системы. Если не определить сценарий — непонятно, в каком именно контейнере из десятка искать.

Тимур Гусев (встреча по архитектуре): «Если инженер умеет читать поток данных, он сможет диагностировать систему в любом проекте — в самом лёгком и в самом сложном».

Связанные страницы

  • Шаг 1 — Локализация: система или инфраструктура?
  • Шаг 2 — Определение сценария и условий
  • Шаг 3 — Карта системы и где искать проблему
  • Шаг 4 — Сбор и чтение логов
  • Паспорт инцидента
  • Основные процессы системы (стр. 219–222)