<< Click to Display Table of Contents >> Администрирование (Linux) > Сопровождение работы системы > Проверка работоспособности сервисов Статус-файлы и лог-файлы |
![]() ![]() |
По умолчанию в системе для каждого сервиса и веб-сервера автоматически создаются статус-файлы. Если развернуто несколько экземпляров сервиса, то для каждого экземпляра также создается свой статус-файл. При работе со статус-файлами учитывайте:
•названия задаются по формату <Имя компьютера>.<Имя сервиса>.status;
•размещаются вместе с лог-файлами сервисов в подпапке status;
•обновляются каждые 10 секунд. Таким образом, в них всегда указана актуальная информация по текущему состоянию сервиса;
•если сервис не работает, то статус-файл не обновляется;
•информация отображается в удобном структурированном формате JSON.
С помощью конфигуратора вы можете изменить время обновления статус-файлов, папку, в которой они хранятся, или отключить статус-файлы.
Примечание. Статус-файл предоставляет наглядную информацию по всем проверкам сервиса, но по нему нельзя отследить историю изменений, так как информация в файле перезаписывается. Для отслеживания изменений вы можете использовать информацию из лог-файлов, а также решение «Мониторинг системы Directum RX».
В статус-файл записывается общая информация по всем проверкам и детальная по каждой выполненной проверке для сервиса.
Общая информация содержит дату и время последней записи (Time) и общий статус (Status):
•healthy – все проверки выполнены успешно;
•degraded – хотя бы одна проверка выявила проблему, при этом сервис продолжает работу;
•unhealthy – хотя бы одна проверка выявила критичную ошибку, сервис неработоспособен.
Детальная информация содержит:
•Status – статус конкретной проверки: healthy – выполнена успешно, degraded – выявлены проблемы, unhealthy – возникла критичная ошибка. Отображается для всех проверок;
•Duration – длительность выполнения проверки. Отображается для всех проверок;
•Data – дополнительные данные о проверке. Отображается не для всех проверок, может содержать разную информацию, в зависимости от проверки и сервиса.
Например, если проверка оперативной памяти PROCESS_MEMORY выполнена успешно, то в файл записывается статус healthy, значения свободной и общей физической памяти, размер файла подкачки и другие данные.
Пример статус-файла для сервиса хранения файлов предпросмотра PreviewStorage:
"Time": "2024-05-16 18:16:11.890+04:00", "LastNotUnhealthyTime": "2024-05-16 18:16:11.890+04:00",
"Status": "healthy", "IsReady": true, "Statuses": { "CERTS_EXPIRATION": { "Status": "healthy", "Duration": "00:00:00.0000222"
}, "PROCESS_MEMORY": { "Status": "healthy", "Duration": "00:00:00.0014765", "Data": { "WorkingSetMB": 140, "DegradedThresholdWorkingSetMB": 768,
"MaxThresholdWorkingSetMB": 1024,
"FreeRamMB": 7725, "TotalRamMB": 18431, "PageFileMB": 22681 } … |
Дата и время записи информации Время, когда последний раз общий статус всех проверок работоспособности был healthy или degraded Общий статус всех проверок Признак того, что сервис готов принимать запросы Проверка срока действия сертификатов Статус проверки Длительность проверки
Проверка использования оперативной памяти Статус проверки Длительность проверки Информация о выделенной памяти: - рабочий набор памяти текущего процесса - промежуточное пороговое значение, при котором проверка возвращает статус degraded - максимально допустимое значение, при котором проверка возвращает статус unhealthy - свободная физическая память - общая физическая память - размер файла подкачки |
Если есть разница времени в параметрах Time и LastNotUnhealthyTime, то это значит, что одна из проверок обнаружила критичную ошибку и сервис все это время неработоспособен.
В статус-файл веб-сервера также записывается текущее состояние прикладной разработки (DeploymentPackage). Эта информация используется при публикации в распределенную систему. В зависимости от того, совпадает ли разработка на веб-сервере с разработкой в публикуемом пакете, в статус-файл записывается одно из значений:
•Actual – разработка актуальна и не требует обновления;
•Not actual – разработка неактуальна и будет обновлена.
Кроме этого, для каждого сервиса в лог-файлы записывается информация, когда меняется статус проверки с healthy на degraded, unhealthy и наоборот. Дополнительно каждые 30 минут записывается текущее состояние проверок. Информация в лог-файлах поможет понять причины изменений при расследовании инцидентов. Например, по записям можно увидеть, что оперативная память, потребляемая сервисом, постепенно росла и потом закончился доступный объем памяти сервера. После этого сервис перестал отвечать. Информацию в лог-файлах можно найти, например по слову «health».
© Компания Directum, 2024 |