Всё о SLI, SLO, SLA | AviCast #2
Всем привет! SLI, SLO, SLA — как не запутаться в этих трёх буквах и сделать их работающими инструментами? Обсуждают Паша Лакосников, руководитель юнита ArchGovernance в Авито, Дима Синявский, SRE-инженер Ви.Tech, и Кирилл Юрков, Observability and Reliability Engineering Manager ecom.tech. Поговорим про: ✔️ разницу между тремя показателями; ✔️ опыт внедрения в компаниях: когда почувствовали необходимость в SLI, SLO, SLA и как интегрировали в работу; ✔️ определение критичности и обоснование пользы SLI, SLO, SLA для бизнеса. AviСast — это подкаст, где разработчики Авито с приглашенными коллегами разбирают насущные вопросы it-мира: от обновлений и фич до крупных инцидентов. 📌 Канал Кирилла в телеграмм: https://t.me/r9yo11yp9e 📌 Чат комьюнити, где обсуждаем SLO: https://t.me/allslo_ru Хочешь быть тем самым SRE, который спасает Авито до того, как все упадёт? Здесь для тебя найдется место: https://clc.to/HAgXCw Таймкоды: 00:00 | Интро 00:44 | Введение: наши спикеры 01:34 | Что такое SLI/SLO/SLA 03:17 | Где граница измерения SLO: что нужно измерять? 06:26 | Как внедрять SLO в путь пользователя (CJM) 09:00 | Внедрение SLO с уровня микросервисов 10:11 | Микросервисы и гранулярность при выборе SLO 12:08 | Увязка продуктового сценария с техническими сервисами 14:33 | Определение критичных для бизнеса сервисов 19:50 | Разбор подхода ecom.tech: выбор SLI для компонентов 28:12 | Разбор подхода Ви.Tech: что измеряем для SLI 31:10 | Формирование SLI и SLO — персонализированный процесс 33:00 | Подход ecom.tech: платформенный алертинг на namespace 36:30 | Как отделить SLO пользовательского пути от остальных SLO 40:10 | Пример SLO для кластера Postgres 41:40 | Кто является инициатором появления SLO 46:21 | Зоны критичности 50:22 | Определение пороговых значений 57:30 | Инциденты из практики 1:03:10 | SLO для CJM, NFR сервисов: они дополняют друг друга? 1:08:42 | Как требовать исполнения NFR? 1:13:05 | Как заставить бизнес уважать бюджеты ошибок? 1:18:08 | Приучение к SLO через инциденты 1:19:33 | Итоги AvitoTech — это команда инженеров Авито. Подпишитесь на наш канал, соцсети и блоги, чтобы узнавать больше о технологиях Авито: Сайт: https://avito.tech Телеграм: https://clc.to/-YHGlg Хабр: https://habr.com/ru/company/avito Гитхаб: https://github.com/avito-tech RuTube: https://rutube.ru/channel/30462632/ Дзен: https://dzen.ru/avitotech ВК: https://vk.com/avitotech
Всем привет! SLI, SLO, SLA — как не запутаться в этих трёх буквах и сделать их работающими инструментами? Обсуждают Паша Лакосников, руководитель юнита ArchGovernance в Авито, Дима Синявский, SRE-инженер Ви.Tech, и Кирилл Юрков, Observability and Reliability Engineering Manager ecom.tech. Поговорим про: ✔️ разницу между тремя показателями; ✔️ опыт внедрения в компаниях: когда почувствовали необходимость в SLI, SLO, SLA и как интегрировали в работу; ✔️ определение критичности и обоснование пользы SLI, SLO, SLA для бизнеса. AviСast — это подкаст, где разработчики Авито с приглашенными коллегами разбирают насущные вопросы it-мира: от обновлений и фич до крупных инцидентов. 📌 Канал Кирилла в телеграмм: https://t.me/r9yo11yp9e 📌 Чат комьюнити, где обсуждаем SLO: https://t.me/allslo_ru Хочешь быть тем самым SRE, который спасает Авито до того, как все упадёт? Здесь для тебя найдется место: https://clc.to/HAgXCw Таймкоды: 00:00 | Интро 00:44 | Введение: наши спикеры 01:34 | Что такое SLI/SLO/SLA 03:17 | Где граница измерения SLO: что нужно измерять? 06:26 | Как внедрять SLO в путь пользователя (CJM) 09:00 | Внедрение SLO с уровня микросервисов 10:11 | Микросервисы и гранулярность при выборе SLO 12:08 | Увязка продуктового сценария с техническими сервисами 14:33 | Определение критичных для бизнеса сервисов 19:50 | Разбор подхода ecom.tech: выбор SLI для компонентов 28:12 | Разбор подхода Ви.Tech: что измеряем для SLI 31:10 | Формирование SLI и SLO — персонализированный процесс 33:00 | Подход ecom.tech: платформенный алертинг на namespace 36:30 | Как отделить SLO пользовательского пути от остальных SLO 40:10 | Пример SLO для кластера Postgres 41:40 | Кто является инициатором появления SLO 46:21 | Зоны критичности 50:22 | Определение пороговых значений 57:30 | Инциденты из практики 1:03:10 | SLO для CJM, NFR сервисов: они дополняют друг друга? 1:08:42 | Как требовать исполнения NFR? 1:13:05 | Как заставить бизнес уважать бюджеты ошибок? 1:18:08 | Приучение к SLO через инциденты 1:19:33 | Итоги AvitoTech — это команда инженеров Авито. Подпишитесь на наш канал, соцсети и блоги, чтобы узнавать больше о технологиях Авито: Сайт: https://avito.tech Телеграм: https://clc.to/-YHGlg Хабр: https://habr.com/ru/company/avito Гитхаб: https://github.com/avito-tech RuTube: https://rutube.ru/channel/30462632/ Дзен: https://dzen.ru/avitotech ВК: https://vk.com/avitotech