Gesamtlänge aller Episoden: 5 hours 45 minutes
Tenhle díl je o učení se z vlastních a i cizích chyb. Slova jako Postmortem, Root Cause analýza nebo CAPA proces si přidáme do slovníku a zvládneme tak tu nejtěžší část incidentu s grácií.
Vítejte u poslechu podcastu “You Build It You Run It”. Podcast o všem co potřebujete vědět když chcete provozovat globální internetovou službu. Dnešní díl je speciální, protože kromě mě, Vildy, a Láďi, na které jste zvyklí se k nám přidá host. Tím je náš kamarád Lukáš Linhart neboli Almad. Almad byl prvním zaměstnancem Apiary, zastával tam funkci CTO a hlavně nás najal. Má zkušenosti s vývojem, vedením projektů i se zodpovědností za produkt jako takový a hodně se zabývá produktivitou týmů...
Mluvime s Naďou Jašíkovou, která je SRE veteránka z OCI a Karlem Minaříkem, který strávil skoro 10 let v Elasticu.
Dnešní díl bude hlavně o tom jak dobře a rychle dostaneme změny do produkce. Jak poznáte, že to děláte dobře a co měřit aby to tak zůstalo. Neboli když neměříš tak nevíš a neřešíš...
V dnešním díle budeme pokračovat v incidentech z minulého dílu. V tomto díle se zaměříme na to co nedělat.
Incident Antipatterns
Training provided by PD
V dnešním díle se budeme zabývat tím černým scénářem kdy služba nefunguje jak má nebo něco jiného je špatně. Co s tim jak to vyřešit rychle čistě a bez krve? O tom, že štěstí přeje připraveným a že ta hlavní otázka není jestli se to rozbije, ale kdy a co budeme dělat pak.
Hope is not Strategy - https://sre.google/sre-book/introduction/
PagerDuty Incident Response - https://response.pagerduty.com/
Executive Swoop and Poop - https://response.pagerduty...
Z You build it you run it se dneska budeme i nadále bavit o té Run It části a hlavně o tom jak poznáte, že děláte on-call dobře, udržitelně a že plní účel. Taky se podíváme na to, jaké nástroje vám mohou pomoci a bez kterých se fakt neobejdete.
You build it you run it znamená, že někdo se stará, aby služba běžela dobře 24x7x365. To znamená, že někdo je připravený zasáhnout v neděli ve 4 ráno. O tom jak zavést takový režim, co to obnáší a jak si to zorganizovat se budeme bavit v tomhle díle.
Jak se vývoj posunul za posledních 30 let od software pro hardware až po vývoj pro webové služby.
19. ledna 2023 jsme pořádali panelovou diskusi v Ataccamě. Díky všem, kdo jste dorazili. Hosty byli Roman Pichlík z Ataccamy, Jirka Brunclík z Product Boardu, Borek Bernard z Shoptetu a samozřejmě taky Vilda s Láďou. Pro ty z vás, kdo tam nemohl být v téhle epizodě shrnujeme to, co tam zaznělo.