Quels sont les stratégies à adopter afin d'assurer la disponibilité d'un système de production ? Nous verrons comment orienter son architecture pour la rendre hautement disponible et gérer la reprise rapide d'activité d'un cluster K8S hébergé dans le cloud AWS en cas de perte totale d'une région. Nous verrons comment orienter son architecture dans le cloud AWS dans le but de proposer une plateforme hautement disponible. Pour ce faire, nous détaillerons différents problèmes qu'il est possible de rencontrer et leurs solutions envisageables. Nous parlerons donc de la gestion des backups (application stateless vs stateful), de la disponibilité d'un système de production... Nous pousserons jusqu'au disaster recovery en voyant comment pallier la perte totale d'une région. L'ensemble permet de tirer facilement profit du DevOps et de la business agililty en nous appuyant sur des outils comme terraform, lambda ou encore kops.