Chaos Monkey est un outil logiciel développé par Netflix Engineers pour tester la résilience et la récupérabilité de leurs services Web Amazon (AWS). Le logiciel simule les échecs des instances de services exécutés au sein des groupes de mise à l'échelle automatique (ASG) en fermant un ou plusieurs des machines virtuelles.
- Qu'est-ce que le test du chaos?
- Comment les tests du chaos sont-ils effectués?
- Comment un chaos singe testerait-il les capacités de vos serveurs?
Qu'est-ce que le test du chaos?
Le test du chaos, ou l'ingénierie du chaos, est l'approche très disciplinée pour tester l'intégrité d'un système en simulant et en identifiant de manière proactive les échecs dans un environnement donné avant de conduire à des temps d'arrêt imprévus ou à une expérience utilisateur négative.
Comment les tests du chaos sont-ils effectués?
À un niveau élevé, les tests chaotiques créent simplement la capacité de provoquer des échecs en continu, mais au hasard, dans votre système de production. Cette pratique vise à tester la résilience des systèmes et de l'environnement, ainsi que de déterminer le MTTR.
Comment un chaos singe testerait-il les capacités de vos serveurs?
Chaos Monkey est un outil développé par Netflix lorsqu'ils ont commencé à utiliser Amazon Web Services. Il est utilisé pour tester la résilience de l'infrastructure informatique. Il fonctionne en désactivant délibérément les ordinateurs de la production de Netflix, pour tester comment les systèmes restants réagissent à la panne.