CrowdStrike a connu une panne majeure en raison d'un bug de mise à jour logicielle
La semaine dernière, il y a eu une panne importante dans le fonctionnement des PC exécutant Windowscausé par une erreur dans une mise à jour du logiciel CrowdStrike. Les logiciels conçus pour protéger contre les cyberattaques sont tombés en panne sur des millions d'ordinateurs. Après enquête, CrowdStrike a déterminé que le problème était dû à un bug dans le logiciel de test qui n'avait pas réussi à tester correctement la mise à jour publiée vendredi.
CrowdStrike a promis de tester les mises à jour de manière plus approfondie à l'avenir en mettant en œuvre un déploiement progressif des packages. Cela devrait permettre d’éviter qu’un incident similaire ne se reproduise. L'application Falcon, utilisée pour se protéger contre les cyberattaques, est installée sur des millions de PC dans le monde. Une mise à jour pour la collecte de télémétrie a été publiée vendredi, mais c'est celle-ci qui a provoqué le crash.
Il existe deux types de mises à jour pour Falcon : Sensor Content, qui met à jour le contenu sur l'appareil, et Rapid Response Content, qui met à jour les signatures des capteurs. Cette fois, l'échec était dû à un fichier Rapid Response Content de 40 Ko qui affectait 8,5 millions d'ordinateurs. Ces mises à jour ne sont généralement pas déployées depuis le cloud et incluent des modèles d'IA et d'apprentissage automatique pour améliorer la détection des logiciels malveillants.
La semaine dernière, CrowdStrike a publié deux mises à jour de Rapid Response Content. Un bug dans l’outil de révision de contenu a permis aux deux packages de réussir le test malgré des problèmes avec l’un d’eux. Cela a provoqué un crash dans Windows en raison d'une tentative d'accès à une zone mémoire invalide.
Pour éviter des incidents similaires à l'avenir, CrowdStrike prévoit d'améliorer le processus de test en introduisant des contrôles locaux sur les systèmes des développeurs, des déploiements progressifs et la possibilité de revenir à un état antérieur du système. Des outils de tests de résistance et de détection d'erreurs seront ajoutés, l'outil de vérification du cloud sera mis à jour et le mécanisme de gestion des erreurs dans le capteur Falcon sera amélioré.