MAISON CODE .
/ BFCM · Scaling · Infrastructure

The Peak : orchestrer le Black Friday

10 000 requêtes par seconde. Aucun temps d'arrêt autorisé. Comment nous chargeons les tests, gelons le code et faisons évoluer l'infrastructure pour BFCM.

AB
Alex B.
The Peak : orchestrer le Black Friday

Le Black Friday (BFCM) est le Super Bowl du e-commerce. Vous passez 11 mois à vous préparer pendant 4 jours. Si vous tombez en panne pendant 10 minutes, vous perdez 100 000 $.

Le gel du code

Le 1er novembre, nous entrons dans Code Freeze. Aucune nouvelle fonctionnalité. Pas de « correctifs CSS rapides ». Seuls les bugs P0 (bloqueurs critiques) sont autorisés. Pourquoi? Parce que chaque déploiement comporte des risques. La stabilité est primordiale.

Test de charge avec k6

Nous ne savons pas si le site peut gérer le trafic. Nous l’attaquons. Nous utilisons k6 pour simuler la navigation, l’ajout au panier et le paiement de 50 000 utilisateurs simultanés. Nous identifions les goulots d’étranglement (généralement des requêtes de base de données non optimisées ou des API tierces) et les corrigeons.

La salle de guerre

Dans “The Big Night”, on ne dort pas. Nous avons mis en place une War Room virtuelle.

  • Tableaux de bord Datadog : surveillance des taux d’erreur (5xx), de la latence (p95) et de l’utilisation du processeur.
  • PagerDuty : alertes automatisées si les réponses de l’API tombent en dessous d’un taux de réussite de 99 %.
  • Stratégies de repli : si l’API de recherche meurt, nous masquons automatiquement la barre de recherche. Le site doit se dégrader gracieusement et non exploser.

La survie n’est pas une question de chance. C’est une préparation.