Le choix infra façonne la marge et la vélocité produit. En 2025, les offres serverless se sont étoffées, mais les GPU dédiés gardent l’avantage pour les charges stables.

Profils — Charge régulière (SLA stricts) → dédiés; burst imprévisible → serverless. Latence cible et proximité des données influencent fortement.

Coûts — Capex/Opex, réservations, sur‑allocation, réseau. Comparez le coût par 1M tokens sur scénarios réels. Anticipez la croissance (éléasticité).

Risques — Verrouillage fournisseur, pannes, compliance. Multi‑fournisseur coûte en complexité.

Reco — Commencer serverless pour vitesse; basculer (partiellement) vers dédié à partir d’un seuil d’usage stable. Mesurer en continu, pas une fois par an. original: true category: Guide tags: