LOADING
LOADING
Stratégie d’IAAnalyse
La plupart des projets pilotes d'IA en entreprise impressionnent en démo, puis meurent en silence. Le problème n'est pas le modèle, c'est le modèle d'exploitation. Voici ce qui distingue les pilotes qui passent en production de ceux qui stagnent.
En résumé
L'adoption n'est plus le sujet. McKinsey rapporte que 71 % des organisations ont utilisé l'IA générative dans au moins une fonction en 2024, contre 33 % l'année précédente, et l'AI Index de Stanford situe l'usage global de l'IA à 78 % des organisations. Tout le monde fait des pilotes. Presque personne ne passe en production.
L'étude MIT NANDA a livré le chiffre qui a fait sursauter les directions financières : 95 % des pilotes d'IA générative en entreprise ne livrent aucun retour sur investissement mesurable, et seulement ~5 % accélèrent rapidement les revenus. Gartner ajoute la version prospective — plus de 40 % des projets d'IA agentique seront annulés d'ici fin 2027 — en invoquant des coûts qui dérapent, une valeur floue et des contrôles de risque insuffisants.
Remarquez ce qui ne figure pas sur cette liste : la qualité du modèle. Les mêmes modèles de pointe qui alimentent les pilotes ratés alimentent aussi les 5 % qui fonctionnent. L'étude du MIT est explicite : la cause profonde, c'est une mauvaise intégration et des priorités mal alignées, pas des modèles faibles. Le purgatoire des pilotes est un échec du modèle d'exploitation déguisé en problème technique.
Un pilote prouve qu'un modèle peut faire une tâche une fois, sur une entrée propre, sous l'œil d'un humain. La production exige qu'il fasse la tâche 10 000 fois, sur des entrées désordonnées, à l'intérieur d'un vrai processus, avec journalisation, contrôles d'accès, mécanismes de repli et un responsable alerté quand ça casse. Ce sont des problèmes d'ingénierie différents, et c'est le second qui tue les projets. Gartner prévoit par ailleurs qu'au moins 30 % des projets d'IA générative seront abandonnés après la preuve de concept — la PoC fonctionne, la version de production n'arrive jamais.
Trois modes d'échec reviennent :
Le processus n'a pas été repensé. Greffer l'IA sur un processus hérité produit une version plus rapide d'un processus défaillant. Les données 2025 de McKinsey sont sans détour : seulement 39 % des organisations attribuent un impact sur le BAII à l'IA, et ~6 % seulement sont très performantes avec un impact de 5 % et plus — et la refonte en profondeur des processus est le facteur le plus fortement corrélé à cet impact.
Les données ne sont pas prêtes. Gartner prévoit que les organisations abandonneront 60 % des projets d'IA non soutenus par des données prêtes pour l'IA d'ici 2026, et que 63 % manquent de pratiques adéquates de gestion des données. Un pilote peut tourner sur un échantillon nettoyé à la main ; pas la production.
La fiabilité n'est pas vérifiée. Même les outils spécialisés affabulent — Stanford/RegLab a constaté que des outils juridiques conçus sur mesure hallucinaient sur 17 % à plus de 34 % des requêtes difficiles, malgré des promesses « sans hallucination ». Sans bancs d'évaluation et supervision humaine, un pilote qui semblait précis échoue à son premier audit.
Dans les secteurs réglementés, un pilote peut être techniquement parfait et ne jamais passer en production, parce que personne ne peut accepter le risque. La conformité est désormais le principal frein, pas la capacité : Deloitte a constaté que la préoccupation liée à la conformité réglementaire est passée de 28 % à 38 % pour devenir le frein numéro un à l'adoption de l'IA générative, selon une enquête auprès de 2 773 dirigeants incluant les services financiers.
Le déficit de contrôles est frappant. Le rapport 2025 d'IBM sur les violations a constaté que 63 % des organisations touchées n'ont aucune politique de gouvernance de l'IA ou en élaborent encore une, et parmi les entreprises victimes d'un incident lié à l'IA, 97 % manquaient de contrôles d'accès appropriés. Pendant ce temps, la Loi européenne sur l'IA prévoit des sanctions allant jusqu'à 35 M€ ou 7 % du chiffre d'affaires mondial, les obligations à haut risque entrant en vigueur dès août 2026. Au Québec, les amendes de la Loi 25 atteignent jusqu'à 25 M$ CA ou 4 % du chiffre d'affaires mondial.
La solution n'est pas des pilotes plus lents — ce sont des pilotes conçus dès le départ selon un cadre reconnu. ISO/IEC 42001:2023, première norme certifiable de système de management de l'IA, et le Profil IA générative du cadre de gestion des risques de l'IA du NIST, qui nomme l'affabulation parmi 12 catégories de risque, offrent aux acheteurs réglementés une cible vérifiable. Un pilote bâti selon ces contrôles franchit l'approvisionnement ; un pilote bricolé pour une démo, non. C'est le travail de la sécurité et gouvernance de l'IA — et la raison pour laquelle il doit venir au début du projet, pas à la fin.
Les pilotes qui passent en production partagent une posture : ils traitent la production comme contrainte de conception dès la première semaine, pas comme une phase qui suit les applaudissements de la démo. Concrètement, cela tient en quatre gestes.
Cibler un seul processus avec un responsable mesurable. Pas « l'IA pour les réclamations » — mais « réduire le délai d'évaluation de responsabilité au premier contact sur les réclamations auto, sous la responsabilité du VP réclamations, mesuré en jours ». Le constat de McKinsey selon lequel 62 % des organisations expérimentent des agents mais seulement 23 % les déploient à l'échelle recoupe presque exactement ce déficit de discipline.
Décider avant de bâtir. Une courte phase de découverte fait remonter les obstacles de préparation des données, d'intégration et de conformité avant que les coûts irrécupérables ne s'accumulent. C'est tout le sens d'une évaluation de découverte : un diagnostic à prix fixe, cadré sur un résultat, qui vous dit si le chemin vers la production prend deux semaines ou deux trimestres — et s'il vaut la peine d'être emprunté.
Repenser le processus, pas le décorer. Car, encore une fois, la refonte des processus est le facteur le plus corrélé à l'impact dans les données de McKinsey. Le modèle n'est qu'une composante ; les transferts humains, les chemins d'exception et la piste d'audit qui l'entourent forment le système.
Construire le banc d'évaluation en même temps que la fonctionnalité. Si vous ne pouvez pas mesurer la précision, la dérive et le coût en production, vous n'avez pas bâti un produit — vous avez bâti une responsabilité. Les taux d'hallucination cités plus haut ne sont pas des cas marginaux ; ce sont la norme sans instrumentation.
Même les équipes qui livrent un modèle confondent souvent la mise en service avec la ligne d'arrivée. C'est le début de la partie coûteuse. Un modèle déployé est un actif qui se dégrade : une étude portant sur 32 jeux de données et 2,56 M d'expériences a constaté que 91 % des modèles d'apprentissage automatique se dégradent avec le temps. Sans surveillance ni réentraînement, la précision s'érode en silence jusqu'à ce que quelqu'un remarque que les chiffres n'ont plus de sens.
L'économie a basculé pour faire de ceci le coût dominant. L'inférence s'est effondrée — l'AI Index de Stanford a suivi le prix d'une requête de classe GPT-3.5 passant de 20,00 $ à 0,07 $ par million de jetons, une chute de 280 fois en 18 mois. La dépense durable n'est plus l'appel au modèle ; c'est l'observabilité, l'évaluation, le réentraînement, les contrôles d'accès et la réponse aux incidents. C'est précisément le travail que la plupart des équipes pilotes n'ont pas planifié — d'où l'abandon, non pas parce que le modèle s'est dégradé, mais parce que personne n'était responsable de le maintenir bon.
C'est l'argument en faveur d'une pile d'IA gérée : un forfait qui exploite le déploiement — surveille la dérive, exécute les évaluations, gère les accès et assure une garde quand un agent fait quelque chose d'inattendu — pour que le processus reste en production au lieu de rejoindre discrètement les 95 %. Pour des modèles propres à chaque secteur, voyez nos engagements détaillés pour les assureurs dans le livre blanc sur l'IA en assurance et pour le milieu clinique dans le livre blanc sur l'IA en santé.
Sortir du purgatoire des pilotes n'est pas une question d'outillage ; c'est une question de séquence. Décider avant de bâtir — une phase de découverte qui nomme le processus, le responsable, l'indicateur, et les obstacles de données et de conformité. Bâtir selon un cadre de contrôle reconnu — NIST AI RMF et ISO 42001 dès le premier jour, pas rajoutés avant un audit. Repenser le processus plutôt que le décorer, parce que c'est ce qui fait réellement bouger le BAII. Et financer la production comme une phase d'exploitation continue — surveillance, évaluation, réentraînement, garde — parce que 91 % des modèles se dégradent et que le coût durable se trouve là. Rien de tout cela n'exige un meilleur modèle. Cela exige de traiter le système de production comme l'objet que l'on construit, et la démo comme un point de contrôle en chemin. Les 5 % l'ont compris. Les 95 % autres peaufinent encore la démo.
Ces modèles illustratifs sont des composites représentatifs tirés d'engagements courants en secteur réglementé, et non des clients nommés ; les chiffres sectoriels ci-dessus sont cités et réels.
FAQ
Pas à cause de modèles faibles. MIT NANDA a constaté que 95 % des pilotes d'IA générative ne livrent aucun ROI mesurable, la cause profonde étant une mauvaise intégration et des priorités mal alignées. Les parties difficiles — refonte des processus, données prêtes pour l'IA, vérification de la fiabilité, gouvernance — sont esquivées par la démo mais exigées par la production.
Le modèle d'exploitation. Les mêmes modèles de pointe alimentent les pilotes ratés et les 5 % qui réussissent. Ce qui les distingue, c'est la séquence : cibler un processus avec un responsable mesurable, bâtir selon les contrôles NIST/ISO 42001, repenser le processus, et financer la production comme une phase d'exploitation continue.
Parce que 91 % des modèles d'apprentissage automatique se dégradent avec le temps. Les coûts d'inférence se sont effondrés (chute de 280 fois en 18 mois selon l'AI Index de Stanford) ; la dépense durable s'est donc déplacée vers l'exploitation — surveillance, évaluation, réentraînement, contrôles d'accès et garde. Sans responsable pour ce travail, la précision s'érode en silence et le projet échoue discrètement.
Dans les secteurs réglementés, la conformité est le frein numéro un à l'adoption (Deloitte). Un pilote bâti selon ISO/IEC 42001 et le cadre NIST AI RMF dès le départ franchit l'approvisionnement et l'audit ; un pilote assemblé pour une démo est bloqué. Concevoir les contrôles tôt est plus rapide que les rajouter sous la pression d'un audit — et évite l'exposition à la Loi européenne sur l'IA et à la Loi 25 du Québec.
Décider avant de bâtir. Une courte évaluation de découverte nomme le processus, le responsable, l'indicateur de succès, et les obstacles de données et de conformité avant que les coûts irrécupérables ne s'accumulent — vous indiquant si le chemin vers la production prend deux semaines ou deux trimestres, et s'il vaut la peine d'être emprunté.
À lire ensuite
ISO 42001, le cadre NIST AI RMF et la Loi sur l'IA de l'UE cessent d'être des sigles dès qu'on voit comment un vrai programme se construit — et dans quel ordre.
Gouvernance de l’IACe que les lois québécoises sur la langue et la vie privée exigent réellement d'un produit d'IA — les échéances, les amendes, et comment concevoir le bilinguisme dès le départ plutôt que d'ajouter le français à la fin.
Cas d'usagePerspectives
Envie d'en discuter pour votre environnement ? Nous sommes chevronnés, compétents en IA, et sans verrouillage.
Démarrer la conversation