Gouvernance de l'IA en assurance santé

Votre IA prend les décisions de couverture. Pouvez-vous les défendre devant un tribunal ?

Le recours collectif Lokken v. UnitedHealth a démontré qu'un taux de réformation des recours de 90 % n'est pas un problème technique. C'est une rupture de contrat. Un tribunal fédéral examine désormais les documents internes de développement de nH Predict, les données d'entraînement et les rapports de validation.

Si votre plan Medicare Advantage utilise l'IA dans la gestion de l'utilisation, l'autorisation préalable ou le traitement des demandes de remboursement, la question n'est pas de savoir si vos algorithmes seront soumis à un examen rigoureux. Elle est de savoir s'ils y survivront.

90 %

Refus par IA annulés en appel

Pièces du contentieux Lokken v. UnitedHealth

19,7 Mds $

Dépenses annuelles des prestataires pour contester les refus

Données de l'AMA / du secteur, 2025

Mars 2026

Les indicateurs d'AP de la CMS désormais publiés

Échéance de la Phase 2 de CMS-0057-F

Comment l'IA de gestion de l'utilisation crée une responsabilité juridique

La défaillance de nH Predict n'était pas un bug logiciel. C'était une faille architecturale qui s'applique à la plupart des systèmes d'IA déployés aujourd'hui dans les décisions de couverture Medicare Advantage.

La mécanique du refus algorithmique

Voici comment un flux de travail d'IA de gestion de l'utilisation (UM) typique engendre une responsabilité. Une demande d'autorisation préalable arrive avec un code de diagnostic (CIM-10), un code d'acte (CPT/HCPCS), des données démographiques du patient et des notes cliniques. Le modèle d'IA recoupe ces éléments avec un jeu de données d'entraînement de demandes historiques pour prédire la durée de séjour, la nécessité médicale ou la probabilité d'approbation.

Le point de défaillance réside dans ce que le modèle pondère par rapport à ce qu'il ignore. nH Predict pondérait fortement les délais de rétablissement fondés sur le diagnostic, mais accordait un poids minimal aux indicateurs cliniques individuels comme le taux d'oxygène sanguin, la disponibilité d'un aidant ou les interactions entre comorbidités. Une patiente atteinte de méthémoglobinémie (un trouble sanguin potentiellement mortel) a été renvoyée chez elle sur la base du délai de rétablissement moyen de son groupe diagnostique, et non de son état clinique réel. Sa famille a déboursé 16 768 $ de sa poche pour empêcher une sortie prématurée.

Ce n'est pas un cas marginal. C'est le résultat prévisible du déploiement d'un modèle piloté par les corrélations dans un domaine où la variation clinique individuelle détermine la nécessité médicale. Le modèle optimise le débit à l'échelle de la population. Les normes de couverture Medicare exigent un jugement clinique à l'échelle de l'individu.

Lorsque les responsables de NaviHealth ont réduit l'écart acceptable par rapport aux projections de nH Predict de 3 % à 1 %, ils ont transformé un outil d'aide à la décision en un gardien automatisé. Les cliniciens qui passaient outre l'algorithme s'exposaient à des sanctions disciplinaires. À partir de ce moment, le « contrôle humain » est devenu une simple façade, et chaque refus généré par le système portait tout le poids de la responsabilité contractuelle et réglementaire.

Le piège contractuel

Vos documents d'attestation de couverture (Evidence of Coverage) promettent que les décisions de couverture sont prises par du « personnel de services cliniques » et des « médecins ». Si votre IA prend la décision et qu'un humain l'entérine d'un coup de tampon, vous êtes exposé à la même rupture de contrat que celle identifiée par le tribunal dans Lokken. Examinez le libellé de votre EOC au regard de votre flux de travail UM réel. S'ils divergent, l'avocat de la partie adverse trouvera la faille.

Le problème de la communication des pièces

L'ordonnance de communication des pièces de mars 2026 dans Lokken (2026 WL 658883) a accordé aux plaignants l'accès aux documents de développement de l'IA, aux spécifications des données d'entraînement et aux rapports de validation. Chaque organisme Medicare Advantage (MAO) doit désormais présumer que sa documentation sur l'IA est communicable. Si votre modèle ne dispose pas de journaux de décision structurés, de registres de données d'entraînement à versions contrôlées et de résultats de validation documentés, vous ne pouvez pas défendre ce que vous ne pouvez pas reconstituer.

Le calendrier réglementaire que vous ne pouvez ignorer

Trois forces réglementaires convergent simultanément vers la gouvernance de l'IA en santé. Chacune comporte des échéances précises, des exigences précises et des sanctions précises.

CMS-0057-F : la règle finale sur l'autorisation préalable

1er janv. 2026 (en vigueur)

Délai accéléré d'AP de 72 heures. 7 jours en standard. Aucune réouverture des admissions hospitalières approuvées, sauf en cas de fraude.

31 mars 2026 (en cours)

Publication de 8 indicateurs d'AP : taux de refus, délais de traitement, taux de réformation des recours au niveau du contrat.

1er janv. 2027

API d'autorisation préalable HL7 FHIR obligatoires (CRD, DTR, PAS). Piste de transaction d'AP entièrement électronique.

Application par les procureurs généraux des États

Le procureur général du Texas a réglé la première enquête sur une IA générative en santé (Pieces Technologies, septembre 2024) et le Texas Responsible AI Governance Act est entré en vigueur en janvier 2026, conférant un large pouvoir de demande d'enquête civile. La Pennsylvanie a déposé un projet de loi exigeant un examen par un prestataire humain avant tout refus piloté par l'IA, la divulgation obligatoire par l'assureur du recours à l'IA, et des déclarations de conformité annuelles.

Les MAO présents dans plusieurs États font face à une mosaïque : chaque État peut imposer des exigences différentes en matière de transparence, d'audit et de divulgation de l'IA. Une architecture de gouvernance unique doit toutes les satisfaire.

Règlement européen sur l'IA (pour les plans à opérations mondiales)

L'IA en santé est classée « à haut risque » au titre de l'annexe III. Obligations de conformité intégrale d'ici août 2027. Sanctions pouvant atteindre 6 % du chiffre d'affaires annuel mondial. Les exigences incluent des plans de gestion des risques, la documentation des données d'entraînement, des mécanismes de supervision humaine et une surveillance continue après déploiement.

Le risque de convergence : La CMS développe simultanément sa propre capacité d'audit alimentée par l'IA. Les audits RADV de l'année de paiement 2020 ont commencé en février 2026 en recourant à la détection d'anomalies pour signaler les diagnostics non étayés et les valeurs statistiques aberrantes. La CMS audite votre IA tout en exigeant que vous la gouverniez. Les plans qui construisent d'abord leur infrastructure de gouvernance transforment la conformité, d'un fardeau, en avantage concurrentiel.

Qui d'autre résout ce problème (et où ils s'arrêtent)

Chaque MAO qui évalue la gouvernance de l'IA dispose de cinq options. Chacune traite une partie du problème. Aucune ne le traite dans son ensemble.

Approche	Ce que vous obtenez	Là où ça s'arrête	Coût typique
Plateformes de gouvernance de l'IA Credo AI, Holistic AI, IBM Watsonx	Packs de politiques, tableaux de bord de conformité, surveillance des biais, collecte automatisée de preuves	Surveille les modèles existants mais ne reconstruit pas une architecture de décision défaillante. Si votre IA de gestion de l'utilisation est fondamentalement erronée (comme nH Predict), mieux la surveiller ne la corrige pas.	Licence de plateforme de 150 à 500 k$/an
Éditeurs d'automatisation de l'AP Cohere Health, FinThrive, Availity	Traitement plus rapide de l'AP, coût administratif réduit (47 % revendiqué par Cohere), délais de traitement améliorés	Optimise le débit, pas la défendabilité. Ne produit pas d'explications par décision, d'analyse des disparités démographiques, ni de pistes d'audit prêtes pour le contentieux.	200 k$ à 1 M$/an selon le volume
Big 4 / grands intégrateurs Deloitte, Accenture, McKinsey	Stratégie, conception du cadre de gouvernance, sélection de plateforme, gestion de la mise en œuvre	Ils déploient des plateformes de gouvernance clés en main (Credo AI, Watsonx) et rédigent des documents de politique. Ils ne construisent pas de middleware d'explicabilité sur mesure pour votre configuration Facets/QNXT spécifique. Les missions coûtent de 500 k$ à 5 M$+ et durent de 6 à 18 mois.	500 k$ à 5 M$+ par mission
Éditeurs de plateformes de demandes Cognizant/TriZetto (Facets), HealthEdge	Modules complémentaires d'IA natifs à leur plateforme de demandes, analyses intégrées, modules UM	Conflit d'intérêts : les mêmes entreprises qui maintiennent votre plateforme de demandes y vendent des modules complémentaires d'IA. Elles ne sont pas incitées à faire remonter les lacunes de gouvernance de leurs propres systèmes. La dépendance fournisseur aggrave le problème.	Inclus dans le contrat de plateforme
Développement interne	Contrôle total, aucune dépendance fournisseur, personnalisation pour vos flux de demandes spécifiques	Exige des talents spécialisés (ingénieurs ML maîtrisant à la fois la réglementation CMS, les flux d'instruction des demandes et la défendabilité juridique). La plupart des équipes de science des données des MAO sont optimisées pour l'analytique, pas pour l'architecture de gouvernance. Le délai de construction est de 12 à 24 mois si l'équipe existe.	1 à 3 M$+ en talents + infrastructure
Veriprajna	Audit algorithmique + middleware d'explicabilité + architecture de conformité CMS + préparation au contentieux, conçus sur mesure pour votre pile de gestion des demandes	Nous sommes un cabinet de conseil, pas une plateforme. Nous construisons et transmettons. Si vous avez besoin d'un tableau de bord de surveillance SaaS permanent, il vous faut tout de même une plateforme de gouvernance (nous vous aidons à sélectionner et à intégrer la bonne). Nous ne remplaçons pas le jugement de votre équipe d'opérations cliniques.	Périmètre défini par mission

Ce que nous construisons pour les organismes Medicare Advantage

Chaque capacité est conçue sur mesure pour s'intégrer à votre pile existante de traitement des demandes. Nous ne vendons pas de plateforme. Nous construisons l'infrastructure de gouvernance spécifique dont votre plan a besoin.

Audit de décision algorithmique

Nous procédons à la rétro-ingénierie de votre IA de gestion de l'utilisation pour cartographier chaque parcours décisionnel. L'analyse d'attribution SHAP sur un échantillon représentatif de refus produit une carte d'importance des variables : quels intrants pilotent les refus, quels indicateurs cliniques sont sous-pondérés, et où les variables substitutives démographiques (code postal, statut de double éligibilité) introduisent des disparités.

Le livrable est un rapport d'audit défendable devant un tribunal, avec des cartes d'attribution des variables, une analyse des disparités démographiques et une liste classée par risque des parcours décisionnels les plus susceptibles d'échouer en appel. Pour les modèles fournisseurs en boîte noire, nous incluons une évaluation de la transparence du fournisseur documentant ce que votre fournisseur peut et ne peut pas produire dans le cadre de la communication des pièces.

Délai typique : 6 à 10 semaines pour un seul modèle UM.

Middleware d'explicabilité

Une couche d'explication des décisions qui s'intercale entre votre plateforme de demandes (Facets, QNXT, HealthEdge) et votre IA de gestion de l'utilisation. Chaque détermination de couverture reçoit une explication structurée : quelles variables d'entrée ont pesé sur la décision, le score de confiance du modèle et une justification en langage naturel qu'un médecin réviseur peut lire en moins de 30 secondes.

Pour les prédictions à faible confiance ou les cas présentant des comorbidités peu représentées dans les données d'entraînement, le système oriente vers une révision humaine assortie d'un contexte clinique prérempli. Ce n'est pas un tableau de bord de surveillance. C'est une intervention architecturale qui rend chaque décision individuelle auditable et explicable.

Points d'intégration : API REST, compatible HL7 FHIR, modes par lots et en temps réel.

Architecture de conformité CMS

Nous concevons l'infrastructure technique de conformité à CMS-0057-F : pipelines de collecte des indicateurs d'AP couvrant les 8 indicateurs requis, surveillance de l'équité démographique alignée sur la fonction MEASURE du NIST AI RMF, et une piste d'audit inaltérable pour chaque détermination de couverture assistée par IA.

Pour l'obligation d'API FHIR de janvier 2027, nous construisons la couche d'intégration CRD/DTR/PAS afin que votre flux d'AP produise par conception un enregistrement complet de transaction électronique. Les plans qui construisent cela dès maintenant peuvent transformer le fardeau de la conformité en intelligence opérationnelle : visibilité en temps réel sur les schémas d'AP, les goulets d'étranglement et les foyers de refus, avant que la CMS ne les voie.

Périmètre : un middleware qui s'enfiche dans votre pile de demandes existante. Pas un remplacement de plateforme.

Ingénierie de préparation au contentieux

Après l'ordonnance de communication des pièces de mars 2026 dans Lokken, chaque MAO devrait concevoir ses systèmes d'IA pour la défendabilité juridique dès le premier jour. Nous construisons une journalisation des décisions à l'épreuve de la falsification, avec un stockage en ajout seul et un hachage cryptographique, une documentation des modèles à versions contrôlées et des enregistrements d'explication structurés répondant aux normes de preuve qui émergent de l'affaire.

Nous menons également des exercices de simulation d'attaque (« red team ») reproduisant les demandes de communication de pièces des plaignants. Notre équipe parcourt exactement ce que l'avocat adverse demanderait, ce que vos systèmes peuvent actuellement produire et où les lacunes créent une exposition. L'objectif est d'identifier les failles de défendabilité avant qu'un contentieux ne vous force à les affronter sous la pression du temps.

Livrable : rapport de préparation à la communication des pièces + plan de remédiation technique.

Comment se déroule une mission

Chaque mission commence par l'audit. Les conclusions de l'audit déterminent ce qui sera construit. Nous ne prescrivons pas de solution avant d'avoir compris votre architecture de demandes spécifique, vos flux de gestion de l'utilisation et votre exposition réglementaire.

1

Audit algorithmique (6 à 10 semaines)

Nous cartographions les parcours décisionnels de votre IA, exécutons l'attribution SHAP sur un échantillon représentatif de refus, analysons les schémas de disparité démographique et évaluons la documentation de votre fournisseur au regard des normes de communication des pièces. Livrable : un rapport classé par risque identifiant les parcours décisionnels qui présentent la plus forte exposition au contentieux et à la réglementation.

Nécessite : l'accès aux prédictions du modèle et aux variables d'entrée (pas au code source), 12 à 24 mois de données de refus avec leurs issues, la documentation de l'architecture du système de demandes.

2

Conception de l'architecture (4 à 6 semaines)

Sur la base des conclusions de l'audit, nous concevons le middleware d'explicabilité, les pipelines de conformité et l'infrastructure de préparation au contentieux propres à votre pile de demandes. Cette phase produit des spécifications techniques détaillées, des schémas d'intégration et un plan de mise en œuvre par étapes.

Sessions de travail conjointes avec vos équipes de science des données, d'opérations cliniques et de conformité. Nous devons comprendre non seulement la technologie, mais aussi le flux de travail humain qui l'entoure.

3

Construction et intégration (8 à 16 semaines)

Nous construisons le middleware de gouvernance, l'intégrons à votre plateforme de demandes, validons la qualité des explications au regard des retours des réviseurs cliniques et soumettons le système à des tests de résistance face aux cas limites identifiés lors de l'audit. Le déploiement est progressif : une catégorie de décisions à la fois, en commençant par les parcours les plus à risque.

Mise en garde : les délais d'intégration dépendent fortement de la maturité de l'API de votre plateforme de demandes. Facets (TriZetto) et QNXT ont des exigences de middleware différentes. La couche d'API de HealthEdge est généralement plus accessible. Nous définissons des périmètres réalistes.

4

Transmission et opérationnalisation de la gouvernance (4 à 6 semaines)

Nous transférons la propriété à votre équipe avec une documentation complète, des guides d'exploitation et des protocoles de surveillance. Nous vous aidons à établir ou à restructurer votre comité de gouvernance de l'IA, doté d'une charte définie, de procédures d'escalade et d'un processus de gestion des changements de modèle. Le système est à vous, à exploiter.

En option : forfait de revue trimestrielle de gouvernance pour la validation continue des modèles, l'évaluation des évolutions réglementaires et la vérification de la piste d'audit.

Durée totale de la mission : 22 à 38 semaines, du lancement de l'audit à la transmission complète. La phase d'audit (Phase 1) peut être menée comme une mission autonome si vous avez besoin de comprendre votre exposition avant de vous engager dans une construction. De nombreux plans commencent par là.

Questions que les plans Medicare Advantage posent sur la gouvernance de l'IA

Comment auditer les algorithmes d'IA utilisés dans l'autorisation préalable pour Medicare Advantage ?

Commencez par une décomposition des parcours décisionnels. Votre IA de gestion de l'utilisation prend des déterminations de couverture sur la base d'intrants (codes de diagnostic, codes d'actes, données démographiques du patient, schémas d'utilisation historiques). L'audit retrace chaque parcours pour identifier quelles variables pilotent les refus. Nous exécutons une analyse d'attribution SHAP sur un échantillon représentatif de refus récents afin de produire une carte d'importance des variables.

Le livrable critique est une analyse des disparités : taux de refus segmentés par tranche d'âge, région géographique, statut de double éligibilité et groupe diagnostique. Si votre algorithme refuse les soins post-aigus à 22 % pour un segment démographique et à 9 % pour un autre, cet écart nécessite une explication qui survivra à une déposition de la partie plaignante.

L'audit examine également l'ancienneté des données d'entraînement de votre modèle. Si votre IA de gestion de l'utilisation a été entraînée sur des données de demandes de 2019-2021, elle a appris des schémas de refus issus d'une période où la surveillance de la CMS était plus légère. Ces schémas peuvent ne plus refléter les normes actuelles de nécessité médicale ni les lignes directrices cliniques auxquelles la CMS se réfère dans ses protocoles d'audit. Nous signalons les données d'entraînement obsolètes comme facteur de risque contentieux et recommandons des calendriers de réentraînement alignés sur les cycles de mise à jour des lignes directrices de la CMS.

Pour les plans exploitant des modèles fournisseurs en boîte noire (ce qui décrit la plupart des MAO), l'audit inclut une évaluation de la transparence du fournisseur : quelle documentation votre fournisseur fournit-il sur l'architecture du modèle, la composition des données d'entraînement et la méthodologie de validation ? Après l'ordonnance de communication des pièces dans Lokken, cette documentation est communicable. Si votre fournisseur ne peut pas la produire, cette lacune est votre responsabilité.

Que signifie le recours collectif nH Predict pour les autres plans de santé utilisant l'IA ?

L'affaire Lokken v. UnitedHealth a établi deux précédents qui s'appliquent à chaque MAO utilisant l'IA dans les décisions de couverture. Premièrement, le tribunal a jugé que substituer l'IA à l'examen par un médecin promis dans les documents de la police constitue une rupture de contrat potentielle. Si vos documents destinés aux adhérents indiquent que les décisions de couverture sont prises par du « personnel clinique », mais que votre flux de travail oriente les déterminations à travers un algorithme avant (ou à la place de) l'examen par un médecin, vous êtes exposé au même risque contractuel qu'UnitedHealth.

Deuxièmement, l'ordonnance de communication des pièces de mars 2026 (2026 WL 658883) a accordé aux plaignants l'accès aux documents internes de développement de l'IA, aux spécifications des données d'entraînement et aux rapports de validation. Cela signifie que chaque MAO doit présumer que sa documentation sur l'IA est communicable lors de futurs contentieux.

Les implications pratiques : examinez vos documents d'attestation de couverture (Evidence of Coverage) et votre récapitulatif des prestations pour repérer le libellé sur la manière dont les décisions de couverture sont prises. S'ils font référence à un « examen clinique par des médecins », votre flux de travail d'IA doit manifestement appuyer (et non remplacer) cet examen. Mettez en place une journalisation des décisions qui capture la recommandation de l'IA, l'évaluation du réviseur humain et le fait que l'humain ait approuvé ou passé outre l'algorithme. Les plans capables de démontrer un véritable processus de contrôle humain assorti de taux de réformation documentés ont une posture contentieuse fondamentalement différente de celle des plans où la sortie de l'IA est entérinée d'un coup de tampon.

Comment rendre les décisions de couverture par IA défendables devant un tribunal ?

La défendabilité devant un tribunal exige trois couches. La couche d'explication produit, pour chaque détermination de couverture, une justification structurée qu'un public non technique (juge, jury, auditeur de la CMS) peut comprendre. Ce n'est pas un graphe SHAP brut. C'est une formulation en langage naturel telle que : « La couverture de 14 jours supplémentaires de soins infirmiers qualifiés a été refusée parce que le modèle a pondéré le délai de rétablissement du diagnostic (42 % d'influence) et le schéma d'utilisation antérieur (31 % d'influence) au-dessus des limitations fonctionnelles signalées de la patiente (8 % d'influence). » Lorsque l'avocat adverse demande pourquoi un patient donné a été refusé, vous produisez cet enregistrement en quelques minutes.

La couche de piste d'audit capture les métadonnées de décision avec une journalisation à l'épreuve de la falsification : version du modèle, variables d'entrée, score de confiance, décision d'orientation (approbation automatique, refus automatique ou examen humain), identité du réviseur et détermination finale. Nous utilisons un stockage en ajout seul avec hachage cryptographique afin que l'enregistrement ne puisse pas être altéré après coup. Dans Lokken, l'une des vulnérabilités d'UnitedHealth était l'incapacité à reconstituer exactement comment nH Predict était parvenu à des déterminations précises pour des patients précis.

La couche de documentation des réformations suit chaque instance où un réviseur humain a été en désaccord avec la recommandation de l'IA. Les tribunaux examineront votre taux de réformation. S'il est proche de zéro, cela suggère que l'examen humain est une façade. S'il est de 15 à 25 %, cela démontre un véritable jugement clinique. Nous vous aidons à établir des seuils et des protocoles d'escalade qui produisent un schéma de réformation défendable.

Qu'exige CMS-0057-F pour l'IA dans l'autorisation préalable d'ici 2027 ?

CMS-0057-F se déploie en trois phases. Phase 1 (1er janvier 2026, désormais en vigueur) : les plans MA doivent traiter les demandes d'AP accélérées dans un délai de 72 heures et les demandes standard dans un délai de 7 jours calendaires. Les plans ne peuvent pas rouvrir les admissions hospitalières précédemment approuvées, sauf en cas de fraude ou d'erreur manifeste. Ce changement opérationnel affecte les flux de travail assistés par IA, car les modèles optimisés pour le débit font désormais face à des délais de traitement stricts qui peuvent entrer en conflit avec les exigences d'examen humain.

Phase 2 (31 mars 2026, l'échéance actuelle) : les plans doivent publier 8 indicateurs d'AP au niveau du contrat, notamment les taux d'approbation et de refus, les délais de traitement moyens et les taux de réformation des recours. Cette déclaration rend les schémas de refus de votre IA visibles pour les régulateurs, les avocats des plaignants, les médias et les concurrents. Si votre taux de refus est nettement supérieur à la moyenne MA (15,7 % selon les données de 2025), attendez-vous à un examen rigoureux.

Phase 3 (1er janvier 2027) : les plans doivent mettre en œuvre des API d'autorisation préalable fondées sur HL7 FHIR, en particulier les règles d'aide à la décision clinique (CRD), les modèles et règles de documentation (DTR) et le support d'autorisation préalable (PAS). Il s'agit d'un investissement informatique important. L'obligation FHIR crée de fait un enregistrement électronique standardisé de chaque transaction d'AP, rendant votre pipeline de décision par IA plus transparent et auditable par conception.

Les plans qui construisent leur architecture de conformité dès maintenant, plutôt que de s'agiter au T3 2026, peuvent transformer cette obligation en avantage de gouvernance. La CMS a suspendu certaines exigences de transparence (expertise en équité en santé dans les comités UM, ventilation des indicateurs au niveau du plan) en juin 2025, mais les obligations fondamentales de déclaration et d'API demeurent.

Comment mettre en place un comité de gouvernance de l'IA pour un plan de santé ?

Le comité de gouvernance doit faire le pont entre trois domaines qui dialoguent rarement au sein d'un MAO : les opérations cliniques (qui comprennent les critères de nécessité médicale et les lignes directrices de couverture de la CMS), la technologie (qui comprend les modèles d'IA, leurs données d'entraînement et leurs modes de défaillance) et le juridique/la conformité (qui comprennent l'exposition au contentieux et à la réglementation).

Nous recommandons un comité de 7 à 9 personnes aux rôles définis : un directeur médical (Chief Medical Officer) ou un vice-président des opérations cliniques comme président, un responsable de la science des données capable d'expliquer le comportement du modèle en langage clair, un responsable de la conformité suivant les exigences réglementaires de la CMS et des États, un conseil juridique expérimenté en contentieux de l'assurance santé, un représentant des services aux adhérents qui constate l'impact en aval des décisions de refus, et 2 à 3 réviseurs cliniques en rotation qui interagissent quotidiennement avec l'IA.

Le comité devrait se réunir chaque mois avec un ordre du jour permanent : examiner les indicateurs de décision de l'IA (taux de refus par segment, taux de réformation, issues des recours), évaluer tout changement de modèle ou événement de réentraînement, évaluer les nouvelles exigences réglementaires et trier les incidents signalés.

Ce qui distingue un comité de gouvernance efficace d'un comité de façade, c'est l'autorité. Le comité a besoin d'un mandat documenté pour suspendre les déploiements d'IA, exiger un réentraînement ou imposer un examen humain pour des catégories de décisions précises. Si le comité ne peut que recommander sans pouvoir imposer, il existe pour l'apparence. Après l'affaire Lokken, un comité doté d'un pouvoir d'application est un atout de défense contentieuse. Un comité qui en est dépourvu est une responsabilité, car il démontre une conscience des risques sans action.

Quel est le coût réel d'un contentieux sur les refus par IA pour un plan Medicare Advantage ?

Le modèle de coûts comporte quatre couches. Les coûts directs de contentieux pour un recours collectif de l'ampleur de Lokken s'élèvent de 5 à 15 M$ en frais juridiques sur 3 à 5 ans, selon que l'affaire fait l'objet d'un règlement ou va à procès. Ce chiffre n'inclut pas les dommages-intérêts potentiels qui, pour une catégorie de millions de bénéficiaires de Medicare, pourraient atteindre des centaines de millions.

Les coûts de remédiation réglementaire suivent le contentieux. La CMS peut imposer des sanctions pécuniaires civiles, exiger des plans d'action correctifs et, dans les cas extrêmes, suspendre les adhésions. La mise en œuvre d'un plan d'action correctif coûte en moyenne aux MAO de 2 à 8 M$ en technologie, refonte des processus et surveillance indépendante.

La perturbation opérationnelle est le coût caché. L'ordonnance de communication des pièces dans Lokken a obligé UnitedHealth à produire des documents internes sur l'IA, détournant les équipes d'ingénierie et juridiques de leur travail opérationnel. Pour un MAO de taille moyenne (500 000 à 2 millions d'adhérents), une conformité comparable en matière de communication des pièces consommerait de 6 à 12 mois de la capacité d'une équipe de science des données.

Le préjudice de réputation affecte les Star Ratings, la fidélisation des adhérents et les relations avec les courtiers. Les plans MA se concurrencent sur les Stars ; une défaillance publique de gouvernance de l'IA qui génère une couverture médiatique fait chuter les scores de satisfaction des adhérents (CAHPS), qui alimentent le calcul des Stars. Une baisse d'une étoile coûte environ 500 $ par adhérent et par an en paiements de bonus. Pour un plan d'un million d'adhérents, cela représente 500 M$ par an. L'argument économique en faveur de la gouvernance est simple : un audit algorithmique complet et une architecture de conformité coûtent une fraction de n'importe quel composant isolé de l'exposition au contentieux.

Recherche technique

Notre analyse de la gouvernance algorithmique dans l'assurance santé, incluant l'étude de cas complète de nH Predict et le cadre de conformité réglementaire.

La frontière de la gouvernance : intégrité algorithmique, responsabilité d'entreprise, et la transition des wrappers prédictifs vers des solutions d'IA profonde

Analyse technique approfondie de la défaillance de nH Predict, des alternatives d'IA causale, de la correspondance avec le cadre de crédibilité de la FDA et de l'opérationnalisation du NIST AI RMF pour les payeurs de soins de santé.