醫療保險 AI 治理

您的 AI 做出承保決策。 您能在法庭上為它們辯護嗎?

Lokken 訴 UnitedHealth 集體訴訟證明,90% 的申訴推翻率並非技術問題,而是違約。聯邦法院現正審查 nH Predict 的內部開發文件、訓練資料與驗證報告。

如果您的 Medicare Advantage 計畫在使用率管理、事前授權或理賠處理中使用 AI,問題不在於您的演算法是否會受到審查,而在於它們能否通過審查。

90%

經申訴推翻的 AI 拒賠

Lokken 訴 UnitedHealth 訴訟卷宗

$19.7B

醫療提供者每年用於對抗拒賠的支出

AMA/產業數據,2025 年

2026 年 3 月

CMS PA 指標現已公開揭露

CMS-0057-F 第二階段截止日

使用率管理 AI 如何製造責任風險

nH Predict 的失敗並非軟體錯誤,而是一項架構缺陷,而這項缺陷適用於當今大多數部署於 Medicare Advantage 承保決策的 AI 系統。

演算法拒賠的運作機制

以下是典型的 UM AI 工作流程如何產生責任風險。一項事前授權請求伴隨著診斷代碼(ICD-10)、處置代碼(CPT/HCPCS)、病患人口統計資料與臨床紀錄到達。AI 模型將其與歷史理賠的訓練資料集交叉比對,以預測住院天數、醫療必要性或核准機率。

失敗點在於模型重視什麼、又忽略什麼。nH Predict 大幅加重以診斷為基礎的康復時程的權重,卻對個別臨床指標(如血氧濃度、照護者可用性或共病交互作用)賦予極低權重。一名患有變性血紅素血症(一種危及生命的血液疾病)的病患,是依據其診斷群組的平均康復時程出院,而非依其實際臨床狀況。她的家屬自付 $16,768 以避免提前出院。

這並非極端個案,而是在個別臨床差異決定醫療必要性的領域中部署相關性驅動模型的可預測結果。該模型為族群層級的吞吐量進行最佳化,但 Medicare 承保標準要求個體層級的臨床判斷。

當 NaviHealth 經理將 nH Predict 預測值的可接受誤差範圍從 3% 縮小到 1% 時,他們便把決策支援工具轉變為自動化的把關者。推翻演算法的臨床醫師面臨懲處。至此,「人在迴路中」變成形式主義,而系統產生的每一筆拒賠都承載著契約與法規責任的全部份量。

契約陷阱

您的承保證明文件承諾承保決策由「臨床服務人員」與「醫師」做出。如果是您的 AI 做出判定、再由人類橡皮圖章式核可,您便承擔了與 Lokken 法院所指認的相同違約風險。請對照您實際的 UM 工作流程檢視您的承保證明用語。如果兩者出現分歧,對方律師將找出這個落差。

證據揭示問題

Lokken 案 2026 年 3 月的證據揭示命令(2026 WL 658883)准許原告取得 AI 開發文件、訓練資料規格與驗證報告。每一家 MAO 現在都應假設其 AI 文件均可被揭示。如果您的模型缺乏結構化的決策日誌、版本控管的訓練資料紀錄與書面化的驗證結果,您將無法為自己無法重建的事物辯護。

您無法忽視的法規時間表

三股法規力量正同時匯聚於醫療 AI 治理。每一股都有特定的截止日、特定的要求與特定的罰則。

CMS-0057-F:事前授權最終規則

2026 年 1 月 1 日(已生效)

加急 PA 須於 72 小時內處理完畢。標準 PA 為 7 天。除詐欺外,不得重新審查已核准的住院收治。

2026 年 3 月 31 日(現行)

公開揭露 8 項 PA 指標:契約層級的拒賠率、處理時程、申訴推翻率。

2027 年 1 月 1 日

須建置 HL7 FHIR 事前授權 API(CRD、DTR、PAS)。完整的電子化 PA 交易軌跡。

州檢察長執法

德州檢察長和解了首宗醫療生成式 AI 調查案(Pieces Technologies,2024 年 9 月),且《德州負責任 AI 治理法》於 2026 年 1 月生效,賦予廣泛的民事調查傳喚權。賓州提出立法,要求任何 AI 驅動的拒賠前須經人類醫療提供者審查、強制保險公司揭露 AI 使用情形,以及年度合規聲明。

跨州 MAO 面臨拼湊式的法規格局:各州可能課予不同的 AI 透明度、稽核與揭露要求。單一的治理架構必須滿足所有這些要求。

歐盟 AI 法案(適用於有全球業務的計畫)

醫療 AI 依附錄 III 被列為「高風險」。完整合規義務須於 2027 年 8 月前達成。罰則最高可達全球年度營業額的 6%。要求包括風險管理計畫、訓練資料文件、人類監督機制,以及持續的部署後監測。

匯聚風險: CMS 正同時擴大其自身的 AI 驅動稽核能力。2020 給付年度的 RADV 稽核已於 2026 年 2 月開始,運用異常偵測來標記無依據的診斷與統計離群值。CMS 一面稽核您的 AI,一面又要求您治理它。率先建立治理基礎設施的計畫,能將合規從負擔轉化為競爭優勢。

還有誰能解決這個問題(以及他們的侷限)

每一家評估 AI 治理的 MAO 都有五種選擇。每一種都處理了問題的一部分,但沒有一種能處理全部。

做法 您能獲得什麼 其侷限所在 典型成本
AI 治理平台
Credo AI、Holistic AI、IBM Watsonx
政策套件、合規儀表板、偏差監測、自動化證據蒐集 監測既有模型,但不會重建有缺陷的決策架構。如果您的 UM AI 從根本上就是錯的(如 nH Predict),把它監測得更好也無法修正它。 平台授權費每年 $150K-500K
PA 自動化廠商
Cohere Health、FinThrive、Availity
更快的 PA 處理、降低行政成本(Cohere 宣稱降低 47%)、改善處理時程 為吞吐量而非可辯護性進行最佳化。不會產出逐筆決策的解釋、人口統計差異分析或可供訴訟使用的稽核軌跡。 每年 $200K-1M,視量而定
四大/大型系統整合商
Deloitte、Accenture、McKinsey
策略、治理框架設計、平台選擇、實施管理 他們部署套裝化的治理平台(Credo AI、Watsonx)並撰寫政策文件。他們不會為您特定的 Facets/QNXT 設定打造客製化的可解釋性中介軟體。一個專案執行費用為 $500K-5M+,並需時 6-18 個月。 每個專案 $500K-5M+
理賠平台廠商
Cognizant/TriZetto(Facets)、HealthEdge
其理賠平台原生的 AI 附加元件、整合式分析、UM 模組 利益衝突:維護您理賠平台的同一批公司,正在為它銷售 AI 附加元件。他們沒有動機揭露自家系統中的治理缺口。廠商鎖定更加劇了這個問題。 隨平台合約綁定
內部自建 完全掌控、無廠商依賴、依您特定的理賠工作流程客製化 需要專業人才(同時懂得 CMS 法規、理賠裁定工作流程與法律可辯護性的 ML 工程師)。多數 MAO 的資料科學團隊是為分析而非治理架構而最佳化的。若團隊已就位,建置時程為 12-24 個月。 人才加基礎設施 $1-3M+
Veriprajna 演算法稽核 + 可解釋性中介軟體 + CMS 合規架構 + 訴訟整備,為您的理賠技術堆疊量身打造 我們是顧問公司,不是平台。我們建置並交付。如果您需要一個永久的 SaaS 監測儀表板,您仍需要一個治理平台(我們協助您選擇並整合合適的平台)。我們不會取代您臨床營運團隊的判斷。 依各專案界定範圍

我們為 Medicare Advantage 機構建置什麼

每項能力都是量身打造,以與您現有的理賠處理技術堆疊整合。我們不銷售平台。我們建置您的計畫所需的特定治理基礎設施。

演算法決策稽核

我們對您的 UM AI 進行逆向工程,以繪製每一條決策路徑。在具代表性的拒賠樣本上進行 SHAP 歸因分析,可產出一份特徵重要性圖譜:哪些輸入驅動拒賠、哪些臨床指標權重不足,以及人口統計代理變數(郵遞區號、雙重資格身分)在何處引入差異。

其產出是一份可供法庭辯護的稽核報告,內含特徵歸因圖譜、人口統計差異分析,以及一份按風險排序、最可能在申訴中失敗的決策路徑清單。對於廠商黑箱模型,我們會納入一份廠商透明度評估,記錄您的廠商在證據揭示下能與不能產出什麼。

典型時程:單一 UM 模型 6-10 週。

可解釋性中介軟體

一個位於您的理賠平台(Facets、QNXT、HealthEdge)與您的 UM AI 之間的決策解釋層。每一項承保判定都會獲得一份結構化的解釋:哪些輸入特徵驅動了決策、模型的信心分數,以及一段醫師審查者可在 30 秒內讀完的自然語言理由。

對於低信心的預測,或共病在訓練資料中代表性不足的案例,系統會將其轉送至人類審查,並附上預先填入的臨床脈絡。這不是一個監測儀表板,而是一項架構性介入,使每一項個別決策皆可稽核、可解釋。

整合接點:REST API、相容於 HL7 FHIR、批次與即時模式。

CMS 合規架構

我們為 CMS-0057-F 合規設計技術基礎設施:對應全部 8 項必要指標的 PA 指標蒐集管線、與 NIST AI RMF 之 MEASURE 功能對齊的人口統計公平性監測,以及為每一項 AI 輔助承保判定建立的不可變稽核軌跡。

針對 2027 年 1 月的 FHIR API 強制規定,我們建置 CRD/DTR/PAS 整合層,使您的 PA 工作流程在設計上即產生一份完整的電子交易紀錄。現在就建置這套系統的計畫,能將合規負擔轉化為營運情報:在 CMS 看到之前,即時掌握 PA 樣態、瓶頸與拒賠熱點。

範圍:嵌入您現有理賠技術堆疊的中介軟體。並非平台替換。

訴訟整備工程

在 2026 年 3 月的 Lokken 證據揭示命令之後,每一家 MAO 都應從第一天起就為法律可辯護性而設計 AI 系統。我們建置具防竄改特性的決策日誌記錄(採用僅可附加儲存與密碼學雜湊)、版本控管的模型文件,以及符合該案件所浮現之證據標準的結構化解釋紀錄。

我們也進行紅隊演練,模擬原告的證據揭示請求。我們的團隊會逐一推演對方律師究竟會要求什麼、您的系統目前能產出什麼,以及缺口在何處造成風險。目標是在訴訟迫使您在時間壓力下面對之前,先行找出可辯護性的缺口。

交付物:證據揭示整備報告 + 技術補救計畫。

專案如何進行

每個專案都從稽核開始。稽核發現決定了要建置什麼。在了解您特定的理賠架構、UM 工作流程與法規風險之前,我們不會預先開立解決方案。

1

演算法稽核(6-10 週)

我們繪製您的 AI 決策路徑、在具代表性的拒賠樣本上執行 SHAP 歸因、分析人口統計差異樣態,並對照證據揭示標準評估您廠商的文件。產出:一份按風險排序的報告,指認哪些決策路徑承載最高的訴訟與法規風險。

需要:取得模型預測與輸入特徵(非原始碼)、12-24 個月含結果的拒賠資料、理賠系統架構文件。

2

架構設計(4-6 週)

根據稽核發現,我們設計專屬於您理賠技術堆疊的可解釋性中介軟體、合規管線與訴訟整備基礎設施。此階段產出詳細的技術規格、整合圖表,以及分階段的實施計畫。

與您的資料科學、臨床營運與合規團隊進行聯合工作會議。我們不僅需要了解技術,還需要了解圍繞它的人類工作流程。

3

建置與整合(8-16 週)

我們建置治理中介軟體、將其與您的理賠平台整合、對照臨床審查者的回饋驗證解釋品質,並針對稽核期間找出的極端案例對系統進行壓力測試。部署採漸進方式:一次一個決策類別,從風險最高的路徑開始。

注意事項:整合時程在很大程度上取決於您理賠平台 API 的成熟度。Facets(TriZetto)與 QNXT 有不同的中介軟體要求。HealthEdge 的 API 層通常較易存取。我們會務實地界定範圍。

4

交接與治理營運化(4-6 週)

我們將所有權移轉給您的團隊,並附上完整文件、操作手冊與監測規程。我們協助您建立或重整 AI 治理委員會,訂定明確的章程、升級程序與模型變更管理流程。系統由您來營運。

選用項目:季度治理審查顧問合約,用於持續的模型驗證、法規變更評估與稽核軌跡查核。

專案總時程: 從稽核啟動到完整交接為 22-38 週。如果您需要在投入建置前先了解自身風險,稽核階段(第一階段)可作為一個獨立專案執行。許多計畫都從這裡開始。

Medicare Advantage AI 治理整備評估

回答關於您目前 AI 治理態勢的六道問題。此評估會產出一個整備分數,並附上您可立即採取行動的具體後續步驟,無論您是否與 Veriprajna 合作。

1. 對於您的 AI 在過去 12 個月內所協助的任何承保判定,您能否產出逐筆決策的解釋?

2. 您是否依病患人口統計(年齡組、地理位置、雙重資格身分)分層追蹤拒賠率?

3. 當 AI 建議拒賠時,您的臨床審查者推翻率是多少?

4. 您是否有一個 AI 治理委員會,具備書面化的權限可停止或修改 AI 部署?

5. 您是否符合 CMS-0057-F 第二階段(PA 指標報告於 2026 年 3 月 31 日到期)的規定?

6. 如果對方律師明天就您 AI 的決策邏輯、訓練資料與驗證結果發出證據揭示請求,您能否在 30 天內產出?

Medicare Advantage 計畫對 AI 治理常問的問題

我們如何稽核 Medicare Advantage 事前授權中所使用的 AI 演算法?

從決策路徑分解開始。您的 UM AI 依據輸入(診斷代碼、處置代碼、病患人口統計、歷史使用率樣態)做出承保判定。稽核會追溯每一條路徑,以辨識哪些特徵驅動拒賠。我們在具代表性的近期拒賠樣本上執行 SHAP 歸因分析,以產出一份特徵重要性圖譜。

關鍵產出是一份差異分析:依年齡組、地理區域、雙重資格身分與診斷群組分層的拒賠率。如果您的演算法對某一人口統計區段的後急性照護拒賠率為 22%,而對另一區段為 9%,那個落差需要一個能在原告作證時站得住腳的解釋。

稽核也會檢視您模型的訓練資料年份。如果您的 UM AI 是以 2019-2021 年的理賠資料訓練的,它學到的是 CMS 監督較寬鬆時期的拒賠樣態。那些樣態可能已不再反映當前的醫療必要性標準,或 CMS 在其稽核規程中所引用的臨床指引。我們將過時的訓練資料標記為訴訟風險因子,並建議與 CMS 指引更新週期對齊的重新訓練排程。

對於執行廠商黑箱模型的計畫(這描述了大多數 MAO),稽核會納入一份廠商透明度評估:您的廠商就模型架構、訓練資料組成與驗證方法提供了哪些文件?在 Lokken 證據揭示命令之後,這些文件均可被揭示。如果您的廠商無法產出,那個缺口就是您的責任。

nH Predict 集體訴訟對其他使用 AI 的健康計畫意味著什麼?

Lokken 訴 UnitedHealth 案確立了兩項先例,適用於每一家在承保決策中使用 AI 的 MAO。首先,法院裁定,以 AI 取代政策文件中所承諾的醫師審查,構成潛在的違約。如果您面向會員的資料宣稱承保決策由「臨床人員」做出,但您的工作流程卻在醫師審查之前(或取而代之)透過演算法進行判定,您便承擔了與 UnitedHealth 相同的契約風險。

其次,2026 年 3 月的證據揭示命令(2026 WL 658883)准許原告取得內部 AI 開發文件、訓練資料規格與驗證報告。這意味著每一家 MAO 都應假設其 AI 文件在未來訴訟中均可被揭示。

實務上的意涵:檢視您的承保證明文件與福利摘要中關於承保決策如何做出的用語。如果它們提及「由醫師進行臨床審查」,您的 AI 工作流程就必須能明確地支援(而非取代)該審查。實施決策日誌記錄,擷取 AI 的建議、人類審查者的評估,以及人類是同意還是推翻了演算法。能展現真正的人在迴路中流程並具備書面化推翻率的計畫,其訴訟態勢與那些 AI 輸出只是橡皮圖章式核可的計畫,有著根本性的不同。

我們如何使 AI 承保決策可供法庭辯護?

可供法庭辯護需要三個層次。解釋層為每一項承保判定產出一份結構化的理由,讓非技術背景的對象(法官、陪審團、CMS 稽核員)能夠理解。這不是一張原始的 SHAP 圖,而是一段自然語言陳述,例如:「14 天額外專業護理的承保被拒,因為模型將診斷康復時程(影響力 42%)與先前使用率樣態(影響力 31%)的權重置於病患所報告的功能限制(影響力 8%)之上。」當對方律師詢問某位特定病患為何被拒時,您能在數分鐘內產出這份紀錄。

稽核軌跡層以防竄改的日誌記錄擷取決策中繼資料:模型版本、輸入特徵、信心分數、轉送決策(自動核准、自動拒絕或人類審查)、審查者身分,以及最終判定。我們採用僅可附加儲存搭配密碼學雜湊,使紀錄在事後無法被竄改。在 Lokken 案中,UnitedHealth 的弱點之一就是無法重建 nH Predict 究竟如何對特定病患做出特定判定。

推翻文件層追蹤每一個人類審查者不同意 AI 建議的實例。法院會檢視您的推翻率。如果接近零,即暗示人類審查只是形式;如果為 15-25%,則展現了真正的臨床判斷。我們協助您建立門檻與升級規程,以產生一套可辯護的推翻樣態。

CMS-0057-F 對 2027 年前事前授權中的 AI 有何要求?

CMS-0057-F 分三個階段展開。第一階段(2026 年 1 月 1 日,現已生效):MA 計畫必須在 72 小時內處理加急 PA 請求,並在 7 個日曆日內處理標準請求。除詐欺或明顯錯誤外,計畫不得重新審查先前已核准的住院收治。這項營運變革影響 AI 輔助的工作流程,因為為吞吐量而最佳化的模型如今面臨可能與人類審查要求相牴觸的硬性處理期限。

第二階段(2026 年 3 月 31 日,現行截止日):計畫必須在契約層級公開報告 8 項 PA 指標,包括核准率與拒賠率、平均處理時程,以及申訴推翻率。這項報告使您 AI 的拒賠樣態對監管機關、原告律師、媒體與競爭對手皆可見。如果您的拒賠率明顯高於 MA 平均(以 2025 年數據為 15.7%),預期將受到審查。

第三階段(2027 年 1 月 1 日):計畫必須實施以 HL7 FHIR 為基礎的事前授權 API,具體為臨床決策規則(CRD)、文件範本與規則(DTR),以及事前授權支援(PAS)。這是一筆可觀的 IT 投資。FHIR 強制規定實質上為每一筆 PA 交易建立了一份標準化的電子紀錄,使您的 AI 決策管線在設計上更為透明且可稽核。

現在就建置合規架構、而非在 2026 年第三季手忙腳亂的計畫,能將這項強制規定轉化為治理優勢。CMS 於 2025 年 6 月暫停了某些透明度要求(UM 委員會的健康公平專業、計畫層級的指標細分),但核心的報告與 API 強制規定仍然有效。

我們如何為健康計畫設立 AI 治理委員會?

治理委員會必須橋接 MAO 內部三個鮮少彼此交流的領域:臨床營運(懂得醫療必要性標準與 CMS 承保指引)、技術(懂得 AI 模型、其訓練資料與其失效模式),以及法務/合規(懂得訴訟與法規風險)。

我們建議一個 7-9 人的委員會並界定角色:由首席醫療官或臨床營運副總裁擔任主席、一位能以淺白語言說明模型行為的資料科學負責人、一位追蹤 CMS 與州法規要求的合規長、一位具醫療保險訴訟經驗的法律顧問、一位看見拒賠決策下游影響的會員服務代表,以及 2-3 位每日與 AI 互動的輪值臨床審查者。

委員會應每月開會並設常設議程:檢視 AI 決策指標(依區段分的拒賠率、推翻率、申訴結果)、評估任何模型變更或重新訓練事件、評估新的法規要求,並分流任何被標記的事件。

使治理委員會有效而非流於形式的關鍵在於權限。委員會需要一份書面化的授權,以停止 AI 部署、要求重新訓練,或對特定決策類別強制施行人類審查。如果委員會只能建議而無法執行,它的存在只是為了門面。在 Lokken 案之後,具執行權限的委員會是一項訴訟防禦資產;沒有執行權限的委員會則是一項責任,因為它展現了對風險的知悉卻未採取行動。

對 Medicare Advantage 計畫而言,AI 拒賠訴訟的真實成本是多少?

成本模型有四個層次。如 Lokken 規模的集體訴訟,其直接訴訟成本在 3-5 年間的律師費為 $5-15M,視案件是和解或進入審判而定。這個數字不包含潛在的損害賠償,而在數百萬 Medicare 受益人的集體中,賠償金額可能高達數億。

法規補救成本接續在訴訟之後。CMS 可課予民事罰款、要求矯正行動計畫,在極端情況下還可暫停加保。矯正行動計畫的平均實施成本,使 MAO 在技術、流程重新設計與獨立監測上花費 $2-8M。

營運中斷是隱藏成本。Lokken 證據揭示命令要求 UnitedHealth 產出內部 AI 文件,使工程與法務團隊從營運工作中分身。對於一家中型 MAO(50 萬至 200 萬名會員),相當規模的證據揭示合規將耗用資料科學團隊 6-12 個月的產能。

聲譽損害影響星級評等、會員留存與經紀人關係。MA 計畫以星級競爭;一次引發媒體報導的公開 AI 治理失敗,會壓低會員滿意度分數(CAHPS),而這會流入星級的計算。掉一顆星,每名會員每年約損失 $500 的獎勵給付。對一家擁有 100 萬名會員的計畫而言,那就是每年 $500M。治理的商業論據很直截了當:一項全面的演算法稽核與合規架構,其成本只是訴訟風險中任一單一構成要素的零頭。

技術研究

我們對醫療保險中演算法治理的分析,包含完整的 nH Predict 案例研究與法規合規框架。

治理前沿:演算法完整性、企業責任,以及從預測性外殼到深度 AI 解決方案的轉型

針對 nH Predict 失敗、因果 AI 替代方案、FDA 可信度框架對應,以及面向醫療給付者的 NIST AI RMF 營運化的技術深入剖析。

您 AI 的拒賠樣態如今已是公開紀錄

CMS-0057-F 第二階段要求自 2026 年 3 月 31 日起公開報告 PA 指標。監管機關、原告律師與媒體都能看見您的數字。

一份在 CMS 稽核之後的矯正行動計畫要價 $2-8M。一場集體訴訟的辯護在損害賠償之前就要花 $5-15M。一項全面的演算法稽核與治理架構,成本低於兩者,且能預防兩者。

演算法稽核與風險評估

  • ✓ UM AI 模型的決策路徑繪製
  • ✓ 以 SHAP 為基礎的特徵歸因與差異分析
  • ✓ 廠商透明度評估(證據揭示整備)
  • ✓ 按風險排序、附補救優先順序的風險暴露報告

治理架構與建置

  • ✓ 面向 Facets/QNXT/HealthEdge 的可解釋性中介軟體
  • ✓ CMS-0057-F 合規基礎設施(指標 + FHIR API)
  • ✓ 防竄改的決策日誌記錄與稽核軌跡
  • ✓ 治理委員會章程與營運化