RECLUTAMENTO PER STUDI CLINICI

Il tuo strumento di abbinamento AI non distingue un catetere venoso centrale da un cateterismo cardiaco. E ti costa 800.000 $ al giorno.

L'80% degli studi clinici non rispetta i tempi di arruolamento. Il collo di bottiglia non è la disponibilità di pazienti. È la precisione dell'abbinamento. L'AI generica legge le parole. I sistemi guidati da ontologie ragionano sui concetti medici, analizzano le clausole di eccezione e producono audit trail che reggono allo scrutinio normativo.

800.000 $/giorno

Vendite perse per ogni giorno di ritardo dello studio

Tufts CSDD, 2024

80%

Degli studi non rispetta i tempi di arruolamento

Consenso del settore, 2025

1.200 $

Costo medio per fallimento dello screening

Antidote.me, 2025

Costruiamo sistemi di abbinamento su misura che ragionano sull'idoneità usando grafi ontologici SNOMED-CT e logica deterministica. Per sponsor farmaceutici, CRO e centri medici accademici che conducono studi complessi in cui i tassi di fallimento dello screening e i ritardi nell'arruolamento si misurano in milioni.

Il problema dell'abbinamento di cui nessuno parla

Il settore ha trascorso gli ultimi cinque anni a sostituire la ricerca per parole chiave con gli LLM. Questo ha risolto i casi facili. Non ha risolto i casi che contano davvero.

L'errore che spiega tutto

Uno studio di Fase III su un anticoagulante esclude i pazienti che hanno subito un "cateterismo cardiaco." La cartella clinica elettronica di un paziente contiene una nota che descrive un "posizionamento di catetere venoso centrale" eseguito in terapia intensiva per l'accesso a farmaci endovenosi.

Cosa fa l'AI generica:

Vede "catetere" + "venoso" + prossimità a termini cardiovascolari. Il punteggio di similarità vettoriale è alto. Il paziente viene segnalato come non idoneo. Si perde un paziente idoneo.

Cosa fa l'abbinamento guidato da ontologie:

Mappa entrambi su ID di concetto SNOMED-CT. Il cateterismo cardiaco (SCTID: 41976001) rientra in "Procedura sul cuore." Il cateterismo venoso centrale (SCTID: 392230005) rientra in "Cateterismo di una vena." Rami diversi. Il paziente è idoneo.

Non è un caso limite. Rappresenta un'intera classe di errori in cui procedure, condizioni o farmaci condividono il vocabolario ma differiscono dal punto di vista medico. Valutazioni pubblicate confermano che i modelli di AI commettono esattamente questo errore di "cateterismo cardiaco uguale puntura venosa centrale" (Fierce Biotech, 2025). Moltiplicate per centinaia di criteri su decine di studi e otterrete una perdita sistematica di idoneità che nessuna quantità di prompt engineering può correggere.

Tre fallimenti strutturali nell'abbinamento attuale

Cecità ontologica

Gli LLM elaborano il testo per prossimità di token, non per gerarchia medica. "Angiografia coronarica" e "angiografia periferica" ottengono punteggi simili perché condividono la parola "angiografia." SNOMED-CT sa che una è una procedura cardiaca e l'altra una procedura di accesso vascolare.

Fragilità delle clausole di eccezione

"Escludere i pazienti con ipertensione a meno che non sia ben controllata con terapia stabile da oltre 3 mesi." Gli LLM vedono "ipertensione" e o escludono (perdendo un paziente idoneo) o includono (mancando la verifica temporale). I protocolli ora hanno in media oltre 27 criteri, molti con condizionali annidati (IQVIA, 2026).

Output non deterministico

Fate passare lo stesso paziente attraverso un matcher basato su LLM due volte con finestre di contesto leggermente diverse. Potreste ottenere risultati diversi. Gli studi clinici richiedono audit trail riproducibili al 100%. Le autorità di regolamentazione devono sapere esattamente perché ogni paziente è stato incluso o escluso.

Chi fa cosa nell'abbinamento per studi oggi

Tirate fuori questo nella vostra prossima riunione di valutazione dei fornitori. Ogni piattaforma ha i suoi punti di forza. La domanda è quali lacune contano per la complessità del vostro protocollo.

Piattaforma	Cosa fanno effettivamente	Accesso ai dati	Dove si rompe
Tempus (incl. Deep 6 AI)	Agente Patient Query basato su LLM che legge note non strutturate e le valuta rispetto ai criteri. Accuratezza del 94% sulle query valutate. Oltre 750 sedi di provider dopo l'acquisizione di Deep 6.	Dati genomici e clinici proprietari. Sedi della rete Tempus.	Abbinamento probabilistico senza fondamento ontologico. Limitato alla rete Tempus per l'accesso ai dati. Nessuna traccia di ragionamento formale per l'audit normativo.
IQVIA (IQVIA.ai)	Piattaforma di AI agentica unificata (marzo 2026) con NVIDIA. I più grandi dataset sanitari a livello globale. End-to-end dalla fattibilità all'arruolamento.	Oltre 250 milioni di cartelle paziente. Relazioni con il settore farmaceutico che durano decenni.	Abbinamento ampio ma generico. L'approccio platform-first potrebbe non gestire le specifiche sfumature del vostro protocollo. Requisiti di integrazione pesanti per i flussi di lavoro personalizzati.
Medidata (Dassault)	AI Study Build per Rave EDC. Leader CTMS. Oltre 500 studi supportati dall'AI. Solida pipeline da EDC ad abbinamento.	Dati degli studi dalla piattaforma Rave. Accesso diretto all'EHR limitato.	L'abbinamento è una funzionalità all'interno di un CTMS più ampio, non il focus principale. Le limitazioni dell'API Rave spingono la maggior parte dei team verso l'ETL in batch anziché l'abbinamento in tempo reale.
TriNetX	Rete di dati del mondo reale per la fattibilità e l'identificazione delle coorti. Oltre 250 milioni di cartelle paziente in tutti i sistemi sanitari.	Modello di rete federata. Focus sui dati strutturati.	Forte per la fattibilità, più debole nell'analisi delle note non strutturate. Richiede l'appartenenza alla rete per l'accesso ai dati.
ConcertAI (ACT)	Piattaforma di AI agentica lanciata a febbraio 2026. Dichiara una riduzione dei tempi di 10-20 mesi. Dati del mondo reale focalizzati sull'oncologia.	Dataset oncologici proprietari. Ecosistema adiacente a Roche.	Piattaforma nuova, track record di produzione limitato. Centrata sull'oncologia; meno approfondita in altre aree terapeutiche.
Big 4 / Grandi system integrator	Implementano e integrano piattaforme. Configurano Medidata, Veeva, Oracle Clinical One. Project management e change management.	Dati del cliente tramite l'incarico.	Implementano piattaforme, non costruiscono intelligenza. Nessuna ingegneria ontologica o capacità di abbinamento personalizzato. Gli incarichi vanno da 500.000 $ a oltre 5 milioni di $ con tempistiche di 6-12 mesi solo per l'integrazione.
Sviluppo interno	Il team di informatica clinica costruisce regole di abbinamento o effettua il fine-tuning dei modelli rispetto a protocolli specifici.	Accesso completo all'EHR. Nessuna preoccupazione di condivisione dei dati.	Gli informatici clinici sono scarsi e costosi. La manutenzione dell'ontologia (SNOMED si aggiorna due volte l'anno, MedDRA trimestralmente) richiede personale dedicato. La maggior parte degli sviluppi interni si ferma all'abbinamento per parole chiave con un po' di NLP.

Ogni piattaforma sopra utilizza qualche forma di abbinamento NLP o LLM. Nessuna implementa pubblicamente il ragionamento neuro-symbolic con grafi ontologici SNOMED-CT per la valutazione deterministica dell'idoneità. È in quella lacuna che risiede la precisione clinica.

Cosa costruiamo

Ogni capacità affronta una specifica modalità di fallimento dei sistemi di abbinamento attuali. Non sono funzionalità di prodotto. Sono componenti costruiti su misura per il vostro portafoglio di protocolli, il vostro ambiente EHR e i vostri requisiti normativi.

Motore di abbinamento dei pazienti fondato su ontologie

Costruiamo sistemi di abbinamento in cui la decisione sull'idoneità viene calcolata, non prevista. Il livello di estrazione LLM converte le note cliniche in ID di concetto SNOMED-CT usando il decoding vincolato che forza l'output SCTID. Il grafo di conoscenza (Neo4j) memorizza oltre 350.000 concetti medici con le loro relazioni gerarchiche. Il reasoner simbolico valuta l'idoneità attraversando il grafo: la procedura del paziente è un sottotipo della procedura esclusa? La risposta è deterministica.

Ricorriamo al decoding vincolato in stile SAKT quando le note cliniche sono disordinate (note di terapia intensiva, trascrizioni scritte a mano) perché forzare il modello a produrre SCTID validi in fase di generazione intercetta le entità mediche allucinate prima che entrino nella pipeline di ragionamento. Per dati EHR ben strutturati (risorse FHIR con campi codificati), bypassiamo del tutto l'LLM e mappiamo direttamente sull'ontologia.

Parser di protocolli con logica deontica

I protocolli degli studi non sono checklist booleane. Sono enunciati normativi con obblighi, permessi e divieti che interagiscono attraverso clausole di eccezione e vincoli temporali. Analizziamo i protocolli traducendoli in logica deontica formale, scomponendo "escludi X a meno che Y entro l'intervallo Z" in operazioni calcolabili.

Il parser gestisce la logica di insiemi temporali per i calcoli di durata ("nessuna PCI entro 12 mesi"), le catene di interazione tra farmaci tramite l'attraversamento del percorso degli enzimi CYP nel grafo di conoscenza ("qualsiasi farmaco che interagisce con CYP3A4") e la logica condizionale annidata che le pipeline NLP standard appiattiscono in risposte sbagliate. Ogni criterio analizzato produce una specifica di logica formale che il reasoner esegue rispetto ai fenotipi dei pazienti.

Architettura di deployment locale all'EHR

I dati dei pazienti rimangono all'interno del vostro firewall. Il livello di estrazione neurale viene eseguito come un modello clinico di linguaggio distribuito localmente (sottoposto a fine-tuning sui pattern delle note della vostra istituzione). Il grafo di conoscenza e il reasoner simbolico vengono eseguiti on-premise. Gli adattatori di input FHIR R4 si connettono a Epic (tramite gli endpoint App Orchard), Oracle Health (API FHIR Millennium) o altri sistemi EHR certificati.

Progettiamo l'architettura per la conformità HIPAA BAA fin dal primo giorno: logging di audit su ogni accesso ai dati dei pazienti, controlli di accesso al minimo necessario, permessi basati sui ruoli allineati ai vostri protocolli IRB e capacità di de-identificazione per qualsiasi dato aggregato che deve spostarsi tra i sistemi. Le informazioni sanitarie protette non toccano mai un'API esterna.

Integrazione CTMS e pipeline di dati normativi

L'output di abbinamento che risiede in un sistema separato è un output di abbinamento che viene ignorato. Costruiamo connettori che inviano gli abbinamenti paziente-studio classificati direttamente in Medidata Rave, Veeva Vault CTMS o Oracle Clinical One. I coordinatori di sito vedono i risultati negli strumenti che già usano, non in un'altra dashboard da controllare.

L'output viene mappato nel formato del dominio CDISC SDTM IE (Inclusion/Exclusion), così i dati di reclutamento sono strutturati per la sottomissione normativa fin dal primo giorno. Nessuna pulizia o riconciliazione dei dati a valle richiesta. La pipeline gestisce anche la normalizzazione dei codici di laboratorio locali (mappatura LOINC) per riconciliare gli intervalli di riferimento specifici della sede rispetto alle soglie definite dal protocollo.

Sviluppo di ontologie per area terapeutica

SNOMED-CT fornisce la base. Noi costruiamo la profondità terapeutica al di sopra. Per l'oncologia: livelli di espressione PD-L1 mappati su soglie di test specifiche (22C3 vs SP263 vs SP142), classificazioni delle varianti BRCA1/2 (patogena vs VUS vs benigna secondo le linee guida ACMG), sottotipi di mutazione EGFR (delezione dell'esone 19 vs L858R vs T790M), stato del riarrangiamento ALK, stadiazione TNM con mappatura AJCC 8ª edizione e storie di regimi precedenti con attribuzione della linea di terapia.

Ogni ontologia viene validata rispetto a 10-15 protocolli reali del vostro portafoglio di studi prima di andare in produzione. La validazione significa eseguire il sistema rispetto a studi completati in cui gli esiti dell'arruolamento sono noti e misurare la concordanza con il gold standard umano. Manteniamo le ontologie aggiornate man mano che SNOMED-CT si aggiorna due volte l'anno e MedDRA trimestralmente, così le mappature dei concetti rimangono attuali.

Come funziona: dalla nota clinica alla decisione sull'idoneità

Seguiamo passo passo una singola valutazione di paziente per uno studio oncologico di Fase III. Questo è il processo che viene eseguito per ogni coppia paziente-criterio.

1

Estrazione neurale

L'LLM clinico distribuito localmente legge le note non strutturate del paziente. Un medico ha scritto: "Pt completati 4 cicli carboplatino/pemetrexed, ultima infusione 03/2025. PD-L1 TPS 45% (22C3). ECOG 1." Il modello estrae le entità usando il decoding vincolato che forza output SNOMED-CT e LOINC validi: MedicationAdministration: carboplatino (SCTID: 386905003), pemetrexed (SCTID: 409342003). Finding: PD-L1 45% (LOINC: 85146-3). Finding: ECOG PS 1.

2

Mappatura ontologica

Le entità estratte vengono mappate sul grafo di conoscenza. "Carboplatino" viene risolto nel ramo degli agenti antineoplastici a base di platino. Il grafo sa che il carboplatino è-un agente alchilante, è-un composto del platino, interagisce-con CYP2C8. Se il protocollo esclude la "precedente terapia con platino," l'attraversamento del grafo conferma che il carboplatino è idoneo. Se esclude la "precedente immunoterapia," il grafo conferma che il carboplatino non lo è. Nessuna ambiguità.

3

Valutazione con logica deontica

Criterio del protocollo: "Nessuna terapia sistemica precedente per malattia avanzata, a meno che la terapia adiuvante/neoadiuvante non sia stata completata > 12 mesi prima della randomizzazione." Il parser scompone: Prohibition(terapia sistemica precedente) EXCEPT Permission(adiuvante OR neoadiuvante) AND Temporal(data_completamento + 12 mesi < data_randomizzazione). Il reasoner verifica: carboplatino/pemetrexed è stato somministrato. Era adiuvante? Il grafo controlla lo stadio della malattia al momento del trattamento. L'intervallo era sufficiente? Ultima infusione marzo 2025, randomizzazione aprile 2026 = 13 mesi. Risultato: IDONEO (clausola di eccezione soddisfatta, vincolo temporale rispettato).

4

Punteggio di confidenza e traccia di ragionamento

Il sistema produce un punteggio composito. I criteri deterministici (corrispondenze ontologiche, calcoli temporali) ottengono una confidenza binaria. I criteri ambigui (formulazione poco chiara delle note, dati mancanti) ottengono un punteggio di probabilità con l'ambiguità specifica segnalata. La traccia di ragionamento per ogni criterio viene memorizzata: quale SCTID è stato abbinato, quale attraversamento del grafo è stato eseguito, quale operazione logica ha prodotto il risultato. Questa traccia confluisce direttamente nel formato del dominio CDISC SDTM IE e nella vista CTMS del coordinatore.

Distinzione chiave dall'AI di piattaforma:

In nessun momento il sistema chiede a un LLM "questo paziente è idoneo?" L'LLM legge il testo. L'ontologia risolve il significato. Il motore logico calcola l'idoneità. Ogni livello ha un compito definito e un output verificabile. Quando un coordinatore vede "idoneo" o "escluso," può tracciare esattamente il perché, fino all'ID di concetto SNOMED e alla relazione del grafo che hanno determinato l'esito.

Come lavoriamo

Tre fasi, 14-20 settimane in totale. Ogni fase ha un deliverable definito e un punto di decisione prima di procedere.

Fase 1: settimane 1-4

Audit delle operazioni di reclutamento

Analizzare gli attuali tassi di fallimento dello screening per area terapeutica e tipo di criterio
Mappare il panorama dei dati EHR: strutturati vs non strutturati, maturità FHIR, qualità delle note
Esaminare 10-15 protocolli rappresentativi del vostro portafoglio di studi
Identificare i tipi di criterio che causano il maggior numero di falsi positivi e abbinamenti mancati
Consegna: documento di architettura tecnica, modello di ROI basato sui vostri dati effettivi, raccomandazione sul percorso normativo

Punto di decisione: procedere con lo sviluppo, adattare lo scope o stabilire che una piattaforma sia la scelta migliore. Ve lo diremo se è così.

Fase 2: settimane 5-16

Sviluppo

Sviluppo dell'ontologia per l'area terapeutica prioritaria (6-8 settimane per l'oncologia, 8-12 settimane per le malattie rare)
Fine-tuning dell'LLM sui pattern delle note cliniche e sulle convenzioni di abbreviazione della vostra istituzione
Costruzione del grafo di conoscenza con mappature SNOMED-CT, MedDRA, LOINC
Configurazione del reasoner simbolico con logica deontica per i vostri template di protocollo
Integrazione FHIR R4 con il vostro ambiente EHR
Sviluppo del connettore CTMS (Medidata Rave, Veeva Vault o Oracle Clinical One)

Fase 3: settimane 17-20

Validazione e deployment

Validazione retrospettiva rispetto a 3-5 studi completati con esiti di arruolamento noti
Benchmark di accuratezza: obiettivo >90% di recall, >85% di precision rispetto al gold standard umano
Integrazione e formazione sul flusso di lavoro dei coordinatori di sito
Documentazione di esenzione CDS e dichiarazione dell'uso previsto
Passaggio di consegne della manutenzione dell'ontologia o accordo di supporto continuativo

Continuativo: SNOMED-CT si aggiorna due volte l'anno, MedDRA trimestralmente. Manteniamo o effettuiamo il passaggio di consegne con documentazione.

Avvertenze oneste

L'integrazione EHR è il collo di bottiglia, non l'AI. La certificazione Epic App Orchard richiede 6-12 mesi. Se la vostra istituzione non ha avviato quel processo, la Fase 2 sarà vincolata all'accesso ai dati. Vi aiutiamo a navigare la certificazione, ma non possiamo accelerarla.
La qualità dei dati fissa il limite massimo. Se le note cliniche sono scarse, incoerenti o pesantemente abbreviate senza una sigla standardizzata, l'accuratezza dell'estrazione sarà inferiore. La Fase 1 identifica queste lacune prima che vi impegniate nello sviluppo.
L'adesione organizzativa conta. I coordinatori di sito che sono rimasti scottati da strumenti carichi di falsi positivi resistono ai nuovi sistemi. La Fase 3 include il change management, ma la fiducia del coordinatore si guadagna nel corso di settimane di risultati accurati, non in una sessione di formazione.

Valutazione della prontezza al reclutamento per studi

Rispondete a sei domande sulle vostre attuali operazioni di reclutamento. La valutazione identifica dove la vostra pipeline di abbinamento sta perdendo pazienti idonei e quali miglioramenti avrebbero il ROI più alto per la vostra situazione specifica.

1. Qual è il vostro attuale tasso di fallimento dello screening negli studi attivi?

Le domande che ci pongono gli acquirenti

In che modo l'abbinamento guidato da ontologie differisce da ciò che Tempus o IQVIA già offrono?

Tempus Patient Query e gli strumenti di abbinamento di IQVIA usano grandi modelli linguistici per leggere le note cliniche e valutarne la pertinenza rispetto ai criteri dello studio. Questo funziona bene per i criteri semplici ma fallisce sulle distinzioni ontologiche. Quando un protocollo esclude il "cateterismo cardiaco" e una cartella paziente menziona un "posizionamento di catetere venoso centrale," un LLM che opera sulla similarità vettoriale vede due procedure di cateterismo che coinvolgono il sistema cardiovascolare e segnala una corrispondenza. Un sistema fondato su SNOMED-CT riconosce che queste si trovano su rami completamente diversi della gerarchia delle procedure (SCTID 41976001 vs. 392230005) e dichiara correttamente il paziente idoneo.

La differenza pratica si manifesta nei tassi di fallimento dello screening. L'abbinamento basato su LLM raggiunge tipicamente un'accuratezza dell'85-94% su criteri ben strutturati, ma scende al 70-80% sui protocolli con distinzioni ontologiche complesse, logica temporale o clausole di eccezione. L'abbinamento guidato da ontologie mantiene un'accuratezza superiore al 95% su tutti i tipi di criterio perché la decisione sull'idoneità viene calcolata da un reasoner simbolico, non prevista da un modello linguistico.

L'altra differenza strutturale è l'auditabilità. Un LLM produce un punteggio di pertinenza. Il nostro sistema produce una traccia di ragionamento: il paziente ha SCTID X, il criterio richiede non-SCTID Y, X non-è-un-sottotipo-di Y secondo la gerarchia SNOMED, quindi idoneo. Quella traccia è ciò di cui i team di affari regolatori hanno bisogno per la documentazione di sottomissione alla FDA.

Questo può integrarsi con il nostro sistema EHR esistente senza inviare i dati dei pazienti ad API esterne?

Sì, e questo è un principio architetturale fondamentale, non un ripensamento. L'architettura neuro-symbolic separa il livello neurale (LLM per l'estrazione delle entità) dal livello simbolico (grafo di conoscenza e logic solver). Entrambi possono essere eseguiti interamente all'interno del vostro firewall.

Il livello di estrazione LLM viene distribuito come modello locale, tipicamente un modello clinico di linguaggio sottoposto a fine-tuning in esecuzione sulla vostra infrastruttura o su un'istanza di cloud privato sicuro. Non invia mai testo grezzo dei pazienti ad API esterne. Il grafo di conoscenza (Neo4j o equivalente) e l'ontologia SNOMED-CT risiedono on-premise. FHIR R4 è lo standard di input. Per gli ambienti Epic, sviluppiamo rispetto agli endpoint FHIR R4 disponibili tramite App Orchard, recuperando le risorse Patient, Condition, Procedure e MedicationAdministration. Per Oracle Health (Cerner), l'integrazione utilizza le loro API FHIR Millennium.

Il livello di estrazione elabora le note cliniche localmente, mappa le entità su SCTID e il reasoner simbolico valuta l'idoneità rispetto ai criteri del protocollo. Le informazioni sanitarie protette non lasciano mai il vostro ambiente sicuro. Progettiamo l'architettura per la conformità HIPAA BAA fin dal primo giorno, incluso il logging di audit, i controlli di accesso al minimo necessario e le capacità di de-identificazione per qualsiasi dato che deve effettivamente spostarsi tra i sistemi.

Per quali aree terapeutiche funziona e quanto tempo richiede la configurazione dell'ontologia?

L'architettura funziona per qualsiasi area terapeutica perché SNOMED-CT copre oltre 350.000 concetti medici. La variabile è la profondità dell'ontologia, ovvero quante mappature specifiche del dominio, sinonimi e relazioni gerarchiche sono preconfigurati per i vostri protocolli specifici.

L'oncologia è il punto di partenza della maggior parte dei nostri incarichi perché i criteri sono i più complessi: requisiti di biomarcatori (livelli di espressione PD-L1, stato di mutazione BRCA1/2, varianti EGFR), sistemi di stadiazione (TNM, AJCC 8ª edizione), storie di regimi precedenti con vincoli temporali e punteggi di performance status. Un'ontologia oncologica pronta per la produzione che copre i primi 50 biomarcatori, oltre 200 regimi di trattamento e i sistemi di stadiazione standard richiede 6-8 settimane per essere costruita e validata.

Cardiovascolare e SNC sono i successivi più comuni. L'ontologia cardiovascolare si concentra sulle gerarchie delle procedure (la distinzione del cateterismo cardiaco è solo una di decine), sulle catene di interazione tra farmaci tramite i percorsi degli enzimi CYP e sugli intervalli dei valori di laboratorio con aggiustamenti di riferimento specifici della sede. Il SNC aggiunge la gestione degli endpoint soggettivi e la mappatura dei punteggi di valutazione cognitiva.

Le malattie rare sono tecnicamente le più impegnative perché la copertura di SNOMED può essere scarsa per le condizioni ultra-rare. Integriamo con le mappature dell'ontologia Orphanet e costruiamo estensioni di concetto personalizzate che si reintegrano nel grafo. La configurazione per un'area terapeutica di malattie rare richiede 8-12 settimane. Ogni ontologia viene validata rispetto a criteri di protocollo reali del vostro portafoglio di studi prima di andare in produzione.

Come gestisce le complesse clausole "a meno che" ed "eccetto" nei moderni protocolli degli studi?

È qui che la logica deterministica supera più chiaramente i modelli linguistici probabilistici. L'NLP standard tratta i criteri di idoneità come testo da interpretare. Noi li trattiamo come logica formale da calcolare.

Prendete un criterio reale: "Escludere i pazienti con ipertensione, a meno che non sia ben controllata con terapia stabile da almeno 3 mesi." Un LLM vede la parola "ipertensione" e deve decidere dal contesto se escludere. Lo fa correttamente la maggior parte delle volte, ma "la maggior parte delle volte" significa perdere pazienti idonei in ogni studio.

Il nostro parser scompone questo in operatori deontici. Prohibition: ipertensione presente. Condizione di permission: ipertensione AND controllata (PA sotto 140/90 secondo la definizione del protocollo) AND terapia stabile (stesso regime antipertensivo) AND vincolo temporale (durata di 3+ mesi). Il sistema quindi interroga la storia farmacologica del paziente dal grafo di conoscenza, identifica l'antipertensivo, controlla la data di inizio della prescrizione, calcola il delta di durata rispetto alla data di screening e verifica le letture della pressione arteriosa entro la finestra di osservazione. Ogni passaggio produce un output verificabile.

La stessa logica gestisce catene come "nessuna chemioterapia precedente a meno che la terapia neoadiuvante non sia stata completata più di 6 mesi fa" controllando l'attributo dell'intento della terapia (neoadiuvante vs. adiuvante vs. palliativa), la data di fine e il delta temporale. Questi non sono casi limite. I dati IQVIA mostrano che i protocolli ora hanno in media oltre 27 criteri di idoneità, molti con condizionali annidati. Una singola clausola di eccezione gestita male per protocollo, su centinaia di pazienti sottoposti a screening, si traduce in decine di arruolamenti persi.

Come si presenta un tipico incarico e quanto costa rispetto alla licenza di una piattaforma?

Un tipico incarico si articola in tre fasi nell'arco di 14-20 settimane. La Fase 1 (3-4 settimane) è un audit delle operazioni di reclutamento: analizziamo i vostri attuali tassi di fallimento dello screening, mappiamo il vostro panorama di dati EHR, esaminiamo 10-15 protocolli rappresentativi del vostro portafoglio di studi e identifichiamo i tipi di criterio specifici che causano il maggior numero di falsi positivi e abbinamenti mancati. Questa fase fornisce un documento di architettura tecnica e un modello di ROI basato sui vostri dati effettivi.

La Fase 2 (8-12 settimane) è lo sviluppo: sviluppo dell'ontologia per la vostra area terapeutica prioritaria, fine-tuning dell'LLM sui pattern delle vostre note cliniche, costruzione del grafo di conoscenza, configurazione del reasoner simbolico e integrazione FHIR con il vostro ambiente EHR. La Fase 3 (3-4 settimane) è la validazione: test retrospettivo rispetto a studi completati in cui gli esiti dell'arruolamento sono noti, benchmark di accuratezza e integrazione del flusso di lavoro dei coordinatori.

Il costo dipende dallo scope. Uno sviluppo per una singola area terapeutica con un'integrazione EHR costa tipicamente da 180.000 $ a 350.000 $. I deployment multi-terapeutici o multi-sito scalano con l'ampiezza dell'ontologia e la complessità dell'integrazione. Per fare un confronto, le licenze delle piattaforme Tempus e IQVIA costano da 200.000 $ a oltre 500.000 $ all'anno con commissioni per paziente o per studio in aggiunta.

La differenza economica fondamentale è la proprietà. Una licenza di piattaforma è una spesa ricorrente con vincolo al fornitore. Uno sviluppo personalizzato è un asset che possedete, mantenete ed estendete. Per le organizzazioni che conducono oltre 20 studi all'anno, lo sviluppo personalizzato raggiunge tipicamente il punto di pareggio rispetto alla licenza di piattaforma entro 18 mesi, con l'ulteriore vantaggio di un'accuratezza di abbinamento calibrata sulla complessità specifica del vostro protocollo.

Questo richiede l'autorizzazione della FDA o rientra nell'esenzione CDS?

La guida aggiornata sul Clinical Decision Support della FDA del gennaio 2026 è il quadro di riferimento qui. La domanda chiave è se il sistema prende decisioni cliniche autonome o supporta il processo decisionale umano.

La nostra architettura è progettata per l'esenzione CDS ai sensi della Sezione 3060 del 21st Century Cures Act. Il sistema soddisfa tutti e quattro i criteri di esenzione: non è destinato ad acquisire, elaborare o analizzare immagini o segnali medici; mostra la base delle raccomandazioni (la traccia completa di ragionamento); è destinato a professionisti sanitari con capacità di revisione indipendente; e non sostituisce il giudizio clinico nel determinare l'idoneità.

In pratica, ciò significa che il sistema produce abbinamenti paziente-studio classificati con punteggi di confidenza e tracce di ragionamento. Un coordinatore di sito o un clinical research associate esamina ogni abbinamento prima di qualsiasi contatto con il paziente. Il sistema non arruola mai automaticamente.

Detto questo, l'interpretazione della FDA sull'ambito del CDS continua a evolversi. Se la vostra organizzazione prevede di usare l'output di abbinamento per escludere automaticamente i pazienti senza revisione umana, il sistema potrebbe sconfinare nel territorio dei dispositivi, richiedendo l'autorizzazione 510(k) o la classificazione De Novo. Raccomandiamo di coinvolgere il Digital Health Center of Excellence della FDA fin dalle prime fasi della progettazione. Costruiamo la documentazione normativa, inclusa la giustificazione dell'esenzione CDS, la dichiarazione dell'uso previsto e il report di valutazione clinica, come deliverable standard nella Fase 1.

Ricerca tecnica

La ricerca alla base di questa pagina di soluzione. Per l'architettura tecnica completa, il razionale di progettazione dell'ontologia e l'approccio di validazione clinica.

Oltre la sintassi: AI neuro-symbolic e fenotipizzazione guidata da ontologie nel reclutamento per studi clinici

Analisi tecnica completa dell'architettura neuro-symbolic, dell'integrazione SNOMED-CT, del framework di logica deontica e dell'implementazione GraphRAG per l'abbinamento dei pazienti negli studi clinici.

Il tuo strumento di abbinamento AI non distingue un catetere venoso centrale da un cateterismo cardiaco. E ti costa 800.000 $ al giorno.

Il problema dell'abbinamento di cui nessuno parla

L'errore che spiega tutto

Tre fallimenti strutturali nell'abbinamento attuale

Chi fa cosa nell'abbinamento per studi oggi

Cosa costruiamo

Motore di abbinamento dei pazienti fondato su ontologie

Parser di protocolli con logica deontica

Architettura di deployment locale all'EHR

Integrazione CTMS e pipeline di dati normativi

Sviluppo di ontologie per area terapeutica

Come funziona: dalla nota clinica alla decisione sull'idoneità

Estrazione neurale

Mappatura ontologica

Valutazione con logica deontica

Punteggio di confidenza e traccia di ragionamento

Come lavoriamo

Audit delle operazioni di reclutamento

Sviluppo

Validazione e deployment

Avvertenze oneste

Valutazione della prontezza al reclutamento per studi

Le domande che ci pongono gli acquirenti

In che modo l'abbinamento guidato da ontologie differisce da ciò che Tempus o IQVIA già offrono?

Questo può integrarsi con il nostro sistema EHR esistente senza inviare i dati dei pazienti ad API esterne?

Per quali aree terapeutiche funziona e quanto tempo richiede la configurazione dell'ontologia?

Come gestisce le complesse clausole "a meno che" ed "eccetto" nei moderni protocolli degli studi?

Come si presenta un tipico incarico e quanto costa rispetto alla licenza di una piattaforma?

Questo richiede l'autorizzazione della FDA o rientra nell'esenzione CDS?

Ricerca tecnica

Ogni giorno di ritardo nell'arruolamento costa alla vostra pipeline 800.000 $

Audit delle operazioni di reclutamento

Sviluppo del sistema di abbinamento personalizzato

Pubblicato anche su