REKRUTIERUNG KLINISCHER STUDIEN
80 % der klinischen Studien verfehlen ihre Rekrutierungsfristen. Der Engpass liegt nicht am Patientenangebot. Es ist die Präzision des Abgleichs. Generische KI liest Wörter. Ontologiegestützte Systeme schließen über medizinische Konzepte, analysieren Ausnahmeklauseln und erzeugen Prüfprotokolle, die einer regulatorischen Überprüfung standhalten.
800.000 $/Tag
Entgangener Umsatz pro Tag Studienverzögerung
Tufts CSDD, 2024
80 %
Der Studien verfehlen die Rekrutierungsfristen
Branchenkonsens, 2025
1.200 $
Durchschnittliche Kosten pro Screening-Fehlschlag
Antidote.me, 2025
Wir entwickeln maßgeschneiderte Abgleichsysteme, die über die Eignung mithilfe von SNOMED-CT-Ontologiegraphen und deterministischer Logik schließen. Für Pharma-Sponsoren, CROs und akademische medizinische Zentren, die komplexe Studien durchführen, bei denen Screening-Fehlschlagsraten und Rekrutierungsverzögerungen in Millionen gemessen werden.
Die Branche hat die letzten fünf Jahre damit verbracht, die Schlagwortsuche durch LLMs zu ersetzen. Das hat die einfachen Fälle gelöst. Es hat nicht die Fälle gelöst, auf die es wirklich ankommt.
Eine Phase-III-Studie zu Antikoagulanzien schließt Patienten aus, die eine „Herzkatheteruntersuchung“ hatten. Die elektronische Patientenakte eines Patienten enthält eine Notiz, die eine „Anlage eines zentralvenösen Katheters“ beschreibt, die auf der Intensivstation für den intravenösen Medikamentenzugang durchgeführt wurde.
Was generische KI tut:
Sie sieht „Katheter“ + „venös“ + Nähe zu kardiovaskulären Begriffen. Der Vektorähnlichkeitswert ist hoch. Der Patient wird als nicht geeignetmarkiert. Ein geeigneter Patient geht verloren.
Was ontologiegestützter Abgleich tut:
Er bildet beide auf SNOMED-CT-Konzept-IDs ab. Die Herzkatheteruntersuchung (SCTID: 41976001) liegt unter „Eingriff am Herzen“. Die zentralvenöse Katheterisierung (SCTID: 392230005) liegt unter „Katheterisierung einer Vene“. Unterschiedliche Zweige. Der Patient ist geeignet.
Dies ist kein Sonderfall. Er steht für eine ganze Klasse von Fehlern, bei denen Eingriffe, Erkrankungen oder Medikamente das Vokabular teilen, sich aber medizinisch unterscheiden. Veröffentlichte Evaluierungen bestätigen, dass KI-Modelle genau diesen Fehler „Herzkatheteruntersuchung gleich zentralvenöse Punktion“ machen (Fierce Biotech, 2025). Multipliziert man dies mit Hunderten von Kriterien über Dutzende von Studien hinweg, ergibt sich ein systematisches Eignungsleck, das durch noch so viel Prompt Engineering nicht zu beheben ist.
Ontologische Blindheit
LLMs verarbeiten Text nach Token-Nähe, nicht nach medizinischer Hierarchie. „Koronarangiographie“ und „periphere Angiographie“ erhalten ähnliche Werte, weil sie das Wort „Angiographie“ teilen. SNOMED-CT weiß, dass das eine ein kardialer Eingriff und das andere ein vaskulärer Zugangseingriff ist.
Anfälligkeit von Ausnahmeklauseln
„Schließen Sie Patienten mit Bluthochdruck aus, es sei denn er ist seit mindestens 3 Monaten unter stabiler Medikation gut eingestellt.“ LLMs sehen „Bluthochdruck“ und schließen entweder aus (und verlieren einen geeigneten Patienten) oder schließen ein (und übersehen die zeitliche Prüfung). Protokolle umfassen mittlerweile durchschnittlich über 27 Kriterien, viele mit verschachtelten Bedingungen (IQVIA, 2026).
Nicht-deterministische Ausgabe
Lassen Sie denselben Patienten zweimal durch einen LLM-basierten Abgleich mit leicht unterschiedlichen Kontextfenstern laufen. Sie erhalten möglicherweise unterschiedliche Ergebnisse. Klinische Studien erfordern zu 100 % reproduzierbare Prüfprotokolle. Aufsichtsbehörden müssen genau wissen, warum jeder Patient ein- oder ausgeschlossen wurde.
Bringen Sie das in Ihrem nächsten Meeting zur Anbieterbewertung zur Sprache. Jede Plattform hat ihre Stärken. Die Frage ist, welche Lücken für die Komplexität Ihres Protokolls von Bedeutung sind.
| Plattform | Was sie tatsächlich tun | Datenzugriff | Wo es scheitert |
|---|---|---|---|
| Tempus (inkl. Deep 6 AI) | LLM-basierter Patient-Query-Agent liest unstrukturierte Notizen und bewertet sie anhand von Kriterien. 94 % Genauigkeit bei evaluierten Abfragen. Über 750 Anbieterstandorte nach der Deep-6-Übernahme. | Proprietäre Genom- + klinische Daten. Standorte im Tempus-Netzwerk. | Probabilistischer Abgleich ohne ontologische Verankerung. Beim Datenzugriff auf das Tempus-Netzwerk beschränkt. Keine formale Schlusskette für die regulatorische Prüfung. |
| IQVIA (IQVIA.ai) | Einheitliche agentic AI-Plattform (März 2026) mit NVIDIA. Weltweit größte Gesundheitsdatensätze. Durchgängig von der Machbarkeit bis zur Rekrutierung. | Über 250 Mio. Patientendatensätze. Pharma-Beziehungen über Jahrzehnte hinweg. | Breiter, aber generischer Abgleich. Der plattformorientierte Ansatz bewältigt möglicherweise nicht die spezifischen Feinheiten Ihres Protokolls. Hoher Integrationsaufwand für individuelle Workflows. |
| Medidata (Dassault) | AI Study Build für Rave EDC. CTMS-Marktführer. Über 500 KI-gestützte Studien. Starke EDC-zu-Abgleich-Pipeline. | Studiendaten von der Rave-Plattform. Begrenzter direkter EHR-Zugriff. | Der Abgleich ist eine Funktion innerhalb eines größeren CTMS, nicht der Kernfokus. Die Einschränkungen der Rave-API drängen die meisten Teams zum Batch-ETL statt zum Echtzeit-Abgleich. |
| TriNetX | Real-World-Data-Netzwerk zur Machbarkeitsprüfung und Kohortenidentifikation. Über 250 Mio. Patientendatensätze über Gesundheitssysteme hinweg. | Föderiertes Netzwerkmodell. Fokus auf strukturierte Daten. | Stark bei der Machbarkeit, schwächer beim Parsen unstrukturierter Notizen. Netzwerkmitgliedschaft für den Datenzugriff erforderlich. |
| ConcertAI (ACT) | Agentic AI-Plattform, eingeführt im Februar 2026. Verspricht eine Verkürzung der Zeitachse um 10–20 Monate. Onkologisch fokussierte Real-World-Daten. | Proprietäre Onkologie-Datensätze. Roche-nahes Ökosystem. | Neue Plattform, begrenzte Erfolgsbilanz im Produktivbetrieb. Onkologiezentriert; geringere Tiefe in anderen Therapiebereichen. |
| Big 4 / große Systemintegratoren | Implementieren und integrieren Plattformen. Konfigurieren Medidata, Veeva, Oracle Clinical One. Projektmanagement und Change-Management. | Kundendaten über das Mandat. | Sie implementieren Plattformen, sie entwickeln keine Intelligenz. Keine Ontologie-Entwicklung oder maßgeschneiderte Abgleichfähigkeit. Mandate kosten 500.000 $ bis über 5 Mio. $ mit Zeitachsen von 6–12 Monaten allein für die Integration. |
| Eigenentwicklung | Das Team für klinische Informatik entwickelt Abgleichregeln oder feintunt Modelle anhand spezifischer Protokolle. | Voller EHR-Zugriff. Keine Bedenken hinsichtlich der Datenweitergabe. | Klinische Informatiker sind rar und teuer. Die Ontologie-Pflege (SNOMED-Aktualisierungen halbjährlich, MedDRA vierteljährlich) erfordert dediziertes Personal. Die meisten Eigenentwicklungen stagnieren beim Schlagwortabgleich mit etwas NLP. |
Jede der oben genannten Plattformen verwendet eine Form des NLP- oder LLM-Abgleichs. Keine implementiert öffentlich neuro-symbolisches Schließen mit SNOMED-CT-Ontologiegraphen für eine deterministische Eignungsbewertung. In dieser Lücke liegt die klinische Präzision.
Jede Fähigkeit adressiert einen spezifischen Fehlermodus in aktuellen Abgleichsystemen. Dies sind keine Produktfunktionen. Es sind maßgeschneiderte Komponenten, die auf Ihr Protokollportfolio, Ihre EHR-Umgebung und Ihre regulatorischen Anforderungen zugeschnitten sind.
Wir entwickeln Abgleichsysteme, bei denen die Eignungsentscheidung berechnet und nicht vorhergesagt wird. Die LLM-Extraktionsschicht wandelt klinische Notizen mithilfe von constrained decoding, das eine SCTID-Ausgabe erzwingt, in SNOMED-CT-Konzept-IDs um. Der Wissensgraph (Neo4j) speichert über 350.000 medizinische Konzepte mit ihren hierarchischen Beziehungen. Der symbolische Reasoner bewertet die Eignung durch das Durchlaufen des Graphen: Ist der Eingriff des Patienten ein Untertyp des ausgeschlossenen Eingriffs? Die Antwort ist deterministisch.
Wir greifen auf SAKT-artiges constrained decoding zurück, wenn klinische Notizen unsauber sind (Intensivnotizen, handschriftliche Transkriptionen), denn das Erzwingen valider SCTIDs zum Generierungszeitpunkt fängt halluzinierte medizinische Entitäten ab, bevor sie in die Schluss-Pipeline gelangen. Bei gut strukturierten EHR-Daten (FHIR-Ressourcen mit kodierten Feldern) umgehen wir das LLM vollständig und bilden direkt auf die Ontologie ab.
Studienprotokolle sind keine booleschen Checklisten. Es sind normative Aussagen mit Verpflichtungen, Erlaubnissen und Verboten, die über Ausnahmeklauseln und zeitliche Bedingungen zusammenwirken. Wir parsen Protokolle in formale deontische Logik und zerlegen „schließe X aus, es sei denn Y innerhalb des Zeitrahmens Z“ in berechenbare Operationen.
Der Parser bewältigt zeitliche Ensemble-Logik für Dauerberechnungen („keine PCI innerhalb von 12 Monaten“), Medikamenten-Interaktionsketten über die Durchquerung von CYP-Enzym-Stoffwechselwegen im Wissensgraphen („jedes Medikament, das mit CYP3A4 interagiert“) und verschachtelte bedingte Logik, die Standard-NLP-Pipelines zu falschen Antworten verflachen. Jedes geparste Kriterium erzeugt eine formale Logikspezifikation, die der Reasoner gegen die Patienten-Phänotypen ausführt.
Patientendaten bleiben innerhalb Ihrer Firewall. Die neuronale Extraktionsschicht läuft als lokal bereitgestelltes klinisches Sprachmodell (feingetunt auf die Notizmuster Ihrer Einrichtung). Der Wissensgraph und der symbolische Reasoner laufen vor Ort. FHIR-R4-Eingabeadapter verbinden sich mit Epic (über App-Orchard-Endpunkte), Oracle Health (Millennium-FHIR-APIs) oder anderen zertifizierten EHR-Systemen.
Wir konzipieren von Tag eins an für die HIPAA-BAA-Konformität: Audit-Protokollierung bei jedem Zugriff auf Patientendaten, Zugriffskontrollen nach dem Prinzip der minimal notwendigen Daten, rollenbasierte Berechtigungen, die auf Ihre IRB-Protokolle abgestimmt sind, und De-Identifizierungsfunktionen für alle aggregierten Daten, die zwischen Systemen bewegt werden müssen. Geschützte Gesundheitsinformationen berühren niemals eine externe API.
Abgleichausgaben, die in einem separaten System leben, sind Abgleichausgaben, die ignoriert werden. Wir entwickeln Konnektoren, die geordnete Patienten-Studien-Übereinstimmungen direkt in Medidata Rave, Veeva Vault CTMS oder Oracle Clinical One einspeisen. Standortkoordinatoren sehen die Ergebnisse in den Tools, die sie bereits nutzen, und nicht in einem weiteren Dashboard, das überprüft werden muss.
Die Ausgabe wird auf das CDISC-SDTM-IE-Domänenformat (Inclusion/Exclusion) abgebildet, sodass Rekrutierungsdaten von Tag eins an für die regulatorische Einreichung strukturiert sind. Keine nachgelagerte Datenbereinigung oder Abstimmung erforderlich. Die Pipeline bewältigt auch die Normalisierung lokaler Laborcodes (LOINC-Mapping), um standortspezifische Referenzbereiche mit protokolldefinierten Schwellenwerten abzugleichen.
SNOMED-CT bildet die Grundlage. Wir bauen die therapeutische Tiefe darauf auf. Für die Onkologie: PD-L1-Expressionsniveaus, abgebildet auf spezifische Assay-Schwellenwerte (22C3 vs. SP263 vs. SP142), BRCA1/2-Variantenklassifikationen (pathogen vs. VUS vs. benigne gemäß ACMG-Richtlinien), EGFR-Mutationssubtypen (Exon-19-Deletion vs. L858R vs. T790M), ALK-Rearrangement-Status, TNM-Staging mit Mapping auf die AJCC 8. Auflage und vorherige Therapieverläufe mit Zuordnung der Therapielinie.
Jede Ontologie wird vor dem Live-Gang anhand von 10–15 realen Protokollen aus Ihrem Studienportfolio validiert. Validierung bedeutet, das System gegen abgeschlossene Studien laufen zu lassen, bei denen die Rekrutierungsergebnisse bekannt sind, und die Übereinstimmung mit dem menschlichen Goldstandard zu messen. Wir pflegen Ontologien, während SNOMED-CT halbjährlich und MedDRA vierteljährlich aktualisiert werden, sodass die Konzeptzuordnungen aktuell bleiben.
Gehen wir eine einzelne Patientenbewertung für eine onkologische Phase-III-Studie durch. Dies ist der Prozess, der für jedes Patienten-Kriterium-Paar abläuft.
Das lokal bereitgestellte klinische LLM liest die unstrukturierten Notizen des Patienten. Eine Ärztin schrieb: „Pt. schloss 4 Zyklen Carboplatin/Pemetrexed ab, letzte Infusion 03/2025. PD-L1 TPS 45 % (22C3). ECOG 1.“ Das Modell extrahiert Entitäten mithilfe von constrained decoding, das valide SNOMED-CT- und LOINC-Ausgaben erzwingt: MedicationAdministration: Carboplatin (SCTID: 386905003), Pemetrexed (SCTID: 409342003). Finding: PD-L1 45 % (LOINC: 85146-3). Finding: ECOG PS 1.
Extrahierte Entitäten werden auf den Wissensgraphen abgebildet. „Carboplatin“ wird dem Zweig der platinbasierten antineoplastischen Wirkstoffe zugeordnet. Der Graph weiß, dass Carboplatin ist-ein Alkylanz, ist-ein Platinverbindung, interagiert-mit CYP2C8. Wenn das Protokoll „vorherige Platintherapie“ ausschließt, bestätigt die Graphdurchquerung, dass Carboplatin zutrifft. Wenn es „vorherige Immuntherapie“ ausschließt, bestätigt der Graph, dass Carboplatin dies nicht tut. Keine Mehrdeutigkeit.
Protokollkriterium: „Keine vorherige systemische Therapie bei fortgeschrittener Erkrankung, es sei denn, eine adjuvante/neoadjuvante Therapie wurde > 12 Monate vor der Randomisierung abgeschlossen.“ Der Parser zerlegt: Prohibition(vorherige systemische Therapie) AUSSER Permission(adjuvant ODER neoadjuvant) UND Temporal(Abschlussdatum + 12 Monate < Randomisierungsdatum). Der Reasoner prüft: Carboplatin/Pemetrexed wurde verabreicht. War es adjuvant? Der Graph prüft das Krankheitsstadium zum Zeitpunkt der Behandlung. War das Intervall ausreichend? Letzte Infusion März 2025, Randomisierung April 2026 = 13 Monate. Ergebnis: GEEIGNET (Ausnahmeklausel erfüllt, zeitliche Bedingung erfüllt).
Das System gibt einen zusammengesetzten Wert aus. Deterministische Kriterien (ontologische Übereinstimmungen, zeitliche Berechnungen) erhalten eine binäre Konfidenz. Mehrdeutige Kriterien (unklare Formulierung in Notizen, fehlende Daten) erhalten einen Wahrscheinlichkeitswert mit Kennzeichnung der spezifischen Mehrdeutigkeit. Die Schlusskette für jedes Kriterium wird gespeichert: welche SCTID abgeglichen wurde, welche Graphdurchquerung durchgeführt wurde, welche Logikoperation das Ergebnis erzeugt hat. Diese Schlusskette fließt direkt in das CDISC-SDTM-IE-Domänenformat und in die CTMS-Ansicht des Koordinators ein.
Wesentliche Unterscheidung zur Plattform-KI:
Zu keinem Zeitpunkt fragt das System ein LLM „ist dieser Patient geeignet?“. Das LLM liest Text. Die Ontologie erschließt die Bedeutung. Die Logik-Engine berechnet die Eignung. Jede Schicht hat eine definierte Aufgabe und eine überprüfbare Ausgabe. Wenn ein Koordinator „geeignet“ oder „ausgeschlossen“ sieht, kann er genau nachvollziehen, warum – bis hinunter zur SNOMED-Konzept-ID und der Graphbeziehung, die das Ergebnis bestimmt hat.
Drei Phasen, insgesamt 14–20 Wochen. Jede Phase hat ein definiertes Ergebnis und einen Entscheidungspunkt, bevor fortgefahren wird.
Phase 1: Wochen 1–4
Entscheidungspunkt: zur Entwicklung übergehen, den Umfang anpassen oder feststellen, dass eine Plattform besser passt. Wir sagen es Ihnen, wenn dem so ist.
Phase 2: Wochen 5–16
Phase 3: Wochen 17–20
Fortlaufend: SNOMED-CT-Aktualisierungen halbjährlich, MedDRA vierteljährlich. Wir übernehmen die Pflege oder übergeben sie mit Dokumentation.
Beantworten Sie sechs Fragen zu Ihren aktuellen Rekrutierungsabläufen. Die Bewertung zeigt auf, wo Ihre Abgleich-Pipeline geeignete Patienten verliert und welche Verbesserungen für Ihre spezifische Situation den höchsten ROI hätten.
1. Wie hoch ist Ihre aktuelle Screening-Fehlschlagsrate über alle aktiven Studien hinweg?
Tempus Patient Query und die Abgleich-Tools von IQVIA verwenden große Sprachmodelle, um klinische Notizen zu lesen und die Relevanz anhand von Studienkriterien zu bewerten. Das funktioniert gut bei einfachen Kriterien, scheitert jedoch bei ontologischen Unterscheidungen. Wenn ein Protokoll eine „Herzkatheteruntersuchung“ ausschließt und eine Patientenakte eine „Anlage eines zentralvenösen Katheters“ erwähnt, sieht ein LLM, das auf Vektorähnlichkeit arbeitet, zwei Katheter-Eingriffe am kardiovaskulären System und markiert eine Übereinstimmung. Ein SNOMED-CT-verankertes System erkennt, dass diese auf völlig unterschiedlichen Zweigen der Eingriffshierarchie liegen (SCTID 41976001 vs. 392230005), und stuft den Patienten korrekt als geeignet ein.
Der praktische Unterschied zeigt sich in den Screening-Fehlschlagsraten. LLM-basierter Abgleich erreicht bei gut strukturierten Kriterien typischerweise 85–94 % Genauigkeit, fällt jedoch bei Protokollen mit komplexen ontologischen Unterscheidungen, zeitlicher Logik oder Ausnahmeklauseln auf 70–80 % ab. Ontologiegestützter Abgleich hält über alle Kriteriumstypen hinweg eine Genauigkeit von über 95 %, weil die Eignungsentscheidung von einem symbolischen Reasoner berechnet und nicht von einem Sprachmodell vorhergesagt wird.
Der andere strukturelle Unterschied ist die Auditierbarkeit. Ein LLM erzeugt einen Relevanzwert. Unser System erzeugt eine Schlusskette: Patient hat SCTID X, Kriterium erfordert nicht-SCTID Y, X ist-kein-Untertyp-von Y gemäß SNOMED-Hierarchie, daher geeignet. Diese Schlusskette ist es, was Regulatory-Affairs-Teams für die Dokumentation der FDA-Einreichung benötigen.
Ja, und das ist ein zentrales Architekturprinzip, kein nachträglicher Gedanke. Die neuro-symbolische Architektur trennt die neuronale Schicht (LLM zur Entitätsextraktion) von der symbolischen Schicht (Wissensgraph und Logiklöser). Beide können vollständig innerhalb Ihrer Firewall laufen.
Die LLM-Extraktionsschicht wird als lokales Modell bereitgestellt, typischerweise ein feingetuntes klinisches Sprachmodell, das auf Ihrer Infrastruktur oder einer sicheren Private-Cloud-Instanz läuft. Sie sendet niemals rohen Patiententext an externe APIs. Der Wissensgraph (Neo4j oder gleichwertig) und die SNOMED-CT-Ontologie liegen vor Ort. FHIR R4 ist der Eingabestandard. Für Epic-Umgebungen entwickeln wir gegen die über App Orchard verfügbaren FHIR-R4-Endpunkte und rufen die Ressourcen Patient, Condition, Procedure und MedicationAdministration ab. Für Oracle Health (Cerner) nutzt die Integration deren Millennium-FHIR-APIs.
Die Extraktionsschicht verarbeitet klinische Notizen lokal, bildet Entitäten auf SCTIDs ab, und der symbolische Reasoner bewertet die Eignung anhand der Protokollkriterien. Geschützte Gesundheitsinformationen verlassen niemals Ihre sichere Umgebung. Wir konzipieren von Tag eins an für die HIPAA-BAA-Konformität, einschließlich Audit-Protokollierung, Zugriffskontrollen nach dem Prinzip der minimal notwendigen Daten und De-Identifizierungsfunktionen für alle Daten, die tatsächlich zwischen Systemen bewegt werden müssen.
Die Architektur funktioniert für jeden Therapiebereich, weil SNOMED-CT über 350.000 medizinische Konzepte abdeckt. Die Variable ist die Ontologietiefe, also wie viele domänenspezifische Zuordnungen, Synonyme und hierarchische Beziehungen für Ihre spezifischen Protokolle vorkonfiguriert sind.
Die Onkologie ist der Bereich, mit dem wir die meisten Mandate beginnen, weil die Kriterien am komplexesten sind: Biomarker-Anforderungen (PD-L1-Expressionsniveaus, BRCA1/2-Mutationsstatus, EGFR-Varianten), Staging-Systeme (TNM, AJCC 8. Auflage), vorherige Therapieverläufe mit zeitlichen Bedingungen und Performance-Status-Werte. Eine produktionsreife Onkologie-Ontologie, die die wichtigsten 50 Biomarker, über 200 Behandlungsschemata und Standard-Staging-Systeme abdeckt, dauert 6–8 Wochen für Entwicklung und Validierung.
Kardiovaskulär und ZNS sind die nächsthäufigsten. Die kardiovaskuläre Ontologie konzentriert sich auf Eingriffshierarchien (die Unterscheidung der Herzkatheteruntersuchung ist nur eine von Dutzenden), Medikamenten-Interaktionsketten über CYP-Enzym-Stoffwechselwege und Laborwertbereiche mit standortspezifischen Referenzanpassungen. Das ZNS fügt die Handhabung subjektiver Endpunkte und das Mapping kognitiver Bewertungswerte hinzu.
Seltene Erkrankungen sind technisch am anspruchsvollsten, weil die SNOMED-Abdeckung bei ultraseltenen Erkrankungen dünn sein kann. Wir ergänzen mit Orphanet-Ontologie-Mappings und entwickeln benutzerdefinierte Konzepterweiterungen, die in den Graphen zurückfließen. Die Einrichtung für einen Therapiebereich für seltene Erkrankungen dauert 8–12 Wochen. Jede Ontologie wird vor dem Live-Gang anhand realer Protokollkriterien aus Ihrem Studienportfolio validiert.
Hier übertrifft deterministische Logik probabilistische Sprachmodelle am deutlichsten. Standard-NLP behandelt Eignungskriterien als zu interpretierenden Text. Wir behandeln sie als zu berechnende formale Logik.
Nehmen Sie ein reales Kriterium: „Schließen Sie Patienten mit Bluthochdruck aus, es sei denn, er ist seit mindestens 3 Monaten unter stabiler Medikation gut eingestellt.“ Ein LLM sieht das Wort „Bluthochdruck“ und muss aus dem Kontext entscheiden, ob ausgeschlossen werden soll. Es trifft dies meistens richtig, aber „meistens“ bedeutet, bei jeder Studie geeignete Patienten zu verlieren.
Unser Parser zerlegt dies in deontische Operatoren. Prohibition: Bluthochdruck vorhanden. Permissions-Bedingung: Bluthochdruck UND eingestellt (Blutdruck unter 140/90 gemäß Protokolldefinition) UND stabile Medikation (gleiches antihypertensives Schema) UND zeitliche Bedingung (Dauer von mindestens 3 Monaten). Das System fragt dann die Medikationshistorie des Patienten aus dem Wissensgraphen ab, identifiziert das Antihypertensivum, prüft das Verordnungsstartdatum, berechnet die Dauerdifferenz gegenüber dem Screening-Datum und verifiziert die Blutdruckmesswerte innerhalb des Beobachtungsfensters. Jeder Schritt erzeugt eine überprüfbare Ausgabe.
Dieselbe Logik bewältigt Ketten wie „keine vorherige Chemotherapie, es sei denn, eine neoadjuvante Therapie wurde vor mehr als 6 Monaten abgeschlossen“, indem sie das Therapieintentionsattribut (neoadjuvant vs. adjuvant vs. palliativ), das Enddatum und die zeitliche Differenz prüft. Dies sind keine Sonderfälle. IQVIA-Daten zeigen, dass Protokolle mittlerweile durchschnittlich über 27 Eignungskriterien umfassen, viele mit verschachtelten Bedingungen. Eine einzige falsch behandelte Ausnahmeklausel pro Protokoll summiert sich über Hunderte gescreenter Patienten zu Dutzenden verlorener Rekrutierungen.
Ein typisches Mandat läuft über drei Phasen in 14–20 Wochen. Phase 1 (3–4 Wochen) ist ein Audit der Rekrutierungsabläufe: Wir analysieren Ihre aktuellen Screening-Fehlschlagsraten, kartieren Ihre EHR-Datenlandschaft, überprüfen 10–15 repräsentative Protokolle aus Ihrem Studienportfolio und identifizieren die spezifischen Kriteriumstypen, die die meisten Falsch-Positiven und verpassten Übereinstimmungen verursachen. Diese Phase liefert ein technisches Architekturdokument und ein ROI-Modell auf Basis Ihrer tatsächlichen Daten.
Phase 2 (8–12 Wochen) ist die Entwicklung: Ontologie-Entwicklung für Ihren priorisierten Therapiebereich, LLM-Feintuning auf Ihre Muster klinischer Notizen, Aufbau des Wissensgraphen, Konfiguration des symbolischen Reasoners und FHIR-Integration mit Ihrer EHR-Umgebung. Phase 3 (3–4 Wochen) ist die Validierung: retrospektive Tests anhand abgeschlossener Studien mit bekannten Rekrutierungsergebnissen, Genauigkeits-Benchmarking und Integration in den Koordinator-Workflow.
Die Kosten hängen vom Umfang ab. Eine Entwicklung für einen einzelnen Therapiebereich mit einer EHR-Integration kostet typischerweise 180.000 $ bis 350.000 $. Multi-therapeutische oder Multi-Site-Bereitstellungen skalieren mit der Breite der Ontologie und der Integrationskomplexität. Zum Vergleich: Die Plattformlizenzen von Tempus und IQVIA kosten 200.000 $ bis über 500.000 $ jährlich, zuzüglich Gebühren pro Patient oder pro Studie.
Der grundlegende wirtschaftliche Unterschied ist das Eigentum. Eine Plattformlizenz ist wiederkehrende Ausgabe mit Anbieterabhängigkeit. Eine Eigenentwicklung ist ein Vermögenswert, den Sie besitzen, pflegen und erweitern. Für Organisationen, die jährlich über 20 Studien durchführen, erreicht die Eigenentwicklung typischerweise innerhalb von 18 Monaten den Break-even gegenüber der Plattformlizenzierung, mit dem zusätzlichen Vorteil einer auf die Komplexität Ihres spezifischen Protokolls abgestimmten Abgleichgenauigkeit.
Die im Januar 2026 aktualisierte Clinical-Decision-Support-Leitlinie der FDA ist hier der relevante Rahmen. Die Schlüsselfrage ist, ob das System autonome klinische Entscheidungen trifft oder die menschliche Entscheidungsfindung unterstützt.
Unsere Architektur ist für die CDS-Ausnahme gemäß Abschnitt 3060 des 21st Century Cures Act konzipiert. Das System erfüllt alle vier Ausnahmekriterien: Es ist nicht dafür bestimmt, medizinische Bilder oder Signale zu erfassen, zu verarbeiten oder zu analysieren; es zeigt die Grundlage für Empfehlungen an (die vollständige Schlusskette); es ist für medizinisches Fachpersonal mit unabhängiger Überprüfungsfähigkeit bestimmt; und es ersetzt nicht das klinische Urteil bei Eignungsentscheidungen.
In der Praxis bedeutet das, dass das System geordnete Patienten-Studien-Übereinstimmungen mit Konfidenzwerten und Schlussketten ausgibt. Ein Standortkoordinator oder klinischer Forschungsassistent überprüft jede Übereinstimmung vor jedem Patientenkontakt. Das System rekrutiert niemals automatisch.
Allerdings verschiebt sich die Auslegung des CDS-Umfangs durch die FDA weiterhin. Wenn Ihre Organisation plant, Abgleichausgaben zu nutzen, um Patienten ohne menschliche Überprüfung automatisch auszuschließen, kann das System in den Geräte-Bereich übergehen, der eine 510(k)-Zulassung oder De-Novo-Klassifizierung erfordert. Wir empfehlen, das Digital Health Center of Excellence der FDA frühzeitig in der Designphase einzubeziehen. Wir erstellen die regulatorische Dokumentation, einschließlich der Begründung der CDS-Ausnahme, der Erklärung der Zweckbestimmung und des klinischen Bewertungsberichts, als Standardergebnis in Phase 1.
Die Forschung hinter dieser Lösungsseite. Für die vollständige technische Architektur, die Begründung des Ontologie-Designs und den Ansatz zur klinischen Validierung.
Vollständige technische Analyse der neuro-symbolischen Architektur, der SNOMED-CT-Integration, des deontischen Logikrahmens und der GraphRAG-Implementierung für den Patientenabgleich in klinischen Studien.
Eine Screening-Fehlschlagsrate von 40 % über 10 Studien bedeutet jährlich rund 480.000 $ an verschwendeten Screening-Kosten, noch bevor die Rekrutierungsverzögerungen eingerechnet werden.
Wir beginnen mit einem 3–4-wöchigen Audit der Rekrutierungsabläufe. Sie erhalten ein Architekturdokument, ein ROI-Modell auf Basis Ihrer tatsächlichen Screening-Fehlschlagsdaten und eine klare Antwort darauf, ob eine Eigenentwicklung für Ihr Studienportfolio sinnvoll ist.