KI-Einstellungs-Compliance · Multi-jurisdiktionale Bias- & Barrierefreiheits-Audits
Stand April 2026 befindet sich jede CHRO oder jeder General Counsel, der AEDTs in New York, Colorado, Illinois, Texas, Kalifornien oder der EU betreibt, in einem regulatorischen Zeitfenster, auf das die meisten ihrer Anbieter nicht ausgelegt waren. Illinois HB 3773 trat am 1. Januar in Kraft. Texas TRAIGA trat am 1. Januar in Kraft. Kaliforniens FEHA-ADS-Änderungen traten letzten Oktober in Kraft. Colorado SB 24-205 tritt am 30. Juni in Kraft. Der EU AI Act stuft Personalbeschaffung ab dem 2. August als hochriskant ein. Der NY State Comptroller hat soeben ein Audit vom Dezember 2025 veröffentlicht, das 17 LL144-Verstöße feststellte, wo das DCWP nur einen gefunden hatte, und das DCWP erklärte sich bereit, auf proaktive Durchsetzung umzustellen. Mobley v. Workday befindet sich im Beweisermittlungsverfahren. Kistler v. Eightfold stellt die Frage, ob KI-Einstellungsplattformen FCRA-Auskunfteien sind. Diese Seite existiert, weil kein einzelner Anbieter auf Ihrer engeren Auswahl all das ehrlich für Sie beantworten kann.
17 vs. 1
LL144-Verstöße, die NY State-Prüfer im Vergleich zum DCWP in derselben Stichprobe von 32 Unternehmen feststellten
NY State Comptroller, 2. Dez. 2025
4,6 %
von 391 NYC-Arbeitgebern hatten ein Bias-Audit veröffentlicht — das Ergebnis der „Null-Compliance“
Cornell / Data & Society / Consumer Reports, FAccT 2024
64 Mio.
Bewerberdatensätze offengelegt, als ein McHire-/Paradox-Administratorkonto das Passwort „123456“ verwendete
Offenlegung durch Carroll & Curry, 30. Juni 2025
Drei dieser Ereignisse sind bereits live. Zwei werden vor Ende des Sommers brisant. Zwei befinden sich in laufenden Gerichtsverfahren. Keines davon wartet auf Ihren jährlichen Compliance-Zyklus.
Arbeitgeber müssen ADS-Eingaben, -Ausgaben, Bias-Testergebnisse und Auswahlkriterien mindestens vier Jahre lang aufbewahren. Die Haftung greift bei diskriminierenden Beschäftigungspraktiken, die durch ein ADS verursacht werden, ob vorsätzlich oder nicht. Gilt für jeden Arbeitgeber, der in Kalifornien einstellt, unabhängig vom Standort des Hauptsitzes.
Verbietet den Einsatz von KI, die eine diskriminierende Wirkung auf Personalbeschaffung, Einstellung, Beförderung, Disziplinarmaßnahmen oder Entlassung hat. Verbietet ausdrücklich Postleitzahlen als Proxys für geschützte Gruppen. Eine Benachrichtigung ist erforderlich, sobald KI eingesetzt wird, um eine Beschäftigungsentscheidung zu „beeinflussen oder zu erleichtern“. Durchgesetzt vom Illinois Department of Human Rights, das Ende 2025 einen Entwurf von Benachrichtigungsvorschriften veröffentlicht hat.
Verbietet vorsätzliche Diskriminierung durch KI. Texas lehnte Disparate Impact ausdrücklich als eigenständige Theorie ab und weicht damit von den LL144- und Colorado-Rahmenwerken ab. Wird ausschließlich vom Texas Attorney General durchgesetzt. Verstöße erhalten eine Benachrichtigung und eine 60-tägige Heilungsfrist; die Strafen reichen von $12.000 für heilbare Verstöße bis zu $200.000 für unheilbare.
Staatliche Prüfer fanden 17 potenzielle LL144-Verstöße in derselben Stichprobe von 32 Unternehmen, in der das DCWP nur einen gefunden hatte. 75 % von 311 AEDT-Beschwerdeanrufen wurden falsch weitergeleitet. Das DCWP räumte ein, dass ihm die technische Expertise zur Bewertung von AEDTs fehlte, und erklärte sich bereit, eine proaktive Durchsetzung einzuführen. Die Strafstruktur bleibt unverändert: bis zu $1.500 pro Tag und Verstoß. „Null-Compliance“ — die Selbsteinstufung Ihres Tools als außerhalb des Anwendungsbereichs — ist in New York City keine vertretbare Haltung mehr.
Richterin Rita F. Lin wies Workdays Antrag auf Klageabweisung zurück und stellte fest, dass ein KI-Einstellungsanbieter direkt als „Agent“ von Arbeitgebern haftbar sein kann, wenn sein Tool durch das Empfehlen oder Filtern von Kandidaten an der Entscheidungsfindung teilnimmt. Die vorläufige Sammelzertifizierung wurde am 16. Mai 2025 gewährt; das Opt-in-Fenster für Bewerber über 40 schloss am 7. März 2026. Das Gericht ordnete Workday daraufhin an, eine vollständige Liste der Arbeitgeber vorzulegen, die HiredScore Spotlight und Fetch aktiviert hatten, und wies Workdays Versuch zurück, die nach der Übernahme erworbenen Produkte aus der Sammelklage auszuschließen.
Erster Test, ob KI-Einstellungsplattformen FCRA-„Auskunfteien“ sind. Die Kläger behaupten, Eightfold habe Daten von LinkedIn, GitHub, Stack Overflow und öffentlichen Datenbanken abgegriffen, Kandidatendossiers aus „mehr als 1,5 Milliarden globalen Datenpunkten“ erstellt und einen Erfolgswahrscheinlichkeits-Score von 0–5 erzeugt, ohne Zertifizierung, Benachrichtigung, Offenlegung, Autorisierung oder Widerspruchsverfahren für die Kandidaten. Sollte das Gericht entscheiden, dass Eightfold eine CRA ist, schuldet jede vergleichbare Plattform jedem bewerteten Kandidaten eine Adverse-Action-Benachrichtigung und einen Widerspruchsprozess. Die gesetzlichen Schadensersatzbeträge nach dem FCRA betragen $100–$1.000 pro Verbraucher und Verstoß.
Gouverneur Polis unterzeichnete am 28. August 2025 das Verschiebungsgesetz und verlegte das Inkrafttreten vom 1. Februar auf den 30. Juni 2026. Betreiber müssen ein Risikomanagementprogramm einführen, erstmalige und jährliche Folgenabschätzungen durchführen, Verbraucherbenachrichtigungen vor der Entscheidung und bei nachteiligen Entscheidungen herausgeben und Offenlegungen auf der Website veröffentlichen. Der Colorado Attorney General hat die ausschließliche Durchsetzungsbefugnis. Die widerlegbare Vermutung als Verteidigung erfordert dokumentierte angemessene Sorgfalt.
Personalbeschaffung, Screening, Stellenanzeigen-Targeting, Bewerbungsfilterung und Kandidatenbewertung fallen alle unter die Hochrisiko-Einstufung des Anhangs III. Bis zum 2. August 2026 müssen Anbieter Konformitätsbewertungen abschließen, technische Dokumentation veröffentlichen (Art. 11 / Anhang IV), ein Daten-Governance-Programm implementieren (Art. 10), menschliche Aufsicht gewährleisten (Art. 14), sich in der EU-Datenbank registrieren und die CE-Kennzeichnung anbringen. Die Strafen erreichen 35 Mio. € oder 7 % des weltweiten Jahresumsatzes bei Verstößen gegen verbotene Praktiken, 15 Mio. € oder 3 % bei Hochrisiko-Pflichten. Der Vorschlag eines Digital Omnibus von Ende 2025 könnte Anhang III auf Dezember 2027 verschieben, aber diese Verlängerung wurde nicht erlassen, und eine vorsichtige Compliance behandelt den 2. August als verbindlich.
Die nachstehende Tabelle ist kein Einkaufsratgeber. Sie ist eine Landkarte dessen, wo jede Plattform im Verhältnis zum aktuellen Rechtsregime steht und was das für eine CHRO bedeutet, die 2026 einen Vertrag verlängern oder ersetzen muss. Wir sind anbieterneutral und haben keine Geschäftsbeziehung zu einem der hier aufgeführten Unternehmen.
| Anbieter / Produkt | Aktuelle regulatorische Haltung | Die ehrliche Lücke, die der CHRO trägt |
|---|---|---|
| Workday + HiredScore (Spotlight, Fetch) | Veröffentlichte eine Drittanalyse von Secretariat; liefert LL144-Audit-Konfigurationen; verteidigt sich aktiv in Mobley | Richterin Lin wies Workdays Versuch zurück, HiredScore aus der Sammelklage auszuschließen. Wenn ein Kunde Spotlight während des Klassenzeitraums eingesetzt hat, steht der Name dieses Kunden auf der vom Gericht angeordneten Liste. |
| Eightfold AI (Match) | Veröffentlicht Bias-Audit-Dokumentation; zu den Unternehmenskunden zählen Microsoft, Morgan Stanley | Benannter Beklagter in Kistler. Sollte die FCRA-Theorie Bestand haben, könnte jeder Kunde, der Match-Scoring verwendet hat, Kandidaten rückwirkend Adverse-Action-Benachrichtigungen schulden. |
| HireVue | Stellte die Gesichtskodierungs-Analyse im Januar 2021 ein; wechselte zu strukturierten Text- und Video-Assessments | Benannt in der ACLU-Beschwerde vom März 2025 (D.K. v. Intuit/HireVue) auf Grundlage des ADA, Title VII und des Colorado Anti-Discrimination Act. HireVues CEO bestreitet, dass eine KI-Bewertung eingesetzt wurde; die ASR-Pipeline selbst unterliegt nach wie vor dem in der Barrierefreiheitsforschung dokumentierten Problem der abweichenden WER. |
| Paradox (Olivia) | Keine spezifische Compliance-Differenzierung; reaktives Patchen | Legte im Juni 2025 64 Mio. Datensätze offen, weil ein Administrator-Testkonto von 2019 123456 als Passwort verwendete. Die Ursache war die Konfiguration, nicht ML. Ihr DPO und CISO müssen bei jedem Verlängerungsgespräch dabei sein. |
| Pymetrics / Harver | Spielbasiertes Assessment mit öffentlicher Bias-Audit-Historie | Unterliegt nach wie vor der ADA-Theorie in der Aon/Cangrade-FTC-Beschwerde der ACLU: Instrumente zur Messung von Persönlichkeitsmerkmalen, die klinische Diagnosekriterien widerspiegeln, fungieren als Behinderungs-Screenings. |
| iCIMS, Greenhouse, Lever, SmartRecruiters, Ashby | ATS-Schicht — manche exportieren LL144-Bias-Berichte; in der Regel keine benannten Beklagten | Das ATS ist ein Data Warehouse, für sich genommen kein AEDT. Die Compliance-Frage liegt bei dem jeweiligen Scoring- oder Ranking-Plugin, das Ihre Recruiter aktiviert haben und das der ATS-Anbieter nicht für Sie auditiert. |
| FairNow, Holistic AI, Credo AI, Warden AI, Fairly AI | Governance-Plattformen und Audit-Tools; einige LL144-spezialisiert | Eine Plattform sagt Ihnen, wie Ihre Metriken aussehen. Sie ersetzt nicht die Anbieter-Due-Diligence, sie auditiert die Barrierefreiheit nicht getrennt vom Adverse Impact und sie versöhnt keine widersprüchlichen Regime. Am nützlichsten als Dashboard, nachdem die Strategie festgelegt ist. |
| DCI Consulting, ORCAA, Secretariat | Rechtlich anerkannte unabhängige LL144-Prüfer; etwa $50.000–$200.000 pro System und Jahr | Goldstandard für die jährliche Momentaufnahme, die LL144 verlangt. Nicht kontinuierlich, nicht rechtsraumübergreifend und nicht dafür konzipiert, Ihre AEDT-Architektur neu zu schreiben. |
| Deloitte, KPMG, EY, PwC KI-Praxisbereiche | Beratungssparten mit arbeitsrechtlichen Beziehungen und Audit-Glaubwürdigkeit | Mandate beginnen typischerweise bei $500.000 und reichen bis $2 Mio.+. Stark bei Governance-Ergebnissen, schwach beim Liefern von funktionierendem Code. Gute Antwort für ein Fortune-50-Unternehmen mit unbegrenztem Budget, falsche Antwort für eine CHRO im Mittelstand, die in einem Quartal compliant werden muss. |
Die ehrliche Antwort lautet: Deloitte, KPMG, EY und PwC sind die richtige Wahl, wenn Sie einen vorstandsreifen Governance-Bericht benötigen und es Ihnen egal ist, welche Zahl auf der Rechnung steht. Ihre Methodik ist solide, ihre Marke schützt Sie politisch und ihre regulatorischen Beziehungen sind real. Sie sind die falsche Wahl, wenn das zugrunde liegende Problem ein neuronales Netz ist, das pro Quartal 0–5-Scores für 2 Mio. Kandidaten erzeugt, Ihre Frist in zwölf Wochen abläuft und Sie jemanden brauchen, der sich mit Ihrem ML-Team zusammensetzt und Feature-Engineering-Pipelines neu schreibt. Große Firmen vergeben diese Arbeit als Unterauftrag; kleine Spezialfirmen erledigen sie direkt. Wir berechnen einen Bruchteil dessen, was ein Big-4-Audit-Mandat kostet, weil wir keinen Büroturm finanzieren, und wir liefern funktionierenden Code statt eines 200-seitigen Foliensatzes. Wenn Sie den Foliensatz brauchen, beauftragen Sie die Big 4. Wenn Sie den Code brauchen, lesen Sie weiter.
Ein Bias-Audit, das NYC LL144 erfüllt, erfüllt Colorado nicht. Ein Audit, das Colorado erfüllt, erfüllt den EU AI Act nicht. Manche Anforderungen sind technisch unvereinbar. Das ist kein Konstruktionsfehler, den der Markt korrigieren wird — es ist das rechtliche Umfeld, in das Sie sich einkaufen.
LL144 verlangt intersektionale Impact-Ratios, berechnet über Rasse × Geschlecht für jede Auswahlstufe. Der Standard der „angemessenen Sorgfalt“ in Colorados SB 24-205 schreibt keine Methodik vor, und der Illinois Human Rights Act konzentriert sich auf die diskriminierende Wirkung, ohne einen statistischen Test vorzuschreiben. Ein einziges universelles Audit erzeugt Ergebnisse, die für LL144 zu grob und zu detailliert sind, um als die Colorado-spezifische Folgenabschätzung anerkannt zu werden. Jeder Rechtsraum erhält ein anders geformtes Ergebnis oder jeder scheitert nach seinen eigenen Maßstäben.
Illinois HB 3773 verbietet ausdrücklich die Verwendung von Postleitzahlen als Proxys für geschützte Gruppen. Artikel 10(3) des EU AI Act verlangt, dass Trainingsdaten „relevant, repräsentativ und im bestmöglichen Umfang fehlerfrei und vollständig“ sind — was typischerweise bedeutet, geografische Merkmale einzubeziehen, um regionale Abdeckungslücken zu vermeiden. Entfernen Sie Postleitzahlen, scheitern Sie am EU-Repräsentativitäts-Audit; behalten Sie sie, verstoßen Sie gegen Illinois. Die praktische Antwort ist ein explizites Wohnsitz-Merkmal mit gröberer geografischer Granularität für EU-Trainingsdaten und eine vollständige geografische Maskierung für die Illinois-Inferenz — was zwei Deployment-Konfigurationen desselben Modells erfordert, nicht eine.
Nach LL144 bestimmt der Arbeitgeber selbst, ob ein Tool eine Einstellungsentscheidung „wesentlich unterstützt“. Nach Mobley haftet der Anbieter direkt, wenn sein Tool Kandidaten empfiehlt oder filtert, unabhängig davon, was der Arbeitgeber behauptet. Ein Selbsteinstufungs-Memo von 2024, das besagt „unser Workday-Spotlight-Deployment ist kein AEDT“, ist jetzt Beweisstück A der Kläger. Die einzige vertretbare Haltung besteht darin, jedes Scoring-, Ranking-, Filter- oder Routing-Tool als im Anwendungsbereich zu behandeln und entsprechend zu dokumentieren.
Texas TRAIGA ist das erste Bundesstaatsgesetz, das Disparate Impact ausdrücklich als eigenständige Grundlage für die KI-Einstellungshaftung ablehnt. Das bedeutet nicht, dass texanische Arbeitgeber sicher sind — bundesrechtliche Title-VII-Ansprüche und Ansprüche nach dem Texas Commission on Human Rights Act gelten weiterhin —, aber es bedeutet, dass das TRAIGA-Compliance-Ergebnis vorsatzfokussiert statt statistikfokussiert ist. Eine bundesrechtliche Title-VII-Adverse-Impact-Analyse, ein LL144-Vier-Fünftel-Bericht und eine TRAIGA-Vorsatzbewertung sind drei getrennte Mandate mit drei getrennten Beweismaßstäben.
Kistler v. Eightfold ist kein Adverse-Impact-Fall. Der FCRA-Rahmen fragt, ob die Plattform als Auskunftei fungiert, unabhängig davon, ob ihre Scores fair sind. Eine vollkommen unvoreingenommene Plattform kann dennoch jedem bewerteten Kandidaten eine Pre-Adverse-Action-Benachrichtigung, eine Kopie des „Berichts“ und einen Widerspruchsweg schulden. Bias-Audits erzeugen keines dieser Artefakte. Ein Käufer, der nur für LL144- und Colorado-Compliance optimiert, kann dennoch Beklagter einer Sammelklage sein, weil die FCRA-Frage nie gestellt wurde.
LL144 verlangt keine Behinderungs-Impact-Tests. Colorado verlangt sie nach dem allgemeinen Standard der „angemessenen Sorgfalt“, schreibt aber keine Methodik vor. Die ACLU-Beschwerde im Namen einer indigenen gehörlosen Beschäftigten (D.K. v. Intuit / HireVue) argumentiert, dass ASR-gesteuerte Videointerviews Menschen, deren Sprachmuster in den Trainingsdaten unterrepräsentiert waren, in unverhältnismäßiger Weise benachteiligen. Das zugrunde liegende technische Problem ist messbar: Veröffentlichte Forschung zeigt, dass Whispers mehrsprachige durchschnittliche WER etwa dreimal so hoch ist wie seine englische WER, und das Siegerteam der 2025 Interspeech Speech Accessibility Project Challenge erreichte eine WER von 8,11 % bei beeinträchtigter Sprache — immer noch ein Vielfaches der Standard-Benchmarks. Bias-Audits, die nur Rasse und Geschlecht verfolgen, werden dies nicht aufdecken, und ein Unternehmen, das LL144 besteht, kann dennoch mit einer ADA-Beschwerde konfrontiert werden.
Die Paradox-/McHire-Datenpanne legte 64 Mio. Kandidatendatensätze offen, weil ein Administrator-Testkonto von 2019 noch aktiv war, mit 123456 als Benutzername und Passwort, ohne MFA und mit einem IDOR in einer internen API. Nichts davon hatte etwas mit ML zu tun. All das liegt nun beim CHRO, denn Kandidatendaten, die über ein Einstellungstool offengelegt werden, sind nach wie vor Einstellungsdaten, die der DSGVO-Meldepflicht bei Datenpannen, dem CCPA-Klagerecht von Privatpersonen und dem Verlust der Rechtsgrundlage für die weitere Verarbeitung unterliegen. Die Anbieter-Due-Diligence für KI-Einstellungstools muss Anmeldedaten-Hygiene, API-Autorisierungsgrenzen und Standardpasswort-Audits abdecken — was nicht das ist, was Ihnen ein Standard-SOC-2-Schreiben mitteilt.
Dies sind Beratungsmandate, keine Produkte. Jedes einzelne ist maßgeschneidert. Was uns nützlich macht, ist, dass wir Code schreiben und wir an Ihren Anbietermeetings teilnehmen. Wir sind anbieterneutral: Wir verkaufen keine HR-Tech weiter und wir sagen Ihnen, wenn Ihr Workday- oder Eightfold-Deployment so, wie es ist, vertretbar ist.
Wir erfassen jedes Tool, das eine Einstellungsentscheidung berührt — ATS-Plugins, Scoring-Engines, Terminplanungs-Bots, Video-Interviewer, Referenzprüfungs-APIs, Hintergrundprüfungs-Integrationen, die native KI von LinkedIn Recruiter, alles, was Kandidaten hervorhebt oder verbirgt. Für jedes Tool klassifizieren wir es anhand der LL144-Definition der „wesentlichen Unterstützung“, der Colorado-Unterscheidung zwischen Betreiber/Entwickler, des Illinois-Tests „beeinflussen oder erleichtern“, des reinen Texas-Vorsatztests und der EU-Anhang-III-Hochrisiko-Einstufung. Das Ergebnis ist ein AEDT-Register, das einer Aufsichtsbehörden-Untersuchung standhält, und eine Anbieterliste, die der Rechtsabteilung sagt, welche Verträge geändert werden müssen.
Ergebnis: AEDT-Register, jurisdiktionelle Risikomatrix, Liste der zu ändernden Anbieterverträge, priorisierte Warteschlange für Abhilfemaßnahmen.
Wir führen die vollständige Vier-Fünftel-Analyse auf der intersektionalen Ebene durch, die LL144 verlangt, berechnen die Colorado-Folgenabschätzung zur „angemessenen Sorgfalt“ in dem Format, zu dem sich die Entwurfsvorschriften des CO AG hinbewegen, erzeugen die Illinois-Benachrichtigungsartefakte und erstellen die Daten-Governance-Dokumentation nach Artikel 10 des EU AI Act. Wo Regime kollidieren, schreiben wir ein Memo, das genau sagt, wo und warum, und wir geben die rechtsstrategische Empfehlung ab (für welches Regime Sie optimieren, bei welchem Sie das Risiko akzeptieren, wie groß das Risiko tatsächlich ist). Wir sind kein unabhängiger Prüfer nach LL144 — diese Rolle gehört DCI, ORCAA oder Secretariat —, aber wir bringen Ihr System in den Zustand, in dem das unabhängige Audit nichts Berichtenswertes findet.
Ergebnis: LL144-Intersektionalbericht, Colorado-Folgenabschätzung, Illinois-Benachrichtigungsvorlage, EU-Art.-10/11-Dokumentationspaket, Konflikt-Memo.
Wir behandeln dies als eigene Disziplin, weil kein Bias-Audit-Rahmenwerk sie abdeckt. Wir benchmarken Ihre Videointerview-ASR-Pipeline gegen das Korpus des Speech Accessibility Project und veröffentlichte WER-Disparitäten für gehörlose, schwerhörige und akzentbehaftete Sprecher. Wir bewerten Persönlichkeitsinstrumente anhand der Aon-Theorie der ACLU: Wenn die Fragen klinische Diagnosekriterien widerspiegeln, fungieren sie nach dem ADA als Behinderungs-Screening. Wir entwerfen den Human-in-the-Loop-Eskalationspfad für Kandidaten, die einen Anpassungsbedarf offenlegen, einschließlich eines CART-Anbieter-SLA, das Kandidaten nicht 72 Stunden warten lässt. Hier beginnt eine ACLU-Beschwerde oder eine DOJ-ADA-Untersuchung, daher dokumentieren wir es nach dem Beweismaßstab, den diese Verfahren verlangen.
Ergebnis: ASR-WER-Disparitätsbericht, ADA-Überprüfung von Persönlichkeitsinstrumenten, Spezifikation des Anpassungs-Workflows, CART-Anbieter-SLA-Vorlage.
Wir beurteilen, ob Ihre KI-Einstellungsanbieter dem Sachverhaltsmuster entsprechen, das die Kistler-Kläger verfolgen: Abgreifen von Drittdaten, Erstellen von Kandidatenprofilen, Erzeugen numerischer Scores und Verwenden dieser Scores zum Filtern. Wo das Muster zutrifft, bauen wir die FCRA-Adverse-Action-Benachrichtigungs-Pipeline, den kandidatenseitigen Widerspruchs-Workflow, das Datenherkunfts-Protokoll, das zeigt, welche Informationen in einen Score eingeflossen sind, und die Widerspruchsbearbeitungs-Zeitleiste, die Ihr GC vor Gericht verteidigen kann. Sollte das Gericht in Kistler entscheiden, dass Eightfold eine CRA ist, sind Sie ab Tag eins bereit. Falls nicht, haben Sie eine Kandidatenerfahrung, für die Ihr DEI-Team Ihnen ohnehin danken wird.
Ergebnis: FCRA-Anwendbarkeits-Memo, Adverse-Action-Benachrichtigungsvorlagen, Spezifikation des Kandidaten-Widerspruchsportals, Architektur der Datenherkunfts-Protokollierung.
Nach McHire reicht ein SOC-2-Schreiben nicht aus. Wir führen eine KI-bewusste Sicherheitsüberprüfung bei jedem HR-Tech-Anbieter in Ihrem Stack durch: Standard-Anmeldedaten, MFA-Durchsetzung bei Administratorkonten, API-Autorisierungsgrenzen (insbesondere IDOR-Klassen-Bugs wie der, der 64 Mio. Datensätze offenlegte), Aufbewahrung von Kandidaten-Chat-Transkripten, Prompt-Injection-Härtung bei dialogorientierten Schnittstellen und Datenresidenz für die DSGVO-Rechtsgrundlagen-Analyse. Das Ergebnis ist ein Anbieter-Risiko-Memo, das der CISO mitzeichnen kann, und ein vertraglicher Zusatz, den Ihr Beschaffungsteam an jede Verlängerung anhängen kann.
Ergebnis: Anbieter-Risiko-Memo, IDOR-/Autorisierungsgrenzen-Testergebnisse, vertraglicher Sicherheitszusatz, DPIA-Aktualisierung für die DSGVO.
Wenn das Audit ein Tool aufdeckt, das ohne Änderung des Modells nicht compliant gemacht werden kann, haben wir zwei Optionen. Option eins: Ersetzen Sie es durch eine Glass-Box-Architektur, die wir bauen — ein Knowledge-Graph-Skill-Matcher oder eine constraint-durchgesetzte symbolische Regel-Engine, in der jede Entscheidung auf einen auditierbaren Knoten statt auf ein Gleitkomma-Gewicht zurückführbar ist. Option zwei: Legen Sie ein Compliance-Overlay über den bestehenden Anbieter, das Scores abfängt, rechtsraumspezifische Anpassungen anwendet und einen unabhängigen Prüfpfad erzeugt, der dem Beweisermittlungsverfahren standhält. Wir fangen nicht bei null an, es sei denn, die Alternative ist wirklich schlechter; meistens löst ein schmales Overlay das Problem.
Ergebnis: Memo zu Abhilfeoptionen, Prototyp- oder Overlay-Code, Integrationsspezifikation für das bestehende ATS.
Wir verkaufen keine Retainer. Jede der untenstehenden Phasen ist ihre eigene Leistungsbeschreibung mit ihrem eigenen Ergebnis. Manche Kunden hören nach Phase 1 auf und fühlen sich gut dabei; andere fahren bis zur architektonischen Abhilfe fort. Keine Phase hängt davon ab, sich für die nächste zu verpflichten.
Wir begleiten einen vollständigen Einstellungszyklus, erfassen jedes AEDT, kartieren Ihre operativen Rechtsräume und erstellen ein Risiko-Memo, das sagt, welche Regime gelten und wo Sie derzeit nicht compliant sind. Arbeitssitzungen mit HR, Recht, Beschaffung und IT-Sicherheit. Festpreis. Endzustand: Ihr GC kann mit einer nummerierten Liste in eine Vorstandssitzung gehen.
Die eigentliche statistische Arbeit. Intersektionale Adverse-Impact-Tabellen, Colorado-Folgenabschätzung, Illinois-Benachrichtigungsartefakte, EU-Art.-10/11-Dokumentation, FCRA-Anwendbarkeits-Memo, ASR-WER-Benchmarks. Wir erstellen das Pre-Audit-Paket, das der von Ihnen gewählte unabhängige LL144-Prüfer (DCI, ORCAA, Secretariat) ohne Neuschreiben akzeptieren wird. Wir identifizieren unvereinbare Konflikte und schreiben das rechtsstrategische Memo, das der Führung sagt, welche Risiken sie wissentlich akzeptiert.
Für jeden benannten Anbieter führen wir eine KI-bewusste Sicherheitsüberprüfung durch, prüfen DPAs anhand der sieben Kollisionszonen und entwerfen die Vertragszusätze, die Ihr Beschaffungsteam bei der Verlängerung anhängen wird. Für Workday-/HiredScore-Kunden prüfen wir gezielt das Mobley Risiko und dokumentieren, wo Ihr Deployment vom Sachverhaltsmuster abweicht. Für Eightfold-Kunden kennzeichnen wir das Kistler-Risiko und empfehlen vorläufige Abhilfemaßnahmen.
Nur bei Bedarf. Ein Overlay, das Scores abfängt, bevor sie auf einem Recruiter-Bildschirm landen, ein kandidatenseitiges Widerspruchsportal, das in Ihr ATS integriert ist, ein Knowledge-Graph-Skill-Matcher für die eine Rollenfamilie, bei der der bestehende Anbieter nicht bestehen kann. Wir bauen, wir übergeben den Code, wir dokumentieren ihn für Ihr Engineering-Team. Typisches Mandat: ein bis drei Quartale.
Wir helfen Ihnen, eine laufende Überwachung auf einer Governance-Plattform aufzubauen, die Sie bereits besitzen oder gewählt haben (FairNow, Holistic AI, Credo AI sind alle hierfür geeignet; wir verkaufen keine davon weiter). Wir schulen Ihr internes Team darin, wie die Dashboards in der Sprache zu interpretieren sind, die jede Aufsichtsbehörde verwendet. Dann ziehen wir uns zurück.
Zu Zeitplänen und Ehrlichkeit: Ein Unternehmen, das dies seit 2024 nicht angefasst hat, kann bis zum 2. August 2026 nicht über alle sechs Regime hinweg vollständig compliant sein. Wir sagen Ihnen genau, welche Risiken bestehen bleiben, schreiben das Memo und helfen Ihnen, eine informierte rechtsstrategische Entscheidung darüber zu treffen, was Sie akzeptieren. Die Alternative — eine vollständige Abdeckung bis zu einem Datum zu behaupten, das nie erreichbar war — schafft genau jenes „bösgläubige“ Protokoll, nach dem Aufsichtsbehörden und Kläger suchen.
Geben Sie ein, wo Sie einstellen und was Sie verwenden. Das Tool berechnet, welche Regime gelten, welche Ihrer Anbieter laufende Rechtsstreitigkeiten oder regulatorische Risiken haben und welche Prioritätenreihenfolge für Abhilfemaßnahmen gilt. Es wird nichts versendet — dies läuft vollständig in Ihrem Browser. Nutzen Sie das Ergebnis in Ihrem nächsten Compliance-Meeting, ob Sie uns beauftragen oder nicht.
Formuliert so, wie Kunden sie beim ersten Gespräch tatsächlich formulieren, nicht für die Website geglättet.
Keine separaten Audits, aber separate Ergebnisse, abgeleitet aus einem gut konzipierten Audit. Die zugrunde liegende statistische Arbeit — Adverse-Impact-Ratios, intersektionale Analyse, Feature-Attributionen — ist gemeinsam. Die Formatierung und was berechnet wird, ist es nicht. LL144 verlangt intersektionale Rasse-mal-Geschlecht-Impact-Ratios und eine öffentlich veröffentlichte Zusammenfassung in einem bestimmten Format. Colorado will eine dokumentierte Folgenabschätzung als Teil eines Risikomanagementprogramms, ohne explizite Vier-Fünftel-Anforderung. Illinois benötigt ein Benachrichtigungsartefakt und eine Proxy-Variablen-Dokumentation. Die EU will Art.-10-Daten-Governance-Aufzeichnungen und Art.-11-technische Dokumentation, was viel tiefer geht als jedes US-Rahmenwerk. Ein einzelner Prüfer, der ein „universelles“ LL144-Audit durchführt und es für Colorado für gut befindet, gibt Ihnen etwas, das eine Aufsichtsbehörde ablehnen wird. Ein einziges Audit-Mandat erzeugt vier oder fünf unterschiedlich geformte Ergebnisse, wenn es richtig konzipiert ist. Wir konzipieren Mandate auf diese Weise; die meisten Allzweck-Audit-Anbieter tun das nicht.
Sie könnten es sein oder auch nicht. Die Sammelklage, die im Mai 2025 die vorläufige Zertifizierung erhielt, umfasst Stellenbewerber ab 40 Jahren, die von einem Workday-Kunden mithilfe von Workdays Tools aussortiert wurden. Richterin Lin wies daraufhin Workdays Versuch zurück, HiredScore Spotlight und Fetch aus der Sammelklage auszuschließen, obwohl diese Produkte nach der Klage erworben wurden, und ordnete Workday an, eine vollständige Liste der Arbeitgeber vorzulegen, die HiredScore-Funktionen aktiviert hatten. Das Opt-in-Fenster für Bewerber über 40 schloss am 7. März 2026, was bedeutet, dass das Beweisermittlungsverfahren nun mit identifizierten Klassenmitgliedern fortschreitet. Ihre unmittelbaren Maßnahmen sind: Ziehen Sie Ihre HiredScore-Deployment-Historie mit Datumsangaben heran, identifizieren Sie die Rollen und Regionen, in denen Spotlight oder Fetch Kandidaten gefiltert haben, bewahren Sie alle bewerberbezogenen Daten aus diesem Zeitraum auf und dokumentieren Sie den menschlichen Prüfungs-Checkpoint, falls es einen gab. Eine Verteidigung nach dem Motto „der Anbieter hat sich darum gekümmert“ ist genau das, was Richterin Lins „Agent“-Urteil aushebeln sollte. Je früher Ihr GC ein Sachverhalts-Memo hat, desto besser Ihre Position, wenn die Anwälte der Kläger sich melden.
Unabhängige, nach LL144 anerkannte Prüfer — in erster Linie DCI Consulting, ORCAA, Secretariat und eine Handvoll kleinerer Firmen — berechnen typischerweise $50.000 bis $200.000 pro AEDT und Jahr, abhängig von Datenvolumen, demografischer Verfügbarkeit und Komplexität des Auswahl-Workflows. Die Durchlaufzeit von der Datenbereitschaft bis zum unterzeichneten Audit beträgt 15 bis 20 Werktage, sobald der Prüfer alles hat, was er braucht. Die Phase „bis zur Datenbereitschaft“ ist es, in der die meiste Zeit verschwindet, und es ist das, was wir tun: Datenpipeline, Wahl der Methode zur demografischen Imputation, intersektionale Gruppierung, Berechnung der Auswahlrate, Artefakt-Formatierung. Ein Prüfer, der von uns ein sauberes Pre-Audit-Paket erhält, kann in den angegebenen 15–20 Tagen abzeichnen; ein Prüfer, der Ihre Daten selbst bereinigen muss, berechnet das obere Ende der Spanne und braucht länger. Wir sind kein unabhängiger Prüfer — wir können das endgültige LL144-Ergebnis bewusst nicht unterzeichnen —, aber wir sind der Grund, warum das Audit, das Ihr unabhängiger Prüfer unterzeichnet, sauber ist.
Nein. Der EU AI Act ist das anspruchsvollste Regime in Bezug auf Dokumentation, Daten-Governance und menschliche Aufsicht, aber er verlangt nicht die spezifischen intersektionalen Adverse-Impact-Ratios, die LL144 fordert, und er erzeugt nicht das Colorado-Folgenabschätzungs-Format, das die Entwurfsvorschriften des CO AG vorsehen. EU-Compliance ist notwendig, aber nicht hinreichend für die Compliance in den US-Bundesstaaten. Umgekehrt bringt Sie LL144-Compliance nicht in die Reichweite der EU-Messlatte — LL144 ist im Wesentlichen ein schmales statistisches Audit und eine veröffentlichte Zusammenfassung, während der EU AI Act ein vollständiges Qualitätsmanagementsystem (Art. 17), eine Konformitätsbewertung, ein technisches Dokumentationsdossier, eine Überwachung nach dem Inverkehrbringen und eine CE-Kennzeichnung verlangt. Wenn Ihr Fußabdruck sowohl in den USA als auch in der EU liegt, planen Sie zwei Arbeitsstränge. Die Konfliktzonen, in denen die Anforderung des einen Regimes die eines anderen verletzt (Postleitzahl ist das klarste Beispiel), sind real und erfordern eine rechtsstrategische Entscheidung, keine technische.
Sie verteidigen sich dagegen mit einer separaten ADA-Pipeline-Überprüfung, die die meisten Bias-Audit-Anbieter nicht anbieten, weil es eine andere Rechtstheorie und eine andere Beweisgrundlage ist. Für Videointerview-Tools bedeutet das, Ihre ASR-Komponente gegen das Korpus des Speech Accessibility Project und ähnliche Testsätze für gehörlose, schwerhörige und akzentbehaftete englische Sprecher zu benchmarken. Die veröffentlichten Disparitäten sind groß: Das Siegerteam der SAP Challenge 2025 erreichte eine WER von 8,11 % bei beeinträchtigter Sprache, was immer noch ein mehrfaches der Benchmark-WER für Standardenglisch ist, und Whispers mehrsprachige Leistung ist im Durchschnitt etwa 3-mal schlechter als seine englische Leistung. Bei Persönlichkeits- und spielbasierten Assessments ist die Frage, ob das Instrument klinische Diagnosekriterien widerspiegelt — die Theorie in der Aon-FTC-Beschwerde der ACLU. Für die Kandidatenerfahrung brauchen Sie einen Anpassungs-Workflow, der einen gehörlosen Bewerber nicht 72 Stunden auf menschliche CART-Unterstützung warten lässt, denn „der Prozess war verfügbar“ ist keine Verteidigung, wenn der Prozess voraussetzt, dass der Bewerber weiß, dass er fragen muss. Die D.K. v. Intuit/HireVue Beschwerde ist die Vorlage, die die Anwälte der Kläger jetzt verwenden; lesen Sie sie und richten Sie Ihre Kontrollen an jeder einzelnen Behauptung aus, denn genau das wird das Beweisermittlungsverfahren durchgehen.
Hängt davon ab, welche Theorie Sie erwischt. LL144 sind $1.500/Tag pro Verstoß, was sich auf $547.500 pro Jahr und nicht auditiertem Tool beläuft, bevor irgendein privates Klagerecht hinzukommt. Texas TRAIGA reicht bis maximal $200.000 pro unheilbarem Verstoß. Der EU AI Act deckelt bei dem höheren Wert von 15 Mio. € oder 3 % des weltweiten Jahresumsatzes bei Hochrisiko-Pflichten. Die EEOC einigte sich bei ihrem ersten KI-Einstellungsfall (iTutorGroup, 2023) auf $365.000, was klein ist, bis man erkennt, dass es nun die Untergrenze für individuelle Diskriminierungsansprüche ist. Sammelklagen skalieren anders: Mobleys Sammelklage umfasst potenziell einen erheblichen Teil der über 40-jährigen Bewerber, die Workdays Ökosystem durchlaufen haben, was nach Feststellung des Gerichts eine Milliarde übersteigen könnte. Kistlers FCRA-Theorie knüpft, sofern sie Bestand hat, $100–$1.000 gesetzlichen Schadensersatz pro Verbraucher und Verstoß an jeden Kandidaten, der von einer als Auskunftei eingestuften Plattform bewertet wurde. Ein Unternehmen, das 2 Millionen Kandidaten pro Jahr bewertet und für schuldig befunden wird, auch nur das untere Ende zu schulden, steht vor einem Risiko von $200 Mio. pro Jahr. Die Kosten eines Multi-Regime-Audit- und Abhilfeprogramms bewegen sich für die meisten unserer Kunden im niedrigen sechsstelligen Bereich und nur für die größten im niedrigen siebenstelligen Bereich. Die Rechnung von Versicherung gegen Risiko ist nicht einmal annähernd ausgeglichen.
Ja, und für die laufende Überwachung ist eine Governance-Plattform wirklich nützlich. Wir haben Kunden, die FairNow für kontinuierliches LL144-Tracking und Holistic AI für die regimeübergreifende Risikosicht nutzen, und wir empfehlen beide im richtigen Kontext. Was eine Plattform nicht tut, ist, an Ihrer Anbieter-Sicherheitsüberprüfung mit Ihrem CISO teilzunehmen, das rechtsstrategische Memo zu schreiben, wenn Illinois- und EU-Anforderungen kollidieren, einen SAP-Korpus-ASR-Benchmark für Ihr HireVue-Deployment durchzuführen oder eine Scoring-Pipeline neu zu schreiben, um Ausgaben abzufangen, bevor sie auf dem Recruiter-Bildschirm landen. Eine Plattform ist ein Dashboard; das Mandat, das wir durchführen, ist das, was das Dashboard überhaupt erst mit aussagekräftigen Daten füllt. Lassen Sie die Plattform laufen und beauftragen Sie den Spezialisten für das Mandat. Sie sind kein Ersatz füreinander.
2024 war das gut genug. Jetzt ist es nicht mehr gut genug. Die Forschung von Cornell / Data & Society / Consumer Reports prägte den Begriff „Null-Compliance“ für genau dieses Muster: 391 untersuchte NYC-Arbeitgeber, nur 4,6 % veröffentlichten ein Bias-Audit, und der Rest stützte sich auf Selbsteinstufungs-Argumente, die das Tool außerhalb des Anwendungsbereichs von LL144 stellten. Das NY State Comptroller-Audit vom Dezember 2025 zeigte dann, dass die Selbsteinstufung einer rigorosen Drittüberprüfung nicht standhält — staatliche Prüfer fanden 17 potenzielle Verstöße in derselben Stichprobe von 32 Unternehmen, in der das DCWP nur einen gefunden hatte. Das DCWP erklärte sich bereit, eine proaktive Durchsetzung einzuführen, was bedeutet, dass die Aufsichtsbehörde nun ihre eigene Analyse durchführt, anstatt darauf zu warten, dass Arbeitgeber Offenlegungen machen. Auf der Seite der Anbieterhaftung lehnt Mobleys „Agent“-Theorie ausdrücklich die Vorstellung ab, dass ein Screening-Tool, das Kandidaten empfiehlt oder filtert, nicht an der Entscheidung teilnimmt. Die praktische Haltung für jeden CHRO lautet: Gehen Sie davon aus, dass jedes Scoring-, Ranking- oder Filtertool im Anwendungsbereich ist, behandeln Sie das Memo „der Anbieter sagte, wir seien kein AEDT“ als künftiges Beweisermittlungsstück und auditieren Sie entsprechend. Eine Selbsteinstufungs-Verteidigung, die voraussetzt, dass die Aufsichtsbehörde und der Kläger mit der Charakterisierung des Anbieters übereinstimmen, ist keine Verteidigung, sondern eine Hoffnung.
Diese Lösungsseite stützt sich auf acht unserer interaktiven Whitepaper. Jedes deckt einen separaten Ausschnitt des KI-Einstellungs-Compliance-Problems ab. Der ernsthafte Käufer sollte sie alle überfliegen, bevor ein Mandatsgespräch stattfindet.
Das Ankerpapier für diese Seite. Analysiert das NY State Comptroller-Audit zu LL144 vom Dezember 2025, das „Compliance-Trilemma“ über NYC, Colorado, Illinois und die EU hinweg sowie die architektonischen Anforderungen an audit-fähige KI-Einstellungssysteme.
Knowledge-Graph-Ansätze für erklärbare Einstellung. Wie eine Skill-Ontologie die Art von Entscheidungsverfolgung ermöglicht, die der EU AI Act Art. 13 und 14 verlangen, und wo der Ansatz an die Grenzen des Proxy-Bias stößt.
Kontrafaktische Fairness und Strukturelle Kausalmodelle. Warum adversariales Debiasing in der Praxis instabil ist und wie der Kompromiss mit der Vorhersagegenauigkeit tatsächlich aussieht.
Das ADA-Risiko, das Bias-Audits nicht abdecken. Analysiert die Theorie der Aon-FTC-Beschwerde der ACLU und die technischen Grenzen des kausalen Representation Learning für behinderungsbewusste Assessments.
Aufarbeitung der McHire-/Paradox-Datenpanne von 64 Mio. Datensätzen. Anmeldedaten-Hygiene, IDOR-Klassen-Bugs und warum ein SOC-2-Schreiben kein Ersatz für eine KI-bewusste Anbieter-Due-Diligence ist.
Tiefgehende Betrachtung des „Agent“-Urteils in Mobley v. Workday. Wie neuro-symbolic-Architekturen die auditierbaren Entscheidungsspuren erzeugen, die dem Beweisermittlungsverfahren standhalten.
FCRA-Anwendbarkeit auf KI-Einstellungsplattformen, das Sachverhaltsmuster von Kistler v. Eightfold sowie die Datenherkunfts- und „Right to Dispute“-Workflows, die ein als CRA eingestufter Anbieter aufbauen muss.
Der Aspekt der Barrierefreiheit und der multimodalen Fusion. ASR-WER-Disparitäten für gehörlose, schwerhörige und indigene englische Sprecher; das Sachverhaltsmuster von D.K. v. Intuit / HireVue; sowie ein realistisches HITL-Eskalationsdesign.
Ein nicht auditiertes AEDT in NYC verursacht allein an LL144-Strafen bis zu $547.500 pro Jahr. Mobley und Kistler fügen ein Sammelklage-Risiko hinzu, das mit Ihrem Bewerbungsvolumen skaliert. Die Kosten eines ordentlichen Multi-Regime-Audit-Mandats sind ein kleiner Bruchteil einer einzigen Sammelklage-Verteidigung.
Wir beginnen mit einer Festpreis-Erfassung und Risikoprüfung. Sie gehen mit einem vertretbaren AEDT-Register und einem nummerierten Memo nach Hause — ob Sie das Mandat fortsetzen oder nicht.