Question 1

¿Cómo evaluamos la seguridad de la IA clínica antes de la adquisición?

Accepted Answer

Comience con tres requisitos no negociables antes de cualquier demostración: datos de desempeño por subgrupos estratificados por raza, sexo y edad para la población de pacientes a la que servirá la herramienta; un estudio de validación externa independiente (no financiado por el proveedor); y una tarjeta de modelo completa que documente la procedencia de los datos de entrenamiento, los modos de fallo conocidos y los contextos clínicos específicos en los que la herramienta no ha sido probada. La mayoría de los proveedores le proporcionarán cifras de exactitud globales. Vaya más allá de estas. Pida la sensibilidad y el valor predictivo positivo desglosados por grupo demográfico. Un modelo de sepsis con un 80 % de sensibilidad para pacientes blancos y un 40 % para pacientes negros no es un modelo con un 80 % de exactitud. Son dos herramientas diferentes que ofrecen dos niveles de atención. Exija al proveedor que firme un lenguaje contractual que se comprometa a una divulgación continua del desempeño, no solo a los puntos de referencia previos a la venta. El acuerdo con Pieces Technologies estableció que las afirmaciones de exactitud en el marketing sin fundamento constituyen una práctica comercial engañosa. Sus contratos con proveedores deberían reflejar este precedente: vincule las representaciones de exactitud a métricas verificables de forma independiente e incluya cláusulas de remediación que se activen ante la degradación del desempeño. Para las herramientas de documentación ambiental específicamente, solicite capacidades de evidencia vinculada en las que cada afirmación generada por IA en una nota clínica se remonte a un momento específico del audio del encuentro con el paciente. Abridge y Nuance ofrecen ambas versiones de esto. Si su proveedor no puede proporcionar atribución de fuente para el texto generado, ese es un riesgo de alucinación que usted no puede monitorizar.

Question 2

¿Qué significa el acuerdo de Pieces Technologies para nuestros contratos existentes con proveedores de IA?

Accepted Answer

El acuerdo de septiembre de 2024 del Fiscal General de Texas con Pieces Technologies estableció que la ley de protección al consumidor existente, no una nueva legislación específica sobre IA, es suficiente para perseguir a los proveedores de IA del sector salud por afirmaciones de exactitud engañosas. El Compromiso de Cumplimiento Voluntario de cinco años exige que Pieces revele las definiciones de las métricas, las metodologías de cálculo, los detalles de los datos de entrenamiento y los usos dañinos conocidos a todos los clientes actuales y futuros. Para sus contratos, esto genera tres puntos de acción inmediatos. Primero, audite cada afirmación de exactitud en sus acuerdos existentes con proveedores y en sus materiales de marketing. Si un proveedor afirma una tasa de alucinaciones, una tasa de error o un porcentaje de exactitud específico, su contrato debería exigir la divulgación de cómo se calculó esa cifra, sobre qué conjunto de datos y si ha sido validada de forma independiente. Segundo, añada cláusulas de transparencia del desempeño a los nuevos contratos. Exija a los proveedores que proporcionen métricas de desempeño por subgrupos, que divulguen las actualizaciones del modelo que podrían afectar la exactitud y que acepten una auditoría independiente de terceros a su elección. Tercero, revise su asignación de responsabilidad. La mayoría de los contratos con proveedores de HCE, incluido el Acuerdo Marco de Licencia de Software de Epic, contienen amplias cláusulas de limitación de responsabilidad. Cuando el modelo de sepsis integrado de Epic falla, la responsabilidad contractual normalmente recae sobre el sistema de salud. El precedente de Pieces sugiere que el marketing de exactitud engañoso puede anular estas limitaciones, pero esa teoría no ha sido puesta a prueba en los tribunales. No espere a un litigio para aclarar esto. Incorpore la verificación independiente a su proceso de gobernanza ahora.

Question 3

¿Cómo debemos gestionar el cumplimiento de la AB 3030 para los mensajes del portal del paciente redactados por IA?

Accepted Answer

La AB 3030 exige que las instalaciones sanitarias de California notifiquen a los pacientes cuando se utiliza IA generativa para comunicar información clínica del paciente, con normas de notificación específicas para las comunicaciones escritas, de chat en línea, de audio y de vídeo. El matiz crítico es la exención de «leído y revisado»: si un proveedor con licencia lee y revisa la comunicación generada por IA antes de que llegue al paciente, el requisito de divulgación no se aplica. La mayoría de los sistemas de salud se apoyan en esta exención. El problema es que apoyarse en ella requiere que la revisión médica sea significativa, y la evidencia dice que no lo es. El estudio de Lancet de abril de 2024 halló que los médicos omitieron el 66,6 % de los errores dañinos en los mensajes al paciente redactados por IA, con un 35-45 % de los borradores erróneos enviados completamente sin editar. El tiempo medio de revisión en muchas instituciones es de 8-15 segundos por mensaje. Si su grupo de hospitalistas procesa más de 400 mensajes de MyChart redactados por IA al día con tiempos medios de revisión de 12 segundos, la exención de «leído y revisado» es una ficción legal que no sobrevivirá al escrutinio regulatorio. Nuestra recomendación: implemente tanto la infraestructura de divulgación como controles de revisión significativos. Añada los descargos de responsabilidad requeridos a todas las comunicaciones asistidas por IA como base. Después construya una interfaz de revisión que resalte la incertidumbre de la IA, haga aflorar el historial pertinente del paciente junto al borrador, requiera la confirmación activa de las afirmaciones clínicas señaladas y registre la duración de la revisión y las ediciones específicas. Esto lo protege independientemente de si la exención se sostiene, y aborda el verdadero problema de seguridad del paciente. La sanción de $25.000 por infracción para las instalaciones es real, pero la exposición a la negligencia médica derivada de un mensaje redactado por IA que daña a un paciente al que nunca se le dijo que había IA involucrada es de un orden de magnitud mayor.

Question 4

¿Es responsable nuestro sistema de salud cuando la IA clínica produce una recomendación errónea?

Accepted Answer

La responsabilidad es estratificada, y la asignación depende de la herramienta de IA específica, de cómo se desplegó y de qué hizo el médico con su resultado. En 2025-2026, las reclamaciones por negligencia médica que involucran herramientas de IA aumentaron un 14 % en comparación con 2022, concentradas en radiología, cardiología y oncología. El estándar de atención en evolución crea responsabilidad en ambas direcciones: un médico que acepta ciegamente una recomendación dañina de la IA puede ser declarado negligente, y un médico que no utiliza una herramienta de IA validada que podría haber detectado un error también puede enfrentar responsabilidad a medida que la atención asistida por IA se convierte en el estándar esperado. Para el sistema de salud, importan tres vectores de responsabilidad. Primero, la responsabilidad por la selección del proveedor: si eligió una herramienta de IA sin la debida diligencia adecuada sobre su perfil de seguridad, su desempeño demográfico y su validación clínica, esa decisión de adquisición puede ser impugnada. Segundo, la responsabilidad por supervisión: si su estructura de gobernanza no monitorizó el desempeño continuo de la herramienta o no respondió a señales de seguridad conocidas, el sistema asume la responsabilidad. Tercero, la responsabilidad por la integración en el flujo de trabajo: si la IA se integró de una manera que dificultaba a los médicos anular o cuestionar sus recomendaciones (campos autocompletados, aceptaciones predeterminadas, flujos de trabajo con presión de tiempo), el propio diseño del sistema se convierte en un factor contribuyente. Las aseguradoras de negligencia médica están respondiendo. Algunas ahora incluyen exclusiones específicas de IA. Otras exigen que los médicos completen capacitación en seguridad de IA para mantener la cobertura. Su programa de gestión de riesgos necesita documentar su proceso de evaluación de proveedores, su monitorización continua y la capacitación de sus médicos. Las organizaciones mejor posicionadas serán aquellas con rastros de gobernanza auditables que demuestren que identificaron riesgos, monitorizaron el desempeño y actuaron ante señales de degradación.

Question 5

¿Cómo detectamos y abordamos el sesgo racial en nuestras herramientas de IA clínica desplegadas?

Accepted Answer

La detección de sesgos requiere una infraestructura de monitorización continua, no auditorías puntuales. Comience con tres pasos concretos. Primero, instrumente las salidas de su IA clínica para la estratificación demográfica. Cada predicción, alerta o recomendación que generen sus herramientas de IA debería poder registrarse con la raza, etnia, sexo y edad autorreportados del paciente. Esto no requiere cambiar el propio modelo de IA. Requiere construir una capa de análisis sobre la salida del modelo que calcule la sensibilidad, la especificidad y el valor predictivo positivo por grupo demográfico de forma continua. Segundo, establezca umbrales de alerta. Si la sensibilidad de su modelo de sepsis para los pacientes negros cae por debajo del 80 % de su sensibilidad para los pacientes blancos (un análogo aproximado de la regla de los cuatro quintos utilizada en la discriminación laboral), eso desencadena una revisión de gobernanza. Los umbrales específicos dependen de su contexto clínico y su tolerancia al riesgo, pero no tener umbrales significa que está volando a ciegas. Tercero, aborde el problema de los datos en origen. Los oxímetros de pulso sobreestiman la SpO2 entre 0,6 y 1,5 puntos porcentuales en pacientes de piel más oscura. La FDA emitió una guía preliminar en enero de 2025 que recomienda realizar pruebas con más de 150 participantes diversos utilizando la escala Monk Skin Tone, frente al requisito anterior de solo 10 sujetos. Si su sistema de triaje con IA usa la SpO2 como característica de entrada, hereda este sesgo de hardware. Los pacientes negros tienen casi tres veces más probabilidades de experimentar hipoxemia oculta que los oxímetros de pulso pasan por alto. Sus protocolos clínicos deberían incluir evaluaciones complementarias cuando las lecturas de SpO2 difieran de otros signos vitales en pacientes con tonos de piel más oscuros. Esto no es solo un problema de IA. Es un problema de integridad de los datos que la IA amplifica. La brecha de desempeño documentada del Epic Sepsis Model (AUC 0,63 en validación externa frente al 0,76-0,83 declarado) ilustra lo que ocurre cuando el sobreajuste específico del sitio se encuentra con una evaluación ciega a la demografía.

Question 6

¿Cómo se ve el cumplimiento de la Ley de IA de Colorado y la Ley de IA de la UE en el sector salud?

Accepted Answer

La Ley de IA de Colorado (SB 24-205), ahora efectiva el 30 de junio de 2026 tras una prórroga desde febrero, es la primera ley estatal integral de IA de EE. UU. con implicaciones directas en el sector salud. Define los sistemas de IA «de alto riesgo» como aquellos que son un factor sustancial en decisiones consecuentes, incluida la provisión, denegación, costo o condiciones de los servicios de salud. Los implementadores del sector salud deben adoptar una política de gestión de riesgos, realizar revisiones anuales de cada sistema de IA de alto riesgo en busca de discriminación algorítmica, completar evaluaciones de impacto, notificar a los pacientes cuando la IA toma decisiones consecuentes y ofrecer oportunidades de apelación mediante revisión humana. Existe una exención crítica para las entidades cubiertas por HIPAA: si la IA proporciona recomendaciones que requieren que un proveedor de salud tome medidas para implementarlas, el sistema puede estar exento. Esto significa que su asistente ambiental que redacta una nota para la revisión del médico probablemente está exento, pero una IA que clasifica automáticamente a los pacientes o deniega automáticamente las autorizaciones previas no lo está. El Fiscal General de Colorado tiene autoridad exclusiva de aplicación, y el cumplimiento de NIST AI RMF o ISO 42001 crea una presunción refutable de cuidado razonable. Para la Ley de IA de la UE, el soporte a la decisión clínica se clasifica como de alto riesgo bajo el Anexo III, punto 5. A partir del 2 de agosto de 2026, cualquier herramienta de SDC que atienda a pacientes de la UE debe cumplir con los Artículos 9-17: sistemas de gestión de riesgos, documentación técnica, gobernanza de datos, requisitos de transparencia, supervisión humana y monitorización poscomercialización. Las sanciones por incumplimiento alcanzan los 15 millones EUR o el 3 % de la facturación anual global. Si su sistema de salud atiende a pacientes internacionales o se asocia con instituciones de la UE, esto le aplica. Para ambas leyes, el punto de partida práctico es el mismo: mantenga un inventario centralizado de cada herramienta de IA desplegada en los flujos de trabajo clínicos, clasifique cada una por nivel de riesgo y documente sus controles de gobernanza para cada nivel.

Question 7

¿Cómo construimos un comité de gobernanza de IA que realmente funcione?

Accepted Answer

A fecha de 2026, el 84 % de las organizaciones del sector salud han establecido comités de gobernanza de IA, pero la mayoría carece de capacidad operativa real. Los CIO forman parte del 63 % y los CMIO de solo el 45 %, lo que significa que casi la mitad de estos comités están tomando decisiones sobre IA clínica sin un médico de informática clínica en la mesa. El comité necesita cuatro capacidades operativas, no solo una carta constitutiva. Primero, un flujo de trabajo de aprobación previa al despliegue con criterios explícitos: ¿qué evidencia se requiere antes de que una herramienta de IA pueda usarse en entornos clínicos? Como mínimo, esto incluye datos de validación independiente, métricas de desempeño por subgrupos, una tarjeta de modelo completa, documentación de HIPAA/BAA/SOC 2 y un defensor clínico que asuma la responsabilidad del despliegue seguro de la herramienta. Segundo, un protocolo de monitorización posdespliegue: ¿quién revisa el desempeño de la herramienta de IA, con qué frecuencia y qué desencadena una pausa o una retirada? Defina métricas específicas (tasa de alucinaciones, indicadores de fatiga de alertas, ratios de desempeño demográfico) y cadencias de revisión (trimestral para herramientas de bajo riesgo, mensual para las de alto riesgo). Tercero, una vía de notificación de incidentes: cuando un médico detecta un error de la IA, ¿adónde va ese informe? Debería alimentar su sistema existente de notificación de seguridad del paciente, no un silo separado específico de IA. Cuarto, un plan de detección y respuesta de IA en la sombra. Los médicos están adoptando herramientas de IA fuera de la gobernanza institucional. Su comité necesita un proceso para descubrir el uso no autorizado de IA, evaluar su riesgo y, o bien autorizarlo dentro de la gobernanza, o bien eliminarlo. La composición del comité debería incluir al CMIO (seguridad clínica), al CISO (seguridad y privacidad), un responsable de cumplimiento (regulatorio), un responsable de seguridad del paciente (gestión de incidentes), un defensor clínico de primera línea (realidad del flujo de trabajo) y un científico de datos o informático (evaluación técnica). Reuniéndose mensualmente con una agenda permanente: solicitudes de nuevas herramientas, revisión del panel de monitorización, informes de incidentes, actualizaciones regulatorias.

Categoría	Actores clave	Lo que hacen bien	Dónde se quedan cortos
Documentación ambiental	Nuance DAX (Microsoft), Abridge, Ambience Healthcare	Reducen la carga de documentación entre un 50 y un 79 %. Abridge y Nuance ofrecen trazabilidad de evidencia vinculada. Integración profunda con HCE (Abridge es el primer Pal de Epic).	Ninguno publica tasas de alucinaciones independientes y revisadas por pares estratificadas por especialidad clínica. La exactitud es autorreportada. Ningún proveedor ofrece desgloses de desempeño demográfico.
Soporte a la decisión clínica	Epic (integrado), Viz.ai, Aidoc, Pieces Technologies	Viz.ai tiene múltiples autorizaciones de la FDA en más de 1.400 hospitales. Aidoc autorizado para triaje de TC abdominal de 14 condiciones con un 97 % de sensibilidad.	Los modelos integrados de Epic (p. ej., ESM) mostraron una pobre generalización externa. Los modelos propietarios a menudo carecen de validación independiente. Los datos de desempeño por subgrupos rara vez se divulgan.
Plataformas de gobernanza de IA	Censinet, Credo AI, Holistic AI, IBM watsonx.governance	Censinet ofrece gestión de riesgos específica para el sector salud. Credo AI mapea los requisitos regulatorios. IBM proporciona gobernanza del ciclo de vida a escala empresarial.	Las plataformas de gobernanza gestionan procesos. No prueban la IA clínica en busca de alucinaciones, no ejecutan sondeos adversariales ni miden el desempeño demográfico sobre los datos de sus pacientes.
Detección de alucinaciones	Vectara (HHEM-2.1), Arthur AI, Galileo	El modelo HHEM de Vectara compara la fidelidad. Arthur AI proporciona monitorización de ML de ciclo de vida completo.	Herramientas de propósito general no calibradas para texto clínico. «Considerar metformina» puede ser correcto para la diabetes tipo 2 pero peligroso en caso de insuficiencia renal. La detección dependiente del contexto requiere fundamentación clínica.
Big 4 / Grandes integradores de sistemas	Deloitte, Accenture, McKinsey, EY	Gestión del cambio empresarial. Credibilidad a nivel de junta directiva. Equipos grandes para implementaciones de varios años.	Implementan plataformas, no construyen infraestructura de seguridad de IA clínica desde cero. Los compromisos comienzan en $500K-$5M+. Los equipos generalistas rotan; la profundidad de dominio sigue siendo superficial. Recomiendan marcos de gobernanza. Rara vez prueban modelos contra sus datos.
Equipos internos	Sus equipos de informática, cumplimiento y TI	Conocen sus flujos de trabajo, sus datos, su política interna. Esenciales para una gobernanza sostenida.	La mayoría de los equipos de informática de los sistemas de salud carecen de capacidad de prueba adversarial de IA, infraestructura para el cálculo de métricas de equidad y ancho de banda para la monitorización de sesgos entre proveedores. Esta es una carencia de recursos que ningún proveedor externo resuelve por completo. Veriprajna puede construir la infraestructura y capacitar al equipo, pero la monitorización sostenida requiere capacidad interna.

Su sistema de salud ejecuta entre 5 y 15 herramientas de IA. Ninguna ha sido verificada de forma independiente.

Tres modos de fallo que definen el riesgo

Alucinación y sesgo de automatización

Afirmaciones de exactitud no verificables

Puntos ciegos demográficos en la IA clínica

El panorama de la IA clínica que su comité de gobernanza necesita comprender

Lo que construimos para los sistemas de salud

Evaluaciones de seguridad de IA clínica

Arquitectura de gobernanza de IA

Monitorización de sesgos y auditorías de equidad

Ingeniería de cumplimiento regulatorio

Red-teaming de IA clínica

Cómo trabajamos

Descubrimiento e inventario

Evaluación y pruebas

Arquitectura e implementación

Transferencia y monitorización

Evaluación de preparación en seguridad de IA clínica

Preguntas que los CMIO nos hacen

¿Cómo evaluamos la seguridad de la IA clínica antes de la adquisición?

¿Qué significa el acuerdo de Pieces Technologies para nuestros contratos existentes con proveedores de IA?

¿Cómo debemos gestionar el cumplimiento de la AB 3030 para los mensajes del portal del paciente redactados por IA?

¿Es responsable nuestro sistema de salud cuando la IA clínica produce una recomendación errónea?

¿Cómo detectamos y abordamos el sesgo racial en nuestras herramientas de IA clínica desplegadas?

¿Cómo se ve el cumplimiento de la Ley de IA de Colorado y la Ley de IA de la UE en el sector salud?

¿Cómo construimos un comité de gobernanza de IA que realmente funcione?

Investigación técnica

Sus herramientas de IA están tomando decisiones clínicas. ¿Puede demostrar que son seguras?

Evaluación de seguridad de IA clínica

Construcción de arquitectura de gobernanza