
Microsoft Asegura que Su Nuevo Sistema de IA Diagnosticó Pacientes con Cuatro Veces Más Precisión que Médicos Humanos
La empresa tecnológica atrajo a varios destacados investigadores de Google para desarrollar una herramienta de inteligencia artificial capaz de diagnosticar a los pacientes y que podría reducir los costos en el sector de la salud.
Microsoft ha dado un importante paso hacia la inteligencia médica avanzada, según Mustafa Suleyman, CEO de su división de inteligencia artificial. La compañía ha desarrollado una nueva herramienta de IA capaz de diagnosticar enfermedades con una precisión cuatro veces mayor y a un costo significativamente menor que un grupo de médicos humanos. La investigación buscó comprobar si esta herramienta podía realizar diagnósticos de manera correcta, replicando tareas que habitualmente realiza un médico.
Para llevar a cabo el estudio, el equipo de Microsoft utilizó 304 casos clínicos extraídos del New England Journal of Medicine y creó una prueba denominada Sequential Diagnosis Benchmark (SDBench). Un modelo de lenguaje desglosó cada caso en un proceso secuencial que un médico seguiría para llegar a un diagnóstico. Posteriormente, los investigadores desarrollaron un sistema llamado MAI Diagnostic Orchestrator (MAI-DxO), que consulta varios modelos de IA líderes, incluyendo GPT de OpenAI, Gemini de Google, Claude de Anthropic, Llama de Meta y Grok de xAI, imitando la colaboración de varios expertos humanos.
En el experimento, MAI-DxO superó el rendimiento de los médicos, logrando una precisión del 80% en contraste con el 20% de los médicos. Además, el sistema redujo los costos en un 20% al elegir pruebas y procedimientos más económicos. Suleyman expresó que este mecanismo de orquestación, en el que múltiples agentes trabajan juntos en un estilo de debate, es lo que acercará la tecnología hacia la superinteligencia médica.
La compañía también contrató a varios investigadores de inteligencia artificial de Google, lo que evidencia una creciente competencia por los mejores talentos en el sector. La IA ya está siendo utilizada en algunas áreas de la salud en EE. UU., como en el apoyo a radiólogos para la interpretación de imágenes. Los modelos de IA multimodal recientes muestran el potencial de actuar como herramientas de diagnóstico más generales, aunque el uso de IA en la salud plantea preocupaciones sobre sesgos en los datos de entrenamiento.
Microsoft aún no ha decidido si comercializará esta tecnología, pero existe la posibilidad de integrarla en Bing para ayudar a los usuarios a diagnosticar síntomas. También podría desarrollar herramientas para asistir a médicos en la mejora o automatización del cuidado del paciente. Suleyman mencionó que en los próximos años, la empresa se enfocará en validar estos sistemas en entornos reales.
La investigación actual de Microsoft se distingue de trabajos anteriores, ya que reproduce de manera más fiel el método diagnóstico de los médicos, al analizar síntomas, ordenar pruebas y realizar análisis adicionales hasta llegar a un diagnóstico. En un comunicado sobre el proyecto, la compañía describió la combinación de varios modelos de IA de frontera como un "camino hacia la superinteligencia médica."
Este avance sugiere que la IA podría ayudar a reducir los costos en la atención médica, un tema crítico, especialmente en EE. UU. Dominic King, vicepresidente de Microsoft y participante del proyecto, resaltó que el modelo presenta un rendimiento notable tanto en la obtención del diagnóstico como en su eficiencia en costos.
David Sontag, científico del MIT y cofundador de Layer Health, consideró el trabajo emocionante, destacando su relevancia porque refleja con mayor precisión cómo operan los médicos y aborda cuestiones complejas en la metodología subyacente. Sin embargo, advirtió que los hallazgos deben tomarse con precaución, ya que los médicos del estudio no usaron herramientas adicionales al diagnosticar, lo que puede no reflejar su práctica habitual.
Eric Topol, del Scripps Research Institute, calificó el informe como impresionante por abordar casos complejos de diagnóstico y consideró innovador que la IA pudiera, en teoría, reducir costos en la atención médica. Tanto Topol como Sontag coincidieron en que la siguiente fase para validar la efectividad del sistema de Microsoft sería realizar ensayos clínicos que comparen sus resultados con los de médicos reales tratando a pacientes reales, para una evaluación rigurosa de costos.