– Investigadores del New York Eye and Ear Infirmary of Mount Sinai (NYEE) demostrado que el Generative Pre-Training – Model 4 (GPT-4) de OpenAI puede igualar, o en algunos casos superar, a los oftalmólogos en el diagnóstico y tratamiento del glaucoma y los trastornos de la retina.
El estudiarpublicado esta semana en JAMA Oftalmologíabuscaron evaluar la utilidad de los modelos de lenguaje grandes (LLM) en subespecialidades oftálmicas determinando si una de esas herramientas podría proporcionar respuestas completas y precisas en comparación con los especialistas humanos.
El equipo de investigación comenzó reclutando a 15 participantes, incluidos 12 médicos tratantes y tres estudiantes de alto nivel, del Departamento de Oftalmología de la Escuela de Medicina Icahn en Mount Sinai. Luego, a los participantes y a GPT-4 se les hicieron 20 preguntas comunes de los pacientes de un conjunto de consultas relacionadas con la retina y el glaucoma proporcionadas por la Academia Estadounidense de Oftalmología.
También se seleccionó al azar para el análisis un conjunto de 20 casos de glaucoma y retina no identificados de clínicas afiliadas a Mount Sinai.
Se evaluó la integridad y precisión de las respuestas de los participantes y del chatbot mediante una escala Likert.
En general, la precisión y exhaustividad de las respuestas del LLM igualaron o superaron a las de los oftalmólogos. Para las preguntas sobre la retina, la herramienta igualó a los especialistas en términos de precisión, pero los superó en exhaustividad. GPT-4 logró un rendimiento superior en preguntas sobre glaucoma, superando a los humanos en ambas métricas.
«El rendimiento de GPT-4 en nuestro estudio fue bastante revelador», dijo en el comunicado de prensa el autor principal Andy Huang, MD, residente de oftalmología en NYEE. “Reconocimos el enorme potencial de este [artificial intelligence] sistema desde el momento en que comenzamos a probarlo y nos fascinó observar que GPT-4 no solo podía ayudar sino que, en algunos casos, igualaba o superaba la experiencia de especialistas oftálmicos experimentados”.
«La IA fue particularmente sorprendente por su competencia en el manejo de casos de pacientes con glaucoma y retina, igualando la precisión e integridad de los diagnósticos y sugerencias de tratamiento hechos por médicos humanos en un formato de nota clínica», explicó el autor principal Louis R. Pasquale, MD, FARVO, Vicepresidente de Investigación en Oftalmología del Departamento de Oftalmología. «Así como la aplicación de inteligencia artificial Grammarly puede enseñarnos cómo ser mejores escritores, GPT-4 puede brindarnos una valiosa orientación sobre cómo ser mejores médicos, especialmente en términos de cómo documentamos los hallazgos de los exámenes de los pacientes».
Los investigadores subrayaron que se necesitan más pruebas, pero señalaron que los hallazgos del estudio resaltan el potencial significativo de la tecnología LLM en oftalmología.
«Podría servir como un asistente confiable para los oftalmólogos brindándoles apoyo de diagnóstico y potencialmente aliviando su carga de trabajo, especialmente en casos complejos o áreas con un gran volumen de pacientes», afirmó Huang. «Para los pacientes, la integración de la IA en la práctica oftálmica convencional podría resultar en un acceso más rápido al asesoramiento de expertos, junto con una toma de decisiones más informada para guiar su tratamiento».
Estos resultados arrojan luz sobre una sola posible aplicación de la IA en oftalmología, pero los investigadores están explorando una variedad de herramientas y casos de uso.
El mes pasado, investigadores del Centro Infantil Johns Hopkins revelaron que una IA autónoma diseñada para detectar enfermedades oculares diabéticas en jóvenes también puede tener un impacto positivo en la aceptación de las pruebas de detección.
Las enfermedades oculares como la retinopatía diabética afectan a un número significativo de niños y adolescentes con diabetes tipo 1 y tipo 2, pero las barreras para la detección pueden impedir la detección y el tratamiento oportunos. Estas brechas en las pruebas de detección son grandes entre los jóvenes pobres y minoritarios, lo que genera inequidades en salud y peores resultados para los pacientes.
El equipo de investigación había descubierto en trabajos anteriores que la IA podría usarse con éxito para diagnosticar afecciones oculares diabéticas, pero planteó la hipótesis de que la herramienta también podría aumentar la probabilidad de completar la detección.
Sus hallazgos respaldaron esta hipótesis, mostrando que los pacientes que se sometieron a pruebas de detección asistidas por IA tenían muchas más probabilidades de completar su seguimiento que los pacientes que recibieron pruebas de detección estándar.
