¿Qué es todo este alboroto? – El blog de atención médica

Por MIKE MAGEE

Si sigues mi comentario semanal sobre SaludCommentary.org o THCB, es posible que hayas notado en los últimos 6 meses que parezco estar obsesionado con mAI, o la intrusión de la Inteligencia Artificial en el espacio del sector de la salud.

Así que hoy, déjame compartir un secreto. Mi inmersión profunda ha sido parte de una larga preparación para una conferencia (“La IA se encuentra con la medicina”) que impartiré este viernes 17 de mayo a las 2:30 p.m. en Hartford, CT. Si estás en la zona, está abierto al público. Puedes registrarte para asistir AQUÍ.

Esta imagen es una de las 80 diapositivas que cubriré durante la presentación de 90 minutos sobre un tema enorme, revolucionario, transformador y complejo. También es un objetivo en movimiento, como se ilustra en la última fila que agregué esta mañana.

La adición fue forzada por Mira Murati, El director de tecnología de OpenAI, quien ayer anunció desde una posición privilegiada en San Francisco que «estamos mirando el futuro de la interacción entre nosotros y las máquinas».

La nueva aplicación, diseñada tanto para ordenadores como para teléfonos inteligentes, está GPT-4o. A diferencia de los miembros anteriores de la familia GPT, que se distinguían por sus capacidades generativas de autoaprendizaje y una sed insaciable de datos, esta nueva aplicación no se centra tanto en el espacio de búsqueda, sino que crea un «asistente personal» que es rápido y familiarizado con texto, audio e imagen (“multimodal”).

OpenAI dice Este es «un paso hacia una interacción persona-computadora mucho más natural» y es capaz de responder a su consulta «con un (retraso) promedio de 320 milisegundos, que es similar a un tiempo de respuesta humana.“Y se apresuran a reforzar eso. este es solo el comienzo, declarando en su sitio web esta mañana: “Con GPT-4o, entrenamos un único modelo nuevo de extremo a extremo en texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal. Debido a que GPT-4o es nuestro primer modelo que combina todas estas modalidades, todavía estamos apenas rascando la superficie de la exploración de lo que el modelo puede hacer y sus limitaciones”.

Es útil recordar que todo este movimiento de la IA, en la medicina y en todos los demás sectores, tiene que ver con el lenguaje. Y como expertos en lenguaje recuérdenos: “El lenguaje y el habla en el mundo académico son campos complejos que van más allá de la paleoantropología y la primatología”, y requieren un conocimiento práctico de “Fonética, Anatomía, Acústica y Desarrollo Humano, Sintaxis, Léxico, Gestos, Representaciones Fonológicas, Organización Silábica, Habla”. Percepción y control neuromuscular”.

La noción de comunicación instantánea y multimodal con las máquinas aparentemente no surgió de la nada, pero en realidad es el producto de casi un siglo de descubrimientos imaginativos, creativos y disciplinados por parte de tecnólogos de la información y expertos en el habla humana, que sólo recientemente han convergido plenamente entre sí. Como arqueólogo paleolítico, Paul Pettit, PhD, Como dice: «Ahora existe un gran apoyo a la noción de que la creatividad simbólica era parte de nuestro repertorio cognitivo cuando comenzamos a dispersarnos desde África». Es decir, «Sus imágenes informáticas multimodales son parte de una conversación que comenzó hace mucho tiempo en antiguos dibujos rupestres».

A lo largo de la historia, el lenguaje ha sido un acelerador de especies, un poder secreto que nos ha permitido dominar y ascender rápidamente (para bien o para mal) a la posición de “amos del universo”. La taquigrafía: nosotros, los humanos, hemos pasado “del balbuceo a la concordancia y a la inclusión…”

GPT-4o es sólo el último avance, pero destaca no porque enfatice la capacidad de “autoaprendizaje” que el New York Times correctamente calificó de “emocionante y aterrador”, sino porque se centra en la velocidad y la eficiencia en el esfuerzo. competir ahora en igualdad de condiciones con el lenguaje humano a humano. Como afirma OpenAI, «GPT-4o es 2 veces más rápido, la mitad del precio y tiene límites de velocidad (de tráfico) 5 veces más altos en comparación con GPT-4».

Practicidad y usabilidad son las palabras que elegí. En palabras de la empresa, “Hoy en día, GPT-4o es mucho mejor que cualquier modelo existente a la hora de comprender y analizar las imágenes que comparte. Por ejemplo, ahora puedes tomar una fotografía de un menú en un idioma diferente y hablar con GPT-4o para traducirla, conocer la historia y el significado de la comida y obtener recomendaciones”.

En mi conferencia cubriré una gran cantidad de terreno, mientras intento brindar un contexto histórico, nomenclatura relevante y definiciones de nuevos términos, y el gran potencial (tanto bueno como malo) para aplicaciones en el cuidado de la salud. Como muchos otros han dicho: “¡Es complicado!”

Pero como deja claro el anuncio de ayer en San Francisco, la interfaz hombre-máquina se ha desdibujado significativamente. o como Mira Murati En pocas palabras, «quieres tener la experiencia que estamos teniendo, donde podamos tener este diálogo tan natural».

Mike Magee MD es historiador médico y colaborador habitual de THCB. El es el autor de CÓDIGO AZUL: Dentro del Complejo Médico Industrial (Arboleda/2020)

You may also like

Leave a Comment