La historia de 7 décadas de ChatGPT – The Health Care Blog

Por MIKE MAGEE

Durante el año pasado, la popularización general de la IA oInteligencia artificial ha capturado la imaginación del mundo. Por supuesto, los académicos suelen hacer hincapié en el contexto histórico. Pero los empresarios tienden a estar de acuerdo con Thomas Jefferson, quien dijo: «Me gustan más los sueños del futuro que la historia del pasado».

Sin embargo, este sueño en particular tiene que ver con el lenguaje, su posición y significado en la sociedad humana. A lo largo de la historia, el lenguaje ha sido un acelerador de especies, un poder secreto que nos ha permitido dominar y ascender rápidamente (para bien o para mal) a la posición de “amos del universo”.

Bien antes ChatGPT se convirtió en una frase familiar, hubo LDT o la teoría del descenso laríngeo. Profesaba que la capacidad única de los humanos para hablar era el resultado de una laringe, que se encuentra más abajo en la garganta que otros primates. Esto permitió que “la forma de la garganta y el control motor” produjeran vocales que son la piedra angular del habla humana. El habla (y, por tanto, la llegada del lenguaje) se vinculó a cambios evolutivos anatómicos que datan de entre 200.000 y 300.000 hace años que.

Resulta que esa teoría tenía muy poca evidencia científica. Y en 2019, un estudio histórico Se propuso retrasar la fecha de la vocalización de los primates hasta hace al menos 3 a 5 millones de años. Como lo resumieron los científicos en tres puntos: “En primer lugar, incluso entre los primates, el descenso laríngeo no es exclusivamente humano. En segundo lugar, no es necesario el descenso laríngeo para producir patrones de formantes contrastantes en las vocalizaciones. En tercer lugar, los primates no humanos vivos producen vocalizaciones con patrones de formantes contrastantes”.

El lenguaje y el habla en el mundo académico son campos complejos que van más allá de la paleoantropología y la primatología. Si quieres estudiar ciencias del habla, es mejor que tengas conocimientos prácticos de “fonética, anatomía, acústica y desarrollo humano”, dice el expertos. Se podría agregar a esto “sintaxis, léxico, gesto, representaciones fonológicas, organización silábica, percepción del habla y control neuromuscular”.

Profesor Paul Pettitt, quien se gana la vida en la Universidad de Oxford interpretando antiguas pinturas rupestres en África y más allá, ve el nacimiento de la civilización en términos de lenguaje multimodal. Dice: “Ahora existe un gran apoyo a la idea de que la creatividad simbólica era parte de nuestro repertorio cognitivo cuando comenzamos a dispersarnos desde África. silla de google, Sundar Pichai, mantiene una visión igualmente expansiva en lo que respecta al lenguaje. En su presentación del 6 de diciembre de 2023 de su innovador LLM (modelo de lenguaje grande), Gemini (un competidor de ChatGPT), describió el nuevo producto como “nuestro modelo de IA más grande y más capaz con comprensión natural de imágenes, audio y video y Razonamiento matemático.»

Estratega Cognitivo Digital, Marcos Minevich, Se hizo eco de la opinión de Google de que la antorcha del lenguaje humano había ido mucho más allá del texto y había pasado a las máquinas. Su reseña: «Gemini combina tipos de datos como nunca antes para desbloquear nuevas posibilidades en el aprendizaje automático… Su naturaleza multimodal se basa en predecesores como GPT-3.5 y GPT-4, pero va mucho más allá en su capacidad para comprender nuestro complejo mundo de forma dinámica».

GPT que???

OK Demos un paso atrás y démosnos a todos la oportunidad de ponernos al día.

Lo que llamamos IA o “inteligencia artificial” es una Concepto de 70 años eso solía llamarse «aprendizaje profundo». Esta fue la construcción cerebral de los investigadores Warren McCullough y Walter Pitts de la Universidad de Chicago, quienes desarrollaron el concepto de “redes neuronales” en 1944modelando el aprendizaje automático teórico a partir de cerebros humanos, consistentes en múltiples fibras de tránsito superpuestas, unidas en nodos sinápticos que, con un estímulo adecuado, podrían permitir que la información recopilada pase a la siguiente fibra en la línea.

Sobre la base de ese concepto, los dos se trasladaron a MIT en 1952 y lanzó el Departamento de Ciencias Cognitivas que une a informáticos y neurocientíficos. Mientras tanto, Frank Rosenblatt, un psicólogo de Cornell, inventó la «primera red neuronal entrenable» en 1957, que él denominó futurista. el “perceptrón” que incluía una capa de entrada de datos, una capa sándwich que podía ajustar los paquetes de información con «pesos» y «umbrales de disparo», y una tercera capa de salida para permitir que los datos que cumplían con los criterios del umbral pasaran por la línea.

De vuelta en el MIT, el Departamento de Ciencias Cognitivas estaba en proceso de ser secuestrado en 1969 por los matemáticos Marvin Minsky y Seymour Papert, y se convirtió en el Laboratorio de Inteligencia Artificial del MIT. Destruyeron sumariamente la máquina Perceptron de Rosenblatt creyendo que no tenía suficiente potencia y era ineficiente para realizar los cálculos más básicos. En 1980, el departamento estaba listo para ofrecer un «no importa», a medida que la potencia informática crecía y los algoritmos para codificar umbrales y pesos en los nodos neuronales se volvían eficientes y prácticos.

El salto informático, según coinciden ahora los expertos, se produjo “cortesía de la industria de los juegos de ordenador”, cuya “unidad de procesamiento de gráficos” (GPU), que albergaba miles de núcleos de procesamiento en un solo chip, era efectivamente la red neuronal que McCullough y Pitts habían imaginado. En 1977, Atari había desarrollado cartuchos de juegos y hardware basado en microprocesadores, con una exitosa interfaz de televisión.

Con el lanzamiento de Internet y la explosión comercial de la informática de escritorio, el lenguaje –que es el combustible de las interacciones humanas en todo el mundo– creció exponencialmente en importancia. Más específicamente, la mayor demanda era de un lenguaje que pudiera vincular a los humanos con las máquinas de forma natural.

Con el crecimiento explosivo de los datos de texto, inicialmente la atención se centró en Procesamiento natural del lenguaje (PNL), «un subcampo interdisciplinario de la informática y la lingüística que se ocupa principalmente de dotar a las computadoras de la capacidad de soportar y manipular el lenguaje humano». Inicialmente, el software de formación utilizaba textos anotados o referenciados para abordar o responder preguntas o tareas específicas con precisión. La utilidad y precisión para abordar consultas fuera de su capacitación predeterminada fueron limitadas y la ineficiencia socavó su uso.

Pero la potencia informática había avanzado mucho más allá de lo que Warren McCullough y Walter Pitts podrían haber imaginado en 1944, mientras que el concepto de «redes neuronales» no podría ser más relevante. IBM describe la versión moderna de esta manera:

“Las redes neuronales… son un subconjunto de aprendizaje automático y están en el corazón de aprendizaje profundo algoritmos. Su nombre y estructura están inspirados en el cerebro humano, imitando la forma en que las neuronas biológicas se envían señales entre sí… Las redes neuronales artificiales se componen de capas de nodos, que contienen una capa de entrada, una o más capas ocultas y una capa de salida… Se determina la capa y se asignan pesos. Estas ponderaciones ayudan a determinar la importancia de cualquier variable determinada, y las más grandes contribuyen de manera más significativa a la producción en comparación con otros insumos. Luego, todas las entradas se multiplican por sus respectivos pesos y luego se suman. Luego, la salida pasa a través de una función de activación, que determina la salida. Si esa salida excede un umbral determinado, «dispara» (o activa) el nodo, pasando datos a la siguiente capa en la red… Vale la pena señalar que lo «profundo» en el aprendizaje profundo solo se refiere a la profundidad de las capas en un red neuronal. Una red neuronal que consta de más de tres capas (que incluirían las entradas y la salida) puede considerarse un algoritmo de aprendizaje profundo. Una red neuronal que sólo tiene dos o tres capas es sólo una red neuronal básica”.

La conclusión es que el sistema automatizado responde a una lógica interna. La “próxima opción” de la computadora está determinada por qué tan bien encaja con las opciones anteriores. Y no importa de dónde vengan las palabras o las “monedas”. Aliméntelo con datos y lo hará.tren» sí mismo; y siguiendo las reglas o algoritmos incorporados en las capas o pantallas de decisión intermedias,transformar» los conocimientos adquiridos, en generado» lenguaje que tanto humanos como máquinas entienden.

En 2016, un grupo de empresarios tecnológicos, entre ellos Elon Musk y Reed Hastings, creyendo que la IA podría desviarse si se restringía o se utilizaba como arma, formó una organización sin fines de lucro llamada AbiertoAI. Dos años más tarde, lanzaron un producto de aprendizaje profundo llamado Chat GPT. Esta solución nació de la unión del procesamiento del lenguaje natural y los vínculos neuronales de aprendizaje profundo con el objetivo declarado de «permitir a los humanos interactuar con las máquinas de una manera más natural».

GPT significaba «Transformador generativo preentrenado». Incorporada en el software estaba la capacidad de «considerar el contexto de la oración completa al generar la siguiente palabra», una táctica conocida como «autorregresiva». Como «modelo de aprendizaje autosupervisado», GPT puede aprender por sí solo ingiriendo o ingresando grandes cantidades de texto anónimo; transformarlo pasándolo a través de una variedad de pantallas intermedias pesadas que juzgan el contenido; y permitir el paso (y la supervivencia) de datos validados. ¿El resultado resultante? Lenguaje de alto rendimiento que imita el texto humano.

Liderazgo en Microsoft quedó impresionado y en 2019 aportó mil millones de dólares para participar conjuntamente en el desarrollo del producto y servir como su proveedor exclusivo de nube.

El primer ChatGPT-1 de OpenAI fue el primero introducido por GPT-1 en 2018, pero no formalmente lanzado públicamente hasta el 30 de noviembre de 2022.

Fue entrenado en un enorme conjunto de datos de BooksCorpus. Su diseño incluía una capa de entrada y salida, con 12 capas de transformadores sucesivas intercaladas en el medio. Fue tan efectivo en el procesamiento del lenguaje natural que se requirió un ajuste mínimo en la parte posterior.

OpenAI lanzó a continuación la versión dos, llamada GPT-2, que era 10 veces el tamaño de su predecesor con 1.500 millones de parámetros y la capacidad de traducir y resumir. Le siguió GPT-3. Ahora había crecido a 175 mil millones de parámetros, 100 veces el tamaño de GPT-2, y fue entrenado ingiriendo un corpus de 500 mil millones de fuentes de contenido (incluyendo los de mi propio libro CÓDIGO AZUL). Ahora podría generar pasajes largos a pedido verbal, hacer matemáticas básicas, escribir código y realizar (lo que los inventores describen como) «tareas inteligentes». Un GPT 3.5 intermedio absorbió entradas de Wikipedia, publicaciones en redes sociales y comunicados de prensa.

El 14 de marzo de 2023, GPT-4 se volvió grande en lenguaje, ahora con salidas multimodales que incluyen texto, voz, imágenes e interacciones físicas con el medio ambiente. Esto representa una convergencia exponencial de múltiples tecnologías que incluyen bases de datos, inteligencia artificial, computación en la nube, redes 5G, computación perimetral personal y más.

Los New York Times El titular lo anunció como «Emocionante y aterrador». Su columnista de tecnología escribió: «Lo que vemos surgir son máquinas que saben razonar, son expertas en todos los lenguajes humanos y son capaces de percibir e interactuar con el entorno físico». No estaba solo en sus preocupaciones. El Atlántico, Casi al mismo tiempo, publicó un editorial titulado: “La IA está a punto de hacer que las redes sociales sean (mucho) más tóxicas.

Leonid Zhukov, Ph.D.director de IA global de Boston Consulting Group (BCG), cree Ofertas como ChatGPT-4 y Genesis tienen el potencial de convertirse en cerebros de agentes autónomos, que no sólo detectan sino que también actúan sobre su entorno, en los próximos 3 a 5 años. Esto podría allanar el camino para flujos de trabajo totalmente automatizados”.

¿Estaba vivo? Leonardo da Vinci, probablemente no estaría preocupado. Hace quinientos años, escribió con indiferencia: “Hacía tiempo que me había dado cuenta de que las personas con logros rara vez se sentaban y dejaban que les pasaran cosas. Salieron y sucedieron cosas”.

Mike Magee MD es historiador médico y colaborador habitual de THCB. El es el autor de CÓDIGO AZUL: Dentro del complejo industrial médico de Estados Unidos (Arboleda/2020).

You may also like

Leave a Comment