Nvidia: ¿qué tiene de bueno el nuevo superchip de IA de la empresa de tecnología? | Sector tecnológico

El fabricante de chips Nvidia ha ampliado su liderazgo en inteligencia artificial con la presentación de un nuevo “superchip”, un servicio de computación cuántica y un nuevo conjunto de herramientas para ayudar a desarrollar el sueño supremo de la ciencia ficción: la robótica humanoide de propósito general. Aquí analizamos lo que está haciendo la empresa y lo que podría significar.

¿Qué está haciendo Nvidia?

El principal anuncio de la conferencia anual de desarrollo de la compañía el lunes fue la serie «Blackwell» de chips de IA, utilizados para alimentar los centros de datos increíblemente caros que entrenan modelos de IA de vanguardia, como las últimas generaciones de GPT, Claude y Gemini.

Uno, el Blackwell B200, es una actualización bastante sencilla del chip de IA H100 preexistente de la compañía. Para entrenar un modelo de IA masivo, del tamaño de GPT-4, se necesitarían actualmente unos 8.000 chips H100 y 15 megavatios de potencia, dijo Nvidia, suficiente para alimentar a unos 30.000 hogares británicos típicos.

Con los nuevos chips de la compañía, la misma sesión de capacitación requeriría sólo 2.000 B200 y 4 MW de potencia. Esto podría conducir a una reducción en el uso de electricidad por parte de la industria de la IA, o podría llevar a que la misma electricidad se utilice para alimentar modelos de IA mucho más grandes en un futuro próximo.

¿Qué hace que un chip sea «súper»?

Además del B200, la compañía anunció una segunda parte de la línea Blackwell: el “superchip” GB200. Incluye dos chips B200 en una sola placa junto con la CPU Grace de la compañía, para construir un sistema que, según Nvidia, ofrece «30 veces el rendimiento» para las granjas de servidores que ejecutan, en lugar de entrenar, chatbots como Claude o ChatGPT. Ese sistema también promete reducir el consumo de energía hasta 25 veces, dijo la compañía.

Poner todo en el mismo tablero mejora la eficiencia al reducir la cantidad de tiempo que los chips pasan comunicándose entre sí, lo que les permite dedicar más tiempo de procesamiento a procesar los números que hacen que los chatbots canten, o al menos hablen.

Huang muestra nuevos productos de chips en la conferencia Nvidia GTC. Fotografía: Josh Edelson/-/Getty Images

¿Y si quiero más grande?

Nvidia, que tiene un valor de mercado de más de 2 billones de dólares (1,6 billones de libras esterlinas), estaría encantada de ofrecerlo. Tomemos como ejemplo el GB200 NVL72 de la empresa: un único bastidor de servidor con 72 chips B200 configurados, conectados por casi dos millas de cableado. ¿Eso no es suficiente? ¿Por qué no mirar el DGX Superpod, que combina ocho de esos bastidores en un centro de datos de IA del tamaño de un contenedor de envío en una caja? El precio no se reveló en el evento, pero es seguro decir que si tiene que preguntar, no puede pagarlo. Incluso la última generación de chips llegó a costar unos considerables 100.000 dólares cada uno.

omitir la promoción pasada del boletín

Huang revela detalles de la plataforma ‘Blackwell’ de Nvidia. Fotografía: Justin Sullivan/Getty Images

¿Qué pasa con mis robots?

El Proyecto GR00T, aparentemente llamado así por el alienígena arboriforme de Marvel, aunque no vinculado explícitamente a él, es un nuevo modelo básico de Nvidia desarrollado para controlar robots humanoides. Un modelo básico, como GPT-4 para texto o StableDiffusion para generación de imágenes, es el modelo de IA subyacente sobre el que se pueden construir casos de uso específicos. Son la parte más costosa de crear de todo el sector, pero son los motores de toda innovación futura, ya que pueden “ajustarse” a casos de uso específicos en el futuro.

El modelo básico de Nvidia para robots les ayudará a «comprender el lenguaje natural y emular movimientos observando las acciones humanas, aprendiendo rápidamente coordinación, destreza y otras habilidades para navegar, adaptarse e interactuar con el mundo real».

GR00T se combina con otra pieza de tecnología de Nvidia (y otra referencia de Marvel) en Jetson Thor, un sistema en un chip diseñado específicamente para ser el cerebro de un robot. El objetivo final es una máquina autónoma a la que se le pueda instruir utilizando el habla humana normal para realizar tareas generales, incluidas aquellas para las que no ha sido entrenada específicamente.

Un robot sube al escenario en la conferencia Nvidia GTC. Fotografía: Josh Edelson/-/Getty Images

¿Cuántico?

Uno de los pocos sectores de moda en los que Nvidia no tiene participación es la computación cuántica en la nube. La tecnología, que sigue a la vanguardia de la investigación, ya se ha incorporado a ofertas de Microsoft y Amazon, y ahora Nvidia está entrando en juego.

Pero la nube de Nvidia en realidad no estará conectada a una computadora cuántica. En cambio, la oferta es un servicio que utiliza sus chips de inteligencia artificial para simular una computadora cuántica, lo que idealmente permitiría a los investigadores probar sus ideas sin tener que gastar dinero en acceder a algo real (raro y costoso). Pero en el futuro, Nvidia proporcionará acceso a computadoras cuánticas de terceros a través de la plataforma, dijo.

You may also like

Leave a Comment