El director ejecutivo de Google, Sundar Pichai, habla en la conferencia de desarrolladores Google I/O.
Andrej Sokolow | Alianza de imágenes | imágenes falsas
Google el martes organizó su conferencia anual de desarrolladores de E/S y lanzó una gama de productos de inteligencia artificial, desde nuevas funciones de búsqueda y chat hasta hardware de inteligencia artificial para clientes de la nube. Los anuncios subrayan el enfoque de la compañía en la IA mientras se defiende de competidores, como OpenAI.
Muchas de las funciones o herramientas que Google presentó están solo en una fase de prueba o limitadas a los desarrolladores, pero dan una idea de cómo piensa el gigante tecnológico sobre la IA y dónde está invirtiendo. Google gana dinero con la IA cobrando a los desarrolladores que usan sus modelos y a los clientes que pagan por Gemini Advanced, su competidor de ChatGPT, que cuesta 19,99 dólares al mes y puede ayudar a los usuarios a resumir archivos PDF, Google Docs y más.
Los anuncios del martes siguen a eventos similares realizados por sus competidores de IA. A principios de este mes, AmazonasAnthropic, respaldado por Google, anunció su primera oferta empresarial y una aplicación gratuita para iPhone. Mientras tanto, OpenAI lanzó el lunes un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una nueva interfaz de usuario.
Esto es lo que anunció Google.
Actualizaciones de la IA de Géminis
También hay un nuevo modelo Gemini 1.5 Flash AI, que según la compañía es más rentable y está diseñado para tareas más pequeñas como resumir rápidamente conversaciones, subtitular imágenes y videos y extraer datos de documentos grandes.
El director ejecutivo de Google, Sundar Pichai, destacó las mejoras en las traducciones de Gemini y agregó que estará disponible para todos los desarrolladores en todo el mundo en 35 idiomas. Dentro de Gmail, Gemini 1.5 Pro analizará archivos PDF y videos adjuntos, brindando resúmenes y más, dijo Pichai. Eso significa que si te perdiste un largo hilo de correo electrónico durante las vacaciones, Gemini podrá resumirlo junto con los archivos adjuntos.
Las nuevas actualizaciones de Gemini también son útiles para buscar en Gmail. Un ejemplo que dio la compañía: si ha estado comparando precios de diferentes contratistas para arreglar su techo y está buscando un resumen que lo ayude a decidir a quién elegir, Gemini podría devolverle tres cotizaciones junto con las fechas de inicio anticipadas que se ofrecen en los diferentes correos electrónicos. hilos.
Google dijo que Gemini eventualmente reemplazará a Google Assistant en los teléfonos Android, lo que sugiere que será un competidor más poderoso para manzana Siri en iPhone.
Google Veo, Imagen 3 y descripciones generales de audio
Google anunció «Veo», su último modelo para generar vídeo de alta definición, e Imagen 3, su modelo de conversión de texto a imagen de mayor calidad, que promete imágenes realistas y «menos artefactos visuales que distraigan que nuestros modelos anteriores».
Las herramientas estarán disponibles para creadores seleccionados el lunes y llegarán a Vertex AI, la plataforma de aprendizaje automático de Google que permite a los desarrolladores entrenar e implementar aplicaciones de IA.
La compañía también presentó «Audio Overviews», la capacidad de generar debates de audio basados en la entrada de texto. Por ejemplo, si un usuario sube un plan de lección, el chatbot puede resumirlo. O, si solicita un ejemplo de un problema científico de la vida real, puede hacerlo a través de audio interactivo.
Por otra parte, la compañía también presentó «AI Sandbox», una gama de herramientas de inteligencia artificial generativa para crear música y sonidos desde cero, según las indicaciones del usuario.
Sin embargo, las herramientas de IA generativa, como los chatbots y los creadores de imágenes, siguen teniendo problemas de precisión.
A principios de este año, Google presentó el generador de imágenes impulsado por Gemini. Los usuarios descubrieron imprecisiones históricas que se volvieron virales en línea y la compañía eliminó la función y dijo que la relanzaría en las próximas semanas. La función aún no se ha vuelto a publicar.
Nuevas funciones de búsqueda
El gigante tecnológico lanzará «Descripciones generales de IA» en la Búsqueda de Google el lunes en EE. UU. Las descripciones generales de IA muestran un resumen rápido de las respuestas a las preguntas de búsqueda más complejas, según Liz Reid, directora de Búsqueda de Google. Por ejemplo, si un usuario busca la mejor manera de limpiar botas de cuero, la página de resultados puede mostrar una «Descripción general de IA» en la parte superior con un proceso de limpieza de varios pasos, obtenido a partir de la información que sintetizó en la web.
La compañía dijo que planea introducir capacidades de planificación similares a asistentes directamente dentro de la búsqueda. Explicó que los usuarios podrán buscar algo como «‘Crear un plan de alimentación de 3 días para un grupo que sea fácil de preparar'» y obtendrán un punto de partida con una amplia gama de recetas de toda la web. .
En cuanto a su progreso para ofrecer «multimodalidad», o integrar más imágenes y videos dentro de las herramientas de inteligencia artificial generativa, Google dijo que comenzará a probar la capacidad de los usuarios de hacer preguntas a través de videos, como filmar un problema con un producto de su propiedad, subir y pedirle al motor de búsqueda que resuelva el problema. En un ejemplo, Google mostró a alguien filmando un tocadiscos roto mientras preguntaba por qué no funcionaba. La Búsqueda de Google encontró el modelo del tocadiscos y sugirió que podría estar funcionando mal porque no estaba correctamente equilibrado.
Otra característica nueva que se está probando se llama «AI Teammate», que se integrará en el Google Workspace del usuario. Puede crear una colección de trabajos con capacidad de búsqueda a partir de mensajes e hilos de correo electrónico con más archivos PDF y documentos. Por ejemplo, un futuro fundador podría preguntarle a su compañero de equipo de IA: «¿Estamos listos para el lanzamiento?» y el asistente proporcionará un análisis y un resumen basado en la información a la que puede acceder en Gmail, Google Docs y otras aplicaciones de Workspace.
Proyecto Astra
El Proyecto Astra es el último avance de Google hacia su asistente de inteligencia artificial que está siendo desarrollado por la unidad de inteligencia artificial DeepMind de Google. Es solo un prototipo por ahora, pero puedes considerarlo como el objetivo de Google de desarrollar su propia versión de JARVIS, el omnisciente asistente de inteligencia artificial de Tony Stark del Universo Marvel.
En el vídeo de demostración presentado en Google I/O, el asistente, a través de vídeo y audio, en lugar de una interfaz de chatbot, pudo ayudar al usuario a recordar dónde dejó sus gafas, revisar el código y responder preguntas sobre qué parte determinada de un se llama al orador, cuando ese orador fue mostrado en video.
Google dijo que un chatbot verdaderamente útil debe permitir a los usuarios «hablar con él de forma natural y sin retrasos ni demoras». La conversación en el vídeo de demostración se desarrolló en tiempo real, sin demoras. La demostración siguió Presentación del lunes de OpenAI de una conversación de audio similar con ChatGPT.
El director ejecutivo de DeepMind, Demis Hassabis, dijo en el escenario que «reducir el tiempo de respuesta a algo conversacional es un desafío de ingeniería difícil».
Pichai dijo que espera que el Proyecto Astra se lance en Gemini a finales de este año.
Hardware de IA
Google también anunció Trillium, su TPU o unidad de procesamiento de tensor de sexta generación, una pieza de hardware integral para ejecutar operaciones complejas de inteligencia artificial, que estará disponible para los clientes de la nube a fines de 2024.
Los TPU no están destinados a competir con otros chips, como Nvidia Unidades de procesamiento de gráficos. Pichai señaló durante I/O, por ejemplo, que Google Cloud comenzará a ofrecer las GPU Blackwell de Nvidia a principios de 2025.
Nvidia dijo en marzo que Google utilizará la plataforma Blackwell para «varias implementaciones internas y será uno de los primeros proveedores de nube en ofrecer instancias impulsadas por Blackwell», y que el acceso a los sistemas de Nvidia ayudará a Google a ofrecer herramientas a gran escala para empresas. desarrolladores que construyen grandes modelos de lenguaje.
En su discurso, Pichai destacó la «larga asociación de Google con Nvidia». Las empresas han estado trabajando juntas durante más de una década, y Pichai ha dicho en el pasado que espera que sigan haciéndolo dentro de una década.

