Actualizaciones de Gemini AI, nuevas funciones de búsqueda y más

El director ejecutivo de Google, Sundar Pichai, habla en la conferencia de desarrolladores Google I/O.

Andrej Sokolow | Alianza de imágenes | imágenes falsas

Google el martes organizó su conferencia anual de desarrolladores de E/S y lanzó una gama de productos de inteligencia artificial, desde nuevas funciones de búsqueda y chat hasta hardware de inteligencia artificial para clientes de la nube. Los anuncios subrayan el enfoque de la compañía en la IA mientras se defiende de competidores, como OpenAI.

Muchas de las funciones o herramientas que Google presentó están solo en una fase de prueba o limitadas a los desarrolladores, pero dan una idea de cómo piensa el gigante tecnológico sobre la IA y dónde está invirtiendo. Google gana dinero con la IA cobrando a los desarrolladores que usan sus modelos y a los clientes que pagan por Gemini Advanced, su competidor de ChatGPT, que cuesta 19,99 dólares al mes y puede ayudar a los usuarios a resumir archivos PDF, Google Docs y más.

Los anuncios del martes siguen a eventos similares realizados por sus competidores de IA. A principios de este mes, AmazonasAnthropic, respaldado por Google, anunció su primera oferta empresarial y una aplicación gratuita para iPhone. Mientras tanto, OpenAI lanzó el lunes un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una nueva interfaz de usuario.

Esto es lo que anunció Google.

Actualizaciones de la IA de Géminis

Google presentó actualizaciones de Gemini 1.5 Pro, su modelo de IA que pronto podrá manejar aún más datos; por ejemplo, la herramienta puede resumir 1.500 páginas de texto cargadas por un usuario.

También hay un nuevo modelo Gemini 1.5 Flash AI, que según la compañía es más rentable y está diseñado para tareas más pequeñas como resumir rápidamente conversaciones, subtitular imágenes y videos y extraer datos de documentos grandes.

El director ejecutivo de Google, Sundar Pichai, destacó las mejoras en las traducciones de Gemini y agregó que estará disponible para todos los desarrolladores en todo el mundo en 35 idiomas. Dentro de Gmail, Gemini 1.5 Pro analizará archivos PDF y videos adjuntos, brindando resúmenes y más, dijo Pichai. Eso significa que si te perdiste un largo hilo de correo electrónico durante las vacaciones, Gemini podrá resumirlo junto con los archivos adjuntos.

Las nuevas actualizaciones de Gemini también son útiles para buscar en Gmail. Un ejemplo que dio la compañía: si ha estado comparando precios de diferentes contratistas para arreglar su techo y está buscando un resumen que lo ayude a decidir a quién elegir, Gemini podría devolverle tres cotizaciones junto con las fechas de inicio anticipadas que se ofrecen en los diferentes correos electrónicos. hilos.

Google dijo que Gemini eventualmente reemplazará a Google Assistant en los teléfonos Android, lo que sugiere que será un competidor más poderoso para manzana Siri en iPhone.

Google Veo, Imagen 3 y descripciones generales de audio

Google anunció «Veo», su último modelo para generar vídeo de alta definición, e Imagen 3, su modelo de conversión de texto a imagen de mayor calidad, que promete imágenes realistas y «menos artefactos visuales que distraigan que nuestros modelos anteriores».

Las herramientas estarán disponibles para creadores seleccionados el lunes y llegarán a Vertex AI, la plataforma de aprendizaje automático de Google que permite a los desarrolladores entrenar e implementar aplicaciones de IA.

La compañía también presentó «Audio Overviews», la capacidad de generar debates de audio basados en la entrada de texto. Por ejemplo, si un usuario sube un plan de lección, el chatbot puede resumirlo. O, si solicita un ejemplo de un problema científico de la vida real, puede hacerlo a través de audio interactivo.

Nuevas funciones de búsqueda

El gigante tecnológico lanzará «Descripciones generales de IA» en la Búsqueda de Google el lunes en EE. UU. Las descripciones generales de IA muestran un resumen rápido de las respuestas a las preguntas de búsqueda más complejas, según Liz Reid, directora de Búsqueda de Google. Por ejemplo, si un usuario busca la mejor manera de limpiar botas de cuero, la página de resultados puede mostrar una «Descripción general de IA» en la parte superior con un proceso de limpieza de varios pasos, obtenido a partir de la información que sintetizó en la web.

La compañía dijo que planea introducir capacidades de planificación similares a asistentes directamente dentro de la búsqueda. Explicó que los usuarios podrán buscar algo como «‘Crear un plan de alimentación de 3 días para un grupo que sea fácil de preparar'» y obtendrán un punto de partida con una amplia gama de recetas de toda la web. .

En cuanto a su progreso para ofrecer «multimodalidad», o integrar más imágenes y videos dentro de las herramientas de inteligencia artificial generativa, Google dijo que comenzará a probar la capacidad de los usuarios de hacer preguntas a través de videos, como filmar un problema con un producto de su propiedad, subir y pedirle al motor de búsqueda que resuelva el problema. En un ejemplo, Google mostró a alguien filmando un tocadiscos roto mientras preguntaba por qué no funcionaba. La Búsqueda de Google encontró el modelo del tocadiscos y sugirió que podría estar funcionando mal porque no estaba correctamente equilibrado.

Otra característica nueva que se está probando se llama «AI Teammate», que se integrará en el Google Workspace del usuario. Puede crear una colección de trabajos con capacidad de búsqueda a partir de mensajes e hilos de correo electrónico con más archivos PDF y documentos. Por ejemplo, un futuro fundador podría preguntarle a su compañero de equipo de IA: «¿Estamos listos para el lanzamiento?» y el asistente proporcionará un análisis y un resumen basado en la información a la que puede acceder en Gmail, Google Docs y otras aplicaciones de Workspace.

Proyecto Astra

Hardware de IA

Google también anunció Trillium, su TPU o unidad de procesamiento de tensor de sexta generación, una pieza de hardware integral para ejecutar operaciones complejas de inteligencia artificial, que estará disponible para los clientes de la nube a fines de 2024.

Los TPU no están destinados a competir con otros chips, como Nvidia Unidades de procesamiento de gráficos. Pichai señaló durante I/O, por ejemplo, que Google Cloud comenzará a ofrecer las GPU Blackwell de Nvidia a principios de 2025.

Nvidia dijo en marzo que Google utilizará la plataforma Blackwell para «varias implementaciones internas y será uno de los primeros proveedores de nube en ofrecer instancias impulsadas por Blackwell», y que el acceso a los sistemas de Nvidia ayudará a Google a ofrecer herramientas a gran escala para empresas. desarrolladores que construyen grandes modelos de lenguaje.

En su discurso, Pichai destacó la «larga asociación de Google con Nvidia». Las empresas han estado trabajando juntas durante más de una década, y Pichai ha dicho en el pasado que espera que sigan haciéndolo dentro de una década.

No te pierdas estas exclusivas de CNBC PRO

Vea la entrevista completa de CNBC con el director ejecutivo de Alphabet, Sundar Pichai

You may also like

Leave a Comment