La búsqueda en Google ahora se realiza mediante IA generativa… Asistente de IA también lanzado
Resuma rápidamente los resultados de la búsqueda a través de la «Descripción general de IA»… “Gran cambio en 25 años”
Google ha lanzado oficialmente un motor de búsqueda equipado con su IA generativa Gemini.
También se introdujeron funciones de inteligencia artificial (IA), como un asistente que habla como un humano.
Google celebró la ‘Conferencia Anual de Desarrolladores (I/O) de Google’ en el Shoreline MP Theatre en Mountain View, California, el día 14 (hora local) y discutió cómo hacer realidad el futuro de la IA a través de su último modelo de IA, anunció Gemini. visión para
«Hemos puesto todo lo imaginable en IA en el ecosistema Gemini», dijo el director ejecutivo, Sundar Pichai. «Nos complace anunciar que a partir de esta semana lanzaremos ‘AI Overview’, una experiencia completamente renovada para todos los usuarios en los Estados Unidos». él dijo.
‘AI Overview’ es una función que le permite resumir rápidamente los resultados de búsqueda y recibir enlaces relacionados usando Gemini. Puede buscar en forma de conversación y puede buscar no solo a través de fotos sino también de videos.
Google comenzó a utilizar IA para redactar respuestas a preguntas el año pasado, pero era una versión experimental.
– dijo: «La instalación de IA generativa en los motores de búsqueda es el mayor cambio en 25 años desde la llegada de la Búsqueda de Google».
La nueva función de búsqueda impulsada por Gemini estará disponible en EE. UU. y otros países en los próximos meses. Google planea ofrecerlo a más de mil millones de personas antes de fin de año.
Google también presentó un nuevo ‘Proyecto Astra’ basado en Gemini y el modelo de voz de Google.
Esta es la visión de Google para implementar un futuro asistente de IA. Se trata de una función en la que la IA puede ver y oír como un ser humano y comunicarse con la voz, actuando como el asistente personal del usuario.
Demis Hassabis, director ejecutivo de Google DeepMind, dijo: «Hace mucho que queremos crear un agente de IA universal que pueda ser útil en la vida cotidiana», y agregó: «A través de un factor de forma como un teléfono móvil o gafas, podemos tener un asistente experto». a nuestro lado”. “Es fácil imaginar el futuro”, enfatizó.
El video de demostración muestra un asistente de inteligencia artificial que muestra los alrededores usando la cámara de un teléfono celular, le dice al usuario dónde están las gafas cuando se le solicita, determina con precisión la ubicación actual y la anuncia por voz cuando se le solicita.
Google también publicó un vídeo de una persona con gafas inteligentes hablando con IA para implementar el Proyecto Astra.
Bloomberg News dijo: «Google Glass, un dispositivo de realidad aumentada (AR) que fue muy popular entre los consumidores hace 10 años, se está preparando para un renacimiento gracias a la IA».
Google presentó ‘Gemini Live’ como un paso preliminar hacia el Proyecto Astra Vision. Esta función se comunica como un humano y reconoce imágenes a través de la carga.
Google planea lanzar ‘Gemini Live’ dentro de unos meses y luego agregar funciones para el Proyecto Astra, como visión y audición en tiempo real.
Google también anunció que Gemini 1.5 Pro, un modelo de IA multimodal lanzado en febrero, se lanzará en 35 idiomas, incluido el coreano, a partir de hoy.
Gemini 1.5 Pro es una versión mejorada de Gemini 1.0 Ultra. Puede resumir 100 correos electrónicos en sólo segundos y procesar una hora de vídeo a la vez.
La cantidad de información que un modelo de IA puede procesar a la vez se denomina «ventana de contexto», que se compone de «tokens» con significados como palabras, imágenes, vídeos, audio y códigos.
Gemini 1.5 Pro tiene la capacidad de procesar hasta 1 millón de tokens. También está previsto el lanzamiento pronto de una versión con capacidad para procesar 2 millones de tokens.
También se presentó Gemini 1.5 Flash, que es más liviano que Gemini 1.5 Pro pero tiene la misma función de inferencia multimodal y función de contexto largo.
Junto con Imagen 3, también se lanzó la última versión de Imagen, una IA de texto a imagen, Veo, un modelo de IA que crea un video de más de 1 minuto ingresando texto.
También anunciaron Trillium, el TPU de sexta generación, un semiconductor de IA para servidores. Google explicó que el rendimiento informático máximo por chip ha mejorado 4,7 veces en comparación con el modelo anterior.
Además, Google ha decidido ampliar la aplicación de la tecnología ‘SynthID’, que inserta una marca de agua invisible en imágenes generadas por IA, a texto y vídeo.
Google dijo: «A través de este evento, anunciamos la apertura a gran escala de la ‘era Gemini'» y «Planeamos acelerar la innovación en IA completando el ecosistema Gemini».
Hola, reportero de Tea, Kim Jin-hee |
