OpenAI, el creador de ChatGPT y el generador DALL-E, anunció una nueva herramienta llamada Sora, que sirve para crear videos realistas de hasta un minuto de duración simplemente ingresando una solicitud de texto, lo cual es una gran innovación en el campo de inteligencia artificial.
La startup aliada de Microsoft explicó que esta nueva plataforma, que se basa en investigaciones previas realizadas sobre los programas DALL-E y ChatGPT, aún está en fase de pruebas, pero no obstante mostró algunos videoclips y explicó cómo surgió.
OpenAI explicó en su sitio web que el programa puede crear vídeos de hasta un minuto de duración “manteniendo la calidad visual y respetando la solicitud del usuario”.
Añadió que Sora puede crear «escenas complejas que involucran múltiples personajes, tipos específicos de movimientos y detalles precisos».
La nueva herramienta también permite crear un vídeo a partir de una imagen fija o ampliar clips de vídeo existentes, según la empresa.
El presidente de OpenAI, Sam Altman, indicó en la plataforma “X” que la empresa pondrá la nueva herramienta a disposición de un “número limitado” de creadores de contenidos, en el marco de una fase piloto.
También invitó a los usuarios a enviar sugerencias relacionadas con la creación de videoclips y, momentos después, mostró los más destacados en la plataforma.
Entre estos clips se encuentra uno en el que se muestra a dos perros peleando en la nieve en una zona montañosa, y otro videoclip muestra a un animal volador imaginario, mitad pato y mitad dragón, en una maravillosa escena de atardecer, con un hámster vestido con ropa deportiva. sobre su espalda.
La herramienta «Sora» constituye la base de «programas capaces de comprender y simular el mundo real», según la startup, que espera que sea «un paso importante hacia la consecución de la inteligencia artificial general», que es un sistema altamente autónomo cuyo capacidades exceden lo que los humanos son capaces de hacer en la mayoría de las tareas económicamente rentables.
Uso positivo
«OpenAI» advirtió que existen «defectos» en el «modelo actual» de la plataforma, entre ellos la confusión entre izquierda y derecha, o la imposibilidad de mantener la continuidad visual a lo largo del vídeo.
La compañía explicó que una persona en un videoclip “puede comer parte de una galleta, pero los efectos del mordisco pueden no aparecer en la galleta” en una segunda escena del videoclip.
La empresa confirmó que la cuestión de la seguridad será fundamental con respecto a esta herramienta, señalando que organizará simulaciones para definir mejor los límites de la plataforma.
La empresa añadió: «Involucraremos a responsables políticos, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología».
Los grupos Meta, Google y Runway AI han presentado anteriormente ejemplos de aplicaciones similares llamadas texto a video, que buscan crear.
