Sora es un sistema de inteligencia artificial creado por OpenAI, misma empresa que ha creado otros sistemas como ChatGPT y DALL-E; sin embargo, esta herramienta es una IA que genera videos a partir de texto, de modo que escribes lo que quieres ver a través de un prompt o comando textual
Sora es la nueva herramienta presentada por OpenAI, creadores de ChatGPT y DALL-E, que tiene la capacidad de utilizar inteligencia artificial para generar vídeos realistas de 60 segundos de duración a partir de indicaciones de textos rápidas.
Con base en la información emitida por la compañía, los videos creados por la IA pueden mostrar escenas con múltiples personajes, movimientos y detalles tanto del sujeto como en el fondo.
De igual manera, revelaron que esta nueva aplicación ‘Sora’ desde una base de comandos textuales, tiene la capacidad de generar videos acordes a las peticiones realizadas por los usuarios.
“El modelo comprende no solo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico, así lo confirmó OpenAI en una publicación dentro de su blog.
A pesar de que la tecnología de Sora aún no está disponible al público, ha desatado preocupación entre los expertos y analistas, pues su potencial impacto en múltiples sectores, entre los que destacan la industria del entretenimiento, la seguridad informática y la integridad de los procesos democráticos.
Por el momento, su uso está limitado a un grupo selecto de “red teamers”, artistas visuales, diseñadores y cineastas, quienes están contribuyendo con sus opiniones para perfeccionar el producto antes de su lanzamiento masivo.
¿Cómo funciona Sora de OpenAI?
La herramienta Sora es un sistema de inteligencia artificial creado por OpenAI, misma empresa que ha creado otros sistemas como ChatGPT y DALL-E, sin embargo, esta herramienta es una IA que genera videos a partir de texto, de modo que escribes lo que quieres ver a través de un prompt o comando textual.
Dicha inteligencia artificial es similar a los modelos que crean imágenes a partir de un texto y que se basa en parte de la tecnología de modelos de lenguaje como GPT. Este sistema es capaz de entender lo que pide un usuario con lenguaje natural, pues ha sido entrenada para entender la manera en la que solemos hablar y cómo nos expresamos para pedir o preguntar algo.
Tras entender lo que le has pedido en un prompt, Sora podrá generar videos en los que se vea en movimiento lo que le has pedido, lo que supone un paso más con respecto a la creación de imágenes.
Cabe señalar que esto lo ha conseguido porque es un modelo entrenado con una biblioteca de videos, de forma que sabe reconocer movimientos, descripciones y cualquier cosa que le pidas, y será capaz de recrearlos en vídeo. Además, sabrá a lo que te refieres cuando le hables de tipos de personas, de vestimenta, de accesorios o de efectos visuales.
No obstante, OpenAI señaló que Sora sigue siendo un trabajo en progreso y con claras debilidades, sobre todo, cuando se trata de detalles especiales de un mensaje y causa y efecto y agregó que planea trabajar con un equipo de expertos para probar el último modelo y observar varias áreas, incluida la desinformación, los consentidos que incitan al odio y la parcialidad, además de que están creando herramientas para ayudar a detectar información engañosa.
Con información de El Universal, El Mundo, Infobae, CNN Español, Xataka