La generación de contenido audiovisual a partir de texto para recrear escenas imaginarias tiene un nuevo aliado. Se trata de Sora, una plataforma creada por la empresa OpenAI, los mismos de ChapGPT y DALL-E, que ahora busca tener una propuesta completa para contenidos de video.
La empresa ha señalado que a través del aprendizaje la tecnología de IA ahora puede comprender y simular el mundo físico en movimiento y de esa manera crear mecanismos para ayudar a las personas a resolver los problemas que tengan y que requieren una interacción con el mundo real.
“Sora puede generar videos de hasta un minuto de duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario”, indica OpenAI en su plataforma web.

Indican que actualmente la plataforma está disponible sólo para los investigadores de OpenAI y para un grupo de artistas visuales, diseñadores y cineastas que la están probando para dar sus comentarios y posteriormente avanzar en el modelo, para que sea útil para los profesionales de la industria creativa.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
“Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino que también puede integrar a la escena cosas que existen en el mundo físico”.

La plataforma puede crear múltiples tomas dentro de un solo video generando con precisión los personajes y el estilo visual.
Según OpenAI el modelo actual de Sora está siendo perfeccionado pues tiene algunos temas por superar.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
“Puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”, admite la empresa que usa la inteligencia artificial generativa.

Otro problema que se ha encontrado es que puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

