Cuando todavía miramos con una mezcla de escepticismo, sorpresa y esperanza el avance de los modelos de Inteligencia Artificial generativa, OpenAI ha dado el siguiente paso: Sora, una disruptiva herramienta para crear vídeos de hasta 60 segundos a partir de texto. Te contamos todos los detalles.
Haciendo uso de su altavoz a través de X, antigua Twitter, Sam Altman presentó ayer en sociedad su última creación: Sora. Instantes después, la red social se inundó de todo tipo de vídeos, con sus respectivos prompts, realizados con ella. Como si de una representación se tratase, los usuarios de X asistimos a todo tipo de propuestas que comprendían un amplio espectro de variantes: vídeos realistas, de dibujos animados, de animales… Pero todos, con un mismo denominador común: una resolución y un nivel de detalle fuera de lo común, especialmente si tenemos en cuenta que únicamente hace falta darle la orden pertinente a Sora para que lleve a cabo la creación.
Conocimiento del lenguaje
“Una mujer elegante camina por una calle de Tokio llena de luces de neón brillantes y carteles animados de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y lápiz labial rojo. Camina con confianza y despreocupación. La calle está húmeda y refleja, creando un efecto espejo de las luces de colores. Muchos peatones caminan por allí”. Este ha sido uno de los ejemplos que OpenAI ha hecho públicos. Y sus resultados, accesibles desde enlace, no dejan lugar a dudas de lo que esta herramienta puede llegar a suponer para la industria creativa.
Sora no solo comprende la orden que emite el usuario en cada petición. Sino que también es capaz de entender cómo cada uno de los objetos que tiene que representar existen en el mundo físico y conviven con el resto de los objetos. De este modo, la herramienta permite generar todo tipo de escenarios complejos con diferentes personajes. Ofreciéndonos un gran nivel de detalle no solo del sujeto, sino también del fondo sobre el que transcurre la acción.
Todo ello se ha conseguido gracias a un “profundo conocimiento del lenguaje”. Una característica que le permite generar “personajes convincentes que expresan emocionantes vibrantes”.
Diferentes creaciones
Como ya hemos mencionado previamente, Sora es capaz de generar vídeos de 60 segundos a partir de una serie de instrucciones que le ofrezcamos por medio del texto. Sin embargo, no es esta su única función. OpenAI ha decidido dar un paso más allá, el modelo también es capaz de, a partir de una imagen fija que le ofrezcamos, generar un vídeo completo. No solo animará el contenido, sino también todos los detalles que transcurren en torno al mismo.
Sora también hereda funciones de ChatGPT, como la posibilidad de mejorar el contenido que introducimos en la herramienta. Tiene la capacidad de, a partir de un vídeo ya existente, ampliarlo con fotogramas que puedan mejorar el mismo con un gran nivel de detalle.
Disponibilidad
Durante la presentación de ayer, OpenAI afirmó que inicialmente Sora estará disponible únicamente para un seleccionado número de usuarios, que tendrán el trabajo de probarlo y llevarlo al límite, con el objetivo de detectar posibles “áreas críticas en busca de daños o riesgos”. Además, la compañía también se ha querido acercar a la comunidad de artistas, creadores y profesionales del cine, ofreciéndoles acceso a la herramienta para comprobar cómo puede llegar a simplificar su trabajo en el día a día.
OpenAI también ha querido detenerse a explicar algunas de las áreas de oportunidad con las que todavía cuenta el modelo. Ha puesto como ejemplo la acción de una persona dando un mordisco a una galleta, pero en el fotograma siguiente no se muestra la marca del mordisco. O, también, que en ocasiones confunde orientaciones espaciales como izquierda y derecha en determinadas situaciones.
La compañía no ha querido perder la oportunidad de resaltar los esfuerzos que está realizando en materia de seguridad y de privacidad. Afirmando que se rechazarán “las solicitudes de ingreso de texto que infrinjan nuestras políticas de uso, como aquellas que solicitan violencia extrema, contenido sexual, imágenes de odio, imágenes de celebridades o la IP de otros”.
Pese a que no se ha compartido ninguna fecha oficial, se espera que a medida que las comunidades previamente mencionadas vayan probando la aplicación, OpenAI decida un aterrizaje masivo en el mercado durante las próximas semanas.
The post Sora, la última revolución de OpenAI: generar vídeos a partir de texto nunca fue tan sencillo appeared first on ADSLZone.
0 Commentaires