La llegada de ChatGPT, la IA generativa que crea textos a partir de peticiones expresadas de manera natural, supuso toda una revolución a finales de 2022. Desde entonces, esta tecnología no ha dejado de avanzar y explorar nuevos campos y usos. El último paso lo ha dado la propia OpenAI (creadora de ChatGPT) con el anuncio de Sora, un sistema en fase de prueba que la compañía acaba de anunciar y que genera vídeos con un sorprendente nivel de realismo a partir de las descripciones detalladas de los usuarios.
De momento, se desconoce la fecha en la que se pondrá a disposición del público y, actualmente, su acceso está limitado a un equipo encargado de detectar daños y riesgos de seguridad potenciales en la creación de vídeos con inteligencia artificial, además de algunos artistas, diseñadores y cineastas para que aporten su opinión.
Cómo funciona Sora
Según explica la compañía, su funcionamiento es bastante sencillo y resultará familiar para quienes hayan utilizado alguna herramienta de IA generativa con anterioridad: el usuario describe de manera natural lo que desea crear y a continuación Sora lo interpreta y genera el vídeo. Para entrenarla se han empleado miles de horas de vídeos y OpenAI ha aprovechado también la experiencia sobre interpretación del lenguaje humano que ha puesto en práctica en servicios como ChatGPT.
Para conseguir los mejores resultados la empresa señala que será recomendable escribir las instrucciones con el máximo nivel de detalle y precisión; no se trata sólo de que el usuario enumere los elementos que desea que aparezcan en el vídeo, sino también añadir instrucciones adicionales como el tipo de paisaje, el entorno, la incidencia de la luz, el movimiento o el estado de ánimo de los protagonistas.
Las posibilidades de Sora no se limitarán a la creación de vídeos partiendo de una descripción escrita: será capaz de convertir una imagen fija en vídeo y, también, usar un vídeo ya existente para ampliarlo o completar los fotogramas que falten.
Mayor realismo con más aprendizaje
Hasta el momento, esta herramienta únicamente produce vídeos de 60 segundos de duración sin sonido y, según sus creadores, presenta algunos problemas para recrear con exactitud algunos elementos físicos. Aun así, y dado que esta tecnología ‘aprende’ y acumula conocimientos con cada ensayo y creación, los vídeos irán perfeccionando su realismo según aumente su biblioteca de contenidos. En su web están disponibles diferentes ejemplos con sus descripciones y los resultados finales para quienes deseen conocer hasta dónde llega su capacidad actual.