Inteligencia Artificial

Sora, ¿el ChatGPT del video?

OpenAI, los mismos creadores de ChatGPT, dieron la noticia del mes en lo que se refiere a Inteligencia Artificial con Sora, una plataforma para crear vídeos a partir de texto. ¿Qué impacto puede tener en la industria?

Publicado el 19 de feb de 2024

Jorge Hernández

¿Se imagina poder crear el prototipo de su comercial de vídeo con solo dar un par de instrucciones en texto? ¿Sin necesidad de hablar con su agencia de publicidad, sin creativos que no entienden la marca, ni ejecutivos de cuenta que demoran los procesos? Pues Sora ya lo hace posible.

Desarrollado por OpenAI, los mismos creadores de ChatGPT y DALL-E, Sora permite crear vídeos de hasta 60 segundos y con estándares de calidad que parecen de broma. Es más, sus muestras fueron tan impactantes que algunos competidores borraron algunos anuncios de sus redes sociales.

Con Sora sería posible saltar varios pasos en los procesos de producción multimedia tradicional. Incluso no sería extraño que en el futuro se le pida a ChatGPT crear una historia (storytelling) y que produzca un piloto de vídeo automáticamente. El único eslabón faltante de la cadena audiovisual para OpenAI es el audio.

Ver este video en YouTube

Por cierto, OpenAI ya tiene un servicio relacionado llamado Whisper que, por ahora, ha sido limitado para el reconocimiento de voz y transcripción de textos, pero su potencial va mucho más allá de esto.

Índice de temas

Limitaciones, fechas y competidores

Sí, Sora le emociona, le tenemos algunas malas noticias. Por ahora, su uso está restringido para el “red team” de OpenAI, un grupo de expertos contratados para analizar los riesgos de la Inteligencia Artificial, y a un selecto grupo de creadores de contenido.

Estas limitaciones no son extrañas en medio de un año electoral en Estados Unidos. ¿Se imagina crear un vídeo fotorealista de Trump o Biden en plena campaña? Pero esto es apenas una muestra del potencial dañino de esta herramienta.

Por ello, los vídeos producidos por Sora tienen una ‘marca de agua’ y deben seguir las mismas políticas de uso de DALL-E referentes a nada de violencia, porno o apropiarse de personas reales u obras de artistas conocidos.

En conclusión, por ahora no hay una fecha estimada de apertura al público masivo, pero el potencial de esta herramienta es tan grande que no sería extraño contar con paquetes corporativos para empresas de contenido.

Otros jugadores

Aunque Sora suena impresionante y de hecho fue un golpe de autoridad de OpenAI, también es cierto que existen grandes competidores en el campo del ‘text-to-video’, como son Google y RunWay por solo mencionar dos casos.

El primero de ellos hizo noticia en enero con el lanzamiento de Lumiere, la plataforma de vídeo de Google que ahora parece limitada comparada con Sora. Recordemos que en su lanzamiento se demostraron vídeos de hasta 5 segundos creados a partir de imágenes o frases.

Pero lo más interesante de Lumiere es su arquitectura STUNet (Space-Time U-Net) que, contrario a otros modelos que crean primero fotogramas y luego generan imágenes de relleno, el modelo Lumiere es más coherente generando en una sola pasada toda la duración temporal del vídeo.

Ver este video en YouTube

Por su parte, Runway, una startup con líderes chilenos, ya es un jugador establecido en el campo del vídeo usando Inteligencia Artificial, pero genera clips de apenas 4 segundos que se pueden ir ampliando hasta los 16. Otros jugadores destacados en este campo son Stability, los mismos de Stable Difusión, y Pika, entre otros.

Retos y derechos

Aún es pronto para conocer el verdadero impacto de modelos como Sora en la industria de contenido audiovisual, pero si las historias de Shutterstock y Getty Images sirven de modelo, es muy probable que los bancos de imágenes y vídeos sean los primeros en adoptarla comercialmente.

Y aunque surjan resistencias, recordemos la huelga de guionistas en Hollywood, los beneficios en reducción de costos y optimización de procesos de la IA las harán ganar cada día más participación de mercado. Por cierto, el Foro Económico Mundial estima que para 2025, 85 millones de puestos de trabajo podrían desaparecer.

Sin embargo, la IA es solo una herramienta y aún falta mucha tela por cortar que cobije desde aspectos de protección de propiedad intelectual y fraude (deepfakes) hasta la generación de nuevos modelos de trabajo. En otras palabras, es pronto para saber donde acabará el frenesí de la IA.

¿Recuerda que en la revolución industrial del siglo XIX, los artesanos empezaron a quemar las máquinas textiles para que no les quitaran sus trabajos? ¿Recuerda de cuánto les sirvió? La revolución de la IA no tiene reversa y el problema no es luchar contra ella, es cómo sacarle el mejor provecho y ese es el reto de las empresas en este 2024.

Prohibida su reproducción total o parcial.

Periodista de tecnología, escritor y libretista. Editor en ImpactoTIC

Jorge Hernández

Periodista de la Universidad de La Sabana, escritor y guionista con más de 20 años de experiencia en medios como El Tiempo, El Espectador y la revista Esquire, además de medios de tecnología como Canal Informático y CityTech. Libretista de estudio para las cadenas RCN y ESPN. Además, ganador en convocatorias para el desarrollo de videojuegos (CREA Digital 2020) y series de televisión (Ibermedia 2023). Periodista de Impacto TIC, medio del grupo Nextwork360. Gamer y amante de la tecnología y toda clase de narrativas digitales y tradicionales.

Sígame en