OpenAI ha presentado Sora 2, la versión mejorada de su modelo de generación de vídeo con inteligencia artificial. La compañía ha estado trabajando en nuevas capacidades para la herramienta, que ahora incluye audio y vídeos más realistas y precisos, así como en una nueva experiencia que se materializa en una aplicación de social media, abriendo la era de las redes sociales sintéticas.
El modelo original de Sora se presentó en febrero de 2024 y se lanzó oficialmente el pasado diciembre, con una primera versión que, pese a las limitaciones, impresionó al mercado. Ahora, el modelo se ha entrenado para ofrecer creaciones que se asemejen más al mundo real. La compañía considera que Sora 2 podría ser a la generación de vídeo lo que GPT-3.5 supuso para el chatbot.
Así lo describen desde OpenAI: “Sora 2 puede hacer cosas excepcionalmente difíciles, y en algunos casos completamente imposibles, para los modelos de generación de video anteriores”, comentan en un comunicado. “Los modelos de video anteriores son demasiado optimistas: transforman objetos y deforman la realidad para ejecutar con éxito una instrucción de texto. Aunque sigue siendo imperfecto, obedece mejor las leyes de la física en comparación con los sistemas anteriores”.
Lo ilustra con un ejemplo. Con Sora si se creaba un vídeo en el que un jugador de baloncesto falla un tiro, la pelota puede teletransportarse espontáneamente al aro. En cambio, con Sora 2, si un jugador de baloncesto falla un tiro, rebota en el tablero. En este sentido, la compañía señala que han perfeccionado una capacidad útil para todo simulador, que es ser capaz de modelar el fracaso, no solo el éxito.
La nueva versión de Sora no sólo ofrece vídeo, sino que ahora es capaz de crear sofisticados paisajes sonoros de fondo, diálogos y efectos de sonido con un alto grado de realismo. Además, permite integrar elementos del mundo real, como animales, objetos o incluso personas, para lograr simulaciones con un representación precisa de apariencia y voz.
Una red social de deepfakes
La compañía acompaña la presentación de Sora 2 con una nueva aplicación social, llamada "Sora" y disponible para sistemas iOS bajo invitación en Estados Unidos y Canadá. Con ella, los usuarios pueden crear, descubrir nuevos vídeos en un feed personalizable o incluirse a si mismos o a sus amigos en vídeos. OpenAI explica que los usuarios puedes aparecer directamente en cualquier escena de Sora, lo que denomina cameos, “tras una breve grabación de vídeo y audio en la app para verificar tu identidad y capturar tu imagen”.
La aplicación se asemeja a TikTok, tal y como puede verse en la Apple Store. Cuenta con una página "Para ti" y una interfaz con desplazamiento vertical. Incluye la función llamada "Cameos", que permite a los usuarios dar permiso a la app para generar vídeos con su imagen. También se puede remezclar la imagen (incluso al interactuar con la de otras personas) describiendo el vídeo y el audio deseados en una instrucción de texto.

Todo ello plantea un nuevo escenario para la generación de simulaciones y deepfakes. OpenAI, no obstante, lo presenta desde la perspectiva del entretenimiento y la creatividad. “Creemos que la gente puede divertirse mucho con los modelos que estamos construyendo”, aseguran en el comunicado. "Empezamos a experimentar con esta función de "súbete" hace varios meses en el equipo de Sora, y todos nos divertimos muchísimo. Parecía una evolución natural de la comunicación: de los mensajes de texto a los emojis, las notas de voz y esto".
Desarrollado para evitar el doomscrolling
OpenAI asegura que ha desarrollado la aplicación atendiendo al riesgo de doomscrolling, adicción, o el aislamiento. A este respecto, apunta que ofrece a los usuarios herramientas y opciones para controlar lo que ven en su feed, y que sonderaá periódicamente a los usuarios sobre su bienestar.
Asimismo, explica que de forma predeterminada, muestra contenido con un fuerte sesgo hacia las personas que a las que se sigue o con las que se interactúa, y se priorizan los vídeos que el modelo considera que es más probable que el usuario vaya a usar como inspiración para sus propias creaciones. “No optimizamos el tiempo que pasas en el feed, y diseñamos la aplicación explícitamente para maximizar la creación, no el consumo”, dicen desde OpenAI.
Por otro lado, dice estar estableciendo límites predeterminados para el número de generaciones que los adolescentes pueden ver al día en el feed, y e implementando permisos más estrictos para los cameos. También asegura estar ampliando los equipos de moderadores humanos para revisar rápidamente los casos de acoso si surgen y estableciendo los controles parentales.
En lo que respecta a los cameos, OpenAI apunta que el usuario tiene control total de su imagen. En este sentido, sólo el usuario decide quién puede usar su cameo y se puede revocar el acceso o eliminar cualquier video que lo incluya en cualquier momento. También puede ver los videos que contienen cameos suyos, incluyendo borradores creados por otras personas, en cualquier momento.
Noticias Relacionadas

OpenAI permite la compra a través de ChatGPT y abre un nuevo escenario para el e-commerce
{"id":27976,"titular":"OpenAI permite la compra a través de ChatGPT y abre un nuevo escenario para el e-commerce","prefijo":null,"slug":null,"image":"https://www.reasonwhy.es/media/cache/noticia_relacionada/media/library/chatgpt-compra-directa.jpg","path":"/actualidad/openai-instant-checkout-comprar-en-chatgpt"}
OpenAI crea “películas” de sencillas historias humanas para la primera campaña de marca de ChatGPT
{"id":27968,"titular":"OpenAI crea “películas” de sencillas historias humanas para la primera campaña de marca de ChatGPT","prefijo":null,"slug":null,"image":"https://www.reasonwhy.es/media/cache/noticia_relacionada/media/library/chatgpt-campana-marca.jpg","path":"/actualidad/openai-peliculas-historias-humanas-campana-marca-chatgpt"}Además, según recoge The Verge, cada vídeo creado con Sora incluirá señales para indicar que está generado por IA, como metadatos o una marca de agua. La compañía también dice contar con herramientas de detección internas para ayudar a evaluar si un determinado vídeo o audio fue creado con Sora. La aplicación tampoco permite la grabación de pantalla.
En lo que respecta a los deepfakes, OpenAI ha explicado, tal y como informa el citado medio, que no se pueden generar la imagen de figuras públicas en Sora a menos que hayan subido un cameo y dado su consentimiento para su uso. Tampoco será posible generar contenido para adultos o "extremo" a través de la plataforma.
Con todo, la precisión y sofisticación alcanzada por Sora 2 incrementa la dificultad para distinguir lo que es real de lo que no, y la incursión de OpenAI en el terreno del social media allana el camino hacia una realidad sintética. Pese a ello, la compañía considera que su propuesta mejorará lo existente. “Vemos esto como el comienzo de una era completamente nueva para las experiencias cocreativas. Somos optimistas y creemos que esta será una plataforma más saludable para el entretenimiento y la creatividad en comparación con lo que está disponible actualmente”, comentan.
Auguran también una nueva era de creatividad y desarrollo cultural. “Los simuladores de mundo de propósito general y los agentes robóticos transformarán radicalmente la sociedad y acelerarán el progreso humano. Sora 2 representa un avance significativo hacia ese objetivo”, señalan desde la compañía. “Creemos que Sora traerá mucha alegría, creatividad y conexión al mundo”.