Agencias
OpenAI, la firma creadora de ChatGPT, ha mostrado un nuevo modelo capaz de generar vídeos a partir de instrucciones de texto, que considera un hito importante en la historia de la Inteligencia Artificial General.
La empresa explica que su nuevo producto, llamado Sora, tiene la capacidad de generar vídeos con Múltiples personajes y fondos detallados, gracias a que su modelo “no sólo comprende lo que el usuario ha solicitado en la petición, sino también cómo son las cosas en el mundo físico”.
Además, el sistema está provisto de un profundo conocimiento del lenguaje, que le permite producir imágenes detalladas de acuerdo con el contexto del mundo real.
Sora produce vídeos de hasta un minuto de duración. OpenAI explica que lo ha entrenado con una mezcla de vídeos e imágenes de duración, resolución y relación de aspecto diversos, lo que le permite simular escenarios de la vida real y generar vídeos de diferentes estilos.
El modelo de conversión de texto a vídeo se fundamenta en la investigación realizada previamente por OpenAI para el generador de imágenes DALL-E. Según la empresa, ambos comparten una misma técnica, consistente en “generar etiquetas muy descriptivas para los datos visuales de entrenamiento”.
OpenAI también está desarrollando herramientas para detectar los vídeos generados por Sora e identificar contenido potencialmente engañoso. Además, prevé colaborar con responsables políticos y educadores a fin de evitar que se abuse de la tecnología utilizada en el nuevo sistema.
Sora ya está a disposición de varios artistas, cineastas y diseñadores, a los que se ha invitado a opinar sobre la nueva plataforma.
Fuente: MWL