La compañía OpenAI, un referente en el campo de la inteligencia artificial generativa, dio a conocer su modelo llamado «Sora», el cual es capaz de recibir instrucciones en forma de texto y transformarlas en escenas de video realistas, con la inclusión de múltiples personajes y movimientos específicos.
De acuerdo con la empresa fundada en 2015 y dirigida por Sam Altman, conocida por desarrollar ChatGPT y el generador de imágenes estáticas DALL-E, “Sora” tiene la capacidad de generar escenas complejas con detalles tanto del elemento principal como del fondo.
La empresa también señaló que su modelo tiene la habilidad de comprender la existencia de objetos en el mundo físico y cuenta con la capacidad de “interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes”.
El nombre «Sora» proviene del japonés y significa «cielo». Según el periódico The New York Times, la compañía aún no ha lanzado el modelo al público, ya que está llevando a cabo un análisis para comprender los posibles riesgos asociados con el sistema.
En lugar de eso, OpenAI ha proporcionado la tecnología a un reducido grupo de académicos y otros investigadores externos con el objetivo de identificar posibles formas en que «Sora» podría ser utilizada con intenciones perjudiciales.
La empresa afirma que «Sora» posibilita la generación de diversos entornos, ya sean realistas o imaginarios, en tres dimensiones y con movimientos suaves. Incluso en escenas que no tienen existencia en el mundo real, el modelo aplica las reglas físicas apropiadas.
De esta manera, OpenAI, que ha transformado el floreciente sector de los servicios de inteligencia artificial generativa, contará con un conjunto de servicios que abarcan desde la generación de texto hasta imágenes estáticas y video.
Tú que opina de este post