VASA-1 la nueva IA de Microsoft



Microsoft ha presentado una inteligencia artificial capaz de generar avatares hiperrealistas a partir de una imagen y un archivo de voz. VASA-1 puede darle vida a tus fotografías añadiendo expresiones, al tiempo que sincroniza el movimiento de tus labios con el clip de sonido. El resultado final es sorprendente y podría revolucionar la forma como interactuamos en el mundo digital.

De acuerdo con los investigadores, VESA-1 captura toda la gama de expresiones humanas, incluidos los movimientos naturales de la cabeza, para generar avatares parlantes verdaderamente creíbles. Esto es posible al separar elementos como los rasgos faciales, la posición de la cabeza y read more las expresiones, lo que permite un control detallado de cada atributo y la posibilidad de editar el contenido por separado.

VESA-1 va más allá de otros modelos de inteligencia artificial que añaden audio a una imagen y sincronizan el movimiento de labios. Los investigadores han creado expresiones realistas con movimientos en un espacio definido. Esto produce una imagen más Actualidad auténtica y menos rígida.

"Consideramos todas las dinámicas faciales Leer... posibles, incluido el movimiento de los labios, la expresión (sin labios), la mirada y el parpadeo, entre otras, como una única variable latente y modelamos su distribución check here probabilística de manera unificada", mencionan los autores de Microsoft Research. "Nuestro modelado holístico de la dinámica facial, junto con los patrones de movimiento check here de la cabeza aprendidos conjuntamente, conduce a la generación de una amplia gama de comportamientos de conversación emotivos y realistas".

Leave a Reply

Your email address will not be published. Required fields are marked *