Microsoft presenta Vasa-1 che genera volti con capacità visive affettive

Microsoft VASA-1 genera volti parlanti estremamente realistici, sincronizzando movimenti labiali e espressioni naturali con l’audio. Supporta vari input come audio e foto, offrendo controllo su sguardo ed emozioni. Capace di produrre video a 45 fps, VASA-1 si distingue per autenticità e precisione, entrando in competizione con modelli come Lumière e Sora.

volti di persone e simbolo di microsoft

Tempo di lettura:

2 minuti


Alcune immagini,traduzioni e sintesi possono essere stati realizzati con ausilio di strumenti di intelligenza artificiale.

Storytelling e supervisione umani