In vergelijking met soortgelijke technieken, spant deze techniek de kroon. Het grote “probleem” met programma’s die artificieel intelligentie gebruiken is dat ze veel data nodig hebben die geanalyseerd moet worden, echter is dit nu niet het geval vermits je maar enkele minuten aan videomateriaal van je onderwerp nodig hebt . Aangezien er niet zoveel data nodig is, zijn de berekeningen die vereist zijn om tot een resultaat te komen veel sneller, namelijk 40 seconden i.p.v. enkele uren. Ook de kwaliteit van de mondbewegingen komen beter overeen, bv.: bij een ‘b klank’ staan de lippen op elkaar, wat hiervoor niet altijd het geval was. En ten laatste is er, aan de hand van een bevraging, geconcludeerd dat de fragmenten van een korte zin er even goed / een beetje beter uit zien dan eerdere versies, met 12 keer zo weinig data te gebruiken. En fragmenten van langere zinnen er 10 % geloofwaardiger uit zien dan eerdere versies, opnieuw met 12 keer zo weinig data te gebruiken.