Двуезична анимирана говореща глава – това бе едно от изобретенията, привлякло най-голямо внимание по време на организирания от Microsoft TechFest 2012 – ежегоден форум, представящ най-новите технологични постижения на щатския IT концерн.
Наречена Monolingual TTS, разработката, снабдена със софтуер, може директно да превежда говорения от потребителя език директно на друг език с глас, наподобяващ оригиналния. Както обясняват от Microsoft, в същността си това е система от тип текст към глас (TTS).
По думите на разработчиците към момента системата може да превежда на 26 езика в реално време.
За да функционира правилно, първата работа на интелигентния софтуер е да "научи" как звучи истинският глас на потребителя. Инструментът работи чрез система за разпознаване на речта и преработката ѝ във вид на текст.
Следва превод на текста на друг език, който накрая бива възпроизведен като глас. Произнасяйки думите, виртуалната глава на аватара се старае да движи устните си и да направи мимиките, който истинският човек би направил по време на разговор.
В представеното от Microsoft демо е използван аватарът на Крег Мунди, генерален директор в областта на изследванията и стратегиите на компанията. От двата видеофайла се вижда, че главата може да говори еднакво добре и английски, и китайски език.
Някои от очевидните приложения на Monolingual TTS са свързани с предлагането на различни услуги в областта на туризма, държавния сектор и международната дипломация.