AI помага на Google Translate да се разшири със 110 нови езика

Включени са дори езици без текуща националност, което демонстрира ангажимента на Google за запазване на застрашените езици.

по статията работи: iNews.bg | 02.07.2024 | 17:30
AI помага на Google Translate да се разшири със 110 нови езика
Повече за:

AI помага на Google Translate да се разшири със 110 нови езика, което е най-голямата му актуализация досега.

Google обяви в публикация в блог, че това огромно разширяване включва езици, говорени от над 614 милиона души по света, или около 8% от световното население. Разнообразието е огромно - от езиците, говорени от повече от 100 милиона души, до ценни диалекти на местните общности, предава бТВ. 

Включени са дори езици без текуща националност, което демонстрира ангажимента на Google за запазване на застрашените езици.

В допълнение към тази впечатляваща актуализация, Google се фокусира върху африканските езици, които представляват около една четвърт от новите допълнения. Езици като "фон", "киконго", "лу", "га", "суати", "венда" и уолоф вече са част от Google Translate, отбелязвайки най-значимия напредък в добавянето на африканските езици досега.

Google признава, че преводът на езици не е лесен поради регионални вариации, диалекти и разлики в правописа. Някои езици, като ромския, с неговите много диалекти, нямат една стандартна форма, което прави превода сложен.

Големият езиков модел PalM 2 на Google беше полезен при разширяването на Translate. Той научава сродни езици, което позволява добавянето на подобни на хинди езици като авадхи и марвади, както и френски креолски езици като сейшелски и мавритански.

Добавянето на широко използвани езици като кантонски идва със собствени предизвикателства поради споделените писмени знаци с мандарин. Въпреки тези пречки ангажиментът на Google към езиковото многообразие е ясен. Пример е включването на мански, келтски език от остров Ман, който почти изчезна през 1974 г. Благодарение на усилията за съживяване, броят на говорещите свободно нарасна до хиляди.

Това разширение включва и пенджаби, написан на шрифта Shahmukhi, персийско-арабски вариант, използван в Пакистан, където е най-разпространеният език.

Преди това разширение най-голямата актуализация на Google Translate беше през май 2022 г. с въвеждането на Zero-Shot машинен превод. Тази технология позволява на модела да учи нови езици, без да има нужда от съществуващи преведени примери. Това беше голям напредък в машинния превод, който помогна на Google да преодолее допълнително езиковите бариери.

Това разширение е голяма стъпка към инициативата на Google за 1000 езика, която има за цел да използва модели на изкуствен интелект за поддръжка на 1000 от най-важните езици в света.


Добави коментар
Моля, пишете на кирилица! Коментари, написани на латиница, ще бъдат изтривани.

ТВ програма

Кино

  • Сега Мост на небесата тържествен...
  • 14:30 Българското село /п/
  • 15:00 "Децата на Балканите -
  • 16:00 30 години от световното първенство...
  • 18:00 Имате среща с ... Диана Любенова...
  • 18:45 Спорт ТОТО
  • 19:00 С БНТ завинаги /п/
  • 20:00 По света и у нас
  • Сега "Полет към дома" - драма,...
  • 15:00 "COOLt" - лайфстайл предаване с...
  • 16:00 "НепознатиТЕ" - документална...
  • 16:30 "120 минути" - публицистично...
  • 19:00 bTV Новините - централна емисия
  • 19:40 "Защо, господин министър?" -...
  • 20:00 "Трезорът" - екшън, трилър,...
  • 22:30 "Вълкът от Уолстрийт" -...
  • Сега "Приказна сватба" - с уч. на Брук...
  • 14:15 "Незабравимо лято" - с уч. на...
  • 16:00 "Да хванеш гората" - документална...
  • 16:30 "На фокус с Лора Крумова" -...
  • 19:00 Новините на NOVA - централна емисия
  • 19:40 На фокус след новините
  • 20:00 "Тор: Любов и...
  • 22:30 "Мошенички от класа" - с уч. на Ан...
Какво е общото между цигарите и мазнините по корема Анализът им показва, че започването на пушенето и пушенето през целия живот е свързано с увеличаване на коремните мазнини.