Компанія Meta Марка Цукерберга представила SeamlessM4T – нейромережу, яка вміє розпізнавати мову, перетворювати її на текст і робити переклад близько 100 мовами. Також модель вміє створювати з тексту мову (підтримуються 35 мов).
Нейромережа доступна для дослідників за ліцензією з відкритим вихідним кодом, разом із SeamlessAlign — набором даних для перекладу, що містить 270 годин запису мови та тексти, що їй відповідають.
SeamlessM4T може розпізнавати, коли людина переходить з однієї мови на іншу або використовує в розмові відразу кілька мов.
Модель заснована на попередніх проєктах Meta для перекладів: системі прямого перекладу між мовами, ШІ-перекладачі для діалекту хоккієн, який не має письмового варіанту, та інших.