Українська велика мовна модель (LLM) буде побудована на основі Llama 4 та згодом розширена до 11 мільярдів токенів. Про це повідомив заступник міністра цифрової трансформації Олександр Борняков під час tech-форуму 2U, передає dev.ua.
За словами Борнякова, перша версія української великої мовної моделі може з’явитися вже до кінця поточного року. Початково вона базуватиметься на 2-3 мільярдах токенів, а на наступному етапі буде розширена до 11 мільярдів. Амбітною кінцевою метою проєкту є розвиток моделі до 70 мільярдів токенів.
“Хочемо, щоб її використовували не тільки ми для внутрішніх задач, а і будь-яка компанія в Україні могла її взяти”, — зазначив заступник міністра. Він також додав, що дорожня карта запуску моделі вже розпланована, і приблизно за місяць буде оголошено деталі щодо того, що, де і як відбуватиметься.
Розвиток власної української великої мовної моделі має стратегічне значення для технологічного суверенітету країни та розвитку українського сегменту штучного інтелекту, що особливо важливо в умовах стрімкого розвитку технологій ШІ у світі. Велика мовна модель дасть змогу обробляти дані всередині країни, що стратегічно важливо для використання ШІ в обороні, урядових організаціях, медицині та фінансовому секторі.
Попередньо запуск LLM запланований на листопад-грудень 2025 року.