Національна велика мовна модель штучного інтелекту (LLM) вийде в бета-тестування вже навесні цього року. Наразі триває найважливіша частина роботи — збір даних для навчання LLM.
Про деталі роботи над українським ШІ розповів Перший віцепремʼєр-міністр України — Міністр цифрової трансформації України Михайло Федоров.
Хто будує та на якій технології?
Технічним партнером став Київстар. Компанія фінансує та веде розробку, а після фінішу — передасть мовну модель державі. Фундаментом для великої мовної моделі обрали сімейство моделей Gemma від Google. Це передові технології, які розробники «українізують» — адаптують під нашу мову та контекст.
Якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей, яка перевірятиме модель на:
- технічну якість;
- етичність та безпечність для користувачів;
- знання української мови;
- розуміння національного контексту.
На якому етапі розробка зараз?
Зараз триває «невидима», але найважливіша частина роботи — підготовка даних. Для високої якості інформації з інтернету недостатньо, тому Мінцифри працює з державними органами, медіа, університетами та іншими інституціями — це терабайти унікальних даних.
Для незалежного контролю розробки моделі створено комітет експертів, які працюють за чотирма напрямами: науково-технічним, правовим, культурно-історичним та мовним. Їхнє поточне завдання — розробити професійні бенчмарки (систему тестування). Це дозволить переконатися, що модель навчена якісно.
Паралельно створюють юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі.
Вже в січні 2026 року Мінцифри представить:
- першу базу текстів для тренування LLM;
- покращений токенізатор — інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше та продуктивніше;
- власні бенчмарки для оцінки якості.
Зауважимо, що Мінцифри та “Київстар” оголосили про конкурс серед українців на назву для LLM. Залишити свої назви для української мовної моделі користувачі могли до 5 грудня включно. Вже у січні Мінцифри запустить голосування в “Дії”.

