Міністерство цифрової трансформації та «Київстар» закликали українців долучитися до навчання національної великої мовної моделі (LLM). До співпраці запрошують представників бізнесу, освіти, науки, культури та медіа, які володіють якісним контентом українською мовою.
Як передає Мінцифри, національна LLM має стати базою для створення ШІ-помічників у державному секторі та бізнесі. За задумом розробників, це будуть українські аналоги сервісів на кшталт ChatGPT і Gemini, адаптовані до національного контексту, мови та реалій.
“Якщо у вас є якісні тексти українською — ви нам потрібні. Ваш контент стане фундаментом для національного ШІ, який даватиме відповіді мільйонам українців”, – наголосили у відомстві.
Які дані потрібні:
- Медіа: новини, інтерв’ю, блоги, публіцистика.
- Наука та освіта: контент курсів, підручники, наукові роботи, дисертації.
- Література: художні твори, критика, рецензії.
- Історія: оцифровані архівні матеріали.
- Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.
У Мінцифри зазначають, що медіа та видавництва допоможуть задати еталон мовної грамотності й стилю, університети та науковці — сформувати інтелектуальну основу моделі, а бізнес — навчити ШІ краще розуміти ринок і галузеву специфіку.
Розробники наголошують на захисті інтелектуальної власності партнерів і запевняють, що використання даних відбуватиметься на прозорих юридичних умовах. Учасників проєкту планують офіційно відзначити у підсумковому звіті про створення національної мовної моделі.
Зауважимо, що Мінцифри та “Київстар” раніше оголосили про конкурс серед українців на назву для LLM. Залишити свої назви для української мовної моделі користувачі могли до 5 грудня включно. Вже у січні Мінцифри запустить голосування в “Дії”. LLM вийде в бета-тестування вже навесні цього року. Наразі триває найважливіша частина роботи — збір даних для навчання.

