Американська холдингова компанія Alphabet представила свою інноваційну модель штучного інтелекту Gemini. Модель здатна до складніших міркувань та розуміння інформації, ніж її попередник Bard від Google.
Як зазначається у блозі Google, перша ітерація Gemini 1.0, розроблена підрозділом DeepMind, представлена у вигляді трьох моделей різних розмірів. Усі моделі мультимодальні, тобто підтримують роботу з різним типом контенту: текстом, зображеннями, аудіо та відео.
Вона розроблена, щоб бути гнучкою та ефективною, здатною працювати на різних пристроях — від центрів обробки даних до мобільних телефонів. Gemini поставляється в трьох версіях: Ultra, Pro і Nano, кожна з яких оптимізована для різних рівнів складності та завдань.
Перш ніж представити широкому загалу, Google перевірила Gemini Pro в низці галузевих стандартних тестів. Зазначається, що у 6 з 8 тестів Gemini Pro перевершила GPT-3.5. Крім того, Google спеціально налаштувала Gemini Pro у Bard, щоб ця модель краще виконувала розуміння, узагальнення, міркування, кодування та планування.
Наразі користувачам доступна можливість використання Bard із Gemini Pro для отримання текстових підказок, а незабаром з’явиться підтримка інших модальностей. Спочатку модель буде доступна англійською мовою в більш ніж 170 країнах і територіях, включаючи Україну, а згодом з’явиться іншими мовами в різних країнах, зокрема в Європі.
Найближчим часом доступ до неї отримають тільки обрані партнери, а на початку наступного року Google планує розповсюдити її серед інших розробників і корпоративних клієнтів. Також на початку наступного року запуститься Bard Advanced, який отримає всі можливості Gemini Ultra. Вона призначена для виконання надскладних завдань і створена для швидкого розуміння та реагування на різні типи інформації — зокрема текст, зображення, аудіо, відео та код.