Компанія Google DeepMind оголосила про створення Gemini Robotics – спеціалізованої моделі штучного інтелекту, розробленої для керування реальними роботами з артикульованими руками. Технологія базується на тій самій моделі Gemini 2.0, яка зараз використовується у смартфонах та інших пристроях, але з доданою функціональністю фізичної взаємодії з навколишнім середовищем.
Про це інформує Gizmodo. Компанія представила дві нові моделі ШІ, які “закладають основу для нового покоління корисних роботів”. Перша модель, Gemini Robotics, є вдосконаленою системою типу “зір-мова-дія” (VLA), яка дозволяє роботам виконувати фізичні дії у відповідь на команди.
Друга модель – Gemini Robots-ER – створена для “втіленого мислення” з розширеним просторовим розумінням. Вона допомагає роботам орієнтуватися в середовищі, яке змінюється в реальному часі.
Google співпрацює з компаніями Apptronik, Agile Robots, Agility Robots, Boston Dynamics та Enchanted Tools для “створення наступного покоління роботів-гуманоїдів”. Модель Gemini Robots-ER буде доступна партнерам для тестування, хоча точних термінів виходу на ринок компанія не називає.
Щодо питань безпеки, Google заявляє, що впроваджує системи захисту, які дозволяють моделі Gemini Robotics-ER розуміти, чи безпечно виконувати певні дії в конкретному контексті.
Нагадаємо – компанія Apple готує альтернативу інтеграції ChatGPT у своєму сервісі Apple Intelligence – Google Gemini. У новій бета-версії операційної системи 18.4 виявлено згадки про Google Gemini в одному з внутрішніх оновлень.