Оптимізована AI-модель Google DeepMind працює безпосередньо на роботах

Компанія Google DeepMind представляє версію свого AI-моделі Gemini Robotics, що працює на пристроях без підключення до Інтернету. Ця модель, відома як модель з комбінованим візуально-мовним-діємою (VLA), має досконалі можливості, подібні до тих, що були представлені в березні, але Google зазначає, що “вона досить компактна та ефективна для роботи безпосередньо на робоці”.

Головна модель Gemini Robotics розроблена для допомоги роботам у виконанні широкого спектру фізичних завдань, навіть якщо вона не проходила спеціальне навчання для них. Вона дозволяє роботам узагальнювати нові ситуації, розуміти та реагувати на команди, а також виконувати завдання, які вимагають тонкої моторики.

Кароліна Парада, керівник робототехніки в Google DeepMind, пояснює, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати і на пристроях, і в хмарі. Проте у цій версії, що працює тільки на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як і у головної моделі.

Модель, що працює на пристрої, може виконувати кілька різних завдань відразу ж після запуску, а також може адаптуватися до нових ситуацій “з лише 50 до 100 демонстрацій”, згідно з Парада. Google навчила цю модель на своєму роботові ALOHA, проте компанія змогла адаптувати її для роботи з різними типами роботів, такими як гуманоїдний робот Apollo від Apptronik і дворукий робот Franka FR3.

“Гібридна модель Gemini Robotics все ще є більш потужною, але ми насправді здивовані, наскільки сильною є ця версія для пристроїв”, – зазначає Парада. “Я сприймала б це як стартову модель або модель для застосувань із поганим з’єднанням”. Це також може бути корисно для компаній з жорсткими вимогами до безпеки.

Одночасно з випуском моделі, Google також запускає комплект розробки програмного забезпечення (SDK) для цієї версії, який розробники можуть використовувати для оцінки та налаштування – це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв та її SDK будуть доступні для групи довірених тестувальників, поки Google продовжує працювати над мінімізацією ризиків безпеки.