Оптимізована модель штучного інтелекту Google DeepMind безпосередньо працює на роботах

Google DeepMind презентує версію свого AI-моделі Gemini Robotics, яка може працювати без доступу до інтернету. Модель з візуально-мовно-дійовими можливостями (VLA) має маневрені здібності, подібні до тих, що були представлені у березні, але, за словами Google, вона «достатньо маленька та ефективна для роботи безпосередньо на роботі».

Головна модель Gemini Robotics розроблена для того, щоб допомагати роботам виконувати широкий спектр фізичних задач, навіть якщо вони не отримували спеціальне навчання для цього. Це дозволяє роботам узагальнювати нові ситуації, розуміти команди й реагувати на них, а також виконувати завдання, що вимагають тонкої моторики.

Кароліна Парада, керівник відділу робототехніки Google DeepMind, зазначає, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати як на пристрої, так і в хмарі. Проте, у цій версії, що працює лише на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як у основної моделі.

Модель, що працює на пристрої, здатна виконувати кілька різних задач без додаткового навчання та може адаптуватися до нових ситуацій «з лише 50-100 демонстрацій», за словами Паради. Google навчала модель на своєму роботу ALOHA, але компанія змогла адаптувати її для різних типів роботів, таких як гуманоїдний робот Apollo від Apptronik та бі-рука Franka FR3.

«Гібридна модель Gemini Robotics залишається більш могутньою, але ми насправді здивовані, наскільки потужною є ця версія для пристроїв», – каже Парада. «Я б розглядала це як стартову модель або модель для застосувань з поганою зв’язком». Вона також може бути корисною для компаній з жорсткими вимогами до безпеки.

Разом із запуском, Google випускає набір для розробки програмного забезпечення (SDK) для роботи на пристрої, який розробники можуть використовувати для оцінки та налаштування моделі — це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв і її SDK будуть доступні обмеженій групі довірених тестувальників, поки Google продовжує працювати над зменшенням ризиків безпеки.

  • Демченко Галина

    Related Posts

    Відкрийте нові можливості: віддалений доступ Windows 11 на Quest 3 вже доступний для всіх

    Користувачі гарнітур Quest 3 та Quest 3S отримали можливість нової інтеграції з комп’ютерами на базі Windows через додаток Mixed Reality Link. Ця інновація дозволяє власникам гарнітури безпосередньо взаємодіяти з робочим…

    З’ясування шокуючої правди: Чому співобвинувач з leaked iOS 26 стверджує, що Джон Проссер заплатив йому $650?

    Компанія Apple продовжує юридичну битву з інформатором Джоном Проссером та його колегою Майклом Рамачотті. На початку року Apple подала в суд, звинувачуючи їх у “координованій схемі”, спрямованій на викрадення торгових…

    You Missed

    Відкриття Realme P4x: Дата запуску, ключові характеристики та захоплюючий дизайн

    Відкриття Realme P4x: Дата запуску, ключові характеристики та захоплюючий дизайн

    Ігри з конячками під забороною: що сталося в Epic Games Store?

    Ігри з конячками під забороною: що сталося в Epic Games Store?

    Трамп може позбавити H-1B віз тих, хто працював у модерації контенту: що далі?

    Трамп може позбавити H-1B віз тих, хто працював у модерації контенту: що далі?

    Відкрийте нові можливості: віддалений доступ Windows 11 на Quest 3 вже доступний для всіх

    Відкрийте нові можливості: віддалений доступ Windows 11 на Quest 3 вже доступний для всіх

    CME Group зазнає тривалого збою: що це означає для ринку?

    CME Group зазнає тривалого збою: що це означає для ринку?

    Майбутнє ігрового бізнесу Microsoft: Чекати революції в світі Xbox?

    Майбутнє ігрового бізнесу Microsoft: Чекати революції в світі Xbox?