Оптимізована модель штучного інтелекту Google DeepMind безпосередньо працює на роботах

Google DeepMind презентує версію свого AI-моделі Gemini Robotics, яка може працювати без доступу до інтернету. Модель з візуально-мовно-дійовими можливостями (VLA) має маневрені здібності, подібні до тих, що були представлені у березні, але, за словами Google, вона «достатньо маленька та ефективна для роботи безпосередньо на роботі».

Головна модель Gemini Robotics розроблена для того, щоб допомагати роботам виконувати широкий спектр фізичних задач, навіть якщо вони не отримували спеціальне навчання для цього. Це дозволяє роботам узагальнювати нові ситуації, розуміти команди й реагувати на них, а також виконувати завдання, що вимагають тонкої моторики.

Кароліна Парада, керівник відділу робототехніки Google DeepMind, зазначає, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати як на пристрої, так і в хмарі. Проте, у цій версії, що працює лише на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як у основної моделі.

Модель, що працює на пристрої, здатна виконувати кілька різних задач без додаткового навчання та може адаптуватися до нових ситуацій «з лише 50-100 демонстрацій», за словами Паради. Google навчала модель на своєму роботу ALOHA, але компанія змогла адаптувати її для різних типів роботів, таких як гуманоїдний робот Apollo від Apptronik та бі-рука Franka FR3.

«Гібридна модель Gemini Robotics залишається більш могутньою, але ми насправді здивовані, наскільки потужною є ця версія для пристроїв», – каже Парада. «Я б розглядала це як стартову модель або модель для застосувань з поганою зв’язком». Вона також може бути корисною для компаній з жорсткими вимогами до безпеки.

Разом із запуском, Google випускає набір для розробки програмного забезпечення (SDK) для роботи на пристрої, який розробники можуть використовувати для оцінки та налаштування моделі — це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв і її SDK будуть доступні обмеженій групі довірених тестувальників, поки Google продовжує працювати над зменшенням ризиків безпеки.

  • Демченко Галина

    Related Posts

    Apple знову вводить моніторинг рівня кисню в крові у нові моделі Apple Watch

    Моніторинг рівня кисню в крові повертається до Apple Watch — в певному сенсі. З сьогоднішнього дня компанія Apple починає випускати оновлення програмного забезпечення, яке активує перероблену версію цієї функції для…

    Розумні окуляри з штучним інтелектом для людей з обмеженим зором

    Компанія, що спеціалізується на технологіях для людей з обмеженими можливостями, Envision, уклала партнерство з виробником окулярів Solos для випуску нових смарт-окулярів, призначених для сліпих і людей з порушеннями зору. Envision…

    You Missed

    Ні, оновлення Windows, напевно, не пошкодило ваш SSD

    Ні, оновлення Windows, напевно, не пошкодило ваш SSD

    Злой Імперії: уникайте раннього доступу, поки не завершать на 90%

    Злой Імперії: уникайте раннього доступу, поки не завершать на 90%

    Неймовірний ріст акцій Oracle підняв співзасновника компанії в світовому рейтингу багатіїв поруч із Маском

    Неймовірний ріст акцій Oracle підняв співзасновника компанії в світовому рейтингу багатіїв поруч із Маском

    Оголошено про запуск Google Pixel Watch 4 та Pixel Buds 2a

    Оголошено про запуск Google Pixel Watch 4 та Pixel Buds 2a

    Ant International, Standard Chartered та Swift працюють разом над системою платежів між банками та гаманцями

    Ant International, Standard Chartered та Swift працюють разом над системою платежів між банками та гаманцями

    Meta має труднощі з контролем своїх чат-ботів на основі штучного інтелекту

    Meta має труднощі з контролем своїх чат-ботів на основі штучного інтелекту