Оптимізована модель штучного інтелекту Google DeepMind безпосередньо працює на роботах

Google DeepMind презентує версію свого AI-моделі Gemini Robotics, яка може працювати без доступу до інтернету. Модель з візуально-мовно-дійовими можливостями (VLA) має маневрені здібності, подібні до тих, що були представлені у березні, але, за словами Google, вона «достатньо маленька та ефективна для роботи безпосередньо на роботі».

Головна модель Gemini Robotics розроблена для того, щоб допомагати роботам виконувати широкий спектр фізичних задач, навіть якщо вони не отримували спеціальне навчання для цього. Це дозволяє роботам узагальнювати нові ситуації, розуміти команди й реагувати на них, а також виконувати завдання, що вимагають тонкої моторики.

Кароліна Парада, керівник відділу робототехніки Google DeepMind, зазначає, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати як на пристрої, так і в хмарі. Проте, у цій версії, що працює лише на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як у основної моделі.

Модель, що працює на пристрої, здатна виконувати кілька різних задач без додаткового навчання та може адаптуватися до нових ситуацій «з лише 50-100 демонстрацій», за словами Паради. Google навчала модель на своєму роботу ALOHA, але компанія змогла адаптувати її для різних типів роботів, таких як гуманоїдний робот Apollo від Apptronik та бі-рука Franka FR3.

«Гібридна модель Gemini Robotics залишається більш могутньою, але ми насправді здивовані, наскільки потужною є ця версія для пристроїв», – каже Парада. «Я б розглядала це як стартову модель або модель для застосувань з поганою зв’язком». Вона також може бути корисною для компаній з жорсткими вимогами до безпеки.

Разом із запуском, Google випускає набір для розробки програмного забезпечення (SDK) для роботи на пристрої, який розробники можуть використовувати для оцінки та налаштування моделі — це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв і її SDK будуть доступні обмеженій групі довірених тестувальників, поки Google продовжує працювати над зменшенням ризиків безпеки.

  • Демченко Галина

    Related Posts

    Verizon впроваджує штучний інтелект Gemini від Google для вирішення складних питань клієнтів

    Компанія Verizon прагне удосконалити свій сервіс обслуговування клієнтів, запроваджуючи більше чат-ботів та штучних інтелектуальних інструментів. Сьогодні відбувається перезапуск додатку My Verizon з новим «AI-помічником Verizon», який має на меті допомогти…

    Anthropic здобуває значну перемогу в справедливому використанні для ШІ, але залишаються проблеми зі скраденням книг

    Федеральний суддя підтримав компанію Anthropic у справі про авторське право на штучний інтелект, ухваливши рішення, що навчання її AI-моделей на законно придбаних книгах без дозволу авторів є справедливим використанням. Це…

    You Missed

    Найвигідніші пропозиції на Apple Watch Series 10 під час Дня продажів Amazon Prime

    Найвигідніші пропозиції на Apple Watch Series 10 під час Дня продажів Amazon Prime

    20 Найпопулярніших пропозицій Prime Day серед читачів Verge

    20 Найпопулярніших пропозицій Prime Day серед читачів Verge

    20 Найпопулярніших акцій на Prime Day серед читачів Verge

    20 Найпопулярніших акцій на Prime Day серед читачів Verge

    Verizon впроваджує штучний інтелект Gemini від Google для вирішення складних питань клієнтів

    Verizon впроваджує штучний інтелект Gemini від Google для вирішення складних питань клієнтів

    Ziglu переходить в адміністрування

    Ziglu переходить в адміністрування

    Найкращі акції на смарт-годинники та фітнес-трекери під час Дня Prime

    Найкращі акції на смарт-годинники та фітнес-трекери під час Дня Prime