Оптимізована модель штучного інтелекту Google DeepMind безпосередньо працює на роботах

Google DeepMind презентує версію свого AI-моделі Gemini Robotics, яка може працювати без доступу до інтернету. Модель з візуально-мовно-дійовими можливостями (VLA) має маневрені здібності, подібні до тих, що були представлені у березні, але, за словами Google, вона «достатньо маленька та ефективна для роботи безпосередньо на роботі».

Головна модель Gemini Robotics розроблена для того, щоб допомагати роботам виконувати широкий спектр фізичних задач, навіть якщо вони не отримували спеціальне навчання для цього. Це дозволяє роботам узагальнювати нові ситуації, розуміти команди й реагувати на них, а також виконувати завдання, що вимагають тонкої моторики.

Кароліна Парада, керівник відділу робототехніки Google DeepMind, зазначає, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати як на пристрої, так і в хмарі. Проте, у цій версії, що працює лише на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як у основної моделі.

Модель, що працює на пристрої, здатна виконувати кілька різних задач без додаткового навчання та може адаптуватися до нових ситуацій «з лише 50-100 демонстрацій», за словами Паради. Google навчала модель на своєму роботу ALOHA, але компанія змогла адаптувати її для різних типів роботів, таких як гуманоїдний робот Apollo від Apptronik та бі-рука Franka FR3.

«Гібридна модель Gemini Robotics залишається більш могутньою, але ми насправді здивовані, наскільки потужною є ця версія для пристроїв», – каже Парада. «Я б розглядала це як стартову модель або модель для застосувань з поганою зв’язком». Вона також може бути корисною для компаній з жорсткими вимогами до безпеки.

Разом із запуском, Google випускає набір для розробки програмного забезпечення (SDK) для роботи на пристрої, який розробники можуть використовувати для оцінки та налаштування моделі — це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв і її SDK будуть доступні обмеженій групі довірених тестувальників, поки Google продовжує працювати над зменшенням ризиків безпеки.

  • Демченко Галина

    Related Posts

    Блумберг – Чи є ти роботом?

    Encyclopedia Britannica  та Merriam-Webster подають до суду на компанію Perplexity

    Компанія, що займається веб-пошуком на базі штучного інтелекту, Perplexity, знову зіткнулася з позовом, цього разу від Encyclopedia Britannica та Merriam-Webster через порушення авторських прав та торгових марок. Britannica, яка є…

    You Missed

    Як угода EA відрізняється від традиційних схем

    Як угода EA відрізняється від традиційних схем

    Як угода з EA відрізняється від звичного підходу

    Як угода з EA відрізняється від звичного підходу

    Як викуп EA відрізняється від звичного сценарію

    Як викуп EA відрізняється від звичного сценарію

    Samsung представляє новий сенсор ISOCELL HP5 на 200 МП для смартфонів

    Samsung представляє новий сенсор ISOCELL HP5 на 200 МП для смартфонів

    План G20 щодо трансакцій між країнами не встигне до терміна 2027 року

    План G20 щодо трансакцій між країнами не встигне до терміна 2027 року

    Дешевий тарифний план домашнього інтернету від Mint Mobile за певних умов

    Дешевий тарифний план домашнього інтернету від Mint Mobile за певних умов