Оптимізована AI-модель Google DeepMind працює безпосередньо на роботах

Компанія Google DeepMind представляє версію свого AI-моделі Gemini Robotics, що працює на пристроях без підключення до Інтернету. Ця модель, відома як модель з комбінованим візуально-мовним-діємою (VLA), має досконалі можливості, подібні до тих, що були представлені в березні, але Google зазначає, що “вона досить компактна та ефективна для роботи безпосередньо на робоці”.

Головна модель Gemini Robotics розроблена для допомоги роботам у виконанні широкого спектру фізичних завдань, навіть якщо вона не проходила спеціальне навчання для них. Вона дозволяє роботам узагальнювати нові ситуації, розуміти та реагувати на команди, а також виконувати завдання, які вимагають тонкої моторики.

Кароліна Парада, керівник робототехніки в Google DeepMind, пояснює, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати і на пристроях, і в хмарі. Проте у цій версії, що працює тільки на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як і у головної моделі.

Модель, що працює на пристрої, може виконувати кілька різних завдань відразу ж після запуску, а також може адаптуватися до нових ситуацій “з лише 50 до 100 демонстрацій”, згідно з Парада. Google навчила цю модель на своєму роботові ALOHA, проте компанія змогла адаптувати її для роботи з різними типами роботів, такими як гуманоїдний робот Apollo від Apptronik і дворукий робот Franka FR3.

“Гібридна модель Gemini Robotics все ще є більш потужною, але ми насправді здивовані, наскільки сильною є ця версія для пристроїв”, – зазначає Парада. “Я сприймала б це як стартову модель або модель для застосувань із поганим з’єднанням”. Це також може бути корисно для компаній з жорсткими вимогами до безпеки.

Одночасно з випуском моделі, Google також запускає комплект розробки програмного забезпечення (SDK) для цієї версії, який розробники можуть використовувати для оцінки та налаштування – це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв та її SDK будуть доступні для групи довірених тестувальників, поки Google продовжує працювати над мінімізацією ризиків безпеки.

  • Савчук Анастасія

    Related Posts

    Трамп може позбавити H-1B віз тих, хто працював у модерації контенту: що далі?

    Адміністрація Трампа впровадила нову політику, що стосується надання віз H-1B. Відповідно до отриманого звіту, американські консульства тепер можуть відмовляти заявникам, які мають досвід роботи в галузі модерації контенту або “цензури”.…

    Майбутнє ігрового бізнесу Microsoft: Чекати революції в світі Xbox?

    Microsoft Gaming, підрозділ компанії Microsoft, що популярний завдяки бренду Xbox, нині переживає складні часи. Після значних інвестицій в індустрію, компанія стикнулася з екзистенційною кризою, яка змушує переглянути стратегію. Сьогодні Microsoft…

    You Missed

    Відкриття Realme P4x: Дата запуску, ключові характеристики та захоплюючий дизайн

    Відкриття Realme P4x: Дата запуску, ключові характеристики та захоплюючий дизайн

    Ігри з конячками під забороною: що сталося в Epic Games Store?

    Ігри з конячками під забороною: що сталося в Epic Games Store?

    Трамп може позбавити H-1B віз тих, хто працював у модерації контенту: що далі?

    Трамп може позбавити H-1B віз тих, хто працював у модерації контенту: що далі?

    Відкрийте нові можливості: віддалений доступ Windows 11 на Quest 3 вже доступний для всіх

    Відкрийте нові можливості: віддалений доступ Windows 11 на Quest 3 вже доступний для всіх

    CME Group зазнає тривалого збою: що це означає для ринку?

    CME Group зазнає тривалого збою: що це означає для ринку?

    Майбутнє ігрового бізнесу Microsoft: Чекати революції в світі Xbox?

    Майбутнє ігрового бізнесу Microsoft: Чекати революції в світі Xbox?