Оптимізована AI-модель Google DeepMind працює безпосередньо на роботах

Компанія Google DeepMind представляє версію свого AI-моделі Gemini Robotics, що працює на пристроях без підключення до Інтернету. Ця модель, відома як модель з комбінованим візуально-мовним-діємою (VLA), має досконалі можливості, подібні до тих, що були представлені в березні, але Google зазначає, що “вона досить компактна та ефективна для роботи безпосередньо на робоці”.

Головна модель Gemini Robotics розроблена для допомоги роботам у виконанні широкого спектру фізичних завдань, навіть якщо вона не проходила спеціальне навчання для них. Вона дозволяє роботам узагальнювати нові ситуації, розуміти та реагувати на команди, а також виконувати завдання, які вимагають тонкої моторики.

Кароліна Парада, керівник робототехніки в Google DeepMind, пояснює, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати і на пристроях, і в хмарі. Проте у цій версії, що працює тільки на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як і у головної моделі.

Модель, що працює на пристрої, може виконувати кілька різних завдань відразу ж після запуску, а також може адаптуватися до нових ситуацій “з лише 50 до 100 демонстрацій”, згідно з Парада. Google навчила цю модель на своєму роботові ALOHA, проте компанія змогла адаптувати її для роботи з різними типами роботів, такими як гуманоїдний робот Apollo від Apptronik і дворукий робот Franka FR3.

“Гібридна модель Gemini Robotics все ще є більш потужною, але ми насправді здивовані, наскільки сильною є ця версія для пристроїв”, – зазначає Парада. “Я сприймала б це як стартову модель або модель для застосувань із поганим з’єднанням”. Це також може бути корисно для компаній з жорсткими вимогами до безпеки.

Одночасно з випуском моделі, Google також запускає комплект розробки програмного забезпечення (SDK) для цієї версії, який розробники можуть використовувати для оцінки та налаштування – це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв та її SDK будуть доступні для групи довірених тестувальників, поки Google продовжує працювати над мінімізацією ризиків безпеки.

  • Савчук Анастасія

    Related Posts

    Ці 4K-камери на батарейках ведуть запис цілодобово

    TP-Link представила нові моделі камер для забезпечення безпеки під брендом Tapo, включаючи лінію камер з підтримкою 4K для вулиці та доступні камери з функцією панорамування й нахилу, які можуть використовуватись…

    Amazon забезпечить доставку в той же день для «мільйонів» жителів сільської місцевості

    Amazon оголосив про свої плани запровадити доставку в один і наступний день для “десятків мільйонів” людей, які проживають у менших містах, до кінця 2026 року. Швидша доставка буде доступна для…

    You Missed

    Офіційний реліз Honor Magic V5 – ще тонший корпус, більша батарея та покращена камера

    Офіційний реліз Honor Magic V5 – ще тонший корпус, більша батарея та покращена камера

    Yonder представляє дебетові картки

    Yonder представляє дебетові картки

    Ці 4K-камери на батарейках ведуть запис цілодобово

    Ці 4K-камери на батарейках ведуть запис цілодобово

    SDK Discord для «соціальної інфраструктури» допомагає розробникам скористатися трендом «соціальної гри»

    SDK Discord для «соціальної інфраструктури» допомагає розробникам скористатися трендом «соціальної гри»

    Ось як Microsoft об’єднує Windows і Xbox для портативних ПК

    Ось як Microsoft об’єднує Windows і Xbox для портативних ПК

    Amazon забезпечить доставку в той же день для «мільйонів» жителів сільської місцевості

    Amazon забезпечить доставку в той же день для «мільйонів» жителів сільської місцевості