Оптимізована модель штучного інтелекту Google DeepMind безпосередньо працює на роботах

Google DeepMind презентує версію свого AI-моделі Gemini Robotics, яка може працювати без доступу до інтернету. Модель з візуально-мовно-дійовими можливостями (VLA) має маневрені здібності, подібні до тих, що були представлені у березні, але, за словами Google, вона «достатньо маленька та ефективна для роботи безпосередньо на роботі».

Головна модель Gemini Robotics розроблена для того, щоб допомагати роботам виконувати широкий спектр фізичних задач, навіть якщо вони не отримували спеціальне навчання для цього. Це дозволяє роботам узагальнювати нові ситуації, розуміти команди й реагувати на них, а також виконувати завдання, що вимагають тонкої моторики.

Кароліна Парада, керівник відділу робототехніки Google DeepMind, зазначає, що оригінальна модель Gemini Robotics використовує гібридний підхід, що дозволяє їй працювати як на пристрої, так і в хмарі. Проте, у цій версії, що працює лише на пристрої, користувачі можуть отримати доступ до офлайн-функцій, які майже такі ж, як у основної моделі.

Модель, що працює на пристрої, здатна виконувати кілька різних задач без додаткового навчання та може адаптуватися до нових ситуацій «з лише 50-100 демонстрацій», за словами Паради. Google навчала модель на своєму роботу ALOHA, але компанія змогла адаптувати її для різних типів роботів, таких як гуманоїдний робот Apollo від Apptronik та бі-рука Franka FR3.

«Гібридна модель Gemini Robotics залишається більш могутньою, але ми насправді здивовані, наскільки потужною є ця версія для пристроїв», – каже Парада. «Я б розглядала це як стартову модель або модель для застосувань з поганою зв’язком». Вона також може бути корисною для компаній з жорсткими вимогами до безпеки.

Разом із запуском, Google випускає набір для розробки програмного забезпечення (SDK) для роботи на пристрої, який розробники можуть використовувати для оцінки та налаштування моделі — це перший випадок для одного з VLA від Google DeepMind.

Модель Gemini Robotics для пристроїв і її SDK будуть доступні обмеженій групі довірених тестувальників, поки Google продовжує працювати над зменшенням ризиків безпеки.

  • Демченко Галина

    Related Posts

    Як штучний інтелект Google створив забавні Але жахливі копії ігор Nintendo

    Google представив новий експериментальний інструмент штучного інтелекту під назвою Project Genie, який дозволяє користувачам генерувати інтерактивні 3D-світи, виходячи з текстових чи графічних запитів. Цей новий продукт, заснований на моделі Genie…

    Apple здійснила найбільшу угоду з моменту покупки Beats: компанія, що розуміє «мову без слів»

    Кампанія Apple продовжує зміцнювати свої позиції на ринку штучного інтелекту, оголосивши про придбання стартапу Q.ai, що спеціалізується на аудіоінноваціях. Це рішення, яке, за попередніми даними, обійдеться компанії у 2 мільярди…

    You Missed

    Топ-10 смартфонів 2025 року: Які моделі підкорять світ?

    Топ-10 смартфонів 2025 року: Які моделі підкорять світ?

    Atlus планує підвищити заробітні плати та зменшити фіксований понаднормовий час роботи

    Atlus планує підвищити заробітні плати та зменшити фіксований понаднормовий час роботи

    Відчуй ностальгію: Спеціальний чохол для AirPods у стилі класичної миші Apple Macintosh

    Відчуй ностальгію: Спеціальний чохол для AirPods у стилі класичної миші Apple Macintosh

    Як штучний інтелект Google створив забавні Але жахливі копії ігор Nintendo

    Як штучний інтелект Google створив забавні Але жахливі копії ігор Nintendo

    ШІ ставить під сумнів майбутнє професій у США: чи варто хвилюватися?

    ШІ ставить під сумнів майбутнє професій у США: чи варто хвилюватися?

    Apple інвестує $2 млрд у стартап Q.AI для розробки революційної технології розпізнавання мікрорухів обличчя

    Apple інвестує $2 млрд у стартап Q.AI для розробки революційної технології розпізнавання мікрорухів обличчя