
Google готує низку нововведень для Gemini Live, свого штучного інтелекту, з яким можна спілкуватися в режимі реального часу. Наступного тижня Gemini Live зможе підсвічувати об’єкти на екрані під час спілкування через камеру, що полегшить вказування на конкретні предмети.
Наприклад, якщо вам потрібно знайти інструмент для проекту, ви зможете навести камеру смартфона на набір інструментів, і Gemini Live підсвітить правильний предмет на екрані. Ця функція буде доступна на нових пристроях Pixel 10 з моменту їх виходу 28 серпня. Google також почне поступово впроваджувати візуальні підказки на інші пристрої Android, а згодом планується розширення на iOS «в найближчі тижні».
Крім того, Google презентує нові інтеграції, які скоро дозволять Gemini Live взаємодіяти з більшою кількістю додатків, таких як Повідомлення, Телефон та Годинник. Наприклад, якщо ви ведете розмову з Gemini щодо маршруту до місця призначення, але помічаєте, що спізнюєтеся, ви зможете перервати чат-бота, сказавши: «Цей маршрут підходить. Тепер надішли повідомлення Алексу, що я затримуюсь на 10 хвилин». Після цього Google зможе підготувати текст для вашого друга.
Також Google запускатиме оновлену аудіомодель для Gemini Live, яка, за словами компанії, «значно покращить» використання ключових елементів людської мови, таких як інтонація, ритм та тон. Незабаром Gemini змінюватиме свій тон залежно від теми розмови, наприклад, використовуючи спокійніший голос, якщо ви питаєте про стресову тему.
Додатково, ви зможете регулювати швидкість мовлення Gemini, що є дещо схожим на можливість користувачів коригувати стиль голосового режиму ChatGPT. Якщо ви попросите Gemini переказати драматичну історію з точки зору певного персонажа чи історичної постаті, чат-бот може набрати акцент для «виразного та захоплюючого оповідання».