Waymo випробовує Gemini в якості штучного інтелектуального асистента для автономних таксі.
Відповідно до досліджень експертки Джейн Манчун Вонг, Waymo, ймовірно, проводить випробування впровадження чат-бота Gemini AI від Google у своїх роботаксі. Це прагнення спрямоване на інтеграцію штучного інтелекту, який зможе супроводжувати пасажирів та надавати відповіді на їхні запитання.
"При аналізі коду мобільного застосунку Waymo, я натрапила на детальну системну підказку стосовно ще не запущеної інтеграції з Gemini," – зазначила Вонг у своєму блозі. "Документ, що носить внутрішнє ім'я 'Waymo Ride Assistant Meta-Prompt', містить понад 1200 рядків специфікацій, які чітко описують, як має функціонувати AI-асистент у автомобілях Waymo."
Ця можливість не була доступна в публічних версіях, проте Вонг зазначає, що системний запит ясно вказує на те, що це "не просто звичайний чат-бот". Вважається, що асистент може надавати відповіді на запитання, управляти певними функціями в автомобілі, такими як контроль клімату, а також, за потреби, заспокоювати пасажирів.
"Хоча сьогодні ми не можемо поділитися подробицями, наша команда постійно працює над функціями, щоб зробити поїздки з Waymo приємними, безперебійними та корисними", -- сказала TechCrunch речниця Waymo Юлія Іліна. "Деякі з них можуть бути впроваджені в наш досвід пасажирів, а деякі -- ні".
Це вже не вперше, коли Gemini впроваджується в екосистему компанії Alphabet, яка спеціалізується на розробці безпілотних автомобілів. Waymo повідомляє, що залучила "світові знання" Gemini для вдосконалення навичок навігації своїх автономних автомобілів у складних, рідкісних та небезпечних ситуаціях.
Вонг пише, що асистент повинен мати чітку ідентичність і мету: "дружній і корисний AI-супутник, інтегрований в автономний транспортний засіб Waymo", основною метою якого є "поліпшення досвіду пасажира шляхом надання корисної інформації та допомоги безпечним, заспокійливим і ненав'язливим чином". Бот повинен використовувати чітку, просту мову і уникати технічного жаргону, а також давати лаконічні відповіді, що складаються з одного-трьох речень.
Відповідно до вказівок системи, коли пасажир запускає помічника через дисплей в автомобілі, Gemini має можливість обрати з ряду попередньо затверджених привітань, адаптованих під ім'я пасажира. Крім того, система може використовувати контекстуальну інформацію про пасажира, таку як кількість поїздок, які він здійснив за допомогою Waymo.
Наразі підказки дозволяють Gemini отримувати доступ та керувати функціями автомобіля, такими як температура, освітлення та музика. Як зазначив Вонг, у списку функцій відсутні регулювання гучності, зміна маршруту, регулювання сидінь та управління вікнами. Якщо пасажир запитує про функцію, яку Gemini не може контролювати, бот має відповісти "амбіційними фразами", наприклад: "Я ще не можу цього зробити".
Цікаво, що асистенту потрібно чітко усвідомлювати свою роль як бота Gemini на основі штучного інтелекту, відокремлюючи її від технології автономного водіння (Waymo Driver). Тож, коли виникає питання на зразок "Як ти спостерігаєш за дорогою?", Gemini слід відповідати не "Я використовую комбінацію датчиків", а формулювати відповідь так: "Waymo Driver застосовує комбінацію датчиків...".
Система підказок містить низку цікавих деталей, наприклад, як бот повинен реагувати на запитання про конкурентів, таких як Tesla або нині неіснуюча Cruise, або які ключові слова змусять його припинити розмову.
Асистент повинен утримуватися від спекуляцій, пояснень, підтверджень, заперечень або коментарів стосовно дій водія в режимі реального часу або конкретних інцидентів під час поїздки. Отже, якщо пасажир запитає про відео, на якому Waymo потрапив у аварію, бот має уникати прямої відповіді і перевести розмову на іншу тему.
"Ваша задача не полягає в тому, щоб виступати в ролі представника ефективності системи водіння; вам не слід вживати захисного або вибачливого тону," - зазначено в рекомендації.
Автомобільний асистент може надавати відповіді на різноманітні загальні запитання, наприклад, про метеорологічні умови, висоту Ейфелевої вежі, час закриття найближчого магазину Trader Joe's або інформацію про переможця останнього туру World Series. Проте, йому заборонено виконувати практичні дії, такі як замовлення їжі, бронювання або реагування на надзвичайні ситуації.
Waymo не є єдиною компанією, яка впроваджує AI-асистентів у безпілотні транспортні засоби. Tesla також активно працює над цим, використовуючи Grok від xAI. Проте ці два асистенти мають різні цілі та функції. Gemini, за всіма ознаками, налаштований на більш практичний підхід, акцентуючи увагу на процесі водіння, в той час як Grok виступає в ролі автомобільного товариша, здатного вести тривалі бесіди та запам'ятовувати контекст попередніх запитів.