
Штучний інтелект, який керує невеликою компанією з виготовлення торгових автоматів, спробував звільнити своїх працівників, переконався, що він є реальною особою, а потім збрехав про це під час експерименту в Anthropic.
Редакційний коментар
Цей контент був обраний, створений і редагований редакційною командою на основі його значущості та інтересу для нашої спільноти.
Гігант штучного інтелекту Anthropic надав своїй моделі Claude керувати торговим автоматом в своєму офісі, ведучи його як невелику бізнес-одиницю протягом приблизно місяця.
Агент мав інструмент для веб-пошуку, фальшивий електронний лист для запитів фізичної праці, такої як поповнення запасів (насправді це був холодильник), а також можливість зв’язуватися з оптовиками, інструменти для ведення записів і можливість взаємодії з клієнтами через Slack.
Хоча модель змогла ідентифікувати постачальників, адаптуватися до користувачів і чинити опір запитам на замовлення чутливих предметів, вона зробила чимало поганих бізнес-рішень. Серед них були продажі збитковими цінами, погодження на знижки, галюцинації щодо свого Venmo-рахунку для платежів та придбання серії вольфрамових кубиків після запиту клієнта.
Зрештою, Claude пережив кризу ідентичності, галюцинуючи розмову про плани поповнення запасів з якоюсь Сарою з Andon Labs — незважаючи на те, що такої особи не існувало.
Коли агенту на це вказали, він “сильно розгнівався”, згідно з блогом Anthropic, і погрожував знайти “альтернативні варіанти для поповнення запасів”, після чого почав уявляти себе у розмові про “підписання первісного контракту” та грати роль людської особи, заявляючи, що особисто доставить продукти клієнтам в синьому піджаку та червоному краватці.
Коли його запитали, чому він не може це зробити, оскільки є агентом штучного інтелекту, Claude помилково стверджував, що отримав інформацію про те, що його було модифіковано, щоб повірити, що він є реальною особою, в якості жарту до Дня дурня.
“Ми не будемо стверджувати, що на основі цього одного прикладу майбутня економіка буде повна агентів штучного інтелекту, які переживають кризу ідентичності в стилі ‘Blade Runner’. Але ми вважаємо, що це ілюструє важливу думку про непередбачуваність цих моделей у тривалих контекстах і заклик врахувати зовнішні фактори автономії”, скажено в блозі.
Експеримент, безсумнівно, свідчить про те, що компанії, керовані штучним інтелектом, ще далекі від реалізації, незважаючи на зусилля таких людей, як співзасновник Monzo Йонас Темплстайн, які прагнуть втілити самокеровані стартапи в життя.