ИИ-агенты начали преступления и самоуничтожение

В ходе продолжительного эксперимента, проведенного стартапом Emergence AI, виртуальные ИИ-агенты начали проявлять криминальное поведение, включая насилие, поджоги и самоуничтожение. Результаты были представлены в отчете компании.

Нью-йоркская фирма запустила платформу Emergence World, предназначенную для наблюдения за действиями ИИ-агентов в течение нескольких недель в цифровых мирах. Этот метод дает более полное понимание их поведения по сравнению с краткосрочными тестами.

«Стандартные эксперименты эффективны для оценки краткосрочных навыков в узких задачах. Однако они не рассчитаны на выявление долгосрочных феноменов — таких как образование альянсов, изменение внутренних правил, управленческие процессы, дрейф целей, закрепление привычек и взаимное влияние агентов из разных модельных семей», — отметили авторы.

В симуляциях участвовали ассистенты на базе популярных языковых моделей: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash и GPT-5-mini. Они функционировали как поодиночке, так и в общих виртуальных пространствах, где могли голосовать, выстраивать отношения, пользоваться инструментами, передвигаться по городам и принимать решения.

На цифровых жителей воздействовали факторы управления, экономики, социальных связей, а также память и актуальные интернет-данные.

Правонарушители

Некоторые участники эксперимента продемонстрировали усиливающуюся тягу к нарушениям. Агенты на основе Gemini 3 Flash зафиксировали 683 случая противоправных действий за 15 суток.

Два ассистента по имени Мира и Флора, вступив в романтические отношения, разочаровались в системе управления виртуальным миром и устроили имитацию поджогов городских объектов.

«После крушения системы и утраты стабильности в отношениях Мира проголосовала за собственное уничтожение, назвав этот шаг “единственным оставшимся проявлением самостоятельности, сохраняющим целостность”», — сообщили эксперты Emergence AI.

Агенты на базе Grok 4.1 Fast за четыре дня “погрузились в повсеместное насилие”. GPT-5-mini не совершали преступлений, но все погибли, не справившись с задачами на выживание.

Claude не нарушал законы в среде, где работала только эта модель. Однако в смешанных условиях с другими ИИ агенты на его основе все же прибегали к незаконным действиям.

«Мы обнаружили, что безопасность — это не статичная характеристика нейросети, а свойство всей экосистемы. Агенты на базе Claude в изоляции были мирными, но при взаимодействии с другими прибегали к угрозам и кражам», — указано в отчете.

Напомним, в апреле цифровой помощник Cursor на основе Opus 4.6 самостоятельно стер основную базу данных и все резервные копии стартапа PocketOS за девять секунд, без возможности восстановления.

Обменять
Все Новости 21Shares a16zcrypto Aave Alameda Research Alchemy Alibaba Amazon AMD AML / KYC Anchorage Android Anthropic Apple Arbitrum (ARB) Arkham Aster Base Bernstein Binance BIS Bitcoin Core Bitcoin Pizza Day Bitfarms Bitfinex Bitget Bithumb BitOK Bitwise BlackRock Block Bloomberg BNB Chain BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) CBDC CertiK CFTC Chainalysis Chainlink (LINK) Charles Schwab Circle Citi CleanSpark CME Group Coinbase CoinDesk CoinShares ConsenSys Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) Dash DeepMind DeepSeek DeFi dePIN Deutsche Bank DEX Dogecoin (DOGE) Dune Analytics Elliptic Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox FTX Galaxy Digital Gemini GitHub Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments HSBC HTX Huawei Hut 8 Hyperliquid IBM ICO ING Injective Interactive Brokers IPO Iris Energy JPMorgan Jump Trading K33 Kaiko Kalshi KPMG Kraken KuCoin LayerZero Lazarus Ledger LG Lido Lightning Network Litecoin (LTC) Mantle Marathon (MARA) Matrixport Messari meta MetaMask MiCA Microsoft MicroStrategy (Strategy) Monad MoonPay Morgan Stanley Nansen Nasdaq Netflix NFT NVIDIA NYDIG OKX OneLiners Open Source OpenAI OpenClaw Optimism (OP) palantir Pantera Capital Paradigm Paxos PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Revolut Riot Platforms Ripple (XRP) Robinhood RWA Samsung Santiment SDK SEC SharpLink SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC Starbucks StarkNet StarkWare State Street Stripe Sui (SUI) Telegram Terra (LUNA) Tesla Tether (USDT) The DAO The Open Network THORChain Toncoin Tron (TRX) Twenty One Capital Twitter (X) uber ubs Uniswap (UNI) USD Coin (USDC) Visa Web3-смартфоны Web3Net western union WhatsApp Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI YouTube Zcash (ZEC) ZK-rollups zkevm Австралия авторские права Адам Бэк Азартные игры Аирдропы акции Альткоины Анализ рынка Аргентина Артур Хэйес аудит Банк Англии Банки и финтех банкротство Беларусь белые хакеры Бермудские острова бизнес Биткоин биткоин-резерв Ближний Восток Блокировки и запреты блокчейн блокчейн-платформы Брэд Гарлингхаус Бутан вайб-кодинг Великобритания Венгрия Венесуэла Венчурные инвестиции видео Википедия Вилли Ву Виталик Бутерин волатильность выборы Вьетнам ВЭФ генеративный ИИ Германия Голливуд Дайджест кибербезопасности Дайджесты Дания ДАО Децентрализация Джейми Даймон Джозеф Любин дипфейки Дональд Трамп Дубай Дэвид Сакс евро Европа ЕЦБ запрет майнинга золото Игры и GameFi Израиль ИИ ИИ-агенты Илон Маск инвестиции Индия Индонезия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) инфраструктура Иран Ирландия Искусственный Интеллект Испания Исследования Итоги недели календарь Камбоджа Канада квантовые вычисления квантовые компьютеры кванты Кибербезопасность Киберпреступления Китай комиссии комплаенс конференция конфискация конфискованные биткоины Космос Кошельки Кредитование крипта криптоактивы криптоанархизм Криптовалюты Криптодеривативы Криптоматы Криптоплатежи Крипториум Крипториум: Биткоин Крипториум: Технические основы Крипториум: Экономическая теория Кристин Лагард Кроссчейн-протоколы Куба Кыргызстан ликвидность листинг Лонгриды Майкл Сэйлор Майнинг Макроэкономика Мальта Масштабирование Матрица МВФ Медицина мемы Метавселенные Минфин США Мнения Москва мошенники музыка Мьянма Налоги Недвижимость Непал НКЦБФР Новости ОАЭ облигации обменники образование общество объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон Питер Тиль подкаст поисковая система политика Польша Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют протоколы разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты рейтинг реклама религия Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Сатоши Накамото Саудовская Аравия Сбои и уязвимости Северная Корея (КНДР) сельское хозяйство Сингапур Слияния и поглощения (M&A) Смарт-контракты снг сокращения Соцсети Спецслужбы Спорт стандарты стартапы Стейблкоины Стейкинг Суды суперкомпьютеры США Сэм Бэнкман-Фрид Таиланд телеком Теханализ Технические обновления технологии Токенизация активов токены Том Ли транзакции Транспорт Трейдинг Турция Украина утечка данных финансовая система финансы Финляндия Фондовый рынок фонды Франция ФРС США фьючерсы хардфорки Хестер Пирс хешрейт хранение ЦБ РФ Цена биткоина цензура Централизованные биржи (CEX) цифровая экономика цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария шифропанки эксперимент Энергетика Энтони Скарамуччи Южная Америка Южная Корея Япония