Anthropic обновила флагманскую модель Claude Opus

Компания Anthropic выпустила крупное обновление своей ведущей модели искусственного интеллекта Claude, представив версию Opus 4.6. Новая версия демонстрирует значительный прогресс в способности планировать действия, выполнять длительные задачи и работать с большими базами кода.

Важным усовершенствованием стало увеличение контекстного окна до одного миллиона токенов. Это позволяет модели анализировать огромные документы и вести продолжительные диалоги, не теряя логической связи.

Алгоритмы модели были оптимизированы для решения практических рабочих задач, таких как финансовый анализ, исследовательская деятельность, а также создание и обработка документов, таблиц и презентаций.

В ходе тестирования Opus 4.6 достигла наивысшего балла в бенчмарке по программированию Terminal-Bench 2.0 и обошла конкурентов в сложном междисциплинарном тесте на логическое мышление Humanity’s Last Exam.

В тесте GDPval-AA, оценивающем качество рассуждений и принятия решений, модель превзошла GPT-5.2 от OpenAI. Она также показала лучшие результаты в BrowseComp, который измеряет умение находить в сети труднодоступную информацию.

Благодаря расширенному контекстному окну модель эффективно извлекает данные из объемных документов, улавливая даже неочевидные детали.

Команды агентов

Одним из ключевых нововведений стала возможность формировать группы автономных ИИ-агентов для совместной работы. Несколько ассистентов могут действовать параллельно, координируя свои усилия.

Этот инструмент хорошо подходит для задач, которые можно разделить на независимые части и которые требуют анализа большого массива текстовой информации.

Замкнутый цикл

В Anthropic отметили, что создают Claude с помощью самого Claude. Разработчики пишут код, используя собственную модель, а каждый новый продукт перед выпуском тестируется на внутренних задачах компании.

Специалисты обнаружили, что Opus 4.6 фокусируется на самых сложных аспектах задачи без дополнительных указаний, быстро выполняет простые поручения, лучше справляется с неоднозначными проблемами и сохраняет эффективность при длительной работе.

В компании подчеркнули, что Opus 4.6 часто мыслит более глубоко и тщательно перепроверяет свои рассуждения перед принятием решения. Это приводит к лучшим результатам в сложных случаях, но может увеличивать затраты ресурсов на простые задачи.

Безопасность

Автоматизированный аудит выявил у новой модели низкую склонность к нежелательному поведению, такому как обман, лесть, поддержка заблуждений пользователя или содействие в противоправных действиях.

Для проверки модели была проведена наиболее полная серия оценок с применением новых методик тестирования и усовершенствованием существующих.

Доступность и новые функции

Claude Opus 4.6 уже доступна через веб-интерфейс, API и на основных облачных платформах.

Инструментарий для разработчиков пополнился рядом новых возможностей:
адаптивное мышление — модель самостоятельно определяет, когда необходимо задействовать режим глубокого анализа;
регулировка усилий — предусмотрено четыре уровня интенсивности работы, от низкого до максимального;
уплотнение контекста — система автоматически резюмирует и заменяет старый контекст, когда диалог приближается к лимиту токенов.

Opus 4.6 демонстрирует улучшенную интеграцию с офисными приложениями, такими как Excel и PowerPoint.

Напомним, что в январе генеральный директор Anthropic Дарио Амодеи прогнозировал скорое появление общего искусственного интеллекта и связанное с этим сокращение рабочих мест.

Обменять
Все Новости Aave Alameda Research Alibaba Amazon Android Anthropic Apple Arbitrum (ARB) Arkham Aster Base Bernstein Binance Bitfinex Bitget Bithumb Bitwise BlackRock Bloomberg BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) Chainalysis Chainlink (LINK) Circle CleanSpark CME Group Coinbase CoinShares Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) DeepMind DeepSeek DeFi Deutsche Bank DEX Dogecoin (DOGE) Elliptic Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox FTX Gemini Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments HSBC HTX Hyperliquid ING Injective JPMorgan Jump Trading K33 Kaiko Kalshi Kraken KuCoin LayerZero Lido Lightning Network Litecoin (LTC) Marathon (MARA) Matrixport Messari meta MetaMask MicroStrategy (Strategy) MoonPay Morgan Stanley Nansen Nasdaq Netflix NVIDIA NYDIG OpenAI OpenClaw Optimism (OP) Pantera Capital PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Riot Platforms Ripple (XRP) Robinhood RWA Santiment SEC SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC StarkNet StarkWare Stripe Terra (LUNA) Tesla Tether (USDT) The DAO Tron (TRX) Twitter (X) ubs Uniswap (UNI) USD Coin (USDC) Visa Web3-смартфоны Web3Net Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI YouTube Zcash (ZEC) ZK-rollups авторские права Адам Бэк Аирдропы акции Альткоины Анализ рынка Аргентина Банки и финтех банкротство Беларусь Бермудские острова бизнес Биткоин биткоин-резерв Блокировки и запреты блокчейн Бутан вайб-кодинг Великобритания Венесуэла Венчурные инвестиции видео Вилли Ву Виталик Бутерин волатильность ВЭФ Германия Голливуд ДАО Децентрализация дипфейки Дональд Трамп Дубай Европа золото ИИ-агенты Илон Маск инвестиции Индия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) Иран Искусственный Интеллект Испания Исследования календарь Канада квантовые вычисления квантовые компьютеры Кибербезопасность Киберпреступления Китай комиссии конфискация Космос Кошельки Кредитование Криптовалюты Криптоплатежи Кроссчейн-протоколы ликвидность Лонгриды Майкл Сэйлор Майнинг Макроэкономика Масштабирование Медицина мемы Минфин США Мнения мошенники Недвижимость Новости ОАЭ образование объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон политика Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты реклама Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Сбои и уязвимости сельское хозяйство снг сокращения Соцсети Спорт стандарты Стейблкоины Стейкинг Суды США Сэм Бэнкман-Фрид телеком Теханализ Технические обновления Токенизация активов токены Том Ли транзакции Трейдинг Турция утечка данных финансовая система Фондовый рынок фонды ФРС США фьючерсы хардфорки хешрейт хранение Цена биткоина цензура Централизованные биржи (CEX) цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария Энергетика Энтони Скарамуччи Южная Корея