Anthropic выпустила Claude Opus 4.8 с динамическими процессами

29.05.2026 Anthropic Искусственный Интеллект Новости

Компания Anthropic анонсировала выпуск Claude Opus 4.8, а также внедрение функции динамических рабочих процессов для платформы Claude Code.

Новый инструмент позволяет искусственному интеллекту самостоятельно создавать оркестрационные скрипты, которые управляют десятками или сотнями параллельных субагентов. Система проверяет результаты работы перед тем, как передать их пользователю.

Решение ориентировано на выполнение сложных задач в объемных кодовых базах: проведение аудита безопасности, выявление ошибок, миграцию между различными фреймворками и языками программирования, а также модернизацию проектов.

Функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, в десктопной версии, расширении для VS Code, через API, а также на платформах Amazon Bedrock, Vertex AI и Microsoft Foundry.

Активировать режим можно прямой командой на создание рабочего процесса или через команду ultracode. Это переводит вычислительные мощности на максимальный уровень и позволяет модели самостоятельно решать, когда применять многошаговую схему.

В Anthropic предупредили, что динамические рабочие процессы потребляют значительно больше токенов по сравнению со стандартной сессией Claude Code.

Модель разделяет задачу на подзадачи, распределяет их между параллельными агентами, после чего объединяет результаты, прошедшие взаимную проверку и попытки опровергнуть найденные решения.

В качестве примера компания привела перенос инструмента Bun с языка Zig на Rust. Разработчик Джаред Самнер с помощью динамических рабочих процессов сгенерировал около 750 000 строк кода на Rust. Порт успешно прошел 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней. При этом в Anthropic уточнили, что данная версия пока не используется в продакшене.

Показатели новой модели Opus 4.8:
— 69,2% в SWE-Bench Pro;
— 49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними;
— 83,4% в OSWorld-Verified;
— 1890 баллов в GDPval-AA;
— 53,9% в Finance Agent v2.

В тесте Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%.

В Anthropic отметили, что Opus 4.8 стала значительно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше распознает проблемы в собственном коде до передачи результата пользователю.

Напомним, что в мае Anthropic опубликовала первый отчет по Project Glasswing — программе поиска уязвимостей с использованием модели Claude Mythos.

Обменять