Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой

Компания Anthropic выпустила крупное обновление своей ведущей модели искусственного интеллекта Claude, представив версию Opus 4.6. Новая версия демонстрирует значительный прогресс в способности планировать действия, выполнять длительные задачи и работать с большими базами кода.
Важным усовершенствованием стало увеличение контекстного окна до одного миллиона токенов. Это позволяет модели анализировать огромные документы и вести продолжительные диалоги, не теряя логической связи.
Алгоритмы модели были оптимизированы для решения практических рабочих задач, таких как финансовый анализ, исследовательская деятельность, а также создание и обработка документов, таблиц и презентаций.
В ходе тестирования Opus 4.6 достигла наивысшего балла в бенчмарке по программированию Terminal-Bench 2.0 и обошла конкурентов в сложном междисциплинарном тесте на логическое мышление Humanity’s Last Exam.
В тесте GDPval-AA, оценивающем качество рассуждений и принятия решений, модель превзошла GPT-5.2 от OpenAI. Она также показала лучшие результаты в BrowseComp, который измеряет умение находить в сети труднодоступную информацию.
Благодаря расширенному контекстному окну модель эффективно извлекает данные из объемных документов, улавливая даже неочевидные детали.
Команды агентов
Одним из ключевых нововведений стала возможность формировать группы автономных ИИ-агентов для совместной работы. Несколько ассистентов могут действовать параллельно, координируя свои усилия.
Этот инструмент хорошо подходит для задач, которые можно разделить на независимые части и которые требуют анализа большого массива текстовой информации.
Замкнутый цикл
В Anthropic отметили, что создают Claude с помощью самого Claude. Разработчики пишут код, используя собственную модель, а каждый новый продукт перед выпуском тестируется на внутренних задачах компании.
Специалисты обнаружили, что Opus 4.6 фокусируется на самых сложных аспектах задачи без дополнительных указаний, быстро выполняет простые поручения, лучше справляется с неоднозначными проблемами и сохраняет эффективность при длительной работе.
В компании подчеркнули, что Opus 4.6 часто мыслит более глубоко и тщательно перепроверяет свои рассуждения перед принятием решения. Это приводит к лучшим результатам в сложных случаях, но может увеличивать затраты ресурсов на простые задачи.
Безопасность
Автоматизированный аудит выявил у новой модели низкую склонность к нежелательному поведению, такому как обман, лесть, поддержка заблуждений пользователя или содействие в противоправных действиях.
Для проверки модели была проведена наиболее полная серия оценок с применением новых методик тестирования и усовершенствованием существующих.
Доступность и новые функции
Claude Opus 4.6 уже доступна через веб-интерфейс, API и на основных облачных платформах.
Инструментарий для разработчиков пополнился рядом новых возможностей:
адаптивное мышление — модель самостоятельно определяет, когда необходимо задействовать режим глубокого анализа;
регулировка усилий — предусмотрено четыре уровня интенсивности работы, от низкого до максимального;
уплотнение контекста — система автоматически резюмирует и заменяет старый контекст, когда диалог приближается к лимиту токенов.
Opus 4.6 демонстрирует улучшенную интеграцию с офисными приложениями, такими как Excel и PowerPoint.
Напомним, что в январе генеральный директор Anthropic Дарио Амодеи прогнозировал скорое появление общего искусственного интеллекта и связанное с этим сокращение рабочих мест.
Популярные новости: