Квантовое улучшение Llama 3.1 на IBM Heron

27.05.2026 Исследования квантовые вычисления квантовые компьютеры Новости

Специалисты компании Multiverse Computing сообщили о том, что им удалось повысить производительность большой языковой модели с помощью квантовых вычислений на оборудовании IBM. В основе разработки лежит гибридная архитектура, использующая 156-кубитный процессор Heron.

Авторы назвали свой эксперимент первым случаем «сквозного квантового ускорения» LLM на сверхпроводящем чипе для авторегрессионной генерации текста.

В ходе испытаний применялась модель Llama 3.1 8B от Meta. Её не подвергали дополнительному обучению: параметры оставили неизменными, а к ним добавили квантовые адаптеры — унитарные модули, построенные на основе параметризации Кэли (CUA). Сначала эти адаптеры обучали классическим методом, после чего интегрировали в гибридную квантово-классическую систему.

Тестирование проходило на платформе IBM Quantum System Two, созданной для гибридных квантовых решений. В установке применялся 156-кубитный чип Heron.

Гибридная версия позволила снизить перплексию Llama 3.1 8B на 1,4%. Для этого потребовалось добавить около 6000 параметров, что составляет примерно 0,000075% от общего объёма модели.

Во время демонстрации квантово-улучшенная Llama корректно отвечала на вопросы из области астрономии и биологии, с которыми исходная версия не справлялась (например, о том, есть ли кольца у всех планет-гигантов).

Ведущий автор исследования Борха Айспуруа отметил, что работа служит подтверждением концепции. Квантовые блоки позволили более точно предсказывать следующий токен в тексте, затрачивая минимум вычислительных ресурсов.

Команда намерена продолжить снижение перплексии и повышение точности, используя меньшее количество параметров по сравнению с традиционными классическими методами.

Напомним, что в мае котировки квантовых компаний выросли после заявления Министерства торговли США о выделении $2 млрд американским предприятиям в рамках программы CHIPS R&D.

Обменять