Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой

Специалисты компании Multiverse Computing сообщили о том, что им удалось повысить производительность большой языковой модели с помощью квантовых вычислений на оборудовании IBM. В основе разработки лежит гибридная архитектура, использующая 156-кубитный процессор Heron.
Авторы назвали свой эксперимент первым случаем «сквозного квантового ускорения» LLM на сверхпроводящем чипе для авторегрессионной генерации текста.
В ходе испытаний применялась модель Llama 3.1 8B от Meta. Её не подвергали дополнительному обучению: параметры оставили неизменными, а к ним добавили квантовые адаптеры — унитарные модули, построенные на основе параметризации Кэли (CUA). Сначала эти адаптеры обучали классическим методом, после чего интегрировали в гибридную квантово-классическую систему.
Тестирование проходило на платформе IBM Quantum System Two, созданной для гибридных квантовых решений. В установке применялся 156-кубитный чип Heron.
Гибридная версия позволила снизить перплексию Llama 3.1 8B на 1,4%. Для этого потребовалось добавить около 6000 параметров, что составляет примерно 0,000075% от общего объёма модели.
Во время демонстрации квантово-улучшенная Llama корректно отвечала на вопросы из области астрономии и биологии, с которыми исходная версия не справлялась (например, о том, есть ли кольца у всех планет-гигантов).
Ведущий автор исследования Борха Айспуруа отметил, что работа служит подтверждением концепции. Квантовые блоки позволили более точно предсказывать следующий токен в тексте, затрачивая минимум вычислительных ресурсов.
Команда намерена продолжить снижение перплексии и повышение точности, используя меньшее количество параметров по сравнению с традиционными классическими методами.
Напомним, что в мае котировки квантовых компаний выросли после заявления Министерства торговли США о выделении $2 млрд американским предприятиям в рамках программы CHIPS R&D.
Популярные новости: