Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой

Google анонсировала семейство открытых ИИ-моделей нового поколения Gemma 4, созданных для сложных логических задач и автономных рабочих процессов.
Как отмечают в компании, Gemma 4 представляет собой наиболее интеллектуальные открытые модели на сегодняшний день, обеспечивающие беспрецедентный уровень эффективности на параметр. Разработка основана на тех же исследовательских наработках, что и чат-бот Gemini 3.
С момента первого релиза модели Gemma были загружены разработчиками более 400 миллионов раз, что привело к созданию свыше 100 тысяч модификаций в рамках экосистемы Gemmaverse.
Модельный ряд
Семейство Gemma 4 включает четыре версии: компактные Effective 2B (E2B) и Effective 4B (E4B), а также более мощные 26B Mixture of Experts (MoE) и флагманскую 31B Dense.
Модели E2B и E4B, насчитывающие 2,3 и 4,5 миллиарда активных параметров соответственно, ориентированы на мультимодальность, минимальную задержку и простую интеграцию. Их можно запускать на смартфонах или стандартных ноутбуках.
Для работы с версиями 26B MoE и 31B Dense, содержащими 26 и 31 миллиард параметров, потребуется графический ускоритель уровня Nvidia H100 с 80 ГБ памяти. Эти модели предназначены в первую очередь для исследователей и разработчиков.
Старшие модели демонстрируют выдающиеся результаты в отраслевых тестах. В глобальном рейтинге открытых текстовых моделей Arena AI флагманская 31B занимает третью позицию, а 26B — шестую. По заявлениям Google, новая линейка превосходит по эффективности конкурентные модели, которые крупнее в двадцать раз.
Основные функции
Ключевым преимуществом Gemma 4 являются развитые способности к логическим рассуждениям. Модели способны выстраивать сложные цепочки умозаключений и планировать многоэтапные задачи, показывая значительный прогресс в математических тестах и точном следовании инструкциям.
Среди других важных возможностей:
* Автономные рабочие процессы — встроенная поддержка вызова функций, структурированного вывода в JSON и системных инструкций позволяет создавать самостоятельных агентов, взаимодействующих с инструментами и внешними API.
* Генерация кода — модели обеспечивают качественное написание кода в офлайн-режиме, превращая рабочую станцию в локального ИИ-ассистента.
* Работа с мультимедиа — все версии способны обрабатывать видео и изображения с переменным разрешением, распознавать текст и анализировать диаграммы. Компактные E2B и E4B также поддерживают распознавание и понимание речи.
* Большой контекст — компактные модели поддерживают окно в 128 тысяч токенов, а более крупные — до 256 тысяч. Это позволяет анализировать целые репозитории кода или объемные документы в рамках одного запроса.
* Мультиязычность — семейство моделей работает с более чем 140 языками.
Gemma 4 уже доступна в Google AI Studio и Google AI Edge Gallery. Интеграцию также поддерживают популярные сторонние платформы, включая Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM и LM Studio.
Настройку моделей можно выполнять через Google Colab, Vertex AI или на локальных видеокартах. Для промышленного использования доступно развертывание в инфраструктуре Google Cloud, включая сервисы Cloud Run, GKE и Sovereign Cloud.
Ранее в апреле Google представила новую модель для генерации видео — Veo 3.1 Lite.
Популярные новости: