Kling AI представила новую модель видеогенерации

Китайская компания Kuaishou выпустила третье поколение своей модели для создания видео под названием Kling AI. Разработчики позиционируют Kling 3.0 как универсальный творческий инструмент, который делает сложные аудиовизуальные форматы доступными для широкого круга пользователей.

Модель основана на глубоко унифицированной платформе обучения, что обеспечивает нативный мультимодальный ввод и вывод данных. Ключевым улучшением стала бесшовная интеграция аудиодорожки и продвинутый контроль согласованности элементов, что придает сгенерированным роликам ощущение цельности и реалистичности.

Функционал Kling 3.0 охватывает несколько задач: преобразование текстовых описаний, изображений и референсов в видео, а также модификация, дополнение или удаление контента в уже готовых роликах. Максимальная длительность генерируемого видео увеличилась до 15 секунд.

Новая функция Multi-Shot автоматически анализирует текстовый запрос пользователя, определяет структуру сцены и типы необходимых кадров, после чего самостоятельно выстраивает ракурсы и композицию. Модель поддерживает различные монтажные решения, включая классические диалоги, параллельное повествование и сцены с закадровым голосом.

Система способна работать с несколькими изображениями или короткими видеофрагментами в качестве исходных материалов, фиксируя ключевые характеристики персонажей и предметов. Это обеспечивает стабильность и согласованность объектов на протяжении всего ролика, независимо от движения камеры или развития сюжета.

Разработчики усовершенствовали генерацию аудио. Система точнее синхронизирует речь с артикуляцией, а в диалогах позволяет вручную назначать говорящего персонажа. Модель поддерживает пять языков: китайский, английский, японский, корейский и испанский, с улучшенной передачей диалектов и акцентов.

Параллельно команда обновила мультимодальную модель O1 до версии Video 3.0 Omni. Пользователи могут загружать аудиозаписи речи от трех секунд для извлечения голосовых характеристик или предоставлять короткие видео с персонажем для копирования его внешности и манер.

Рынок AI-генерации видео становится все более конкурентным. Компания OpenAI представила свою модель Sora еще в феврале 2024 года, но публичный релиз состоялся лишь в декабре. Несмотря на впечатляющий старт мобильного приложения, которое быстро набрало миллионы загрузок, в последние месяцы интерес к Sora пошел на спад.

На рынке активно развиваются другие игроки. Google усилила свои позиции с моделью Nano Banana для Gemini, Meta AI продвигает функцию Vibes, а стартап Runway недавно анонсировал модель Gen 4.5, показавшую высокие результаты в независимых тестах.

Sora также столкнулась с проблемами, связанными с нарушением авторских прав, когда пользователи массово создавали ролики с известными персонажами. Хотя позже OpenAI заключила соглашение с Disney, это не привело к возобновлению роста популярности сервиса. Дополнительной сложностью стало распространение дипфейков, например, с использованием образа CEO компании Сэма Альтмана.

Обменять
Все Новости Aave Alameda Research Alibaba Amazon Android Anthropic Apple Arbitrum (ARB) Arkham Aster Base Bernstein Binance Bitget Bithumb Bitwise BlackRock Bloomberg BNP Paribas Börse Stuttgart Bullish Canaan Cardano (ADA) Chainalysis Chainlink (LINK) Circle CleanSpark CME Group Coinbase CoinShares Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) DeepMind DeepSeek DeFi Deutsche Bank DEX Elliptic Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments FTX Gemini Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments HSBC HTX Hyperliquid ING JPMorgan Jump Trading K33 Kaiko Kalshi Kraken KuCoin LayerZero Lido Lightning Network Marathon (MARA) Matrixport meta MetaMask MicroStrategy (Strategy) MoonPay Nansen Nasdaq Netflix NVIDIA NYDIG OpenAI Optimism (OP) Pantera Capital PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Riot Platforms Ripple (XRP) Robinhood RWA Santiment SEC Solana (SOL) Solana-резерв Standard Chartered PLC StarkNet StarkWare Stripe Terra (LUNA) Tesla Tether (USDT) The DAO ubs Uniswap (UNI) USD Coin (USDC) Web3-смартфоны Web3Net Wintermute World Liberty Financial (WLFI) x402 XAI YouTube Zcash (ZEC) ZK-rollups авторские права Адам Бэк Аирдропы акции Альткоины Анализ рынка Банки и финтех банкротство Беларусь Бермудские острова бизнес Биткоин биткоин-резерв Блокировки и запреты блокчейн Бутан вайб-кодинг Великобритания Венесуэла Венчурные инвестиции видео Вилли Ву Виталик Бутерин волатильность ВЭФ Германия Голливуд ДАО Децентрализация дипфейки Дональд Трамп Дубай Европа золото ИИ-агенты Илон Маск инвестиции Индия Институционалы и киты интернет интероперабельность Иран Искусственный Интеллект Испания Исследования календарь Канада квантовые вычисления квантовые компьютеры Кибербезопасность Киберпреступления Китай комиссии конфискация Космос Кошельки Кредитование Криптовалюты Криптоплатежи Кроссчейн-протоколы ликвидность Лонгриды Майкл Сэйлор Майнинг Макроэкономика Масштабирование мемы Минфин США Мнения мошенники Недвижимость Новости ОАЭ образование объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон политика Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты реклама Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Сбои и уязвимости сельское хозяйство снг сокращения Соцсети стандарты Стейблкоины Стейкинг Суды США Сэм Бэнкман-Фрид телеком Теханализ Технические обновления Токенизация активов токены Том Ли транзакции Трейдинг Турция утечка данных финансовая система Фондовый рынок фонды ФРС США фьючерсы хардфорки хешрейт хранение Цена биткоина цензура Централизованные биржи (CEX) цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария Энергетика Энтони Скарамуччи Южная Корея