Kling AI представила новую модель видеогенерации

Китайская компания Kuaishou выпустила третье поколение своей модели для создания видео под названием Kling AI. Разработчики позиционируют Kling 3.0 как универсальный творческий инструмент, который делает сложные аудиовизуальные форматы доступными для широкого круга пользователей.

Модель основана на глубоко унифицированной платформе обучения, что обеспечивает нативный мультимодальный ввод и вывод данных. Ключевым улучшением стала бесшовная интеграция аудиодорожки и продвинутый контроль согласованности элементов, что придает сгенерированным роликам ощущение цельности и реалистичности.

Функционал Kling 3.0 охватывает несколько задач: преобразование текстовых описаний, изображений и референсов в видео, а также модификация, дополнение или удаление контента в уже готовых роликах. Максимальная длительность генерируемого видео увеличилась до 15 секунд.

Новая функция Multi-Shot автоматически анализирует текстовый запрос пользователя, определяет структуру сцены и типы необходимых кадров, после чего самостоятельно выстраивает ракурсы и композицию. Модель поддерживает различные монтажные решения, включая классические диалоги, параллельное повествование и сцены с закадровым голосом.

Система способна работать с несколькими изображениями или короткими видеофрагментами в качестве исходных материалов, фиксируя ключевые характеристики персонажей и предметов. Это обеспечивает стабильность и согласованность объектов на протяжении всего ролика, независимо от движения камеры или развития сюжета.

Разработчики усовершенствовали генерацию аудио. Система точнее синхронизирует речь с артикуляцией, а в диалогах позволяет вручную назначать говорящего персонажа. Модель поддерживает пять языков: китайский, английский, японский, корейский и испанский, с улучшенной передачей диалектов и акцентов.

Параллельно команда обновила мультимодальную модель O1 до версии Video 3.0 Omni. Пользователи могут загружать аудиозаписи речи от трех секунд для извлечения голосовых характеристик или предоставлять короткие видео с персонажем для копирования его внешности и манер.

Рынок AI-генерации видео становится все более конкурентным. Компания OpenAI представила свою модель Sora еще в феврале 2024 года, но публичный релиз состоялся лишь в декабре. Несмотря на впечатляющий старт мобильного приложения, которое быстро набрало миллионы загрузок, в последние месяцы интерес к Sora пошел на спад.

На рынке активно развиваются другие игроки. Google усилила свои позиции с моделью Nano Banana для Gemini, Meta AI продвигает функцию Vibes, а стартап Runway недавно анонсировал модель Gen 4.5, показавшую высокие результаты в независимых тестах.

Sora также столкнулась с проблемами, связанными с нарушением авторских прав, когда пользователи массово создавали ролики с известными персонажами. Хотя позже OpenAI заключила соглашение с Disney, это не привело к возобновлению роста популярности сервиса. Дополнительной сложностью стало распространение дипфейков, например, с использованием образа CEO компании Сэма Альтмана.

Обменять
Все Новости 21Shares a16zcrypto Aave Alameda Research Alchemy Alibaba Amazon AML / KYC Anchorage Android Anthropic Apple Arbitrum (ARB) Arkham Aster Base Bernstein Binance BIS Bitcoin Core Bitcoin Pizza Day Bitfarms Bitfinex Bitget Bithumb BitOK Bitwise BlackRock Block Bloomberg BNB Chain BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) CBDC CertiK CFTC Chainalysis Chainlink (LINK) Charles Schwab Circle CleanSpark CME Group Coinbase CoinDesk CoinShares ConsenSys Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) Dash DeepMind DeepSeek DeFi Deutsche Bank DEX Dogecoin (DOGE) Dune Analytics Elliptic Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox FTX Galaxy Digital Gemini GitHub Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments HSBC HTX Hut 8 Hyperliquid IBM ING Injective Interactive Brokers IPO Iris Energy JPMorgan Jump Trading K33 Kaiko Kalshi KPMG Kraken KuCoin LayerZero Lazarus Ledger Lido Lightning Network Litecoin (LTC) Mantle Marathon (MARA) Matrixport Messari meta MetaMask Microsoft MicroStrategy (Strategy) Monad MoonPay Morgan Stanley Nansen Nasdaq Netflix NVIDIA NYDIG OKX OneLiners Open Source OpenAI OpenClaw Optimism (OP) palantir Pantera Capital Paxos PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Revolut Riot Platforms Ripple (XRP) Robinhood RWA Samsung Santiment SDK SEC SharpLink SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC Starbucks StarkNet StarkWare Stripe Sui (SUI) Telegram Terra (LUNA) Tesla Tether (USDT) The DAO THORChain Toncoin Tron (TRX) Twenty One Capital Twitter (X) ubs Uniswap (UNI) USD Coin (USDC) Visa Web3-смартфоны Web3Net western union WhatsApp Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI YouTube Zcash (ZEC) ZK-rollups zkevm Австралия авторские права Адам Бэк Аирдропы акции Альткоины Анализ рынка Аргентина Артур Хэйес аудит Банк Англии Банки и финтех банкротство Беларусь Бермудские острова бизнес Биткоин биткоин-резерв Ближний Восток Блокировки и запреты блокчейн блокчейн-платформы Брэд Гарлингхаус Бутан вайб-кодинг Великобритания Венесуэла Венчурные инвестиции видео Википедия Вилли Ву Виталик Бутерин волатильность выборы ВЭФ генеративный ИИ Германия Голливуд Дайджест кибербезопасности Дайджесты ДАО Децентрализация Джозеф Любин дипфейки Дональд Трамп Дубай Дэвид Сакс евро Европа ЕЦБ запрет майнинга золото ИИ-агенты Илон Маск инвестиции Индия Индонезия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) Иран Ирландия Искусственный Интеллект Испания Исследования Итоги недели календарь Канада квантовые вычисления квантовые компьютеры Кибербезопасность Киберпреступления Китай комиссии комплаенс конференция конфискация Космос Кошельки Кредитование криптоактивы Криптовалюты Криптодеривативы Криптоматы Криптоплатежи Крипториум Крипториум: Технические основы Кристин Лагард Кроссчейн-протоколы Кыргызстан ликвидность листинг Лонгриды Майкл Сэйлор Майнинг Макроэкономика Мальта Масштабирование Матрица МВФ Медицина мемы Минфин США Мнения Москва мошенники музыка Налоги Недвижимость НКЦБФР Новости ОАЭ облигации обменники образование объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон Питер Тиль подкаст поисковая система политика Польша Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты рейтинг реклама религия Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Сатоши Накамото Саудовская Аравия Сбои и уязвимости Северная Корея (КНДР) сельское хозяйство Слияния и поглощения (M&A) Смарт-контракты снг сокращения Соцсети Спецслужбы Спорт стандарты стартапы Стейблкоины Стейкинг Суды США Сэм Бэнкман-Фрид Таиланд телеком Теханализ Технические обновления технологии Токенизация активов токены Том Ли транзакции Транспорт Трейдинг Турция Украина утечка данных финансовая система финансы Финляндия Фондовый рынок фонды ФРС США фьючерсы хардфорки Хестер Пирс хешрейт хранение Цена биткоина цензура Централизованные биржи (CEX) цифровая экономика цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария шифропанки эксперимент Энергетика Энтони Скарамуччи Южная Америка Южная Корея