The Verge→ оригинал

Seedance 2.0 من ByteDance: اختراق في توليد الفيديو أم قمامة مصقولة؟

كشفت ByteDance عن Seedance 2.0، وهو نموذج جديد لتوليد الفيديو. ونشر المخرج الأيرلندي رواري روبنسون سلسلة من المقاطع تظهر فيها نسخة رقمية من توم كروز وهو يقاتل ب

Seedance 2.0 من ByteDance: اختراق في توليد الفيديو أم قمامة مصقولة؟
Источник: The Verge. Коллаж: Hamidun News.
◐ Слушать статью

Когда ирландский режиссёр Руари Робинсон начал выкладывать в сеть короткие ролики, созданные с помощью Seedance 2.0 — новейшей модели генерации видео от ByteDance, материнской компании TikTok, — индустрия на мгновение замерла. Цифровой двойник Тома Круза дрался с Брэдом Питтом, отбивался от гуманоидных роботов и крошил зомби. Персонажи двигались с какой-то почти хореографической сложностью, а виртуальная камера работала так, будто за ней стоял оператор с двадцатилетним стажем. Это было действительно впечатляюще — и одновременно обманчиво.

Чтобы понять контекст, нужно оглянуться на последние полтора года гонки генеративного видео. После того как OpenAI анонсировала Sora в феврале 2024 года, рынок буквально взорвался: Runway, Pika, Kling, Minimax — десятки компаний бросились доказывать, что именно их модель ближе всего к тому, чтобы сделать традиционное кинопроизводство устаревшим. Каждый новый релиз сопровождался волной восторженных постов о том, что Голливуд «уже мёртв». Seedance 2.0 стала очередным поводом для таких заявлений, но на этот раз аргументы выглядели весомее. ByteDance — не стартап из гаража, а технологический гигант с колоссальными вычислительными ресурсами и доступом к крупнейшей в мире видеоплатформе.

Технически Seedance 2.0 действительно делает шаг вперёд. Модель заметно лучше справляется с физикой движений — персонажи больше не «плывут» по сцене, как медузы в невесомости, что было бичом ранних генераторов видео. Взаимодействие между объектами стало правдоподобнее: когда цифровой Круз наносит удар, его противник реагирует с задержкой и инерцией, которые хотя бы отдалённо напоминают реальную физику. Динамическая «операторская работа» — с наездами, панорамированием и сменой ракурсов — придаёт роликам кинематографическое качество, которого раньше не удавалось достичь ни одной модели. Робинсон, как профессиональный режиссёр, очевидно понимает, как подать материал, и его промпт-инженерия работает на результат.

Но вот в чём проблема: при ближайшем рассмотрении Seedance 2.0 всё ещё производит то, что в индустрии уже привыкли называть «слопом» — визуально броским, но по сути пустым контентом. Лица персонажей при замедленном просмотре деформируются в характерной для нейросетей манере. Руки по-прежнему остаются ахиллесовой пятой: пальцы сливаются, исчезают или множатся в самые неподходящие моменты. Текстуры одежды и поверхностей при внимательном взгляде выдают свою синтетическую природу — они слишком гладкие, слишком идеальные, лишённые той микроскопической хаотичности, которая отличает реальный мир от цифрового. И самое главное — у этих роликов нет нарратива. Есть эффектные секунды, но нет истории, нет эмоциональной дуги, нет смысла за пределами технической демонстрации.

Это подводит к более глубокому вопросу, который индустрия генеративного AI пока предпочитает не замечать. Кинопроизводство — это не только и не столько генерация красивых кадров. Это режиссура актёров, это сценарная логика, это монтажный ритм, это звуковой дизайн, это тысячи микрорешений, которые превращают набор изображений в связное повествование. Seedance 2.0 может сгенерировать впечатляющий пятисекундный клип, но попросите модель создать связную двухминутную сцену с последовательной логикой действий — и иллюзия рассыпется. Между «вау-эффектом» демо-ролика и реальным производственным инструментом лежит пропасть, которую пока не преодолела ни одна модель.

Для ByteDance Seedance 2.0 — это прежде всего стратегический ход в контексте TikTok. Компании не нужно заменять Голливуд; ей нужно дать миллионам создателей контента на своей платформе инструмент для производства более зрелищных коротких роликов. В этом смысле модель попадает точно в цель. Пятисекундный клип с цифровым Томом Крузом, дерущимся с зомби, идеально вписывается в формат вертикального видео и алгоритмической ленты. Это не кино — это контент, и в этом качестве Seedance 2.0 может оказаться по-настоящему успешным продуктом.

Генеративное видео продолжает развиваться с впечатляющей скоростью, и было бы глупо отрицать прогресс. То, что Seedance 2.0 показывает сегодня, было немыслимо ещё год назад. Но столь же глупо принимать демо-ролики за доказательство того, что традиционное кинопроизводство доживает последние дни. Между «почти как настоящее» и «настоящее» — не количественная, а качественная разница. И именно в этом зазоре, в этих последних процентах правдоподобия, скрывается самая сложная часть задачи. Seedance 2.0 — это впечатляющая технологическая демонстрация. Но пока это именно демонстрация, а не революция.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…