Habr AI→ оригинал

«Рерайт-Завод» показал предел AI-рерайта: правила передаются, редакторский голос — нет

Команда «Рерайт-Завода» объяснила, почему AI-рерайт новостей может быть фактически точным и структурно правильным, но всё равно не звучать как конкретное медиа.

◐ Слушать статью

Команда проекта «Рерайт-Завод», который автоматизирует рерайт новостей для региональных СМИ, описала главное ограничение своего подхода: AI уже умеет воспроизводить структуру текста и формальные редакционные правила, но не всегда улавливает голос конкретного издания. На примере материалов «Фонтанки» разработчики показали, что решающим оказывается не шаблон, а точечный выбор слов.

Тест на

Фонтанке Разработчики обучили систему на стиле «Фонтанки» и прогнали через неё несколько текстов об одном и том же событии — задержании 16-летнего подростка в Уфе по делу о подготовке теракта. Сгенерированный рерайт получился грамотным, логичным и фактически корректным: лид был собран верно, атрибуция на месте, ключевые детали не потерялись. Но на фоне реального текста «Фонтанки» быстро стало видно, что модель пишет похоже на новость вообще, а не на конкретную редакцию.

Ключевая разница оказалась в одном слове. В исходнике фигурировал «подросток», а в публикации «Фонтанки» — «мальчик» и «школьник». Такой выбор не меняет фактуру новости, но меняет её интонацию: рядом с формулировкой о вербовке и теракте появляется детский образ, который усиливает напряжение без прямой оценки со стороны автора.

Нейтральный термин передаёт факт, а более точное редакционное слово передаёт ещё и авторскую дистанцию, ритм и эмоциональный вес фразы.

«Мальчик» вместо «подростка» — это редакторское чутьё.

Где ломаются правила

Проект использует аспектный подход к стилю: вместо одного большого промпта модель получает набор характеристик конкретного СМИ — структуру, тон, лексику, заголовки и другие параметры. Такой способ хорошо работает там, где стиль можно описать как правило. Например, можно зафиксировать, что лид начинается с факта, атрибуция даётся один раз, предложения в среднем короткие, а официальный топоним «Санкт-Петербург» лучше заменить на «Петербург».

Всё это можно измерить, проверить и довольно стабильно воспроизвести на новых текстах. Проблема начинается там, где стиль состоит не из запретов и инструкций, а из микровыбора в конкретном контексте. Формула вроде «нейтрально-информационный тон с элементами разговорности» звучит правдоподобно, но почти ничего не говорит о том, какое именно слово выберет редактор в чувствительной новости.

То же касается конструкции «по версии следствия»: это не просто источник, а способ встроить дистанцию в саму фразу. Такие решения не сводятся к стабильному набору правил, потому что в другой ситуации то же издание может написать гораздо суше.

Что чинят дальше Разработчики не считают это багом в узком смысле.

Скорее, речь идёт о пределе самого метода: структура передаётся инструкциями, а голос чаще передаётся через примеры. Поэтому в продукте сейчас усиливают не абстрактные правила, а контекст вокруг генерации. Логика простая: модель лучше имитирует увиденный редакционный приём, чем следует словесному описанию тонкой интонации, которую невозможно надёжно формализовать для всех случаев. На практике это смещает центр работы с промпта на подбор релевантных образцов.

  • Количество примеров для подражания увеличивают с 3 до 10–15.
  • Примеры подбирают по типу сюжета: криминал к криминалу, ЧП к ЧП.
  • Модель дополнительно проверяют на соблюдение явных запретов из стилевого гида.
  • Агент сверяет не только корректность фактов, но и полноту их переноса в рерайт. Параллельно команда уточняет позиционирование MVP: система должна точно воспроизводить структуру и формальные признаки стиля, а голос — лишь приблизительно. Это более честная рамка для редакций, которым нужен быстрый рабочий рерайт без обещаний полной неотличимости от живого автора. По оценке команды, для большинства региональных СМИ этого уже может быть достаточно, потому что у них стилевые различия обычно слабее, чем у «Фонтанки». Иными словами, продукт обещает дисциплину текста и скорость, а не магию полного совпадения с конкретной редакцией.

Что это значит

История с «мальчиком» и «подростком» показывает важную границу для редакционных AI-инструментов. Они уже способны экономить время на рутине и довольно точно повторять форму текста, но тонкие интонационные решения пока остаются зоной человеческой редактуры. Для новостных продуктов это означает простую вещь: автоматизация рерайта работает, если обещать скорость и дисциплину текста, а не полное воспроизведение голоса конкретного медиа. Именно на этом разделении теперь и придётся строить реалистичные ожидания от newsroom-автоматизации.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…