На Habr AI предложили использовать новостной сентимент как торговый сигнал для крипторынка
Вышел разбор стратегии, где главным сигналом для сделок становится не график, а сдвиг настроений в новостях и соцсетях. Автор предлагает разделять векторный пои

В новом разборе описан подход, в котором торговый сигнал для крипторынка строится не на графиках, а на изменении новостного сентимента. Автор утверждает, что внутридневные развороты чаще объясняются каскадом публикаций и репостов, чем историей цены.
Почему сигналы ломаются В статье разбирается типичная проблема
технического анализа: скользящие средние и другие индикаторы подстраиваются под прошлые данные и предполагают, что режим рынка достаточно стабилен. Но на крипторынке настроение может несколько раз за день переключаться из бычьего в медвежье и обратно. Когда это происходит, даже аккуратно настроенная стратегия начинает давать шум вместо направления, потому что реагирует на вчерашнюю структуру рынка, а не на свежий поток сообщений, который уже меняет поведение участников.
«Новостной сентимент определяет режим.
Индикатор работает внутри режима». По версии автора, проблема не только в самих новостях, но и в механике их распространения. Цену двигают не сухие документы регуляторов и не сама публикация отчёта, а цепочка репостов, комментариев и интерпретаций в тех доменах и блогах, за которыми следит розничный инвестор. Из-за этого рынок реагирует на медиасреду быстрее, чем классические индикаторы успевают перестроиться, а попытка применять один и тот же набор сигналов ко всем режимам часто заканчивается результатом около 50 на 50.
Как искать сентимент
Практическая часть строится вокруг векторного поиска по новостям и постам с последующей интерпретацией при помощи LLM. Автор предлагает не смешивать эти задачи: embeddings и cosine distance нужны для того, чтобы достать релевантный новостной массив по смыслу, а языковая модель должна уже отдельно оценивать общее настроение выборки. В качестве рабочих инструментов упоминаются связки на Scrapy, PostgreSQL с PgVector, MongoDB Atlas Vector Search, а для быстрого старта — Tavily и Perplexity Search API.
- Искать не только точные совпадения, а смысловой контекст вокруг актива.
- Не брать максимальный score как лучший сигнал, а смотреть на пограничные упоминания.
- Сначала отбирать влиятельные домены и авторов, а уже потом уточнять запрос.
- Держать жёсткое временное окно, чтобы утренний позитив не смешивался с вечерним негативом.
- Отделять поиск публикаций от анализа настроения, чтобы LLM не подменяла факт своей интерпретацией. Отдельный акцент сделан на времени публикации. В статье советуют исключать материалы без точного timestamp, иначе в выборку попадает look-ahead bias и стратегия начинает видеть будущее задним числом. Для поиска предлагается брать диапазон в два дня, а затем на своей стороне фильтровать последние 24 часа. Автор считает именно сутки оптимальным окном: оно уже даёт контекст, но ещё не размывает направленность сентимента до статистического шума.
Проверка на рынке
Чтобы проверить гипотезу, автор показывает два кейса по биткоину: в одном запрос дал нейтрально-медвежий сентимент, в другом — бычий. Затем эти оценки сопоставляются с последующей реакцией рынка. Формально это не выглядит как полноценное академическое исследование, но как инженерная демонстрация идея читается ясно: новостной фон можно использовать не как абсолютный предсказатель цены, а как фильтр режима, внутри которого уже принимается решение о входе.
Дальше подход доводится до автоматизации. По описанию, ИИ-агент получает новостной сигнал, открывает позицию и держит её до исчерпания сентимента, а для контроля риска использует статистически недостижимый hard stop и trailing take-profit. Слабое место автор тоже называет прямо: если выходить только по смене сентимента, можно терять часть прибыли из-за задержек парсинга и доставки новостей.
Поэтому в качестве улучшения предлагается выход на откате в 3% от максимального PnL открытой позиции.
Что это значит
Для алгоритмической торговли в новостных и быстро меняющихся рынках вроде крипты это ещё один сигнал, что борьба идёт не только за качество моделей, но и за качество источников, тайминг и фильтрацию шума. Если гипотеза автора выдержит более широкий бектест, приоритет может сместиться от усложнения индикаторов к системам, которые лучше считывают настроение рынка в реальном времени.