TechCrunch→ оригинал

Deccan AI raises $25M in the data labeling market with a focus on specialists in India

Deccan AI, a Mercor competitor in the AI training market, has raised $25M. The startup is concentrating specialists in India — not through crowdsourcing, but th

Deccan AI raises $25M in the data labeling market with a focus on specialists in India
Источник: TechCrunch. Коллаж: Hamidun News.

Deccan AI закрыл раунд финансирования на $25 миллионов, позиционируя себя как системного игрока на рынке разметки данных для обучения AI-моделей. Компания выступает прямым конкурентом Mercor — одной из ведущих платформ в сегменте AI training talent — и строит своё конкурентное преимущество на принципиально иной организационной модели: не распределённый маркетплейс фрилансеров, а управляемые команды специалистов, сконцентрированных в Индии. Рынок, в котором работает Deccan AI, переживает взрывной рост, но страдает от системной проблемы.

Спрос на услуги по обучению AI-моделей растёт с каждым кварталом: крупнейшие лаборатории — OpenAI, Anthropic, Google DeepMind, Meta AI — непрерывно наращивают объёмы RLHF-аннотаций, формирования обучающих выборок, red-teaming и оценки безопасности моделей. По различным прогнозам аналитических агентств, к 2028 году объём рынка AI training data превысит $10 миллиардов. При этом индустрия хронически страдает от проблемы качества: подавляющее большинство подрядчиков работают через краудсорсинговые платформы с минимальным контролем, что систематически ведёт к низкому качеству аннотаций, непоследовательным результатам и, как следствие, к ухудшению качества обученных моделей.

Именно здесь Deccan AI видит точку роста. В отличие от конкурентов, которые агрегируют фрилансеров из десятков стран через единую платформу, стартап выстраивает управляемые команды непосредственно в Индии. Сотрудники проходят специализированное обучение под требования конкретных клиентов, работают в структурированной среде с многоуровневым контролем качества, а операционные процессы поддаются стандартизации так, как это невозможно при децентрализованном аутсорсинге.

Такая модель позволяет гарантировать единообразие результатов на масштабе — ключевое требование для крупных AI-лабораторий, которые не могут позволить себе вариативность в обучающих данных. Выбор Индии как операционного хаба не случаен и не нов, но у Deccan AI есть конкретные аргументы в его пользу. Страна располагает одной из крупнейших в мире концентраций технически грамотных кадров — выпускников инженерных и IT-специальностей ежегодно насчитывается более миллиона.

Уровень английского языка значительно выше, чем в других популярных аутсорс-регионах, что критично для работы с текстовыми данными. Стоимость труда при этом остаётся на порядок ниже западных рынков. Тем же путём идут Scale AI, Surge AI и ряд других лидеров сектора, однако большинство из них делают ставку на масштаб через платформенный агрегатор.

Deccan AI сознательно выбирает меньший масштаб, но более высокое качество и предсказуемость. Конкурентная среда становится всё более жёсткой. Mercor агрессивно расширяется за пределы инженерного найма в сторону AI training.

Традиционные провайдеры — Appen, Lionbridge, Telus International — активно переориентируют портфели под нужды генеративного AI. Сами крупные лаборатории инвестируют в собственные внутренние команды аннотаторов, стремясь снизить зависимость от внешних партнёров. В этой конкурентной динамике Deccan AI придётся постоянно доказывать, что premium-модель с управляемой командой обеспечивает реальный ROI по сравнению с дешёвым масштабом краудсорсинговых платформ.

Привлечённые $25 миллионов позволят компании ускорить набор специалистов в Индии, расширить клиентскую базу среди AI-лабораторий и технологических стартапов, а также инвестировать в собственные инструменты контроля качества, автоматизации workflow и аналитики продуктивности команд. Этот раунд вписывается в более масштабный инвестиционный тренд: венчурный капитал всё активнее движется в сторону инфраструктурного слоя AI-индустрии — не к самим фронтирным моделям, а к тому, что обеспечивает их надёжную работу. Качественные обучающие данные, RLHF-аннотаторы и human evaluators превращаются в стратегически дефицитный ресурс, за которым разворачивается нарастающая конкуренция.

Децентрализованный краудсорсинг с запросом на системное качество не справляется. Управляемая, структурированная, географически сконцентрированная команда — может.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…