TNW→ оригинал

NeuReality contrata al ex jefe de productos de IA de Google para acelerar el lanzamiento de NR-NEXUS

NeuReality está impulsando la entrada de NR-NEXUS al mercado al traer a Shalini Agarwal, quien lideró productos de IA en Google, como asesora estratégica. La st

NeuReality contrata al ex jefe de productos de IA de Google para acelerar el lanzamiento de NR-NEXUS
Источник: TNW. Коллаж: Hamidun News.

NeuReality назначила Шалини Агарвал стратегическим советником, чтобы ускорить вывод на рынок NR-NEXUS — своей операционной системы для AI-инференса. Для израильского стартапа это не просто кадровое усиление: компания пытается занять место между дорогими GPU-кластерами и корпоративными заказчиками, которым нужен управляемый слой поверх разрозненной инфраструктуры.

Зачем нужен советник

Агарвал приходит не на операционную должность, а в роли senior strategic advisor. Раньше она вела продуктовые AI-инициативы в Google Cloud и Google Workspace, включая внедрение Gemini в Gmail, Docs, Slides и Sheets. Для NeuReality это важный сигнал рынку: стартапу нужен не только сильный инженерный стек, но и человек, который умеет переводить сложную инфраструктурную технологию в понятное предложение для крупных клиентов, партнёров и поставщиков железа.

«Корпоративный AI входит в новую фазу», — говорит Агарвал.

Смысл её назначения в go-to-market, а не в переписывании архитектуры. NeuReality уже строит продукт вместе с сооснователем и CEO Моше Танахом и президентом Хиреном Маджмударом, бывшим топ-менеджером GlobalFoundries и Intel Capital. Теперь компании нужно доказать, что её слой оркестрации стоит усилий по интеграции — особенно в мире, где многие заказчики уже глубоко завязаны на экосистему NVIDIA и неохотно добавляют в стек новые инфраструктурные слои.

Как устроен NR-NEXUS

Платформу представили 12 марта 2026 года как аппаратно-нейтральную операционную систему для AI factories или token factories. Идея в том, чтобы не привязывать запуск моделей к одному типу оборудования: NR-NEXUS работает поверх CPU, GPU и сетевой инфраструктуры, а также поддерживает более пёстрые конфигурации с разными ускорителями. Такой подход нужен компаниям, которые уже собрали кластеры из разнородного железа и не хотят перестраивать всё заново ради каждой новой модели или API.

По описанию NeuReality, система берёт на себя оркестрацию полного inference-стека и помогает разносить нагрузку между вычислением, памятью и сетью. Компания отдельно выделяет prefill и decode-этапы, которые можно эффективнее распределять по разным ресурсам. На практике это должно стабилизировать производительность, держать SLA под нагрузкой и выжимать больше полезной работы из ускорителей, которые в обычных кластерах нередко простаивают часть времени в реальной эксплуатации.

  • Единый слой управления для CPU, GPU и NIC Поддержка смешанной инфраструктуры без полной переработки архитектуры Маршрутизация нагрузок между open-source и proprietary моделями и API Рост загрузки ускорителей и более предсказуемые SLA Снижение стоимости генерации токенов при росте объёмов Софт уже используется у бета-клиентов, а полноценный коммерческий запуск ожидается позже в этом году. Целевая аудитория у NR-NEXUS довольно понятная: neocloud-провайдеры, крупные компании, которые строят собственные мощности под inference, и производители чипов, которым нужен готовый программный слой поверх их железа. Для всех трёх сценариев NeuReality продаёт не модель и не чип, а инфраструктурную прослойку, которая должна упростить запуск production AI-сервисов и сократить время вывода новых моделей.

Почему это вовремя Ставка сделана на самый горячий участок рынка.

По оценке Deloitte, на inference уже приходилась примерно половина всех AI-вычислений в 2025 году, а в 2026-м доля может вырасти до двух третей. Это объясняет и всплеск капитальных затрат: Amazon закладывает на 2026 год около $200 млрд, а Google — от $175 млрд до $185 млрд. Но даже на фоне таких бюджетов у корпоративных заказчиков остаётся старая проблема: дорогое железо часто загружено неравномерно, а стек собирается из слишком большого числа несовместимых компонентов.

Именно в этот разрыв между железом и эксплуатацией NeuReality и пытается встроиться. Компания привлекла около $70 млн инвестиций, включая раунд серии A на $35 млн в конце 2022 года и ещё $20 млн в марте 2024-го при поддержке European Innovation Council Fund. Конкуренция при этом уже плотная: за рынок inference-оптимизации одновременно борются Modal Labs, Baseten и Fireworks AI, каждая со своей ставкой на то, кто станет главным слоем управления после эпохи обучения моделей.

Что это значит

История NeuReality показывает, куда смещается ценность AI-инфраструктуры: от обучения моделей к их повседневной эксплуатации. Если стартап сможет доказать, что NR-NEXUS реально повышает загрузку кластеров и снижает цену токена без vendor lock-in, у него есть шанс стать полезным слоем для enterprise-заказчиков, которые хотят строить AI-сервисы на уже купленном железе. Победить здесь может не тот, у кого больше GPU, а тот, кто лучше управляет inference в production.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…