NeuReality hires former Google AI head to accelerate NR-NEXUS launch
NeuReality is bolstering NR-NEXUS's market entry by bringing in Shalini Agarwal, who previously led AI products at Google, as a strategic advisor. The startup i

NeuReality назначила Шалини Агарвал стратегическим советником, чтобы ускорить вывод на рынок NR-NEXUS — своей операционной системы для AI-инференса. Для израильского стартапа это не просто кадровое усиление: компания пытается занять место между дорогими GPU-кластерами и корпоративными заказчиками, которым нужен управляемый слой поверх разрозненной инфраструктуры.
Зачем нужен советник
Агарвал приходит не на операционную должность, а в роли senior strategic advisor. Раньше она вела продуктовые AI-инициативы в Google Cloud и Google Workspace, включая внедрение Gemini в Gmail, Docs, Slides и Sheets. Для NeuReality это важный сигнал рынку: стартапу нужен не только сильный инженерный стек, но и человек, который умеет переводить сложную инфраструктурную технологию в понятное предложение для крупных клиентов, партнёров и поставщиков железа.
«Корпоративный AI входит в новую фазу», — говорит Агарвал.
Смысл её назначения в go-to-market, а не в переписывании архитектуры. NeuReality уже строит продукт вместе с сооснователем и CEO Моше Танахом и президентом Хиреном Маджмударом, бывшим топ-менеджером GlobalFoundries и Intel Capital. Теперь компании нужно доказать, что её слой оркестрации стоит усилий по интеграции — особенно в мире, где многие заказчики уже глубоко завязаны на экосистему NVIDIA и неохотно добавляют в стек новые инфраструктурные слои.
Как устроен NR-NEXUS
Платформу представили 12 марта 2026 года как аппаратно-нейтральную операционную систему для AI factories или token factories. Идея в том, чтобы не привязывать запуск моделей к одному типу оборудования: NR-NEXUS работает поверх CPU, GPU и сетевой инфраструктуры, а также поддерживает более пёстрые конфигурации с разными ускорителями. Такой подход нужен компаниям, которые уже собрали кластеры из разнородного железа и не хотят перестраивать всё заново ради каждой новой модели или API.
По описанию NeuReality, система берёт на себя оркестрацию полного inference-стека и помогает разносить нагрузку между вычислением, памятью и сетью. Компания отдельно выделяет prefill и decode-этапы, которые можно эффективнее распределять по разным ресурсам. На практике это должно стабилизировать производительность, держать SLA под нагрузкой и выжимать больше полезной работы из ускорителей, которые в обычных кластерах нередко простаивают часть времени в реальной эксплуатации.
- Единый слой управления для CPU, GPU и NIC Поддержка смешанной инфраструктуры без полной переработки архитектуры Маршрутизация нагрузок между open-source и proprietary моделями и API Рост загрузки ускорителей и более предсказуемые SLA Снижение стоимости генерации токенов при росте объёмов Софт уже используется у бета-клиентов, а полноценный коммерческий запуск ожидается позже в этом году. Целевая аудитория у NR-NEXUS довольно понятная: neocloud-провайдеры, крупные компании, которые строят собственные мощности под inference, и производители чипов, которым нужен готовый программный слой поверх их железа. Для всех трёх сценариев NeuReality продаёт не модель и не чип, а инфраструктурную прослойку, которая должна упростить запуск production AI-сервисов и сократить время вывода новых моделей.
Почему это вовремя Ставка сделана на самый горячий участок рынка.
По оценке Deloitte, на inference уже приходилась примерно половина всех AI-вычислений в 2025 году, а в 2026-м доля может вырасти до двух третей. Это объясняет и всплеск капитальных затрат: Amazon закладывает на 2026 год около $200 млрд, а Google — от $175 млрд до $185 млрд. Но даже на фоне таких бюджетов у корпоративных заказчиков остаётся старая проблема: дорогое железо часто загружено неравномерно, а стек собирается из слишком большого числа несовместимых компонентов.
Именно в этот разрыв между железом и эксплуатацией NeuReality и пытается встроиться. Компания привлекла около $70 млн инвестиций, включая раунд серии A на $35 млн в конце 2022 года и ещё $20 млн в марте 2024-го при поддержке European Innovation Council Fund. Конкуренция при этом уже плотная: за рынок inference-оптимизации одновременно борются Modal Labs, Baseten и Fireworks AI, каждая со своей ставкой на то, кто станет главным слоем управления после эпохи обучения моделей.
Что это значит
История NeuReality показывает, куда смещается ценность AI-инфраструктуры: от обучения моделей к их повседневной эксплуатации. Если стартап сможет доказать, что NR-NEXUS реально повышает загрузку кластеров и снижает цену токена без vendor lock-in, у него есть шанс стать полезным слоем для enterprise-заказчиков, которые хотят строить AI-сервисы на уже купленном железе. Победить здесь может не тот, у кого больше GPU, а тот, кто лучше управляет inference в production.