Архив

апрель 2026 г.

1835

материалов

активных источников

Habr AI 424 Bloomberg Tech 283 TechCrunch 237 TNW 159 The Verge 144 3DNews AI 102

NVIDIA на GTC 2026 сместила фокус с чипов на фабрики токенов и эру Agent-as-a-Service

На GTC 2026 NVIDIA показала, что делает ставку не на отдельные GPU, а на фабрики токенов, модульную архитектуру Vera Rubin и экономику AI-аг

2026-04-28·3 мин

LLM·Habr AI

PageIndex от VectifyAI предлагает поиск без эмбеддингов для длинных документов

PageIndex строит древовидное оглавление документа и ищет релевантные разделы через рассуждение LLM, обещая RAG без эмбеддингов, но с заметно

апрель 2026 г.

NVIDIA на GTC 2026 сместила фокус с чипов на фабрики токенов и эру Agent-as-a-Service

PageIndex от VectifyAI предлагает поиск без эмбеддингов для длинных документов

Omniscient привлёк $4,1 млн от Seedcamp на ИИ-аналитика для советов директоров

GolangConf 2026 и Онтико: почему Go-командам пора лечить архитектуру, а не скорость кода

ruGPT3XL получил контекст 8k: восстановленная модель почти без потерь вышла за предел 2k

Стивен Марше: писателям пора принять ИИ, но ценность человеческого текста не исчезает

OpenAI, MiniMax и Nvidia задали тон марту в ИИ: Sora, GPT-5.4 и ставка на Миру Мурати

AI-first стартапы: почему growth-маркетинг буксует и что ломается в воронке

Техкомпании США ускорили сокращения на фоне инвестиций в искусственный интеллект

Rocket Close ускорила обработку ипотечных документов в 15 раз с помощью AWS

Глава Anthropic Дарио Амодей обещает «хороший ИИ», но критики требуют замедлить гонку

Дэн Пратл: Quadron продвигает экономику доверия для оценки ценности в эпоху ИИ

Fortis Solutions делает ставку на ИИ под контролем человека и инфраструктуру доверия

Китай утвердил пятилетний план до 2030 года с целями по массовому внедрению ИИ

Habr: ai-агенты меняют delivery, и командам приходится пересобирать весь цикл разработки

М2 передала нейросети 40% маркетинговых текстов и не потеряла качество контента

Sova AI выпустила Android-ассистента, который управляет телефоном без ПК и root

Microsoft хочет создать собственные передовые ИИ-модели к 2027 году на уровне OpenAI и Anthropic

Минюст США оспорит решение суда, остановившее запрет на Anthropic в госструктурах

Как TGS и AWS сократили обучение сейсмической ИИ-модели с полугода до пяти дней

OpenAI API и fan-out запросы GPT: как SEO-специалистам анализировать AI-поиск

Hack The Box: как MCP Inspector превращает AI-инструменты в новую точку атаки

Индийский AI-стартап Sarvam привлекает до $350 млн при оценке в $1,5 млрд

Google добавила в Gemini API режимы Flex и Priority для баланса цены и надёжности

OpenAI купила техношоу TBPN, чтобы сильнее влиять на публичный разговор об ИИ

Система на базе LLM сократила подготовку карт контроля на заводе с 2 часов до 5 минут

Habr AI показал, как добавить память и контекст в LLM-чат на Python с Ollama и LiteLLM

Claude Sonnet и Jarvis Pattern: почему ИИ-агентам может хватить операционной системы

Microsoft представила три модели для работы с текстом, голосом и изображениями

Google упростила переход с ChatGPT на Gemini: теперь можно перенести память и чаты

ИИ-стартап представил цифрового коллегу для Zoom, который отчитывается менеджерам

Microsoft перестроила продажи Copilot после давления аналитиков с Уолл-стрит

SpaceX готовит рекордное IPO, а OpenAI и Anthropic подбираются к выходу на биржу

Microsoft вложит $10 млрд в Японию за четыре года ради спроса на ИИ в Азии

Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен

Яндекс показал, как бизнесу попасть в ответы Алисы и измерять видимость в поиске

Флант: как Go-разработчик превратил Zed и Gemini в полезного ИИ-агента

Micron и рынок памяти: аналитики ждут высокого спроса на фоне ИИ до конца десятилетия

OpenAI замедляет рост выручки и новых пользователей на фоне дорогой ИИ-инфраструктуры

Сотрудники Google потребовали от Пичаи не передавать ИИ-модели компании Пентагону

OpenAI не выполнила внутренние планы по росту аудитории ChatGPT и выручке

Talkie-1930: исследователи выпустили 13B-модель без знаний об интернете и Второй мировой

MarkTechPost показал, как собрать лёгкого VLA-агента с латентной моделью мира и MPC

Arcee AI выпустила Trinity Large Thinking — открытую модель рассуждения для ИИ-агентов

UBTech готова платить до $18 млн в год главному исследователю по искусственному интеллекту

OpenAI покупает ток-шоу TBPN за сотни миллионов долларов и выходит в медиа

Agentis Memory: Redis-совместимое хранилище с векторным поиском и локальными эмбеддингами

OpenAI покупает техшоу TBPN: это первая медийная сделка компании в истории

Habr: как synthetic data помогает обучать модели и почему self-training ведет к collapse

Почему ChatGPT и Gemini не рекомендуют ваш B2B SaaS, даже если сайт сделан нормально

Почему ИИ в UI-дизайне важен не для продакшена, а как источник визуальных мутаций

NVIDIA показала полный пайплайн оптимизации модели с FastNAS pruning и fine-tuning

TII выпустила Falcon Perception — 0,6B-модель для сегментации и поиска объектов по тексту

Qwen и llama.cpp: как запустить локальную нейросеть без облака на компьютере или сервере

Немецкий стартап Penemue привлёк €1,7 млн на AI-платформу против онлайн-ненависти

Anthropic и Claude Cowork: 10 рабочих задач, которые ИИ снимает с человека

Directum: почему бизнес активно обсуждает ИИ-агентов, но не спешит внедрять их в процессы

ClawRouter снизил расходы на LLM API с $47 до $1.80 за неделю — обзор умного роутера

Агентное кодирование как зависимость: почему разработчики не могут остановиться

PromptPilot: планировщик задач для Claude Code и Codex, который работает пока вы спите