апрель 2026 г.

NVIDIA на GTC 2026 сместила фокус с чипов на фабрики токенов и эру Agent-as-a-Service
На GTC 2026 NVIDIA показала, что делает ставку не на отдельные GPU, а на фабрики токенов, модульную архитектуру Vera Rubin и экономику AI-аг

PageIndex от VectifyAI предлагает поиск без эмбеддингов для длинных документов
PageIndex строит древовидное оглавление документа и ищет релевантные разделы через рассуждение LLM, обещая RAG без эмбеддингов, но с заметно

Omniscient привлёк $4,1 млн от Seedcamp на ИИ-аналитика для советов директоров
Парижский стартап Omniscient получил $4,1 млн от Seedcamp, чтобы развивать ИИ-систему, которая в реальном времени отслеживает репутационные

GolangConf 2026 и Онтико: почему Go-командам пора лечить архитектуру, а не скорость кода
Онтико перестраивает GolangConf 2026 вокруг реальных болей Go-команд: AI ускорил написание кода, но архитектурные решения, масштабирование и

ruGPT3XL получил контекст 8k: восстановленная модель почти без потерь вышла за предел 2k
Автор восстановления ruGPT3XL исправил sparse attention, поднял контекст модели с 2k до 8k и сохранил качество на коротких последовательност

Стивен Марше: писателям пора принять ИИ, но ценность человеческого текста не исчезает
Писатель Стивен Марше считает, что генеративный ИИ уже обесценивает шаблонную прозу, но одновременно повышает цену настоящего авторского гол

OpenAI, MiniMax и Nvidia задали тон марту в ИИ: Sora, GPT-5.4 и ставка на Миру Мурати
Март в ИИ прошёл под знаком продуктовых разворотов: OpenAI меняют судьбу Sora, Google и Anthropic ускоряют ассистентов, а MiniMax и Nvidia н

AI-first стартапы: почему growth-маркетинг буксует и что ломается в воронке
У AI-first продуктов сильные метрики на входе часто скрывают ложный спрос: люди приходят за новизной, а не за решением задачи, поэтому привы

Техкомпании США ускорили сокращения на фоне инвестиций в искусственный интеллект
Техкомпании США снова вышли в лидеры по увольнениям: компании урезают штаты на фоне инвестиций в AI, а число заявленных сокращений в секторе

Rocket Close ускорила обработку ипотечных документов в 15 раз с помощью AWS
Rocket Close вместе с AWS ускорила обработку ипотечных документов в 15 раз, объединив Amazon Textract для OCR и Amazon Bedrock для сегментац

Глава Anthropic Дарио Амодей обещает «хороший ИИ», но критики требуют замедлить гонку
После визита главы Anthropic в Канберру австралийская дискуссия об ИИ сместилась от обещаний роста к вопросу, кто заплатит за автоматизацию,

Дэн Пратл: Quadron продвигает экономику доверия для оценки ценности в эпоху ИИ
Основатель Quadron Дэн Пратл считает, что с ростом генеративного ИИ главным дефицитом становятся не знания, а проверяемая экспертиза, сужден

Fortis Solutions делает ставку на ИИ под контролем человека и инфраструктуру доверия
Fortis Solutions считает, что бизнесу нужен не автономный ИИ сам по себе, а системы, где машинная точность усиливает людей, а доверие строит

Китай утвердил пятилетний план до 2030 года с целями по массовому внедрению ИИ
Пекин включил ИИ в число ключевых приоритетов 15-го пятилетнего плана: от моделей и чипов до госуслуг, медицины и промышленности, с горизонт

Habr: ai-агенты меняют delivery, и командам приходится пересобирать весь цикл разработки
На Habr объяснили, почему с появлением ai-агентов команды должны перестраивать не только написание кода, но и весь delivery: контекст, прове

М2 передала нейросети 40% маркетинговых текстов и не потеряла качество контента
Команда М2 встроила AI-копирайтера во внутреннюю редакцию, перевела на него 40% продуктовых и маркетинговых текстов и сохранила единый тон,

Sova AI выпустила Android-ассистента, который управляет телефоном без ПК и root
Sova AI представила Android-приложение с ИИ-агентом, который открывает приложения, нажимает кнопки, скроллит экраны и выполняет голосовые ко

Microsoft хочет создать собственные передовые ИИ-модели к 2027 году на уровне OpenAI и Anthropic
Microsoft планирует к 2027 году разработать крупные передовые ИИ-модели, чтобы снизить зависимость от OpenAI и Anthropic и получить собствен

Минюст США оспорит решение суда, остановившее запрет на Anthropic в госструктурах
Минюст США намерен оспорить решение федерального суда, которое временно остановило запрет администрации Трампа на использование ИИ Anthropic

Как TGS и AWS сократили обучение сейсмической ИИ-модели с полугода до пяти дней
TGS вместе с AWS почти линейно масштабировала обучение сейсмической foundation-модели, сократив цикл с шести месяцев до пяти дней и увеличив

OpenAI API и fan-out запросы GPT: как SEO-специалистам анализировать AI-поиск
Автор показывает, как через OpenAI API получать скрытые fan-out запросы GPT и использовать их для анализа того, как AI-модели собирают источ

Hack The Box: как MCP Inspector превращает AI-инструменты в новую точку атаки
Разбор Kobold из HTB Season 10 показывает, как одна dev-утилита для AI-серверов может привести к RCE, LFI, повторному использованию учётных

Индийский AI-стартап Sarvam привлекает до $350 млн при оценке в $1,5 млрд
Sarvam AI близка к раунду на $300-350 млн при оценке $1,5 млрд, и это один из самых сильных сигналов, что Индия хочет вырастить собственного

Google добавила в Gemini API режимы Flex и Priority для баланса цены и надёжности
Google запустила в Gemini API два новых уровня сервиса: Flex для более дешёвых фоновых задач и Priority для критичного трафика с повышенной

OpenAI купила техношоу TBPN, чтобы сильнее влиять на публичный разговор об ИИ
OpenAI выходит в медиа и покупает популярное в Кремниевой долине шоу TBPN, обещая сохранить редакционную независимость проекта и использоват

Система на базе LLM сократила подготовку карт контроля на заводе с 2 часов до 5 минут
На металлургическом заводе LLM-система начала собирать карты контроля за 3–5 минут вместо двух часов: сработал не универсальный промт, а наб

Habr AI показал, как добавить память и контекст в LLM-чат на Python с Ollama и LiteLLM
В новой части туториала по Python-чату с Ollama и LiteLLM показано, как хранить историю сообщений, передавать контекст модели и ограничивать

Claude Sonnet и Jarvis Pattern: почему ИИ-агентам может хватить операционной системы
На Habr предложили строить персональных AI-агентов не вокруг сложных фреймворков, а на связке LLM, операционной системы и файловой памяти —

Microsoft представила три модели для работы с текстом, голосом и изображениями
Подразделение Microsoft AI представило линейку MAI: модель для транскрибации речи, голосовой генератор и систему для изображений, усиливая с

Google упростила переход с ChatGPT на Gemini: теперь можно перенести память и чаты
В Gemini появилась функция импорта памяти, предпочтений и истории чатов из ChatGPT и других AI-сервисов, чтобы пользователи могли продолжить

ИИ-стартап представил цифрового коллегу для Zoom, который отчитывается менеджерам
Новый ИИ-агент для офисных команд может входить в каждую встречу Zoom, следить за задачами, сам находить пробелы в работе и напоминать сотру

Microsoft перестроила продажи Copilot после давления аналитиков с Уолл-стрит
Microsoft отказалась от идеи раздавать Copilot в составе корпоративных пакетов и сделала ставку на отдельные платные продажи, чтобы показать

SpaceX готовит рекордное IPO, а OpenAI и Anthropic подбираются к выходу на биржу
Конфиденциальная заявка SpaceX на IPO с оценкой выше $1,75 трлн может запустить волну крупнейших размещений, вслед за которой на биржу начну

Microsoft вложит $10 млрд в Японию за четыре года ради спроса на ИИ в Азии
Microsoft объявила о пакете инвестиций на $10 млрд в Японии на ближайшие четыре года, усиливая азиатскую экспансию и ставку на быстро растущ

Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен
Google и NVIDIA продвигают локальный запуск Gemma 4 на RTX, Jetson и DGX Spark, чтобы всегда активные AI-агенты вроде OpenClaw работали быст

Яндекс показал, как бизнесу попасть в ответы Алисы и измерять видимость в поиске
Яндекс запустил в Вебмастере раздел «Видимость сайта в Алисе», и для бизнеса это сигнал: в ответы ассистента ведут не трюки, а сильная поиск

Флант: как Go-разработчик превратил Zed и Gemini в полезного ИИ-агента
Go-разработчик из «Фланта» описал путь от медленных IDE-плагинов к связке Zed, Gemini 3 Flash и gopls-mcp, которая даёт ИИ-агенту контекст п

Micron и рынок памяти: аналитики ждут высокого спроса на фоне ИИ до конца десятилетия
Аналитики Melius Research считают, что бум генеративного ИИ меняет рынок памяти: спрос на DRAM и NAND может остаться высоким до конца десяти

OpenAI замедляет рост выручки и новых пользователей на фоне дорогой ИИ-инфраструктуры
OpenAI сталкивается с ростом затрат на вычисления, более слабой выручкой и замедлением притока пользователей, пока часть аудитории уходит к

Сотрудники Google потребовали от Пичаи не передавать ИИ-модели компании Пентагону
Свыше 600 сотрудников Google, включая специалистов DeepMind и топ-менеджеров, потребовали от Сундара Пичаи закрыть Пентагону доступ к ИИ-мод

OpenAI не выполнила внутренние планы по росту аудитории ChatGPT и выручке
По данным WSJ, OpenAI не дотянула до собственных целей по новым пользователям и продажам, усилив внутри компании вопрос: успевает ли рост би

Talkie-1930: исследователи выпустили 13B-модель без знаний об интернете и Второй мировой
Talkie-1930 — открытая 13B-модель, обученная только на англоязычных текстах до 1931 года, чтобы изучать историческое мышление, утечки данных

MarkTechPost показал, как собрать лёгкого VLA-агента с латентной моделью мира и MPC
В новом туториале MarkTechPost разбирает, как построить упрощённого embodied-агента: он работает по RGB-кадрам, учит латентную модель мира и

Arcee AI выпустила Trinity Large Thinking — открытую модель рассуждения для ИИ-агентов
Arcee AI открыла веса Trinity Large Thinking по лицензии Apache 2.0 и сделала ставку на длинные агентные сценарии, многошаговое рассуждение

UBTech готова платить до $18 млн в год главному исследователю по искусственному интеллекту
Китайский производитель гуманоидных роботов UBTech открыл поиск главного учёного и пообещал до 124 млн юаней в год, показывая, насколько рез

OpenAI покупает ток-шоу TBPN за сотни миллионов долларов и выходит в медиа
OpenAI купила медиапроект TBPN — ежедневное техшоу из Кремниевой долины — чтобы усилить влияние на разговор об ИИ, сохранив редакционную нез

Agentis Memory: Redis-совместимое хранилище с векторным поиском и локальными эмбеддингами
Agentis Memory превращает Redis-совместимое хранилище в общую память для AI-агентов: с локальными эмбеддингами, встроенным векторным поиском

OpenAI покупает техшоу TBPN: это первая медийная сделка компании в истории
OpenAI купила популярное в Кремниевой долине ежедневное шоу TBPN, пообещала сохранить редакционную независимость и встроила проект в стратег

Habr: как synthetic data помогает обучать модели и почему self-training ведет к collapse
Синтетические данные помогают ИИ компенсировать дефицит качественного человеческого корпуса, но при бесконтрольном self-training модели начи

Почему ChatGPT и Gemini не рекомендуют ваш B2B SaaS, даже если сайт сделан нормально
Даже хороший B2B SaaS-сайт может не попасть в ответы ChatGPT, Gemini и Perplexity, если у бренда нет чёткой категории, внешних подтверждений

Почему ИИ в UI-дизайне важен не для продакшена, а как источник визуальных мутаций
AI-generated UI ценен не только скоростью набросков: его сила в редких визуальных сочетаниях, которые помогают дизайнерам находить новые ход

NVIDIA показала полный пайплайн оптимизации модели с FastNAS pruning и fine-tuning
NVIDIA выпустила практический гайд по Model Optimizer: в одном Colab-ноутбуке показаны обучение ResNet20, FastNAS pruning под лимит FLOPs и

TII выпустила Falcon Perception — 0,6B-модель для сегментации и поиска объектов по тексту
TII открыла Falcon Perception — компактную 0,6-миллиардную vision-language-модель, которая ищет и сегментирует объекты по обычному тексту и

Qwen и llama.cpp: как запустить локальную нейросеть без облака на компьютере или сервере
Практический материал объясняет, как запустить модель Qwen через llama.cpp на своём компьютере или сервере, чтобы работать с локальной нейро

Немецкий стартап Penemue привлёк €1,7 млн на AI-платформу против онлайн-ненависти
Penemue из Фрайбурга получил более €1,7 млн на развитие ИИ-системы, которая в реальном времени выявляет язык вражды, угрозы и дезинформацию

Anthropic и Claude Cowork: 10 рабочих задач, которые ИИ снимает с человека
Claude Cowork от Anthropic показывает, как ИИ берёт на себя утренние брифинги, КП, ответы клиентам и отчёты, возвращая до двух-трёх рабочих

Directum: почему бизнес активно обсуждает ИИ-агентов, но не спешит внедрять их в процессы
Directum объясняет, почему ИИ-агенты стали главным корпоративным трендом, но массовое внедрение тормозят дорогая инфраструктура, риски ошибо

ClawRouter снизил расходы на LLM API с $47 до $1.80 за неделю — обзор умного роутера
Роутер ClawRouter анализирует каждый промпт по 15 параметрам и направляет к наиболее дешёвой подходящей модели — это снизило недельные расхо

Агентное кодирование как зависимость: почему разработчики не могут остановиться
CTO стартапов не спят до трёх ночи без дедлайнов, CEO Y Combinator хвастается 19-часовыми сессиями — исследователи UC Berkeley видят паттерн

PromptPilot: планировщик задач для Claude Code и Codex, который работает пока вы спите
Российский разработчик создал планировщик задач для AI CLI — PromptPilot принимает промпты из терминала, браузера или Telegram-бота и выполн