2026

Nvidia, Google и Anthropic: Nemotron, баги Firefox и тревожные сигналы для ИИ-рынка
Nvidia выпустила открытую Nemotron-3-Super-120B, Anthropic нашла десятки дыр в Firefox, а Google и ByteDance оказались в центре новых споров

Microsoft запустила Copilot Health — AI-сервис для объединения медданных и анализа здоровья
Microsoft открыла лист ожидания Copilot Health — защищённого раздела в Copilot, где AI собирает данные из носимых устройств, медкарт и анали

Amazon подключит гигантские чипы Cerebras к Trainium для запуска ИИ-моделей
Amazon будет использовать чипы стартапа Cerebras вместе с собственными Trainium, чтобы эффективнее запускать ИИ-модели и усилить гибкость св

Илон Маск пообещал перестроить xAI после новой волны уходов среди сооснователей
Илон Маск заявил, что заново выстроит xAI после серии уходов из компании: кадровая турбулентность усилила вопросы к темпам роста стартапа и

Claude Cowork и Chrome: 10 сценариев, как передать браузерную рутину AI-агенту
На Habr вышел практический разбор того, как Claude Cowork с расширением для Chrome берет на себя поиск данных, формы, мониторинг цен, QA и д

Microsoft и NVIDIA называют physical AI следующим преимуществом для промышленности
MIT Technology Review описывает новый этап автоматизации: physical AI помогает заводам не просто снижать издержки, а расти в условиях дефици

Anthropic объяснила, как бизнесу внедрять агентные системы без лишней сложности
Anthropic показала, что бизнесу выгоднее начинать не с автономных агентных систем, а с простых сценариев: они дешевле, надёжнее и часто поле

Yoyo за пять дней вырос из 200 строк в автономного агента, который пишет код сам
Эксперимент с агентом yoyo показал, что 200 строк на Rust хватило для запуска цикла самоускорения: бот сам читает код, пишет фиксы, заводит

ChatGPT и дата-центры: как рост ИИ ускоряет энергопотребление и давление на воду
Рост ChatGPT и других AI-сервисов разгоняет строительство дата-центров, повышая спрос на электричество и воду, а движение QuitGPT предлагает

GLiNER 2 показал, как компактные энкодеры догоняют LLM в NER и классификации
Новая волна zero-shot энкодеров во главе с GLiNER 2 показывает, что задачи NER и классификации можно решать без тяжёлых LLM — быстрее, дешев

NVIDIA представила NeMo Retriever — агентный поиск для сложных корпоративных данных
NVIDIA показала agentic-пайплайн в NeMo Retriever: система не ограничивается семантическим поиском, а планирует шаги, уточняет запросы и уже

Ollama Cloud сравнили в code review: DeepSeek v3.1 оказалась сильнее Qwen и GPT-OSS
Автор протестировал три модели в Ollama Cloud на реальных Python Pull Request из легаси-проекта: лучший баланс глубины, точности и полезных

CodeSpeak от автора Kotlin Андрея Бреслава переводит разработку с кода на спецификации
Команда Андрея Бреслава выпустила публичную альфу CodeSpeak — платформы, где разработчик описывает систему на английском, а LLM генерируют,

OpenAI, SoftBank и Oracle спорят о Stargate: мегапроект дата-центров буксует
Проект Stargate стоимостью до 500 млрд долларов, задуманный как вычислительная база OpenAI, тормозит: партнёры спорят о структуре, деньгах,

AWS и vLLM внедрили P-EAGLE для ускорения инференса больших LLM до 1,69 раза
AWS показала, как P-EAGLE в vLLM убирает узкое место спекулятивного декодирования, генерирует несколько токенов за один проход и даёт до 1,6

Илон Маск меняет xAI: сокращения, консультанты из Tesla и SpaceX и ставка на дата-центры ИИ
Маск начал жёсткую перестройку xAI: после притока денег от Tesla и сближения со SpaceX в стартап приходят внешние консультанты, а часть кома

Гарри Тан выпустил gstack — workflow-систему для Claude Code с QA, ревью и релизом
Гарри Тан выложил в open source gstack — набор режимов для Claude Code, который разводит планирование, ревью, QA и релиз по отдельным команд

США отказались увязывать продажу ИИ-чипов с обязательным строительством ЦОД
Вашингтон не поддержал идею продавать американские ускорители только тем странам и компаниям, которые готовы строить дата-центры в США, сохр

Google радикально обновила Maps: Gemini отвечает на вопросы, а навигация стала трёхмерной
Google выпустила крупнейшее обновление Maps за десятилетие: Ask Maps на базе Gemini понимает сложные бытовые запросы, а Immersive Navigation

Claude как часть мышления: почему потеря AI-инструмента ломает не только доступ, но и работу
Потеря аккаунта в Claude для активных пользователей оказалась не просто сбоем сервиса: вместе с доступом исчезают контекст, наработки и част

Seldon Vault превратил психоисторию Азимова в мультиагентный сервис ИИ-прогнозов
Seldon Vault превращает идею психоистории Азимова в реальный AI-сервис: семь агентов, скептик и арбитр ежедневно строят прогнозы мировых соб

The Lancet Psychiatry предупредил: чатботы с ИИ могут усиливать бред у уязвимых людей
Обзор в The Lancet Psychiatry показал, что чатботы с ИИ могут усиливать бредовые идеи у людей с уязвимостью к психозу, поэтому авторы требую

Илон Маск снова перестраивает xAI: уход сооснователей, сокращения и отставание Grok
xAI переживает новый жёсткий перезапуск: из компании уходят ключевые инженеры и сооснователи, Grok уступает конкурентам в программировании,

Anthropic и ETH Zurich: длинный CLAUDE.md ухудшает работу агента и повышает расходы
Исследование ETH Zurich на 138 репозиториях показало: длинные CLAUDE.md и AGENTS.md нередко снижают успех coding-агентов и одновременно увел

Gemini 3.1 Pro обошла ChatGPT 5.4 и Claude Opus 4.6 в тесте генерации текста
Авторское сравнение трех топовых моделей на четырех литературных задачах показало, что Gemini 3.1 Pro лучше держит жанр, эмоцию и компактнос

Anthropic, OpenAI и Cursor: восемь уровней зрелости агентной инженерии
Habr AI разобрал восемь уровней агентной инженерии — от tab-complete и context engineering до фоновых агентов и автономных команд, которые у

Zhipu AI выпустила GLM-OCR — компактную OCR-модель на 0,9 млрд параметров для документов
Zhipu AI и Университет Цинхуа представили GLM-OCR — мультимодальную OCR-модель на 0,9 млрд параметров, которая разбирает сложные документы,

LangChain выпустила Deep Agents для многошаговых ИИ-агентов с памятью и изоляцией
LangChain выпустила Deep Agents — библиотеку для ИИ-агентов, которым нужны планирование, долговременная память, файловый контекст и изоляция

AMD RX580 запустила LLM дома: как победить ROCm, Ollama и добиться GPU inference
Инженер показал, как заставить старую AMD RX580 стабильно крутить LLM через ROCm и Ollama, разобрав ложные признаки работы GPU, сбои hipMemG

Почему Claude 4.6 не спасает без контекста: главное слепое пятно LLM-разработки
Даже сильная модель вроде Claude 4.6 теряет эффективность без системно собранного контекста: knowledge base, связи между сервисами и правила

ИИ вынуждает университеты пересмотреть курсовые: проблема списывания оказалась старше ChatGPT
Доктор Нафиса Баба-Ахмед считает, что ИИ не создал кризис университетских работ, а лишь масштабировал старую привычку выносить мышление за п

Разработчик собрал AI-агрегатор новостей с MCP, DeepSeek и Telegram-ботом
После атаки дронов над Дубаем разработчик собрал мультиязычный агрегатор новостей: 80+ источников, MCP-сервер для AI-агентов, AI-чат и Teleg

BorisovAI проверила MoE на RTX 4090 и показала, почему перплексия ломает оценку LLM
BorisovAI протестировала MoE с подключаемыми экспертами на одной RTX 4090 и выяснила, что красивая перплексия не гарантирует реальный рост к

Эксперимент с LLM показал, как в латентном пространстве зарождается «личность» модели
Эксперимент с модульной LLM показал, что отдельный латентный вектор может хранить не только стиль текста, но и устойчивые поведенческие приз

Nvidia перед GTC 2026 намекает на оптический чип, способный перестроить ИИ-дата-центры
Перед выступлением 16 марта 2026 года Nvidia подогрела рынок обещанием «чипа, который потрясет мир», а главным кандидатом на сюрприз называю

Почему успехи DeepMind в AGI не отвечают на главный вопрос о машинном сознании
Автор разбирает, почему рост вычислительной мощности и успехи DeepMind в AGI не равны появлению сознания: интеллект можно имитировать, а суб

IBM выпустила Granite 4.0 1B Speech — компактную мультиязычную модель речи для edge-ИИ
IBM представила Granite 4.0 1B Speech — лёгкую модель для распознавания и перевода речи, рассчитанную на быстрый запуск в корпоративных и ed

Сокращения в Atlassian вернули спор: должен ли ИИ урезать часы работы, а не штат
После увольнений в Atlassian экономисты снова спорят, кому достанется выигрыш от ИИ: компаниям в виде прибыли или сотрудникам в виде более к

OpenAI перенесла запуск эротических чатов в ChatGPT из-за рисков для подростков
OpenAI снова отложила эротические чаты в ChatGPT: компанию остановили слабая проверка возраста, риск доступа подростков и опасения по поводу

Habr AI о будущем труда: как ИИ и роботы могут вернуть общество к новой античности
Habr AI рассуждает, что связка ИИ, роботизации и нейроимплантов может не просто поменять рынок труда, а разделить общество на узкий класс оп

У партнёра Nvidia Hon Hai упала прибыль, усилив тревогу вокруг спроса на AI-серверы
Hon Hai, один из ключевых партнёров Nvidia по серверному железу, отчитался о снижении квартальной прибыли на 2,4%, и рынок увидел в этом воз

Google убрала из поиска AI-функцию с медицинскими советами от случайных пользователей
Google свернула функцию What People Suggest в поиске: AI-инструмент показывал медицинские советы от обычных людей, и на фоне вопросов к безо

В Unity показали, как собрать голосовых неигровых персонажей с памятью и контекстом мира
Пошаговый гайд показывает, как в Unity собрать голосовых персонажей с локальной моделью, памятью диалогов, знанием мира игры и ответами голо

Гарвард: ИИ сокращает найм джунов, а через три года это может ударить по всей отрасли
Гарвард фиксирует падение найма джунов после внедрения ИИ, а METR — растущую зависимость опытных разработчиков от ассистентов, что грозит де

Moonshot AI представила Attention Residuals — альтернативу остаточным связям в трансформерах
Moonshot AI предложила Attention Residuals — замену стандартным residual connections в трансформерах, где слой сам выбирает полезные сигналы

DeepSeek и GLM-5 обошли Яндекс в тесте 34 AI-моделей для менеджеров без VPN
Авторы большого теста управленческих сценариев выяснили, что доступные в России без VPN DeepSeek V3.2 и GLM-5 заметно сильнее решений Яндекс

Google выпустила Gemini Embedding 2 для мультимодального RAG с видео, аудио и PDF
Google выпустила Gemini Embedding 2 — модель, которая векторизует текст, изображения, видео, аудио и PDF в одном пространстве и упрощает пос

Bitrix24 перечислил восемь типичных ошибок при разработке MCP-серверов для LLM
Разработчик Bitrix24 разобрал, почему MCP-серверы ломаются на авторизации, цепочках вызовов, плохих описаниях инструментов, тестах, безопасн

Профессор Дионн представит VINPix — нанофотонику и ИИ для мультиомики на чипе
IEEE Spectrum приглашает на вебинар о платформе VINPix: нанофотонные чипы в связке с ИИ обещают ускорить мультиомный анализ, биосенсинг и пр

Почему идея world model Янна ЛеКуна не решает главный кризис развития LLM
После ухода Янна ЛеКуна из Meta его концепцию world model снова обсуждают как путь за пределы LLM, но критики считают, что физика мира слишк

Alibaba объединяет сервисы искусственного интеллекта в новый бизнес-блок ради роста прибыли
Alibaba создаёт отдельное подразделение, которое объединит разрозненные ИИ-сервисы и разработки компании, чтобы быстрее превращать технологи

На базе ROS2 и LeRobot собрали Physical AI-конвейер для SO-101 за 30 тысяч рублей
Open-source стек на базе ROS2 и LeRobot позволяет на недорогом SO-101 собрать полный Physical AI-пайплайн: телоуправление, запись эпизодов,

Citrini Research: как AI может обрушить премию за интеллект и встряхнуть экономику
Citrini Research описывает сценарий, в котором AI делает интеллектуальный труд массовым товаром, давит на зарплаты среднего класса и запуска

xAI нанимает банкиров и кредитных экспертов, чтобы усилить Grok в финансах
xAI хочет обучить Grok финансовой стратегии с помощью банкиров и специалистов по private credit, делая ставку на более профессиональный и до

Karakeep помогает навести порядок в статьях, ссылках и YouTube-вкладках с помощью AI
Karakeep превращает хаос из статей, исследований и YouTube-вкладок в аккуратный архив: AI автоматически ставит теги, делает краткие сводки и

Intel предупреждает: агентный ИИ вышел из «детского» этапа и требует новой модели контроля
Агентный ИИ переходит от чат-ботов к самостоятельным действиям, и компаниям уже нужны не общие политики, а встроенные в процессы ограничения

SimpleOne запустила SimpleGen — AI-инструмент для разработки и деплоя на платформе
SimpleOne представила SimpleGen — AI-инструмент для генерации решений на своей платформе: разработчику достаточно подготовить репозиторий, д

Google AI Ultra: как превратить подписку в пул параллельных агентов и консенсус моделей
Google AI Ultra предлагают использовать как основу для мультиагентного стека: запускать параллельных воркеров Gemini, делегировать рутину и

Суд по иску Маска к OpenAI и Microsoft продолжится, хотя сумму в $134 млрд сочли взятой с потолка
Судья усомнилась в оценке ущерба по иску Илона Маска к OpenAI и Microsoft на сумму до $134 млрд, но не закрыла спор и передала вопрос о прет

Meta потратит до $27 млрд на AI-инфраструктуру Nebius Group в ближайшие пять лет
Meta готова потратить до $27 млрд за пять лет на доступ к AI-инфраструктуре Nebius Group, показывая, что борьба за вычислительные мощности с