Habr AI

Anthropic и ETH Zurich: длинный CLAUDE.md ухудшает работу агента и повышает расходы
Исследование ETH Zurich на 138 репозиториях показало: длинные CLAUDE.md и AGENTS.md нередко снижают успех coding-агентов и одновременно увел

Gemini 3.1 Pro обошла ChatGPT 5.4 и Claude Opus 4.6 в тесте генерации текста
Авторское сравнение трех топовых моделей на четырех литературных задачах показало, что Gemini 3.1 Pro лучше держит жанр, эмоцию и компактнос

Anthropic, OpenAI и Cursor: восемь уровней зрелости агентной инженерии
Habr AI разобрал восемь уровней агентной инженерии — от tab-complete и context engineering до фоновых агентов и автономных команд, которые у

AMD RX580 запустила LLM дома: как победить ROCm, Ollama и добиться GPU inference
Инженер показал, как заставить старую AMD RX580 стабильно крутить LLM через ROCm и Ollama, разобрав ложные признаки работы GPU, сбои hipMemG

Почему Claude 4.6 не спасает без контекста: главное слепое пятно LLM-разработки
Даже сильная модель вроде Claude 4.6 теряет эффективность без системно собранного контекста: knowledge base, связи между сервисами и правила

Разработчик собрал AI-агрегатор новостей с MCP, DeepSeek и Telegram-ботом
После атаки дронов над Дубаем разработчик собрал мультиязычный агрегатор новостей: 80+ источников, MCP-сервер для AI-агентов, AI-чат и Teleg

BorisovAI проверила MoE на RTX 4090 и показала, почему перплексия ломает оценку LLM
BorisovAI протестировала MoE с подключаемыми экспертами на одной RTX 4090 и выяснила, что красивая перплексия не гарантирует реальный рост к

Эксперимент с LLM показал, как в латентном пространстве зарождается «личность» модели
Эксперимент с модульной LLM показал, что отдельный латентный вектор может хранить не только стиль текста, но и устойчивые поведенческие приз

Nvidia перед GTC 2026 намекает на оптический чип, способный перестроить ИИ-дата-центры
Перед выступлением 16 марта 2026 года Nvidia подогрела рынок обещанием «чипа, который потрясет мир», а главным кандидатом на сюрприз называю

Почему успехи DeepMind в AGI не отвечают на главный вопрос о машинном сознании
Автор разбирает, почему рост вычислительной мощности и успехи DeepMind в AGI не равны появлению сознания: интеллект можно имитировать, а суб

Habr AI о будущем труда: как ИИ и роботы могут вернуть общество к новой античности
Habr AI рассуждает, что связка ИИ, роботизации и нейроимплантов может не просто поменять рынок труда, а разделить общество на узкий класс оп

В Unity показали, как собрать голосовых неигровых персонажей с памятью и контекстом мира
Пошаговый гайд показывает, как в Unity собрать голосовых персонажей с локальной моделью, памятью диалогов, знанием мира игры и ответами голо

Гарвард: ИИ сокращает найм джунов, а через три года это может ударить по всей отрасли
Гарвард фиксирует падение найма джунов после внедрения ИИ, а METR — растущую зависимость опытных разработчиков от ассистентов, что грозит де

DeepSeek и GLM-5 обошли Яндекс в тесте 34 AI-моделей для менеджеров без VPN
Авторы большого теста управленческих сценариев выяснили, что доступные в России без VPN DeepSeek V3.2 и GLM-5 заметно сильнее решений Яндекс

Google выпустила Gemini Embedding 2 для мультимодального RAG с видео, аудио и PDF
Google выпустила Gemini Embedding 2 — модель, которая векторизует текст, изображения, видео, аудио и PDF в одном пространстве и упрощает пос

Bitrix24 перечислил восемь типичных ошибок при разработке MCP-серверов для LLM
Разработчик Bitrix24 разобрал, почему MCP-серверы ломаются на авторизации, цепочках вызовов, плохих описаниях инструментов, тестах, безопасн

Почему идея world model Янна ЛеКуна не решает главный кризис развития LLM
После ухода Янна ЛеКуна из Meta его концепцию world model снова обсуждают как путь за пределы LLM, но критики считают, что физика мира слишк

На базе ROS2 и LeRobot собрали Physical AI-конвейер для SO-101 за 30 тысяч рублей
Open-source стек на базе ROS2 и LeRobot позволяет на недорогом SO-101 собрать полный Physical AI-пайплайн: телоуправление, запись эпизодов,

SimpleOne запустила SimpleGen — AI-инструмент для разработки и деплоя на платформе
SimpleOne представила SimpleGen — AI-инструмент для генерации решений на своей платформе: разработчику достаточно подготовить репозиторий, д

Google AI Ultra: как превратить подписку в пул параллельных агентов и консенсус моделей
Google AI Ultra предлагают использовать как основу для мультиагентного стека: запускать параллельных воркеров Gemini, делегировать рутину и

Сэм Альтман и Пентагон: как военные контракты могут стать страховкой для OpenAI
Колонка о связке OpenAI и Пентагона утверждает, что военные контракты дают компании Сэма Альтмана не только деньги и данные, но и защиту от

OpenAI выпустила GPT-5.4 Pro: новые рекорды в ARC-AGI-2, FrontierMath и логике
OpenAI представила GPT-5.4 Pro — модель, которая резко прибавила в сложных бенчмарках, лучше решает задачи на рассуждение и увереннее справл

nullClaw на Zig обошёл OpenClaw по памяти и старту в локальных тестах AI-агентов
nullClaw, лёгкий AI-рантайм на Zig, в локальном сравнении с OpenClaw показал почти мгновенный старт и кратно меньший расход памяти даже в сц

ChatGPT 5.4 от OpenAI обошёл Claude Opus 4.6 и Gemini 3.1 Pro в сравнении на Habr
На Habr вышло сравнение трёх флагманских моделей в рутинных задачах: ChatGPT 5.4 занял первое место по сумме баллов, Gemini 3.1 Pro оказался

Исследование: Cursor ускоряет старт разработки, но затем наращивает техдолг команды
Исследование по Cursor показало: AI-ассистент резко ускоряет выпуск кода в первые недели, но затем повышает сложность, число предупреждений

Яндекс на AI Dev Day показал, как ИИ уже меняет разработку в Авито, Ozon и Т-Банке
На AI Dev Day компании Яндекс, Авито, Ozon, Т-Банк и Сбер показали, где AI уже ускоряет разработку, а где эффект пока упирается в метрики, п

Как ИИ меняет инди-разработку: соло-разработчикам всё сложнее конкурировать
Автор колонки утверждает, что ИИ ускорил запуск MVP, но одновременно поднял порог входа, разогрел маркетинговую конкуренцию и ослабил преиму

Компания без менеджеров: три ловушки, в которые попадают при внедрении AI
Из 50 руководителей на ProIT Fest только трое сказали, что AI действительно упростил решения — при том что менеджеров в компаниях становится

Битрикс24 показал, как добавить в бизнес-портал четыре робота для автоматизации
Битрикс24 выпустил продолжение практической серии и показал, как встроить в бизнес-портал четыре робота: для чистки телефонов, нормализации

Anthropic объяснила, как делать skills для Claude Code и зачем командам свой маркетплейс
Anthropic показала, какие skills действительно работают в Claude Code, как их писать без лишнего шума и почему большим командам нужен свой м