Источник

Habr AI

708
всего статей
403
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·Habr AI

Anthropic и ETH Zurich: длинный CLAUDE.md ухудшает работу агента и повышает расходы

Исследование ETH Zurich на 138 репозиториях показало: длинные CLAUDE.md и AGENTS.md нередко снижают успех coding-агентов и одновременно увел

2026-04-30·3 мин
LLM
LLM·Habr AI

Gemini 3.1 Pro обошла ChatGPT 5.4 и Claude Opus 4.6 в тесте генерации текста

Авторское сравнение трех топовых моделей на четырех литературных задачах показало, что Gemini 3.1 Pro лучше держит жанр, эмоцию и компактнос

2026-04-30·3 мин
LLM
LLM·Habr AI

Anthropic, OpenAI и Cursor: восемь уровней зрелости агентной инженерии

Habr AI разобрал восемь уровней агентной инженерии — от tab-complete и context engineering до фоновых агентов и автономных команд, которые у

2026-04-30·3 мин
LLM
LLM·Habr AI

AMD RX580 запустила LLM дома: как победить ROCm, Ollama и добиться GPU inference

Инженер показал, как заставить старую AMD RX580 стабильно крутить LLM через ROCm и Ollama, разобрав ложные признаки работы GPU, сбои hipMemG

2026-04-30·3 мин
LLM
LLM·Habr AI

Почему Claude 4.6 не спасает без контекста: главное слепое пятно LLM-разработки

Даже сильная модель вроде Claude 4.6 теряет эффективность без системно собранного контекста: knowledge base, связи между сервисами и правила

2026-04-30·3 мин
LLM
LLM·Habr AI

Разработчик собрал AI-агрегатор новостей с MCP, DeepSeek и Telegram-ботом

После атаки дронов над Дубаем разработчик собрал мультиязычный агрегатор новостей: 80+ источников, MCP-сервер для AI-агентов, AI-чат и Teleg

2026-04-30·3 мин
LLM
LLM·Habr AI

BorisovAI проверила MoE на RTX 4090 и показала, почему перплексия ломает оценку LLM

BorisovAI протестировала MoE с подключаемыми экспертами на одной RTX 4090 и выяснила, что красивая перплексия не гарантирует реальный рост к

2026-04-30·3 мин
LLM
LLM·Habr AI

Эксперимент с LLM показал, как в латентном пространстве зарождается «личность» модели

Эксперимент с модульной LLM показал, что отдельный латентный вектор может хранить не только стиль текста, но и устойчивые поведенческие приз

2026-04-30·2 мин
LLM
LLM·Habr AI

Nvidia перед GTC 2026 намекает на оптический чип, способный перестроить ИИ-дата-центры

Перед выступлением 16 марта 2026 года Nvidia подогрела рынок обещанием «чипа, который потрясет мир», а главным кандидатом на сюрприз называю

2026-04-30·3 мин
LLM
LLM·Habr AI

Почему успехи DeepMind в AGI не отвечают на главный вопрос о машинном сознании

Автор разбирает, почему рост вычислительной мощности и успехи DeepMind в AGI не равны появлению сознания: интеллект можно имитировать, а суб

2026-04-30·3 мин
LLM
LLM·Habr AI

Habr AI о будущем труда: как ИИ и роботы могут вернуть общество к новой античности

Habr AI рассуждает, что связка ИИ, роботизации и нейроимплантов может не просто поменять рынок труда, а разделить общество на узкий класс оп

2026-04-30·2 мин
LLM
LLM·Habr AI

В Unity показали, как собрать голосовых неигровых персонажей с памятью и контекстом мира

Пошаговый гайд показывает, как в Unity собрать голосовых персонажей с локальной моделью, памятью диалогов, знанием мира игры и ответами голо

2026-04-30·2 мин
LLM
LLM·Habr AI

Гарвард: ИИ сокращает найм джунов, а через три года это может ударить по всей отрасли

Гарвард фиксирует падение найма джунов после внедрения ИИ, а METR — растущую зависимость опытных разработчиков от ассистентов, что грозит де

2026-04-30·3 мин
LLM
LLM·Habr AI

DeepSeek и GLM-5 обошли Яндекс в тесте 34 AI-моделей для менеджеров без VPN

Авторы большого теста управленческих сценариев выяснили, что доступные в России без VPN DeepSeek V3.2 и GLM-5 заметно сильнее решений Яндекс

2026-04-30·3 мин
LLM
LLM·Habr AI

Google выпустила Gemini Embedding 2 для мультимодального RAG с видео, аудио и PDF

Google выпустила Gemini Embedding 2 — модель, которая векторизует текст, изображения, видео, аудио и PDF в одном пространстве и упрощает пос

2026-04-30·2 мин
LLM
LLM·Habr AI

Bitrix24 перечислил восемь типичных ошибок при разработке MCP-серверов для LLM

Разработчик Bitrix24 разобрал, почему MCP-серверы ломаются на авторизации, цепочках вызовов, плохих описаниях инструментов, тестах, безопасн

2026-04-30·3 мин
LLM
LLM·Habr AI

Почему идея world model Янна ЛеКуна не решает главный кризис развития LLM

После ухода Янна ЛеКуна из Meta его концепцию world model снова обсуждают как путь за пределы LLM, но критики считают, что физика мира слишк

2026-04-30·3 мин
LLM
LLM·Habr AI

На базе ROS2 и LeRobot собрали Physical AI-конвейер для SO-101 за 30 тысяч рублей

Open-source стек на базе ROS2 и LeRobot позволяет на недорогом SO-101 собрать полный Physical AI-пайплайн: телоуправление, запись эпизодов,

2026-04-30·3 мин
LLM
LLM·Habr AI

SimpleOne запустила SimpleGen — AI-инструмент для разработки и деплоя на платформе

SimpleOne представила SimpleGen — AI-инструмент для генерации решений на своей платформе: разработчику достаточно подготовить репозиторий, д

2026-04-30·3 мин
LLM
LLM·Habr AI

Google AI Ultra: как превратить подписку в пул параллельных агентов и консенсус моделей

Google AI Ultra предлагают использовать как основу для мультиагентного стека: запускать параллельных воркеров Gemini, делегировать рутину и

2026-04-30·2 мин
LLM
LLM·Habr AI

Сэм Альтман и Пентагон: как военные контракты могут стать страховкой для OpenAI

Колонка о связке OpenAI и Пентагона утверждает, что военные контракты дают компании Сэма Альтмана не только деньги и данные, но и защиту от

2026-04-30·2 мин
LLM
LLM·Habr AI

OpenAI выпустила GPT-5.4 Pro: новые рекорды в ARC-AGI-2, FrontierMath и логике

OpenAI представила GPT-5.4 Pro — модель, которая резко прибавила в сложных бенчмарках, лучше решает задачи на рассуждение и увереннее справл

2026-04-30·2 мин
LLM
LLM·Habr AI

nullClaw на Zig обошёл OpenClaw по памяти и старту в локальных тестах AI-агентов

nullClaw, лёгкий AI-рантайм на Zig, в локальном сравнении с OpenClaw показал почти мгновенный старт и кратно меньший расход памяти даже в сц

2026-04-30·3 мин
LLM
LLM·Habr AI

ChatGPT 5.4 от OpenAI обошёл Claude Opus 4.6 и Gemini 3.1 Pro в сравнении на Habr

На Habr вышло сравнение трёх флагманских моделей в рутинных задачах: ChatGPT 5.4 занял первое место по сумме баллов, Gemini 3.1 Pro оказался

2026-04-30·3 мин
LLM
LLM·Habr AI

Исследование: Cursor ускоряет старт разработки, но затем наращивает техдолг команды

Исследование по Cursor показало: AI-ассистент резко ускоряет выпуск кода в первые недели, но затем повышает сложность, число предупреждений

2026-04-30·2 мин
LLM
LLM·Habr AI

Яндекс на AI Dev Day показал, как ИИ уже меняет разработку в Авито, Ozon и Т-Банке

На AI Dev Day компании Яндекс, Авито, Ozon, Т-Банк и Сбер показали, где AI уже ускоряет разработку, а где эффект пока упирается в метрики, п

2026-04-30·3 мин
LLM
LLM·Habr AI

Как ИИ меняет инди-разработку: соло-разработчикам всё сложнее конкурировать

Автор колонки утверждает, что ИИ ускорил запуск MVP, но одновременно поднял порог входа, разогрел маркетинговую конкуренцию и ослабил преиму

2026-04-30·3 мин
LLM
LLM·Habr AI

Компания без менеджеров: три ловушки, в которые попадают при внедрении AI

Из 50 руководителей на ProIT Fest только трое сказали, что AI действительно упростил решения — при том что менеджеров в компаниях становится

2026-04-30·2 мин
LLM
LLM·Habr AI

Битрикс24 показал, как добавить в бизнес-портал четыре робота для автоматизации

Битрикс24 выпустил продолжение практической серии и показал, как встроить в бизнес-портал четыре робота: для чистки телефонов, нормализации

2026-04-30·3 мин
LLM
LLM·Habr AI

Anthropic объяснила, как делать skills для Claude Code и зачем командам свой маркетплейс

Anthropic показала, какие skills действительно работают в Claude Code, как их писать без лишнего шума и почему большим командам нужен свой м

2026-04-30·3 мин