Habr AI

NextFilm описал модель рекомендаций фильмов: cold start, вектор вкуса и слой GPT
Автор NextFilm показал, как рекомендовать фильмы новым пользователям: собрать стартовые оценки, построить вектор вкуса, сверить его с MovieL

Разработчик n0x научил своего браузерного агента открывать сайты и делать скриншоты
Проект n0x превратили из обычной языковой болталки в браузерного агента с поддержкой MCP: теперь он открывает сайты, делает скриншоты и выпо

Anthropic тестирует Claude Mythos: утечка раскрыла модель на 10 трлн параметров
Внутренняя утечка Anthropic раскрыла Claude Mythos — модель, которую компания считает самым мощным своим ИИ и пока не готова выпускать публи

Anthropic и OpenClaude: почему «бесплатный» Claude Code в 2026 году не совсем бесплатен
После утечки исходников Claude Code сообщество быстро собрало OpenClaude, но за обещанием бесплатного AI-кодинга скрываются ограничения совм

Как одна системная инструкция превращает LLM в надёжный инструмент: тесты на Qwen и DeepSeek
Один системный промпт способен убрать галлюцинации у LLM: эксперимент с Qwen и DeepSeek показал, что «экзоскелет» из правил превращает модел

Группа Т-Технологии об open source в AI/ML: как устроена работа с LLM внутри
Интервью с AI/ML-командой Группы Т-Технологии — о разработке LLM, участии в open source и исследовательском направлении.

NVIDIA на GTC 2026 сместила фокус с чипов на фабрики токенов и эру Agent-as-a-Service
На GTC 2026 NVIDIA показала, что делает ставку не на отдельные GPU, а на фабрики токенов, модульную архитектуру Vera Rubin и экономику AI-аг

PageIndex от VectifyAI предлагает поиск без эмбеддингов для длинных документов
PageIndex строит древовидное оглавление документа и ищет релевантные разделы через рассуждение LLM, обещая RAG без эмбеддингов, но с заметно

GolangConf 2026 и Онтико: почему Go-командам пора лечить архитектуру, а не скорость кода
Онтико перестраивает GolangConf 2026 вокруг реальных болей Go-команд: AI ускорил написание кода, но архитектурные решения, масштабирование и

ruGPT3XL получил контекст 8k: восстановленная модель почти без потерь вышла за предел 2k
Автор восстановления ruGPT3XL исправил sparse attention, поднял контекст модели с 2k до 8k и сохранил качество на коротких последовательност

OpenAI, MiniMax и Nvidia задали тон марту в ИИ: Sora, GPT-5.4 и ставка на Миру Мурати
Март в ИИ прошёл под знаком продуктовых разворотов: OpenAI меняют судьбу Sora, Google и Anthropic ускоряют ассистентов, а MiniMax и Nvidia н

AI-first стартапы: почему growth-маркетинг буксует и что ломается в воронке
У AI-first продуктов сильные метрики на входе часто скрывают ложный спрос: люди приходят за новизной, а не за решением задачи, поэтому привы

Habr: ai-агенты меняют delivery, и командам приходится пересобирать весь цикл разработки
На Habr объяснили, почему с появлением ai-агентов команды должны перестраивать не только написание кода, но и весь delivery: контекст, прове

М2 передала нейросети 40% маркетинговых текстов и не потеряла качество контента
Команда М2 встроила AI-копирайтера во внутреннюю редакцию, перевела на него 40% продуктовых и маркетинговых текстов и сохранила единый тон,

Sova AI выпустила Android-ассистента, который управляет телефоном без ПК и root
Sova AI представила Android-приложение с ИИ-агентом, который открывает приложения, нажимает кнопки, скроллит экраны и выполняет голосовые ко

OpenAI API и fan-out запросы GPT: как SEO-специалистам анализировать AI-поиск
Автор показывает, как через OpenAI API получать скрытые fan-out запросы GPT и использовать их для анализа того, как AI-модели собирают источ

Hack The Box: как MCP Inspector превращает AI-инструменты в новую точку атаки
Разбор Kobold из HTB Season 10 показывает, как одна dev-утилита для AI-серверов может привести к RCE, LFI, повторному использованию учётных

Система на базе LLM сократила подготовку карт контроля на заводе с 2 часов до 5 минут
На металлургическом заводе LLM-система начала собирать карты контроля за 3–5 минут вместо двух часов: сработал не универсальный промт, а наб

Habr AI показал, как добавить память и контекст в LLM-чат на Python с Ollama и LiteLLM
В новой части туториала по Python-чату с Ollama и LiteLLM показано, как хранить историю сообщений, передавать контекст модели и ограничивать

Claude Sonnet и Jarvis Pattern: почему ИИ-агентам может хватить операционной системы
На Habr предложили строить персональных AI-агентов не вокруг сложных фреймворков, а на связке LLM, операционной системы и файловой памяти —

Яндекс показал, как бизнесу попасть в ответы Алисы и измерять видимость в поиске
Яндекс запустил в Вебмастере раздел «Видимость сайта в Алисе», и для бизнеса это сигнал: в ответы ассистента ведут не трюки, а сильная поиск

Флант: как Go-разработчик превратил Zed и Gemini в полезного ИИ-агента
Go-разработчик из «Фланта» описал путь от медленных IDE-плагинов к связке Zed, Gemini 3 Flash и gopls-mcp, которая даёт ИИ-агенту контекст п

Agentis Memory: Redis-совместимое хранилище с векторным поиском и локальными эмбеддингами
Agentis Memory превращает Redis-совместимое хранилище в общую память для AI-агентов: с локальными эмбеддингами, встроенным векторным поиском

Habr: как synthetic data помогает обучать модели и почему self-training ведет к collapse
Синтетические данные помогают ИИ компенсировать дефицит качественного человеческого корпуса, но при бесконтрольном self-training модели начи

Почему ChatGPT и Gemini не рекомендуют ваш B2B SaaS, даже если сайт сделан нормально
Даже хороший B2B SaaS-сайт может не попасть в ответы ChatGPT, Gemini и Perplexity, если у бренда нет чёткой категории, внешних подтверждений

Почему ИИ в UI-дизайне важен не для продакшена, а как источник визуальных мутаций
AI-generated UI ценен не только скоростью набросков: его сила в редких визуальных сочетаниях, которые помогают дизайнерам находить новые ход

Qwen и llama.cpp: как запустить локальную нейросеть без облака на компьютере или сервере
Практический материал объясняет, как запустить модель Qwen через llama.cpp на своём компьютере или сервере, чтобы работать с локальной нейро

Anthropic и Claude Cowork: 10 рабочих задач, которые ИИ снимает с человека
Claude Cowork от Anthropic показывает, как ИИ берёт на себя утренние брифинги, КП, ответы клиентам и отчёты, возвращая до двух-трёх рабочих

Directum: почему бизнес активно обсуждает ИИ-агентов, но не спешит внедрять их в процессы
Directum объясняет, почему ИИ-агенты стали главным корпоративным трендом, но массовое внедрение тормозят дорогая инфраструктура, риски ошибо

ClawRouter снизил расходы на LLM API с $47 до $1.80 за неделю — обзор умного роутера
Роутер ClawRouter анализирует каждый промпт по 15 параметрам и направляет к наиболее дешёвой подходящей модели — это снизило недельные расхо