Habr AI

Как российский разработчик несколько дней запускал Gemini — и что наконец сработало
Российский программист потратил несколько дней на запуск Gemini из России через VPN, перепробовал десятки вариантов и задокументировал кажды

Product Graph и память агентов: почему ИИ не спасает продукт без структуры знаний
Разбор о Product Graph объясняет, почему даже сильные ИИ-агенты бесполезны без общей памяти продукта и как связанная структура знаний снижае

Лаборатория за шесть лет: от флешек и тетрадей до AI, который находит скрытые дефекты
История о том, как одна лаборатория шесть лет строила цифровую инфраструктуру — и в итоге получила AI, который читает логи напыления и заран

Как AI изменил дневниковое исследование: три компромисса, от которых отказались
Команда UX-исследователей объяснила, как AI позволил отказаться от компромиссов с выборкой, длительностью и глубиной анализа — без урезания

Марчин Москала разобрал GeminiAI: что аудит показал о корутинах и архитектуре Android
Автор open-source клиента GeminiAI рассказал, как его проект прошёл аудит у Марчина Москалы и почему именно ошибки в корутинах стали главным

Anthropic: утечка исходников Claude Code раскрыла сложную агентную архитектуру
Утекший через sourcemap код Claude Code показал, что продукт Anthropic давно вырос из «CLI для чата» в платформу с субагентами, памятью, rem

Сбер объяснил, почему бизнесу нужен слой AI Overlay вместо перестройки отделов
Сбер показал, почему точечное внедрение генеративного ИИ редко приносит прибыль, и предложил альтернативу — горизонтальный слой AI Overlay п

Saiga Llama 3 8B на 10 ГБ VRAM: как на Habr добились 93% точности по «Войне и миру»
На Habr AI показали, как запустить Saiga Llama 3 8B на 10 ГБ VRAM, сжать два тома «Войны и мира» в саммари и снизить число галлюцинаций жёст

4 паттерна нетехнических фаундеров, из-за которых стартап не взлетит
Разработчик с Хабра поработал с несколькими нетехническими фаундерами и описал четыре паттерна, из-за которых стартапы не запускаются — и ка

DeepSeek и Gemma: как эксперимент с гибридной LLM на Kaggle сломал библиотеку Transformers
Энтузиасты перенесли четыре 31B-слоя Gemma в MoE-архитектуру DeepSeek без дообучения, обошли ограничения PyTorch и Transformers и запустили

Google Gemma 4 и Qwen 3.6 возглавили список лучших локальных моделей для дома в 2026 году
Подборка локальных моделей 2026 года показывает, что для домашнего AI уже хватает RTX 3060, а выбирать нужно по VRAM, квантованию и задаче —

Яндекс Практикум показал, как CNN видят изображения и почему параметры решают не всё
На Habr AI вышел разбор от Яндекс Практикума о том, как свёрточные нейросети обрабатывают изображения, почему архитектура важнее голого разм

Google показала TurboQuant: 3-битный KV-кэш для LLM, но рынок памяти запаниковал рано
После анонса TurboQuant акции производителей памяти просели, но за громким эффектом скрываются ограничения: кода нет, интеграции нет, а науч

Rutube перешёл от пилота на Whisper к собственной платформе субтитров и распознаванию речи
Rutube рассказал, как превратил быстрый пилот на Whisper в полноценную платформу субтитров с микросервисной архитектурой и собственной ASR,

Raft показала, как компаниям оценивать AI-агентов до запуска в рабочих процессах
Raft выпустила практическое руководство по evals для AI-агентов: вместо интуиции и разовых демо компаниям предлагают проверять результат, пу

Veai показала, как тестирует ИИ-агента в JetBrains IDE без зависимости от модели
Veai описала подход к UI-автоматизации плагина для JetBrains IDE: команда отделила детерминированный интерфейс от ответов LLM и сократила ло

Habr AI объяснил, когда бизнесу нужны рекомендательные системы, а когда они лишние
Habr AI выпустил практический гид по рекомендательным системам: когда бизнесу хватит простых правил, в каких случаях нужны ML-модели и какие

Для Telegram выпустили антиспам-бота Tab на собственной нейросети с дообучением
Разработчик представил бесплатного антиспам-бота Tab для Telegram: он фильтрует сообщения собственной нейросетью, дообучается на жалобах мод

SpeShu.AI запустила AI-Профи — сервис для подбора AI-специалистов под задачи бизнеса
SpeShu.AI представила сервис AI-Профи: компании могут за несколько кликов найти AI-специалистов под конкретные задачи на фоне резкого роста

Qwen 3.6 Plus обошёл DeepSeek V4 Pro в русском battle test и оказался выгоднее
В свежем сравнении шести апрельских LLM модель Qwen 3.6 Plus набрала 92 балла на русском контенте и обошла новый DeepSeek V4 Pro, который ок

Сбер выпустил Kandinsky 6.0 Image Pro — единую модель для генерации и редактирования изображений
Сбер представил Kandinsky 6.0 Image Pro — модель для генерации и редактирования изображений, ускоренную более чем на 40% и дополненную Image

NASA и SETI описали базовые модели для астробиологии и поиска внеземной жизни
Группа авторов из NASA и SETI предложила мультимодальную базовую модель для астробиологии — от поиска биосигнатур до планирования автономных

Как Cursor за три дня и $180 создал прототип, который расколол команду разработки
В крупной ИТ-компании архитектор за три дня и $180 в Cursor собрал рабочий прототип, а команда за три месяца — более надежный модуль, которы

Пользователи Claude Code раскритиковали Anthropic Opus 4.7 и советуют вернуться на 4.6
После релиза Claude Opus 4.7 часть разработчиков в Claude Code пожаловалась на лень, выдумки и потерю контекста модели, а рабочим решением н

VK показала DataCopilot — мультиагентную систему для корпоративных данных и документации
VK рассказала о DataCopilot — мультиагентном помощнике для работы с корпоративным хранилищем данных: он ищет витрины, объясняет структуру да

Wallmates: как проекторы, дроны и ИИ меняют дизайн и оформление коммерческих пространств
Агентство Wallmates показало, как проекторы уже сокращают ручную работу в интерьерных проектах, почему AR пока не готова к работе на объекта

DeepSeek V4 Pro и Claude Sonnet 4.6 сравнили на 50 задачах: где экономия, а где риск
Тест на 50 реальных задачах российского разработчика показал, что DeepSeek V4 заметно дешевле Claude Sonnet 4.6, но чаще ошибается в расчёта

ГК «Умный сервис» протестировала голосовое управление роботом-перевозчиком паллет
Первый тест ГК «Умный сервис» показал, что голос может запускать сценарии паллетного робота на складе, но только при жестко заданных команда

Anthropic выводит Claude Code из тарифа за $20, а SpaceX готовит сделку по Cursor
Anthropic тестирует вывод Claude Code из подписки за $20, Duolingo убирает AI-метрики для сотрудников, а закрытую модель Claude Mythos наход

OpenAI выпустила GPT-5.5: сильнее в программировании, агентах и работе за компьютером
OpenAI запустила GPT-5.5 с упором на код, агентные задачи и работу за компьютером: модель уже доступна в ChatGPT и Codex, но API еще не откр