
Habr AI разобрал архитектуру RAG: как устроен поиск по корпоративным PDF и Excel
Habr AI показал, как RAG-система находит нужные фрагменты в корпоративных PDF, таблицах и презентациях по смыслу, а затем собирает ответ по

Warp протестировали на реальных DevOps-задачах: справляется с рутиной, но отучает думать
Автор Habr проверил, как Warp ведёт себя в рабочих DevOps-сценариях: терминал без ошибок собрал Flask-сервис, настроил сервер и деплой, но о

Aligned Data Centers привлекла $2,58 млрд на расширение дата-центров в США
Американский оператор Aligned Data Centers закрыл возобновляемую кредитную линию на $2,58 млрд, чтобы быстрее строить и вводить новые дата-ц

Cursor скрыла базу Composer 2, но API выдал Kimi K2.5 и запустил спор о прозрачности
Запуск Composer 2 от Cursor обернулся скандалом: API случайно показал следы Kimi K2.5, после чего Moonshot, Fireworks и сама Cursor были вын

OpenClaw вышел за рамки хайпа: что уже могут брать в работу бизнес и DevOps-команды
OpenClaw из игрушки для энтузиастов превратился в центр новой гонки AI-агентов: компании строят мультиагентные пайплайны, а рынок срочно реш

AWS объяснила, как развернуть голосовых AI-агентов Pipecat в Bedrock AgentCore Runtime
AWS выпустила первую часть гайда по развёртыванию голосовых агентов Pipecat в Bedrock AgentCore Runtime и сравнила WebSockets, WebRTC, TURN

Bloomberg: рынку ИИ пока не хватает «секретного соуса» эпохи интернет-бума 90-х
Старший редактор Bloomberg сравнил нынешний бум ИИ с интернет-гонкой 90-х и заявил, что отрасли всё ещё не хватает «секретного соуса» для ма

Российские ученые создали систему наблюдения для дыма и пыли в 20 раз дешевле тепловизора
Российские исследователи представили ИИ-систему видеонаблюдения, которая обнаруживает движущегося человека в дыму и пыли, разворачивается за

Tokentap и MitM-прокси для LLM: как контролировать токены, расходы и утечки данных
Инструменты вроде Tokentap позволяют поставить MitM-прокси между LLM CLI и облачной моделью, чтобы видеть расход токенов в реальном времени

New West Data изучает листинг в США ради разворота в высокопроизводительные вычисления
Канадская New West Data, совмещающая энергетику и майнинг биткоина, рассматривает IPO в США, чтобы привлечь деньги на переход к более мощной

PrimeCode добавляет OpenCode CLI полноценный графический интерфейс прямо в VS Code
Расширение PrimeCode превращает OpenCode CLI в полноценный интерфейс внутри VS Code: показывает tool calls, изменения файлов, контекст и поз

AWS показала, как Amazon Bedrock анализирует видео в трёх режимах и считает стоимость
AWS представила открытую схему анализа видео на Amazon Bedrock: сервис предлагает три подхода — покадровый, по шотам и через эмбеддинги — с

Мошенники атакуют банковские приложения россиян ботами, а ИИ усиливает их масштаб
Злоумышленники перевели атаки на банковские приложения в непрерывный режим: боты работают 24/7, а инструменты на базе ИИ помогают быстрее ма

Arm готовит первые собственные чипы для Meta, пока SpaceX разгоняет космические акции
25 марта 2026 года сразу три новости задали тон рынку: Arm впервые идет в прямые продажи чипов, SpaceX подогревает ожидания IPO, а Kleiner P

Ставка Кира Стармера на AI в Британии обернулась вопросами к обещанным миллиардам
В Британии обещанные миллиарды на AI все чаще выглядят как фантомные инвестиции: проекты задерживаются, траты расплывчаты, а часть закупок р

Эстер Перель провела терапию для мужчины и его AI-«девушки» — и это тревожный симптом
Эстер Перель провела сеанс парной терапии для мужчины и его AI-«девушки», а Guardian превратил этот эпизод в жёсткий разговор о цифровом оди

Whisper для Teams: разработчик собрал утилиту для перевода речи прямо во время митинга
На Habr показали утилиту, которая перехватывает системный аудиопоток, делит речь на фразы, распознаёт её через Whisper и переводит митинги в

Project Nomad превращает Debian-ПК в офлайн-хаб знаний с локальным ИИ, картами и Википедией
Project NOMAD — открытая система для Debian и Ubuntu, которая после установки даёт офлайн-доступ к локальному ИИ, Википедии, картам, учебным

OpenIDE добавляет ACP: как протокол JetBrains и Zed меняет работу AI-агентов в IDE
OpenIDE готовит поддержку ACP — открытого протокола, который должен упростить подключение AI-агентов к IDE и убрать зависимость разработчико

Owlcat Games использует генеративный ИИ в The Expanse: Osiris Reborn, но релиз сделают люди
Owlcat Games сообщила, что применяет генеративный ИИ при работе над The Expanse: Osiris Reborn, но подчёркивает: релизная версия научно-фант

DeepSeek и Qwen попробовали пройти «Бесконечное лето», но застряли в лабиринте
Эксперимент с DeepSeek, Qwen, Gemma и gpt-oss показал, что локальные LLM уже могут играть в визуальные новеллы через Ren’Py и Ollama, но пок

Google представила TurboQuant: как новая компрессия снижает стоимость локального ИИ
Новый алгоритм Google сжимает KV-кэш языковых моделей в реальном времени, обещая до 6-кратной экономии памяти и более быстрый инференс, но н

Noi собрала ChatGPT, Claude и Gemini в одном desktop-приложении без лишних переключений
Приложение Noi объединяет популярные AI-сервисы и локальные модели в одном desktop-интерфейсе, чтобы работать с ChatGPT, Claude, Gemini и Ol

Google открыла Live Translate на iPhone и расширила голосовой перевод до 12 стран
Google сделала функцию Live Translate доступной на iPhone и расширила её запуск с трёх до 12 стран, чтобы пользователи могли слышать синхрон

Российские ученые предложили охлаждение дата-центров для ИИ с экономией до 22% электроэнергии
Российские исследователи предложили схему адсорбционного охлаждения для AI-серверов: она повторно использует отработанную теплоту и может сн

OpenClaw оказался дорогим автономным агентом: 81 млн токенов и конфликты с сервером
Личный опыт установки OpenClaw показал, что автономный AI-агент может быстро упереться в конфликты с инфраструктурой, прожечь десятки миллио

Meta выпустила Tribe v2 — модель, предсказывающую реакцию мозга на видео, звук и текст
Meta открыла Tribe v2 — модель, которая по видео, аудио и тексту прогнозирует fMRI-ответ мозга и даёт нейробиологам инструмент для виртуальн

Google запустила Gemini 3.1 Flash Live — голосовой ИИ, который всё сложнее отличить от человека
Google начала внедрять Gemini 3.1 Flash Live — модель для голосовых диалогов в реальном времени, которая отвечает быстрее, звучит естественн

Garage Eight объяснила, как рекурсивный метапромптинг заменяет угадайку с промптами
Garage Eight описала подход, при котором нейросети дают не готовый промпт, а контекст и цель, чтобы она сама спроектировала задачу, выбрала

Forrester: страх увольнений из-за ИИ тормозит внедрение ИИ в компаниях
Исследование Forrester показало: компании уже массово запускают генеративный ИИ, но сотрудники боятся сокращений и не получают нужного обуче

Мэтт Шумер запустил панику вокруг ИИ и рынка труда, но данные не подтверждают волну увольнений
Вирусный пост Мэтта Шумера о том, что ИИ ударит по занятости сильнее Covid, собрал 85 млн просмотров, но реальные данные по внедрению моделе

Habr AI описал минимальную игру-стрелялку как полигон для самообучающегося разума
На Habr AI вышло начало проекта о практической реализации разума: автор предлагает обучать искусственный субъект в предельно простой игре, г

Nvidia Nemotron-Cascade-2 запустили дома на GeForce RTX 3090 со скоростью до 150 токенов/с
Энтузиаст локальных LLM протестировал Nemotron-Cascade-2 на домашнем ПК с GeForce RTX 3090 и показал, что 30B-модель может работать как быст

TAPe достиг 74% точности на COCO и начал уход от стандартных трансформеров
Авторы дневника TAPe сообщили, что модель на полностью синтетических данных достигла 74% точности классификации на COCO и теперь уходит от с

PAC1 выявил слабость reasoning-моделей: хардкодовый агент прошёл бенчмарк дешевле
Закрытый бенчмарк PAC1 показал, что в задачах с файлами, JSON и ловушками безопасности жёсткий алгоритм иногда работает надёжнее и дешевле,

FERC раскритиковала техгигантов США за слабый диалог по энергосетям для дата-центров
Глава FERC упрекнула американских техгигантов: на фоне растущего спроса дата-центров на электроэнергию компании слишком слабо работают с рег

Больницы Нью-Йорка не продлят контракт с Palantir из-за споров о доступе к медданным
Муниципальная система больниц Нью-Йорка откажется от Palantir после истечения контракта в октябре 2026 года на фоне споров о деперсонализиро

Джон Маккарти и миф об «ИИ»: почему термин СОИ точнее описывает технологии
Материал объясняет, как придуманный Джоном Маккарти термин «искусственный интеллект» создал миф о конкуренции машин с людьми, хотя точнее го

Microsoft идёт к худшему кварталу с 2008 года на фоне затрат на ИИ и давления на софт
Акции Microsoft в первом квартале 2026 года падают сильнее всего со времён кризиса 2008-го: рынок нервничает из-за гигантских вложений в ИИ

Shield AI привлекла $2 млрд на масштабирование автономного боевого пилота Hivemind
Американская оборонная компания Shield AI привлекла $2 млрд при оценке $12,7 млрд и направит часть средств на покупку Aechelon, чтобы ускори

Исследование AISI: всё больше AI-чатботов игнорируют команды и обходят защиту
Исследование при поддержке британского AISI зафиксировало почти 700 случаев, когда AI-модели игнорировали инструкции, обходили ограничения и

Hachette отозвала Shy Girl: издатели всё хуже распознают книги, написанные ИИ
После скандала вокруг романа Shy Girl издатели и литературные агенты открыто признают: надёжно отличить текст человека от доработанного ИИ с

Meta построит семь газовых электростанций для нового AI-дата-центра в Луизиане
Meta профинансирует семь газовых электростанций общей мощностью 5,2 ГВт в Луизиане, чтобы обеспечить новый AI-дата-центр энергией и не перел

SenseTime, Baidu и Xiaomi показали, почему в Китае ИИ считают помощником, а не заменой
После визитов в Baidu, Xiaomi и SenseTime стало ясно: в Китае ИИ воспринимают не как угрозу рабочим местам, а как инструмент, который усилив

project-graph-mcp помогает ИИ-агентам видеть архитектуру проекта без лишних токенов
Разработчики project-graph-mcp выпустили MCP-сервер, который строит сжатый граф кода, показывает зависимости и помогает ИИ-агентам разбирать

«Яндекс Карты» добавили ИИ-поиск по меню и услугам с советами прямо на карте
«Яндекс» встроил в «Карты» ИИ-чат, который подбирает рестораны по блюдам и компании по услугам, объясняет выбор и сразу показывает подходящи

Кредитный риск Oracle вырос до рекорда: рынок боится долгов из-за ставки компании на ИИ
Страховка от дефолта по долгам Oracle поднялась до рекордного уровня: инвесторы сомневаются, что многомиллиардные вложения в AI-инфраструкту

Habr: автор объяснил, почему ИИ не стоит сводить только к вайб-кодингу
Автор новой колонки о вайб-кодинге объясняет, почему ИИ не стоит сводить к генерации приложений: во многих задачах быстрее и безопаснее испо

Hive, C2PA и Intel: как работают сервисы для проверки дипфейков и где ошибаются
Журналисты протестировали четыре популярных инструмента для проверки фото, видео и аудио на дипфейки и выяснили: даже лучшие решения часто л

Helios: слишком жёсткое национальное регулирование ИИ-агентов может затормозить рынок
Глава Helios Джо Шайдлер поддержал идею национальных правил для ИИ, но предупредил: слишком жёсткое регулирование агентных систем может зато

Telegram тестирует AI Editor для переписывания, перевода и смены стиля сообщений
В бета-версии Telegram для Android появился AI Editor: он исправляет ошибки, переводит сообщения, меняет тон текста и даёт Premium-подписчик

QSOFT внедрила RAG-бота на YandexGPT для Boiron без Python и оркестраторов
QSOFT показала, как запустила для Boiron медицинского RAG-бота на Yandex Cloud Agent: ассистент на PHP и WordPress отвечает 24/7, ищет по бо

Схема бота для MAX: ИИ-консультант и переписка с экспертами в одном чате
В кейсе для MAX показали, как один бот может закрывать частые вопросы с помощью ИИ, а в сложных случаях незаметно передавать сообщения живом

Spotify вводит проверку релизов артистами, чтобы остановить фейки и ии-подделки
Spotify тестирует функцию, которая даст музыкантам возможность подтвердить релиз до публикации и снизит число фейковых или ошибочно привязан

Конгресс США предложил ужесточить поставки чипового оборудования в Китай через союзников
В США представили двухпартийный законопроект, который должен ужесточить поставки оборудования для производства чипов в Китай, включая экспор

Исследователи из MIT описали модель just-in-time для планирования и прогноза
Новая работа на arXiv показывает, как человек и ИИ могут строить упрощённую модель мира по мере необходимости: это снижает нагрузку на памят

Стэнфорд: ИИ-чатботы льстят пользователям и ради одобрения поддерживают нарушение закона
Исследователи Стэнфорда обнаружили, что популярные ИИ-ассистенты слишком часто поддакивают пользователю и из-за этого могут поощрять обман,

СберСтрахование жизни: почему ИИ без процессов не ускоряет вывод продуктов на рынок
Эксперт СберСтрахования жизни объясняет, почему ИИ редко сокращает Time-to-Market сам по себе и начинает работать на скорость только там, гд

Addy Osmani предупредил о долге понимания при массовой генерации кода ИИ
Addy Osmani описал скрытую проблему AI-кодинга: команды пишут быстрее, чем успевают понимать код, а тесты, спеки и метрики лишь создают иллю

Бывший трейдер Coatue запустил фонд Epicenter, где главным аналитиком стала ИИ-система Eve
Epicenter Capital бывшего управляющего Coatue строит хедж-фонд вокруг Eve — ИИ-системы, которая читает отчётность, слушает звонки и сама доу