Источник

Habr AI

708
всего статей
403
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·Habr AI

NextFilm описал модель рекомендаций фильмов: cold start, вектор вкуса и слой GPT

Автор NextFilm показал, как рекомендовать фильмы новым пользователям: собрать стартовые оценки, построить вектор вкуса, сверить его с MovieL

2026-04-28·3 мин
LLM
LLM·Habr AI

Разработчик n0x научил своего браузерного агента открывать сайты и делать скриншоты

Проект n0x превратили из обычной языковой болталки в браузерного агента с поддержкой MCP: теперь он открывает сайты, делает скриншоты и выпо

2026-04-28·3 мин
LLM
LLM·Habr AI

Anthropic тестирует Claude Mythos: утечка раскрыла модель на 10 трлн параметров

Внутренняя утечка Anthropic раскрыла Claude Mythos — модель, которую компания считает самым мощным своим ИИ и пока не готова выпускать публи

2026-04-28·2 мин
LLM
LLM·Habr AI

Anthropic и OpenClaude: почему «бесплатный» Claude Code в 2026 году не совсем бесплатен

После утечки исходников Claude Code сообщество быстро собрало OpenClaude, но за обещанием бесплатного AI-кодинга скрываются ограничения совм

2026-04-28·3 мин
LLM
LLM·Habr AI

Как одна системная инструкция превращает LLM в надёжный инструмент: тесты на Qwen и DeepSeek

Один системный промпт способен убрать галлюцинации у LLM: эксперимент с Qwen и DeepSeek показал, что «экзоскелет» из правил превращает модел

2026-04-28·2 мин
LLM
LLM·Habr AI

Группа Т-Технологии об open source в AI/ML: как устроена работа с LLM внутри

Интервью с AI/ML-командой Группы Т-Технологии — о разработке LLM, участии в open source и исследовательском направлении.

2026-04-28·1 мин
LLM
LLM·Habr AI

NVIDIA на GTC 2026 сместила фокус с чипов на фабрики токенов и эру Agent-as-a-Service

На GTC 2026 NVIDIA показала, что делает ставку не на отдельные GPU, а на фабрики токенов, модульную архитектуру Vera Rubin и экономику AI-аг

2026-04-28·3 мин
LLM
LLM·Habr AI

PageIndex от VectifyAI предлагает поиск без эмбеддингов для длинных документов

PageIndex строит древовидное оглавление документа и ищет релевантные разделы через рассуждение LLM, обещая RAG без эмбеддингов, но с заметно

2026-04-28·2 мин
LLM
LLM·Habr AI

GolangConf 2026 и Онтико: почему Go-командам пора лечить архитектуру, а не скорость кода

Онтико перестраивает GolangConf 2026 вокруг реальных болей Go-команд: AI ускорил написание кода, но архитектурные решения, масштабирование и

2026-04-28·3 мин
LLM
LLM·Habr AI

ruGPT3XL получил контекст 8k: восстановленная модель почти без потерь вышла за предел 2k

Автор восстановления ruGPT3XL исправил sparse attention, поднял контекст модели с 2k до 8k и сохранил качество на коротких последовательност

2026-04-28·2 мин
LLM
LLM·Habr AI

OpenAI, MiniMax и Nvidia задали тон марту в ИИ: Sora, GPT-5.4 и ставка на Миру Мурати

Март в ИИ прошёл под знаком продуктовых разворотов: OpenAI меняют судьбу Sora, Google и Anthropic ускоряют ассистентов, а MiniMax и Nvidia н

2026-04-28·2 мин
LLM
LLM·Habr AI

AI-first стартапы: почему growth-маркетинг буксует и что ломается в воронке

У AI-first продуктов сильные метрики на входе часто скрывают ложный спрос: люди приходят за новизной, а не за решением задачи, поэтому привы

2026-04-28·2 мин
LLM
LLM·Habr AI

Habr: ai-агенты меняют delivery, и командам приходится пересобирать весь цикл разработки

На Habr объяснили, почему с появлением ai-агентов команды должны перестраивать не только написание кода, но и весь delivery: контекст, прове

2026-04-28·3 мин
LLM
LLM·Habr AI

М2 передала нейросети 40% маркетинговых текстов и не потеряла качество контента

Команда М2 встроила AI-копирайтера во внутреннюю редакцию, перевела на него 40% продуктовых и маркетинговых текстов и сохранила единый тон,

2026-04-28·2 мин
LLM
LLM·Habr AI

Sova AI выпустила Android-ассистента, который управляет телефоном без ПК и root

Sova AI представила Android-приложение с ИИ-агентом, который открывает приложения, нажимает кнопки, скроллит экраны и выполняет голосовые ко

2026-04-28·2 мин
LLM
LLM·Habr AI

OpenAI API и fan-out запросы GPT: как SEO-специалистам анализировать AI-поиск

Автор показывает, как через OpenAI API получать скрытые fan-out запросы GPT и использовать их для анализа того, как AI-модели собирают источ

2026-04-28·2 мин
LLM
LLM·Habr AI

Hack The Box: как MCP Inspector превращает AI-инструменты в новую точку атаки

Разбор Kobold из HTB Season 10 показывает, как одна dev-утилита для AI-серверов может привести к RCE, LFI, повторному использованию учётных

2026-04-28·2 мин
LLM
LLM·Habr AI

Система на базе LLM сократила подготовку карт контроля на заводе с 2 часов до 5 минут

На металлургическом заводе LLM-система начала собирать карты контроля за 3–5 минут вместо двух часов: сработал не универсальный промт, а наб

2026-04-28·3 мин
LLM
LLM·Habr AI

Habr AI показал, как добавить память и контекст в LLM-чат на Python с Ollama и LiteLLM

В новой части туториала по Python-чату с Ollama и LiteLLM показано, как хранить историю сообщений, передавать контекст модели и ограничивать

2026-04-28·3 мин
LLM
LLM·Habr AI

Claude Sonnet и Jarvis Pattern: почему ИИ-агентам может хватить операционной системы

На Habr предложили строить персональных AI-агентов не вокруг сложных фреймворков, а на связке LLM, операционной системы и файловой памяти —

2026-04-28·2 мин
LLM
LLM·Habr AI

Яндекс показал, как бизнесу попасть в ответы Алисы и измерять видимость в поиске

Яндекс запустил в Вебмастере раздел «Видимость сайта в Алисе», и для бизнеса это сигнал: в ответы ассистента ведут не трюки, а сильная поиск

2026-04-28·2 мин
LLM
LLM·Habr AI

Флант: как Go-разработчик превратил Zed и Gemini в полезного ИИ-агента

Go-разработчик из «Фланта» описал путь от медленных IDE-плагинов к связке Zed, Gemini 3 Flash и gopls-mcp, которая даёт ИИ-агенту контекст п

2026-04-28·3 мин
LLM
LLM·Habr AI

Agentis Memory: Redis-совместимое хранилище с векторным поиском и локальными эмбеддингами

Agentis Memory превращает Redis-совместимое хранилище в общую память для AI-агентов: с локальными эмбеддингами, встроенным векторным поиском

2026-04-28·3 мин
LLM
LLM·Habr AI

Habr: как synthetic data помогает обучать модели и почему self-training ведет к collapse

Синтетические данные помогают ИИ компенсировать дефицит качественного человеческого корпуса, но при бесконтрольном self-training модели начи

2026-04-28·2 мин
LLM
LLM·Habr AI

Почему ChatGPT и Gemini не рекомендуют ваш B2B SaaS, даже если сайт сделан нормально

Даже хороший B2B SaaS-сайт может не попасть в ответы ChatGPT, Gemini и Perplexity, если у бренда нет чёткой категории, внешних подтверждений

2026-04-28·2 мин
LLM
LLM·Habr AI

Почему ИИ в UI-дизайне важен не для продакшена, а как источник визуальных мутаций

AI-generated UI ценен не только скоростью набросков: его сила в редких визуальных сочетаниях, которые помогают дизайнерам находить новые ход

2026-04-28·2 мин
LLM
LLM·Habr AI

Qwen и llama.cpp: как запустить локальную нейросеть без облака на компьютере или сервере

Практический материал объясняет, как запустить модель Qwen через llama.cpp на своём компьютере или сервере, чтобы работать с локальной нейро

2026-04-28·2 мин
LLM
LLM·Habr AI

Anthropic и Claude Cowork: 10 рабочих задач, которые ИИ снимает с человека

Claude Cowork от Anthropic показывает, как ИИ берёт на себя утренние брифинги, КП, ответы клиентам и отчёты, возвращая до двух-трёх рабочих

2026-04-28·2 мин
LLM
LLM·Habr AI

Directum: почему бизнес активно обсуждает ИИ-агентов, но не спешит внедрять их в процессы

Directum объясняет, почему ИИ-агенты стали главным корпоративным трендом, но массовое внедрение тормозят дорогая инфраструктура, риски ошибо

2026-04-28·2 мин
LLM
LLM·Habr AI

ClawRouter снизил расходы на LLM API с $47 до $1.80 за неделю — обзор умного роутера

Роутер ClawRouter анализирует каждый промпт по 15 параметрам и направляет к наиболее дешёвой подходящей модели — это снизило недельные расхо

2026-04-28·2 мин