#LLM
Подборка материалов по теме «LLM»: релизы, исследования, бенчмарки, опенсорс.

Composio открывает код Agent Orchestrator — инструмента для мультиагентных систем за пределами ReAct
Стартап Composio выпустил в открытый доступ оркестратор агентов, который решает главную проблему продакшн-AI: хрупкость простых ReAct-циклов

Guide Labs выпустила открытую языковую модель, которую можно понять изнутри
Стартап Guide Labs представил Steerling-8B — языковую модель с 8 миллиардами параметров, построенную на новой архитектуре. Главная идея: каж

DeepSeek обучила новую модель на запрещённых ускорителях Nvidia Blackwell
Китайская DeepSeek, по данным американских источников, использовала для обучения своей новейшей ИИ-модели санкционные ускорители Nvidia Blac

WebSocket-режим OpenAI меняет правила игры для голосового AI

Claude Code удивил даже CEO Anthropic своей популярностью

OpenAI отказалась от главного бенчмарка для оценки кода — и это меняет правила игры

Kotlin Multiplatform и AI-агенты: четыре платформы, один нервный срыв

Anthropic обвинила DeepSeek и MiniMax в краже знаний своих моделей
Anthropic заявила, что три китайских AI-компании, включая DeepSeek и MiniMax, незаконно извлекали результаты из её моделей для усиления собс

Spotify расширяет AI-плейлисты на новые рынки: что это значит
Spotify продолжает экспансию функции Prompted Playlists — AI-генерация плейлистов по текстовому запросу теперь доступна Premium-подписчикам

Hugging Face и AWS строят медицинского ИИ-агента на открытом коде

OpenAI запускает Frontier Alliance Partners для масштабирования AI-агентов в бизнесе

Революция MCP и поиск устойчивых сценариев корпоративного AI

Ядерные LLM, китайские бенчмарки и политика измерений: главное из Import AI 446

Grindr тестирует ИИ-подбор партнёров на фоне усталости от дейтинг-приложений
Крупнейшее приложение для знакомств геев и бисексуальных мужчин запускает в Австралии подписку с ИИ-мэтчмейкингом стоимостью до 350 долларов

TruLens: как перестать доверять LLM вслепую и начать измерять качество
Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг









