MarkTechPost

Alibaba выпустила Qwen 3.5 Small — компактные модели для работы прямо на устройствах
Новая серия моделей Alibaba от 0.8 до 9 миллиардов параметров бросает вызов гонке за размером. Философия «больше интеллекта, меньше вычислен

SHAP-IQ: новый стандарт объяснимого ИИ выходит на практический уровень
Библиотека SHAP-IQ позволяет не просто оценить важность признаков модели, но и понять, как они взаимодействуют друг с другом. Разбираемся, п

Google представила STATIC: ускорение генеративного поиска в 948 раз
Google AI разработала фреймворк на основе разреженных матриц, который ускоряет декодирование в генеративных рекомендательных системах почти

Alibaba открыла CoPaw — рабочую станцию для масштабирования AI-агентов
Команда Alibaba выпустила open-source фреймворк CoPaw, который превращает локальную машину разработчика в полноценную среду для запуска авто

Unified Latents: Google DeepMind нашла способ улучшить генерацию ИИ
Новый фреймворк Unified Latents от Google DeepMind решает дилемму между качеством сжатия данных и точностью работы нейросетей.

Sakana AI научилась мгновенно адаптировать языковые модели без дообучения
Токийская лаборатория Sakana AI представила два метода — Doc-to-LoRA и Text-to-LoRA — которые позволяют адаптировать большие языковые модели

Perplexity выпустила pplx-embed: модели эмбеддингов, которые меняют правила поиска
Perplexity представила семейство мультиязычных моделей эмбеддингов pplx-embed на базе Qwen3 с двунаправленным вниманием — и заявляет о новом

Liquid AI бросает вызов гонке размеров: гибридная архитектура LFM2 меняет правила игры
Стартап Liquid AI представил модель на 24 миллиарда параметров, которая сочетает механизм внимания с свёртками. Цель — решить проблемы масшт

Composio открывает код Agent Orchestrator — инструмента для мультиагентных систем за пределами ReAct
Стартап Composio выпустил в открытый доступ оркестратор агентов, который решает главную проблему продакшн-AI: хрупкость простых ReAct-циклов

WebSocket-режим OpenAI меняет правила игры для голосового AI
OpenAI представила WebSocket-режим для Realtime API, который устраняет главного врага голосовых AI-агентов — задержку. Три отдельных этапа о

Taalas бросает вызов GPU: жёсткая логика вместо гибкости ради 17 000 токенов в секунду
Канадский стартап Taalas делает ставку на то, что индустрия AI-чипов считала ересью — замену программируемых GPU на специализированные микро

TruLens: как перестать доверять LLM вслепую и начать измерять качество
Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг

Google предлагает думать глубже, а не дольше — и вдвое снижает затраты на инференс
Исследователи из Google и Университета Вирджинии доказали: длинная цепочка рассуждений не означает качественную. Новая метрика Deep-Thinking

Google DeepMind представила Lyria 3 для создания музыки по фото
Новая модель Lyria 3 от Google DeepMind совершает прорыв в генерации аудио. Теперь ИИ способен создавать полноценные треки с вокалом и текст

Tavus представила Phoenix-4: видеоаватары с живыми эмоциями и мгновенным откликом
Новая модель Phoenix-4 преодолевает эффект «зловещей долины», добавляя цифровым аватарам эмоциональный интеллект и сокращая задержку генерац

Anthropic представила Claude 4.6 Sonnet с контекстом в миллион токенов
Anthropic вступает в эпоху рассуждающих моделей. Claude 4.6 Sonnet получил контекстное окно в 1 млн токенов и инновационную систему верифика

Google DeepMind представила фреймворк для интеллектуального делегирования задач между ИИ-агентами
Исследователи разработали систему для создания безопасного «агентного веба», где автономные программы смогут эффективно взаимодействовать и

Google представила WebMCP: новый стандарт взаимодействия ИИ-агентов с вебом
Google представила протокол WebMCP, который позволит ИИ-агентам взаимодействовать с сайтами напрямую через структуру кода, минуя медленный и

Архитектура памяти: как научить ИИ-агентов помнить важное и мыслить логично
Разбор новой концепции памяти для нейросетей: переход от простого хранения истории диалогов к структурированным базам знаний для глубокого а

Гайд по созданию пайплайна синтетических данных с CTGAN и SDV
Узнайте, как построить надежную систему генерации табличных данных, обеспечивающую высокую точность и сохранение всех статистических законом

Как обучить ИИ человеческим предпочтениям: гайд по DPO и QLoRA
Новый туториал показывает, как эффективно настраивать языковые модели под человеческие предпочтения без использования тяжеловесных моделей в

Google Gemini 3 Deep Think: новый рекорд в тестах на общий интеллект
Google представила Gemini 3 Deep Think. Модель показала результат в 84,6% в тесте ARC-AGI-2, приближая индустрию к созданию сильного ИИ чере

OpenAI представила GPT-5.3-Codex-Spark: революция скорости в разработке ПО
OpenAI выпустила сверхбыструю модель для кодинга. Благодаря чипам Cerebras она выдает 1000 токенов в секунду, что в 15 раз быстрее стандартн

Как обучить эмбеддинги Matryoshka для сверхбыстрого поиска данных
Узнайте, как технология Matryoshka Representation Learning позволяет сократить размер векторов до 64 измерений без существенной потери точно

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей
Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, реша

Как упростить разработку нейросетей: руководство по использованию Einops для тензорных вычислений
Библиотека Einops становится стандартом для работы с тензорами в глубоком обучении. Разбираемся, как сделать код чище и избежать ошибок в ар

Google представила NAI: адаптивные интерфейсы на базе Gemini для инклюзивного дизайна
Google Research предлагает пересмотреть подход к доступности ПО. Фреймворк NAI использует ИИ-агентов Gemini для мгновенной адаптации интерфе

Microsoft представила OrbitalBrain: распределенное обучение ИИ прямо в космосе
Исследователи Microsoft предложили архитектуру OrbitalBrain для обучения нейросетей на спутниковых группировках, решая проблему медленной пе

OAT: как токенизация действий приближает роботов к возможностям LLM
Новый метод OAT позволяет роботам эффективнее планировать действия, используя подходы, аналогичные большим языковым моделям. Это открывает д

MLflow для LLM: версионирование промптов и регрессионное тестирование
Как обеспечить стабильность больших языковых моделей? MLflow предлагает решение для версионирования промптов и автоматического регрессионног