MarkTechPost

Стэнфорд представил OpenJarvis — стек локальных AI-агентов с памятью и обучением
Стэнфорд представил OpenJarvis — платформу для персональных AI-агентов, которые работают прямо на устройстве, используют память и инструмент

Гарри Тан выпустил gstack — workflow-систему для Claude Code с QA, ревью и релизом
Гарри Тан выложил в open source gstack — набор режимов для Claude Code, который разводит планирование, ревью, QA и релиз по отдельным команд

Zhipu AI выпустила GLM-OCR — компактную OCR-модель на 0,9 млрд параметров для документов
Zhipu AI и Университет Цинхуа представили GLM-OCR — мультимодальную OCR-модель на 0,9 млрд параметров, которая разбирает сложные документы,

LangChain выпустила Deep Agents для многошаговых ИИ-агентов с памятью и изоляцией
LangChain выпустила Deep Agents — библиотеку для ИИ-агентов, которым нужны планирование, долговременная память, файловый контекст и изоляция

IBM выпустила Granite 4.0 1B Speech — компактную мультиязычную модель речи для edge-ИИ
IBM представила Granite 4.0 1B Speech — лёгкую модель для распознавания и перевода речи, рассчитанную на быстрый запуск в корпоративных и ed

Moonshot AI представила Attention Residuals — альтернативу остаточным связям в трансформерах
Moonshot AI предложила Attention Residuals — замену стандартным residual connections в трансформерах, где слой сам выбирает полезные сигналы

Mistral выпустила Small 4 — 119-миллиардную MoE-модель для reasoning, кода и мультимодальности
Новая Mistral Small 4 объединяет instruct, reasoning, код и работу с изображениями в одной open-source MoE-модели на 119 млрд параметров с к

Google выпустила WAXAL — открытый речевой датасет для африканских языков
Google открыла WAXAL — большой речевой корпус для африканских языков, который должен ускорить распознавание и синтез речи там, где открытых

Nvidia открыла код OpenShell — защищённой среды для автономных ИИ-агентов
Nvidia выпустила OpenShell в open source: это среда с песочницами, политиками доступа и приватной маршрутизацией, чтобы автономные ИИ-агенты

Baidu выпустила Qianfan-OCR — 4B-модель для распознавания и понимания документов
Baidu представила Qianfan-OCR — единую 4B-модель, которая сразу разбирает структуру документа, распознаёт текст и по запросу извлекает табли

MarkTechPost показал, как собрать LLM-систему с самооценкой, уверенностью и веб-поиском
MarkTechPost показал практическую схему uncertainty-aware LLM: модель сначала отвечает и оценивает уверенность, затем перепроверяет себя и п

GitAgent предлагает единый формат AI-агентов для LangChain, AutoGen и Claude Code
GitAgent предлагает хранить логику, память и правила AI-агента в Git-репозитории, а затем экспортировать одного и того же агента в LangChain

Google выпустила colab-mcp: как агенты автоматизируют ноутбуки Colab в продакшене
Google показала open-source сервер colab-mcp для управления ноутбуками Colab через MCP: агент может добавлять ячейки, запускать код и собира

Ян Лекун представил LeWorldModel — JEPA-модель без коллапса представлений из пикселей
Команда Яна Лекуна показала LeWorldModel — world model, которая обучается прямо на пикселях с двумя функциями потерь, избегает коллапса пред

HKUDS подробно показала OpenSpace — движок самоэволюции навыков для AI-агентов
HKUDS показала, как OpenSpace превращает AI-агентов в самообучающиеся системы: движок сохраняет навыки после каждой задачи, переиспользует и

Nvidia представила PivotRL — фреймворк для ИИ-агентов с 4-кратной экономией rollout-шагов
Nvidia показала PivotRL — подход к дообучению ИИ-агентов, который сохраняет качество вне обучающего домена и достигает сопоставимой точности

Google представила TurboQuant: 6-кратное сжатие KV-кэша LLM без потери точности
Google Research показала TurboQuant — алгоритм, который сжимает KV-кэш больших языковых моделей минимум в шесть раз и ускоряет attention до

MolmoWeb-4B от Ai2: веб-агент, который видит сайты как человек, без HTML-парсинга
Ai2 выпустила MolmoWeb-4B — открытого мультимодального веб-агента, который управляет браузером только по скриншотам, без доступа к HTML или

Tencent открыла Covo-Audio — 7B-модель для голосовых диалогов и аудио-рассуждений
Tencent AI Lab выложила в open source Covo-Audio — 7B аудиомодель, которая принимает непрерывную речь, отвечает голосом и нацелена на диалог

Qwen3.5: запуск reasoning-моделей в gguf и 4-битном формате через Colab
Показан Colab-пайплайн для запуска reasoning-моделей Qwen3.5, дистиллированных в стиле Claude: одной настройкой можно переключаться между 27

Google выпустила Gemini 3.1 Flash Live для голосовых AI-агентов и мультимодального диалога
Google открыла preview-доступ к Gemini 3.1 Flash Live — модели для голосовых и визуальных AI-агентов с низкой задержкой, поддержкой инструме

IWE и OpenAI: как превратить markdown-заметки в граф знаний для ИИ-агентов
На примере IWE показали, как собрать локальный граф знаний из markdown, подключить OpenAI function calling и построить agentic RAG с обходом

Google объяснила разницу между Google-Agent и Googlebot для AI-доступа и индексации
Google описала, чем новый Google-Agent отличается от Googlebot: первый выполняет действия на сайте по запросу пользователя, второй автоматич

Связанные с Amazon исследователи представили A-Evolve для автоматической эволюции AI-агентов
Исследователи, связанные с Amazon, представили A-Evolve — систему, которая автоматизирует разработку AI-агентов и заменяет ручную настройку

Agent-Infra представила AIO Sandbox — единую среду для AI-агентов с браузером и shell
Agent-Infra выпустила open-source AIO Sandbox — контейнерную среду, где браузер, shell, общий файловый слой и MCP собраны в одном рантайме д

Cursor выпустила TypeScript SDK для coding-агентов с облачными песочницами и оплатой по токенам
Cursor открыла публичную бету TypeScript SDK: теперь разработчики могут запускать coding-агентов локально, в облаке и на своих воркерах — с

Alibaba выпустила Qwen3.5-Omni — нативную мультимодальную модель для текста, аудио и видео
Alibaba представила Qwen3.5-Omni — нативную омнимодальную модель, которая понимает текст, изображения, аудио и видео в одной архитектуре и у

OpenAI выпустила Privacy Filter: открытая модель для удаления персональных данных
OpenAI опубликовала Privacy Filter — open-source модель для автоматического обнаружения и замены персональных данных, работающая прямо в бра

OpenAI и Promptflow: как собрать LLM-пайплайн с трассировкой и оценкой качества
В гайде показано, как собрать в Google Colab LLM-пайплайн на Promptflow, Prompty и OpenAI с безопасной настройкой ключей, трассировкой запус

Meta FAIR выпустила NeuralSet — Python-пакет для связи нейроданных и ИИ-моделей
Meta FAIR открыла NeuralSet — Python-фреймворк, который объединяет fMRI, M/EEG, спайки и эмбеддинги Hugging Face в один PyTorch-конвейер для