MarkTechPost

Google представила Auto-Diagnose — ИИ-систему для поиска причин сбоев интеграционных тестов
Google представила Auto-Diagnose — систему на базе Gemini 2.5 Flash, которая сама разбирает логи упавших интеграционных тестов и с точностью

OpenAI GPT-OSS: запуск open-weight моделей в Colab с MXFP4 и продвинутым инференсом
Новый гайд объясняет, как поднять openai/gpt-oss-20b в Google Colab: установить зависимости для Transformers, проверить GPU, включить MXFP4-

Anthropic выпустила Claude Opus 4.7 для агентного программирования, зрения и автономных задач
Anthropic представила Claude Opus 4.7 — обновление флагманской модели с заметным приростом в агентном кодинге, анализе детализированных изоб

PrismML Bonsai: как запустить 1-битную модель на CUDA с GGUF, JSON и RAG
В новом туториале по PrismML Bonsai разобрали, как запустить Bonsai-1.7B на GPU через CUDA и GGUF, измерить скорость, настроить чат, строгий

xAI запустила отдельные Grok API для распознавания и синтеза речи для корпоративных разработчиков
xAI вынесла голосовой стек Grok в отдельные API: Speech-to-Text и Text-to-Speech для бизнеса с агрессивными ценами, мультиязычностью и ставк

NVIDIA выпустила Ising — первое открытое семейство ИИ-моделей для квантово-классических систем
NVIDIA представила Ising — открытое семейство ИИ-моделей для калибровки квантовых процессоров и коррекции ошибок, чтобы приблизить полезные

Почему LoRA ломается в продакшене и как RS-LoRA спасает дообучение моделей
LoRA отлично справляется со стилем и форматом, но при дообучении новым фактам теряет сигнал; RS-LoRA решает проблему, меняя формулу масштаби

OpenKB и OpenRouter показали, как собрать локальную ИИ-базу знаний с поиском на Llama
Новый туториал объясняет, как развернуть локальную базу знаний на OpenKB, подключить открытую модель через OpenRouter и безопасно настроить

OpenAI и Magika показали, как собрать пайплайн для распознавания файлов и анализа угроз
В гайде показан практический пайплайн, где Magika определяет реальный тип файла по байтам, а OpenAI помогает интерпретировать результат и вы

Meta представила Sapiens2 — единую модель компьютерного зрения для позы, сегментации и 3D
Meta Reality Labs выпустила Sapiens2 — семейство vision-моделей для анализа человека, которое из одной архитектуры решает позу, сегментацию,

OpenMOSS выпустила MOSS-Audio — открытую аудиомодель, опережающую более крупные аналоги
OpenMOSS представила MOSS-Audio — открытую модель, которая в одной архитектуре понимает речь, музыку и звуки среды, а на общих аудиобенчмарк

Эмбеддинги OpenAI и RL: как собрать агента с долговременной памятью для точных ответов
В туториале показывают, как обучить RL-агента выбирать релевантные записи из долговременной памяти, чтобы LLM точнее отвечала на вопросы по

Как измерить реальный интеллект: главные бенчмарки для ИИ-агентов
Классические тесты больше не отражают реальные способности нейросетей. Разбираемся, какие бенчмарки действительно показывают, готов ли ИИ-аг

Эластичная память для ИИ: как kvcached решает дефицит GPU
Динамическое распределение KV-кэша обещает радикально снизить стоимость хостинга языковых моделей, позволяя эффективно делить память одной в

Голосовая модель xAI обошла GPT Realtime в бизнес-задачах
Компания Илона Маска xAI представила grok-voice-think-fast-1.0. Новая модель превзошла решения от OpenAI и Google в управлении сложными рабо

GitNexus: Как новый инструмент научил ИИ-агентов структурному пониманию кода
ИИ-помощники отлично пишут локальный код, но часто не понимают глобальную архитектуру проектов. Open-source проект GitNexus решает эту пробл

DeepSeek-V4: Как новые алгоритмы сжатия сделали контекст в миллион токенов реальностью
DeepSeek представила четвертое поколение своих моделей. Благодаря радикальному сжатию внимания обработка гигантских объемов данных становитс

Архитектура Decoupled DiLoCo от DeepMind решает проблему масштабирования ИИ
Обучение передовых ИИ-моделей всегда было заложником аппаратных сбоев: поломка одного чипа останавливала весь кластер. Новая архитектура от

OpenMythos: open-source реконструкция архитектуры Claude Mythos на PyTorch с 770M параметров
Разработчик Kye Gomez воссоздал предполагаемую архитектуру Claude Mythos от Anthropic с нуля — без утечек, только на основе публичных исслед

OpenAI масштабирует GPT-5.4-Cyber для верифицированных специалистов по кибербезопасности
OpenAI открывает массовый доступ к GPT-5.4-Cyber — донастроенной версии GPT-5.4 без стандартных ограничений для тысяч верифицированных защит

Moonshot AI выпустила Kimi K2.6: агентная модель с роем из 300 субагентов
Китайская лаборатория Moonshot AI открыла исходники Kimi K2.6 — мультимодальной агентной модели, координирующей до 300 субагентов и 4000 шаг

Phi-4-Mini от Microsoft: реализация квантизации, RAG и LoRA в одном Jupyter-ноутбуке
Туториал показывает полный пайплайн на Phi-4-mini-instruct: 4-битная квантизация, потоковая генерация, рассуждение, вызов инструментов, RAG

Qwen 3.6-35B-A3B на практике: мультимодальность, MoE и RAG в одном пайплайне
Подробный разбор реализации Qwen 3.6-35B-A3B: от загрузки модели до RAG, tool calling и сохранения сессий в рабочих сценариях.

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ
Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде
OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве
Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности
Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов
Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и