Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Google представила Auto-Diagnose — ИИ-систему для поиска причин сбоев интеграционных тестов

Google представила Auto-Diagnose — систему на базе Gemini 2.5 Flash, которая сама разбирает логи упавших интеграционных тестов и с точностью

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI GPT-OSS: запуск open-weight моделей в Colab с MXFP4 и продвинутым инференсом

Новый гайд объясняет, как поднять openai/gpt-oss-20b в Google Colab: установить зависимости для Transformers, проверить GPU, включить MXFP4-

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Anthropic выпустила Claude Opus 4.7 для агентного программирования, зрения и автономных задач

Anthropic представила Claude Opus 4.7 — обновление флагманской модели с заметным приростом в агентном кодинге, анализе детализированных изоб

2026-04-27·3 мин
LLM
LLM·MarkTechPost

PrismML Bonsai: как запустить 1-битную модель на CUDA с GGUF, JSON и RAG

В новом туториале по PrismML Bonsai разобрали, как запустить Bonsai-1.7B на GPU через CUDA и GGUF, измерить скорость, настроить чат, строгий

2026-04-27·2 мин
LLM
LLM·MarkTechPost

xAI запустила отдельные Grok API для распознавания и синтеза речи для корпоративных разработчиков

xAI вынесла голосовой стек Grok в отдельные API: Speech-to-Text и Text-to-Speech для бизнеса с агрессивными ценами, мультиязычностью и ставк

2026-04-27·3 мин
LLM
LLM·MarkTechPost

NVIDIA выпустила Ising — первое открытое семейство ИИ-моделей для квантово-классических систем

NVIDIA представила Ising — открытое семейство ИИ-моделей для калибровки квантовых процессоров и коррекции ошибок, чтобы приблизить полезные

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Почему LoRA ломается в продакшене и как RS-LoRA спасает дообучение моделей

LoRA отлично справляется со стилем и форматом, но при дообучении новым фактам теряет сигнал; RS-LoRA решает проблему, меняя формулу масштаби

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenKB и OpenRouter показали, как собрать локальную ИИ-базу знаний с поиском на Llama

Новый туториал объясняет, как развернуть локальную базу знаний на OpenKB, подключить открытую модель через OpenRouter и безопасно настроить

2026-04-27·2 мин
LLM
LLM·MarkTechPost

OpenAI и Magika показали, как собрать пайплайн для распознавания файлов и анализа угроз

В гайде показан практический пайплайн, где Magika определяет реальный тип файла по байтам, а OpenAI помогает интерпретировать результат и вы

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Meta представила Sapiens2 — единую модель компьютерного зрения для позы, сегментации и 3D

Meta Reality Labs выпустила Sapiens2 — семейство vision-моделей для анализа человека, которое из одной архитектуры решает позу, сегментацию,

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenMOSS выпустила MOSS-Audio — открытую аудиомодель, опережающую более крупные аналоги

OpenMOSS представила MOSS-Audio — открытую модель, которая в одной архитектуре понимает речь, музыку и звуки среды, а на общих аудиобенчмарк

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Эмбеддинги OpenAI и RL: как собрать агента с долговременной памятью для точных ответов

В туториале показывают, как обучить RL-агента выбирать релевантные записи из долговременной памяти, чтобы LLM точнее отвечала на вопросы по

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Как измерить реальный интеллект: главные бенчмарки для ИИ-агентов

Классические тесты больше не отражают реальные способности нейросетей. Разбираемся, какие бенчмарки действительно показывают, готов ли ИИ-аг

2026-04-26·2 мин
LLM
LLM·MarkTechPost

Эластичная память для ИИ: как kvcached решает дефицит GPU

Динамическое распределение KV-кэша обещает радикально снизить стоимость хостинга языковых моделей, позволяя эффективно делить память одной в

2026-04-26·3 мин
LLM
LLM·MarkTechPost

Голосовая модель xAI обошла GPT Realtime в бизнес-задачах

Компания Илона Маска xAI представила grok-voice-think-fast-1.0. Новая модель превзошла решения от OpenAI и Google в управлении сложными рабо

2026-04-26·2 мин
LLM
LLM·MarkTechPost

GitNexus: Как новый инструмент научил ИИ-агентов структурному пониманию кода

ИИ-помощники отлично пишут локальный код, но часто не понимают глобальную архитектуру проектов. Open-source проект GitNexus решает эту пробл

2026-04-26·3 мин
LLM
LLM·MarkTechPost

DeepSeek-V4: Как новые алгоритмы сжатия сделали контекст в миллион токенов реальностью

DeepSeek представила четвертое поколение своих моделей. Благодаря радикальному сжатию внимания обработка гигантских объемов данных становитс

2026-04-26·3 мин
LLM
LLM·MarkTechPost

Архитектура Decoupled DiLoCo от DeepMind решает проблему масштабирования ИИ

Обучение передовых ИИ-моделей всегда было заложником аппаратных сбоев: поломка одного чипа останавливала весь кластер. Новая архитектура от

2026-04-26·2 мин
LLM
LLM·MarkTechPost

OpenMythos: open-source реконструкция архитектуры Claude Mythos на PyTorch с 770M параметров

Разработчик Kye Gomez воссоздал предполагаемую архитектуру Claude Mythos от Anthropic с нуля — без утечек, только на основе публичных исслед

2026-04-23·2 мин
LLM
LLM·MarkTechPost

OpenAI масштабирует GPT-5.4-Cyber для верифицированных специалистов по кибербезопасности

OpenAI открывает массовый доступ к GPT-5.4-Cyber — донастроенной версии GPT-5.4 без стандартных ограничений для тысяч верифицированных защит

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Moonshot AI выпустила Kimi K2.6: агентная модель с роем из 300 субагентов

Китайская лаборатория Moonshot AI открыла исходники Kimi K2.6 — мультимодальной агентной модели, координирующей до 300 субагентов и 4000 шаг

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Phi-4-Mini от Microsoft: реализация квантизации, RAG и LoRA в одном Jupyter-ноутбуке

Туториал показывает полный пайплайн на Phi-4-mini-instruct: 4-битная квантизация, потоковая генерация, рассуждение, вызов инструментов, RAG

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Qwen 3.6-35B-A3B на практике: мультимодальность, MoE и RAG в одном пайплайне

Подробный разбор реализации Qwen 3.6-35B-A3B: от загрузки модели до RAG, tool calling и сохранения сессий в рабочих сценариях.

2026-04-22·1 мин
LLM
LLM·MarkTechPost

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров

Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

2026-03-11·2 мин
LLM
LLM·MarkTechPost

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ

Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Google запустила Android Bench для оценки ИИ в мобильной разработке

Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

2026-03-07·2 мин
LLM
LLM·MarkTechPost

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде

OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве

Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

2026-03-06·3 мин
LLM
LLM·MarkTechPost

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности

Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

2026-03-05·3 мин
LLM
LLM·MarkTechPost

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов

Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и

2026-03-03·3 мин