Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Команда Qwen выпустила FlashQLA: ускорение линейного внимания до 3× на NVIDIA Hopper

QwenLM выпустила FlashQLA — библиотеку CUDA-ядер для Gated Delta Network, которая даёт до 3× прироста производительности на GPU NVIDIA Hoppe

2026-04-30·2 мин
LLM
LLM·MarkTechPost

OpenAI Privacy Filter: как собрать production-пайплайн для поиска и маскировки PII

В гайде с OpenAI Privacy Filter разбирается полный конвейер для поиска и маскировки персональных данных — от загрузки модели до автоматическ

2026-04-30·3 мин
LLM
LLM·MarkTechPost

DeepSeek, Google и Meta: 10 техник сжатия KV-кэша LLM для снижения памяти на инференсе

KV-кэш стал пожирателем GPU-памяти в больших LLM, и новый обзор показывает 10 подходов — от H2O и SnapKV до TurboQuant и MLA DeepSeek — кото

2026-04-30·3 мин
LLM
LLM·MarkTechPost

Poolside выпустила Laguna XS.2 и M.1 — открытые модели для агентного программирования

Poolside показала две модели Laguna для агентного кодинга: открытая XS.2 запускается локально, а более мощная M.1 рассчитана на длинные зада

2026-04-29·3 мин
LLM
LLM·MarkTechPost

LlamaIndex ParseBench: как тестировать парсинг документов через Python и Hugging Face

Практический разбор показывает, как на датасете LlamaIndex ParseBench собрать пайплайн оценки парсеров документов: загрузить PDF из Hugging

2026-04-29·3 мин
LLM
LLM·MarkTechPost

smol-audio от Deep-unlearning: набор Colab-ноутбуков для дообучения аудио-моделей

Deep-unlearning выпустила smol-audio — коллекцию Colab-совместимых ноутбуков, где можно дообучать Whisper, Parakeet, Voxtral, Granite Speech

2026-04-29·3 мин
LLM
LLM·MarkTechPost

Топ-10 физических AI-моделей, которые управляют реальными роботами в 2026 году

За 18 месяцев разрыв между LLM и реальной робототехникой резко сократился: физические AI-модели уже работают на заводах, складах и в исследо

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Hugging Face и Gemma 3 1B: как собрать готовый к продакшену пайплайн генерации в Colab

Разбор показывает, как запустить Gemma 3 1B Instruct в Colab через Hugging Face Transformers: с безопасной авторизацией, chat templates и во

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.ai выпустила GLM-5V-Turbo — нативную мультимодальную модель для визуального программирования

Китайская лаборатория Z.ai выпустила GLM-5V-Turbo — модель, которая видит архитектурные схемы и скриншоты и сразу генерирует по ним рабочий

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен

Google и NVIDIA продвигают локальный запуск Gemma 4 на RTX, Jetson и DGX Spark, чтобы всегда активные AI-агенты вроде OpenClaw работали быст

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Talkie-1930: исследователи выпустили 13B-модель без знаний об интернете и Второй мировой

Talkie-1930 — открытая 13B-модель, обученная только на англоязычных текстах до 1931 года, чтобы изучать историческое мышление, утечки данных

2026-04-28·3 мин
LLM
LLM·MarkTechPost

MarkTechPost показал, как собрать лёгкого VLA-агента с латентной моделью мира и MPC

В новом туториале MarkTechPost разбирает, как построить упрощённого embodied-агента: он работает по RGB-кадрам, учит латентную модель мира и

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Arcee AI выпустила Trinity Large Thinking — открытую модель рассуждения для ИИ-агентов

Arcee AI открыла веса Trinity Large Thinking по лицензии Apache 2.0 и сделала ставку на длинные агентные сценарии, многошаговое рассуждение

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NVIDIA показала полный пайплайн оптимизации модели с FastNAS pruning и fine-tuning

NVIDIA выпустила практический гайд по Model Optimizer: в одном Colab-ноутбуке показаны обучение ResNet20, FastNAS pruning под лимит FLOPs и

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TII выпустила Falcon Perception — 0,6B-модель для сегментации и поиска объектов по тексту

TII открыла Falcon Perception — компактную 0,6-миллиардную vision-language-модель, которая ищет и сегментирует объекты по обычному тексту и

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google DeepMind позволила LLM переписать алгоритмы игровой теории и обойти экспертов

Google DeepMind показала, что AlphaEvolve может переписывать код алгоритмов для игр с неполной информацией и находить решения, которые на бо

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.AI показала, как собрать production-ready агентные системы на GLM-5 с tool calling

Z.AI выпустила подробный туториал по GLM-5: от настройки SDK и OpenAI-совместимого API до streaming, tool calling, JSON-вывода и multi-turn

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Netflix открыла Void — модель для удаления объектов из видео с учетом физики сцены

Команда Netflix и INSAIT выложила в open source Void — систему, которая удаляет объекты из видео и одновременно пересчитывает падения, подде

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Как искусственный интеллект помогает брендам одежды проектировать моду будущего

Алгоритмы уже помогают модным брендам быстрее создавать коллекции, прогнозировать тренды, снижать перепроизводство и персонализировать покуп

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Как собрать пайплайн Netflix Void для удаления объектов из видео с помощью CogVideoX

В подробном разборе показано, как развернуть модель Netflix Void, скачать нужные чекпойнты, подготовить входные данные и запустить удаление

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Gladstone Institutes представили MaxToki — ИИ-модель, предсказывающую старение клеток

Модель MaxToki от Gladstone Institutes учится видеть не «снимок» клетки, а её траекторию во времени, оценивает ускорение старения и подсказы

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TinyFish запустила единую веб-платформу для AI-агентов с Search, Fetch, Browser и Agent

TinyFish объединила поиск, рендеринг страниц, браузерные сессии и автономные веб-воркфлоу в одной платформе для AI-агентов с единым API-ключ

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google добавила Skills в Chrome и превратила AI-промпты в сценарии на один клик

Google запустила в Chrome функцию Skills: пользователи Gemini смогут сохранять часто используемые промпты как повторяемые сценарии и запуска

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Google DeepMind представила Gemini Robotics-ER 1.6 для автономии и чтения приборов роботами

Google DeepMind обновила Gemini Robotics-ER до версии 1.6: модель для роботов лучше понимает пространство, несколько видеопотоков и умеет чи

2026-04-28·2 мин
LLM
LLM·MarkTechPost

MarkTechPost разобрал полный цикл обучения больших языковых моделей: от данных до деплоя

MarkTechPost выпустил подробный разбор того, как сегодня строят LLM: от предобучения на огромных корпусах до SFT, RLHF, оптимизации логики р

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google представила Gemini 3.1 Flash TTS — модель речи с управлением, диалогами и 70+ языками

Google запустила Gemini 3.1 Flash TTS в превью: модель озвучивает текст на 70+ языках, поддерживает диалоги с двумя голосами и позволяет упр

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Mem0 и OpenAI: как собрать универсальный слой долгосрочной памяти для AI-агентов

Новый туториал разбирает связку Mem0, моделей OpenAI и ChromaDB: из обычных диалогов она извлекает факты, хранит их по user_id, ищет по смыс

2026-04-28·2 мин
LLM
LLM·MarkTechPost

SmolAgents: как собрать мультиагентную AI-систему с кодом и динамической оркестрацией

Разбор реализации на SmolAgents показывает, как лёгкие AI-агенты исполняют код, вызывают инструменты, работают с памятью и координируют зада

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NetKet и JAX: как собрать Transformer-модель для фрустрированных спиновых систем

Гайд показывает, как с помощью NetKet, JAX и архитектуры Transformer собрать исследовательский VMC-пайплайн для моделирования фрустрированно

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI представила GPT-Rosalind — ИИ-модель для биологии, геномики и разработки лекарств

OpenAI запустила GPT-Rosalind — специализированную модель для биологии и фармы, которая помогает ускорять разработку лекарств, анализ геномн

2026-04-28·3 мин