Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Alibaba выпустила Qwen 3.5 Small — компактные модели для работы прямо на устройствах

Новая серия моделей Alibaba от 0.8 до 9 миллиардов параметров бросает вызов гонке за размером. Философия «больше интеллекта, меньше вычислен

2026-03-03·3 мин
LLM
LLM·MarkTechPost

SHAP-IQ: новый стандарт объяснимого ИИ выходит на практический уровень

Библиотека SHAP-IQ позволяет не просто оценить важность признаков модели, но и понять, как они взаимодействуют друг с другом. Разбираемся, п

2026-03-02·3 мин
LLM
LLM·MarkTechPost

Google представила STATIC: ускорение генеративного поиска в 948 раз

Google AI разработала фреймворк на основе разреженных матриц, который ускоряет декодирование в генеративных рекомендательных системах почти

2026-03-02·3 мин
LLM
LLM·MarkTechPost

Alibaba открыла CoPaw — рабочую станцию для масштабирования AI-агентов

Команда Alibaba выпустила open-source фреймворк CoPaw, который превращает локальную машину разработчика в полноценную среду для запуска авто

2026-03-01·2 мин
LLM
LLM·MarkTechPost

Unified Latents: Google DeepMind нашла способ улучшить генерацию ИИ

Новый фреймворк Unified Latents от Google DeepMind решает дилемму между качеством сжатия данных и точностью работы нейросетей.

2026-02-28·2 мин
LLM
LLM·MarkTechPost

Sakana AI научилась мгновенно адаптировать языковые модели без дообучения

Токийская лаборатория Sakana AI представила два метода — Doc-to-LoRA и Text-to-LoRA — которые позволяют адаптировать большие языковые модели

2026-02-27·3 мин
LLM
LLM·MarkTechPost

Perplexity выпустила pplx-embed: модели эмбеддингов, которые меняют правила поиска

Perplexity представила семейство мультиязычных моделей эмбеддингов pplx-embed на базе Qwen3 с двунаправленным вниманием — и заявляет о новом

2026-02-27·3 мин
LLM
LLM·MarkTechPost

Liquid AI бросает вызов гонке размеров: гибридная архитектура LFM2 меняет правила игры

Стартап Liquid AI представил модель на 24 миллиарда параметров, которая сочетает механизм внимания с свёртками. Цель — решить проблемы масшт

2026-02-25·3 мин
LLM
LLM·MarkTechPost

Composio открывает код Agent Orchestrator — инструмента для мультиагентных систем за пределами ReAct

Стартап Composio выпустил в открытый доступ оркестратор агентов, который решает главную проблему продакшн-AI: хрупкость простых ReAct-циклов

2026-02-24·3 мин
LLM
LLM·MarkTechPost

WebSocket-режим OpenAI меняет правила игры для голосового AI

OpenAI представила WebSocket-режим для Realtime API, который устраняет главного врага голосовых AI-агентов — задержку. Три отдельных этапа о

2026-02-24·3 мин
LLM
LLM·MarkTechPost

Taalas бросает вызов GPU: жёсткая логика вместо гибкости ради 17 000 токенов в секунду

Канадский стартап Taalas делает ставку на то, что индустрия AI-чипов считала ересью — замену программируемых GPU на специализированные микро

2026-02-23·3 мин
LLM
LLM·MarkTechPost

TruLens: как перестать доверять LLM вслепую и начать измерять качество

Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг

2026-02-23·3 мин
LLM
LLM·MarkTechPost

Google предлагает думать глубже, а не дольше — и вдвое снижает затраты на инференс

Исследователи из Google и Университета Вирджинии доказали: длинная цепочка рассуждений не означает качественную. Новая метрика Deep-Thinking

2026-02-22·3 мин
LLM
LLM·MarkTechPost

Google DeepMind представила Lyria 3 для создания музыки по фото

Новая модель Lyria 3 от Google DeepMind совершает прорыв в генерации аудио. Теперь ИИ способен создавать полноценные треки с вокалом и текст

2026-02-19·2 мин
LLM
LLM·MarkTechPost

Tavus представила Phoenix-4: видеоаватары с живыми эмоциями и мгновенным откликом

Новая модель Phoenix-4 преодолевает эффект «зловещей долины», добавляя цифровым аватарам эмоциональный интеллект и сокращая задержку генерац

2026-02-19·2 мин
LLM
LLM·MarkTechPost

Anthropic представила Claude 4.6 Sonnet с контекстом в миллион токенов

Anthropic вступает в эпоху рассуждающих моделей. Claude 4.6 Sonnet получил контекстное окно в 1 млн токенов и инновационную систему верифика

2026-02-18·2 мин
LLM
LLM·MarkTechPost

Google DeepMind представила фреймворк для интеллектуального делегирования задач между ИИ-агентами

Исследователи разработали систему для создания безопасного «агентного веба», где автономные программы смогут эффективно взаимодействовать и

2026-02-16·2 мин
LLM
LLM·MarkTechPost

Google представила WebMCP: новый стандарт взаимодействия ИИ-агентов с вебом

Google представила протокол WebMCP, который позволит ИИ-агентам взаимодействовать с сайтами напрямую через структуру кода, минуя медленный и

2026-02-15·2 мин
LLM
LLM·MarkTechPost

Архитектура памяти: как научить ИИ-агентов помнить важное и мыслить логично

Разбор новой концепции памяти для нейросетей: переход от простого хранения истории диалогов к структурированным базам знаний для глубокого а

2026-02-15·2 мин
LLM
LLM·MarkTechPost

Гайд по созданию пайплайна синтетических данных с CTGAN и SDV

Узнайте, как построить надежную систему генерации табличных данных, обеспечивающую высокую точность и сохранение всех статистических законом

2026-02-14·3 мин
LLM
LLM·MarkTechPost

Как обучить ИИ человеческим предпочтениям: гайд по DPO и QLoRA

Новый туториал показывает, как эффективно настраивать языковые модели под человеческие предпочтения без использования тяжеловесных моделей в

2026-02-13·2 мин
LLM
LLM·MarkTechPost

Google Gemini 3 Deep Think: новый рекорд в тестах на общий интеллект

Google представила Gemini 3 Deep Think. Модель показала результат в 84,6% в тесте ARC-AGI-2, приближая индустрию к созданию сильного ИИ чере

2026-02-13·2 мин
LLM
LLM·MarkTechPost

OpenAI представила GPT-5.3-Codex-Spark: революция скорости в разработке ПО

OpenAI выпустила сверхбыструю модель для кодинга. Благодаря чипам Cerebras она выдает 1000 токенов в секунду, что в 15 раз быстрее стандартн

2026-02-13·2 мин
LLM
LLM·MarkTechPost

Как обучить эмбеддинги Matryoshka для сверхбыстрого поиска данных

Узнайте, как технология Matryoshka Representation Learning позволяет сократить размер векторов до 64 измерений без существенной потери точно

2026-02-12·2 мин
LLM
LLM·MarkTechPost

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей

Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, реша

2026-02-11·2 мин
LLM
LLM·MarkTechPost

Как упростить разработку нейросетей: руководство по использованию Einops для тензорных вычислений

Библиотека Einops становится стандартом для работы с тензорами в глубоком обучении. Разбираемся, как сделать код чище и избежать ошибок в ар

2026-02-11·2 мин
LLM
LLM·MarkTechPost

Google представила NAI: адаптивные интерфейсы на базе Gemini для инклюзивного дизайна

Google Research предлагает пересмотреть подход к доступности ПО. Фреймворк NAI использует ИИ-агентов Gemini для мгновенной адаптации интерфе

2026-02-11·2 мин
LLM
LLM·MarkTechPost

Microsoft представила OrbitalBrain: распределенное обучение ИИ прямо в космосе

Исследователи Microsoft предложили архитектуру OrbitalBrain для обучения нейросетей на спутниковых группировках, решая проблему медленной пе

2026-02-10·2 мин
LLM
LLM·MarkTechPost

OAT: как токенизация действий приближает роботов к возможностям LLM

Новый метод OAT позволяет роботам эффективнее планировать действия, используя подходы, аналогичные большим языковым моделям. Это открывает д

2026-02-09·2 мин
LLM
LLM·MarkTechPost

MLflow для LLM: версионирование промптов и регрессионное тестирование

Как обеспечить стабильность больших языковых моделей? MLflow предлагает решение для версионирования промптов и автоматического регрессионног

2026-02-09·1 мин