MarkTechPost→ оригинал

Liquid AI выпустила LFM2.5-230M: 213 токенов/с на Galaxy S25 и поддержка llama.cpp

Liquid AI выпустила самую маленькую модель в линейке с открытыми весами — LFM2.5-230M. 230 миллионов параметров: 213 токенов/с на Galaxy S25 Ultra и 42 на…

AI-обработка оригинала MarkTechPost; редакция Hamidun News
Liquid AI выпустила LFM2.5-230M: 213 токенов/с на Galaxy S25 и поддержка llama.cpp
Источник: MarkTechPost. Коллаж: Hamidun News.
◐ Слушать статью

Liquid AI выпустила LFM2.5-230M — самую компактную модель в линейке с открытыми весами. При 230 миллионах параметров она умещается на смартфоне или одноплатнике и при этом обгоняет конкурентов с втрое и вчетверо бо́льшим числом параметров на задачах, для которых создавалась.

Что такое LFM и чем она отличается LFM расшифровывается как

Liquid Foundation Model — собственная архитектура компании Liquid AI, основанной выходцами из MIT. Подход принципиально отличается от стандартных трансформеров: вместо классического механизма внимания используется гибридный дизайн, вдохновлённый нейронными дифференциальными уравнениями. Результат — модели, которые работают эффективнее при меньшем числе параметров. LFM2.5-230M — наименьшая в серии, но построена на той же основе, что более мощные версии. Она не претендует на звание универсального ассистента: модель заточена под tool use (вызов внешних инструментов и API в агентных пайплайнах) и data extraction (структурированное извлечение данных из неструктурированного текста). Именно на этих задачах она демонстрирует результаты выше, чем у значительно более крупных конкурентов.

Скорость на реальном железе и точность на бенчмарках

Liquid AI проверила производительность не на серверах, а на потребительских устройствах: Galaxy S25 Ultra — 213 токенов в секунду Raspberry Pi 5 — 42 токена в секунду Для контекста: комфортная скорость чтения для пользователя — около 15–25 токенов/с. Модель работает на смартфоне с восьмикратным запасом — достаточно даже для интерактивных приложений в реальном времени. Что это означает практически: LFM2.

5-230M можно запускать офлайн, без API-ключей, без облачных расходов и без передачи данных на сторонние серверы. Для корпоративных продуктов с требованиями к конфиденциальности это весомый аргумент сам по себе. На тестах по следованию инструкциям (instruction following) модель обошла **Qwen3.

5-0.8B от Alibaba (в три с лишним раза крупнее) и Gemma 3 1B** от Google (в четыре раза крупнее). Это победа не в общем рейтинге, а конкретно на задачах, для которых модель и проектировалась.

Поддерживаемые рантаймы LFM2.5-230M выходит с открытыми весами и

поддерживает весь стандартный стек инференса: llama.cpp — CPU-запуск без GPU на любом железе MLX — оптимизировано для чипов Apple Silicon (M1–M4) vLLM и SGLang — для серверного высоконагруженного деплоя ONNX — кроссплатформенный стандарт для продакшн-развёртывания Охват максимальный: от MacBook до Linux-сервера, от флагманского Samsung до одноплатника за $80. Для открытых моделей широта экосистемной поддержки — один из главных факторов реального распространения.

Что это значит

Liquid AI наглядно показывает: архитектурная эффективность вытесняет гонку параметров. Модель на 230 млн параметров, которая работает на смартфоне быстрее, чем человек успевает читать, и при этом обходит аналоги вчетверо крупнее — убедительный аргумент в пользу специализации над универсальностью. Для разработчиков мобильных AI-приложений и агентных пайплайнов это открывает новое окно возможностей.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…