Liquid AI выпустила LFM2.5-230M: 213 токенов/с на Galaxy S25 и поддержка llama.cpp
Liquid AI выпустила самую маленькую модель в линейке с открытыми весами — LFM2.5-230M. 230 миллионов параметров: 213 токенов/с на Galaxy S25 Ultra и 42 на…
AI-обработка оригинала MarkTechPost; редакция Hamidun News
Liquid AI выпустила LFM2.5-230M — самую компактную модель в линейке с открытыми весами. При 230 миллионах параметров она умещается на смартфоне или одноплатнике и при этом обгоняет конкурентов с втрое и вчетверо бо́льшим числом параметров на задачах, для которых создавалась.
Что такое LFM и чем она отличается LFM расшифровывается как
Liquid Foundation Model — собственная архитектура компании Liquid AI, основанной выходцами из MIT. Подход принципиально отличается от стандартных трансформеров: вместо классического механизма внимания используется гибридный дизайн, вдохновлённый нейронными дифференциальными уравнениями. Результат — модели, которые работают эффективнее при меньшем числе параметров. LFM2.5-230M — наименьшая в серии, но построена на той же основе, что более мощные версии. Она не претендует на звание универсального ассистента: модель заточена под tool use (вызов внешних инструментов и API в агентных пайплайнах) и data extraction (структурированное извлечение данных из неструктурированного текста). Именно на этих задачах она демонстрирует результаты выше, чем у значительно более крупных конкурентов.
Скорость на реальном железе и точность на бенчмарках
Liquid AI проверила производительность не на серверах, а на потребительских устройствах: Galaxy S25 Ultra — 213 токенов в секунду Raspberry Pi 5 — 42 токена в секунду Для контекста: комфортная скорость чтения для пользователя — около 15–25 токенов/с. Модель работает на смартфоне с восьмикратным запасом — достаточно даже для интерактивных приложений в реальном времени. Что это означает практически: LFM2.
5-230M можно запускать офлайн, без API-ключей, без облачных расходов и без передачи данных на сторонние серверы. Для корпоративных продуктов с требованиями к конфиденциальности это весомый аргумент сам по себе. На тестах по следованию инструкциям (instruction following) модель обошла **Qwen3.
5-0.8B от Alibaba (в три с лишним раза крупнее) и Gemma 3 1B** от Google (в четыре раза крупнее). Это победа не в общем рейтинге, а конкретно на задачах, для которых модель и проектировалась.
Поддерживаемые рантаймы LFM2.5-230M выходит с открытыми весами и
поддерживает весь стандартный стек инференса: llama.cpp — CPU-запуск без GPU на любом железе MLX — оптимизировано для чипов Apple Silicon (M1–M4) vLLM и SGLang — для серверного высоконагруженного деплоя ONNX — кроссплатформенный стандарт для продакшн-развёртывания Охват максимальный: от MacBook до Linux-сервера, от флагманского Samsung до одноплатника за $80. Для открытых моделей широта экосистемной поддержки — один из главных факторов реального распространения.
Что это значит
Liquid AI наглядно показывает: архитектурная эффективность вытесняет гонку параметров. Модель на 230 млн параметров, которая работает на смартфоне быстрее, чем человек успевает читать, и при этом обходит аналоги вчетверо крупнее — убедительный аргумент в пользу специализации над универсальностью. Для разработчиков мобильных AI-приложений и агентных пайплайнов это открывает новое окно возможностей.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.