Habr AI→ оригинал

Decima-8: архитектура, которая хочет переизобрести нейроморфные чипы

Архитектура Decima-8 атакует сразу две ключевые проблемы нейроморфных систем — неэффективное кодирование информации и аппаратные ограничения. Вместо бинарных сп

Decima-8: архитектура, которая хочет переизобрести нейроморфные чипы
Источник: Habr AI. Коллаж: Hamidun News.

Нейроморфные вычисления годами остаются одной из самых многообещающих и одновременно самых разочаровывающих областей микроэлектроники. Идея проста и красива: построить чипы, работающие по принципам биологического мозга, и получить на порядки более энергоэффективные вычисления. На практике же каждая попытка реализации упирается в одни и те же стены. Архитектура Decima-8 претендует на то, чтобы эти стены если не снести, то существенно подвинуть — и делает это сразу по нескольким направлениям.

Чтобы понять, что именно предлагает Decima-8, нужно разобраться в природе проблем. Современные спайковые нейронные сети кодируют информацию бинарно: нейрон либо «выстрелил», либо нет. Чтобы передать градации сигнала — а без них невозможны сколько-нибудь сложные вычисления — приходится прибегать к частотному кодированию, растягивая одно значение на множество тактов, или увеличивать количество физических линий передачи.

Оба подхода пожирают время и площадь кристалла. Параллельно существует аппаратная проблема. Мемристорные кроссбары, которые на бумаге выглядят идеальным субстратом для нейроморфных вычислений, на практике страдают от шума, дрейфа параметров и недетерминизма.

Каждый чип требует индивидуальной калибровки, что делает массовое производство кошмаром для инженеров. А традиционные сети на кристалле (Network-on-Chip) съедают до сорока процентов площади кристалла под маршрутизаторы, при этом около семидесяти процентов энергии тратится не на вычисления, а на пересылку данных между блоками.

Decima-8 атакует обе проблемы одновременно, предлагая три ключевых нововведения. Первое — формат Level16. Вместо бинарного спайка каждая линия передаёт уровень активации от нуля до пятнадцати за один такт. Шестнадцать градаций — это осознанный компромисс между грубостью бинарного представления и капризностью аналоговой непрерывности. Четыре бита на значение достаточно для того, чтобы передать содержательный градиент сигнала, но при этом система остаётся полностью цифровой и детерминированной. Нет необходимости тратить десятки тактов на частотное кодирование одного числа — значение передаётся мгновенно.

Второе нововведение — цифровые кроссбары, которые эмулируют поведение мемристорных матриц, но лишены их ключевых недостатков. Никакого шума, никакого дрейфа, никакой индивидуальной калибровки. Каждый чип ведёт себя одинаково, каждое вычисление воспроизводимо. Это звучит как шаг назад — отказ от «настоящей» аналоговой нейроморфности в пользу цифровой эмуляции. Но в инженерии прагматизм часто побеждает элегантность. Мемристоры прекрасны в теории и мучительны на производстве. Цифровые кроссбары Decima-8 жертвуют теоретической красотой ради практической работоспособности.

Третье и, возможно, самое радикальное решение — эстафетная активация. Вместо традиционной пакетной маршрутизации, где данные передаются между вычислительными тайлами через сеть роутеров, Decima-8 распространяет активацию через граф зависимостей. Тайлы не «общаются» друг с другом в привычном смысле — активация просто перетекает от одного вычислительного блока к следующему по заранее определённому графу. Это позволяет полностью отказаться от маршрутизаторов на кристалле. Ноль процентов площади на роутеры — цифра, которая звучит почти провокационно на фоне стандартных сорока процентов. Фиксированная задержка вместо непредсказуемой латентности пакетной сети — это не просто оптимизация, это качественно иная модель вычислений.

Важно, однако, сохранять трезвость оценок. Архитектура пока описана на концептуальном уровне, и между красивой схемой и работающим кремнием лежит огромная дистанция. Шестнадцать уровней активации — это хорошо для определённого класса задач, но для многих современных моделей машинного обучения даже восьмибитная квантизация считается агрессивной. Вопрос масштабируемости эстафетной активации на графы с миллиардами узлов остаётся открытым. Цифровые кроссбары решают проблему детерминизма, но могут проигрывать аналоговым решениям в энергоэффективности — а именно энергоэффективность является главным обещанием нейроморфных вычислений.

Тем не менее Decima-8 заслуживает внимания как концептуально целостная попытка переосмыслить нейроморфную архитектуру не по частям, а целиком. Индустрия слишком долго пыталась решать проблему кодирования отдельно от проблемы коммуникации и отдельно от проблемы аппаратной реализации. Подход «всё сразу» рискован, но если хотя бы часть заявленных характеристик подтвердится в железе, это может задать новое направление для целого поколения нейроморфных процессоров. В мире, где энергопотребление дата-центров становится геополитической проблемой, любая архитектура, способная радикально снизить затраты энергии на вычисления, заслуживает пристального изучения.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…