Habr AI→ original

Decima-8: a arquitetura que busca reinventar os chips neuromórficos

A arquitetura Decima-8 ataca de uma vez dois problemas-chave dos sistemas neuromórficos: a codificação ineficiente da informação e as limitações de hardware…

Processado por IA de Habr AI; editado por Hamidun News
Decima-8: a arquitetura que busca reinventar os chips neuromórficos
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A computação neuromórfica permanece uma das áreas mais promissoras e simultaneamente mais decepcionantes da microeletrônica há anos. A ideia é simples e elegante: construir chips que funcionam de acordo com os princípios do cérebro biológico e alcançar computações ordens de magnitude mais eficientes em energia. Na prática, porém, toda tentativa de implementação esbarra nas mesmas barreiras. A arquitetura Decima-8 afirma que não apenas irá quebrar essas barreiras, mas empurrá-las significativamente—e faz isso em várias dimensões simultaneamente.

Para entender exatamente o que Decima-8 propõe, precisamos compreender a natureza dos problemas. As redes neurais pulsantes modernas codificam informações em binário: um neurônio ou "dispara" ou não. Para transmitir gradações de sinal—sem as quais nenhuma computação suficientemente complexa é possível—devemos recorrer à codificação de frequência, estendendo um valor ao longo de muitos ciclos de clock, ou aumentar o número de linhas de transmissão física.

Ambas as abordagens consomem tempo e área do chip. Paralelamente, existe um problema de hardware. Crossbars memristor, que parecem perfeitos no papel como substrato para computação neuromórfica, sofrem na prática com ruído, deriva de parâmetros e não-determinismo.

Cada chip requer calibração individual, tornando a produção em massa um pesadelo para os engenheiros. E as arquiteturas tradicionais de rede no chip consomem até quarenta por cento da área do chip em roteadores, enquanto cerca de setenta por cento da energia é gasta não em computações, mas na transferência de dados entre blocos.

Decima-8 ataca ambos os problemas simultaneamente, propondo três inovações-chave. A primeira é o formato Level16. Em vez de pulsos binários, cada linha de transmissão carrega um nível de ativação de zero a quinze em um único ciclo de clock. Dezesseis gradações—este é um compromisso deliberado entre a aspereza da representação binária e o capricho da continuidade analógica. Quatro bits por valor são suficientes para transmitir gradiente de sinal significativo, enquanto o sistema permanece totalmente digital e determinístico. Não há necessidade de gastar dezenas de ciclos em codificação de frequência de um único número—o valor é transmitido instantaneamente.

A segunda inovação são crossbars digitais, que emulam o comportamento de matrizes memristor, mas carecem de suas desvantagens-chave. Sem ruído, sem deriva, sem calibração individual. Cada chip se comporta de forma idêntica, cada computação é reproduzível. Isso soa como um passo atrás—abandonar a neuromorfia "verdadeira" analógica em favor da emulação digital. Mas na engenharia, o pragmatismo frequentemente vence a elegância. Os memristores são bonitos em teoria e agonizantes na produção. Os crossbars digitais de Decima-8 sacrificam a beleza teórica pela viabilidade prática.

A terceira e talvez a solução mais radical é a ativação de revezamento. Em vez do roteamento de pacotes tradicional, em que os dados são transmitidos entre tiles computacionais através de uma rede de roteadores, Decima-8 propaga ativação através de um gráfico de dependência. Os tiles não se "comunicam" um com o outro no sentido tradicional—a ativação simplesmente flui de um bloco computacional para o próximo de acordo com um gráfico pré-definido.

Isso permite a eliminação completa de roteadores no chip. Zero por cento da área para roteadores—um número que soa quase provocador contra os quarenta por cento padrão. Latência fixa em vez de latência imprevisível da rede de pacotes—isso não é apenas uma otimização, é um modelo qualitativamente diferente de computação.

É importante, porém, manter uma avaliação sóbria. A arquitetura ainda é descrita em um nível conceitual, e entre um diagrama bonito e silício funcional existe uma vasta distância. Dezesseis níveis de ativação—isso é bom para uma certa classe de tarefas, mas para muitos modelos modernos de aprendizado de máquina, até a quantização de oito bits é considerada agressiva. A questão da escalabilidade da ativação de revezamento para grafos com bilhões de nós permanece em aberto. Os crossbars digitais resolvem o problema do determinismo, mas podem perder para soluções analógicas em eficiência energética—e a eficiência energética é a promessa primária da computação neuromórfica.

No entanto, Decima-8 merece atenção como uma tentativa conceitualmente coerente de repensar a arquitetura neuromórfica não em partes, mas como um todo. A indústria tentou por muito tempo resolver o problema de codificação separadamente do problema de comunicação e separadamente do problema de implementação de hardware. A abordagem "tudo de uma vez" é arriscada, mas se pelo menos parte das características reivindicadas forem confirmadas no silício, isso poderia estabelecer uma nova direção para uma geração inteira de processadores neuromórficos. Em um mundo em que o consumo de energia dos data centers está se tornando um problema geopolítico, qualquer arquitetura capaz de reduzir radicalmente os custos de energia para computação merece estudo cuidadoso.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…