MarkTechPost→ original

StepFun apresenta Step 3.7 Flash — modelo Vision-Language com 198 bilhões de parâmetros

A StepFun lançou o Step 3.7 Flash, um modelo Vision-Language com 198 bilhões de parâmetros em uma arquitetura de mixture-of-experts. O modelo conta com capacida

StepFun apresenta Step 3.7 Flash — modelo Vision-Language com 198 bilhões de parâmetros
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

StepFun apresentou oficialmente Step 3.7 Flash — um novo modelo Vision-Language que promete ser uma solução significativa para tarefas especializadas em inteligência artificial. Este modelo é construído em uma arquitetura de Mistura de Especialistas (MoE) e contém 198 bilhões de parâmetros, o que lhe permite oferecer alto desempenho enquanto utiliza eficientemente os recursos computacionais.

Parâmetros Técnicos e Arquitetura

Step 3.7 Flash se distingue por várias características técnicas principais. O modelo utiliza uma arquitetura MoE, na qual apenas as subredes relevantes de parâmetros são ativadas para cada exemplo de entrada.

Isso permite alcançar um equilíbrio entre a escala do modelo e a eficiência de seu funcionamento. Os recursos visuais integrados permitem ao modelo processar não apenas dados textuais, mas também analisar imagens. Uma janela de contexto expandida de 256 mil tokens oferece a possibilidade de trabalhar com documentos longos, bases de código complexas e materiais visuais detalhados sem perda de contexto.

Um lugar especial é ocupado pelo modo Advisor, integrado na arquitetura do modelo. Este modo fornece um nível adicional de controle sobre o comportamento do modelo e permite alcançar uma saída mais estruturada e previsível. Tal abordagem é particularmente útil em ambientes de produção, onde confiabilidade e consistência dos resultados são necessárias.

Aplicações Alvo e Cenários de Uso

StepFun posiciona Step 3.7 Flash como uma solução para duas direções principais de aplicação. A primeira é a automação do desenvolvimento de código.

O modelo pode analisar código-fonte, identificar possíveis melhorias, gerar versões otimizadas e até participar do processo de depuração. A visão integrada permite que funcione com capturas de tela de código e diagramas de arquitetura. A segunda direção é a integração em sistemas de busca.

Os recursos visuais tornam o modelo adequado para plataformas de busca que funcionam tanto com consultas textuais quanto com imagens. O contexto expandido permite procurar por respostas complexas e multifacetadas com base em dados abrangentes. Adicionalmente, o modelo pode ser aplicado em ferramentas analíticas — para processar conjuntos de dados combinados, analisar materiais em vídeo com transcrição detalhada do conteúdo e fornecer recomendações estruturadas com base nos resultados obtidos.

Posição no Mercado

O lançamento de Step 3.7 Flash continua uma tendência visível no mercado em direção à especialização. Em vez de criar modelos universais, as empresas estão cada vez mais desenvolvendo soluções otimizadas para tarefas específicas. StepFun demonstra que a especialização eficaz é alcançada não apenas pela escolha da arquitetura, mas também por modos operacionais especiais que permitem adaptar o comportamento do modelo aos requisitos específicos. A arquitetura MoE está se tornando o padrão para modelos grandes, especialmente no contexto de restrições de consumo de energia e custos de infraestrutura. Isso abre caminho para soluções de IA mais acessíveis e ecológicas.

O Que Isto Significa

O surgimento de Step 3.7 Flash indica uma mudança importante na estratégia de desenvolvimento de grandes modelos. Em vez de uma corrida por tamanho e universalidade, os desenvolvedores estão focando na otimização profunda para aplicações específicas. Para desenvolvedores e empresas, isso significa mais ferramentas para escolher e a possibilidade de selecionar uma solução que corresponda perfeitamente às necessidades de seu projeto. A arquitetura MoE, por sua vez, torna-se não apenas um truque de engenharia, mas um padrão para modelos eficientes de próxima geração. Isso permite reduzir os custos de infraestrutura e despesas operacionais sem comprometer a qualidade, o que é crítico para implementação comercial de IA.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

O que você acha?
Carregando comentários…