StepFun apresenta Step 3.7 Flash — modelo Vision-Language com 198 bilhões de parâmetros
A StepFun lançou o Step 3.7 Flash, um modelo Vision-Language com 198 bilhões de parâmetros em uma arquitetura de mixture-of-experts. O modelo conta com capacida

StepFun apresentou oficialmente Step 3.7 Flash — um novo modelo Vision-Language que promete ser uma solução significativa para tarefas especializadas em inteligência artificial. Este modelo é construído em uma arquitetura de Mistura de Especialistas (MoE) e contém 198 bilhões de parâmetros, o que lhe permite oferecer alto desempenho enquanto utiliza eficientemente os recursos computacionais.
Parâmetros Técnicos e Arquitetura
Step 3.7 Flash se distingue por várias características técnicas principais. O modelo utiliza uma arquitetura MoE, na qual apenas as subredes relevantes de parâmetros são ativadas para cada exemplo de entrada.
Isso permite alcançar um equilíbrio entre a escala do modelo e a eficiência de seu funcionamento. Os recursos visuais integrados permitem ao modelo processar não apenas dados textuais, mas também analisar imagens. Uma janela de contexto expandida de 256 mil tokens oferece a possibilidade de trabalhar com documentos longos, bases de código complexas e materiais visuais detalhados sem perda de contexto.
Um lugar especial é ocupado pelo modo Advisor, integrado na arquitetura do modelo. Este modo fornece um nível adicional de controle sobre o comportamento do modelo e permite alcançar uma saída mais estruturada e previsível. Tal abordagem é particularmente útil em ambientes de produção, onde confiabilidade e consistência dos resultados são necessárias.
Aplicações Alvo e Cenários de Uso
StepFun posiciona Step 3.7 Flash como uma solução para duas direções principais de aplicação. A primeira é a automação do desenvolvimento de código.
O modelo pode analisar código-fonte, identificar possíveis melhorias, gerar versões otimizadas e até participar do processo de depuração. A visão integrada permite que funcione com capturas de tela de código e diagramas de arquitetura. A segunda direção é a integração em sistemas de busca.
Os recursos visuais tornam o modelo adequado para plataformas de busca que funcionam tanto com consultas textuais quanto com imagens. O contexto expandido permite procurar por respostas complexas e multifacetadas com base em dados abrangentes. Adicionalmente, o modelo pode ser aplicado em ferramentas analíticas — para processar conjuntos de dados combinados, analisar materiais em vídeo com transcrição detalhada do conteúdo e fornecer recomendações estruturadas com base nos resultados obtidos.
Posição no Mercado
O lançamento de Step 3.7 Flash continua uma tendência visível no mercado em direção à especialização. Em vez de criar modelos universais, as empresas estão cada vez mais desenvolvendo soluções otimizadas para tarefas específicas. StepFun demonstra que a especialização eficaz é alcançada não apenas pela escolha da arquitetura, mas também por modos operacionais especiais que permitem adaptar o comportamento do modelo aos requisitos específicos. A arquitetura MoE está se tornando o padrão para modelos grandes, especialmente no contexto de restrições de consumo de energia e custos de infraestrutura. Isso abre caminho para soluções de IA mais acessíveis e ecológicas.
O Que Isto Significa
O surgimento de Step 3.7 Flash indica uma mudança importante na estratégia de desenvolvimento de grandes modelos. Em vez de uma corrida por tamanho e universalidade, os desenvolvedores estão focando na otimização profunda para aplicações específicas. Para desenvolvedores e empresas, isso significa mais ferramentas para escolher e a possibilidade de selecionar uma solução que corresponda perfeitamente às necessidades de seu projeto. A arquitetura MoE, por sua vez, torna-se não apenas um truque de engenharia, mas um padrão para modelos eficientes de próxima geração. Isso permite reduzir os custos de infraestrutura e despesas operacionais sem comprometer a qualidade, o que é crítico para implementação comercial de IA.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.