Habr AI→ original

A Selectel adicionou servidores de ponta para treinamento de modelos e ampliou o catálogo de imagens

A Selectel atualizou sua infraestrutura de AI: a linha agora inclui servidores HGX B300 de ponta para o treinamento de modelos de grande porte, configurações…

Processado por IA de Habr AI; editado por Hamidun News
A Selectel adicionou servidores de ponta para treinamento de modelos e ampliou o catálogo de imagens
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Selectel Adiciona Servidores Flagship para Treinamento de Modelos e Expande Catálogo de Imagens

Selectel resumiu fevereiro e demonstrou como sua infraestrutura está evoluindo para atender à crescente demanda por cargas de trabalho de IA. As principais atualizações incluem novos servidores dedicados para treinamento de modelos grandes, novas imagens no marketplace de IA e várias mudanças notáveis na plataforma Kubernetes em nuvem.

Servidores para Treinamento

A inovação flagship é o servidor dedicado GL8-B300-HGX-25GE baseado na plataforma NVIDIA HGX B300. A empresa o chama de configuração mais poderosa em sua linha atual: a solução é projetada para treinamento de IA, ajuste fino e inferência industrial de grandes modelos de linguagem. Selectel enfatiza especificamente o volume total de memória de vídeo de 2,3 TB — um nível necessário não para pilotos, mas para pipelines pesados, contexto longo e grandes lotes, onde o gargalo se torna não apenas a GPU mas também a estabilidade de toda a infraestrutura.

"NVIDIA HGX B300 é uma plataforma flagship para cargas de trabalho de

IA em larga escala."

Para equipes que não precisam de capacidade de nível de cluster de topo, a empresa também adicionou opções mais práticas. A configuração AR45G-NVMe-H200 é posicionada como um servidor compacto e mais acessível para inferência, protótipos e treinamento em pequena escala. Outra opção — AR45G-NVMe-RTX6000 — é projetada para cenários onde 96 GB de VRAM são suficientes: pilotos LLM, tarefas de visão computacional, gráficos e cargas de trabalho aplicadas. Em paralelo, Selectel expandiu sua linha de armazenamento adicionando HDDs de 28 TB para arquivos, backups e logs.

Marketplace e Nuvem

Novas imagens prontas para uso apareceram no marketplace de IA do Selectel, cobrindo diferentes estágios do ciclo de ML — de experimentos a controle de qualidade e rotulagem de dados. Isso não é simplesmente expandir o catálogo por quantidade: a empresa está adicionando ferramentas que ajudam a construir um ecossistema mais completo em torno de um modelo, em vez de apenas executar inferência em um contêiner. Para equipes de engenharia, isso também é uma maneira de montar rapidamente um ambiente de trabalho sem integração manual extra.

  • Aim — para rastreamento de experimentos e comparação de resultados de ajuste de modelos.
  • Lobe Chat — uma interface para trabalhar com LLM com ênfase em plugins e soluções prontas da comunidade.
  • Evidently AI — monitoramento de qualidade do modelo e métricas nas quais as atualizações do modelo podem ser automatizadas.
  • Xtreme1 — serviço de rotulagem de dados, incluindo cenários com lidar e classificação de objetos.

Separadamente, Selectel implantou GPU L4 com 24 GB de memória na nuvem. A empresa a chama de cartão universal para tarefas de IA/ML, processamento de vídeo, streaming e VDI, bem como para cenários aplicados como transcrição de áudio para texto. Este lançamento é importante não apenas para equipes de IA: L4 é frequentemente escolhida onde é necessário um equilíbrio entre custo, eficiência energética e desempenho suficiente sem mudar para aceleradores de grau de treinamento caros. Para equipes com orçamentos limitados, esta é uma opção particularmente prática.

Kubernetes e Camada do Sistema

Uma atualização significativa de infraestrutura afetou o Kubernetes Gerenciado. Selectel adicionou suporte completo para o recurso ephemeralStorage no Cluster Autoscaler e Karpenter. O valor prático aqui é direto: ao escalar o cluster, o sistema agora entende com mais precisão quanto armazenamento temporário local os novos Pods realmente precisam. Anteriormente, em cenários onde o cluster não tinha nós com ephemeralStorage explicitamente definido, o autoscaling podia calcular requisitos de forma imprecisa. Para equipes com processamento de dados e cargas de trabalho de IA, isso elimina uma classe desagradável de erros na fase de aumento de escala.

Várias outras mudanças se relacionam a controle e camada básica do sistema. Kubernetes Gerenciado agora apresenta logs de auditoria para operações-chave de cluster e grupos de nós — isso simplifica análise de mudanças, segurança e conformidade. A interface também abriu a visualização da configuração de DNS privado, e para grupos de nós atualizou a exibição de User Data. No nível do SO, Selectel lançou SELECTOS 1.3 com atualizações de pacotes para Debian 12.13, fechamento de 177 vulnerabilidades e adição de imagem de contêiner. Além disso, a empresa lançou Astra Linux para servidores do A-ЦОД — este é um movimento em direção aos clientes que precisam de um ambiente seguro certificado.

O Que Isso Significa

O pacote de atualização de fevereiro mostra que Selectel quer ser mais do que apenas aluguel de hardware, mas uma plataforma de infraestrutura de IA completa. No topo, a empresa expande seu catálogo de ferramentas ML prontas e GPUs em nuvem; no fundo, fortalece Kubernetes, sistemas operacionais base e a camada de conformidade. Para equipes construindo seus próprios serviços de IA, isso reduz montagem manual e acelera o caminho do piloto para implantação em produção.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…