A Selectel adicionou servidores de ponta para treinamento de modelos e ampliou o catálogo de imagens
A Selectel atualizou sua infraestrutura de AI: a linha agora inclui servidores HGX B300 de ponta para o treinamento de modelos de grande porte, configurações…
Processado por IA de Habr AI; editado por Hamidun News
Selectel Adiciona Servidores Flagship para Treinamento de Modelos e Expande Catálogo de Imagens
Selectel resumiu fevereiro e demonstrou como sua infraestrutura está evoluindo para atender à crescente demanda por cargas de trabalho de IA. As principais atualizações incluem novos servidores dedicados para treinamento de modelos grandes, novas imagens no marketplace de IA e várias mudanças notáveis na plataforma Kubernetes em nuvem.
Servidores para Treinamento
A inovação flagship é o servidor dedicado GL8-B300-HGX-25GE baseado na plataforma NVIDIA HGX B300. A empresa o chama de configuração mais poderosa em sua linha atual: a solução é projetada para treinamento de IA, ajuste fino e inferência industrial de grandes modelos de linguagem. Selectel enfatiza especificamente o volume total de memória de vídeo de 2,3 TB — um nível necessário não para pilotos, mas para pipelines pesados, contexto longo e grandes lotes, onde o gargalo se torna não apenas a GPU mas também a estabilidade de toda a infraestrutura.
"NVIDIA HGX B300 é uma plataforma flagship para cargas de trabalho de
IA em larga escala."
Para equipes que não precisam de capacidade de nível de cluster de topo, a empresa também adicionou opções mais práticas. A configuração AR45G-NVMe-H200 é posicionada como um servidor compacto e mais acessível para inferência, protótipos e treinamento em pequena escala. Outra opção — AR45G-NVMe-RTX6000 — é projetada para cenários onde 96 GB de VRAM são suficientes: pilotos LLM, tarefas de visão computacional, gráficos e cargas de trabalho aplicadas. Em paralelo, Selectel expandiu sua linha de armazenamento adicionando HDDs de 28 TB para arquivos, backups e logs.
Marketplace e Nuvem
Novas imagens prontas para uso apareceram no marketplace de IA do Selectel, cobrindo diferentes estágios do ciclo de ML — de experimentos a controle de qualidade e rotulagem de dados. Isso não é simplesmente expandir o catálogo por quantidade: a empresa está adicionando ferramentas que ajudam a construir um ecossistema mais completo em torno de um modelo, em vez de apenas executar inferência em um contêiner. Para equipes de engenharia, isso também é uma maneira de montar rapidamente um ambiente de trabalho sem integração manual extra.
- Aim — para rastreamento de experimentos e comparação de resultados de ajuste de modelos.
- Lobe Chat — uma interface para trabalhar com LLM com ênfase em plugins e soluções prontas da comunidade.
- Evidently AI — monitoramento de qualidade do modelo e métricas nas quais as atualizações do modelo podem ser automatizadas.
- Xtreme1 — serviço de rotulagem de dados, incluindo cenários com lidar e classificação de objetos.
Separadamente, Selectel implantou GPU L4 com 24 GB de memória na nuvem. A empresa a chama de cartão universal para tarefas de IA/ML, processamento de vídeo, streaming e VDI, bem como para cenários aplicados como transcrição de áudio para texto. Este lançamento é importante não apenas para equipes de IA: L4 é frequentemente escolhida onde é necessário um equilíbrio entre custo, eficiência energética e desempenho suficiente sem mudar para aceleradores de grau de treinamento caros. Para equipes com orçamentos limitados, esta é uma opção particularmente prática.
Kubernetes e Camada do Sistema
Uma atualização significativa de infraestrutura afetou o Kubernetes Gerenciado. Selectel adicionou suporte completo para o recurso ephemeralStorage no Cluster Autoscaler e Karpenter. O valor prático aqui é direto: ao escalar o cluster, o sistema agora entende com mais precisão quanto armazenamento temporário local os novos Pods realmente precisam. Anteriormente, em cenários onde o cluster não tinha nós com ephemeralStorage explicitamente definido, o autoscaling podia calcular requisitos de forma imprecisa. Para equipes com processamento de dados e cargas de trabalho de IA, isso elimina uma classe desagradável de erros na fase de aumento de escala.
Várias outras mudanças se relacionam a controle e camada básica do sistema. Kubernetes Gerenciado agora apresenta logs de auditoria para operações-chave de cluster e grupos de nós — isso simplifica análise de mudanças, segurança e conformidade. A interface também abriu a visualização da configuração de DNS privado, e para grupos de nós atualizou a exibição de User Data. No nível do SO, Selectel lançou SELECTOS 1.3 com atualizações de pacotes para Debian 12.13, fechamento de 177 vulnerabilidades e adição de imagem de contêiner. Além disso, a empresa lançou Astra Linux para servidores do A-ЦОД — este é um movimento em direção aos clientes que precisam de um ambiente seguro certificado.
O Que Isso Significa
O pacote de atualização de fevereiro mostra que Selectel quer ser mais do que apenas aluguel de hardware, mas uma plataforma de infraestrutura de IA completa. No topo, a empresa expande seu catálogo de ferramentas ML prontas e GPUs em nuvem; no fundo, fortalece Kubernetes, sistemas operacionais base e a camada de conformidade. Para equipes construindo seus próprios serviços de IA, isso reduz montagem manual e acelera o caminho do piloto para implantação em produção.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.