Editora · verificada pela redação

Hugging Face Blog

Fonte de notícias de IA. Os artigos são selecionados e adaptados pela redação do Hamidun News.

65 artigos no Hamidun·Último: 30 de julho· Ativo·huggingface.co ↗

Últimas publicações

NVIDIA abre os datasets Nemotron: 10 trilhões de tokens para treinar agentes de AI

A NVIDIA lançou os datasets Nemotron com mais de 10 trilhões de tokens e 2,4 bilhões de personas sintéticas para treinar agentes de AI em cenários reais e falhas no uso de ferramentas.

9 de jul. de 2026·3 min

LLMHugging Face Blog

Hugging Face: backend de transformers no vLLM agora roda em velocidade nativa

A Hugging Face anunciou paridade de desempenho: a flag `--model-impl transformers` entrega velocidade nativa do vLLM em mais de 450 arquiteturas sem reescrever código.

8 de jul. de 2026·2 min

LLMHugging Face Blog

SkyPilot e Hugging Face lançaram armazenamento sem taxa de tráfego de saída

A integração entre SkyPilot e Hugging Face Storage permite treinar modelos em qualquer nuvem, armazenando pesos e datasets por $12-18/TB/mês sem taxa de tráfego de saída.

8 de jul. de 2026·2 min

LLMHugging Face Blog

Microsoft lançou Foundry Managed Compute: milhares de modelos Hugging Face com um clique

Microsoft combinou Azure Foundry com o catálogo Hugging Face: milhares de modelos abertos agora fazem deploy na nuvem com um clique, com segurança corporativa e faturamento unificado.

8 de jul. de 2026·2 min

LLMHugging Face Blog

LeRobot v0.6.0 da Hugging Face: robôs aprendem a prever o futuro e avaliar a si mesmos

A Hugging Face lançou LeRobot v0.6.0 com políticas world-model, modelos de recompensa para auto-avaliação de tarefas e seis novos benchmarks — completando o ciclo completo de aprendizado de robôs.

6 de jul. de 2026·3 min

LLMHugging Face Blog

Hugging Face atualiza Kernels: publicadores confiáveis, assinatura de código e desenvolvimento com agentes

Em 6 de julho de 2026, Hugging Face lançou uma grande atualização de Kernels: kernels se tornaram um tipo separado de repositório no Hub, publicadores confiáveis e assinatura de código via Sigstore foram adicionados.

6 de jul. de 2026·3 min

LLMHugging Face Blog

Hugging Face e Cerebras lançam Gemma 4 para AI de voz em tempo real

Hugging Face e Cerebras apresentaram um pipeline aberto de fala para fala com Gemma 4 e latências previsíveis — o sistema já é usado em mais de 9.000 robôs Reachy Mini.

4 de jul. de 2026·2 min

LLMHugging Face Blog

Hugging Face compara todas as alternativas ao LoRA: quem vence no fine-tuning de LLMs

A equipe do Hugging Face testou cinco métodos PEFT de fine-tuning de LLMs — do DoRA ao GaLore — e descobriu quando é possível superar o LoRA e a que custo exato.

29 de jun. de 2026·2 min

LLMHugging Face Blog

ServiceNow: agente de IA vaza segredos corporativos por meio de uma cadeia de buscas

Pesquisadores da ServiceNow mostraram que um agente de deep-research revela segredos corporativos sem querer: cada consulta é inofensiva isoladamente, mas toda a cadeia forma um mosaico.

29 de jun. de 2026·3 min

LLMHugging Face Blog

PaddleOCR lança PP-OCRv6: reconhecimento de texto em 50 idiomas de 1,5 a 34,5 milhões de parâmetros

PP-OCRv6 da Baidu PaddlePaddle: um OCR universal para 50 idiomas em três configurações de 1,5 a 34,5 milhões de parâmetros, com ganho de precisão de +4,6-5,1 pontos percentuais em relação à versão de servidor anterior.

29 de jun. de 2026·2 min

LLMHugging Face Blog

Modelos híbridos predizem melhor palavras de conteúdo do que transformers — estudo da Allen AI

A Allen AI comparou as arquiteturas OLMo 3 e OLMo Hybrid: modelos híbridos predizem com mais precisão substantivos, verbos e adjetivos, mas ficam atrás dos transformers em trechos repetitivos de texto.

28 de jun. de 2026·2 min

LLMHugging Face Blog

Hugging Face: agora é possível iniciar um servidor vLLM no HF Jobs com um único comando

A Hugging Face adicionou suporte a vLLM à plataforma HF Jobs: agora, um servidor de inferência pronto para produção para qualquer modelo do Hub pode ser implantado com um único comando de CLI.

28 de jun. de 2026·2 min

LLMHugging Face Blog

AllenAI Lança olmo-eval — Uma Plataforma para Avaliar LLMs Durante o Treinamento

AllenAI lançou olmo-eval, um kit de ferramentas aberto para avaliação contínua de modelos de linguagem durante todo o ciclo de treinamento — checkpoint por checkpoint.

15 de jun. de 2026·2 min

LLMHugging Face Blog

Cohere apresenta North Mini Code — modelo para desenvolvedores e agentes de IA

Cohere lançou North Mini Code — um modelo de 30 bilhões de parâmetros, especialmente treinado em programação e funcionamento com agentes de IA. O modelo é gratuito e acessível a todos.

11 de jun. de 2026·3 min

LLMHugging Face Blog

Agentes de voz não estão prontos para clientes bilíngues. Pesquisa ServiceNow-AI

Agentes de voz têm desempenho ruim com clientes bilíngues. Isso foi demonstrado por uma pesquisa da equipe ServiceNow-AI, que testou sete sistemas populares de reconhecimento de fala em exemplos de…

11 de jun. de 2026·3 min

LLMHugging Face Blog

Como acelerar modelos PyTorch: guia prático do torch.profiler

Hugging Face falou sobre torch.profiler — ferramenta integrada do PyTorch para análise de desempenho. Ela ajuda a encontrar gargalos no treinamento e inferência de modelos.

29 de mai. de 2026·3 min

LLMHugging Face Blog

Hugging Face ensinou TRL a entregar um trilhão de parâmetros através de delta-pesos

Hugging Face adicionou Delta Weight Sync ao TRL — técnica que envia apenas mudanças de pesos em vez de arquivos completos, reduzindo dados em centenas de vezes no treinamento de modelos gigantes.

29 de mai. de 2026·2 min

LLMHugging Face Blog

Reachy Mini aprendeu a conversar localmente sem nuvem

O robô humanóide Reachy Mini agora pode executar toda a pilha de reconhecimento de fala localmente, sem nuvem e API, graças aos modelos abertos do Hugging Face.

29 de mai. de 2026·3 min

LLMHugging Face Blog

IBM e Artificial Analysis criam benchmark: agentes de IA fracassam em tarefas de TI

Grandes modelos de linguagem obtiveram menos de 50% no novo benchmark ITBench-AA para avaliar a capacidade de agentes de IA em resolver tarefas corporativas de TI. Isso mostra que a automação completa do trabalho em TI p

29 de mai. de 2026·3 min

LLMHugging Face Blog

NVIDIA Nemotron: modelos de difusão geram texto 6 vezes mais rápido

A NVIDIA apresentou Nemotron-Labs Diffusion — os primeiros modelos de linguagem que geram texto em paralelo em vez de sequencialmente. No modo de autoespeculação, funcionam 6× mais rápido que modelos comuns graças à abor

25 de mai. de 2026·3 min

LLMHugging Face Blog

Como um modelo pequeno superou GPT-5 e Claude Opus no reconhecimento óptico de caracteres em português

A Dharma AI treinou um modelo de 3 bilhões de parâmetros que superou todos os modelos frontier em reconhecimento de texto em português — 52 vezes mais barato.

25 de mai. de 2026·3 min

LLMHugging Face Blog

Hugging Face lançou o Open Agent Leaderboard para avaliar agentes de AI

A Hugging Face apresentou um benchmark aberto para comparar sistemas completos de agentes de AI. O resultado mostrou que a arquitetura do agente importa mais do que o modelo escolhido.

21 de mai. de 2026·3 min

LLMHugging Face Blog

PaddleOCR 3.5 recebe suporte a Transformers do Hugging Face

PaddleOCR foi atualizado com suporte completo a Transformers do Hugging Face como backend de inferência. Agora o reconhecimento de texto e análise de documentos funcionam em ambiente PyTorch.

21 de mai. de 2026·2 min

LLMHugging Face Blog

NVIDIA mostrou uma forma eficiente de treinar Cosmos em vídeos de robôs através de LoRA

A NVIDIA lançou um guia para fine-tuning do Cosmos Predict 2.5 via LoRA/DoRA — método parametricamente eficiente para adaptar modelo de vídeo para geração de vídeos robóticos em 17 horas em um único GPU.

21 de mai. de 2026·2 min

LLMHugging Face Blog

Ettin Reranker da Hugging Face: 6 modelos para reranking preciso de busca

A Hugging Face lançou 6 rerranqueadores Ettin baseados em ModernBERT com precisão de ponta e velocidade graças a Flash Attention 2 e otimização de sequências.

21 de mai. de 2026·3 min

LLMHugging Face Blog

OlmoEarth v1.1: Allen AI lançou modelos de satélite 3 vezes mais baratos

Allen AI apresentou uma versão mais eficiente de modelos para análise de imagens de satélite, reduzindo custos computacionais em 3 vezes mantendo a qualidade.

21 de mai. de 2026·2 min

LLMHugging Face Blog

Como o modelo da Allen AI aprendeu a descobrir sozinho a especialização dos especialistas

A Allen AI apresentou o EMO, um modelo baseado em uma mistura de especialistas que desenvolve naturalmente especialização por áreas (saúde, política, cinema) sem treinamento explícito nessas categorias.

17 de mai. de 2026·3 min

LLMHugging Face Blog

CyberSecQwen-4B: como um modelo pequeno se tornou especialista em vulnerabilidades

O modelo especializado de cibersegurança com 4 bilhões de parâmetros supera concorrentes de uso geral na análise de vulnerabilidades e roda localmente em hardware pessoal sem serviços em nuvem.

17 de mai. de 2026·3 min

LLMHugging Face Blog

OncoAgent: sistema de AI para detecção precoce do câncer com base em dados privados de pacientes

Como um algoritmo de aprendizado de máquina ajuda médicos a tomar decisões sobre o diagnóstico de câncer sem comprometer a confidencialidade dos pacientes

17 de mai. de 2026·3 min

LLMHugging Face Blog

Hugging Face acelerou a inferência de LLM em 22% com batching assíncrono

O processamento paralelo de CPU e GPU, em vez do sequencial, eliminou 24% do tempo ocioso da GPU e acelerou a geração de tokens em quase um quarto sem mudar o modelo.

17 de mai. de 2026·2 min