Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

A equipe Qwen lançou FlashQLA: acelerando atenção linear até 3× em NVIDIA Hopper

QwenLM lançou FlashQLA — uma biblioteca de kernels CUDA para Gated Delta Network que oferece ganho de desempenho de até 3× em GPU NVIDIA Hop

2026-04-30·2 мин
LLM
LLM·MarkTechPost

OpenAI Privacy Filter: Como Construir um Pipeline de Produção para Detecção e Mascaramento de PII

O guia do OpenAI Privacy Filter desglosa um pipeline completo para detectar e mascarar dados pessoais — desde o carregamento do modelo até a

2026-04-30·3 мин
LLM
LLM·MarkTechPost

DeepSeek, Google e Meta: 10 técnicas de compressão de KV-cache em LLM para reduzir memória em inferência

KV-cache se tornou um consumidor de memória GPU em grandes LLMs, e uma nova revisão apresenta 10 abordagens — de H2O e SnapKV até TurboQuant

2026-04-30·3 мин
LLM
LLM·MarkTechPost

Poolside lançou Laguna XS.2 e M.1 — modelos abertos para programação com agentes

Poolside apresentou dois modelos Laguna para codificação com agentes: o XS.2 aberto é executado localmente, enquanto o mais poderoso M.1 é p

2026-04-29·3 мин
LLM
LLM·MarkTechPost

LlamaIndex ParseBench: como testar parsing de documentos via Python e Hugging Face

Um guia prático mostra como construir um pipeline de avaliação de analisadores de documentos usando o dataset LlamaIndex ParseBench: carrega

2026-04-29·3 мин
LLM
LLM·MarkTechPost

smol-audio da Deep-unlearning: Uma coleção de notebooks Colab para ajuste fino de modelos de áudio

Deep-unlearning lançou smol-audio — uma coleção de notebooks compatíveis com Colab para ajustar Whisper, Parakeet, Voxtral, Granite Speech e

2026-04-29·3 мин
LLM
LLM·MarkTechPost

Os 10 principais modelos de IA física que controlam robôs reais em 2026

Em 18 meses, a lacuna entre LLMs e a robótica real diminuiu drasticamente: modelos de IA física já funcionam em fábricas, armazéns e laborat

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Hugging Face e Gemma 3 1B: Construindo um Pipeline de Geração Pronto para Produção no Colab

Um breakdown de como executar Gemma 3 1B Instruct no Colab via Hugging Face Transformers: com autorização segura, chat templates e um pipeli

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.ai lança GLM-5V-Turbo — modelo multimodal nativo para programação visual

O laboratório chinês Z.ai lançou GLM-5V-Turbo — um modelo que reconhece diagramas arquitetônicos e capturas de tela e gera imediatamente cód

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google Gemma 4, NVIDIA e OpenClaw: Agentes AI locais sem cobrança por token

Google e NVIDIA estão promovendo a execução local do Gemma 4 em RTX, Jetson e DGX Spark para que agentes AI sempre ativos como OpenClaw func

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Talkie-1930: Pesquisadores lançaram um modelo 13B sem conhecimento da internet e Segunda Guerra Mundial

Talkie-1930 é um modelo 13B aberto, treinado apenas em textos em inglês até 1931, para estudar pensamento histórico, vazamentos de dados e c

2026-04-28·3 мин
LLM
LLM·MarkTechPost

MarkTechPost mostra como construir um agente VLA leve com modelo de mundo latente e MPC

Em um novo tutorial, MarkTechPost detalha como construir um agente embodied simplificado: ele opera em frames RGB, aprende um modelo de mund

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Arcee AI Lança Trinity Large Thinking — Modelo de Raciocínio Aberto para Agentes IA

Arcee AI disponibilizou os pesos do Trinity Large Thinking sob licença Apache 2.0 e aposta em cenários de agentes longos, raciocínio multiet

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NVIDIA mostrou pipeline completo de otimização de modelo com FastNAS pruning e fine-tuning

NVIDIA lançou um guia prático para o Model Optimizer: em um único notebook Colab, demonstra-se treinamento de ResNet20, FastNAS pruning sob

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TII lança Falcon Perception — modelo 0,6B para segmentação e busca de objetos por texto

TII apresentou Falcon Perception — um modelo vision-language compacto com 0,6 bilhão de parâmetros que busca e segmenta objetos a partir de

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google DeepMind Permite que LLM Reescreva Algoritmos da Teoria dos Jogos e Supere Especialistas

Google DeepMind demonstrou que AlphaEvolve pode reescrever código de algoritmos para jogos com informação incompleta e encontrar soluções qu

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.AI mostrou como construir sistemas agentic production-ready no GLM-5 com tool calling

Z.AI lançou um tutorial detalhado sobre GLM-5: desde a configuração do SDK e API compatível com OpenAI até streaming, tool calling, saída JS

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Netflix Abre Void — Modelo para Remover Objetos de Vídeos com Consideração da Física da Cena

A equipe da Netflix e INSAIT lançou em open source o Void — um sistema que remove objetos de vídeos e recalcula simultaneamente quedas, sust

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Como a Inteligência Artificial Ajuda Marcas de Moda a Projetar a Moda do Futuro

Algoritmos já ajudam marcas de moda a criar coleções mais rapidamente, prever tendências, reduzir superprodução e personalizar compras, mas

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Como Construir um Pipeline Netflix Void para Remoção de Objetos em Vídeo usando CogVideoX

Um passo a passo detalhado mostra como implantar o modelo Netflix Void, baixar os checkpoints necessários, preparar dados de entrada e execu

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Gladstone Institutes apresentam MaxToki — modelo de IA que prevê envelhecimento celular

O modelo MaxToki do Gladstone Institutes aprende a ver não um 'instantâneo' da célula, mas sua trajetória ao longo do tempo, avalia a aceler

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TinyFish Lança Plataforma Web Unificada para Agentes de IA com Search, Fetch, Browser e Agent

TinyFish combinou busca, renderização de páginas, sessões de navegador e fluxos de trabalho web autônomos em uma única plataforma para agent

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google adicionou Skills no Chrome e transformou prompts de IA em cenários de um clique

Google lançou a funcionalidade Skills no Chrome: usuários do Gemini poderão salvar prompts frequentemente usados como cenários reutilizáveis

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Google DeepMind Apresenta Gemini Robotics-ER 1.6 para Autonomia e Leitura de Instrumentos por Robôs

Google DeepMind atualizou Gemini Robotics-ER para a versão 1.6: um modelo para robôs que compreende melhor o espaço, múltiplos fluxos de víd

2026-04-28·2 мин
LLM
LLM·MarkTechPost

MarkTechPost desmembrou o ciclo completo de treinamento de grandes modelos de linguagem: dos dados ao deployment

MarkTechPost lançou uma análise detalhada de como os LLMs são construídos hoje: desde o pré-treinamento em grandes corpora até SFT, RLHF, ot

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google apresentou Gemini 3.1 Flash TTS — modelo de fala com controle, diálogos e 70+ idiomas

Google lançou Gemini 3.1 Flash TTS em pré-visualização: o modelo sintetiza texto em 70+ idiomas, suporta diálogos com duas vozes e permite c

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Mem0 e OpenAI: como construir uma camada universal de memória de longo prazo para agentes de IA

Um novo tutorial decompõe a combinação de Mem0, modelos OpenAI e ChromaDB: ela extrai fatos de conversas comuns, armazena-os por user_id, bu

2026-04-28·2 мин
LLM
LLM·MarkTechPost

SmolAgents: Como Construir um Sistema de IA Multi-Agente com Código e Orquestração Dinâmica

Uma análise da implementação do SmolAgents mostra como agentes de IA leves executam código, invocam ferramentas, trabalham com memória e coo

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NetKet e JAX: como construir um modelo Transformer para sistemas de spins frustrados

O guia mostra como construir um pipeline de VMC de pesquisa usando NetKet, JAX e arquitetura Transformer para modelar uma cadeia de spin fru

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI apresentou GPT-Rosalind — um modelo de IA para biologia, genômica e desenvolvimento de medicamentos

OpenAI lançou GPT-Rosalind — um modelo especializado para biologia e farmacêutica que ajuda a acelerar o desenvolvimento de medicamentos, an

2026-04-28·3 мин