MarkTechPost

Google apresentou Auto-Diagnose — sistema de IA para encontrar causas de falhas em testes de integração
Google apresentou Auto-Diagnose — um sistema baseado em Gemini 2.5 Flash que analisa automaticamente logs de testes de integração com falha

OpenAI GPT-OSS: Lançando Modelos Open-Weight no Colab com MXFP4 e Inferência Avançada
Um novo guia explica como lançar openai/gpt-oss-20b no Google Colab: instalar dependências para Transformers, verificar GPU, ativar quantiza

Anthropic lança Claude Opus 4.7 para programação de agentes, visão e tarefas autônomas
Anthropic apresentou Claude Opus 4.7 — uma atualização do modelo de referência com melhorias notáveis em codificação de agentes, análise de

PrismML Bonsai: Como executar um modelo 1-bit em CUDA com GGUF, JSON e RAG
Em um novo tutorial de PrismML Bonsai, cobrimos como executar Bonsai-1.7B em GPU via CUDA e GGUF, medir throughput, configurar chat, saída J

xAI lança APIs Grok separadas para reconhecimento e síntese de fala para desenvolvedores corporativos
xAI separou a pilha de voz do Grok em APIs autônomas: Speech-to-Text e Text-to-Speech para negócios com preços agressivos, suporte multilíng

NVIDIA lançou Ising — a primeira família aberta de modelos de IA para sistemas quântico-clássicos
NVIDIA apresentou Ising — uma família aberta de modelos de IA para calibração de processadores quânticos e correção de erros, para trazer si

Por que LoRA quebra em produção e como RS-LoRA salva o ajuste fino de modelos
LoRA funciona bem com estilo e formato, mas perde sinal ao ajustar com novos fatos; RS-LoRA resolve o problema mudando a fórmula de escalona

OpenKB e OpenRouter mostram como construir uma base de conhecimento IA local com busca em Llama
Um novo tutorial explica como implantar uma base de conhecimento local no OpenKB, conectar um modelo aberto via OpenRouter e configurar a bu

OpenAI e Magika mostraram como construir um pipeline para reconhecimento de arquivos e análise de ameaças
O guia demonstra um pipeline prático onde Magika determina o tipo real do arquivo a partir de bytes, e OpenAI ajuda a interpretar o resultad

Meta apresentou Sapiens2 — um modelo unificado de visão computacional para pose, segmentação e 3D
Meta Reality Labs lançou Sapiens2 — uma família de modelos de visão para análise humana que resolve pose, segmentação, geometria de superfíc

OpenMOSS lança MOSS-Audio — modelo de áudio aberto que supera alternativas maiores
OpenMOSS apresentou MOSS-Audio — um modelo aberto que compreende fala, música e sons ambientes em uma única arquitetura e supera modelos ope

Embeddings OpenAI e RL: Como Construir um Agente com Memória de Longo Prazo para Respostas Precisas
O tutorial mostra como treinar um agente RL para selecionar registros relevantes da memória de longo prazo, de forma que uma LLM responda co

Como Medir a Inteligência Real: Principais Benchmarks para Agentes de IA
Testes clássicos não refletem mais as capacidades reais das redes neurais. Exploramos quais benchmarks realmente mostram se um agente de IA

Memória Elástica para IA: Como kvcached Resolve a Escassez de GPU
A distribuição dinâmica de cache KV promete reduzir drasticamente o custo de hospedagem de modelos de linguagem, permitindo o compartilhamen

Modelo de Voz da xAI Supera GPT Realtime em Tarefas Empresariais
A empresa de Elon Musk, xAI, apresentou o grok-voice-think-fast-1.0. O novo modelo superou soluções da OpenAI e Google no gerenciamento de f

GitNexus: Como uma nova ferramenta ensinou agentes IA a compreender estruturalmente o código
Assistentes de IA são excelentes em escrever código local, mas frequentemente não conseguem entender a arquitetura global de projetos. O pro

DeepSeek-V4: Como novos algoritmos de compressão tornaram o contexto de um milhão de tokens uma realidade
A DeepSeek apresentou a quarta geração de seus modelos. Através da compressão radical de atenção, o processamento de enormes volumes de dado

Arquitetura Decoupled DiLoCo do DeepMind Resolve Problema de Escalabilidade da IA
O treinamento de modelos avançados de IA sempre foi refém de falhas de hardware: a quebra de um chip paralisava todo o cluster. Uma nova arq

OpenMythos: reconstrução open-source da arquitetura Claude Mythos em PyTorch com 770M parâmetros
O desenvolvedor Kye Gomez reconstruiu a presumida arquitetura Claude Mythos da Anthropic do zero — sem vazamentos, apenas com base em pesqui

OpenAI Expande GPT-5.4-Cyber para Profissionais Verificados de Segurança Cibernética
OpenAI abre acesso amplo ao GPT-5.4-Cyber — uma versão refinada do GPT-5.4 sem restrições padrão para milhares de defensores verificados.

Moonshot AI lança Kimi K2.6: modelo agêntico com um enxame de 300 subagentes
O laboratório chinês Moonshot AI abriu o código-fonte do Kimi K2.6, um modelo agêntico multimodal que coordena autonomamente até 300 subagen

Phi-4-Mini da Microsoft: implementação de quantização, RAG e LoRA em um único notebook Jupyter
O tutorial mostra o pipeline completo com o Phi-4-mini-instruct: quantização de 4 bits, geração em streaming, raciocínio, chamada de ferrame

Qwen 3.6-35B-A3B na prática: multimodalidade, MoE e RAG em um único pipeline
Uma análise detalhada da implementação do Qwen 3.6-35B-A3B, do carregamento do modelo a RAG, tool calling e persistência de sessões em fluxo

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ
Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде
OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве
Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности
Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов
Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и