Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Google apresentou Auto-Diagnose — sistema de IA para encontrar causas de falhas em testes de integração

Google apresentou Auto-Diagnose — um sistema baseado em Gemini 2.5 Flash que analisa automaticamente logs de testes de integração com falha

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI GPT-OSS: Lançando Modelos Open-Weight no Colab com MXFP4 e Inferência Avançada

Um novo guia explica como lançar openai/gpt-oss-20b no Google Colab: instalar dependências para Transformers, verificar GPU, ativar quantiza

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Anthropic lança Claude Opus 4.7 para programação de agentes, visão e tarefas autônomas

Anthropic apresentou Claude Opus 4.7 — uma atualização do modelo de referência com melhorias notáveis em codificação de agentes, análise de

2026-04-27·3 мин
LLM
LLM·MarkTechPost

PrismML Bonsai: Como executar um modelo 1-bit em CUDA com GGUF, JSON e RAG

Em um novo tutorial de PrismML Bonsai, cobrimos como executar Bonsai-1.7B em GPU via CUDA e GGUF, medir throughput, configurar chat, saída J

2026-04-27·2 мин
LLM
LLM·MarkTechPost

xAI lança APIs Grok separadas para reconhecimento e síntese de fala para desenvolvedores corporativos

xAI separou a pilha de voz do Grok em APIs autônomas: Speech-to-Text e Text-to-Speech para negócios com preços agressivos, suporte multilíng

2026-04-27·3 мин
LLM
LLM·MarkTechPost

NVIDIA lançou Ising — a primeira família aberta de modelos de IA para sistemas quântico-clássicos

NVIDIA apresentou Ising — uma família aberta de modelos de IA para calibração de processadores quânticos e correção de erros, para trazer si

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Por que LoRA quebra em produção e como RS-LoRA salva o ajuste fino de modelos

LoRA funciona bem com estilo e formato, mas perde sinal ao ajustar com novos fatos; RS-LoRA resolve o problema mudando a fórmula de escalona

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenKB e OpenRouter mostram como construir uma base de conhecimento IA local com busca em Llama

Um novo tutorial explica como implantar uma base de conhecimento local no OpenKB, conectar um modelo aberto via OpenRouter e configurar a bu

2026-04-27·2 мин
LLM
LLM·MarkTechPost

OpenAI e Magika mostraram como construir um pipeline para reconhecimento de arquivos e análise de ameaças

O guia demonstra um pipeline prático onde Magika determina o tipo real do arquivo a partir de bytes, e OpenAI ajuda a interpretar o resultad

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Meta apresentou Sapiens2 — um modelo unificado de visão computacional para pose, segmentação e 3D

Meta Reality Labs lançou Sapiens2 — uma família de modelos de visão para análise humana que resolve pose, segmentação, geometria de superfíc

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenMOSS lança MOSS-Audio — modelo de áudio aberto que supera alternativas maiores

OpenMOSS apresentou MOSS-Audio — um modelo aberto que compreende fala, música e sons ambientes em uma única arquitetura e supera modelos ope

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Embeddings OpenAI e RL: Como Construir um Agente com Memória de Longo Prazo para Respostas Precisas

O tutorial mostra como treinar um agente RL para selecionar registros relevantes da memória de longo prazo, de forma que uma LLM responda co

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Como Medir a Inteligência Real: Principais Benchmarks para Agentes de IA

Testes clássicos não refletem mais as capacidades reais das redes neurais. Exploramos quais benchmarks realmente mostram se um agente de IA

2026-04-26·2 мин
LLM
LLM·MarkTechPost

Memória Elástica para IA: Como kvcached Resolve a Escassez de GPU

A distribuição dinâmica de cache KV promete reduzir drasticamente o custo de hospedagem de modelos de linguagem, permitindo o compartilhamen

2026-04-26·3 мин
LLM
LLM·MarkTechPost

Modelo de Voz da xAI Supera GPT Realtime em Tarefas Empresariais

A empresa de Elon Musk, xAI, apresentou o grok-voice-think-fast-1.0. O novo modelo superou soluções da OpenAI e Google no gerenciamento de f

2026-04-26·2 мин
LLM
LLM·MarkTechPost

GitNexus: Como uma nova ferramenta ensinou agentes IA a compreender estruturalmente o código

Assistentes de IA são excelentes em escrever código local, mas frequentemente não conseguem entender a arquitetura global de projetos. O pro

2026-04-26·3 мин
LLM
LLM·MarkTechPost

DeepSeek-V4: Como novos algoritmos de compressão tornaram o contexto de um milhão de tokens uma realidade

A DeepSeek apresentou a quarta geração de seus modelos. Através da compressão radical de atenção, o processamento de enormes volumes de dado

2026-04-26·3 мин
LLM
LLM·MarkTechPost

Arquitetura Decoupled DiLoCo do DeepMind Resolve Problema de Escalabilidade da IA

O treinamento de modelos avançados de IA sempre foi refém de falhas de hardware: a quebra de um chip paralisava todo o cluster. Uma nova arq

2026-04-26·2 мин
LLM
LLM·MarkTechPost

OpenMythos: reconstrução open-source da arquitetura Claude Mythos em PyTorch com 770M parâmetros

O desenvolvedor Kye Gomez reconstruiu a presumida arquitetura Claude Mythos da Anthropic do zero — sem vazamentos, apenas com base em pesqui

2026-04-23·2 мин
LLM
LLM·MarkTechPost

OpenAI Expande GPT-5.4-Cyber para Profissionais Verificados de Segurança Cibernética

OpenAI abre acesso amplo ao GPT-5.4-Cyber — uma versão refinada do GPT-5.4 sem restrições padrão para milhares de defensores verificados.

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Moonshot AI lança Kimi K2.6: modelo agêntico com um enxame de 300 subagentes

O laboratório chinês Moonshot AI abriu o código-fonte do Kimi K2.6, um modelo agêntico multimodal que coordena autonomamente até 300 subagen

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Phi-4-Mini da Microsoft: implementação de quantização, RAG e LoRA em um único notebook Jupyter

O tutorial mostra o pipeline completo com o Phi-4-mini-instruct: quantização de 4 bits, geração em streaming, raciocínio, chamada de ferrame

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Qwen 3.6-35B-A3B na prática: multimodalidade, MoE e RAG em um único pipeline

Uma análise detalhada da implementação do Qwen 3.6-35B-A3B, do carregamento do modelo a RAG, tool calling e persistência de sessões em fluxo

2026-04-22·1 мин
LLM
LLM·MarkTechPost

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров

Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

2026-03-11·2 мин
LLM
LLM·MarkTechPost

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ

Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Google запустила Android Bench для оценки ИИ в мобильной разработке

Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

2026-03-07·2 мин
LLM
LLM·MarkTechPost

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде

OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве

Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

2026-03-06·3 мин
LLM
LLM·MarkTechPost

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности

Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

2026-03-05·3 мин
LLM
LLM·MarkTechPost

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов

Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и

2026-03-03·3 мин