Источник

Habr AI

708
всего статей
403
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·Habr AI

NextFilm descreve modelo de recomendação de filmes: cold start, vetor de gosto e camada GPT

O autor do NextFilm mostrou como recomendar filmes a novos usuários: coletar avaliações iniciais, construir um vetor de gosto, compará-lo co

2026-04-28·3 мин
LLM
LLM·Habr AI

Desenvolvedor do n0x ensinou seu agente de navegador a abrir sites e tirar capturas de tela

O projeto n0x evoluiu de um simples chatbot de linguagem para um agente de navegador com suporte a MCP: agora ele abre sites, tira capturas

2026-04-28·3 мин
LLM
LLM·Habr AI

Anthropic testa Claude Mythos: vazamento revela modelo com 10 trilhões de parâmetros

Um vazamento interno da Anthropic revelou Claude Mythos — um modelo que a empresa considera seu IA mais poderoso e ainda não está pronta par

2026-04-28·2 мин
LLM
LLM·Habr AI

Anthropic e OpenClaude: por que o Claude Code 'grátis' em 2026 não é tão grátis assim

Após o vazamento do código-fonte do Claude Code, a comunidade rapidamente montou o OpenClaude, mas por trás da promessa de codificação AI gr

2026-04-28·3 мин
LLM
LLM·Habr AI

Como uma única instrução de sistema transforma um LLM em uma ferramenta confiável: testes em Qwen e DeepSeek

Um único prompt de sistema pode eliminar alucinações em LLM: um experimento com Qwen e DeepSeek mostrou que um 'exoesqueleto' de regras tran

2026-04-28·2 мин
LLM
LLM·Habr AI

T-Technologies sobre open source em AI/ML: como o trabalho com LLM é organizado internamente

Entrevista com o time AI/ML do Grupo T-Technologies — sobre desenvolvimento de LLM, participação em open source e direcionamento de pesquisa

2026-04-28·1 мин
LLM
LLM·Habr AI

NVIDIA na GTC 2026 muda foco de chips para fábricas de tokens e a era de Agent-as-a-Service

Na GTC 2026, a NVIDIA apresentou uma aposta não em GPUs individuais, mas em fábricas de tokens, a arquitetura modular Vera Rubin e a economi

2026-04-28·3 мин
LLM
LLM·Habr AI

PageIndex da VectifyAI oferece busca sem embeddings para documentos longos

PageIndex constrói um índice estruturado em árvore do documento e busca seções relevantes através de raciocínio LLM, prometendo RAG sem embe

2026-04-28·2 мин
LLM
LLM·Habr AI

GolangConf 2026 e Ontiko: por que times Go precisam consertar a arquitetura, não a velocidade do código

Ontiko está reestruturando GolangConf 2026 em torno dos problemas reais dos times Go: a IA acelerou a escrita de código, mas decisões arquit

2026-04-28·3 мин
LLM
LLM·Habr AI

ruGPT3XL Ganha Contexto de 8k: Modelo Restaurado Ultrapassa Limite de 2k com Mínimas Perdas

O autor da restauração do ruGPT3XL corrigiu sparse attention, aumentou o contexto do modelo de 2k para 8k e preservou a qualidade em sequênc

2026-04-28·2 мин
LLM
LLM·Habr AI

OpenAI, MiniMax e Nvidia determinaram o tom de março em IA: Sora, GPT-5.4 e a aposta em Mira Murati

Março em IA foi marcado por grandes mudanças de produtos: OpenAI reconsidera o futuro de Sora, Google e Anthropic aceleram seus assistentes,

2026-04-28·2 мин
LLM
LLM·Habr AI

Startups AI-first: por que o growth marketing não funciona e o que quebra no funil

Produtos AI-first costumam ter métricas fortes no topo do funil que mascaram demanda falsa: pessoas chegam pela novidade, não para resolver

2026-04-28·2 мин
LLM
LLM·Habr AI

Habr: Agentes de IA transformam delivery, e equipes precisam reconstruir todo o ciclo de desenvolvimento

Habr explica por que com o surgimento de agentes de IA, as equipes precisam reestruturar não apenas a escrita de código, mas todo o delivery

2026-04-28·3 мин
LLM
LLM·Habr AI

M2 delegou 40% dos textos de marketing a uma rede neural e manteve a qualidade do conteúdo

A equipe da M2 integrou um redator de IA no seu departamento editorial interno, delegou 40% dos textos de produtos e marketing para ele e ma

2026-04-28·2 мин
LLM
LLM·Habr AI

Sova AI lança assistente Android que controla telefone sem PC e root

Sova AI apresentou um aplicativo Android com agente IA que abre aplicativos, pressiona botões, faz scroll em telas e executa comandos de voz

2026-04-28·2 мин
LLM
LLM·Habr AI

API de OpenAI e Consultas Fan-Out do GPT: Como Especialistas em SEO Analisam a Busca por IA

O autor demonstra como obter consultas fan-out ocultas do GPT via API OpenAI e usá-las para analisar como modelos de IA coletam fontes e ger

2026-04-28·2 мин
LLM
LLM·Habr AI

Hack The Box: Como MCP Inspector Transforma Ferramentas de IA em um Novo Vetor de Ataque

Uma análise do Kobold do HTB Season 10 mostra como um único utilitário dev para servidores de IA pode levar a RCE, LFI, reutilização de cred

2026-04-28·2 мин
LLM
LLM·Habr AI

Sistema baseado em LLM reduziu preparação de mapas de controle de qualidade em fábrica metalúrgica de 2 horas para 5 minutos

Em uma fábrica metalúrgica, um sistema LLM começou a montar mapas de controle de qualidade em 3–5 minutos em vez de duas horas: não um promp

2026-04-28·3 мин
LLM
LLM·Habr AI

Habr AI mostra como adicionar memória e contexto a um chat LLM em Python com Ollama e LiteLLM

Em uma nova parte do tutorial sobre chat em Python com Ollama e LiteLLM, é demonstrado como armazenar o histórico de mensagens, transmitir c

2026-04-28·3 мин
LLM
LLM·Habr AI

Claude Sonnet e Jarvis Pattern: por que agentes de IA podem precisar apenas de um sistema operacional

No Habr, propuseram construir agentes de IA pessoais não em torno de frameworks complexos, mas em uma combinação de LLM, sistema operacional

2026-04-28·2 мин
LLM
LLM·Habr AI

Yandex mostrou como chegar às respostas do Alice e medir visibilidade de busca

Yandex lançou uma seção 'Visibilidade do Site no Alice' no Webmaster. A mensagem para os negócios é clara: respostas do assistente vêm não d

2026-04-28·2 мин
LLM
LLM·Habr AI

Flant: como um desenvolvedor Go transformou Zed e Gemini em um agente IA útil

Um desenvolvedor Go da Flant descreveu o caminho desde plugins IDE lentos até uma combinação de Zed, Gemini 3 Flash e gopls-mcp, que fornece

2026-04-28·3 мин
LLM
LLM·Habr AI

Agentis Memory: Armazenamento Compatível com Redis com Busca Vetorial e Embeddings Locais

Agentis Memory transforma um armazenamento compatível com Redis em memória compartilhada para agentes de IA: com embeddings locais, busca ve

2026-04-28·3 мин
LLM
LLM·Habr AI

Habr: como dados sintéticos ajudam a treinar modelos e por que self-training leva ao colapso

Dados sintéticos ajudam a IA a compensar a escassez de corpus de alta qualidade gerados por humanos, mas com self-training descontrolado, mo

2026-04-28·2 мин
LLM
LLM·Habr AI

Por que ChatGPT e Gemini não recomendam seu B2B SaaS, mesmo que o site seja bem construído

Até um site de B2B SaaS bem projetado pode não aparecer nas respostas de ChatGPT, Gemini e Perplexity se a marca não tiver uma categoria cla

2026-04-28·2 мин
LLM
LLM·Habr AI

Por que IA em Design de UI é importante não para produção, mas como fonte de mutações visuais

UI gerada por IA é valiosa não apenas pela velocidade de sketches: seu poder reside em combinações visuais raras que ajudam designers a enco

2026-04-28·2 мин
LLM
LLM·Habr AI

Qwen e llama.cpp: como executar uma rede neural local sem nuvem no seu computador ou servidor

Um guia prático explicando como executar o modelo Qwen através de llama.cpp em seu próprio computador ou servidor para trabalhar com uma red

2026-04-28·2 мин
LLM
LLM·Habr AI

Anthropic e Claude Cowork: 10 tarefas de trabalho que a IA tira dos humanos

Claude Cowork da Anthropic demonstra como a IA assume briefings matutinos, propostas, respostas a clientes e relatórios, devolvendo até dois

2026-04-28·2 мин
LLM
LLM·Habr AI

Directum: por que os negócios discutem ativamente agentes de IA mas hesitam em implementá-los nos processos

Directum explica por que os agentes de IA se tornaram a principal tendência corporativa, mas a adoção em massa é impedida por infraestrutura

2026-04-28·2 мин
LLM
LLM·Habr AI

ClawRouter reduziu custos de LLM API de $47 para $1.80 por semana — análise do roteador inteligente

O ClawRouter analisa cada prompt em 15 parâmetros e o roteia para o modelo mais adequado e econômico — reduzindo despesas semanais com LLM A

2026-04-28·2 мин