Habr AI

NextFilm describe modelo de recomendación de películas: cold start, vector de gusto y capa GPT
El autor de NextFilm mostró cómo recomendar películas a nuevos usuarios: recopilar calificaciones iniciales, construir un vector de gusto, c

El desarrollador de n0x enseñó a su agente de navegador a abrir sitios y tomar capturas de pantalla
El proyecto n0x evolucionó de un simple chatbot de lenguaje a un agente de navegador con soporte MCP: ahora abre sitios web, toma capturas d

Anthropic prueba Claude Mythos: fuga revela modelo con 10 billones de parámetros
Una fuga interna de Anthropic ha revelado Claude Mythos — un modelo que la empresa considera su IA más poderoso y aún no está listo para lan

Anthropic y OpenClaude: por qué el 'gratuito' Claude Code en 2026 no es tan gratuito
Después de la filtración del código fuente de Claude Code, la comunidad rápidamente ensambló OpenClaude, pero tras la promesa de codificació

Cómo una única instrucción de sistema convierte un LLM en una herramienta confiable: pruebas en Qwen y DeepSeek
Un único prompt de sistema puede eliminar alucinaciones en LLM: un experimento con Qwen y DeepSeek mostró que un 'exoesqueleto' de reglas co

T-Technologies sobre open source en AI/ML: cómo se organiza el trabajo con LLM internamente
Entrevista con el equipo AI/ML del Grupo T-Technologies — sobre desarrollo de LLM, participación en open source y dirección de investigación

NVIDIA en GTC 2026 cambia el enfoque de chips a fábricas de tokens y la era de Agent-as-a-Service
En GTC 2026, NVIDIA presentó una apuesta no en GPUs individuales, sino en fábricas de tokens, la arquitectura modular Vera Rubin y la econom

PageIndex de VectifyAI ofrece búsqueda sin embeddings para documentos largos
PageIndex construye un índice estructurado en árbol del documento y busca secciones relevantes mediante razonamiento LLM, prometiendo RAG si

GolangConf 2026 y Ontiko: por qué los equipos de Go necesitan arreglar la arquitectura, no la velocidad del código
Ontiko está reestructurando GolangConf 2026 alrededor de los problemas reales de los equipos de Go: la IA aceleró la escritura de código, pe

ruGPT3XL Gana Contexto de 8k: Modelo Restaurado Supera Límite de 2k con Pérdidas Mínimas
El autor de la restauración de ruGPT3XL corrigió sparse attention, aumentó el contexto del modelo de 2k a 8k y preservó la calidad en secuen

OpenAI, MiniMax y Nvidia marcaron el tono de marzo en IA: Sora, GPT-5.4 y la apuesta por Mira Murati
Marzo en IA estuvo marcado por grandes cambios de productos: OpenAI reconsidera el futuro de Sora, Google y Anthropic aceleran sus asistente

Startups AI-first: por qué el growth marketing se estanca y qué se rompe en el funnel
Los productos AI-first suelen tener métricas fuertes en la parte superior del funnel que ocultan demanda falsa: la gente viene por la noveda

Habr: Los agentes de IA cambian el delivery, y los equipos deben reconstruir todo el ciclo de desarrollo
Habr explica por qué con la aparición de agentes de IA, los equipos necesitan reestructurar no solo la escritura de código sino todo el deli

M2 delegó el 40% de sus textos de marketing a una red neuronal y mantuvo la calidad del contenido
El equipo de M2 integró un redactor de IA en su departamento editorial interno, delegó el 40% de los textos de productos y marketing al mode

Sova AI lanzó asistente Android que controla teléfono sin PC ni root
Sova AI presentó una aplicación Android con agente IA que abre aplicaciones, presiona botones, desplaza pantallas y ejecuta comandos de voz

API de OpenAI y Consultas Fan-Out de GPT: Cómo los Especialistas en SEO Analizan la Búsqueda por IA
El autor demuestra cómo obtener consultas fan-out ocultas de GPT a través de la API de OpenAI y utilizarlas para analizar cómo los modelos d

Hack The Box: Cómo MCP Inspector Convierte Herramientas de IA en un Nuevo Vector de Ataque
Un análisis de Kobold de HTB Season 10 muestra cómo una única utilidad dev para servidores de IA puede conducir a RCE, LFI, reutilización de

Sistema basado en LLM redujo preparación de mapas de control de calidad en fábrica metalúrgica de 2 horas a 5 minutos
En una fábrica metalúrgica, un sistema LLM comenzó a ensamblar mapas de control de calidad en 3–5 minutos en lugar de dos horas: no un promp

Habr AI muestra cómo agregar memoria y contexto a un chat LLM en Python con Ollama y LiteLLM
En una nueva parte del tutorial sobre chat en Python con Ollama y LiteLLM, se muestra cómo almacenar el historial de mensajes, pasar context

Claude Sonnet y Jarvis Pattern: por qué los agentes de IA podrían necesitar solo un sistema operativo
En Habr propusieron construir agentes de IA personales no alrededor de frameworks complejos, sino sobre una combinación de LLM, sistema oper

Yandex mostró cómo llegar a las respuestas de Alice y medir la visibilidad en búsqueda
Yandex lanzó una sección 'Visibilidad del Sitio en Alice' en Webmaster. El mensaje para los negocios es claro: las respuestas del asistente

Flant: cómo un desarrollador Go convirtió Zed y Gemini en un agente IA útil
Un desarrollador Go de Flant describió el camino desde plugins IDE lentos hacia una combinación de Zed, Gemini 3 Flash y gopls-mcp, que prop

Agentis Memory: Almacenamiento Compatible con Redis con Búsqueda Vectorial e Embeddings Locales
Agentis Memory transforma un almacenamiento compatible con Redis en memoria compartida para agentes de IA: con embeddings locales, búsqueda

Habr: cómo los datos sintéticos ayudan a entrenar modelos y por qué el self-training conduce al colapso
Los datos sintéticos ayudan a la IA a compensar la escasez de corpus de alta calidad generados por humanos, pero con self-training incontrol

Por qué ChatGPT y Gemini no recomiendan tu B2B SaaS, aunque el sitio esté bien hecho
Incluso un sitio de B2B SaaS bien diseñado puede no aparecer en las respuestas de ChatGPT, Gemini y Perplexity si tu marca carece de una cat

Por qué la IA en diseño de UI es importante no para producción, sino como fuente de mutaciones visuales
La UI generada por IA es valiosa no solo por la velocidad de bocetos: su poder radica en combinaciones visuales raras que ayudan a los diseñ

Qwen y llama.cpp: cómo ejecutar una red neuronal local sin nube en tu computadora o servidor
Una guía práctica que explica cómo ejecutar el modelo Qwen a través de llama.cpp en tu propio computador o servidor para trabajar con una re

Anthropic y Claude Cowork: 10 tareas laborales que la IA quita a los humanos
Claude Cowork de Anthropic demuestra cómo la IA asume briefings matutinos, propuestas, respuestas a clientes e informes, devolviendo dos a t

Directum: por qué los negocios discuten activamente agentes de IA pero dudan en implementarlos en procesos
Directum explica por qué los agentes de IA se convirtieron en la principal tendencia corporativa, pero la adopción masiva está obstaculizada

ClawRouter redujo los costos de LLM API de $47 a $1.80 por semana — análisis del enrutador inteligente
ClawRouter analiza cada prompt en 15 parámetros y lo dirige al modelo más apropiado y económico — reduciendo gastos semanales en LLM API de