Habr AI

Anthropic y ETH Zurich: un CLAUDE.md largo empeora el rendimiento del agente y eleva los costos
Un estudio de ETH Zurich sobre 138 repositorios mostró que los archivos CLAUDE.md y AGENTS.md largos a menudo reducen la tasa de éxito de lo

Gemini 3.1 Pro superó a ChatGPT 5.4 y Claude Opus 4.6 en una prueba de generación de texto
Una comparación del autor entre tres modelos punteros en cuatro tareas literarias mostró que Gemini 3.1 Pro mantiene mejor el género, la emo

Anthropic, OpenAI y Cursor: ocho niveles de madurez de la ingeniería de agentes
Habr AI analizó ocho niveles de la ingeniería de agentes, desde tab-complete y context engineering hasta background agents y equipos autónom

AMD RX580 ejecutó un LLM localmente: cómo superar ROCm, Ollama y lograr inferencia en GPU
Un ingeniero mostró cómo hacer que una vieja AMD RX580 ejecute un LLM de forma estable con ROCm y Ollama, desglosando las señales falsas de

Por qué Claude 4.6 no basta sin contexto: el principal punto ciego del desarrollo con LLM
Incluso un modelo sólido como Claude 4.6 pierde eficacia sin un contexto reunido de forma sistemática: knowledge base, conexiones entre serv

Desarrollador crea agregador de noticias con AI, MCP, DeepSeek y bot de Telegram
Tras el ataque de drones sobre Dubái, un desarrollador creó un agregador de noticias multilingüe: 80+ fuentes, un servidor MCP para agentes

BorisovAI probó MoE en una RTX 4090 y mostró por qué la perplejidad compromete la evaluación de LLM
BorisovAI probó MoE con expertos plug-in en una sola RTX 4090 y descubrió que una perplejidad llamativa no garantiza una mejora real de la c

Un experimento con LLM mostró cómo surge la “personalidad” del modelo en el espacio latente
Un experimento con una LLM modular mostró que un vector latente independiente puede almacenar no solo el estilo del texto, sino también rasg

Nvidia insinúa antes de GTC 2026 un chip óptico capaz de reconfigurar los centros de datos de AI
Antes de su presentación del 16 de marzo de 2026, Nvidia avivó las expectativas del mercado con la promesa de “un chip que sacudirá al mundo

Por qué los avances de DeepMind en AGI no responden a la pregunta clave sobre la conciencia de máquina
El autor explica por qué el aumento de la potencia de cómputo y los avances de DeepMind en AGI no equivalen a la aparición de la conciencia:

Habr AI sobre el futuro del trabajo: cómo AI y los robots pueden devolver a la sociedad a una nueva Antigüedad
Habr AI sostiene que la combinación de AI, robotización y neuroimplantes puede no solo cambiar el mercado laboral, sino dividir a la socieda

Unity mostró cómo crear NPCs con voz, memoria y contexto del mundo
Una guía paso a paso muestra cómo crear NPCs con voz en Unity con un modelo local, memoria de diálogos, conocimiento del mundo del juego y r

Harvard: AI reduce la contratación de juniors, y en tres años eso podría afectar a toda la industria
Harvard registra una caída en la contratación de juniors tras la adopción de AI, mientras que METR apunta a una dependencia creciente de los

DeepSeek y GLM-5 superaron a Yandex en una prueba de 34 modelos de AI para gerentes sin VPN
Los autores de una gran prueba de escenarios de gestión concluyeron que DeepSeek V3.2 y GLM-5, disponibles en Rusia sin VPN, rinden notablem

Google lanzó Gemini Embedding 2 para RAG multimodal con video, audio y PDF
Google lanzó Gemini Embedding 2, un modelo que vectoriza texto, imágenes, video, audio y PDF en un solo espacio y simplifica la creación de

Bitrix24 enumeró ocho errores típicos al desarrollar servidores MCP para LLMs
Un desarrollador de Bitrix24 explicó por qué los servidores MCP fallan en la autorización, las cadenas de llamadas, las malas descripciones

Por qué la idea de world model de Yann LeCun no resuelve la principal crisis en el desarrollo de LLMs
Tras la salida de Yann LeCun de Meta, su concepto de world model vuelve a debatirse como una vía más allá de los LLMs, pero los críticos cre

Montaron un pipeline de Physical AI para SO-101 sobre ROS2 y LeRobot por 30 mil rublos
Un stack open-source basado en ROS2 y LeRobot permite montar un pipeline completo de Physical AI en el SO-101 de bajo costo: teleoperación,

SimpleOne lanzó SimpleGen — herramienta de AI para desarrollo y despliegue en la plataforma
SimpleOne presentó SimpleGen — una herramienta de AI para generar soluciones en su plataforma: al desarrollador le basta con preparar un rep

Google AI Ultra: cómo convertir una suscripción en un pool de agentes paralelos y consenso entre modelos
Google AI Ultra se propone como base para un stack multiagente: ejecutar workers paralelos de Gemini, delegar rutinas y contrastar decisione

Sam Altman y el Pentágono: cómo los contratos militares podrían convertirse en un seguro para OpenAI
Una columna sobre el vínculo entre OpenAI y el Pentágono sostiene que los contratos militares dan a la empresa de Sam Altman no solo dinero

OpenAI lanzó GPT-5.4 Pro: nuevos récords en ARC-AGI-2, FrontierMath y lógica
OpenAI presentó GPT-5.4 Pro, un modelo que dio un salto importante en benchmarks complejos, resuelve mejor las tareas de razonamiento y mane

nullClaw en Zig superó a OpenClaw en uso de memoria y arranque en pruebas locales de agentes de AI
nullClaw, un runtime ligero de AI en Zig, mostró un arranque casi instantáneo y un consumo de memoria varias veces menor en una comparación

ChatGPT 5.4 de OpenAI superó a Claude Opus 4.6 y Gemini 3.1 Pro en una comparativa de Habr
Habr publicó una comparativa de tres modelos insignia en tareas rutinarias: ChatGPT 5.4 quedó en primer lugar por puntuación total, Gemini 3

Estudio: Cursor acelera el inicio del desarrollo, pero luego aumenta la deuda técnica del equipo
Un estudio sobre Cursor mostró que el asistente de AI acelera de forma drástica la entrega de código en las primeras semanas, pero después a

Yandex en AI Dev Day mostró cómo la IA ya está cambiando el desarrollo en Avito, Ozon y T-Bank
En AI Dev Day, las empresas Yandex, Avito, Ozon, T-Bank y Sber demostraron dónde la IA ya está acelerando el desarrollo y dónde el efecto aú

Cómo AI está cambiando el desarrollo indie: competir es cada vez más difícil para los desarrolladores en solitario
El autor de la columna sostiene que AI aceleró el lanzamiento de MVPs, pero al mismo tiempo elevó la barrera de entrada, intensificó la comp

Una empresa sin gerentes: tres trampas en las que caen las empresas al implementar AI
De 50 directivos en ProIT Fest, solo tres dijeron que AI realmente facilitó la toma de decisiones, aunque cada vez hay menos gerentes en las

Bitrix24 mostró cómo añadir cuatro robots de automatización a un portal empresarial
Bitrix24 publicó la continuación de su serie práctica y mostró cómo integrar cuatro robots en un portal empresarial: para limpiar números de

Anthropic explicó cómo crear skills para Claude Code y por qué los equipos necesitan su propio marketplace
Anthropic mostró qué skills realmente funcionan en Claude Code, cómo escribirlas sin ruido innecesario y por qué los equipos grandes necesit