Habr AI

Por qué los modelos de OpenAI, Google y Anthropic se vuelven más convincentes pero cometen más errores
Los grandes laboratorios de IA intentan corregir errores de modelos con computaciones adicionales, pero cuanto más convincentes se vuelven l

Habr AI: Por qué los modelos de lenguaje necesitan guardrails y cómo defenderse del prompt hacking
Habr AI examina por qué los LLMs ahora requieren una capa de protección separada: desde contenido tóxico y fugas de datos hasta inyección de

Ingeniero de Selectel Mostró Agente LLM para Selección Automática de Dominios Disponibles
Un ingeniero de Selectel construyó un servicio en Python que solicita a un LLM generar nombres de dominio y los verifica inmediatamente a tr

Anthropic Explicó Cómo y Cuándo Iniciar Correctamente una Nueva Sesión en Claude Code
Anthropic lanzó el comando /usage y explicó cómo gestionar sesiones en Claude Code para que un millón de tokens de contexto no se conviertan

Niantic Muestra Cómo Pokémon Go Convierte Acciones de Jugadores en Datasets para IA
Niantic, Google y otras empresas transforman cada vez más acciones ordinarias de usuarios — desde juegos y viajes hasta CAPTCHAs — en datos

Positive Technologies enumeró los mejores benchmarks para evaluar LLM en ciberseguridad
Positive Technologies dividió los benchmarks de ciberseguridad para LLM en pruebas de conocimiento y evaluaciones prácticas, demostrando que

Deflación de IA en TI: Los casos Klarna e IBM explican por qué hay más vacantes pero crecimiento salarial más débil
Una nueva paradoja ha surgido en el desarrollo: hay 11% más vacantes para ingenieros, pero el crecimiento salarial en TI se ha desacelerado

MTS mostró cómo se conectó OpenClaw a un robot y se llevó un agente de IA al mundo físico
El equipo MWS demostró que OpenClaw puede conectarse a un robot físico a través de una capa de software simple y LLM en la nube sin construi

Claude Sonnet Ayuda a Ejecutivos a Construir Director de IA para Decisiones Críticas en 8 Horas
En el hackathon cerrado Snow BASE, un equipo de CEO, CTO y CIO ensamblió CAITO en ocho horas — un director de IA en Claude Sonnet que cambia

Por qué ServiceNow, Atlassian y BMC están transformando el mercado de ITSM y el debate sobre plataforma en 2026
El mercado de ITSM con IA se está desplazando de chatbots a infraestructura gestionada, donde la seguridad, escalabilidad y control de agent

ServiceNow y Atlassian Lideran el Mercado ITSM Hacia Plataformas de IA en lugar de Soluciones Empaquetadas
La IA en ITSM está cambiando rápidamente de chatbots a infraestructura administrada: el mercado compara enfoques de plataforma y soluciones

Wildberries & Russ describió qué nivel de madurez de datos se necesita para agentes de IA precisos
Wildberries & Russ describió un modelo de madurez de datos de tres niveles donde la calidad de los metadatos y la capa semántica determina d

Midjourney en 2026: por qué un fuerte estilo visual no lo hace universal
Un análisis de Midjourney muestra que en 2026, su principal fortaleza no es la universalidad, sino el estilo reconocible y el control profun

Cursor y Microsoft Research Prueban si los Agentes de IA Necesitan Acceso Completo al Depurador
Un experimento con Debug2Fix y Modo Depuración de Cursor muestra que los puntos de interrupción, la ejecución paso a paso y la evaluación de

Raft mostró cómo priorizar iniciativas de AI y construir una hoja de ruta realista
Raft analizó cómo evaluar el valor de las iniciativas de AI, filtrar ideas débiles a través de una matriz de viabilidad y construir una hoja

Gemma 4 en Codex CLI: la ejecución local funciona, pero sigue siendo más débil que la nube
Las pruebas de Gemma 4 local en Codex CLI mostraron que el modelo ya puede trabajar con tool calling y pasar pruebas, pero sigue siendo infe

Por qué los LLM crean una ilusión de creatividad y no garantizan verdadera novedad de ideas
Los LLM ayudan a desarrollar rápidamente una idea y llevarla a su forma final, pero su estilo confiado enmascara fácilmente la secundariedad

Cómo los Agentes de IA e IBM Están Transformando la Gestión de Proyectos de TI y el Papel del Gestor de Proyectos
Los agentes de IA van más allá de los chatbots: ya ayudan a los gestores de proyectos a planificar sprints, evaluar riesgos y resolver incid

StudyAI: Cómo la IA Generativa Socava la Confianza en Textos, Voces y Vídeos en Línea
StudyAI analiza cómo la IA generativa hace los deepfakes más convincentes, desvaloriza las pruebas digitales e impulsa internet hacia una er

Habr AI Explica Por Qué los LLM No Calculan, No Aprenden en el Diálogo y Dependen de Herramientas
Habr AI explica que los modelos de lenguaje por sí solos solo pueden trabajar con texto, mientras que la memoria, cálculos, búsqueda, agente

Svoi.ru redujo la preparación de pruebas en 70% usando agentes de IA
El equipo de Svoi.ru demostró cómo los agentes de IA pueden automatizar el análisis de requisitos y la preparación de documentación de prueb

Kodik explica por qué los benchmarks públicos de modelos de lenguaje son engañosos
Kodik analizó debilidades en pruebas populares de LLM y mostró por qué para su editor de código AI, un benchmark interno es más importante q

Cómo Google DeepMind y Competidores Están Transformando la Música: Cinco Servicios de IA para Generación de Pistas
Una recopilación de cinco servicios de IA muestra cómo la generación de música a partir de texto ha dejado de ser un juguete y se ha convert

WisprFlow, Whisper y GigaAM: quién reconoce mejor el habla ruso-inglesa
El autor comparó cinco aplicaciones y cinco modelos de entrada de voz para mezcla ruso-inglesa y demostró cómo las soluciones open source lo

GPTunneL y la Tendencia Forbes: Por Qué las AI-Superapps Se Están Convirtiendo en el Nuevo Motor de Crecimiento del Mercado
GPTunneL, que ha crecido a 2 millones de usuarios, describe cómo las AI-superapps están cambiando el comportamiento de la audiencia, la dema

Habr mostró cómo entrenar una mini-LLM en C# usando ILGPU y gráficos AMD integrados
Habr publicó un desglose de cómo construir y entrenar una LLM minúscula en C# con ILGPU y OpenCL, exportarla a GGUF y ejecutarla en LM Studi

Anthropic presenta Claude Mythos Preview mediante system card de 244 páginas en lugar de lanzamiento estándar
Anthropic presentó Claude Mythos Preview no como un lanzamiento típico, sino a través de una system card de 244 páginas que detalla las capa

OpenAI y Anthropic modifican el cálculo de costos de modelos de lenguaje: en 2026, el precio de la tarea es clave
OpenAI y Anthropic están cambiando las reglas de facturación de LLM: en 2026, a las empresas ya no les basta monitorear solo el precio del t

Claude Code Convertido en Analista de IA por BABOK: El Asistente Conduce Entrevistas y Recopila Requisitos
Basándose en Claude Code, desarrollaron un asistente de IA para análisis empresarial siguiendo BABOK v3: ayuda a conducir entrevistas, recop

Claude Code y Codex: cómo reducir pérdidas de tokens con tres archivos markdown
Claude Code y Codex a menudo gastan la mayor parte de su contexto en navegación repetida de proyectos; esto se puede resolver con una jerarq