Habr AI

OpenAI lanza GPT-5.4: apuesta por agentes de computadora, no solo por código
OpenAI presentó GPT-5.4 con computer use nativo, tool search y contexto largo: en tareas de agentes, el modelo es notablemente más fuerte, p

Las startups de AI en 2026 pasan de un solo prompt a pipelines multiagente
La era de los servicios de AI basados en un solo prompt está llegando a su fin: para ofrecer resultados consistentes, las startups en 2026 e

Por qué los textos de AI irritan a los lectores: un autor de Habr analizó la reacción al estilo de escritura de redes neuronales
Un autor de Habr hizo un experimento con edición por AI de sus propios textos y mostró que la audiencia a menudo reacciona no a las ideas, s

Los LLM y los sistemas agénticos están desplazando a ROS del centro de la robótica — por qué esto importa
La arquitectura de los robots está pasando de escenarios de ROS rígidamente programados a una combinación de LLM y frameworks agénticos, don

Cómo Del Complex, un falso centro de datos flotante de AI con H100, engañó a X y a los principales medios tecnológicos
La historia de Del Complex mostró cómo, en 2023, un sitio web pulido, imágenes generadas por AI y grandes promesas sobre un centro de datos

Habr AI mostró cómo preparar una entrada estructurada para un agente de AI en lugar de una especificación técnica en bruto
En Habr AI explicaron por qué es mejor dar a los agentes no un documento entero, sino requisitos atómicos con atributos JSON: así es más fác

ETH Strategy: Parallel AI y AskSurf dieron evaluaciones opuestas del mismo proyecto DeFi
La comparación de dos auditorías de AI de ETH Strategy mostró que incluso modelos sólidos difieren en conclusiones básicas: uno encontró rie

X5 Tech contó cómo desarrolló en 7 días un servicio de AI para la preparación de exámenes internacionales
En AI Talent Camp, el equipo de ExamLab Bot desarrolló en una semana un servicio que crea planes personalizados de preparación para exámenes

Claude fue convertido en un analista médico personal con acceso al sueño y a análisis
El autor conectó Claude a Notion, Oura, un bot de Telegram para la alimentación y datos de la báscula para que la AI correlacionara en tiemp

OpenAI explicó cómo Codex está cambiando el desarrollo en un mundo donde el código es cada vez más escrito por agentes
OpenAI describió un experimento en el que un producto interno se construyó casi por completo a través de Codex: las personas definían reglas

Claude Code y Codex comparados en una tarea real: Claude es más fuerte en RAG, Codex ahorra tokens
Una comparación amplia de Claude Code y Codex muestra que la elección de un agente de programación no depende de la velocidad en una demo, s

Claude Code ayudó a crear una aplicación de producción en Elixir sin escribir código a mano en cuatro meses
El caso mostró cómo, en cuatro meses, Claude Code permitió crear un servicio de producción en Elixir con 1.702 commits, 3.880 pruebas y dos

Veai 5.6 para JetBrains IDEs añade generación de commit message y ejecución manual de Skills
Veai lanzó la versión 5.6 para JetBrains IDEs: ahora el agente propone por sí mismo una commit message a partir del diff, ofrece acciones rá

Habr AI mostró cómo construir un Linear Layer en C++ y CUDA en la serie «De MNIST a Transformer»
En la tercera parte de la serie «De MNIST a Transformer», Habr AI muestra cómo pasar de matrices a tensores, implementar un Linear Layer en

Selectel añadió servidores de alta gama para el entrenamiento de modelos y amplió su catálogo de imágenes
Selectel resumió las actualizaciones de febrero: lanzó servidores HGX B300 para entrenar modelos de gran tamaño, añadió nuevas imágenes, inc

DEMIURGOS añade un modo de depuración de reglas para agentes de AI y compatibilidad con más de 20 herramientas
DEMIURGOS permite describir una sola vez el stack, las restricciones y los estándares del proyecto para que Claude Code, Cursor, Copilot y o

Whisper y Gemma 3 unidos con aprendizaje contrastivo para entrada de voz de bajo costo en LLMs
Un desarrollador mostró cómo unió Whisper y Gemma 3 mediante un proyector MLP y aprendizaje contrastivo: tras una serie de intentos de regul

Un stack open source de 6 modelos y 9 agentes mostró cómo montar un equipo de AI en un solo servidor
Seis modelos open source y nueve agentes en un solo servidor con GPU forman un equipo autónomo de AI que diseña, escribe, prueba y despliega

Gamma, Tome y SlidesAI: qué servicios de AI realmente aceleran la creación de presentaciones
Los servicios de AI para presentaciones se encargan de la estructura, el texto y el diseño básico, pero solo ahorran tiempo de verdad cuando

Sber, Yandex y red_mad_robot mostraron cómo la AI está cambiando el papel del desarrollador
En un encuentro con Sber, Yandex, T-Technologies y red_mad_robot, se debatió el AI PDLC: la AI ya escribe la mayor parte del código, y el de

Nvidia, Google y Anthropic: Nemotron, fallos de Firefox y señales preocupantes para el mercado de AI
Nvidia lanzó el modelo abierto Nemotron-3-Super-120B, Anthropic encontró decenas de fallos en Firefox, y Google y ByteDance quedaron en el c

Claude Cowork y Chrome: 10 casos de uso para delegar la rutina repetitiva del navegador a un agente de AI
En Habr se publicó un análisis práctico de cómo Claude Cowork, junto con una extensión para Chrome, se encarga de la búsqueda de datos, el l

Anthropic explicó cómo las empresas pueden implementar sistemas agénticos sin complejidad innecesaria
Anthropic mostró que a las empresas les conviene más empezar no con sistemas agénticos autónomos, sino con escenarios simples: son más barat

En cinco días, Yoyo pasó de 200 líneas a un agente autónomo que escribe código por sí solo
Un experimento con el agente Yoyo mostró que 200 líneas en Rust bastaron para poner en marcha un ciclo de autoaceleración: el bot lee su pro

GLiNER 2 mostró cómo los encoders compactos están alcanzando a los LLMs en NER y clasificación
Una nueva ola de encoders zero-shot, encabezada por GLiNER 2, muestra que las tareas de NER y clasificación pueden resolverse sin LLMs pesad

Ollama Cloud comparado en un code review: DeepSeek v3.1 resultó superior a Qwen y GPT-OSS
El autor probó tres modelos en Ollama Cloud sobre Pull Requests reales de Python de un proyecto legacy: DeepSeek v3.1 mostró el mejor equili

CodeSpeak, de Andrey Breslav, creador de Kotlin, traslada el desarrollo del código a las especificaciones
El equipo de Andrey Breslav lanzó la alfa pública de CodeSpeak — una plataforma en la que el desarrollador describe un sistema en inglés y L

OpenAI, SoftBank y Oracle discuten por Stargate: el megaproyecto de centros de datos se atasca
Stargate, un proyecto de hasta 500.000 millones de dólares concebido como la base computacional de OpenAI, se ralentiza: los socios discuten

Claude como parte del pensamiento: por qué perder una herramienta de AI afecta no solo el acceso, sino también el trabajo
Para los usuarios activos, perder una cuenta de Claude resultó ser algo más que una falla del servicio: junto con el acceso desaparecen el c

Seldon Vault convirtió la psicohistoria de Asimov en un servicio multiagente de pronósticos con AI
Seldon Vault convierte la idea de la psicohistoria de Asimov en un servicio real de AI: siete agentes, un escéptico y un árbitro elaboran a