MarkTechPost

Google presentó Auto-Diagnose — un sistema de IA para encontrar causas de fallos en pruebas de integración
Google presentó Auto-Diagnose — un sistema basado en Gemini 2.5 Flash que analiza automáticamente logs de pruebas de integración fallidas e

OpenAI GPT-OSS: Lanzamiento de Modelos Open-Weight en Colab con MXFP4 e Inferencia Avanzada
Una nueva guía explica cómo lanzar openai/gpt-oss-20b en Google Colab: instalar dependencias para Transformers, verificar GPU, habilitar cua

Anthropic lanza Claude Opus 4.7 para programación de agentes, visión y tareas autónomas
Anthropic presentó Claude Opus 4.7 — una actualización del modelo insignia con mejoras notables en codificación de agentes, análisis de imág

PrismML Bonsai: Cómo ejecutar un modelo de 1 bit en CUDA con GGUF, JSON y RAG
En un nuevo tutorial de PrismML Bonsai, cubrimos cómo ejecutar Bonsai-1.7B en GPU a través de CUDA y GGUF, medir velocidad, configurar chat,

xAI lanza APIs Grok separadas para reconocimiento y síntesis de voz para desarrolladores corporativos
xAI ha dividido la pila de voz de Grok en APIs autónomas: Speech-to-Text y Text-to-Speech para negocios con precios agresivos, soporte multi

NVIDIA lanzó Ising — la primera familia abierta de modelos de IA para sistemas cuántico-clásicos
NVIDIA presentó Ising — una familia abierta de modelos de IA para calibración de procesadores cuánticos y corrección de errores, para acerca

Por qué LoRA falla en producción y cómo RS-LoRA salva el ajuste fino de modelos
LoRA es excelente para estilo y formato, pero pierde señal al ajustar con nuevos hechos; RS-LoRA resuelve el problema cambiando la fórmula d

OpenKB y OpenRouter muestran cómo construir una base de conocimiento IA local con búsqueda en Llama
Un nuevo tutorial explica cómo desplegar una base de conocimiento local en OpenKB, conectar un modelo abierto a través de OpenRouter y confi

OpenAI y Magika mostraron cómo construir un pipeline para reconocimiento de archivos y análisis de amenazas
La guía demuestra un pipeline práctico donde Magika determina el tipo real del archivo a partir de bytes, y OpenAI ayuda a interpretar el re

Meta presentó Sapiens2 — un modelo unificado de visión por computadora para pose, segmentación y 3D
Meta Reality Labs lanzó Sapiens2 — una familia de modelos de visión para análisis humano que resuelve pose, segmentación, geometría de super

OpenMOSS lanza MOSS-Audio — modelo de audio abierto que supera alternativas mayores
OpenMOSS presentó MOSS-Audio — un modelo abierto que comprende voz, música y sonidos ambientes en una única arquitectura y supera a modelos

Embeddings de OpenAI y RL: Cómo Construir un Agente con Memoria a Largo Plazo para Respuestas Precisas
El tutorial muestra cómo entrenar un agente RL para seleccionar registros relevantes de la memoria a largo plazo, de modo que una LLM respon

Cómo Medir la Inteligencia Real: Los Principales Benchmarks para Agentes de IA
Las pruebas clásicas ya no reflejan las capacidades reales de las redes neuronales. Exploramos qué benchmarks realmente muestran si un agent

Memoria Elástica para IA: Cómo kvcached Resuelve la Escasez de GPU
La distribución dinámica de caché KV promete reducir radicalmente el costo de alojamiento de modelos de lenguaje, permitiendo un comparticio

El Modelo de Voz de xAI Supera a GPT Realtime en Tareas Empresariales
La empresa de Elon Musk, xAI, presentó grok-voice-think-fast-1.0. El nuevo modelo superó las soluciones de OpenAI y Google en la gestión de

GitNexus: Cómo una nueva herramienta enseñó a agentes IA a comprender estructuralmente el código
Los asistentes de IA sobresalen en escribir código local, pero a menudo no comprenden la arquitectura global de proyectos. El proyecto open-

DeepSeek-V4: Cómo los nuevos algoritmos de compresión hicieron realidad el contexto de un millón de tokens
DeepSeek presentó la cuarta generación de sus modelos. Mediante la compresión radical de atención, el procesamiento de volúmenes masivos de

La Arquitectura Decoupled DiLoCo de DeepMind Resuelve el Problema de Escalabilidad de la IA
El entrenamiento de modelos de IA avanzados siempre ha sido rehén de fallos de hardware: una falla en un chip detenía todo el cluster. Una n

OpenMythos: reconstrucción de código abierto de la arquitectura Claude Mythos en PyTorch con 770M parámetros
El desarrollador Kye Gomez reconstruyó la presumida arquitectura Claude Mythos de Anthropic desde cero — sin filtraciones, solo basándose en

OpenAI Amplía GPT-5.4-Cyber para Profesionales Verificados de Ciberseguridad
OpenAI abre acceso amplio a GPT-5.4-Cyber — una versión ajustada de GPT-5.4 sin restricciones estándar para miles de defensores verificados.

Moonshot AI lanza Kimi K2.6: un modelo agéntico con un enjambre de 300 subagentes
El laboratorio chino Moonshot AI ha liberado el código fuente de Kimi K2.6, un modelo agéntico multimodal que coordina de forma autónoma has

Phi-4-Mini de Microsoft: implementación de cuantización, RAG y LoRA en un único notebook Jupyter
El tutorial muestra el pipeline completo con Phi-4-mini-instruct: cuantización de 4 bits, generación en streaming, razonamiento, llamada de

Qwen 3.6-35B-A3B en la práctica: multimodalidad, MoE y RAG en un solo pipeline
Un análisis detallado de la implementación de Qwen 3.6-35B-A3B, desde la carga del modelo hasta RAG, tool calling y la persistencia de sesio

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ
Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде
OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве
Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности
Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов
Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и