Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Google presentó Auto-Diagnose — un sistema de IA para encontrar causas de fallos en pruebas de integración

Google presentó Auto-Diagnose — un sistema basado en Gemini 2.5 Flash que analiza automáticamente logs de pruebas de integración fallidas e

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI GPT-OSS: Lanzamiento de Modelos Open-Weight en Colab con MXFP4 e Inferencia Avanzada

Una nueva guía explica cómo lanzar openai/gpt-oss-20b en Google Colab: instalar dependencias para Transformers, verificar GPU, habilitar cua

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Anthropic lanza Claude Opus 4.7 para programación de agentes, visión y tareas autónomas

Anthropic presentó Claude Opus 4.7 — una actualización del modelo insignia con mejoras notables en codificación de agentes, análisis de imág

2026-04-27·3 мин
LLM
LLM·MarkTechPost

PrismML Bonsai: Cómo ejecutar un modelo de 1 bit en CUDA con GGUF, JSON y RAG

En un nuevo tutorial de PrismML Bonsai, cubrimos cómo ejecutar Bonsai-1.7B en GPU a través de CUDA y GGUF, medir velocidad, configurar chat,

2026-04-27·2 мин
LLM
LLM·MarkTechPost

xAI lanza APIs Grok separadas para reconocimiento y síntesis de voz para desarrolladores corporativos

xAI ha dividido la pila de voz de Grok en APIs autónomas: Speech-to-Text y Text-to-Speech para negocios con precios agresivos, soporte multi

2026-04-27·3 мин
LLM
LLM·MarkTechPost

NVIDIA lanzó Ising — la primera familia abierta de modelos de IA para sistemas cuántico-clásicos

NVIDIA presentó Ising — una familia abierta de modelos de IA para calibración de procesadores cuánticos y corrección de errores, para acerca

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Por qué LoRA falla en producción y cómo RS-LoRA salva el ajuste fino de modelos

LoRA es excelente para estilo y formato, pero pierde señal al ajustar con nuevos hechos; RS-LoRA resuelve el problema cambiando la fórmula d

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenKB y OpenRouter muestran cómo construir una base de conocimiento IA local con búsqueda en Llama

Un nuevo tutorial explica cómo desplegar una base de conocimiento local en OpenKB, conectar un modelo abierto a través de OpenRouter y confi

2026-04-27·2 мин
LLM
LLM·MarkTechPost

OpenAI y Magika mostraron cómo construir un pipeline para reconocimiento de archivos y análisis de amenazas

La guía demuestra un pipeline práctico donde Magika determina el tipo real del archivo a partir de bytes, y OpenAI ayuda a interpretar el re

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Meta presentó Sapiens2 — un modelo unificado de visión por computadora para pose, segmentación y 3D

Meta Reality Labs lanzó Sapiens2 — una familia de modelos de visión para análisis humano que resuelve pose, segmentación, geometría de super

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenMOSS lanza MOSS-Audio — modelo de audio abierto que supera alternativas mayores

OpenMOSS presentó MOSS-Audio — un modelo abierto que comprende voz, música y sonidos ambientes en una única arquitectura y supera a modelos

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Embeddings de OpenAI y RL: Cómo Construir un Agente con Memoria a Largo Plazo para Respuestas Precisas

El tutorial muestra cómo entrenar un agente RL para seleccionar registros relevantes de la memoria a largo plazo, de modo que una LLM respon

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Cómo Medir la Inteligencia Real: Los Principales Benchmarks para Agentes de IA

Las pruebas clásicas ya no reflejan las capacidades reales de las redes neuronales. Exploramos qué benchmarks realmente muestran si un agent

2026-04-26·2 мин
LLM
LLM·MarkTechPost

Memoria Elástica para IA: Cómo kvcached Resuelve la Escasez de GPU

La distribución dinámica de caché KV promete reducir radicalmente el costo de alojamiento de modelos de lenguaje, permitiendo un comparticio

2026-04-26·3 мин
LLM
LLM·MarkTechPost

El Modelo de Voz de xAI Supera a GPT Realtime en Tareas Empresariales

La empresa de Elon Musk, xAI, presentó grok-voice-think-fast-1.0. El nuevo modelo superó las soluciones de OpenAI y Google en la gestión de

2026-04-26·2 мин
LLM
LLM·MarkTechPost

GitNexus: Cómo una nueva herramienta enseñó a agentes IA a comprender estructuralmente el código

Los asistentes de IA sobresalen en escribir código local, pero a menudo no comprenden la arquitectura global de proyectos. El proyecto open-

2026-04-26·3 мин
LLM
LLM·MarkTechPost

DeepSeek-V4: Cómo los nuevos algoritmos de compresión hicieron realidad el contexto de un millón de tokens

DeepSeek presentó la cuarta generación de sus modelos. Mediante la compresión radical de atención, el procesamiento de volúmenes masivos de

2026-04-26·3 мин
LLM
LLM·MarkTechPost

La Arquitectura Decoupled DiLoCo de DeepMind Resuelve el Problema de Escalabilidad de la IA

El entrenamiento de modelos de IA avanzados siempre ha sido rehén de fallos de hardware: una falla en un chip detenía todo el cluster. Una n

2026-04-26·2 мин
LLM
LLM·MarkTechPost

OpenMythos: reconstrucción de código abierto de la arquitectura Claude Mythos en PyTorch con 770M parámetros

El desarrollador Kye Gomez reconstruyó la presumida arquitectura Claude Mythos de Anthropic desde cero — sin filtraciones, solo basándose en

2026-04-23·2 мин
LLM
LLM·MarkTechPost

OpenAI Amplía GPT-5.4-Cyber para Profesionales Verificados de Ciberseguridad

OpenAI abre acceso amplio a GPT-5.4-Cyber — una versión ajustada de GPT-5.4 sin restricciones estándar para miles de defensores verificados.

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Moonshot AI lanza Kimi K2.6: un modelo agéntico con un enjambre de 300 subagentes

El laboratorio chino Moonshot AI ha liberado el código fuente de Kimi K2.6, un modelo agéntico multimodal que coordina de forma autónoma has

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Phi-4-Mini de Microsoft: implementación de cuantización, RAG y LoRA en un único notebook Jupyter

El tutorial muestra el pipeline completo con Phi-4-mini-instruct: cuantización de 4 bits, generación en streaming, razonamiento, llamada de

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Qwen 3.6-35B-A3B en la práctica: multimodalidad, MoE y RAG en un solo pipeline

Un análisis detallado de la implementación de Qwen 3.6-35B-A3B, desde la carga del modelo hasta RAG, tool calling y la persistencia de sesio

2026-04-22·1 мин
LLM
LLM·MarkTechPost

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров

Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

2026-03-11·2 мин
LLM
LLM·MarkTechPost

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ

Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Google запустила Android Bench для оценки ИИ в мобильной разработке

Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

2026-03-07·2 мин
LLM
LLM·MarkTechPost

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде

OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве

Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

2026-03-06·3 мин
LLM
LLM·MarkTechPost

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности

Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

2026-03-05·3 мин
LLM
LLM·MarkTechPost

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов

Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и

2026-03-03·3 мин