Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

El equipo Qwen lanzó FlashQLA: aceleración de atención lineal hasta 3× en NVIDIA Hopper

QwenLM lanzó FlashQLA — una biblioteca de kernels CUDA para Gated Delta Network que proporciona ganancia de rendimiento de hasta 3× en GPU N

2026-04-30·2 мин
LLM
LLM·MarkTechPost

OpenAI Privacy Filter: Cómo Construir un Pipeline de Producción para Detección y Enmascaramiento de PII

La guía de OpenAI Privacy Filter desglosa un pipeline completo para detectar y enmascarar datos personales — desde la carga del modelo hasta

2026-04-30·3 мин
LLM
LLM·MarkTechPost

DeepSeek, Google y Meta: 10 técnicas de compresión de KV-cache en LLM para reducir memoria en inferencia

KV-cache se ha convertido en un consumidor de memoria GPU en grandes LLMs, y una nueva revisión muestra 10 enfoques — desde H2O y SnapKV has

2026-04-30·3 мин
LLM
LLM·MarkTechPost

Poolside lanzó Laguna XS.2 y M.1 — modelos abiertos para programación con agentes

Poolside presentó dos modelos Laguna para codificación con agentes: el XS.2 abierto se ejecuta localmente, mientras que el más potente M.1 e

2026-04-29·3 мин
LLM
LLM·MarkTechPost

LlamaIndex ParseBench: cómo probar análisis de documentos a través de Python y Hugging Face

Un análisis práctico muestra cómo construir un pipeline de evaluación de analizadores de documentos usando el dataset LlamaIndex ParseBench:

2026-04-29·3 мин
LLM
LLM·MarkTechPost

smol-audio de Deep-unlearning: Una colección de notebooks de Colab para ajuste fino de modelos de audio

Deep-unlearning lanzó smol-audio — una colección de notebooks compatibles con Colab para ajustar Whisper, Parakeet, Voxtral, Granite Speech

2026-04-29·3 мин
LLM
LLM·MarkTechPost

Top 10 modelos de IA física que controlan robots reales en 2026

En 18 meses, la brecha entre LLMs y la robótica real se ha reducido drásticamente: los modelos de IA física ya funcionan en fábricas, almace

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Hugging Face y Gemma 3 1B: Construyendo un Pipeline de Generación Listo para Producción en Colab

Un análisis de cómo ejecutar Gemma 3 1B Instruct en Colab a través de Hugging Face Transformers: con autorización segura, chat templates y u

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.ai lanza GLM-5V-Turbo — modelo multimodal nativo para programación visual

El laboratorio chino Z.ai ha lanzado GLM-5V-Turbo — un modelo que reconoce diagramas arquitectónicos y capturas de pantalla e inmediatamente

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google Gemma 4, NVIDIA y OpenClaw: Agentes AI locales sin pago por token

Google y NVIDIA están promoviendo la ejecución local de Gemma 4 en RTX, Jetson y DGX Spark para que agentes AI siempre activos como OpenClaw

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Talkie-1930: Investigadores lanzaron un modelo 13B sin conocimiento de internet ni de la Segunda Guerra Mundial

Talkie-1930 es un modelo 13B abierto, entrenado solo en textos en inglés hasta 1931, para estudiar el pensamiento histórico, filtraciones de

2026-04-28·3 мин
LLM
LLM·MarkTechPost

MarkTechPost muestra cómo construir un agente VLA ligero con modelo de mundo latente y MPC

En un nuevo tutorial, MarkTechPost explica cómo construir un agente embodied simplificado: opera en fotogramas RGB, aprende un modelo de mun

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Arcee AI Lanzó Trinity Large Thinking — Modelo de Razonamiento Abierto para Agentes IA

Arcee AI liberó los pesos de Trinity Large Thinking bajo licencia Apache 2.0 y apuesta por escenarios de agentes largos, razonamiento multie

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NVIDIA mostró un pipeline completo de optimización de modelos con FastNAS pruning y fine-tuning

NVIDIA lanzó una guía práctica para Model Optimizer: en un único notebook Colab se demuestran el entrenamiento de ResNet20, FastNAS pruning

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TII lanza Falcon Perception — modelo 0,6B para segmentación y búsqueda de objetos por texto

TII presentó Falcon Perception — un modelo vision-language compacto con 0,6 mil millones de parámetros que busca y segmenta objetos a partir

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google DeepMind Permite que LLM Reescriba Algoritmos de Teoría de Juegos y Supere Expertos

Google DeepMind demostró que AlphaEvolve puede reescribir código de algoritmos para juegos con información incompleta y encontrar soluciones

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.AI mostró cómo construir sistemas agentic production-ready en GLM-5 con tool calling

Z.AI lanzó un tutorial detallado sobre GLM-5: desde la configuración del SDK e API compatible con OpenAI hasta streaming, tool calling, sali

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Netflix Abre Void — Modelo para Eliminar Objetos de Videos con Consideración de la Física de la Escena

El equipo de Netflix e INSAIT lanzó en código abierto Void — un sistema que elimina objetos de videos y simultáneamente recalcula caídas, so

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Cómo la Inteligencia Artificial Ayuda a las Marcas de Ropa a Diseñar la Moda del Futuro

Los algoritmos ya ayudan a las marcas de moda a crear colecciones más rápidamente, pronosticar tendencias, reducir la sobreproducción y pers

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Cómo Construir un Pipeline Netflix Void para la Eliminación de Objetos en Vídeo usando CogVideoX

Un análisis detallado muestra cómo implementar el modelo Netflix Void, descargar los puntos de control necesarios, preparar datos de entrada

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Gladstone Institutes presenta MaxToki — un modelo de IA que predice el envejecimiento celular

El modelo MaxToki de Gladstone Institutes aprende a ver no una 'instantánea' de la célula, sino su trayectoria a lo largo del tiempo, evalúa

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TinyFish Lanzó Plataforma Web Unificada para Agentes de IA con Search, Fetch, Browser y Agent

TinyFish combinó búsqueda, renderización de páginas, sesiones de navegador y flujos de trabajo web autónomos en una única plataforma para ag

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google agregó Skills en Chrome y transformó prompts de IA en escenarios de un clic

Google lanzó la función Skills en Chrome: los usuarios de Gemini podrán guardar prompts frecuentemente usados como escenarios reutilizables

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Google DeepMind Presenta Gemini Robotics-ER 1.6 para Autonomía y Lectura de Instrumentos por Robots

Google DeepMind actualizó Gemini Robotics-ER a la versión 1.6: un modelo para robots que comprende mejor el espacio, maneja múltiples flujos

2026-04-28·2 мин
LLM
LLM·MarkTechPost

MarkTechPost desglosó el ciclo completo de entrenamiento de grandes modelos de lenguaje: desde datos hasta despliegue

MarkTechPost publicó un desglose detallado de cómo se construyen los LLMs hoy: desde el preentrenamiento en grandes corpus hasta SFT, RLHF,

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google presentó Gemini 3.1 Flash TTS — modelo de habla con control, diálogos e idiomas 70+

Google lanzó Gemini 3.1 Flash TTS en vista previa: el modelo sintetiza texto en 70+ idiomas, soporta diálogos con dos voces y permite contro

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Mem0 y OpenAI: cómo construir una capa universal de memoria a largo plazo para agentes de IA

Un nuevo tutorial desglosa la combinación de Mem0, modelos OpenAI y ChromaDB: extrae hechos de conversaciones ordinarias, los almacena por u

2026-04-28·2 мин
LLM
LLM·MarkTechPost

SmolAgents: Cómo Construir un Sistema de IA Multiagente con Código y Orquestación Dinámica

Un análisis de la implementación de SmolAgents muestra cómo los agentes de IA ligeros ejecutan código, invocan herramientas, trabajan con me

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NetKet y JAX: cómo construir un modelo Transformer para sistemas de espines frustrados

La guía muestra cómo construir un pipeline de VMC de investigación usando NetKet, JAX y arquitectura Transformer para modelar una cadena de

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI presentó GPT-Rosalind — un modelo de IA para biología, genómica y desarrollo de fármacos

OpenAI lanzó GPT-Rosalind — un modelo especializado para biología y farmacéutica que ayuda a acelerar el desarrollo de fármacos, análisis de

2026-04-28·3 мин