Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

ByteDance выпустила Protenix-v1: Open-Source модель для прогнозирования биомолекулярных структур

ByteDance представила Protenix-v1, open-source модель, стремящуюся к уровню AlphaFold3 в прогнозировании структуры биомолекул. Код и парамет

2026-02-08·1 мин
LLM
LLM·MarkTechPost

PaperBanana: Google научила нейросети рисовать графики, за которые не стыдно перед рецензентами

Пока ИИ пишет код и статьи, красивые схемы оставались рутиной. Фреймворк PaperBanana от Google автоматизирует создание научных иллюстраций и

2026-02-07·2 мин
LLM
LLM·MarkTechPost

Waymo World Model: беспилотники Google теперь тренируются в собственной «Матрице»

Waymo запустила генеративную модель на базе Genie 3. Теперь беспилотники учатся водить в фотореалистичных мирах, которые нейросеть создает н

2026-02-07·2 мин
LLM
LLM·MarkTechPost

Claude Opus 4.6: Anthropic учит нейросети думать медленно и работать за вас

Anthropic выкатила Opus 4.6. Пока конкуренты гонятся за хайпом, Дарио Амодеи дает нам миллион токенов контекста и агентов, которые реально п

2026-02-06·2 мин
LLM
LLM·MarkTechPost

GPT-5.3-Codex: OpenAI превращает кодинг в автономный процесс (и делает это быстрее)

OpenAI объединила мощь GPT-5.2 с навыками кодинга в новой модели 5.3-Codex. Она работает на 25% быстрее и метит в роль полноценного автономн

2026-02-05·2 мин
LLM
LLM·MarkTechPost

Voxtral Transcribe 2: Mistral напомнила, зачем нам всё ещё нужны европейские нейронки

Mistral выпустила Voxtral Transcribe 2 — семейство моделей для распознавания речи. Теперь диаризация и real-time ASR работают в промышленных

2026-02-05·2 мин
LLM
LLM·MarkTechPost

Gemini 3 Flash: Google учит нейросети не гадать, а всматриваться

Google внедряет Agentic Vision в Gemini 3 Flash. Теперь модель не просто сканирует картинку, а активно изучает детали. Конец эпохи галлюцина

2026-02-05·2 мин
LLM
LLM·MarkTechPost

Qwen3-Coder-Next: 80 миллиардов параметров, которые влезут в ваш ПК

Команда Qwen снова ломает стереотипы. Новая модель весит как гигант, но бегает как спринтер: из 80 млрд параметров активны только 3 млрд. Ид

2026-02-04·2 мин
LLM
LLM·MarkTechPost

Оффлайн-обучение без жертв: как Conservative Q-Learning спасает бюджеты и жизни

Забудьте про бесконечные пробы и ошибки. Новая реализация CQL позволяет обучать агентов на исторических данных, исключая риск катастроф в ре

2026-02-04·2 мин
LLM
LLM·MarkTechPost

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности

Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адапти

2026-02-03·2 мин
LLM
LLM·MarkTechPost

Зеро-паддинг: почему лишние нули обходятся вашим нейросетям слишком дорого

Стандартный прием с добавлением нулей по краям картинки оказался не таким уж безобидным. Разбираемся, как технический костыль создает статис

2026-02-02·2 мин
LLM
LLM·MarkTechPost

Nemotron-3-Nano-30B: NVIDIA научила 4-битные модели думать по-взрослому

NVIDIA втиснула 30 миллиардов параметров в 4 бита без потери качества. Рассказываем, как технология QAD делает сложные рассуждения доступным

2026-02-02·2 мин
LLM
LLM·MarkTechPost

Generative UI: почему чат-боты — это тупик эволюции интерфейсов

Мы привыкли общаться с ИИ через узкое текстовое окно, но это лишь костыль. На смену приходит Generative UI — интерфейс, который строится на

2026-01-29·2 мин
LLM
LLM·MarkTechPost

HPC-Ops от Tencent: китайский софт выжимает максимум из американского железа

Tencent выложила в открытый доступ HPC-Ops — библиотеку низкоуровневых CUDA-ядер. Это попытка заставить тяжелые нейросети работать быстрее н

2026-01-28·2 мин
LLM
LLM·MarkTechPost

Haystack и мультиагенты: как перестать дежурить по ночам и начать жить

Пока все обсуждают чат-боты, Haystack показывает, как собрать команду ИИ-агентов для реального SRE. Это уже не игрушки, а автоматизация расс

2026-01-27·2 мин
LLM
LLM·MarkTechPost

NVIDIA Earth-2: метеорологические суперкомпьютеры уходят на пенсию

NVIDIA открыла доступ к Earth-2 — первой полностью открытой платформе для ИИ-прогнозирования климата. Теперь предсказать ураган сможет даже

2026-01-26·2 мин
LLM
LLM·MarkTechPost

AutoGluon: автоматизация машинного обучения для промышленных табличных моделей

AutoGluon упрощает создание и развертывание ML-пайплайнов для табличных данных. Ансамбли, дистилляция, анализ – все в одном фреймворке. Подр

2026-01-22·1 мин
LLM
LLM·MarkTechPost

Salesforce AI представила FOFPred: управление роботами с помощью языка

Salesforce AI разработала FOFPred, систему, использующую язык для прогнозирования движения объектов. Это открывает новые возможности для роб

2026-01-22·2 мин
LLM
LLM·MarkTechPost

Inworld AI представляет TTS-1.5: голос нового поколения для AI-агентов

Inworld AI выпустила TTS-1.5, систему преобразования текста в речь для AI-агентов. Мгновенный отклик, высокое качество и доступная стоимость

2026-01-22·1 мин