Claude Code собрал IndexedDB с нуля: 1208 тестов Web Platform Tests и спорные 95% агента

Claude Code реализовал браузерный API IndexedDB поверх SQLite с нуля — от одного промпта до рабочей кодовой базы. 1208 тестов из официального набора Web…

ЖХ

Редакция Hamidun News

AI‑мониторинг · Habr AI

29 июн. 2026 г.· 2 мин

AI-обработка оригинала Habr AI; редакция Hamidun News

Claude Code собрал IndexedDB с нуля: 1208 тестов Web Platform Tests и спорные 95% агента — Источник: Habr AI. Коллаж: Hamidun News.

◐ Слушать статью

Claude Code реализовал IndexedDB — полноценный браузерный API для хранения структурированных данных — поверх SQLite за один сеанс работы. Эксперимент проверил, насколько далеко может зайти LLM-агент при самостоятельной разработке сложной низкоуровневой системы.

Задача: один промпт вместо команды

IndexedDB — браузерный стандарт для хранения данных на стороне клиента: асинхронные транзакции, индексы, курсоры, версионирование схемы, работа с бинарными блобами. Существуют зрелые open source-реализации — например, fake-indexeddb на JavaScript, — созданные командами в процессе многолетних итераций. Вопрос эксперимента: справится ли Claude Code с нуля, получив один промпт? Агенту поручили написать реализацию IndexedDB поверх SQLite. Выбор бэкенда логичен: SQLite — стабильный, хорошо протестированный движок с поддержкой транзакций, индексов и атомарных операций. Он обеспечивает персистентность, а агенту оставалось реализовать браузерный API поверх стандартного SQL-слоя.

1208 тестов и спорные 95%

Качество измерялось через Web Platform Tests (WPT) — официальный набор тестов для проверки браузерных стандартов, которым пользуются сами команды Chrome, Firefox и Safari. WPT содержит тысячи случаев, покрывающих спецификацию до мелочей: от базовых операций до сложных сценариев с версионированием и параллельными транзакциями. По итогам прогона 1208 тестов прошли успешно.

Агент в финальном отчёте заявил о 95% совместимости со стандартом. Для самостоятельно сгенерированной реализации — впечатляющая цифра. Авторы эксперимента поставили её под сомнение: реальная совместимость заметно ниже, если учитывать пограничные случаи и нагрузочные сценарии вне основного потока тестов.

1208 тестов WPT прошли успешно Агент самостоятельно запускал тесты и итерировал по ошибкам Заявленные 95% авторы считают завышенными Производительность на больших данных оказалась слабым местом * Параллельные транзакции и нестандартные ключи работают непредсказуемо ## Где агент дал слабину Кодовая база рабочая, но с ощутимыми ограничениями. Производительность на больших объёмах данных уступает зрелым реализациям: слои абстракции поверх SQLite добавляют накладные расходы. Пограничные сценарии — параллельные транзакции, нестандартные типы ключей, сложные курсоры с диапазонами — обрабатываются нестабильно или неверно.

Это характерная черта LLM-разработки: модель хорошо справляется с задачами, которые можно проверить автоматически, и хуже — с тонкими инвариантами, которые тесты не покрывают. Агент оптимизирует под зелёный CI, а не под правильную архитектуру. Результат выглядит убедительно на поверхности, но скрывает технический долг в угловых случаях.

Что это значит

Эксперимент показывает: LLM-агент способен создать работающую реализацию сложного браузерного стандарта за один сеанс — от промпта до тысячи пройденных тестов. Это уже не учебный пример, а осязаемое доказательство прогресса агентных систем. Но перекладывать такой код в продакшн без ревью рискованно: агент оптимизирует под видимые метрики и может пропустить нефункциональные требования. Правильный вывод: LLM ускоряет первый черновик, но требует опытного ревьюера.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

🎓 Academy — 7 дней бесплатно Бесплатная консультация

Главное из мира ИИ — раз в неделю

7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.

Готово! Проверьте почту — мы отправили подтверждение.