Spetslab: la precisión de los sistemas de identificación facial no puede medirse con una sola cifra
Spetslab explicó por qué la pregunta "cuál es la precisión de los sistemas de identificación facial" es incorrecta por sí sola. En un control de acceso, la biom
Компания Спецлаб опубликовала разбор, в котором объяснила, почему вопрос о «точности» систем идентификации лиц сам по себе поставлен неверно. Итог работы таких систем зависит не от одной магической цифры, а от ракурса лица, сценария использования, настроек порога и того, как сформирована база изображений.
Почему нет одной цифры
Главная мысль статьи проста: система идентификации не отвечает на вопрос «узнала ли она человека абсолютно точно». Она всегда ищет наиболее похожее лицо в базе и сравнивает текущий кадр с теми образцами, которые у нее уже есть. Пока человек смотрит в камеру прямо, задача относительно проста. Но чем сильнее лицо повернуто, чем хуже свет, резкость и угол съемки, тем больше растет число похожих кандидатов. Поэтому один и тот же алгоритм может показывать почти безошибочный результат на проходной и заметно чаще ошибаться в потоке людей.
«В одних настройках ошибки исключены, но лицо смотрит строго анфас».
Автор подчеркивает, что пользователи часто ждут от биометрии универсальной оценки, как у бытовой техники или теста на скорость. В реальности такой оценки нет, потому что система всегда балансирует между жесткостью и гибкостью. Если выставить максимально строгий порог, будут надежно проходить только хорошие фронтальные кадры. Если ослабить настройки, можно находить человека в более сложных позах, но одновременно вырастает риск ложных совпадений. Именно этот компромисс и определяет реальную эффективность решения.
СКУД и поиск В статье разбираются два почти противоположных сценария.
Первый — система контроля и управления доступом, или СКУД, когда камера установлена на заранее подготовленном рубеже, а человек понимает, что нужно посмотреть в объектив. Здесь можно требовать почти идеальный анфас, настроить высокий порог совпадения и получить очень стабильную работу. Второй сценарий — поиск конкретного человека по видеопотоку, например в архиве или в толпе. Там люди не смотрят в камеру по команде, держат телефон у лица, отворачиваются, попадают в кадр сверху или сбоку, и потому система вынуждена работать мягче.
- В СКУД камера ставится так, чтобы получить фронтальный кадр.
- В поиске по толпе система работает с плохими ракурсами и случайными позами.
- Жесткие настройки снижают число ошибок, но пропускают сложные кадры.
- Мягкие настройки повышают шанс найти нужного человека, но дают больше ложных срабатываний. Отсюда и вывод: требовать одной цифры «точности» для обоих режимов бессмысленно. Для проходной важно почти не пускать чужих и стабильно узнавать своих в контролируемых условиях. Для розыска важнее сократить оператору объем ручного просмотра и быстро показать ограниченный набор наиболее похожих лиц. Это уже не одна и та же задача, а две разные модели использования, у которых разные допуски к ошибкам.
Как уменьшают ошибки
Спецлаб предлагает обходить базовое ограничение не только настройками, но и структурой самой базы. Если нужно отслеживать собственных сотрудников или постоянных посетителей в разных условиях, в базу стоит добавлять не один снимок анфас, а несколько изображений с разными поворотами головы. Тогда даже сильно искаженный кадр будет сравниваться не с «идеальным паспортным лицом», а с более близким по позе образцом того же человека.
Такой подход особенно полезен для трекинга перемещений по объекту, где важно не спутать своих между камерами. В статье также проводится важное различие между простым распознаванием лица и идентификацией личности. Детектор лиц нужен, чтобы вообще найти лицо в кадре, вытащить его из многочасового архива и убрать дубли.
Автор приводит показательный пример: просмотр недели записи с 16 камер может занимать 2688 часов, а детектор лиц сводит поиск к отдельным кадрам с людьми. При этом в сложных сценах — ночью, в расфокусе, в черно-белом видео — человек иногда все еще узнает знакомого лучше, чем алгоритм, потому что ориентируется не только на метрику лица, но и на общий визуальный контекст.
Что это значит
Для бизнеса и служб безопасности это хороший ориентир: системы идентификации лиц нужно оценивать не по абстрактной «точности», а по конкретному сценарию, условиям съемки и цене ошибки. Если задача сформулирована правильно, биометрия может заметно сократить ручной труд и ускорить поиск. Если неправильно — даже сильный алгоритм будет казаться слабым просто потому, что от него ждут невозможного.