Spetslab: a precisão dos sistemas de identificação facial não pode ser medida por um único número
A Spetslab explicou por que a pergunta "qual é a precisão dos sistemas de identificação facial" é incorreta por si só. Em uma portaria, a biometria pode funcion
Компания Спецлаб опубликовала разбор, в котором объяснила, почему вопрос о «точности» систем идентификации лиц сам по себе поставлен неверно. Итог работы таких систем зависит не от одной магической цифры, а от ракурса лица, сценария использования, настроек порога и того, как сформирована база изображений.
Почему нет одной цифры
Главная мысль статьи проста: система идентификации не отвечает на вопрос «узнала ли она человека абсолютно точно». Она всегда ищет наиболее похожее лицо в базе и сравнивает текущий кадр с теми образцами, которые у нее уже есть. Пока человек смотрит в камеру прямо, задача относительно проста. Но чем сильнее лицо повернуто, чем хуже свет, резкость и угол съемки, тем больше растет число похожих кандидатов. Поэтому один и тот же алгоритм может показывать почти безошибочный результат на проходной и заметно чаще ошибаться в потоке людей.
«В одних настройках ошибки исключены, но лицо смотрит строго анфас».
Автор подчеркивает, что пользователи часто ждут от биометрии универсальной оценки, как у бытовой техники или теста на скорость. В реальности такой оценки нет, потому что система всегда балансирует между жесткостью и гибкостью. Если выставить максимально строгий порог, будут надежно проходить только хорошие фронтальные кадры. Если ослабить настройки, можно находить человека в более сложных позах, но одновременно вырастает риск ложных совпадений. Именно этот компромисс и определяет реальную эффективность решения.
СКУД и поиск В статье разбираются два почти противоположных сценария.
Первый — система контроля и управления доступом, или СКУД, когда камера установлена на заранее подготовленном рубеже, а человек понимает, что нужно посмотреть в объектив. Здесь можно требовать почти идеальный анфас, настроить высокий порог совпадения и получить очень стабильную работу. Второй сценарий — поиск конкретного человека по видеопотоку, например в архиве или в толпе. Там люди не смотрят в камеру по команде, держат телефон у лица, отворачиваются, попадают в кадр сверху или сбоку, и потому система вынуждена работать мягче.
- В СКУД камера ставится так, чтобы получить фронтальный кадр.
- В поиске по толпе система работает с плохими ракурсами и случайными позами.
- Жесткие настройки снижают число ошибок, но пропускают сложные кадры.
- Мягкие настройки повышают шанс найти нужного человека, но дают больше ложных срабатываний. Отсюда и вывод: требовать одной цифры «точности» для обоих режимов бессмысленно. Для проходной важно почти не пускать чужих и стабильно узнавать своих в контролируемых условиях. Для розыска важнее сократить оператору объем ручного просмотра и быстро показать ограниченный набор наиболее похожих лиц. Это уже не одна и та же задача, а две разные модели использования, у которых разные допуски к ошибкам.
Как уменьшают ошибки
Спецлаб предлагает обходить базовое ограничение не только настройками, но и структурой самой базы. Если нужно отслеживать собственных сотрудников или постоянных посетителей в разных условиях, в базу стоит добавлять не один снимок анфас, а несколько изображений с разными поворотами головы. Тогда даже сильно искаженный кадр будет сравниваться не с «идеальным паспортным лицом», а с более близким по позе образцом того же человека.
Такой подход особенно полезен для трекинга перемещений по объекту, где важно не спутать своих между камерами. В статье также проводится важное различие между простым распознаванием лица и идентификацией личности. Детектор лиц нужен, чтобы вообще найти лицо в кадре, вытащить его из многочасового архива и убрать дубли.
Автор приводит показательный пример: просмотр недели записи с 16 камер может занимать 2688 часов, а детектор лиц сводит поиск к отдельным кадрам с людьми. При этом в сложных сценах — ночью, в расфокусе, в черно-белом видео — человек иногда все еще узнает знакомого лучше, чем алгоритм, потому что ориентируется не только на метрику лица, но и на общий визуальный контекст.
Что это значит
Для бизнеса и служб безопасности это хороший ориентир: системы идентификации лиц нужно оценивать не по абстрактной «точности», а по конкретному сценарию, условиям съемки и цене ошибки. Если задача сформулирована правильно, биометрия может заметно сократить ручной труд и ускорить поиск. Если неправильно — даже сильный алгоритм будет казаться слабым просто потому, что от него ждут невозможного.