Платформа распознавания лиц Kipod от компании Synesis, пожалуй, одна из самых скандально известных программ, разработанных в Беларуси. Еще в 2021 году BYPOL заявил, что силовики используют ее, чтобы определять людей, которые были на протестах. Сама компания-разработчик отрицала это. Но BYPOL до сих пор утверждает, что силовики и сейчас активно пользуются системой и она установлена на каждом рабочем компьютере в МВД и Следственном комитете. Как работает Kipod? Насколько быстро и точно распознает людей? Возможны ли ошибки и спасут ли очки с маской? На условиях анонимности «Зеркало» пообщалось с двумя разработчиками программы. В общей сложности мужчины работали над ней около 3 лет, до осени 2020 года.
Что такое Kipod?
Это флагманский продукт компании Synesis, облачная платформа для «умного города» на основе технологий AI и Big Data. В Беларуси на основе технологии Kipod была создана республиканская система мониторинга общественной безопасности (РСМОБ). Специальный указ Лукашенко подписал 25 мая 2017 года. Оператором системы до 25 февраля 2022-го была компания «24×7 Паноптес» — «дочка» Synesis. После очередным указом Лукашенко передал РСМОБ «Белтелекому».
Технология, которая лежит в основе платформы, создана на основе разработанных компанией алгоритмов машинного зрения и распознавания лиц. Kipod позволяет подключаться к камерам видеонаблюдения и автоматически обрабатывать информацию.
— Сам пользователь может подключаться к системе с обычного компьютера и видеть уже обработанную информацию. При этом система позволяет масштабировать количество серверов (при необходимости их можно просто докупить и подключить). За счет этого снимаются ограничения объемов обрабатываемой информации, — объясняет один из наших собеседников.
Вариантов использования Kipod много: распознавание лиц, фиксация в кадре движения, задымления, пересечения определенного периметра и так далее.
Все, кроме первого, в основном использовалось коммерческими организациями за абонентскую плату. Взамен организация получала обслуживание серверов от Synesis и доступ к аккаунту в системе, где видны все архивные записи и можно отслеживать интересующие моменты. Но обычному коммерческому пользователю открывается доступ только к тем видео, которые делает его камера, — государство же видит абсолютно все.
— Распознавание лиц стало решением, которое компания предложила государству. В рамках республиканской системы мониторинга общественной безопасности Synesis предоставлял силовикам доступ к уже подключенным камерам и ко всей информации, которая с них поступала, — объясняет разработчик.
Как программа распознает людей?
— Чтобы видеозапись могла обрабатываться должным образом, первым делом к камере нужно подключить модуль распознавания (специальная программа. — Прим. ред.). Если этого не сделать, то записи нельзя будет использовать для анализа лиц, — описывает процесс собеседник, который работал над пользовательским интерфейсом программы. — Но как только модуль включают, все лица, которые появляются на видео, будут фиксироваться. После этого в системе появляется запись «Обнаружено лицо». Здесь важно, что «обнаружено» не значит идентифицировано. Это означает, что кусочек картинки система определяет как лицо человека. Затем для каждого обнаруженного лица создается запись в базе данных. К записи прикрепляется временная метка и до десяти кадров с этим лицом. Такая фиксация идет в режиме реального времени.
После обнаружения лицо идентифицируют — сравнивают с эталоном при помощи нейросетевых алгоритмов. Чтобы это стало возможным, пользователь (в нашем случае — силовики) должен добавить в систему изображения персон, местоположение которых нужно отследить.
Например, вас интересует человек в розыске. Тогда вы создаете запись, условно, «Александр Григорьев» и загружаете туда одну или несколько фотографий человека. Потом эту запись обрабатывает модуль распознавания. Затем система создает цифровой идентификатор. Дальше уже используется именно он. Когда в системе есть обе составляющие — видеозапись и папка с фотографиями человека, можно приступать к поиску.
При этом наш собеседник отмечает, что интерфейс программы достаточно простой:
— Если вы умеете пользоваться Facebook, освоить Kipod будет не сложно. В личном аккаунте есть разделы «видеокамера», «события», «список персон». В каждом из них — обычные кнопки, как в любой социальной сети. Открыв трансляцию с камер, можно найти фильтр, настроить данные для поиска и распознавания.
Было ли специальное обновление к выборам 2020 года?
О республиканской системе мониторинга общественной безопасности и Kipod активно заговорили после августа 2020 года. Но, по словах наших собеседников, специальных обновлений программы к президентским выборам никто не делал. Подобного запроса от властей также не было.
Через сколько меня могут найти?
За 10−30 секунд. Именно столько времени нужно, чтобы отследить ваше местоположение по камерам в режиме реального времени. Как это работает? Пользователь (в данном случае силовые структуры) выбирает, кого хочет отследить. Дальше Kipod сообщает о локации человека каждый раз, как только он появится в поле зрения камеры.
С технической стороны это происходит так: модуль замечает на видеопотоке нужное лицо, отправляет его в другой модуль, а тот сравнивает обнаруженное лицо с другими образцами, включенными для автоматической идентификации. Если где-то происходит совпадение, в системе появляется новое событие «Лицо распознано». Пользователь узнает, что система обнаружила человека на определенной камере.
Около пяти минут. Столько времени занимает поиск информации о передвижениях человека за большой период (к примеру, за 10 месяцев). Чем меньше период, тем меньше времени необходимо алгоритму.
Как это работает? В Kipod есть отдельная страница «Поиск по фото». Там пользователь загружает несколько фотографий и выбирает видеокамеры, которые нужны. Система начинает искать конкретного человека.
— Здесь алгоритм такой же, как и в первом случае, но постфактум: записи с «Обнаруженными лицами» уже лежат в базе. Алгоритм пробегает по всем, которые есть в архиве, и выводит список совпадений, если они есть. Поскольку в системе имеются данные геопозиции каждой камеры, вы увидите результат вроде: «Вчера вечером на станции метро Якуба Коласа было лицо, похожее на ваш образец запроса с вероятностью 74%». Порог точности регулируется, параметры фильтрации тоже. Можно задать диапазон времени и диапазон камер, который вас интересует.
Кроме этого, в программе есть опция отслеживания передвижения неизвестного человека. Она нужна, например, если нужно найти хулигана, укравшего в метро кошелек.
— Его лицо попадает на камеру, в системе появляется событие «Лицо обнаружено». Дальше вы можете просто нажать на него и отправить запрос системе поискать это же лицо на других камерах, — объясняет разработчик.
Получается, государство может знать все о моих передвижениях?
Не совсем. По словам наших собеседников, на конец 2020 года в Минске было установлено примерно 600 камер, подключенных к платформе Kipod.
— Для двухмиллионной столицы этого мало. Безусловно, можно допустить, что за полтора года камер видеонаблюдения стало больше, но вероятность этого невысока, — считает один из разработчиков.
Сколько камер подключено к Kipod в регионах, бывшие сотрудники не знают.
На каком расстоянии программа может распознать лицо человека?
Это достаточно сложный вопрос. Все зависит от разрешения, в котором снимает камера.
— Самое главное, чтобы размер лица был не меньше 40 пикселей. Поэтому, если у камеры хорошая оптика и разрешение, она снимет лицо в достаточном качества на расстоянии и в сотни метров, — объясняет бывший сотрудник Synesis. — Но конкретные цифры зависят от технических характеристик камеры, уровня освещения и угла съемки.
Какие фотографии используют как эталон?
Точного ответа нет. Никто из наших собеседников не знает, какой именно базой пользуются силовики. Но разработчики склоняются к тому, что базу паспортных фотографий использовать проще всего. К тому же, они подходят для алгоритма: фронтальные, хорошего качества, с правильно выстроенным светом.
В заявлении компании Synesis от 26 марта 2021 года (сейчас оно удалено, но доступна архивная версия страницы) сказано, что технически невозможно загрузить в базу системы всех граждан страны (к примеру, базу паспортов), чтобы система могла массово идентифицировать всех людей, попадающих в поле зрения камер. Наши собеседники комментировали этот момент немного иначе.
С одной стороны, функции автоматической загрузки базы данных в Kipod и правда не предусмотрено. С другой — это достаточно просто сделать с помощью стороннего скрипта, который позволит загрузить в систему все паспортные фото.
— Написать его не сложно, — считает бывший сотрудник компании. — В базу можно добавить и фотографии из соцсетей. Для этого понадобится стороннее решение, которое выгрузит их и разложит по папкам, подписывая именем и фамилией. А уже готовые данные можно занести в систему с помощью скрипта. Весь процесс займет около трех-четырех дней.
С какой точностью работает система и могут ли быть ошибки?
Системы по распознаванию лиц дают довольно большую точность, близкую к 95−99%. В объединении бывших силовиков BYPOL считают, что уровень точности распознавания лиц у Kipod около 94,21%. Наши собеседники не знают конкретных цифр, но на примере из собственного опыта заявляют, что ошибки точно есть:
— Мы использовали Kipod в офисе, чтобы открывать дверь: подходишь, камера тебя узнает, и можешь заходить. Все работало, потому что камера была хорошая, стояла как нужно, а мы смотрели прямо в нее. К тому же у каждого сотрудника было загружено 4−5 хороших студийных фотографий, снятых под разными углами в студии. Но все равно, бывало, нужно было остановиться, посмотреть прямо в камеру, пару секунд постоять. И только тогда тебя пропускало.
В Беларуси многие камеры устанавливали достаточно давно — качество видео оставляет желать лучшего.
— Влияет и ракурс: когда внедряли систему, к ней подключали уже работающие камеры, а их часто ставили не для распознавания лиц. Поэтому устройства размещены под углом. А чем дальше камера от фронтального ракурса, тем хуже распознается лицо, — объясняет один из разработчиков. — Ну и, наконец, влияет количество людей в кадре: если в метро на Каменной горке в час пик идет очень много людей, а камера стоит неудачно, она зафиксирует не всех.
Сколько в Минске новых устройств, способных распознавать лица на расстоянии сотен метров, наши собеседники не знают.
— Еще одна важная составляющая в процессе распознавания — фотография, которая используется для идентификации человека. Основной принцип простой: чем больше фотографий и чем они качественнее, тем лучше. Правда, важна актуальность снимка, — отмечает бывший сотрудник Synesis. — Хоть алгоритмы пытаются учесть изменения внешности, если фотография старая, у человека там другая прическа, он похудел или поправился с тех пор, узнать его будет сложнее.
Можно ли обмануть Kipod?
Сохранить конфиденциальность, проходя под камерами, сложно. Но реально.
— Остаться незафиксированными с большой долей вероятности помогут очки и медицинская маска, но только вместе друг с другом. Если вы наденете только маску или только очки, вероятность вашего распознавания снизится, но у системы по-прежнему будут шансы зафиксировать лицо, — объясняет собеседник.
К тому же, можно просто не смотреть в камеру: если человек идет, опустив голову в телефон, это мешает работе алгоритма.
Силовики снимали протестующих на видео, Kipod сможет распознать всех?
Собеседники считают, что такая возможность у программы есть в теории, и о ее внедрении в компании периодически задумывались.
Правда, обычно сходились на том, что игра не стоит свеч: система распознавания в режиме реального времени более уникальна, чем просто идентификация людей на записи. Поэтому на это не тратили много времени и сил.
— Но осуществить это достаточно просто, — рассказывает один из бывших сотрудников Synesis (второй собеседник считает так же). — Алгоритм для этого можно написать за полдня. Дальше программа будет работать так же, как с записью камеры: сначала определение лиц в режиме реального времени (придется отсмотреть все записи на скорости максимум 1.25), а потом Kipod соотнесет определенные лица с фотографиями из базы. И вот здесь уровень распознавания может быть выше: сотрудники милиции снимают свои видео как раз на уровне лица и, вероятно, записи в хорошем качестве. Но у меня есть сомнения, что мои коллеги стали бы разрабатывать подобное обновление для помощи силовым структурам. Да и для этой цели проще использовать уже готовую программу, чем переделывать Kipod.