Ваши лица в руках корпораций

07 июля 2019

2052

Ваши лица в руках корпораций

Техно-компании незаметно изучали ваши фото для улучшения системы распознавания лиц. Как им это удалось.

Распознавание лиц — мощная технология, которая серьезно угрожает гражданским свободам. А еще это процветающий бизнес. Сегодня многие стартапы и технологические гиганты продают системы распознавания лиц гостиницам, ритейлерам и даже школам и летним лагерям. Этот бизнес процветает благодаря новым алгоритмам, которые могут идентифицировать людей с куда большей точностью, чем пять лет назад. Для улучшения алгоритмов их тренировали на миллиардах лиц, порой без чьего-либо разрешения. Поэтому велики шансы, что ваше лицо является частью «обучающего набора» в одной из таких систем или находится в базе клиентских данных какой-нибудь компании.

Методы сбора информации, используемые компаниями, могут удивить потребителей. Так, по меньшей мере в трех случаях компании получали миллионы изображений через приложения для фото на смартфонах. Сейчас система распознавания лиц слабо регулируется, поэтому люди почти никак не могут ограничить использование своих лиц в коммерческих целях.

В 2018 году камера идентифицировала лица пассажиров, которые торопливо спускались с трапа самолета неподалёку от Вашингтона, штат Колумбия. Но на самом деле и самолет, и пассажиры были частью имитации, созданной Национальным институтом стандартов и технологий (НИСТ), чтобы продемонстрировать, как можно собирать данные «в поле». Использованные в этом эксперименте лица станут частью конкурса от НИСТ, в котором компании со всего мира тестируют свои системы распознавания лиц.

htiqxeiqqeirtglv

В моделировании ситуации с самолетом добровольцы дали согласие на использование своих лиц. Так было на ранних этапах систем распознавания лиц — исследователи старались согласованно включать людей в свои наборы. Сейчас же бизнес вряд ли будет утруждать себя и спрашивать разрешения.

По словам Market Research Future, компании (в том числе такие лидеры, как Face++ и Kairos) борются за первое место в индустрии, которая ежегодно растет на 20% и достигнет объема в $9 млрд к 2022 году. Бизнес-модель этих игроков основана на лицензированном программном обеспечении для растущего числа клиентов — от правоохранительных органов до университетов, — которые используют его в собственных разработках.

В конкурентной борьбе побеждают те продукты, чьи алгоритмы способны определять лица точно и без ошибок. Как и со всем искусственным интеллектом, создание системы распознавания лиц предполагает накопление большого количества данных для обучения. И хотя компании могут использовать одобренные государством и университетами данные (например, Йельская база лицевых данных), такие учебные наборы достаточно малы и содержат не больше нескольких тысяч лиц.

Такие официальные наборы имеют и другие недостатки. Многим не хватает расового разнообразия и различных условий — тени, шляпы, косметики — которые изменяют восприятие лица в реальном мире. Для системы, распознающей лица «в естественных условиях», требуется больше изображений. Намного больше.

«Сотни недостаточно, тысячи недостаточно. Нам нужны миллионы изображений. Если вы не обучаете систему распознавать людей в очках и с разным цветом кожи, вы не достигнете хороших результатов», — говорит Питер Трепп, директор FaceFirst, калифорнийской компании, которая помогает ритейлерам идентифицировать преступников в своих магазинах.

Приложение для этого

Так где же компании найти миллионы изображений для своего программного обеспечения? Источником могут послужить снимки заключенных из полицейских участков, которые свободно предоставляются государственными органами и продаются частными компаниями. Например, калифорнийская Vigilant Solutions предлагает коллекцию из 15 миллионов снимков в своей системе по распознаванию лиц.

Некоторые стартапы нашли способы получше — фотоальбомы в приложениях. Они собирают фотографии с устройства пользователя, на которых один и тот же человек изображен в разных позах и ситуациях — богатый источник для обучения.

«Есть потребители, которые отмечают одного человека на фото в тысячах различных ситуаций. Вы наверняка узнаете, кто это, даже если человек в тени или в шляпе», — рассказывает Дуг Эли, директор Ever AI, стартапа по распознаванию лиц из Сан-Франциско, который был основан в 2012 году и тогда разрабатывал приложение EverRoll, призванное упростить для пользователей управление многочисленными фотографиями.

Ever AI, получившая $29 млн от Khosla Ventures и других компаний Кремниевой долины, приняла участие в последнем конкурсе НИСТ и заняла второе место в категории «Снимки преступников» (Mugshots) и третье место — в распознавании «Лиц на улице» (Faces in the Wild). Причиной такого успеха Эли называет большую базу данных Ever AI, насчитывающую 13 миллиардов изображений.

В начале своего пути Ever AI была просто разработчиком приложения для фотографий EverRoll, и в 2016 году её агрессивная маркетинговая политика привела к временной блокировке этого продукта в магазине Apple. Примечательно, что приложение заставляло рассылать рекламные ссылки всем контактам пользователя — тактика, известная в Кремниевой долине как «взлом роста». Пользователи жаловались также на кражу данных.

«Сразу после установки приложение собирает все телефоны из списка контактов и начинает им писать… А дальше скачивает все ваши фотографии и копирует их в облачное хранилище», — писал в 2015 году в своем обзоре на Facebook Грег Миллер, владелец фотостудии в Техасе.

Четыре года спустя Миллер с ужасом обнаружил, что его фотографии все еще хранились в EverRoll, но теперь это уже компания с системой распознавания лиц.

«Нет, я об этом не знал и совершенно с этим не согласен», — пожаловался Миллер в Fortune. «Такая слежка — реальная проблема. Конфиденциальность исчезла, и это очень пугает меня».

Дуг Эли, генеральный директор Ever AI, утверждает, что компания никуда не передает информацию из своей базы данных, а фотографии используются только для обучения системы. Он также добавил, что компания сродни социальной сети, от которой в любой момент можно отказаться. Эли отрицал, что Ever AI с самого начала собиралась стать компанией по распознаванию лиц, заявив, что закрытие приложения — управленческое решение. Сейчас клиенты Ever AI используют его данные в своих целях, в том числе для управления системами идентификации сотрудников, розничной торговли, а также в телекоммуникациях и правоохранительной деятельности.

Ever AI — не единственная компания по распознаванию лиц, которая когда-то предлагала приложение для фотографий. Orbeus, стартап из Сан-Франциско, купленный Amazon в 2016 году (что не было анонсировано), тоже предлагал популярное хранилище PhotoTime.

«Конфиденциальность исчезла, и это очень пугает меня», — Грег Миллер, владелец фотостудии в Техасе.

По словам бывшего сотрудника Orbeus, привлекательность стартапа для Amazon состояла в разработанных им технологиях искусственного интеллекта и обширном наборе фотографий людей в общественных местах.

«Amazon искал такие возможности. Они все купили, а затем закрыли приложение», — сообщает сотрудник, который пожелал остаться анонимным, ссылаясь на договор о неразглашении.

PhotoTime больше не существует, хотя Amazon продолжает продавать другой продукт Orbeus, известный под брендом Rekognition. В бизнесе и правоохранительных органах он используется как система распознавания лиц.

Amazon отказалась раскрывать подробности того, использовалось ли фотоприложение Orbeus для обучения Rekognition, заявив лишь, что берёт данные из разных источников. Компания добавила, что она не использует пользовательские данные из приложения Prime для обучения систем идентификации.

Real Networks — еще одна компания, использующая приложения для обучения своей системы. Расположенная в Сиэтле и когда-то известная своим видеоплеером из 90-х, сейчас компания сосредоточена на распознавании детских лиц в школах. В то же время компания предлагает семейное приложение RealTimes, которое, по словам критиков, собирает данные о лицах пользователей.

«Приложение позволяет создавать видео-презентации из фотографий. Представьте, что мама отправляет такую презентацию бабушке, а система использует эти фото для обучения. Звучит жутковато», — рассказывает Клэр Гаври, профессор Джорджтаунского университета, опубликовавшая доклад, который серьезно повлиял на технологии распознавания лиц.

Real Networks подтвердила, что приложение применялось для улучшения системы распознавания лиц, но добавила, что используются и другие источники информации.

Во всех случаях, когда компании использовали данные из принадлежащих им фотоприложений для обучения своих систем, они не спрашивали разрешения пользователей, но получали скрытое согласие через пользовательские соглашения.

Но это уже довольно много по сравнению с тем, что делают другие компании. Как говорит Патрик Гротер, который проводит конкурс от НИСТ, для компаний, занимающихся сбором лицевых данных, нормально писать программы, «набирающие» изображения с сайтов вроде SmugMug или Tumblr. В этих случаях разрешения со стороны пользователя даже не предполагается.

Этот подход по типу «помоги себе сам» удостоился особого внимания в недавнем отчете NBC News, где подробно рассказано о том, как IBM скачала более миллиона изображений с лицами с фотохостинга Flickr в рамках исследования искусственного интеллекта. (Джон Смит, курирующий технологии искусственного интеллекта в отделе исследований IBM, заявил, что «персональные данные защищены» и что ведется работа с теми, кто хочет удалить личную информацию из базы).

Все это поднимает вопросы о защите лицевых данных компаниями, которые их собирают, и необходимости государственного контроля в этой сфере. Эта тема станет лишь серьезнее с дальнейшим распространением систем распознавания лиц в обществе, а также в среде крупного и малого бизнеса.

От магазинов до школ

Системы для распознавания лиц не новы. Простейшие версии таких программ существовали с 1980 годов, когда американские математики начали определять лица как ряд числовых значений и использовали вероятностные модели для поиска совпадений. Службы безопасности города Тампа, штат Флорида, использовали ее на Супербоуле 2001, оно же годами применялось в казино. Но за последние несколько лет многое изменилось.

«Система распознавания лиц переживает нечто похожее на революцию», — рассуждает Патрик Гротер, добавляя, что изменения наиболее заметны в растущем качестве изображений. «Основная технология изменилась. Старые разработки сменились новыми, гораздо более эффективными системами».

Революция в системе распознавания лиц произошла благодаря двум факторам, которые сильно изменили и расширили сферу технологий искусственного интеллекта. Первый — это появление глубокого обучения (deep learning), системы по распознаванию образов, напоминающей принципом своей работы человеческий мозг. Второй — рекордный избыток данных, которые можно хранить и анализировать с низкими затратами при помощи облачных вычислений.

Неудивительно, что первыми компаниями, которые в полной мере воспользовались этими разработками, стали Google и Facebook. В 2014 году последняя выпустила программу под названием DeepFace, которая может с точностью в 97,24% определять принадлежность двух лиц одному и тому же человеку — аналогичный результат в таком тесте демонстрируют люди. Год спустя Google со своей программой FaceNet добился стопроцентной точности (по оценкеохранной фирмы Gemalto).

Сегодня, во многом благодаря доступу к большим базам лицевых данных, эти и другие технологические гиганты (например, Microsoft) лидируют в распознавании лиц. Но высокий результат демонстрируют все больше стартапов, также стремящихся занять свою нишу на растущем рынке программ лицевой идентификации.

Только в США таких компаний насчитывается больше десятка, в том числе Kairos и FaceFirst. По словам исследователей рынка из PitchBook, Кремниевая долина стремительно набирает обороты в этом секторе, и за последние несколько лет в него были вложены значительные средства. По оценкам PitchBook, общий объем инвестиций за три последних года составил $78,7 млн. По меркам Долины это не фантастические цифры, но они отражают уверенность венчурных капиталистов, что несколько «лицевых» стартапов вскоре вырастут в крупные компании.

До сих пор появляются новые бизнес-модели, ориентированные на распознавание лиц. Особенно это заметно в лицензированном корпоративном ПО. По данным Crunchbase, ежегодный доход таких компаний, как Ever AI и FaceFirst, довольно скромен и варьируется от $2 до 8 млн. Amazon и другие технологические гиганты таких данных не раскрывают.

Долгое время самыми заинтересованными пользователями систем по распознаванию лиц были правоохранительные органы. Но сейчас многие компании, включая WalMart, используют такие программы для получения дополнительной информации о покупателях в своих магазинах.

Так, например, калифорнийская FaceFirst предлагает свои системы сотням ритейлеров, включая секонд-хенды и аптеки. По словам генерального директора компании, многие клиенты используют технологию для выявления краж, но растет число тех, кто пробует применять ее в других целях, в том числе для поиска VIP-клиентов и идентификации сотрудников.

Долгое время самыми заинтересованными пользователями систем по распознаванию лиц были правоохранительные органы.

Похоже, что и Amazon ищет в широком спектре своей деятельности возможности для применения систем распознавания лиц. По сообщениям разных источников, помимо сотрудничества с полицейскими участками, ритейл-гигант помогает отелям ускорить процессы регистрации.

«Компании со всего мира приходят в Amazon и говорят: „Это именно то, что мы хотим делать“. И вы понимаете, что это прекрасная сфера. Она интересует всех», — говорит анонимный источник, присоединившийся к Amazon в момент покупки Orbeus, компании-разработчика одной из систем распознавания лиц.

Для Amazon такая активность не обошлась без противоречивых последствий. В прошлом июле Американский союз защиты гражданских свобод (ACLU) протестировал системы компании, сравнив лица всех членов Конгресса с базой данных преступников. Проверка показала 28 ложных совпадений, причем большинство ошибок произошло из-за цвета кожи участников эксперимента. В результате Союз призвал запретить использование системы распознавания лиц в правоохранительных органах. Тем не менее, представители Amazon настояли на продаже системы полицейским, а также Иммиграционной и таможенной полиции США.

Тогда некоторые члены Конгресса, в том числе член палаты представителей Джерролд Надлер и сенатор Рон Уиден, обратились к Счётной Палате с просьбой расследовать использование программ по распознаванию лиц. Лидирующие компании также обеспокоены применением этих систем. В частности, президент Microsoft Брэд Смит в декабре призвал регулировать такие технологии на государственном уровне.

Но даже с ростом обеспокоенности использование систем по распознаванию лиц лишь расширяется, поскольку компании находят новые и новые сферы их применения. Например, Real Networks, разработчик приложения для семейных фотографий, бесплатно предлагает свое программное обеспечение школам по всей стране. Компания говорит о сотне школ в качестве своих клиентов. В интервью журналу Wired генеральный директор Real Networks Роб Глейзер заявил, что запустил этот проект как беспристрастное решение споров о безопасности в школах и контроле оружия. В настоящее время на сайте компании этот ее продукт позиционируется как технология, позволяющая организаторам мероприятий «распознавать каждого болельщика, клиента, сотрудника или гостя», даже если его лицо скрыто.

Уникальная технология распознает лица даже в раскраске или интенсивном макияже. Система различает и определяет лица в разнообразном освещении.

Real Networks — не единственная компания, ориентированная на детский сегмент рынка. Техасский стартап под названием Waldo предлагает аналогичную технологию сотням школ, а также детским спортивным лигам и летним лагерям. На практике это подразумевает использование таких систем для сканирования изображений, снятых видеокамерами или официальными фотографами, и дальнейшее сопоставление лиц детей с базой изображений, предоставленных родителями. Родители всегда могут отказаться от участия.

По словам генерального директора Waldo Родни Райса, школы ежегодно делают десятки тысяч фотографий, и лишь немногие из них попадают в ежегодные альбомы. Распознавание лиц, по его словам, является эффективным способом распространить оставшиеся среди тех, кому они нужны.

«По цене попкорна или оберточной бумаги вы можете заказать эти фотографии для бабушек и дедушек ваших детей», — говорит Райс, объясняя, что Waldo заключила соглашение о распределении доходов с государственными школами. В настоящее время услугами компании пользуются более чем в 30 штатах США.

Рост Waldo и FaceFirst показывает, как бизнес нормализует распознавание лиц, которое еще недавно казалось фантастикой. И с распространением таких технологий все больше компаний будут собирать фото ваших лиц — либо для обучения алгоритмов, либо для поиска клиентов и преступников, — даже если риск ошибок и злоупотреблений будет только расти.

Будущее вашего лица

В 2017 году вышел эпизод техно-антиутопического сериала «Черное зеркало», в котором взволнованная мать беспокоится о непутёвом молодом человеке, который проводит время с ее дочерью. Чтобы узнать, кто это, она загружает его фото в службу идентификации лиц потребителей. Программа оперативно показывает его имя и место работы, и женщина идет с ним разбираться.

Некогда выдуманный сценарий сейчас кажется вполне реальным. Хотя опасения по поводу распознавания лиц по большей части касались применения этой технологии в правительственных организациях, её использования среди коммерческих компаний и даже частных лиц (в стиле «Черного зеркала») создает очевидные риски для личных данных.

По мере того, как все больше компаний начинают продавать системы распознавания лиц, а наши лица попадают в большее количество баз данных, программное обеспечение может завоевать популярность среди вуайеристов и сталкеров. Ритейлеры и арендодатели могут использовать его для выявления нежелательных клиентов и съемщиков, чтобы без шума отказывать в жилье и услугах.

«Любой, у кого есть видеокамера в густонаселенном месте, может начать собирать базы данных изображений, а затем использовать это аналитическое программное обеспечение, чтобы увидеть, совпадают ли полученные изображения с вашими данными», — говорит Джей Стэнли, аналитик ACLU.

Существует также риск хакерских атак. Андрей Барисевич из Gemini Advisors, фирмы по кибербезопасности, говорит, что на сайтах даркнета он видел в продаже профили, украденные из индийской национальной базы биометрических данных. Таких сведений об американцах он не замечал, но добавил: «Это всего лишь вопрос времени». Утечка данных о клиентах отеля или магазина может помочь преступникам в мошенничестве или краже личных данных.

Поскольку технология распространяется без особого контроля со стороны правительства, ответственность за ограничение ее некорректного использования лежит только на производителях ПО. В интервью Fortune генеральные директоры стартапов по распознаванию лиц заявили, что они готовы к таким угрозам. Некоторые, в том числе генеральный директор FaceFirst, назвали опасным распространение таких систем в Китае.

Руководители также предложили два подхода к ограничению злоупотреблений. Первый заключается в тесном сотрудничестве с покупателями программ, чтобы гарантировать их правильную эксплуатацию. Например, Дуг Эли из Ever AI говорит, что его компания придерживается более высоких стандартов, чем Amazon, которая, как он утверждает, предоставляет свой инструмент Rekognition практически всем желающим.

В ответ на вопрос о контроле злоупотреблений Amazon предоставила ранее опубликованное заявление Мэтта Вуда, который занимается искусственным интеллектом в Amazon Web Services. Вуд указывает, что политика компании запрещает, что вредную и незаконную деятельность.

Другой возможной гарантией сохранности данных является использование технических мер, обеспечивающих невозможность взлома баз «лицевых» данных.

Родни Райс, генеральный директор Waldo, говорит, что лица хранятся в виде буквенно-цифровых хешей. Это означает, что даже в случае утечки данных конфиденциальность не будет нарушена, поскольку хакер не сможет расшифровать хеши и использовать их. Эту точку зрения поддержали и другие.

Райс опасается, что законодательное определение правил использования «лицевых» технологий может принести больше вреда, чем пользы. «Предоставить ребенку разбираться и создавать правила — это смешно», — говорит он.

Между тем, некоторые компании, разрабатывающие программное обеспечение для распознавания лиц, используют новые методы, которые могут уменьшить необходимость в больших данных для обучения. Так действует, например, Kairos, «лицевой» стартап из Майами, который среди прочего работает с широкой сетью отелей. По словам Стивена Мура, главы службы безопасности в этой компании, Kairos создает «синтетические» лица для имитации широкого спектра эмоций и освещения. Такие «искусственные лица» позволяют сократить использование лицевых данных из реального мира при создании технологических продуктов.

Все эти меры — надзор за пользователями систем, надежная защита данных и синтетические средства обучения — могут смягчить некоторые проблемы конфиденциальности, связанные с использованием наших лиц бизнесом. В то же время Трепп из FaceFirst полагает, что беспокойство снизится при близком знакомстве с системой. Он даже утверждает, что сцены распознавания лиц в научно-фантастическом фильме 2002 года «Особое мнение» начнут восприниматься нормально.

«Миллениалы гораздо охотнее делятся информацией. Этот мир [из „Особого мнения“] становится все ближе к нашему, — говорит он. — Если всё делать правильно, то я думаю, что людям понравится, и это будет положительный опыт. Это не будет так уж жутко».

«Миллениалы гораздо охотнее делятся информацией», — Питер Трепп, генеральный директор FaceFirst

Другие, в том числе ACLU, менее оптимистичны. Тем не менее, несмотря на растущее обсуждение вокруг технологии, на данный момент практически нет ничего, что ограничивало бы использование вашего лица. Единственное исключение в трех штатах — Иллинойсе, Техасе и Вашингтоне, — которые требуют определенной степени согласия перед использованием чьего-либо лица. Эти законы на самом деле не используются на практике за исключением Иллинойса, где потребители могут подавать судебные иски для обеспечения соблюдения этого права.

В настоящее время закон штата Иллинойс является предметом громкого апелляционного судебного разбирательства с участием Facebook, которая утверждает, что ограничения на получение лиц не распространяются на цифровое сканирование. В 2017 году Facebook и Google провели неудачную кампанию по лоббированию, чтобы убедить законодателей Иллинойса смягчить закон. В конце января сторонников закона поддержал Верховный суд Иллинойса, когда постановил, что потребители могут подавать в суд на несанкционированное использование их биометрии, даже если при этом не был нанесен реальный вред.

Другие штаты также допускают возможность принятия собственных законов о биометрии. На федеральном уровне законодатели до сих пор уделяли этому мало внимания. Однако это может измениться, поскольку сенаторы Брайан Шатц и Рой Блаунт в этом месяце представили законопроект, который требовал бы от компаний получить разрешение прежде, чем использовать распознавание лиц в общественных местах или делиться данными о лицах с какой-либо третьей стороной.

Клэр Гарви, исследовательница из Джорджтауна, поддерживает законы по контролю за этими системами. Но она говорит, что законодателям было трудно поспевать за технологиями.

«Одной из проблем распознавания лиц является невероятно быстрое их внедрение благодаря уже существующим базам данных. Наши лица много где засветились», — говорит она. «В отличие от отпечатков пальцев, применительно к которым давно существуют правила о сборе данных, регулирования для технологий распознавания лиц все еще нет».

Источник: telegra.ph