Современная практика коммерческого накопления, перепрофилирования и продажи данных полностью противоречит принципу детализации цели и Руководящим принципам защиты частной жизни и трансграничных потоков персональных данных ОЭСР. Кроме того, принцип ограничения сбора данных нарушается всякий раз, когда компания представляет потребителю соглашение о конфиденциальности, которое разработано так, что его невозможно понять и/или оно оставляет за компанией право вносить изменения без дальнейших консультаций или уведомлений. Поэтому любое уведомление превращается в бессмысленное действие «для галочки». Как и в случае с государственным надзором ради безопасности, общественное мнение весьма негативно настроено по отношению к коммерческим сайтам, собирающим и повторно использующим личные данные. В качестве лакмусовой бумажки опять возьмем американские и европейские опросы. К примеру, анкетирование американских интернет-пользователей, проведенное в 2012 г., показало, что 62 % опрошенных взрослых заявили, что не знают, как ограничить информацию, собираемую о них сайтами, а 68 % — что им не нужна целевая реклама, потому что она отслеживает и анализирует их поведение в интернете{56}. Недавний опрос европейских граждан обнаружил схожие результаты: 69 % респондентов считают, что для сбора персональных данных необходимо получить их явное одобрение, но только 18 % респондентов полностью читают заявления о конфиденциальности{57}. Кроме того, 67 % респондентов заявили, что они не читают заявления о конфиденциальности, потому что находят их слишком длинными, а 38 % считают их запутанными или слишком сложными для понимания{58}. Опрос также показал, что 69 % респондентов были обеспокоены тем, что их информация используется для целей, отличных от той, для которой она была собрана, а 53 % не устраивали интернет-компании, использующие их персональную информацию для адаптации рекламы.
Таким образом, на данный момент общественное мнение в целом негативно относится как к государственному надзору, так и к интернет-компаниям, собирающим, хранящим и анализирующим персональные данные. Сегодня большинство комментаторов согласны с тем, что законодательство о конфиденциальности данных необходимо обновить и внести изменения. В 2012 г. Европейский союз и Федеральная торговая комиссия в США опубликовали обзоры и обновления, касающиеся защиты данных и политики конфиденциальности{59},{60},{61}. В 2013 г. Руководящие принципы ОЭСР были расширены, чтобы включить, помимо прочего, более подробную информацию о принципе подотчетности. В частности, новые Руководящие принципы определяют обязанности оператора данных с точки зрения наличия программы управления конфиденциальностью и четко определяют, что влечет за собой такая программа и как ее следует рассматривать с точки зрения управления рисками в отношении персональных данных{62}.
В 2014 г. гражданин Испании Марио Костеха Гонсалес выиграл дело в Европейском суде против Google, отстаивая свое право на забвение{63}. Суд постановил, что физическое лицо может при определенных условиях запросить поисковую интернет-систему, чтобы та удалила ссылки на веб-страницы, полученные в результате поиска от имени физического лица. Основанием для такого иска было то, что данные могут быть неточными, устаревшими или храниться дольше, чем это необходимо для исторических, статистических или научных целей. Это решение имеет серьезные последствия для всех поисковых систем в интернете, но может оказать влияние и на другие накопители больших данных. Например, пока неясно, как это повлияет на сайты социальных сетей, таких как Facebook или Twitter{64}.
Концепция права на забвение была утверждена и в других юрисдикциях. Например, в калифорнийском законе закреплено право несовершеннолетнего на удаление по запросу материалов, которые он или она разместили в интернете или на мобильном сервисе; также закон запрещает интернет-операторам и операторам мобильной связи собирать персональные данные несовершеннолетних в целях адресной рекламы или для передачи третьей стороне{65}.
В качестве заключительного примера происходящих изменений стоит упомянуть, что в 2016 г. был подписан и принят Щит конфиденциальности ЕС‒США{66}. Щит конфиденциальности — это соглашение об обязательствах в отношении персональных данных двух юрисдикций. Подход заключается в том, чтобы усилить защиту данных граждан ЕС, когда эти данные оказываются перемещены за пределы ЕС. Этим соглашением введены более строгие обязательства для компаний в отношении прозрачности использования данных наряду с жесткими механизмами надзора и возможными санкциями, а также соглашения между правительством США и Европейским союзом об ограничениях и механизмах надзора для государственных органов, осуществляющих запись или доступ к персональным данным.
Тем не менее на момент написания этой книги сила и эффективность Щита конфиденциальности ЕС‒США проверяется в ходе судебного разбирательства в ирландском суде. Причина, по которой ирландская правовая система находится в центре этих дебатов, заключается в том, что многие крупные американские транснациональные интернет-компании (Google, Facebook, Twitter и другие) расположили свои EMEA[31] штаб-квартиры в Ирландии. В результате уполномоченный по защите данных в Ирландии несет ответственность за соблюдение правил ЕС о трансграничной передаче данных этими компаниями. Недавняя история показывает, что судебные дела могут привести к значительным и быстрым изменениям в регулировании работы с персональными данными. Фактически Щит конфиденциальности ЕС‒США является прямым следствием дела, возбужденного Максом Шремсом, австрийским юристом и активным защитником приватности, против Facebook. Результатом дела Шремса в 2015 г. стало немедленное вступление в силу действующего соглашения о «Безопасной гавани» между ЕС и США, и в качестве экстренного реагирования был разработан Щит конфиденциальности. По сравнению с первоначальным соглашением о «Безопасной гавани» Щит конфиденциальности укрепил права граждан ЕС в отношении их данных{67}, и вполне может быть, что в скором времени укрепит еще больше.
С точки зрения науки о данных важно то, что эти примеры демонстрируют постоянные изменения правил, касающихся конфиденциальности и защиты данных. Примеры, приведенные здесь, взяты из контекстов США и Европейского союза, но они свидетельствуют о более широких тенденциях. Сложно предсказать, как эти изменения будут развиваться в долгосрочной перспективе. В этой области много заинтересованных сторон, включая крупные рекламные, страховые и интернет-компании, спецслужбы, органы полиции, правительства, медицинские и социальные организации, а также правозащитные группы. Каждый из этих секторов общества использует данные в своих целях, и, следовательно, мы имеем разные взгляды на проблему конфиденциальности данных. Кроме того, мы сами, как частные лица, вероятно, будем менять свои взгляды в зависимости от того, чью точку зрения разделяем. Например, вы одобряете использование и повторное использование ваших персональных данных для медицинских исследований. Однако, как показывают опросы общественного мнения, о которых говорилось выше, многие не поддерживают сбор, повторное использование и обмен данными для целевой рекламы. Вообще говоря, в дискуссии о будущем конфиденциальности данных прослеживаются две темы. Согласно одной точке зрения, необходимо ужесточить правила сбора персональных данных и в некоторых случаях дать людям возможность контролировать их сбор, обмен и использование. Другая точка зрения требует ослабить регулирование, но законодательно ужесточить требования компенсации за ненадлежащее использование персональных данных. С таким количеством различных заинтересованных сторон и точек зрения не может быть простых и очевидных ответов. Вполне вероятно, что возможные решения, которые только предстоит разработать, будут учитывать интересы секторов и состоять из компромиссов, согласованных между соответствующими сторонами.
В таком изменчивом контексте лучше всего действовать консервативно и этично. Если мы разрабатываем новые решения бизнес-задач в области данных, то должны учитывать и этические вопросы. Для этого есть веские деловые причины. Во-первых, этичные и прозрачные действия с персональными данными обеспечат хорошие отношения с клиентами, а вот ненадлежащая практика их использования способна нанести серьезный ущерб репутации бизнеса и привести к оттоку клиентов{68}. Во-вторых, существует риск того, что по мере усиления интеграции, повторного использования, профилирования и нацеливания данных общественное мнение в ближайшие годы будет консолидироваться вокруг идеи защиты конфиденциальной информации, что приведет к ужесточению правил. Прозрачные и этичные действия — лучший способ гарантировать, что разрабатываемые решения в области науки о данных не будут противоречить действующим нормам или тем, которые могут появиться в ближайшие годы.
В качестве примера того, что несоблюдение этических норм может иметь серьезные последствия для разработчиков и поставщиков технологий, можно привести случай 2015 г.{69}. Дело закончилось тем, что Федеральная торговая комиссия США (FTC) оштрафовала разработчиков и издателей игр в соответствии с Законом о защите конфиденциальности детей в интернете (COPPA). Разработчики интегрировали стороннюю рекламу в свои бесплатные игры. Интеграция сторонней рекламы является стандартом бесплатных бизнес-моделей. Однако возникла проблема, поскольку игры были предназначены для детей в возрасте до 13 лет. В результате, предоставляя данные своих пользователей рекламным сетям, разработчики нарушили COPPA. Кроме того, в одном эпизоде разработчики даже не сообщили рекламным сетям, что приложения предназначены для детей. Детям могла быть показана неуместная реклама, поэтому FTC постановила, что издатели игр несут ответственность за обеспечение соответствия контента и рекламы возрасту пользователей. В последние годы число подобных случаев увеличилось, и ряд организаций, в том числе FTC{70}, призвали компании принять
Хотя доводы в пользу этической науки о данных ясны, действовать этично не всегда так просто. Чтобы конкретизировать этические вопросы науки о данных, представьте себе, что вы работаете в критически важном для бизнеса проекте специалистом по данным. Анализируя данные, вы обнаружили ряд зависимых атрибутов, которые в совокупности оказались замещающей переменной расы, религии, сексуальной ориентации или иного конфиденциального признака. Вы знаете, что по закону не можете использовать расовый атрибут в вашей модели, но вы уверены, что эти замещающие переменные позволят вам обойти антидискриминационное законодательство. Вы также полагаете, что включение этих атрибутов в модель заставит ее работать, хотя, конечно, обеспокоены тем, что это может усилить дискриминацию, которая уже присутствует в системе. Спросите себя: «Что я буду делать?»
Источники
‹1›. Brynjolfsson, Erik, Lorin M. Hitt, and Heekyung Hellen Kim. 2011. «Strength in Numbers: How Does Data-Driven Decisionmaking Affect Firm Performance?» SSRN Scholarly Paper ID 1819486. Rochester, NY: Social Science Research Network. https://papers.ssrn.com/abstract=1819486.
‹2›. Carroll, Rory. 2013. «Welcome to Utah, the NSA’s Desert Home for Eavesdropping on America.» The Guardian, June 14, sec. US news. https://www.theguardian.com/world/2013/jun/14/nsa-utah-data-facility.
‹3›. Kitchin, Rob. 2014a. The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. Sage.
‹4›. Batty, Mike, Arun Tripathi, Alice Kroll, Cheng-sheng Peter Wu, David Moore, Chris Stehno, Lucas Lau, Jim Guszcza, and Mitch Katcher. 2010. «Predictive Modeling for Life Insurance: Ways Life Insurers Can Participate in the Business Analytics Revolution.» Society of Actuaries. https://www.soa.org/files/pdf/research-pred-mod-life-batty.pdf.
‹5›. Mayer-Schönberger, Viktor, and Kenneth Cukier. 2014. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Reprint edition. Boston: Eamon Dolan/Mariner Books.
‹6›. Batty, Mike, Arun Tripathi, Alice Kroll, Cheng-sheng Peter Wu, David Moore, Chris Stehno, Lucas Lau, Jim Guszcza, and Mitch Katcher. 2010. «Predictive Modeling for Life Insurance: Ways Life Insurers Can Participate in the Business Analytics Revolution.» Society of Actuaries. https://www.soa.org/files/pdf/research-pred-mod-life-batty.pdf.
‹7›. Hill, Shawndra, Foster Provost, and Chris Volinsky. 2006. «Network-Based Marketing: Identifying Likely Adopters via Consumer Networks.» Statistical Science 21 (2): 256–276. doi:10.1214/088342306000000222.
‹8›. Beales, Howard. 2010. «The Value of Behavioral Targeting.» Network Advertising Initiative. http://www.networkadvertising.org/pdfs/Beales_NAI_Study.pdf.
‹9›. Goldfarb, Avi, and Catherine E. Tucker. 2011. «Online Advertising, Behavioral Targeting, and Privacy.» Communications of the ACM 54 (5): 25–27.