Как дифференциальная конфиденциальность защищает ваши данные? Marco Verch / Flickr, CC BY 

Компании Tech могут использовать дифференциальную конфиденциальность для сбора и обмена совокупными данными об пользовательских привычках при сохранении личной конфиденциальности.

Не секрет, что крупные технические компании, такие как Facebook, Google, Apple и Amazon, все чаще проникают в наши личные и социальные взаимодействия, чтобы ежедневно собирать огромные объемы данных. В то же время нарушения конфиденциальности в киберпространстве регулярно публикуют новости на главной странице.

Итак, как защитить конфиденциальность в мире, где собираются данные и разделяются с растущей скоростью и изобретательностью?

Дифференциальная конфиденциальность - это новая модель кибербезопасности, заявленная сторонниками защиты, которая может защитить личные данные намного лучше, чем традиционные методы.

Математика, на которой она основана, была разработана 10 несколько лет назад, и этот метод был принят Apple и Google в последние годы.


графика подписки внутри себя


Что такое дифференциальная конфиденциальность?

Дифференциальная конфиденциальность позволяет технологическим компаниям собирать и делиться совокупной информацией об пользовательских привычках, сохраняя при этом конфиденциальность отдельных пользователей.

Например, скажите, что вы хотели показать самые популярные маршруты, которые люди проходят по парку. Вы отслеживаете маршруты людей 100, которые регулярно ходят по парку и ходят ли они по тропинке или по траве.

Но вместо того, чтобы делиться конкретными людьми, принимающими каждый маршрут, вы делитесь совокупными данными, собранными с течением времени. Люди, просматривающие ваши результаты, могут знать, что 60 из 100 предпочитают коротко прорезать траву, но не тех людей 60.

Зачем нам это нужно?

Многие правительства стран мира придерживаются строгой политики в отношении того, как технологические компании собирают и обмениваются данными пользователей. Компании, которые не соблюдают правила, могут столкнуться с огромными штрафами. Бельгийский суд недавно заказал Facebook прекратить сбор данных о привычках пользователей на внешних сайтах или штрафах в размере 250,000 в день.

Для многих компаний, особенно транснациональных компаний, работающих в разных юрисдикциях, это оставляет их в деликатной позиции, когда дело доходит до сбора и использования данных клиентов.

С одной стороны, эти компании нуждаются в данных пользователей, чтобы они могли предоставлять высококачественные услуги, которые приносят пользу пользователям, такие как персонализированные рекомендации. С другой стороны, они могут столкнуться с обвинениями, если они собирают слишком много пользовательских данных или пытаются перенести данные из одной юрисдикции в другую.

Традиционные средства обеспечения конфиденциальности, такие как криптография, не могут решить эту проблему, поскольку она мешает технологическим компаниям вообще получать доступ к данным. И анонимность уменьшает ценность данных - алгоритм не может служить вам персонализированным рекомендациям, если он не знает, каковы ваши привычки.

Как это работает?

Давайте продолжим пример прогулок по парку. Если вы знаете личность тех, которые включены в исследование, но вы не знаете, кто взял тот маршрут, тогда вы можете предположить, что конфиденциальность защищена. Но это может быть не так.

Скажите, что кто-то, просматривая ваши данные, хочет выяснить, хочет ли Боб идти по траве или по пути. Они получили справочную информацию о других людях 99 в исследовании, в которых говорится, что люди 40 предпочитают ходить по пути, и 59 предпочитают ходить по траве. Поэтому они могут вывести, что Боб, который является 100th человек в базе данных, является 60th человек, который предпочитает ходить по траве.

Этот тип атаки называется дифференцированной атакой, и от нее довольно сложно защищаться, поскольку вы не можете контролировать, сколько знаний фона может получить кто-то. Дифференциальная неприкосновенность частной жизни направлена ​​на защиту от такого типа нападений.

Кто-то, кто выводит ваш маршрут пешком, может показаться слишком серьезным, но если вы замените пешеходные маршруты результатами тестирования на ВИЧ, то вы увидите, что существует вероятность серьезного вторжения в частную жизнь.

Дифференциальная модель конфиденциальности гарантирует, что даже если у кого-то есть полная информация о 99 людей 100 в наборе данных, они все равно не могут выводить информацию о конечном лице.

Основной механизм достижения этого - добавить случайный шум к совокупным данным. В примере пути вы можете сказать, что количество людей, которые предпочитают пересекать траву, это 59 или 61, а не точное число 60. Неточный номер может сохранить конфиденциальность Боба, но он будет очень мало влиять на шаблон: вокруг 60% люди предпочитают делать короткие снимки.

Шум тщательно разработан. Когда Apple использовала дифференциальную конфиденциальность в iOS 10, она добавила шум для отдельных пользовательских входов. Это означает, что он может отслеживать, например, наиболее часто используемые эмозисы, но использование эмози в отношении любого отдельного пользователя маскируется.

Синтия Дворк, изобретатель дифференциальной конфиденциальности, предложил замечательные математические доказательства того, сколько шума достаточно для достижения требования дифференциальной конфиденциальности.

Каковы его практические применения?

Дифференциальная конфиденциальность может применяться ко всему: от систем рекомендаций до сервисов на основе местоположения и социальных сетей. яблоко использует дифференциальную конфиденциальность для сбора анонимных сведений об использовании таких устройств, как iPhones, iPads и Mac. Метод удобен для пользователя и юридически в.

Дифференциальная конфиденциальность также позволит такой компании, как Amazon, получить доступ к вашим индивидуальным предпочтениям при покупке, скрывая конфиденциальную информацию о вашем историческом списке покупок. Facebook может использовать его для сбора поведенческих данных для целевой рекламы, не нарушая политики конфиденциальности в стране.

Как его можно использовать в будущем?

В разных странах действуют разные политики конфиденциальности, и в настоящее время конфиденциальные документы необходимо проверять вручную, прежде чем они переместятся из одной страны в другую. Это отнимает много времени и дорого.

Недавно команда из Университет Дикин разработала дифференциальную технологию конфиденциальности для автоматизации процессов конфиденциальности в сообществах облачного обмена между странами.

БеседаОни предлагают использовать математические формулы для моделирования законов о конфиденциальности каждой страны, которые могут быть переведены на «промежуточное ПО» (программное обеспечение), чтобы обеспечить соответствие данных. Использование дифференциальной конфиденциальности таким образом может защитить конфиденциальность пользователей и решить головную боль обмена данными для технических компаний.

Об авторе

Тяньцин Чжу, преподаватель кибербезопасности, факультет естественных наук, инженерии и искусственной среды, Университет Дикин

Эта статья изначально была опубликована в Беседа, Прочтите оригинал статьи.

Книги по этой теме

at Внутренний рынок самовыражения и Amazon