IBM Research выпустила открытую библиотеку дифференциальной конфиденциальности

Candellmans

Мастер
Сообщения
7,983
Реакции
8,505
IBM Research выпустила открытую библиотеку дифференциальной конфиденциальности с поддержкой машинного обучения

30.06.20
IBM выпустила библиотеку дифференциальной конфиденциальности (или приватности) с открытым исходным кодом, которая, по словам Наоиса Холоана (Naoise Holohan), сотрудника исследовательской группы IBM Research Europe по вопросам конфиденциальности и безопасности, обладает набором инструментов для решения задач машинного обучения и анализа данных со встроенными гарантиями конфиденциальности.

«Наша библиотека уникальна, она дает ученым и разработчикам доступ к упрощённым, удобным для использования инструментам для анализа данных и машинного обучения в знакомой среде — на самом деле, большинство задач можно решить одной строкой кода», — поясняет Холоан в блоге. Он добавил, что отличие библиотеки также заключается в том, что имеющаяся функция машинного обучения позволяет организациям публиковать и делиться своими данными, сохраняя полную гарантию конфиденциальности пользователей.

istock-1225893654.jpg

В интервью Холохан говорит, что технология дифференциальной приватности стала настолько популярной, что впервые за 230-летнюю историю переписи населения США её будут использовать для обеспечения конфиденциальности данных граждан. Крис Скиакка (Chris Sciacca), менеджер по коммуникациям IBM Research, добавил, что перепись 2020 года является хорошим примером того, как можно использовать дифференциальную конфиденциальность для любых больших наборов данных, когда вы можете производить статистический анализ. Он отметил, что эта технология также может быть востребована при сборе и анализе медицинских данных.

Дифференциальная конфиденциальность позволяет вносить в данные математический шум для анонимизации информации, и особенность библиотеки IBM заключается в том, что ее функциональность машинного обучения позволяет организациям публиковать и делиться своими данными со строгими гарантиями конфиденциальности пользователей. По словам Скиакка, начиная работу над проектом, учёные отметили, что, хотя проделано немало исследований в этом направлении, не было ни одного репозитория или единой библиотеки, позволяющей перейти к машинному обучению с дифференциальной конфиденциальностью.

«Мы решили создать библиотеку, которая, используя существующие пакеты Python, позволяет вам сделать простую надстройку над ними, а затем выполнять машинное обучение со встроенными дифференциальными гарантиями конфиденциальности. Многие команды вы можете выполнить в одной строке кода, поэтому она очень удобна для пользователя. Она проста в использовании и может быть легко интегрирована в имеющиеся скрипты, поэтому не потребуется много дополнительных усилий», — рассказал Крис Скиакка.

В прошлом году Google выпустила свою библиотеку дифференциальной конфиденциальности с открытым исходным кодом, которая используется для её различных сервисов. Например, с её помощью Google анонимно отслеживает данные о том, когда большинство людей едят в определённом ресторане или занимаются шоппингом в популярном магазине. В 2014 году компания использовала эту технологию для усовершенствования браузера Chrome, а также сервиса Google Fi. Apple и Uber тоже используют собственные реализации технологии дифференциальной конфиденциальности для оптимизации своих сервисов и защиты данных пользователей.


Источники:
 
Назад
Сверху Снизу