Top menu

Данные 123 миллионов американских домохозяйств хранились в открытом хранилище Amazon

Облачное хранилище Amazon, содержащее информацию калифорнийской компании Alteryx, занимающуюся анализом данных, были доступны в Интернет. В результате этого было обнаружено огромное количество персональной информации о 123 миллионах домохозяйств США.

Внутри хранилища находятся массивы данных Experian ConsumerView и результаты переписи населения США 2010 года, принадлежащие партнерам Alteryx - бюро кредитных историй Experian и бюро переписи населения США соответственно.

В совокупности данные содержат миллиарды персональных деталей практически по каждому американскому домохозяйству. От домашних адресов и контактной информации, владения ипотекой и финансовых историй, до очень специфического анализа покупательского поведения.

Хранилище Amazon Web Services (AWS) S3, расположенное в субдомене «alteryxdownload» было настроено таким образом, что позволяло любому аутентифицированному пользователю AWS получить доступ к этому хранилищу. Аутентифицированный пользователь AWS это по факту любой пользователь, у которого есть учетная запись AWS. У Amazon уже насчитывается более миллиона таких пользователей. Регистрация для такого аккаунта бесплатна.

Хранилище содержит множество версий программного обеспечения Alteryx:

Особую ценность представляет 36-гигабайтный файл с названием «ConsumerView_10_2013», который имеет расширение .yxdb. Это файл базы данных Alteryx. Ранее такой формат был замечен в утечке информации о 198 миллионов американских избирателей из базы данных Национального комитета Республиканской партии (Republican National Committee, RNC).

Файл ConsumerView_10_2013.yxdb содержит более 123 миллионов строк - число, близкое к оценкам общего количества домохозяйств на момент создания файла в 2013 году.

Experian ConsumerView — это крупнейшая и наиболее полная база данных для традиционных и цифровых маркетинговых кампаний. Тысячи атрибутов более чем 300 миллионов потребителей и 126 миллионов домохозяйств охватывают широкий спектр личной информации: возраст, пол, образование, профессия и семейное положение. В рекламных материалах Experian также отдельно выделяет информацию об ипотеке и финансовых показателях.

После прочтения подобных новостей могут возникнуть вопросы – как всплывают такие «открытия» и как не допускать таких ошибок в хранении конфиденциальных данных? На первый вопрос мы ответили в статье «Как обнаруживают открытые облачные хранилища Amazon».

По поводу второго вопроса - простейшим и весьма эффективным решением проблемы может служить регулярная инвентаризация данных. Такой процесс позволит выявлять те данные, которые попали в облачные хранилища случайно или намеренно, в нарушение политики безопасного хранения информации в компании, и хранятся в открытом виде. Давно существуют решения класса data discovery как самостоятельные продукты или компоненты DLP-систем.

Автор: Владимир Безмалый