Сен
16

Инструкция: Как обмануть Большого Брата

Вас не раздражает, когда в почте после того, как вы написали письмо, скажем, о Брнарде Барухе и отличиях сефардов от ашкенази, у вас появляется реклама Google, приглашающая отдохнуть в Эйлате, либо посетить Иерусалим? В принципе, в этом ничего страшного нет. Потому, как, в сущности, вы меняете возможность бесплатно пользоваться Google и его сервисами на право Google отправлять вам таргетированную рекламу. Умом все это понимаешь, но достает. К тому же, не всегда чтение личной и корпоративной переписки, безобидно. Поэтому я свела материалы сайтов DLP-эксперт и Infowatch в небольшую памятку.

Вся наша переписка и беседы по Скайпу  прослушиваются и просматриваются программами. Роботами. Примитивными алгоритмами, которым до высокого звания Искусственного интеллекта ещё пилить и пилить. Те объёмы данных, которыми оперируют скайпы и е-беи, настолько огромны, что человек не в состоянии просматривать даже одну стамиллионную долю. Там всё – строго автоматически.

Таким образом, возникает возможность сохранить конфиденциальность своих документов, в публичных сетях, облачных ресурсах и зарубежных каналах связи. Надо только не позволить вражеским алгоритмам анализа их найти и вычленить из океана Big Data.

Любая программа-робот, которая просматривает переписку настроена на определенные ключевые слова, т.е. при наличии тех или иных слов, программа относит  ваше письмо к той или иной тематической группе. Списки таких слов по темам организованы в рубрике, а совокупность рубрик является своего рода сердцем программы, занимающейся автоматическим чтением переписки – рубрикатором.

Рубрикатор распознаёт слова и словосочетания, которые у него есть в словаре. Каждое из них сопоставлено одной или нескольким рубрикам с тем или иным весом. Веса обнаруженных слов суммируются или собираются в какую-то более сложную формулу, зависящую от ряда условий. При превышении порога соответствующая рубрика (тематика) присваивается всему тексту.

Словари и алгоритмы вычисления веса должны быть конфиденциальными. В противном случае их будет легче обойти. Напомню, что цензуру и DLP стремятся преодолеть с обеих сторон одновременно – и получатель, и отправитель. В отличие от того же спама, где получатель играет на стороне фильтрующего.

Наш противник может догадываться об имеющихся в словаре терминах и их весе. Но догадки ему мало помогут, поскольку при составлении текста он должен выдержать баланс. С одной стороны, набрать ниже порогового значения. С другой – употребить достаточно тематических терминов, чтобы читатель понял, о чём речь.

С алгоритмом рубрикации ещё веселее. Поясню на примере. Когда текст попадает в тематику “эротика и порнография”, он блокируется цензурным фильтром. Но если одновременно присутствует рубрика “медицина” – он пропускается, поскольку очень многие тексты о здоровье и лечении терминологически близки к порнорассказам. Становится ясно, как порномастеру преодолеть цензуру. Надо использовать несколько “тяжелых” медицинских терминов; иногда хватает даже одного.

В общем, в подавляющем большинстве случаев lостаточно исключить и заменить ключевые слова или вставить так называемые нейтрализующие слова, примеры которых приведены выше. Надо назвать вещи не своими именами. Очень помогают слова-метафоры. Компьютер считает, ему недоступно ассоциативное мышление и поэтому, будучи настроенным на определенные слова, он пропускает мимо метафоры, либо слова по ассоциации. Кроме того, не следует ставить гриф или уведомление. И ещё десятка два способов, о которых хорошо ведомо SEOшникам. Их работа – поднять ресурс в поисковом рейтинге. Но легко справятся и с противоположной задачей – опустить. Все эти призмы с эшелонами устроены аналогично гуглам и яндексам. Как не существует отдельной военной и гражданской криптографии, так и алгоритмы поиска и категоризации – одинаковы для всех.

Поэтому DLP-система может на периметре ИС вместо принудительного шифрования принудительно редактировать документ, делая его непригодным для автоматического поиска и категоризации. В этой задаче кроме SEOшных и спамерские технологии пригодятся.

    Category HANDBOOK     Tags

Прокомментировать

 
ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы