Инструкция: Как обмануть Большого Брата
Вас не раздражает, когда в почте после того, как вы написали письмо, скажем, о Брнарде Барухе и отличиях сефардов от ашкенази, у вас появляется реклама Google, приглашающая отдохнуть в Эйлате, либо посетить Иерусалим? В принципе, в этом ничего страшного нет. Потому, как, в сущности, вы меняете возможность бесплатно пользоваться Google и его сервисами на право Google отправлять вам таргетированную рекламу. Умом все это понимаешь, но достает. К тому же, не всегда чтение личной и корпоративной переписки, безобидно. Поэтому я свела материалы сайтов DLP-эксперт и Infowatch в небольшую памятку.
Вся наша переписка и беседы по Скайпу прослушиваются и просматриваются программами. Роботами. Примитивными алгоритмами, которым до высокого звания Искусственного интеллекта ещё пилить и пилить. Те объёмы данных, которыми оперируют скайпы и е-беи, настолько огромны, что человек не в состоянии просматривать даже одну стамиллионную долю. Там всё – строго автоматически.
Таким образом, возникает возможность сохранить конфиденциальность своих документов, в публичных сетях, облачных ресурсах и зарубежных каналах связи. Надо только не позволить вражеским алгоритмам анализа их найти и вычленить из океана Big Data.
Любая программа-робот, которая просматривает переписку настроена на определенные ключевые слова, т.е. при наличии тех или иных слов, программа относит ваше письмо к той или иной тематической группе. Списки таких слов по темам организованы в рубрике, а совокупность рубрик является своего рода сердцем программы, занимающейся автоматическим чтением переписки – рубрикатором.
Рубрикатор распознаёт слова и словосочетания, которые у него есть в словаре. Каждое из них сопоставлено одной или нескольким рубрикам с тем или иным весом. Веса обнаруженных слов суммируются или собираются в какую-то более сложную формулу, зависящую от ряда условий. При превышении порога соответствующая рубрика (тематика) присваивается всему тексту.
Словари и алгоритмы вычисления веса должны быть конфиденциальными. В противном случае их будет легче обойти. Напомню, что цензуру и DLP стремятся преодолеть с обеих сторон одновременно – и получатель, и отправитель. В отличие от того же спама, где получатель играет на стороне фильтрующего.
Наш противник может догадываться об имеющихся в словаре терминах и их весе. Но догадки ему мало помогут, поскольку при составлении текста он должен выдержать баланс. С одной стороны, набрать ниже порогового значения. С другой – употребить достаточно тематических терминов, чтобы читатель понял, о чём речь.
С алгоритмом рубрикации ещё веселее. Поясню на примере. Когда текст попадает в тематику “эротика и порнография”, он блокируется цензурным фильтром. Но если одновременно присутствует рубрика “медицина” – он пропускается, поскольку очень многие тексты о здоровье и лечении терминологически близки к порнорассказам. Становится ясно, как порномастеру преодолеть цензуру. Надо использовать несколько “тяжелых” медицинских терминов; иногда хватает даже одного.
В общем, в подавляющем большинстве случаев lостаточно исключить и заменить ключевые слова или вставить так называемые нейтрализующие слова, примеры которых приведены выше. Надо назвать вещи не своими именами. Очень помогают слова-метафоры. Компьютер считает, ему недоступно ассоциативное мышление и поэтому, будучи настроенным на определенные слова, он пропускает мимо метафоры, либо слова по ассоциации. Кроме того, не следует ставить гриф или уведомление. И ещё десятка два способов, о которых хорошо ведомо SEOшникам. Их работа – поднять ресурс в поисковом рейтинге. Но легко справятся и с противоположной задачей – опустить. Все эти призмы с эшелонами устроены аналогично гуглам и яндексам. Как не существует отдельной военной и гражданской криптографии, так и алгоритмы поиска и категоризации – одинаковы для всех.
Поэтому DLP-система может на периметре ИС вместо принудительного шифрования принудительно редактировать документ, делая его непригодным для автоматического поиска и категоризации. В этой задаче кроме SEOшных и спамерские технологии пригодятся.
Прокомментировать
Последние записи
- Рецензия на книгу Р.В.Ромачева «История частной разведки США»
- Новое на блоге
- Воспоминание о будущем — 2050
- Новая среда обитания
- Главная технология ближайшего будущего. Битва за кванты
Архивы
- Март 2022
- Февраль 2022
- Март 2021
- Январь 2021
- Декабрь 2020
- Ноябрь 2020
- Октябрь 2020
- Сентябрь 2020
- Август 2020
- Июнь 2020
- Май 2020
- Апрель 2020
- Март 2020
- Февраль 2020
- Январь 2020
- Декабрь 2019
- Ноябрь 2019
- Август 2019
- Июль 2019
- Май 2019
- Апрель 2019
- Март 2019
- Февраль 2019
- Декабрь 2018
- Октябрь 2018
- Сентябрь 2018
- Август 2018
- Июль 2018
- Июнь 2018
- Апрель 2018
- Март 2018
- Январь 2018
- Декабрь 2017
- Ноябрь 2017
- Октябрь 2017
- Сентябрь 2017
- Август 2017
- Июль 2017
- Июнь 2017
- Май 2017
- Апрель 2017
- Март 2017
- Февраль 2017
- Январь 2017
- Декабрь 2016
- Ноябрь 2016
- Октябрь 2016
- Сентябрь 2016
- Август 2016
- Июль 2016
- Июнь 2016
- Май 2016
- Апрель 2016
- Март 2016
- Февраль 2016
- Январь 2016
- Декабрь 2015
- Ноябрь 2015
- Октябрь 2015
- Сентябрь 2015
- Август 2015
- Июль 2015
- Июнь 2015
- Май 2015
- Апрель 2015
- Март 2015
- Февраль 2015
- Январь 2015
- Декабрь 2014
- Ноябрь 2014
- Октябрь 2014
- Сентябрь 2014
- Июль 2014
- Июнь 2014
- Май 2014
- Апрель 2014
- Март 2014
- Февраль 2014
- Январь 2014
- Декабрь 2013
- Ноябрь 2013
- Октябрь 2013
- Сентябрь 2013
- Август 2013
- Июль 2013
- Июнь 2013
- Май 2013
- Апрель 2013
- Март 2013
- Февраль 2013
- Январь 2013
- Декабрь 2012
- Ноябрь 2012
- Октябрь 2012
- Сентябрь 2012
- Август 2012
- Июль 2012
- Июнь 2012
- Май 2012
- Апрель 2012
- Март 2012
- Февраль 2012
- Январь 2012
- Декабрь 2011
- Ноябрь 2011
- Октябрь 2011
- Сентябрь 2011
- Август 2011
- Июль 2011
- Июнь 2011
- Май 2011
- Апрель 2011
- Март 2011
- Февраль 2011
- Январь 2011
- Декабрь 2010