Март
8

Невидимый интернет – 2011. Часть первая.

Ровно десять лет назад вышла знаменитая книга «Невидимый интернет» К.Шермана и Г.Прайса. До сих пор, когда речь идет о «невидимом интернете»,  часто ссылаются именно на нее. Как это ни странно, за десять лет практически не вышло на английском языке сколько-нибудь обобщающей монографии на эту тему. Последняя работа «Going Beyond Google: The Invisible Web in Learning and Teaching» в основном нацелена не на нужды бизнеса и конкурентной разведки, а ориентирована на преподавателей, студентов и учащихся колледжей.

Может быть, больше нет «Невидимого интернета», и актуальность вопроса отпала? Отнюдь. Уже не 90% информации, как в начале 2000-х, а много-много больше находится в так называемом «Глубоком вебе». Может быть, мало изменился мир или веб? Для того чтобы долго не рассуждать на эту тему, лучше посмотрим короткий ролик.

 

А еще просьба, прочтите на Книжной полке рецензию  Абэ Ледермана на книгу «The Invisible Web». Любому непредвзятому человеку понятно, что invisible, deep или hidden web, не только не сжался, но и более того, разросся до умопомрачительных размеров. Попробуем разобраться, каковы же источники этой тенденции, факторы, ее порождающие, и что можно сделать в сложившейся ситуации тем, кому нужно найти не то, что иголку в стоге сена, а атом во вселенной.

Начнем с вопроса: почему видимый веб становится все более невидимым.

Первая причина состоит в коммерциализации Веба. В первое его активное десятилетие, т.е. до момента выхода книги Шермана и Прайса, он только заселялся, осваивался и обустраивался. Лучшими метафорами интернета той поры были Сибирь эпохи Ермака или дальний Запад американских первопоселенцев. Это был постоянно расширяющийся франтир.

В нынешнем веке корпорации, дождавшись, когда в интернет пришли сначала десятки миллионов, а потом сотни и миллиарды пользователей и он стал доступен для любого контента, они взялись осваивать эту территорию, столбить ее за собой и усиленно коммерциализировать.  С 1990 по 2000 г. население веба выросло практически с нуля до 36 млн. человек. А сейчас, по данным ведущей консалтинговой компании Nielsen Onlane в вебе уже более 2 млрд. человек.  Интернет эпохи информации стал все более превращаться в Веб монетизации и власти. Информация из предмета поиска и познания стала на глазах превращаться в товар. Соответственно, если на первом этапе поисковые машины были нацелены на поиск информации, то сегодня они являются в гораздо большей степени своеобразным транспортом по доставке потребителей к местам покупки. В этом нет никаких оценочных характеристик. Это не хорошо не плохо. Такая ситуация – это просто свершившийся факт. Заодно, коммерциализация веба и использование поисковых машин в качестве транспорта до торговых центров породило своеобразный язык интернета, который уже не является вполне английским, русским, китайским и т.п. Речь идет о seo оптимизации. В итоге информационные тексты превращаются в специально обработанные сообщения, где рвутся контекстные и смысловые связи, а главной целью становится максимальная индексация сообщения поисковой машиной Это очень хорошо видно на эволюции и англоязычных и русскоязычных форумах, посвященных поисковым машинам. Если еще пять – семь лет назад там обсуждали алгоритмы и обеспечение все более релевантной выдачи, а также новые подходы к поиску информации, то сегодня едва ли не единственными темами стали способы продвижения сайтов в поисковых системах и, соответственно, обсуждение алгоритмов с этой точки зрения.

Вторая причина  – это информационная избыточность. В ролике, который мы посмотрели, приведен поразительный факт, что за прошедший год создано столько же информации, сколько за всю предыдущую историю человечества. Но, очевидно, что это полная ерунда. Происходит подмена понятий сигналов, данных и знаний. Вот сигналов, передается за год через телекоммуникационные сети,  действительно больше, чем за всю историю человечества. Сигнал, грубо говоря, это сообщение, рассчитанное на потребителя. Данные – это принятый сигнал как-то осмысленный тем, кто его принимает. А знания – это те данные, на основании которых мы действуем или собираемся действовать. Зачастую под информацией понимают и то, и другое, и третье.

Количество сигналов в сети растет по гиперболе. Еще старый, но бесконечно мудрый Станислав Лем в 50-е годы предвидел будущее, когда подавляющая часть информации будет оставаться сигналами, так и не найдя своего адресата. Сеть стала в значительной мере невидимой из-за того, что количество отправленных сообщений текстового, аудио и видео формата просто не находит своих адресатов и тонет в общем информационном шуме. По данным уже упоминавшейся Nielsen Onlane и Technorati в настоящее время в мире существу4ет примерно более 200 млн.сайтов и 150 млн. блогов. Согласно статистике Рунета, для России этот показатель суммарно составляет где-то порядка 4 млн. Но что интересно. Если десять лет назад 50% сайтов были активными (Nielsen Onlane по активным сайтом понимает сайт или блог, имеющий более 1 посетителя в день), четыре года назад таковых было чуть больше 30%, то сейчас 12%. Если же говорить о сайтах, привлекающий в день более 20 человек, то таковых во всемирной паутине лишь около 1%. При этом, самым поразительным является то, что согласно проведенным в разных странах различными компаниями исследованиям, ценность и оригинальность контента оказалась практически никак не связанной с числом посетителей. Более того, многие наиболее посещаемые сайты с точки зрения ценности информации, а не ее коммерческого интереса, заметно уступают низко, а иногда и вообще не посещаемым сайтам.

Сегодня сеть в известном смысле  представляет из себя информационный шум, в котором люди пытаются сорганизоваться, чтобы получать осмысленные сообщения, т.е. превращать сигналы сначала в данные, а потом в знания. По моему мнению, именно с этим, собственно и связан феномен бурного развития социальных сетей, особенно в том виде, который они приобретают на наших глазах. На социальные сети, как средство получения более качественной информации буквально на днях на Facebook написал Евгений Ющук.

Когда  еще начинала осваивать азы интернет-поиска, мне запомнилось высказывание Андрея Масаловича, что интернет для него это не необозримая паутина, а «маленькие нужные островки информации на огромной всемирной свалке».

Третья причина видимого-невидимого интернета является, возможно, наиболее спорной. Но, тем не менее, все возрастающее число научных исследований, проводимых в Америке, Европе и России указываются именно на нее. Речь идет об изменениях в психике людей под влиянием Интернета.  Как показали многочисленные исследования ведущих научных центров, занимающихся когнитивными науками, например, работы одного  из основоположников нейрофизиологии Майкла  Мерженича,  человеческая психика, сознание и даже сама психофизиология мозга оказались гораздо более пластичными, чем предполагалось ранее. В будущем, наверняка, за это буду присуждены Нобелевские премии, но уже сегодня накопилась масса экспериментальных доказательств, что интернет изменил психику человека.

Я остановлюсь лишь на нескольких аспектах, имеющих отношение к нашей теме. Прежде всего, речь идет о таком явлении, как Серфинг и порожденном им рассеянном внимании (не имеющим ничего общего с методом деконцентрации, открытым Олегом Бахтияровым). Серфинг проявляется в том, что постоянно  сокращается время, которое человек затрачивает на просмотр сайта или блога. Так с 2006 по 2010 г. оно снизилось, например, в Америке с 76 до 43 секунд.  Скажите, какую информацию может воспринять человек за это время? Фактически он видит интернет-страницу как картинку, не то что, не вдумываясь а, даже не воспринимая сколько-нибудь глубоко ее содержание. Такой способ существования в интернете приводит к феномену рассеянного внимания, когда человек во все меньшей степени может сосредоточиться на конкретном, иногда  даже важном для него сообщении. Более того, чем сообщение длиннее и содержит в себе более богатый контент, а соответственно и скрытую информацию, тем сложнее ему оказывается воспринять это сообщение и извлечь из него знание. Иными словами, третья причина видимого-невидимого интернета состоит в произошедших в последние десятилетия, а то и годы, изменениях в психологии восприятия и мышления человека

Четвертая причина – это сам по себе Веб 2. В поистине необозримой теме выделим лишь два аспекта. В Сети стремительно падает доля текстового и, соответственно, нарастает доля видео и аудио контента, который индексируется поисковиками в основном только по  его, что называется, обертке, т.е. – наименованию. Пожалуй, единственным отличием является пока фото контент. Конечно, существуют специальные поисковики, типа YouTubе, MP3, но в целом расслоившийся Веб оказывается без действенных инструментов проведения единого глубокого поиска в интегрированной информационной среде, охватывающей тексты, аудио и видео файлы. Хотя в дальнейшем мы еще поговорим о первых попытках продвижения в этом направлении.

Второй аспект связан  с одной стороны, с природой социальных сетей, предполагающей некую приватность, а с другой стороны, с коммерческими противоречиями гигантов Сети. В 2010 г. В Америке впервые трафик пользователей в Facebook превысил  трафик Google.

Следствием этой войны стало то, что, например, контент, содержащийся в Facebook, не индексируется Google. Т.е. для крупнейшей поисковой машины значительная часть Сети оказывается непроницаемой. Правда, Facebook достиг соглашения с Bing и теперь он будет учитывать в поисковой выдаче «лайки», полученные тем или иным сайтом. В общем за исключением LiveJournal и в России «Одноклассники»,  остальные социальные сети по сути остаются непроницаемыми для поисковых машин. И это является пятым, все более возрастающим по своему значению фактором существования «Невидимого интернета».

    Category БЛОГ     Tags

Прокомментировать

ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы