Алекcандр Иванович Доронин

В данном контексте термин «процессор» не имеет ничего общего с микропроцессором, это часть программы, которая определяет, каким образом сама программа управляет и манипулирует данными. Процессор сбора данных использует программное обеспечение, получившее название «робот»: «робот» извлекает нужную информацию, используя целый арсенал средств лингвистического, семантического и статистического анализа. Действуя автономно, процессоры сбора данных перехватывают любую запрашиваемую информацию, как только она появится в Интернете.
Самым первым был рассекречен французский процессор «Taiga» (Traite-ment automatique d'information geopolitique d'actualite — «автоматическая обработка актуальной геополитической информации»). Этот программный комплекс первоначально разрабатывался для нужд французской разведки, где он потом ударно трудился в течение 11 лет, после чего был передан для коммерческого использования. Задачи, которые перед ним ставят теперь уже гражданские специалисты, остались теми же: «шарить» по Интернету для извлечения ценной информации из баз данных о патентах, сообщений информационных агентств и публикаций о научных конференциях.
Методика ведения аналитической разведки с помощью данного программного обеспечения следующая: обрабатывая материалы открытого доступа, имеющиеся в Интернет-пространстве, программа статистического анализа составляет так называемые карты работы в различных отраслях науки. В свою очередь, это позволяет аналитикам устанавливать наиболее перспективные научные разработки в областях, где конкуренция пока что сравнительно невелика. Результаты количественного и качественного анализа результатов работы научных лабораторий позволяют оценить степень творческой атмосферы исследовательских коллективов. Это также может быть весьма полезным при выявлении «перспективных летунов», т.е. исследователей, которые за сравнительно короткий срок успевают поменять ряд представляющих интерес научных центров, а тем самым знакомы со многими результатами их работы.
Стоит упомянуть еще одну французскую разработку. Для проведения семантического анализа крупных информационных массивов компания «Acetic» совместно с учеными Парижского университета разработала пакет прикладных программ «Tropes». Отбор требуемой информации происходит в соответствии с ключевыми словами и понятиями, связанными по смыслу. Так, например, название типа самолета «Мираж» соотносится со словами «самолет», «истребитель», а сочетание слов «госсекретарь США» автоматически ассоциируется со словами «министр», «политик». Данное программное обеспечение позволяет одновременно анализировать два текстовых информационных фрагмента объемом в несколько десятков книжных томов. Помимо этого «Tropes» предоставляет возможность создавать необходимые для работы информационные «сценарии», на основе которых автоматически осуществляется не только поиск, но и целевое группирование требуемых данных.
Технический прогресс не стоит на месте, и весьма очевидно, что если государственные спецслужбы отдают для коммерческого использования подобные разработки, то это может означать только одно — они получили в свое распоряжение что-то гораздо более мощное.
«Noemic», сменивший «Taiga» на боевом посту, не только сканирует, но и автоматически осуществляет «объединение источников», обрабатывая полученную информацию со скоростью 1 млрд. знаков в секунду независимо от того, существуют ли она в виде готовой базы данных или, например, передается электронным агентством новостей на любом языке в виде целостного текста. Этот семантический процессор сбора данных способен также подвергать обработке заслуживающие его внимания концепции, метафоры и совокупности идей. Если перед ним поставить задачу выявить, например, все случаи установления связей между гонконгскими и американскими фирмами, действующими в области микроэлектроники, за последние пять лет, то для ее выполнения ему хватит всего нескольких часов.
Американский аналог этих программных комплексов, который называется «Topic», также первоначально разрабатывался для нужд разведки. Данная система появилась на свет в результате длительных исследовательских работ, осуществлявшихся под контролем ЦРУ. Сегодня он также передан в коммерческое использование, и все права на него принадлежат калифорнийской фирме «Verity», мировому лидеру по сбору документальных данных.
Не отстают от «Verity» и ее конкуренты. Так, например, американская фирма «Intelligent Search Solutions» выпустила на рынок пакет программного обеспечения «InfoTracer», предназначенный для сбора разведывательной информации экономического характера в сети Интернет. Для «фильтрования» информации указанное программное обеспечение использует ключевые слова и фразы, после чего автоматически составляются сообщения необходимого пользователям содержания. В них могут быть, например, данные о деловых операциях конкретной компании и ее партнерах, используемых ими технологиях и выпускаемой продукции, а также фамилии руководящего персонала.
В данной связи хотелось бы отметить, что появление новых сетевых информационных технологий практически уравняло возможности конкурентов в получении необходимой исходной информации. Теперь основное значение имеют быстрота поиска и правильный анализ. В этом как раз и могут помочь процессоры сбора данных, позволяющие «извлекать» и анализировать необходимую информацию из крупных информационных массивов. Профессионалы прекрасно понимают, что экономическую разведку можно вести без компьютерных взломов, просто обрабатывая по специальному алгоритму огромные массивы информации, доступные каждому пользователю Интернета.
По оценкам специалистов, в настоящее время только в США насчитывается около 150 фирм, которые специализируются на анализе данных, полученных из Интернета. Причем новые фирмы растут как грибы после дождя.
Но следует отметить, что аналитическая разведка средствами Интернета — это палка о двух концах. Дело в том, что если отследить и проанализировать тематику интересующих конкретный хозяйствующий субъект данных, имеющихся в Интернете, то достаточно просто можно построить причинно-следственную цепочку и выявить перспективные намерения предприятия, уровень его притязаний, по которым, в свою очередь, можно будет оценить его уровень развития. Для этого разработаны специальные «роботы роботов», которые позволяют перехватывать данные о работе системы, занимающейся целенаправленным сбором информации.
Наиболее продвинутые корпорации с целью введения в заблуждение о своих деловых контактах, разработках, финансовых и маркетинговых планах активно используют дезинформационные технологии (более детально они будут рассмотрены в главах «Активные мероприятия»: информационно-психологическое воздействие» и «Информационно-аналитическая работа: дезинформация»). При участии экспертов-отраслевиков и при помощи специальных программных комплексов, также функционирующих на принципах лингвистического и статистического анализа, из кусочков уже опубликованных текстов и отдельных заумных терминов создаются и публикуются в Интернете различные материалы, мягко говоря, не соответствующие истинному положению дел: информационные сообщения, отраслевые обзоры, «научные» статьи, а иногда целые базы и банки данных.
Эффективность проведения дезинформационных мероприятий оценивается путем заказа через подставные компании у провайдеров «сетевой разведки» аналитических отчетов на самих себя. В дальнейшем контролируемая утечка этих отчетов в прессу выполняет роль «кругов на воде» и является материалом «вторичного закрепления» требуемых стереотипов у объектов дезинформационной атаки.
А теперь давайте вернемся в российскую действительность и попытаемся рассмотреть национальные особенности ведения аналитической разведки, причем остановимся на тех, что не требуют значительных финансовых вложений. Я думаю, что предыдущий материал смог убедить большинство читателей в том, что использование методик аналитической разведки открывает огромные возможности по оперативному получению необходимых данных как из профессиональных баз и банков данных, так и из неструктурированной информации, имеющейся в Интернете.
Эти обстоятельства естественным образом выделяют аналитическую разведку в самостоятельное направление деятельности подразделений безопасности хозяйствующих субъектов, а в сочетании с другими технологиями аналитической обработки информации, которые будут описаны далее, позволяют говорить о целом комплексе разведывательных мероприятий, основанных на современных информационных технологиях.
В данной главе мы основное внимание уделим информационно-поисковой составляющей аналитической разведки, так как в рассматриваемой нами методике поиск в Интернете — это в основном только предварительный подбор информации.
Большая часть информации, полученной в результате, носит неявный характер и нуждается в аналитической обработке. Мой собственный опыт и практика работы моих коллег позволяют утверждать, что только порядка 10-15% нужной информации имеется в Интернете уже в готовом виде (необходима только верификация), а остальные 85-90% получаются в результате сравнения, анализа и синтеза разрозненных и разбросанных по разным источникам фактов, по которым вполне можно составить хотя бы фрагментарную картину настоящего. Естественно, что информация, полученная таким образом, нуждается в уточнениях и верификации (проверке).
Но, во-первых, опять же из личного опыта могу отметить, что оперативность предоставления информации в определенной мере компенсирует ее неполноту.
Во-вторых, как правило, на первоначальном этапе знакомства и этот объем удовлетворяет заказчика.
И, наконец, в-третьих, при наличии дальнейшего интереса к исследуемому хозяйствующему субъекту эта предварительная информация поможет заказчику расставить акценты и задать ориентиры в дальнейшей работе.
Детально с методикой аналитических исследований вы познакомитесь в главе «Информационно-аналитическая работа: обработка материалов средств массовой информации».
Кстати, слегка переиначив вождя мирового пролетариата, стоит заметить, что вышеописанные методики «не догма, а руководство к действию». В данной главе автор не претендует на всепригодный и всеобъемлющий алгоритм аналитической разведки, ибо, как говаривал незабвенный Козьма Прутков: «Невозможно объять необъятное». Наша с вами цель значительно проще и прозаичнее — попытаться предельно минимизировать свои трудовые затраты, как моральные, так и финансовые.
Итак, приступим к делу.

3. Каталоги
Каталоги представляют собой еще один удобный вид доступа к данным. Каталоги — это рубрикаторы или классификаторы, организующие множества документов в деревья или целые заросли рубрик.
Однако есть и весьма существенное НО: для эффективного использования каталога пользователю нужно правильно угадать принцип структуризации, который был применен при его создании и который зачастую существует только в головах авторов каталога. Поэтому для компенсации неудобств каталогов (если уж пользователь не знает, на какой ветке дерева «по логике» данного каталога лежит нужная ссылка, то не найдет ее никогда) они в последнее время стали включать и средства поиска. И наоборот — поисковые машины стали снабжаться каталогами; в частности обзавелся своим тематическим каталогом ресурсов ветеран русского Интернета «Рамблер».
В качестве примера для возможных изысканий можно привести следующие каталоги:
Yahoo (http://www.yahoo.com);
«Ay!» (http://www.au.ru);
«List.Ru» (http://www.list.ru);
«Рамблер» (http://www.rambler.ru);
«Лица российских сайтов» (http://www.sites.ru:8000);
«Улитка» (http://www.ulitka.ru);
«Золотое Кольцо Российского Интернета» (http://www.catalog.net).
При работе с классификаторами следует учитывать, что сайты классифицируются разными каталогами по-разному, это и понятно, так как Интернет-пространство в принципе не может быть упорядочено линейно, оно имеет более сложную геометрию.
Например, каталог «Omen.Ru» (http://www.omen.orc.ru) уже на первом уровне структуризации своей коллекции оперирует более чем с 200 рубриками. «Рамблер» в качестве стартовой процедуры поиска информации предлагает 50 рубрик, одна из которых — «Классификаторы» — объединяет более 200 каталогов.
Сайты, обнаруженные в каталогах, от базы данных Федеральной комиссии по ценным бумагам (http://www.fedcom.ru) до регистрационной базы данных по предприятиям Санкт-Петербурга (http:/ /www.infobroker.ru), как мы увидим далее, могут оказаться весьма полезными в дальнейшей работе.
Помимо хранилищ общего назначения существует множество специализированных каталогов, помогающих пользователям ориентироваться в достаточно узких предметных областях.
Ну а для тех, кто желает повысить свой профессиональный уровень, познакомиться со свежими новостями, а также пообщаться с коллегами на форуме, можно порекомендовать для ознакомления следующие специализированные сайты, посвященные вопросам безопасности: электронная версия журнала «БДИ» (http://www.bdi.spb.ru), Интернет-газета по безопасности (http://www.oxpaha.ru) сайт по безопасности (http://www.sec.ru) и сайт (http://www.agentura.ru). С более полной подборкой сайтов по вопросам безопасности можно ознакомиться в тематическом каталоге Рамблера «Безопасность».

4. Поисковые системы
Еще один простой и дешевый способ информационно-поисковой работы в Интернете — воспользоваться услугами бесплатных поисковых систем.
С помощью поисковых систем можно осуществлять различные манипуляции с информацией: индексирование текстов и поиск по одному (нескольким) ключевым словам (по индексу); морфологический поиск — разбор и отождествление различных грамматических форм слов; ранжирование по степени соответствия документа запросу.
На сегодняшний день самыми эффективными русскоязычными поисковыми системами являются Яндекс (www.yandex.ru), Апорт (www.aport.ru), Рамблер (www.rambler.ru). Из личного опыта могу посоветовать начинать именно с Яндекса, у него самая производительная поисковая машина, к тому же на его сайте имеются ссылки практически на все другие поисковики. Так, например, Яндекс дает ссылку на одну из лучших западных поисковых машин Google (www.google.com), которая при поиске информации просматривает свыше 1 600 млн. страниц.
Стоит отметить, что даже самые лучшие поисковые машины обрабатывают только вершину имеющегося в сети информационного айсберга. Поисковые роботы не могут просматривать закрытые для них коммерческие сайты, число которых в настоящее время приближается к миллиону. Эти сайты различны по содержанию (информация правительственная, законодательная, статистическая, научно-техническая, патентная, новостная и т. п.) и форме — например, сайты, содержащие видеоинформацию, музыкальные сайты.
Поиск нужной информации в данном случае осуществляется по следующему алгоритму: задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу в базе данных, автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.
Имеющимися техническими средствами полностью формализовать процедуру поиска информации пока не представляется возможным. Из-за того, что до настоящего времени не существует стандарта на размещение информации в Интернете, реализовать сложную стратегию поиска часто бывает весьма затруднительно. Поэтому при ведении аналитической разведки средствами Интернета приходится идти по пути информационной избыточности, что накладывает весомые ограничения на релевантность найденных документов. Из-за высокого процента информационного шума в общем объеме найденных документов значительно увеличивается время, необходимое для аналитической обработки полученных сведений.
Следует отметить, что результативность поиска в данном случае зависит от двух составляющих.
Во-первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т.е. релевантности информационного запроса.
Причем если по первому запросу поисковая система нашла слишком много документов, то по уже отобранному массиву можно провести второй поиск с заданием дополнительных условий и тем самым сузить круг выдаваемых документов. Эта функция очень проста в исполнении (нужно только запомнить предыдущую выборку) и реализована в большинстве популярных машин, включая российские «Яндекс» и «Рамблер».
Помимо этого в современных поисковых машинах — западные AltaVista и HotBot, российские «Яндекс» и «Рамблер» — существует (по крайней мере декларируется) функция интерактивного поиска («найти похожие»). Она также позволяет постепенно уточнить запрос: указать на один или несколько найденных документов и попросить найти документы, повествующие «о том же».
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57

А-П

П-Я

Бизнес-разведка