Интернет-разведка. Руководство к действию - Евгений Ющук
Шрифт:
Интервал:
Закладка:
Внимание: пробела между оператором related: и последующим словом быть не должно.
14.10. Оператор define:
Этот оператор выполняет роль, своего рода, толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.
Например:
[define: разведка].
Результат:
Определения разведка в интернете:
совокупность мер для сбора данных о действительном или возможном противнике.
www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html
Интересная особенность оператора define: состоит в его способности искать толкования конкретных выражений. В качестве фразы он понимает все слова, написанные после оператора, в том числе и без кавычек, просто через пробел. Например:
[define: большой взрыв].
Результат:
Определения большой взрыв в интернете:
Большой Взрыв – взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности.
ru.wikipedia.org/wiki/Большой_Взрыв.
Правда, иногда этот оператор может и повеселить, представив материал, в котором мало кто разберется. Например, по запросу
[define: ложка] —
результат будет следующим:
Определения ложка в интернете:
*блесна, основанная на подражании раненой рыбке.
fisherman.com.ua/files/fishsay.php.
А по запросу:
[define: осел] —
результат такой:
Похожие фразы: буриданов осел
Определения осел в интернете:
*строгий, собранный в кучу, материал
astro.rin.ru/htmls/nostradamus/astro1826-5.html.
ВНИМАНИЕ: наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.
14.11. Поиск синонимов
В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».
Нам не удалось найти подтверждения этому заявлению.
Так, мы сравнили два запроса и не нашли разницы:
[~опережающий ~разведка]
Результаты 1 – 10 из примерно 33 100 для ~опережающий ~разведка.
[опережающий разведка]
Результаты 1 – 10 из примерно 33 100 для опережающий разведка.
14.12. Поиск числовых значений
Для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того чтобы найти все страницы, содержащие числа в неком диапазоне «от – до», надо между этими крайними значениями поставить две точки.
Например, по запросу
[численность населения 1913..1917]
будут выданы страницы:
Народная энциклопедия городов и регионов России. Города. Санкт… Подчиненные поселки городского типа, численность населения на 1.01.2000… Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г… rfdata.al.ru/auto/city/18/667.HTM —
с выделенным числом «1914», а также:
Известия Уральского государственного университета № 9(1998…
За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город… proceedings.usu.ru/…/0009(03_05-1998)&xsln=showArticle.xslt&id=a14&doc=../content.jsp
с выделенным числом «1915». Подобный пример приведен в хэлпе Гугла на примере цены DVD:
[DVD player $50..$100].
14.13. Кнопка «Мне повезет» (в английском варианте – «I'm Feeling Lucky»)
Кнопка «Мне повезет» расположена на главной странице Гугла. На наш взгляд, это замечательная идея. По этой кнопке система выдает наиболее релевантный, с ее точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого. Например, запрос по указанной кнопке:
[активные формы] —
открывает непосредственно сайт одноименной консалтинговой компании
http://www.acfor.ru/.
Поиск в Рамблере
Операторы Рамблера в данном разделе рассматриваются в сравнении с операторами Яндекса и Гугла. И, соответственно, те из них, которые имеют аналоги в двух других поисковых системах, здесь будут описаны не слишком подробно. Детальную характеристику мы сочли необходимым дать отличиям Рамблера от Яндекса и Гугла.
Рамблер, на наш взгляд, – третья по значимости поисковая машина для работы с русскоязычными текстами. Причем, это третье место находится на очень значительном расстоянии от первых двух. Мы нечасто обращаемся к Рамблеру, поскольку, в зависимости от задачи, обычно начинаем поиск с Яндекса, после чего переходим в Гугл, или наоборот – начинаем с Гугла, а затем уточняем результат в Яндексе. В большинстве случаев этого бывает достаточно при работе с каким-то фактическим материалом, главным критерием которой выступает не полнота ответа, а его правильность.
Вместе с тем, и специалисты конкурентной разведки, и представители других специальностей, которым часто приходится заниматься профессиональным поиском в Интернете, сходятся во мнении, что лишь использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос. Одна поисковая система не способна справиться с подобной задачей. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин – разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки.
Как следствие, нет и не может быть полного совпадения результатов поиска, особенно когда речь идет о редком запросе.
Например, поиск во всех трех системах точной фразы (фрагмента песни) «дым, дым в твоих глазах» дал на момент написания статьи такие результаты:
Запрос:
[ «дым, дым в твоих глазах»]
Результат:
Яндекс: Результат поиска: страниц – 0
Гугл: Не найдено ни одного документа, соответствующего запросу «дым, дым в твоих глазах».
Рамблер: Вы искали: «дым, дым в твоих глазах», найдено сайтов: 1, документов: 1
Результат этого поиска можно увидеть здесь:
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html
Это не значит, что Рамблер лучше всех. Знать заранее, в какой поисковой системе и что именно удастся найти, невозможно. В этом смысле показателен пример с поиском фразы – фрагмента редкой песни: «аэропорт аэропорт ночное зарево огней».
Запрос:
[ «аэропорт аэропорт ночное зарево огней»]
Результат:
Яндекс: Результат поиска: страниц – 133, сайтов – не менее 4.
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html Гугл: Результаты 1–6 из примерно 32 для «аэропорт аэропорт ночное зарево огней».
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html
Рамблер: Не найдено ни одного документа, полностью соответствующего запросу «„аэропорт аэропорт ночное зарево огней“». http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html
Итак, перейдем к рассмотрению работы с Рамблером. Основу этой работы составляет раздел «Помощь», расположенный по адресу: http://www.rambler. ru/doc/help.shtml – и форма расширенного поиска, находящаяся по адресу: http://www.rambler.ru/cgi-bin/advanced.cgi?set=www.
1. Какие ресурсы Рамблер индексирует.
По утверждению создателей системы, Рамблер индексирует сайты, размещенные в следующих доменах первого уровня:
Российская Федерация:.ru,su
Украина:.ua
Белоруссия:.by
Казахстан:.kz
Киргизия:.kg
Узбекистан:.uz
Грузия:.ge
Сайты, находящиеся в других доменах, поисковик игнорирует.
Для тех, кто хочет, чтобы их сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, эта поисковая машина оставляет небольшую надежду на успех.
Если Ваш сайт находится вне названных доменов (например, в зонах. com,org,net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения.
Кроме того, Рамблер утверждает, что «умеет извлекать гиперссылки из объектов Macromedia Flash», но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты поисковой системы советуют создавать HTML-копию.
2. Поддержка морфологии слов.
По умолчанию, Рамблер поддерживает морфологию слов. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки.
Наш эксперимент подтвердил, что система морфологию слов действительно поддерживает.
3. Скобки.
Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. В этом описываемая в данном разделе система ничем не отличается от Яндекса, поэтому подробнее применение скобок мы рассматривать не станем.