Категории
Самые читаемые
RUSBOOK.SU » Компьютеры и Интернет » Интернет » Интернет-разведка. Руководство к действию - Евгений Ющук

Интернет-разведка. Руководство к действию - Евгений Ющук

Читать онлайн Интернет-разведка. Руководство к действию - Евгений Ющук

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 4 5 6 7 8 9 10 11 12 ... 59
Перейти на страницу:

Записывается оператор следующим образом:

link=www.url.ru/cat/*

Как и в предыдущем случае, мы рекомендуем убирать последнюю косую черту, после которой следует символ «звездочка». Если надо найти ключевое слово в ссылающихся на сайт страницах, то оператор link сочетается с обычными ключевыми словами, отделяясь от них двойным амперсандом. Например, зададим поиск понятия «креатив» в сайтах, ссылающихся на адрес издательства «Вершина»: www.vershinabooks.ru.

Запрос: [креатив && link=www.vershinabooks.ru*]

Результат поиска: страниц – 238, сайтов – не менее 26

В выдаче:

Консалтинг и тренинги Москвы | Новости | Вышла книга Блестящие ответы на трудные…

ТРИЗ и технологии креатива

http://www.vershinabooks.ru

msk.treko.ru/show_news_476 (23 КБ) 02.03.2006

При этом можно еще раз проиллюстрировать влияние знака «плюс» на результат выдачи в Яндексе. При запросе:

[+креатив && link=www.vershinabooks.ru*]

Результат поиска: страниц – 10.

Остальные страницы, показанные в предыдущем запросе, ссылались на сайт издательства «Вершина», но слова «креатив» не содержали.

13. Оператор поиска в заголовке страницы.

Для тех, кто не занимается сайтами профессионально, напомним, что заголовок страницы – это то, что написано на синем (для Windows XP) поле в самом верху экрана, как бы уже за пределами страницы, на ее рамке. А с точки зрения разметки HTML, эта часть сайта заключена внутри тега <TITLE>.

Яндекс справедливо считает, что если ключевое слово содержится в самом заголовке страницы, значит, она однозначно имеет непосредственное отношение к запросу.

Синтаксис оператора выглядит таким образом (на примере поиска слова «разведка» на страницах, содержащих в заголовке словосочетание «ИПК УГТУ»):

Запрос: [+разведка && $title (ИПК УГТУ)]

Результат поиска: страниц – 1

В выдаче:

Институт переподготовки кадров УГТУ (ИПК УГТУ) – Екатеринбург, Свердловская…

… проф. бухгалтеров, семинары и тренинги по управлению недвижимостью, изменениями, бизнес-разведке, технологиям продаж, тренинги личностного роста. www.uralfirm.ru/catalog/card/66.19517 (13 КБ) 18.06.2005

Остальные операторы языка запросов Яндекса представляют меньший практический интерес, хотя и значительно расширяют возможности поиска. Ознакомиться с ними можно на странице помощи в Яндексе,[4] пройдя по ссылкам Помощь > Синтаксис запросов.

Поиск в Гугле (Google)

Гугл (google.ru) становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по информации из интервью инженера по программному обеспечению Google Мэта Катса, уже в 2002 г. «каждые 28 дней Google индексировал 3 млрд веб-документов, в том числе более трех млн новых страниц каждый день».

Этот поисковик в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку Для удобства читателя при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение с аналогичными операторами Яндекса.

1. Основы поиска.

Чтобы ввести запрос, напечатайте ключевые слова и нажмите ENTER либо щелкните кнопку «Поиск в Google».

Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого система анализирует не только саму страницу, которая соответствует запросу, но и те, которые на нее ссылаются, чтобы определить ценность этой страницы для целей вашего поиска. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.

2. Показ ключевых слов в результатах.

Каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в нем ключевые слова. Тем самым облегчается их обнаружение по всему тексту.

Второй способ увидеть ключевые слова – загрузить страницу по ссылке «Сохранено в кэше». Недостаток данного способа (хотя конкурентной разведкой это нередко рассматривается как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а т у, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором она расположена, недоступен.

Третий способ – традиционный для просмотра текста в браузере – заключается в использовании сочетания клавиш CTRL+F. В результате должно появиться окно «найти», в которое необходимо ввести искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.

3. Логическое «И».

В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к рассмотренному ранее поисковому механизму «&&» в сочетании с оператором «плюс», поставленным перед каждым словом запроса.

Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.

Запрос: [литейщик провизор стоматолог маркшейдер]

Результаты 1 – 10 из примерно 18 для литейщик провизор стоматолог маркшейдер

В выдаче:

Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…

Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв. постановлением Госстандарта

РФ от 30 декабря 1993 г. N 298) Russian Classification of Occupations…

Работа для вас в Самаре. Поиск работы, подбор персонала, вакансии…

Медсестра (стоматологический кабинет, ЕТС). Тел. 39-52-53, Адрес: ул… провизор (аптека, в/о,

наличие сертификата, опыт работы в производственной аптеке,…

Интересно, что Гугл может показать и те источники, кoтopые ключевых слов не содержат, однако они присутствуют в ссылках на показанную страницу. В таком случае при просмотре информации с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу».

Описанный механизм работы Гугла хорошо виден, если посмотреть ключевые слова на странице сайта о работе в Самаре, сохраненной в кэше.

Эти слова выделены:

литейщик провизор маркшейдер

А это слова присутствеют только в ссылках на страницу:

стоматолог

4. Логическое «ИЛИ».

Оно пишется с помощью оператора OR. Обратите внимание: оператор этот должен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.

Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.

Запрос: [литейщик OR провизор OR стоматолог OR маркшейдер]

Результаты 1 – 10 из примерно 2 030 000 для литейщик OR провизор OR стоматолог OR маркшейдер

5. Заглавные буквы или строчные?

В отличие от Яндекса Гугл не различает регистр букв. Все буквы воспринимаются как строчные, вне зависимости от того, как их вводили в поисковую строку. Запросы:

[Эйфелева Башня], [Эйфелева башня] и [эйфелева башня]

дадут одинаковые результаты.

Результат поиска на момент написания книги:

Результаты 1 – 10 из примерно 543 000 для Эйфелева Башня.

Результаты 1 – 10 из примерно 543 000 для эйфелева башня.

6. Стоп-слова.

Во вспомогательных инструкциях (хэлпах) написано, что Гугл, подобно большинству поисковых систем, игнорирует стоп-слова. Кроме того, хэлпы утверждают, будто, как и многие другие поисковики, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К таким элементам относится большинство артиклей английского языка, союзов и предлогов русского языка.

В реальности ситуация, похоже, складывается иначе.

Тест: вводим по-русски букву [в]

Результат:

Результаты 1 – 10 из примерно 48 600 000 для в.

Вводим по-английски артикль [the]

Результат:

Результаты 1 – 10 из примерно 8 670 000 000 для the.

7. Оператор «Плюс» (+).

Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву «I» («ай»). Если сделать запрос просто как:

[Star Wars Episode I], —

то результат будет следующий:

Результаты 1 – 10 из примерно 13 200 000 для Star Wars Episode I.

В том числе в выдаче появятся слова

«Episode II», «Episode IV» и т. п.

Если сделать запрос:

[Star Wars Episode +I], —

то результат будет такой:

Результаты 1 – 10 из примерно 9 290 000 для Star Wars Episode +I.

И в него войдут только тексты, содержащие слово «Episode I».

8. Морфология слов.

Гугл не поддерживает морфологию слов. Их изначально следует вводить в нужных формах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы проверить утверждение об отсутствии поддержки морфологии, возьмем такое языковое сочетание, по которому можно увидеть все без исключения результаты. А сочетание следующее: «Глоклая куздра».

1 ... 4 5 6 7 8 9 10 11 12 ... 59
Перейти на страницу:
На этой странице вы можете бесплатно скачать Интернет-разведка. Руководство к действию - Евгений Ющук торрент бесплатно.
Комментарии
Открыть боковую панель
Комментарии
Сергій
Сергій 25.01.2024 - 17:17
"Убийство миссис Спэнлоу" от Агаты Кристи – это великолепный детектив, который завораживает с первой страницы и держит в напряжении до последнего момента. Кристи, как всегда, мастерски строит