Новости партнеров

Особенности работы поисковых систем

Особенности работы поисковых системДля понимания принципов продвижения сайтов в интернете, необходимо для начала понимать как работают поисковики. Поисковые машины состоят из ряда разных компонентов:

1. Паук (spider) – специальный робот, который скачивает содержимое веб-страницы.

2. Путешествующий паук (crawler) – робот планирующий путь обычного паука. Его роль переходить по всем ссылкам на ресурсе.

3. Индексатор (indexer) – программа, предназначенная для анализа информации которую скачивают пауки.

4. База данных (the database) – место хранения данных в сети.

5. Система результатов выдачи (search engine results engine) – предназначена для извлечения и показа результатов поиска из баз данных. К примеру, зависимость выдачи Яндекса от ссылок на сегодняшний день довольно велика.

Особенности работы поисковых систем

Теперь чуть подробнее расскажем о каждой программе отвечающей за работу поисковой системы:

Паук – представляет собой по структуре браузероподобную программу для скачивания информации со страниц интернет ресурса. Spider не имеет никаких визуальных проявлений и компонентов. Его работа идентична со стандартным скачиванием HTML-документа.

Путешествующий паук, как и паук обыкновенный также может скачивать информацию со страниц ресурса, но его целью является не страница в целом, а находящиеся на ней ссылки. Данный робот прочесывает сеть в поисках различных ссылок на другие ресурсы для осуществление «командой» поисковой системы дальнейшей индексации веб-ресурсы. Найдя и скачав все ссылки с ресурса, путешествующий паук проходит по ним продолжая свою работу.

Индексатор осуществляет разбивку интернет страницы на множество частей для последующей индексации. Текст, мета-теги, заголовки, стили, используемые на странице структурные элементы, ссылки, элементы ITALIC и BOLD вычленяются из общего массива и анализируются этим роботом.

Базы данных это крупные хранилища всех скаченных поисковыми роботами документов. По сути все что знает и выдает поисковая система хранится в её database. Хранить такие огромные массивы данных довольно затратно, поэтому содержать хотя бы одну базу данный может позволить себе только обеспеченная интернет организация.

Система результатов выдачи это именно та часть системы с которой непосредственно контактирует пользователь вводя поисковый запрос. Именно эта часть поисковой системы отвечает за демонстрацию пользователю страниц и ресурсов, удовлетворяющих запросу пользователя.

Автор: Олег Писарев
7.12.2013 (20:47)
Зеленые технологии

Лента новостей

Все права защищены © 2005-2018

"Supreme2.Ru" - новости для гиков

Контакты  | Policy  | Map Index

Использование любых материалов, размещенных на сайте, разрешается при условии ссылки на Supreme2.Ru. Для интернет-изданий - обязательна прямая открытая для поисковых систем гиперссылка. Ссылка должна быть размещена в независимости от полного либо частичного использования материалов. Материалы в рубрике "Новости партнеров" публикуются на правах рекламы.