Поисковый бот (робот)
Каждая поисковая система имеет свой набор ботов, каждый из которых отличается друг от друга по своему функциональному назначению. У каждой системы есть бот для текстов. Кроме того в некоторых поисковых системах имеется определенный набор роботов для изображений, видео, а также мобильного, новостного и блогового контента.
Роботы поисковой системы Google
Все боты в поисковой системе Google имеют общее название Googlebot. В зависимости от вида контента Googlebot бывают следующих видов:
1. Googlebot News — робот для быстрой индексации новостных порталов;
2. Googlebot Images — робот для быстрой индексации изображений;
3. Googlebot Video — бот для быстрой индексации изображений;
4. Google Mobile — робот для индексации мобильного контента;
5. Google Mobile AdSense и Google AdSense — роботы для быстрой индексации рекламных блоков;
6. Google AdsBot — робот для проверки качества целевой страницы сайта.
Роботы поисковой системы Яндекс
Yandex bot - это робот, которвый занимается индексацией веб-страниц сайта и их сохранением в поисковой базе Яндекса. После индексации каждой веб-странице сайта присваивается ТИЦ(тематический индекс цитирования).
Поисковая система Яндекс содержит самое большое количество ботов, среди которых можно выделить:
1. Mozilla/5.0 (compatible; YandexBot/3.0; +
2. Mozilla/5.0 (compatible; YandexImages/3.0; +
3. Mozilla/5.0 (compatible; YandexVideo/3.0; +
4. Mozilla/5.0 (compatible; YandexMedia/3.0; +
5. Mozilla/5.0 (compatible; YandexBlogs/0.99; robot; +
6. Mozilla/5.0 (compatible; YandexFavicons/1.0; +
7. Mozilla/5.0 (compatible; YandexWebmaster/2.0; +
8. Mozilla/5.0 (compatible; YandexImageResizer/2.0; +
9. Mozilla/5.0 (compatible; YandexAdNet/1.0; +http://yandex.com/bots) — робот для индексации рекламы в поисковой системе Яндекс;
10. Mozilla/5.0 (compatible; YandexMetrika/2.0; +
11. Mozilla/5.0 (compatible; YandexNews/3.0; +
Робот Рамблера
Поисковый робот Рамблера называется StackRambler/2.0 (MSIE incompatible). Данный бот не указывает список медиатипов, не содержит поля Accept-Language и If-Modified-since.
Роботы Yahoo!
Поисковая система Yahoo! имеет следующие роботы:
1. Mozilla/5.0 (compatible; Yahoo! Slurp;
2. Yahoo-MMCrawler/3.x (mms dash mmcrawler dash support at yahoo dash inc dot com) — робот для индексации изображений;
3. Yahoo-Blogs/v3.9 (compatible; Mozilla 4.0; MSIE 5.5;
Роботы MSN
Поисковая система MSN содержит набор следующих роботов:
1. msnbot/1.1 (+
2. msnbot-media/1.1 (+
3. msnbot-news (+
4. msnbot-NewsBlogs/1.0 (+
5. msnbot-Products/1.0 (+
- Что такое XML? — формат данных, используется для их передачи.
- Что такое SEO? — методы совершенствования сайта, позволяющие занять выгодную позицию в пользовательской системе поиска.
- Индексация сайта — внесение сайта в базу поисковой системы. После этого действия поисковик «узнает» ваш сайт.
- Индекс поисковой системы — это база данных, из которой берутся ответы на все пользовательские запросы.