Вот не поверите, Интернет – это живой организм. Он может запросто раскрыть все свои  потаённые уголки, а может, несмотря на все усилия, выдавать то, что вам и даром не сдалось. Его можно любить и ненавидеть, и только в отношении Интернета первое не противоречит второму. В нём отдыхают, общаются, учатся. Но есть ещё одна черта всемирной сети – он даёт возможность заработать.

Дневник фрилансера: шаг за шагом

С самого момента подключения интернета к моему компьютеру я ежемесячно делал записи о своих успехах, ошибках и неудачах. И честно говоря, от последних меня могло уберечь прочтение дневника, такого как этот. Тем, кто только делает первые шаги во фрилансе посвящается…

Месяц первый

Месяц второй

Месяц третий

Месяц четвёртый

Месяц пятый

Месяц шестой

Месяц седьмой

Месяц восьмой

Месяц девятый

Месяц десятый

Месяц одиннадцатый

Год

ОБЩИЙ разбор полётов

Комментарии гостей

Действующие лица сказки

Сказка для маленьких СЕО-оптимизаторов


Паучок Спайдер   

Spider (паук) - браузероподобная программа, которая скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визуальных компонент и работает напрямую с html-текстом страницы (вы можете сделать «просмотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст).
   

Путешественник Краулер

Crawler (краулер, «путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
  

Мудрый Индексер 

Indexer (индексатор) - программа, которая анализирует и разбирает на составные части веб-страницы, скаченные пауками. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.
  

Примечание: детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.   

 

Старый Хранитель Датабас

Database (база данных) – хранилище скачанных и обработанных страниц, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.
 

Справедливый Серч  

Search Engine Results Engine (система выдачи результатов) – извлекает результаты поиска из базы данных, занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной для нас – именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы подробно рассмотрим все факторы, влияющие на ранжирование результатов.
   

Мистер Веб

Web server (веб-сервер) – веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. Как правило, на сервере присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Веб-сервер также отвечает за выдачу результатов пользователю в виде html-страницы.

Комментариев нет:

Отправить комментарий