Правило работы с поисковыми системами

Содержание статьи:

Правило работы с поисковыми системами

Зачастую результат поиска содержит огромное количество найденных ссылок, перебрать которые все, конечно, можно, но достаточно сложно и долго (а учитывая тот факт, что результат не гарантируется — то, возможно, и бесполезно). В связи с этим бывает очень желательно провести следующий этап поиска, уже среди найденного на первом этапе.

Для этого вам нужно ввести в поле ввода новое слово (фразу), по которой будет проводиться второй, уточняющий этап поиска, а рядом с полем установить флажок В найденном или, если вы пользуетесь поисковой системой Google, — щелкнуть по ссылке «Инструменты поиска» и выберите пункт выпадающего меню «Точное соответствие».

Исправление ошибок в поиске

Многие поисковые системы имеют свой встроенный орфографический словарь и могут «на ходу» замечать ошибки, извещая вас об этом. Причем вместе с предупреждением о возможной ошибке вам будет выдано предполагаемое правильное написание слова (фразы). Такой возможностью обладают, в частности, поисковые системы Яндекс и Google.

Наряду с предупреждением о возможной ошибке поисковая система все-таки выполнит поиск по ошибочному запросу и найдет ресурсы, на которых данное слово упоминается в том виде, в котором вы его указали в поле запроса.

Возможности расширенного поиска

Режим расширенного поиска позволяет задать дополнительные параметры, которые должна будет учитывать поисковая система при проведении поиска (искать на определенных сайтах, языках, проводить поиск с учетом даты создания документов и т.д. и т.п.).

Чтобы перейти в режим расширенного поиска, следует на главной странице поисковой системы щелкнуть по ссылке «Расширенный поиск».

Язык поисковых запросов

Для этого, зайдя на сайт поисковой системы (Яндекс, а лучше всего Google — он поддерживает наибольшее количество всевозможных языков), вам нужно перейти в режим расширенного поиска. Далее в соответствующем поле (оно, как правило, так и называется Язык) выберите требуемый язык, информацию на котором вы хотите найти. Имейте ввиду, что и свой поисковый запрос также придется вводить на этом языке (если это конечно не интернациональные слова типа DVD и т.п.).

rusopen.com

Проблема поиска

Говорят, что в Интернете есть все. На самом деле – это не так. Материалы для размещения в сети готовят живые люди, и потому там можно найти лишь то, что они сочли нужным опубликовать. Впрочем, река питается ручьями, и, благодаря их творчеству сегодня в Интернете уже образовалось около двух миллиардов Web-страниц. В результате каталогизация имеющихся в сети ресурсов стала серьезной проблемой. Несмотря на то, что проблемой занимаются тысячи организаций, она не только не приближается к разрешению, но и становится острее. Процент каталогизированных ресурсов неуклонно падает. В последние годы это падение стало катастрофическим. Так, если в 1999 году процент каталогизированных ресурсов приближался к 40%, то всего лишь за один следующий год он опустился до 25 %.

Вывод простой: пространство Web быстрее наполняется, чем систематизируется.

К сожалению, у нас нет оснований предполагать, что в ближайшее время что-нибудь может измениться к лучшему. В итоге поиск информации в Интернет можно считать одной из самых трудных задач.

Поисковые системы

Для поиска интересующей вас информации необходимо указать браузеру адрес Web-страницы, на которой она находится. Это самый быстрый и надежный вид поиска. Для быстрого доступа к ресурсу достаточно запустить браузер и набрать адрес страницы в строке адреса.

Адреса Web-страниц приводятся в специальных справочниках, печатных изданиях, звучат в эфире популярных радиостанций и с экранов телевизора.

Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета.

Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.

Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.

Робот (Spider, Robot или Bot) — это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое.

Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.

Индекс — это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц.

Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.

Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации.

Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки.

Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).

Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.

Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.

Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.

Поиск по рубрикатору поисковой системы

Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, npeдставляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

Приведем в качестве примера структуру поискового интернет-каталога Яндекс.

Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы:

  • Бизнес и экономика;
  • Общество и политика;
  • Наука и образование;
  • Компьютеры и связь;
  • Справочники и ссылки;
  • Дом и семья;
  • Развлечения и отдых;
  • Культура и искусство.

Каждая тема включает множество подразделов , а они, в свою очередь, содержат рубрики и т. д.

Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом:

Яндекс > Каталог > Культура и искусство > Музыка > Авторская песня

Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:.

Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны

Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

Поиск по ключевым словам

Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска.

Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Найти.

Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. На первый взгляд самое простое — это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц — огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.

Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Количество ссылок уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.

Правила формирования запросов в поисковой системе Яндекс

Приведем несколько простых правил формирования запроса в поисковой системе Яндекс.

Ключевые слова в запросе следует писать строчными (маленькими) буквами.

Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе.

Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

Для поиска устойчивого словосочетания следует заключить слова в кавычки.

Например, «фарфоровая посуда».

Для поиска по точной словоформе перед словом надо поставить восклицательный знак.

Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября».

Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &

Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки « + » и «-» надо писать через пробел от предыдущего и слитно со следующим словом.

Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|».

Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки

Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе.

магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

Если оператор повторяется один раз (например, & или

), поиск производится в пределах предложения. Двойной оператор (&&,

) задает поиск в пределах документа.

Например, по запросу «рак

астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

Вернемся к примеру с аквариумными рыбками. После про¬чтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум — сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

Для поиска литературы или полнотекстовых документов возможен следующий запрос:

«+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.

Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

  • Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.
  • Прочитать предлагаемые статьи и приступить к устройству аквариума.
  • Поискать материалы о хомячках или волнистых попугайчиках.

  1. Какой вид поиска является самым быстрым и надежным?
  2. Где пользователь может найти адреса Web-страниц?
  3. Каково основное назначение поисковой системы?
  4. Из каких частей состоит поисковая система?
  5. Какие поисковые системы вы знаете?
  6. Какова технология поиска по рубрикатору поисковой системы?
  7. Какова технология поиска по ключевым словам?
  8. Когда в критерии поиска надо задавать + или -?
  9. Какие критерии поиска в Яндексе заданы следующей фразой:

Что означает удвоение знака (

или ++) при формировании сложного запроса?

Пользуясь каталогом поисковой системы, найдите следующую информацию (по указанию учителя):

  1. Текст песни популярной музыкальной группы
  2. Репертуар Мариинского театра на текущую неделю
  3. Характеристики последней модели мобильного телефона известной фирмы (по вашему выбору)
  4. Рецепт приготовления украинского борща с галушками
  5. Долгосрочный прогноз погоды в вашем регионе (не менее чем на 10 дней)
  6. Фотография любимого исполнителя современной песни
  7. Примерная стоимость мультимедийного компьютера (прайс)
  8. Информация о вакансиях на должность секретаря в вашем регионе или городе
  9. Гороскоп своего знака зодиака на текущий день

По результатам поиска составьте письменный отчет в Word: представьте в документе найденный, скопированный и отформатированный материал. Предъявите отчет учителю.

Задание 2. Формирование запроса по точному названию или цитате.

Вам известно точное название документа, например «Гигиенические требования к персональным электронно-вычислительным машинам и организации работы». Сформулируйте запрос для поиска в Интернете полного текста документа.

Результат поиска сохраните в своей папке. Предъявите учителю.

Задание 3. Формирование сложных запросов.

  • В любой поисковой системе составьте запрос для поиска информации о русской бане. Исключите предложения об услугах, рекламу банных принадлежностей и прочую рекламу. Сосредоточьте поиск на влиянии русской бани на организм.
  • Составьте сложный запрос на поиск информации по уходу за домашними кошками. Исключите из поиска крупных кошек (например, львов), а также предложения о покупке, продаже, фотографии для обоев и т. п.
  • Текст запроса и результат поиска оформите в Word и представьте учителю.

Задание 4. Тематический поиск.

Всеми известными вам способами выполните поиск в Интернете информации по истории развития вычислительной техники. Поиск производите по различным направлениям: историческая обстановка, техника, личности. Результаты поиска оформите в виде презентации. Используйте в презентации многоступенчатой оглавление в виде гиперссылок.

www.school497.ru

Принципы работы поисковых систем

В этой статье я вам расскажу принцип работы поисковых систем. Думаю, данная публикация будет полезна не только начинающим seo-оптимизаторам, но тем владельцам сайтов, которые уже имеют небольшой опыт в раскрутке своих проектов. Почему я так считаю? Дело в том, что сейчас в интернете можно встретить достаточно большое количество блоггеров, которые, в принципе, знают какие-то правила оптимизации, они покупают ссылки, пишут оптимизированные статьи и т.д. Но далеко не все они знают, по какому принципу работают все поисковые системы, что, как мне кажется, очень сильно мешает им понять все тонкости раскрутки сайтов. Хотя я считаю, что первое, что должен узнать начинающий seo-оптимизатор это то, как работают поисковые системы. И в этой статье я постараюсь максимально подробно об этом рассказать.

Естественно, я буду говорить только о самом принципе работы поисковиков, а все вопросы технического характера (работа алгоритма) затрагиваться не будут. Потому как, во-первых, эти алгоритмы держатся в строгой тайне, и никто кроме самих разработчиков поисковых систем их не знает, а во-вторых, они (алгоритмы) постоянно меняются и если, даже кому-то удастся узнать, как все работает, через некоторое время (1-2 недели) эта информация уже будет не актуальной. Но обо всем по порядку. Итак, начнем!

Первое что вы должны понять так это то, что все поисковые системы являются так называемыми «индексирующими» поисковиками. То есть, они выполняют поиск исключительно по своей базе данных, которая строится специальной программой, называемой поисковым роботом (или как ее еще называют индексатор, паук, кроулер, бот, червяк).

Получается, когда человек только создал сайт, ему необходимо подождать некоторое время чтобы поисковый робот нашел его ресурс и загрузил к себе в индекс (базу данных) и только после этого сайт будет участвовать в поиске. Так же каждая поисковая система предоставляет возможность пользователю добавить свой ресурс в очередь на индексацию в ручном режиме, используя для этого специальную форму добавления адресов. Но главное не это, главное чтобы вы поняли, что когда пользователь вводит в «поисковик» какой-то запрос поисковая система ищет информацию исключительно по своей базе данных. То есть она не перелопачивает весь интернет, чтобы показать вам страницы с необходимой информацией, она работает в рамках своей базы данных. Это очень важно понимать.

Этот принцип работы поисковых систем дает возможность искать информацию практически мгновенно. Мало того, благодаря ему имеется возможность показать пользователю максимально качественный результат выдачи, за счет предварительной обработки и структурирования информации в индексе. Давайте более подробно об этом поговорим.

Смотрите, как все происходит. Когда поисковый робот заходит на сайт он сразу же начинает разбивать его на некие составляющие. Во-первых, выполняется выборка всех ссылок из документа и добавления их в очередь для дальнейшего «путешествия» робота по просторам интернета. После чего робот начинает обработку текста страницы, разбивая его на некие логические составляющие, которые еще называют пассажами.

То есть, что значит пассаж? Все очень просто. Пассаж — последовательность слов или одно слово, находящееся в рамках html тега или знака препинания.

К примеру, у нас есть текст: «сейчас я пишу для вас статью, которая поможет вам понять принцип работы поисковых систем». Так вот, слова: «сейчас я пишу для вас статью» — это будет первый пассаж, а следующий набор слов — «которая поможет вам понять принципы работы поисковых систем» — это уже второй пассаж. Как видите, данные слова разбиваются на пассажи в зависимости от знаков препинания. Но здесь важно знать, что поисковый робот видит нашу страницу не так как обычный пользователь, он ее обрабатывает в виде html-кода. Причем в качестве разделителя пассажов выступают не только знаки препинания, но и теги блочных элементов (

и т.д.). Надеюсь здесь все понятно. Идем, дальше.

После того как текс будет разбит на пассажи, робот выполняет их структурирование по своей значимости. Дело в том, что вес того или иного текста на странице очень сильно зависит от того, в каком html-теге он находится. К примеру, текст который находится в теге

будет иметь большую значимость для поисковой системы, нежели текст который заключен в тег

Конечно, вы должны понимать, что если вес текста в теге

больше, нежели в

это не значит, что вы должны заключать весь текст в тег

, скорей всего этим вы себе только навредите. Тем более это распределение значимости текста актуально только для ключевых слов. В общем, думаю, это понятно. Естественно, в будущем мы еще будем не раз говорить о том, как можно повысить вес страницы для поисковиков, так что подпишитесь на обновления блога, чтобы ничего не пропустить.

Помимо разбивки текста на пассажи робот выполняет расчленение текста и удаление так называемых «шумовых слов» или как еще их называют стоп слова. Другими словами, робот удаляет из текста все предлоги и незначимые части речи, которые выражаются в таких словах: в, на, при, а, у, из, от. То есть это те слова, которые не несут смысловой нагрузки.

После того как все вышеописанные манипуляции будут выполнены, поисковый робот помещает эти данные в основной индекс, по которому и выполняется поиск информации. Важно также знать, что помимо основного индекса поисковик сохраняет и копию страницы, которую он обработал. Эту копию вы можете очень легко посмотреть, нажать на ссылку «копия» которая обычно располагается возле результатов выдачи поисковой системы.

Когда вы перейдете по этой ссылке вы увидите копию страницы, которая на текущий момент находится в индексе поисковой системы. Если вы внимательно посмотрите, то увидите, что сверху страницу указывается время, когда поисковый робот индексировал данный документ. Как по мне это очень важная опция, так как она позволяет узнать, когда в последний раз на ваш сайт заходил поисковый робот и какая копия страниц на данный момент находится индексе.

Исходя из вышесказанного, можно легко понять, что все производимые вами манипуляции на странице связанные с поисковой оптимизацией начнут действовать только через некоторое время, когда поисковик вновь зайдет на сайт и подхватит новую копию документа.

Кстати, если вы хотите узнать, сколько на данный момент находится страниц в индексе, можете воспользоваться очень простым запросом, который выглядит так: «site:igorek.info». То есть вы просто вводите в строку поиску данный запрос (вместо igorek.info пишите свое имя домена) и смотрите, какие страницы участвуют в выдачи. В этом случае поисковик показывает только те страницы, которые принадлежат конкретному сайту.

Внимание! Очень важно понимать, когда речь идет о поисковой выдачи или поисковой оптимизации имеется в виду оптимизация отдельных страниц, а не сайта. Запомните, для поисковых систем понятия сайта не существует. Когда пользователь вводит какой-то запрос в строку поиска, ему показываются страницы, а не сайты. То есть, оптимизируем мы именно отдельные страницы.

Принципы работы поисковых систем понятие ТИЦ, ВИЦ и PR

Помимо того, что поисковик выполняет полную разбивку документа на пассажи и структурирование полученной информации для улучшения ее поиска, он также занимается оцениванием авторитетности обрабатываемой страницы. Как это понять? Дело в том, что в каждой поисковой системе есть некий перечень факторов, которые она учитывает при определении полезности и авторитетности ресурсов. Данных факторов существует очень много, но один из самых значимых — ссылочная масса. Другими словами это количество ссылок, которые ведут на страницу сайта. В простонародье этот фактор еще называют «индекс цитирования». Такого рода оценивания качества информации пришло в интернет с научных кругов, именно там показатель «ссылаемости» на какую-то научную работу определяет ее качество.

Поисковые системы ввели условные показатели авторитетности сайта исходя из количества ссылаемых на него ресурсов. Для Google этот показатель называется PR (Page Rang), который измеряется от 0 до 10. Для Яндекса это так называемый ТИЦ (тематический индекс цитирования), показывающий авторитетность сайта, этот показатель измеряется от 0 до условной бесконечности (у самого Яндекса ТИЦ 430 000 на момент публикации этой статьи) . Также Яндекс ввел так называемый ВИЦ (взвешенный индекс цитирования), который определял вес ссылок ведущей на сайт.

Получается, когда поисковый робот оценивает качество страницы, он берет в расчет количество ссылок ведущих на данную страницу, их вес и многие другие показатели. И это позволяет определить некий уровень качества индексируемой страницы, который учитывается при выдаче результатов пользователю, вбившего в строку поиска кукую-то искомую фразу.

Естественно помимо вышеуказанных факторов поисковые машины берут в расчет и многие другие показатели, которые, как вы понимаются, держатся в строгой тайне. Правда о некоторых из них стало известно посредством многих экспериментов и наблюдений специалистов в этой области, о них я вкратце рассказывал в этой статье, но, полного списка этих факторов никто не знает.

В общем, вы должны хорошо понимать, что поисковые машины — это очень сложный механизм, который выполняет огромную аналитическую работу, для того чтобы оценить качество документа. Причем этот механизм постоянно совершенствуется и если можно так выразиться — эволюционирует. Не зря сейчас существует много seo-компаний, которые берут огромные деньги, за продвижение сайтов в ТОП выдачи поисковой системы, проводится колоссальная работа владельцами проектов в плане раскрутки своих ресурсов с целью получения прибыли. И естественно, без знания базовых принципов работы поисковых систем здесь не обойтись.

Так же немаловажным является понимание того, что поисковые машины вам ничего не должны, и они имеют полное право удалить ваш сайт со своего индекса. Особенно если вы нарушаете лицензию пользования поисковой системой, поэтому ни в коем случаи не пытайтесь каким-то образом «надуть» Яндекс или Google и повлиять на их выдачу, это может кончиться наложением на ваш ресурс определенных санкций или же полным исключением его из поиска. Конечно же, здесь имеется в виду так называемые черные методы оптимизации, где используются специальные скрипты для перенаправления пользователя на другие сайты, скрытия контента от поисковых систем, массовая закупка ссылок, заспамленность страниц ключевыми словами и т.д.

Как бы там ни было вы должны хорошо осознавать, что ваш ресурс должен нести какую-то пользу посетителям. И если это будет так, то ни какие санкции поисковых систем вам не страшны. Это главное что нужно знать!

igorek.info

Лабораторные работы / Лабораторная работа № 12 Поиск информации в сети Интернет

Тема: «Поиск информации в сети Интернет»

Научиться использовать поисковые службы Интернет и поисковые серверы WWW для поиска необходимой информации.

Изучить типы поисковых серверов, язык запросов поискового сервера и технологию поиска.

Основные понятия: Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы — информационно-поисковых систем (ИПС). Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность — это поисковые каталоги и поисковые указатели. Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор — работа должна быть автоматизирована.

Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:

сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы — черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;

индексация базы данных — первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы — собственно поисковые указатели;

рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска. Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

В России наиболее крупными и популярными поисковыми указателями являются:

Упражнение 1. Освоение элементарных приемов поиска информации в сети Интернет. Цель упражнения: Изучение интерфейса, назначения и особенностей поисковых WWW-серверов. Разъяснение понятия «запрос», отличие запроса от вопроса. Задание: Найти, как называется самое большое пресноводное озеро в мире. Порядок выполнения.

Запустить обозреватель MS Internet Explorer.

В адресной строке набрать адрес поискового WWW-сервера.

Открыть новое окно браузера, выполнив последовательность команд в главном менюФайл — Создать — Окно или использовав сочетание клавиш Ctrl+N.

Повторить п.п. 2, 3 не менее четырех раз. В разные окна браузера загрузите главные страницы поисковых машин.

Сравнить интерфейсы поисковых WWW-серверов.

Примечание. Для оптимальной и быстрой работы с поисковыми системами существуют определенные правила написания запросов. Подробный перечень для конкретного поискового сервера можно, как правило, найти на самом сервере по ссылкам Помощь, Подсказка, Правила составления запроса и т.п.

С помощью справочных систем познакомьтесь с основными средствами простого и расширенного поиска.

Организуйте поиск, заполните таблицу и прокомментируйте результаты поиска:

studfiles.net

ITandLife.ru

Статьи об IT, программировании, политике, экономике, жизни и изучении научных дисциплин

Правила и советы по поиску информации в Интернете

Логотипы крупнейших поисковых систем

Каждый день мы ищем различную информацию в сети Интернет, будь-то описание нашего любимого фильма или доклад видного ученого. Мы давно привыкли к дизайну главных страниц крупнейших поисковиков — Google и Яндексу и посещаем их по десятков раз в день.

А часто ли Вы задумывались над правилами поиска информации? Я думаю не часто (сам сильно об этом не задумывался), но заметил что порой поиск нужной мне информации занимает довольно длительное время. В этой заметке я постараюсь рассказать о способах сокращения времени поиска и повышения его результативности.

Правила поиска информации в поисковых системах

Как уменьшить время на поиск и улучшить его результаты, общие рекомендации:

  • Запросы должны быть простыми. Если вы ищете какое-то предприятие, просто введите его название или хотя бы ту часть названия, которую вы помните наверняка. Если вы ищете конкретное понятие, место или продукт, начните с его названия или имени. Если вы ищете пиццерию, просто введите слово «пиццерия» и название своего города или почтовый индекс. Для большинства запросов вовсе не нужны редкие операторы или изощренный синтаксис. Чем проще, тем лучше.
  • Подумайте, какие слова присутствуют на странице, которую вы ищете. Поисковая система не человек. Это программа, которая сравнивает слова, которые вы вводите, и слова, которые имеются на веб-страницах. Используйте слова, которые с наибольшей вероятностью могут присутствовать на искомой странице. Например, вместо [ у меня болит голова ] введите [ головная боль ], потому что именно этот термин будет использоваться на странице, посвященной медицине. Запрос [ в какой стране летучие мыши считаются хорошей приметой? ] понятен человеку, но в документе, содержащем ответ, может не быть этих слов. Введите лучше [ летучие мыши считаются хорошей приметой в ] или даже [ летучие мыши хорошая примета ], поскольку эти слова скорее всего присутствуют на нужной странице.
  • Опишите, что вам нужно, используя как можно меньше слов. Каждое слово в запросе служит для сужения и уточнения области поиска. Поскольку используются все слова, каждое дополнительное слово ограничивает круг результатов. Если ввести слишком много ограничений, можно пропустить полезную информацию. Начните поиск с нескольких ключевых слов. Даже если вы не нашли то, что нужно, просмотрите найденные результаты, и вы поймете, какие дополнительные слова нужно включить в следующий запрос, чтобы получить более релевантные результаты. Например, простой запрос [ погода минск ] даст лучшие результаты, чем более длинный запрос [ прогноз погоды для минска беларусь ].
  • Подбирайте более информативные слова. Чем более информативное слово используется, тем больше вероятность, что результаты будут релевантными. Такие слова, как «документ», «веб-сайт», «компания» или «информация» обычно лишние. При этом следует помнить, что даже если вы используете правильное слово, но большинство людей редко им пользуется, это слово может не оказаться на нужной странице. Например, запрос [ популярные рингтоны ] более информативен и конкретен, чем [ популярные мелодии ].

Разработчики поисковых систем разработали специальный язык поисковых запросов (язык своеобразных правил поиска информации), который позволяет облегчить и ускорить поиск информации в Интернете. Ниже я приведу примеры использования выражения этого «языка».

Какую поисковую систему использовать: Google или Яндекс?

Когда я был неопытен, для поиска я использовал только одну поисковую систему. Но опыт показал, что такой подход неэффективен, потому что у каждой поисковой системы свой уникальный запатентованный алгоритм поиска и, соответственно, свои плюсы и минусы. Куда важнее понять для каких типов поисковых запросов использовать тот или иной поисковик. Существует следующие типы поисковых запросов:

  • Навигационные запросы – это такие запросы целью которых является поиск определенного места в сети Интернет. Например, сайт фирмы или сайт недавно посещенного форума, поиск ссылки на блог и т.д.
  • Информационные запросы – такие запросы вводят, если хотят получить какие-то сведения или найти нужную информацию в Интернете. Например, поиск сведений об истории Древнего Рима или поиск результатов футбольного матча и т.д.
  • Транзакционные запросы – это вид запросов, которые вводят для того чтобы совершить какое-то действие в Интернете — транзакцию (купить, скачать, закачать, подписаться и т.п.)
  • Нечеткие запросы – это общие, конкретизированные запросы, которые, как правило, вводят неопытные пользователи. Напрмер, «мобильник», «музыка», «цветы» и т.д.

Особенности поисковой системы Google

Данный поисковик лучше использовать для навигационных запросов или поиска адреса сайта. Алгоритм этой поисковой машины особое внимание уделяет виду доменному имени и ссылке. Я несколько раз видел как при вводе нечеткого запроса в ТОП-10 выдачи присутствовали сайты, на которых вообще отсутствовал контент. Не стоит также забывать и о том, что Google — это международный поисковик, т.е. лучшее решение для поиска информации на иностранном языке.

Особенности поисковой системы Яндекс

Отечественный поисковик отлично подходит для поиска информации в Интернете по информационным запросам. Он очень хорошо индексирует Рунет, его алгоритм уже много раз подвергался доработке, к тому же он оптимизирован для поиска информации на русском языке. Примечательно что Яндекс тоже получил статус международного поисковика, произошло это 19 мая 2010 года (ссылка на источник).

itandlife.ru

Смотрите еще:

  • App store правила Правила App Store и Google Play. Часть 1 Публикации App Store и Google Play очевидно являются двумя крупнейшими сторами мобильных приложений, и такая монополия дает им карт-бланш в диктовке своих требований разработчикам. Издателям […]
  • Domstorage в реестре Как отключить новый вид Cookie называемым Dom Storage (Web storage) С определенного времени в веб-браузерах появилась некая новая форма куков (Cookie). Это не совсем куки, но цели те же, а именно хранение данных. Называется этот […]
  • Сбор налогов россии Налоговая похвасталась рекордным сбором налогов Федеральная налоговая служба (ФНС) отчиталась о рекордных поступлениях в консолидированный бюджет: по итогам 2017 года служба перечислила 17,3 триллиона рублей, что на 20 процентов […]
  • Нотариус кронштадт клыкова Нотариус Клыкова Лариса Валериевна Адрес: 197760, Кронштадт, улица Сургина, дом № 15 (посмотреть на карте Google) Телефон: +7 (812) 4390740 Работает в выходные Номер лицензии: № 288 от 30.12.1994 Номер приказа: № 369-к от […]
  • Требует разрешения для adobe flash Как воспроизводить Flash-контент Воспроизводить аудио и видео формата Flash в браузере Chrome на компьютере можно с помощью плагина Adobe Flash. Примечание. Компания Adobe прекратит поддержку технологии Flash в конце 2020 года. Чтобы […]
  • Как получить разрешение адобе флеш Включение для браузера Internet Explorer От эксперта: включение Flash Player HTML5-версия представленного выше видео находится в разделе Включение Flash Player в Internet Explorer. Щелкните значок «Инструменты» в правом верхнем углу […]
  • Google chrome разрешения Как изменить разрешения сайтов Вы можете указать, какой контент будет виден на веб-страницах и какие данные о работе в Сети будут получать сайты. Как изменить настройки для всех сайтов Запустите приложение Chrome на устройстве […]
  • Разрешение на unity player включить Что такое Unity Web Player? Все про программу для Windows Что такое Unity Web Player? Эта статья для тех, кто любит игры и не представляет свою жизнь без качественной графики и хорошего изображения. Речь пойдет о браузерном […]