Меню Рубрики

Язык поисковых систем

Давно хотел написать подборку, собранную мной на бескрайних просторах Интернета, о том, что такое язык поисковых систем, как правильно создавать поисковые запросы и находить именно то, что ищете, но все как-то руки не доходили. Натолкнуло меня на эту мысль посещение SEO форумов и форумов веб-мастеров, где я очень часто встречал поднятые темы по тому или иному вопросу, где авторы тем не удосужились даже обратиться к поисковым машинам, чтобы найти ответы на поставленные вопросы. Причиной этому может быть банальная лень, или простое неумение искать, то есть пользоваться поиском в Интернете.

Язык поисковых систем

Да, поиском действительно нужно уметь пользоваться. Тем более, если люди на форумах предоставляют разного рода SEO услуги, считают себя веб-мастерами и не знают язык поисковых машин, то это, мягко говоря, стыдоба. Поэтому я не буду вас томить и перейду к тому, о чем мечтаю, о чем я думаю всегда — это язык поисковых запросов.

Язык поисковых систем и, что он из себя представляет

Что же собой представляет язык поисковых систем, то есть поисковых запросов? Он состоит из специального набора служебных команд, которые максимально конкретно передают поисковой машине запрос с использованием самых простых логических функций исключения либо же объединения слов. А на простом языке, то при составлении поискового запроса вам предоставляется возможность использовать довольно таки простые логические функции, которые позволяют объединять или исключать слова из этих же поисковых запросов. Иными словами язык поисковых запросов включает в себя набор команд, которые могут отличаться для разных поисковых машин. Подобные механизмы применяются не только для Яндекса, но и для других поисковых систем, не раз проверил на собственной шкуре.

Для большей части поисковых запросов чаще всего применяются команды логического объединения или исключения «+» и «». Они дают возможность в принудительной форме добавлять либо же исключать любые слова из теста поискового запроса. Если вы пометили слово знаком «+», то оно в обязательном порядке должно быть в искомом документе. А если слово пометить символом «», то оно должно быть исключено из искомого документа. Давайте рассмотрим на примере. Вы хотите купить относительно недорогой подержанный автомобиль марки «Форд» и ищете объявления о продаже. Поисковый запрос должен выглядеть так:

продам форд +дешево

Обратите внимание на то, что знак «+» пишется через пробел от предыдущего слова, но слитно с последующим. В этом случае поисковая машина будет искать все объявления о продаже автомобилей этой марки, в тексте которых будет присутствовать слово «дешево».

Едем дальше. Вам приспичило найти в Интернете информацию о ноутбуках Lenovo, но вам так не хочется видеть в результатах поиска объявления об их продаже, а также рекламу компьютерных магазинов. Нет проблем, составляем поисковый запрос так:

ноутбуки Lenovo –компьютерный –магазин –продажа

Как видите (я не устану повторять, дабы вам запомнилось) знак «» записан через пробел от предыдущего слова, но слитно с последующим. Еще раз пример. Поисковый запрос

деловой –блог

поисковая система обработает корректно, а вот в запросе

деловой – блог

знак «» поисковая машина проигнорирует.

Думаю многие знают знак амперсанд &. Он обозначает оператора «логическое И». Так вот, при создании поискового запроса с использованием этого знака поисковая машина получает команду перечислять все слова, которые будут встречаться в одном предложении искомого документа. И, конечно же, сам пример поискового запроса:

деловая & жизнь

Такой формат поискового запроса вынудит поисковую машину искать предложения, в которые входят оба указанные слова. Но здесь необходимо знать, что поисковая система может выдать данные поиска с различной степенью релевантности. А именно, в результатах поиска вы сможете обнаружить тексты, в которых присутствуют фразы «Городская деловая жизнь», либо же «Деловая элита города решила воплотить в жизнь свои планы». Так же нужно учесть то, что с точки зрения поискового механизма степень релевантности будет выше в том случае, когда в обнаруженном предложении искомые слова будут, как можно ближе, находится друг к другу. Поясняю на пальцах: если между искомыми словами будет меньше находиться других слов (смотрите выше первую фразу примера), то ссылки с такими предложениями в отчете поиска будут показаны первыми. И наоборот — если между искомыми словами будут в предложении встречаться другие слова (смотрите выше вторую фразу примера), то ссылки на них будут показаны ближе к концу выдачи.

Символ «|» обозначает оператора «логическое ИЛИ». Применение этого символа в поисковом запросе дает возможность находить предложения, в содержание которых входит только одно из перечисленных слов. Привожу пример:

вода | пар | лед

В поисковой выдаче вашему вниманию будут предоставлены документы, в которых встречается только одно из трех слов — «вода», либо «пар», либо «лед».

Символ тильда (~). Обычно этот символ описывает действие, которое аналогично действию обозначенному знаком «-». А именно: тильда исключает из поисковой фразы слова, которые отмечены этим знаком. Составив, таким образом, поисковый запрос

ноутбуки Lenovo ~цена

вы получите в выдаче поисковой системы список искомых фраз, в которых встречается сочетание слов «ноутбуки Lenovo», а слово «цена» исключено из поиска.

Если вы хотите удвоить команду любого поискового запроса, то в этом случае команда будет не к одному искомому предложению, а в целом ко всему документу. И сам поисковый запрос

деловой обед ~~ ресторан

будет означать, что вы ищете файлы, в которых могут встречаться слова «деловой» и «обед», но слово «ресторан» будет полностью исключено из документа, а не лишь с одного предложения, где может быть это слово.

А вот поисковый запрос

деловые && люди

укажет поисковой системе на то, что в выдачу нужно включать все найденные документы, тексты которых содержат слова «деловые» и «люди», независимо от того будут они находиться в одном документе, или же будут разбросаны по всему тексту в хаотичном порядке.

А еще я хочу вам поведать такую штуку, что логические операторы в языке поисковых запросов можно и даже нужно комбинировать. Для таких комбинаций применяются скобки. Ну и без примера никак не обойтись. Поисковый запрос

автомобили & (ваз | жигули)

означает, что вы ищете документы, которые содержат, либо слова «автомобили» и «ваз», либо слова «автомобили» и «жигули».

Но есть случаи, когда комбинировать логические операторы можно и без применения скобок. Поисковая фраза

грузовые & автомобили && камаз ~~ запчасти

означает, что вы ищете документы, которые содержат слова «грузовые» и «автомобили» в одном предложении, а слово «камаз» по всему тексту, а вот слово «запчасти» вообще исключено из поиска.

А теперь внимание! Поисковая система «Яндекс» воспринимает кавычки как служебный оператор. Это значит, что заключенную в кавычки искомую фразу нужно искать только в полном составе. Например, по поисковому запросу

«деловой блог»

в поисковую выдачу войдут только те веб-страницы, которые содержат это словосочетание, а предложения типа «Мой деловой блог один из лучших» будут исключены из результатов выдачи.

По умолчанию поисковая машина «Яндекс» берет во внимание словоформы исходного поискового запроса в соответствии с правилами русского языка. Например, если в окно поиска вы ввели слово «деловой», то «Яндекс» включит в поиск документы, которые содержат слова «деловая», «деловые» и в таком же духе далее. Но все же, может возникнуть необходимость указать поисковой машине совершить поиск в точной словоформе. И такой способ есть. Чтобы сотворить такое чудо, в поисковом запросе, перед ключевым словом нужно поставить восклицательный знак. По поисковому запросу

!деловой

поисковая система «Яндекс» будет искать только те документы, которые содержат слово «деловой», а остальные словоформы этого слова исключит из поиска.

Чтобы найти документ по точно сформулированной фразе, надо использовать кавычки, либо же объединяющие скобки. Например, сформулированные поисковые фразы

«деловой блог» или !(деловой блог)

будут найдены в точности, как они есть и ни на йоту в сторону.

А вот это уже будет интересно. Дело в том, что поисковая система «Яндекс» различает верхний и нижний регистры, когда вы вводите поисковый запрос. Чтобы избежать ошибок в поисковой выдаче, всегда вводите поисковый запрос только строчными буквами. Верхний регистр можно использовать только в исключительных случаях, скажем для названий городов, имен.

Поиск в элементах и объектах

Народ у нас грамотный и долго жевать не стоит по поводу того, чем наполняются поисковые системы. Но, все же, нужно об этом пару слов написать. Опубликованная в Интернете информация в основном размещена на веб-страницах. А веб-страницы состоят из электронных документов, которые представляют собой не только тексты, но и другие элементы: таблицы, гиперссылки, заголовки, графика, видео, фото, подкасты и др. Бывают случаи, когда возникает необходимость поиска интересующих вас данных среди многообразия этих элементов, а также их атрибутов. Например, вам нужно найти какой-то документ с каким-то адресом или же статью, заголовок которой вам известен. Именно для такого поиска существует язык поисковых систем, то есть структура языковых запросов, которые предусмотрены для набора поисковых команд для поиска в элементах и объектах. В данном случае речь пойдет и поисковой системе «Яндекс».

Итак, приступим. Рассмотрим команды и их назначение для поиска веб-страниц. Команда

$title (сюда вставляете искомое слово или выражение)

предназначена для совершения поиска веб-страниц по заданному заголовку. А вот и пример:

$title (венера)

Но здесь есть один нюанс, о котором я сейчас постараюсь внятно рассказать. Дело в том, что под «заголовком» следует понимать не заглавие статьи, размещенной на веб-странице, а заголовок самого документа. Теперь внимание! Где можно увидеть заголовок документа? При открытии веб-страницы в любом браузере есть панель заголовков, иными словами я это называю вкладки, и на вкладке есть текст, вот это и есть заголовок документа. А еще при наведении на вкладку курсора мышки во всплывающем окне может отображаться полный заголовок, так как на вкладке не всегда он умещается. Но, не всегда нужно понимать под заголовком весь текст. Например, Венера — планета солнечной системы, в этом предложении заголовок слово «венера» — остальное шлак.

Команда

$anchor (сюда вставляете искомое слово или выражение)

дает возможность выполнять поиск в якорях гиперссылок. Но следует заметить, что в этой команде в качестве выражения используется не сам адрес сайта, на который ссылается документ, а значение самого якоря. Итак, поисковый запрос

$anchor (авангард блогосферы)

дает команду поисковой системе на поиск документов в html-коде, где есть гиперссылка <a href=”http://blogin.top“>Авангард блогосферы</a>. Такого вида конструкция будет показана в окне браузера, которая представляет собой гиперссылку словосочетания «Авангард блогосферы». Если по ней щелкнуть мышкой, то будет осуществлен переход на страницу http://blogin.top.

Если ваша цель поиск ссылок на сам адрес сайта, то и в этом случае можно оформить команду для поисковой машины таким образом:

#link=”сюда написать искомое”

Поясню более подробно и с примером. Если в окне поискового запросы вы введете #link=”blogin.top, то поисковая машина выдаст список веб-страниц, которые будут ссылаться на http://blogin.top и это не будет зависеть от оформления самой гиперссылки.

Многие в курсе, что html-код большинства веб-страниц содержит специальные мета-определения (мета-теги). При помощи их разработчики сайта указывают краткое описание проекта, а также набор ключевых слов, которые характеризуют содержание сайта. Такие директивы специально включают в код сайта для того, чтобы роботам поисковых машин облегчить индексирование веб-страниц. На данный момент не всегда разработчики применяют данный вид манипуляции с описанием сайта и применением ключевых слов, так как есть уже более прогрессивные методы облегчения участия роботов поисковых систем в индексации проекта. Но как бы там ни было, старые проекты продолжают работать и это не нужно упускать из виду. Не все еще оптимизированы под новые требования.

Итак, мета-определитель типа

<META NAME=”description”CONTENT=”краткое описание содержимого сайта”>

указывает поисковой машине на содержимое документа в виде небольшого анонса.

Мета-определитель

<META NAME=”keywords”CONTENT=”список ключевых слов”>

указывает поисковой машине на список ключевых слов, по которым ссылка на сайт или страницу сайта включается в отчет результата выдачи поиска.

Язык поисковых запросов «Яндекса» имеет две специальные команды, которые дают возможность выполнять поиск в аналогичных конструкциях. Например, команда

#abstract=(сюда вставляете искомое слово или словосочетание)

указывает поисковой машине искать в поле CONTENT определитель description.

Команда

#keywords=(сюда вставляете искомое слово или словосочетание)

указывает поисковой машине искать в поле CONTENT определитель keywords. Чтобы было более понятно, приведу примеры этих команд:

#abstract=(авангард блогосферы)

#keywords=(блог)

Когда вы будете применять данные команды, то необходимо иметь ввиду одно обстоятельство: содержимое мета-определителей description и keywords полностью зависит от того, кто занимается разработкой сайта и не всегда может соответствовать его настоящему содержанию.

Команда

#image=”поисковый запрос”

используется при поиске в именах картинок. В этой команде допустимо использовать маску (*), которая обозначает любую последовательность символов. Давайте этот случай рассмотрим более конкретно. Вам необходимо найти документы, которые содержат все возможные производные от слова «blog». Чтобы указать поисковой машине на то, что окончания этого слова могут быть разными и используют маску, например,

blog*

В этом случае в результаты выдачи поисковой машины попадут слова «blog», «blogger», «blogging» и в таком же духе далее. Надеюсь понятно да? Но я на этом не остановлюсь и еще раз приведу конкретный пример для наглядности. Команда

#image=”blog*”

дает возможность найти все картинки, имена которых содержат данное слово и его словоформы, например, blog.jpg, blogger.gif, blogging.png.

Когда вы просматриваете в Интернете сайты, то не раз, наверное, видели при наведении курсора мышки на картинку, появляется всплывающая подсказка, которая может указывать на название, либо описание картинки. А теперь давайте рассмотрим другой случай, когда браузер по каким-либо причинам не загрузил картинку. В этом случае вместо картинки отображается текст. Это может быть название или описание картинки. Оба этих текста одно и то же описание. Обычно их принято называть альтернативными текстами и, чтобы в этих текстах можно было что-то найти, применяется специальная команда поисковых запросов. Например, если вы введете в окне поискового запроса команду

#hint=(блог)

то в результатах выдачи поисковой машины вы получите ссылки на картинки, в альтернативном тексте которых имеет счастье быть слово «блог». Для тех, кто знаком с языком HTML, всему происходящему можно дать пояснение. Дело в том, что эта команда позволяет вести поиск в тегах типа

<IMG SRC=”здесь ссылка на картинку” ALT=”альтернативный текст”>

Команда #image является оператором параметра SRC, а команда #hint — параметра ALT.

Если вам известен адрес сайта и вы горите желанием осуществить в нем поиск, то и для этого случая существует команда. Например, по поисковому запросу

блог предпринимателя #url=”blogin.top

в результатах выдачи поисковой машины вы получите ссылки на все страницы сайта, которые содержат словосочетание «блог предпринимателя».

Вы еще не устали от моей нудной писанины? А то я уже изрядно подустал и хочется выпить чашечку кофе. Вы со мной? Ну да ладно, еще немного осталось и сделаем небольшой перерыв. По сему, хочу пожалеть вас и себя любимого и приступить к завершающему этапу моего монотонного жужжания вам на ухо.

Если вы, после прочитанного еще горите желанием что-то искать, тогда ноу проблем. Итак, если вы все еще хотите найти электронный документ строго определенного типа, то и для этого случая существует команда. Капец, ну да ладно, выдам вам секрет. Команда

#mime=”поисковый запрос”

В качестве поискового запроса можно использовать два типа обозначения электронных документов, с которыми, к счастью, умеет работать наш любимый «Яндекс» (только не веб-страницы) — .pdf и .rtf. И еще раз пример. По поисковому запросу

audi 6 #mime=”pdf”

наш красавчег «Яндекс» сделает огромную попытку найти все документы в формате .pdf, которые будут содержать словосочетание «audi 6». Применение этой команды для вас может быть очень удобным, когда возникает необходимость поиска разного рода электронной документации с указанными файловыми форматами. Это могут быть руководства пользователей программ и устройств, различные инструкции, рефераты и другие не менее полезные документы.

Итак, делаем небольшой перерыв. Но это еще не значит, что я перестану ваши кишки наматывать на свой локоть. То ли еще будет. Надолго не уходите. Далее я вам поведаю о поиске с ранжированием. Так что тяжело в учении, легко в бою.

Поиск с ранжированием

Если вы внимательно читаете, то я выше уже писал, что в ходе процесса обработки запроса пользователя поисковая машина «Яндекс» производит выдачу результата в виде файла отчетности, где мы видим сортировку ссылок в порядке убывания релевантности. Сама же степень релевантности имеет зависимость от многих факторов, например, с какой частотой в тексте встречается слово, которое вы ищете, также сюда относятся и расстояния между слов и другие факторы. Но, все же, пользователь сможет оказать влияние и изменить порядок сортировки ссылок имеющихся в файле отчета выдачи. Для этого и существуют команды ранжирования. Одна из таких команд общего вида:

слово:число

Или же:

(поисковое выражение):число

Эти команды указывают на вес какого-либо слова в словосочетании. Рассмотрим на примере. В результате обработки поискового запроса:

авангард блогосферы:5

На первых местах в файле отчета выдачи будут показаны ссылки, в которых имеется слово «авангард», а также чаще всего встречающееся слово «блогосферы» и только потом будут отображены остальные документы, согласно заданному запросу.

Так же для повышения релевантности поиска можно задать уточняющие выражения, прибегнув к помощи команды:

<- слово

или

<- (уточняющее выражение)

Ну и в обязательном порядке рассмотрим это все дело на конкретном примере и посмотрим результат обработки запроса:

форум <- блоггеров

В файле отчета выдачи в первую очередь будут показаны ссылки на все документы, которые содержат оба слова: «форум» и «блоггеров».

Если вы используете для поиска язык поисковых запросов, то это вам дает возможность максимально уточнить искомый предмет и в результате поиска найти именно то, что вы ищете. Думаю, стоит потратить всего несколько минут, чтобы усвоить выше приведенные примеры и потом сэкономить намного больше времени. Если вы научитесь четко и грамотно формулировать свои поисковые запросы, то вы без особых затруднений сможете найти именно то, что вам так необходимо.

Поиск с учетом расстояния

Продолжение следует. Бывают случаи, когда вы ищете текст, который содержит какое-то устойчивое словосочетание. В таком случае при составлении поискового запроса очень важную роль играет точное указание максимально допустимого расстояния между определенными словами. А теперь давайте рассмотрим поиск с учетом расстояния на конкретном примере, ибо лучше один раз увидеть, нежели 100 раз услышать. Итак, у нас есть предложение: «Долговечность кузова автомобиля зависит от качества его сборки», которое состоит из восьми слов. Каждому из этих слов условно присвоим номера в порядке то 1 до 8. Теперь, чтобы между словами определить расстояние, нужно между их номерами вычислить разницу. В приведенном примере предложения слову «кузова» присвоен номер 2, а слову «автомобиля» — номер 3. Итак, имея в наличии эти две цифры, не сложно будет определить расстояние между словами путем простого арифметического подсчета: 3 – 2 = 1. Полученный результат в виде цифры 1 обозначает, что слова в предложении расположены подряд. А вот результат -1 обозначал бы, что в понимании поисковой системы, эти слова расположены в обратном порядке. Точно также можно определить расстояние между словами «долговечность» и «автомобиля»: 3 – 1 = 2, а между словами «долговечность» и «качества»: 6 – 1 = 5. Я специально дотошно отношусь к приведению примеров, чтобы у вас не возникало лишних вопросов, читая мои рекомендации.

А теперь перейдем к правильному составлению поисковых запросов. Все или почти все знают, что такое слеш /. Так вот, если слеш присутствует в поисковом запросе и за ним указано целое число, то это значит, что расстояние между словами в искомом предложении не превышает этого числа. То есть, есть число и баста, другое не дано. А вот и сам пример поискового запроса

долговечность /3 автомобиля

означает, что расстояние между этими словами не превышает 3, и оба эти слова находятся в одном предложении.

Ну а если в искомом словосочетании вы точно знаете расстояние между словами, то в таком случае применяется команда для поисковой машины /+n, где n — определяет точное расстояние между искомыми словами. При помощи поискового запроса

долговечность /+2 автомобиля

поисковая система выдаст результаты, в которых эти слова будут находиться в одном предложении, а второе слово размещено через одно слово от первого.

И, конечно не забываем о нашем любимом, дорогом, неадекватном, зажравшемся по самые уши, но, тем не менее, поисковике «Яндексе». Те, кто пользуются этой поисковой системой, могут указывать в поисковом запросе не только лишь максимальное, но и допустимо минимальное расстояние между словами.

Для такого вида поискового запроса нужно использовать команду /(n m), где n — обозначает минимальное расстояние между словами, а m — максимальное.

Теперь рассмотрим пример. Поисковый запрос

долговечность /(2 6) автомобиля

означает, что искомые слова «долговечность» и «автомобиля» должны размещаться друг от дружки на расстоянии не меньше двух и не более шести слов.

А вот поисковый запрос

долговечность /(-3 5) автомобиля

означает, что слово «долговечность» должно находиться от слова «автомобиля» на расстоянии не превышая трех слов с левой стороны и пяти слов — с правой.

Также можно комбинировать команды поисковых запросов с учетом расстояния с другими командами поисковых запросов для нашего несравненно популярного и уважаемого «Яндекса».

И снова пример. Поисковый запрос

блог ~/+2 топ

дает команду поисковой машине совершить поиск предложений, которые содержат слово «блог», а через одно слово от него — «топ» вообще испариться и не будет присутствовать.

А если вам в голову придет светлая мысль составить поисковый запрос с учетом расстояния между словами не в пределах одного предложения, а в пределах целого абзаца, то следует применить принцип удвоения знаков.

Поисковый запрос

деловой &&/1 человек

предоставит вам возможность найти веб-страницы, которые содержат слова «деловой» и «человек» в одном и том же или же в соседних предложениях.

Вот такая заморочка с этими поисковиками. Поэтому и нарекают на «Яндекс», что он в выдаче поиска показывает разный хлам, но не то, что ищешь. А оказывается, что поиск в Интернете — это целая наука, которую нужно грызть как гранит и не сломать себе зубы.

Для большинства пользователей Интернета поисковые машины темный и дремучий лес. Поэтому их создатели стараются по умолчанию настроить поисковую машину так, чтобы любой идиотский поисковый запрос мог максимально попасть в результаты выдачи.

И вы думаете это все? Да какой там!? Подведу небольшую черту…

Итак, я очень кратко (краткость сестра таланта) :)))) изложил только маленькую часть того, что поможет вам значительно сэкономить время на поиски и получить от поиска максимальную отдачу. Для чего и для кого я это пишу? А для тех, кому это необходимо, для тех, кто часто пользуется поиском в Интернете. Все так просто.

С уважением, Вадим.

Язык поисковых систем
5 (100%) 2 голос[ов]

Читать меня:

Вадим

Автор блога Blog In Top.
Создатель и главный конструктор журнала «Авангард блогосферы».
По вопросам рекламы, участия в конкурсе на лучший блог, подачи заявок на интервью и др., обращаться к странице «Контакты».
Читать меня:

Комментарии

  • Спасибо за статью, полезная информация. Буду следовать Вашим рекомендациям. А вообще с поиском в яндексе постоянные проблемы. Сначала выскакивает не то, что нужно и чтобы добраться до нужной инфы, надо страниц пять -шесть пролистать.

    1+

    • Чтобы не выскакивало то, что не нужно, нужно уметь пользоваться поисковыми системами. И без разницы какая это система — Яндекс, Гугле, Бинг…. везде нужны знания и прямые руки 🙂

      1+

  • Я просто в восторге от Вашей статьи. Ни то чтобы материал был совсем новым, но тем не менее Вы открыли для меня и много нового. Огромное спасибо Вам за статью, искренне рад, что встретил Вашу статью. Думаю, что буду возвращаться к этой статье ещё ни раз. Искреннее моё спасибо!

    1+

    • Сергей, приходите, становитесь постоянным читателем, еще будет много интересных и полезных статей, я вам это обещаю 🙂

      1+

  • Полезнейшая статья, честно, все не запомню поэтому помещу в закладки. Сколько пользуюсь Интернетом и ни разу не применяла данные функции, а ведь поиск облегчается в разы. Очень рада что попала на вашу статью!

    1+

  • Автору большое спасибо, что собрал столь важную информацию в одной статье. Однозначно ставлю в закладки и признаюсь, что к своему стыду, не знал некоторые простые и очень полезные “фишки”, делал то же самое, но использовал гораздо больше операций.

    1+

  • Вот спасибо, Вадим! Добавил статью в закладки, буду изучать. Я-то просто пишу запрос, и поисковик мне выдает информацию, но далеко не всегда получаю то, что искал. Теперь выдача будет в разы точнее!

    1+

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *