Основы поиска информации в Интернете
Самый простой, распространенный и, в тоже время, наименее эффективный способ поиска – набор фразы, в том виде, как она должна примерно выглядеть или набора слов, которые по Вашему мнению должны присутствовать в подобных работах. Статистика показывает, что успешность подобного рода поиска составляет в среднем для гуманитарных элементов около 10%. В тоже время, если абсолютно точно известна техническая марка, эффективность даже такого простого варианта поиска может достигать почти 70%. Отсюда уже сразу напрашивается вывод, что и подобным простейшими вариантами не стоит пренебрегать, особенно если речь идёт о поиске известных технических элементов, марок, конструкций.
Поиск в компьютерных сетях становится искусством и требует вполне определённых знаний, которыми современному человеку необходимо овладеть.
Причины, по которым документ не может быть обнаружен
Прежде всего, требуемое не будет обнаружено поисковой машиной, если на ней данные ресурсы не прописаны.
Запомните! Не достаточно разместить, что-либо в Интернете. Необходимо прописать это на соответствующих поисковых машинах. Можно расположить материал в Интернете, знать его адрес. Однако, пока он не «прописан» на одной из поисковых машин, найти его стороннему человеку будет очень сложно, конечно если ему не дан адрес или DNS. Через некоторое время и этот сайт будет обнаружен так называемыми «поисковыми роботами» или «пауками-поисковиками» и, только тогда, возможно, он начнёт посещаться.
Задача поиска
Перед тем, как начать поиск прежде всего следует четко сформулировать задачу. До тех пор, пока этот момент не отработан об успешности, а тем более оптимизации поиска, не может быть и речи. Объем информации в Интернете слишком велик, и как нигде здесь верна поговорка «Время - деньги». Поэтому в нём нельзя искать по принципу «Пойди туда, не знаю куда. Возьми то, не знаю что». Иначе результат будет плачевный. На этом моменте обязательно следует остановиться и обратить на него внимание учащихся. Возможно, стоит предварительно попрактиковаться с ними на нескольких примерах и определить таким образом насколько он подготовлены к поиску.
Язык поисковых запросов
Поисковый запрос может состоять из одного или нескольких слов, в нем могут присутствовать различные знаки препинания. Составлять самые простые запросы можно и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова, да ещё и если они находятся на строго ограниченном расстоянии друг от друга. Такой поиск с довольно большой вероятностью закончится отрицательным результатом. И здесь о понятии успешности не может быть и речи. Знание и правильное применение языка запросов поисковой машины поможет сделать Ваш поиск быстрым и эффективным.
Скобки
При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Как правило, в большинстве поисковых машин используют только скобки вида ( ).
Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются все правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.
Кавычки
Для поиска цитат можно использовать типовые (двойные) кавычки, вида « или “. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том виде и в том порядке, как они были заданы Вами в запросе. Это весьма эффективный способ поиска. Его применение обеспечивает успешность более 60%. Здесь важно учитывать только два момента:
первое – цитирование должно быть точным; поскольку уже сама форма запроса требует искать «как есть», т.е. без изменения по падежам, числам и лицам;
второе – материал, который Вы ищите, как минимум должен быть в Интернете.
Запомните, если при такой форме поиска будет допущена грамматическая ошибка, поиск даст отрицательный результат.
Применение языка запросов
Каждый запрос, адресованный поисковой машине, обрабатывается в соответствии с правилами языка запросов. Некоторые слова и символы трактуются как операторы языка запросов и обрабатываются специальным образом. Фактически, языком запросов описывается некая формула, которая используется при поиске - каждый из документов "сопоставляется" с ней, и результатом поиска являются только те документы, которые ей удовлетворяют.
Например, запросу самолет удовлетворяют все документы, в которых хотя бы раз встретилось слово 'самолет' в любом падеже, включая как единственное, так и множественное число: самолёт, самолеты, самолету, самолетом, самолете, самолетах, самолётам и т.п. Запросу, состоящему из нескольких слов, удовлетворяют документы, содержащие каждое из этих слов в любой форме (при некоторых условиях). Вопрос соответствия документа более сложному запросу определяется логикой операторов и конструкций запроса.
При этом, в поисковую строку Вами вводятся, как считают ключевые слова. Строго говоря - это не совсем так. Следует отличать поиск действительно по ключевым словам, указанным как таковые на данном документе в Интернете (вариант используется в расширенном поиске). Это делается в помощью специальных мета-определителей в головной части описания гипертекстового документа. Согласитесь, то что Вы считаете ключевым словом совсем не обязательно должно быть описано автором работы как таковое. В этой связи, правильнее будет назвать подобное - словами, которые по Вашему мнению, обязательно должны быть в требуемых материалах.
Морфология языка запросов
По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего языка. Поисковая машина «понимает» и «различает» слова русского и английского языков - по умолчанию. Поиск ведется, с учетом изменения по склонению, спряжению, числу и лицу, т.е. по всем формам слова; включая даже совпадающие по смысловому значению.
Стоп - слова
Некоторые слова и символы по умолчанию исключаются из запроса в связи с их малой информативностью. Это так называемые стоп - слова - самые частотные слова русского и английского языков, например, предлоги, частицы и артикли. Очень часто опускаются апострофы и тире. Большинство поисковых машин их знают и сами освобождают от них сформулированный Вами запрос. Это связано с тем, что факт присутствия этих слов может заметно замедлить поиск и отрицательно повлиять на его результат и полноту, а, в конечном итоге, и успешность. В тоже время есть возможность обозначить необходимость этих слов в запросе. Для этого, как мы уже знаем, следует взять запрос в двойные кавычки или воспользовавшись поиском точной фразы в расширенном поиске.
Ограничение расстояния
Если запрос составлен из нескольких слов без применения операторов и конструкций языка запросов, то машина будет пытаться найти документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда вводится так называемое ограничение контекста - положительное число. По умолчанию принимается расстояние равное 40 словам. Документ, в котором встретились все слова запроса, будет выдан только в том случае, если расстояние между словами запроса будет меньше этого числа. Например, по запросу российская армия будут найдены те документы, в которых слова российская и армия хотя бы один раз встретятся на расстоянии менее чем в 40 слов друг от друга. Причем, чем ближе они друг к другу окажутся – тем выше будет и уровень их соответствия запросу
|