Заказать курсовые, контрольные, рефераты...
Образовательные работы на заказ. Недорого!

Информационно-поисковый язык системы

РефератПомощь в написанииУзнать стоимостьмоей работы

Software that is used on Unix Platform будет преобразован в Unix AND Platform AND Software, что будет означать примерно следующее: «Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно». Возможны и варианты. Так, в большинстве систем фраза «Unix Platform» будет опознана как ключевая фраза и не будет разделяться на отдельные слова. Другой подход заключается… Читать ещё >

Информационно-поисковый язык системы (реферат, курсовая, диплом, контрольная)

Индекс — это только часть поискового аппарата, скрытая от пользователя. Второй частью этого аппарата является информационно-поисковый язык (ИПЯ), позволяющий сформулировать запрос к системе в простой и наглядной форме. Уже давно осталась позади романтика создания ИПЯ, как естественного языка, — именно этот подход использовался в системе Wais на первых стадиях ее реализации. Если даже пользователю предлагается вводить запросы на естественном языке, то это еще не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из которых удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR. Таким образом, запрос типа:

Software that is used on Unix Platform будет преобразован в Unix AND Platform AND Software, что будет означать примерно следующее: «Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно». Возможны и варианты. Так, в большинстве систем фраза «Unix Platform» будет опознана как ключевая фраза и не будет разделяться на отдельные слова. Другой подход заключается в вычислении степени близости между запросом и документом. Именно этот подход используется в Lycos. В этом случае в соответствии с векторной моделью представления документов и запросов вычисляется их мера близости. Сегодня известно около дюжины различных мер близости. Наиболее часто применяется косинус угла между поисковым образом документа и запросом пользователя. Обычно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.

Наиболее развитым языком запросов из современных ИПС Internet обладает Alta Vista. Кроме обычного набора AND, OR, NOT эта система позволяет использовать еще и NEAR, позволяющий организовать контекстный поиск. Все документ в системе разбиты на поля, поэтому в запросе можно указать, в какой части документа пользователь надеется увидеть ключевое слово: ссылка, заглавие, аннотация и т. п. Можно также задавать поле ранжирования выдачи и критерий близости документов запросу.

Теория информационного поиска начиналась с исследования особенностей документальных информационно-поисковыхсистем (ИПС). Под информационным поиском в таких системах понимается некоторая последовательность операций, выполняемых с целью отыскания документов (статей, научно-технических отчетов, описаний к авторским свидетельствам и патентам, книг и т. д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.

Массив элементов информации, в котором производится информационный поиск, называется поисковым массивом. Существующие виды информационного обслуживания представлены в таблице.

Признак классификации.

Вид обслуживания.

По источнику инициативы.

принудительное;

по запросам потребителей.

По типам документов.

обслуживание опубликованными документами и/или их копиями;

обслуживание копиями неопубликованных документов (отчетов по НИР, диссертаций, переводов и т. п.).

По направленности или адресности.

информационные издания (много адресов);

избирательное распределение информации (один адрес).

По периодичности или срочности.

текущее оповещение;

ретроспективный поиск.

По способу доведения документов до потребителя.

непосредственная передача документов или их копий потребителям;

двухступенчатое обслуживание (вначале информационное издание, а затем — копии заинтересовавших потребителя документов.

Показать весь текст
Заполнить форму текущей работой