Общая характеристика документальных ИС
Информационный запрос поисковый документальный Практика показывает, что чаще всего информация представлена не в виде структурированных массивов данных, а в виде простых текстовых документов. Вследствие этого наряду с фактографическими ИС получил развитие отдельный класс информационно-поисковых систем, которые были названы документальными или полнотекстовыми. Вообще термин «информационно-поисковые… Читать ещё >
Общая характеристика документальных ИС (реферат, курсовая, диплом, контрольная)
информационный запрос поисковый документальный Практика показывает, что чаще всего информация представлена не в виде структурированных массивов данных, а в виде простых текстовых документов. Вследствие этого наряду с фактографическими ИС получил развитие отдельный класс информационно-поисковых систем, которые были названы документальными или полнотекстовыми. Вообще термин «информационно-поисковые системы» (ИПС) в настоящее время связывают именно с документальными ИС, хотя, как уже говорилось, следует разделять ДИПС и ФИПС.
В отличие от традиционных БД, ориентированных на полное и точное представление данных достаточно простой смысловой структуры, документальные ИС ориентированы на частичное (приближенное) представление данных, имеющих значительно более сложную смысловую структуру — то есть представленных в форме текста.
Основная функция любой ДИПС — информационное обеспечение потребителей путем выдачи ответов на их запросы. Операция выдачи требуемых данных реализуется через проведение информационного поиска. В отличие от ФИПС, в результате проведения информационного поиска ДИПС выдает потребителю не конкретные сведения (факты), а совокупность документов, смысловое содержание которых соответствует его запросу. Процедура информационного поиска в системе проводится на основе поступившего от потребителя запроса на отыскание необходимой ему информации. Причиной запроса является наличие у пользователя некоторой информационной потребности. Фактически, информационный запрос можно рассматривать как частное значение информационной потребности в определенный момент времени, выраженное на естественном языке. При этом следует помнить, что запрос может быть неправильно сформулирован потребителем и не отражать его истинной информационной потребности в момент обращения к системе. Следовательно, при проведении информационного поиска в системе рассматривается не информационная потребность пользователя, а только информационный запрос, в ответ на который и выдаются те или иные документы системы. Для выражения данных отношений в теории ДИПС введены два фундаментальных понятия:
Определение 1. Под пертинентностъю понимается соответствие смыслового содержания документа информационной потребности потребителя. Документы, содержание которых удовлетворяет информационной потребности, называются пертинентными.
Определение 2. Под релевантностью понимается соответствие содержания документа сформулированному информационному запросу потребителя. Документы, содержание которых отвечает запросу потребителя, называются релевантными.
Различают смысловую и формальную релевантность. Смысловая релевантность характеризует соответствие смыслового содержания документа запросу. Очевидно, что определить степень смысловой релевантности под силу только человеку (и то не всегда и не всякому). Поэтому для автоматизации информационного поиска необходимо формализовать представление смыслового содержания информационного запроса и документов, то есть перейти от их записи на естественном языке — к записи на специальных, информационно-поисковых языках (ИПЯ). В результате этого для информационного запроса потребителя можно сформировать поисковый образ запроса (ПОЗ), а для каждого документа — поисковый образ документа. Таким образом, в процессе проведения информационного поиска в ДИПС определяется степень соответствия содержания документов и запроса пользователя путем сопоставления ПОД с ПОЗ и по результатам этого сопоставления принимается решение о выдаче документа (он признается релевантным) или его невыдаче (он считается нерелевантным). В данном случае релевантность выражает смысловую близость запроса и документа с точки зрения некоторых формализованных признаков, поэтому такая релевантность получила название формальной релевантности. Правила, по которым определяется степень смысловой близости между ПОД и ПОЗ называются критерием смыслового соответствия (КСС). Поисковый образ запроса (ПОЗ) в совокупности с правилами КСС образуют поисковое предписание (ПП), выполняя которое документальная ИС выдает потребителю некоторую совокупность документов.
Рис. 1. Общий принцип работы ДИПС