Заказать курсовые, контрольные, рефераты...
Образовательные работы на заказ. Недорого!

Введение. 
Лингвистическая онтология по естественным наукам и технологиям: основные принципы разработки и текущее состояние

РефератПомощь в написанииУзнать стоимостьмоей работы

В то же время подробность и строгость описания предметной области в информационно-поисковых тезаурусах, которые являлись традиционными средствами тематического поиска научной информации в течение многих лет, является недостаточной для их эффективного использования в автоматический режимах обработки текстовой информации для информационно-поисковых приложений,. Представляется, что невозможно… Читать ещё >

Введение. Лингвистическая онтология по естественным наукам и технологиям: основные принципы разработки и текущее состояние (реферат, курсовая, диплом, контрольная)

Одним из важных элементов концепции семантической сети (Semantic Web) является разработка онтологий, на основе которых поиск информации в сети Интернет должен стать более содержательным.

Онтологии представляют собой достаточно широкое понятие, включающее таксономии, тезаурусы, фундаментальные онтологии (аксиоматизированные теории) [Guarino, 1998]. Фундаментальные онтологии описывают предметную область максимально полно, безотносительно к приложениям и обычно с максимальной степенью формализации. Прикладные онтологии (application ontologies), которые также называются «легкими» онтологиями (lightweight ontologies), формализуются настолько, насколько это необходимо для приложения.

Представляется, что невозможно создать фундаментальные онтологии для таких сфер деятельности как естественные науки: физика, химия, геология в силу существования различных теорий и постоянного изменения трактовки самых базовых понятий.

В то же время подробность и строгость описания предметной области в информационно-поисковых тезаурусах [Шемакин, 1974], [NASA Thesaurus, 1988], которые являлись традиционными средствами тематического поиска научной информации в течение многих лет, является недостаточной для их эффективного использования в автоматический режимах обработки текстовой информации для информационно-поисковых приложений [Salton, 1989], [Voorhees, 1999].

Возникает вопрос, какова же должна быть степень формализации предметной области, структура онтологии, чтобы:

  • · с одной стороны, эту онтологию можно было создать в разумные сроки (2−3 года) относительно небольшим коллективом и начать широко использовать в прикладных задачах;
  • · с другой стороны, чтобы степень формализации понятийной структуры предметной области обеспечивала возможность содержательного информационного поиска в автоматических режимах.

Существенной особенностью онтологии, предназначенной для поддержки решения задач информационного поиска, является то, что понятия таких онтологий должны быть аккуратно связаны со значениями терминов предметной области. Такого рода онтологии называются лингвистическими онтологиями: главной характеристикой лингвистических онтологий является то, что их единицы связаны со значениями («are bound to the semantics») языковых выражений (слов, именных групп и т. п.) [Gomez-Perez et.al., 2000]. В качестве примера лингвистической онтологии приводится обычно ресурс WordNet [Miller et.al., 1990].

Коллектив авторов в 2004 году начал работу над созданием лингвистической онтологии для автоматической обработки текстов в области естественных наук.

В статье описывается идея, методология и текущее состояние проекта. В первом разделе мы описываем основные принципы проекта создания лингвистической онтологии для естественных наук. В следующем разделе описывается ранее разработанная авторами онтология — Общественно-политический тезаурус, на основе методологии которой создается и новая лингвистическая онтология. В разделах 3 и 4 излагаются этапы построения онтологии, приводятся данные о текущем состоянии ресурса. В разделе 5 описывается процедура тестирования онтологии.

Показать весь текст
Заполнить форму текущей работой