Применение шаблонов для автоматического анализа текста
Наложение лексико-семантических шаблонов и распознавание дискурсивных маркеров. Если в предложении встретилось слово, являющееся литералом некоторого шаблона, то происходит сопоставление предложения с этим шаблоном, при этом проверяются синтаксические условия для заполняемых мест шаблона. В случае успешного сопоставления происходит заполнение слотов шаблона (что фактически означает извлечение… Читать ещё >
Применение шаблонов для автоматического анализа текста (реферат, курсовая, диплом, контрольная)
Процедура автоматического анализа текста, последовательно обрабатывающая его предложения и использующая описанные выше словарные средства, включает среди прочих следующие шаги:
Выделение слов и словосочетаний общенаучной лексики. Например, во фрагменте «Таким образом, актуальной является задача разработки…» будут распознаны следующие общенаучные словосочетания: таким образом, являться актуальной задачей.
Наложение лексико-семантических шаблонов и распознавание дискурсивных маркеров. Если в предложении встретилось слово, являющееся литералом некоторого шаблона, то происходит сопоставление предложения с этим шаблоном, при этом проверяются синтаксические условия для заполняемых мест шаблона. В случае успешного сопоставления происходит заполнение слотов шаблона (что фактически означает извлечение из анализируемого предложения языковых конструкций).
При этом полный синтаксический разбор предложений не производится; в то же время при необходимости осуществляется проверка согласования и управления слов (например, согласование составляющих слов в употребленных словарных выражениях).
Рассмотрим шаблон:
«под» T V.
Ng.
Он описывает случаи вида.
«Под графемной конструкцией понимается графическая форма, построенная из базисных, проблемно-ориентированных и/или графических конструкций» и.
«Под данными при такой формализации понимаются последовательности символов (слова, предложения) в некоторых алфавитах».
В результате успешного сопоставления вышеописанного шаблона с первым из приведенных определений будет выделен новый термин графемная конструкция и определяющая его конструкция — см. Рисунок 1.
При сопоставлении шаблона со вторым из приведенных определений будет учтено, что в качестве заполнителя его слота T может быть взята расширенная именная группа (т.е. простая именная группа, за которой следует предложная именная группа, играющая роль обстоятельства), и в результате сопоставления будет правильно выделен новый термин данные и определяющая его конструкция.