Начальная фаза обучения «Ребенка» естественному языку
Для описания местоположения и размеров объектов используется трехмерная система координат, изменяющихся от 0 до N по всем направлениям. Началу координат (0,0,0) соответствует левый нижний угол «сцены». Будем предполагать, что в нашем Мире объекты не вращаются и ориентированы в соответствии с координатными осями. Местоположение объекта задается координатами его переднего левого угла, а его РАЗМЕР… Читать ещё >
Начальная фаза обучения «Ребенка» естественному языку (реферат, курсовая, диплом, контрольная)
При разработке традиционных СЕЯ в них закладываются «врожденные» знания об языке и об окружающем мире. Так, например, при разработке системы ПОЭТ [Попов, 1982] была заложена следующая «врожденная» информация. Общие знания о грамматике ограниченного русского языка (в виде программ, осуществляющих морфологический и синтаксический анализы предложений); индивидуальные знания о морфологии и синтаксисе 10 000 слов (словосочетаний) русского языка. Кроме того абстрактные и конкретные знания об окружающем мире (2500 вершин семантической сети и более 250 000 фактов, хранимых в БД).
Основная цель данного исследования состоит в том, чтобы обучить Ребенка ограниченному русскому языку, максимально сократив количество «врожденных» знаний (о языке и окружающем мире), которые закладываются в модель при ее разработке.
Поскольку нас в данном исследовании, прежде всего, интересует обучение языку, мы приняли весьма упрощенную модель Мира [см. Winograd, 1972]. В нашем мире есть два участника диалога — Робот (по имени РЕБЕНОК) и человек (УЧИТЕЛЬ). РЕБЕНОК имеет руку и способен перемещаться в пространстве. Он способен рассматривать Мир и перемещать объекты. В мире существуют игрушки: кубики, пирамиды и шары. Им даны внутренние имена О1, О2, О3 и т. д. Объект описывается набором имен характеристик и их значениями, выраженными во внутреннем языке. Существуют следующие характеристики объектов: местоположение, цвет, размер, форма и т. п. Список характеристик и их значений объекта N может изменяться УЧИТЕЛЕМ.
В модели Мира кроме объектов представлены отношения и действия. В первую очередь определим семантику и внутренние имена пространственных отношений таких как: (т.е. СПРАВА), (СЗАДИ), (СВЕРХУ). Эти отношения определяются увеличением значений координат соответственно по осям X, Y и Z. Необходимость в представлении обратных отношений: (СЛЕВА), (ВПЕРЕДИ), (НИЖЕ) отсутствует, так как факт «О1 СЛЕВА от О2» можно представить в виде «О2 СПРАВА от О1» и т. п. Целесообразно ввести отношение ПОДДЕРЖИВАТЬ (служить опорой).
Для описания местоположения и размеров объектов используется трехмерная система координат, изменяющихся от 0 до N по всем направлениям. Началу координат (0,0,0) соответствует левый нижний угол «сцены». Будем предполагать, что в нашем Мире объекты не вращаются и ориентированы в соответствии с координатными осями. Местоположение объекта задается координатами его переднего левого угла, а его РАЗМЕР (длина, ширина и высота) — указанием трех его измерений. В рассматриваемом Мире определены (во внутреннем языке) три базовых действия: ДВИГАТЬСЯ В, СХВАТИТЬ, ОПУСТИТЬ. Эти команды адресуются РЕБЕНКУ.
Мы предполагаем, что РЕБЕНОК способен видеть. Поэтому он, просматривая модель Мира, получает полную информацию об объектах (местоположение, размеры, форма, цвет), выраженную во внутреннем языке.
В процессе обучения РЕБЕНКА языку сущностям Мира присваиваются внешние имена (т. е. слова или словосочетания русского языка, обозначающие эти сущности). Наша цель — показать, что для обучения естественному (русскому) языку РЕБЕНКУ не требуется владеть «врожденными» знаниями о языке и Мире. РЕБЕНКУ достаточно знать только состав и структуру этих знаний.
Процесс обучения РЕБЕНКА языку на начальной фазе протекает следующим образом. УЧИТЕЛЬ указывает РЕБЕНКУ на очередную сущность Мира и сообщает название этой сущности в виде слова (словосочетания) русского языка в именительном падеже. Заметим, что РЕБЕНОК такой лингвистической категорией как падеж не владеет. Затем УЧИТЕЛЬ приступает к обучению РЕБЕНКА тому, что каждое слово, обозначающее некоторую сущность, может находиться в нескольких формах. Например, стол, столом, столу и т. п. Будем предполагать, РЕБЕНОК пользуется простыми эвристиками (например, отождествляет различные словоформы одного слова по совпадению первых букв). Далее УЧИТЕЛЬ проверяет знания, полученные РЕБЕНКОМ. При этом УЧИТЕЛЬ указывает на некоторую сущность Мира и ждет, что РЕБЕНОК сообщит слово (словосочетание) русского языка, обозначающее эту сущность. РЕБЕНОК ожидает от УЧИТЕЛЯ подтверждение (+) или опровержение (-) данного им ответа. В случае опровержения ответа процесс обучения возобновляется.
В терминах лингвистики, не известных РЕБЕНКУ, успешное распознавание различных словоформ одного слова будет обозначать, что РЕБЕНОК освоил азы морфологии. На этом фаза начального обучения языку завершается.
Более детальное и углубленное описание процесса обучения РЕБЕНКА русскому языку возможно только после реализации и проведению экспериментов с моделью «Ребенок — Мир — Учитель «.