Информационные технологии
Одним из способов уменьшения семантического барьера
между человеком и компьютером заключается в поиске методов обработки
естественного языка. Сегодня уже очевидно, что для реализации общения с
компьютером на естественном языке, создания лингвистического обеспечения
информационных процессов необходимо изучить сам язык. К сожалению, природа
языка не всегда позволяет строить воспроизводящие модели всех его аспектов, так
как любой естественный язык не укладывается в рамках формальных грамматик.
Формальная модель языка предшествует созданию общей схемы модели: заранее
фиксируется, какого рода формальные объекты и действия над нами будут возможны
в модели. Такое ограничение в определенной мере неизбежно, поскольку без него
невозможна экспериментальная проверка модели. Однако формальные модели обычно
идут в этом отношении дальше, подчиняя единому плану не только технический
аппарат модели, но и моделируемый фрагмент реального языка.
С этой целью
разработана формальная модель узбекского языка. Разработка формальной модели
языка предполагается осуществить на базе концепций аксиоматических теорий
математической логики. Применительно к естественному языку в целом формализацию
не разрешима, потому что в любом естественном языке(узбекском,
русском, английском) большое множество слов и очень много вариантов структуры
предложений(разные виды простых и сложных предложений). Возможно лишь частичное
решения если рассматривать естественный язык не в целом, а его подмножество со
строгими определенными видами структуры предложений на ограниченным контексте(в частности рассматривается официально-деловой стиль), то
выполнима построения(синтез) и распознавания(анализ) предложений, удовлетворяющих
установленным требованиям. В связи с этим сделана попытка применения
аксиоматической теории к моделированию грамматики узбекского языка.
Аксиоматическая теория предварительно требует создания формальной теории, в
частности формальной теории грамматики узбекского языка. В работе в качестве
модели рассматриваются конструкции предложений узбекского языка. Разработанные
модели не выходят за рамки официально-делового стиля узбекского языка.
Аксиомы:
(изначальные правильные конструкции предложений)
подлежащее + {Æ, дополнение}+{Æ,обстоятельство}+ сказуемое
Правила
вывода - логические
операции, обеспечивающие переход от аксиом к тем допустимым в данной теории
утверждениям: теорем. В данном случае их 11.
Теоремы теории - описывающие основные конструкции
узбекского языка. Их в данной работе 52.
Утверждения - о непротиворечивости, неизбыточности,
полноты аксиоматической теории узбекского языка
Программная реализация - синтаксический анализатор.
Синтаксический
анализатор предложений узбекского языка предназначен для синтаксического
анализа простых, сложносочиненных и косвенных предложений и является
экспериментальной версией. Она не ориентирована на использование массовым
масштабом. Программа предназначена для анализа предложения
только с орфографически-правильными словами и где каждый члены предложения
состоят из одного слова. Программа сделана на языке Pascal, в среде программирования Borland Delphi.
-
все слова с указанием части речи(существительное,
прилагательное, местоимение, наречие, числительное, глагол и формы глагола);
-
синтаксическая роль в предложении (подлежащее, сказуемое,
дополнение, обстоятельство и определение);
-
все слова, с указанием
грамматических показателей (число, падеж, лицо, и другие);
-
тип предложения;
Формат результата работы анализатора:
- введенное предложение: некоторые служебные сообщения, если не
известное слово (программа предназначена для конкретной базы данных, которое
имеет возможность расширению, а при не обнаружения
слово из базы выводится сообщение о не существования данного слово в базе);
-результаты разбора предложения;
Примеры
анализа. Вводится предложение, конструкция, которой не выходит из рамки
формальной грамматики
Менинг акам шащар мактабида малакали ы=итувчи - Мой брат в городской школе квалифицированный преподаватель.
Результаты
анализа:
тип
предложения - распространенное предложение с определением;
члены
предложения:
менинг- мой: определение;
акам- брат: подлежащее;
шащар- в городской: определение;
мактабида- школе: обстоятельство;
малакали- квалифицированный :определение;
ы=итувчи- преподаватель: сказуемое
Примечание. Тезисы докладов публикуются в авторской редакции
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск