Конференции ИВТ СО РАН



VIII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям

27 - 29 ноября 2007 года, Новосибирск

Тезисы докладов


Информационные технологии

Разработка формальной модели грамматики узбекского языка и её программная реализация

Жураева Н.В.

Национальный Университет Узбекистана (Ташкент)

Одним из способов уменьшения семантического барьера между человеком и компьютером заключается в поиске методов обработки естественного языка. Сегодня уже очевидно, что для реализации общения с компьютером на естественном языке, создания лингвистического обеспечения информационных процессов необходимо изучить сам язык. К сожалению, природа языка не всегда позволяет строить воспроизводящие модели всех его аспектов, так как любой естественный язык не укладывается в рамках формальных грамматик. Формальная модель языка предшествует созданию общей схемы модели: заранее фиксируется, какого рода формальные объекты и действия над нами будут возможны в модели. Такое ограничение в определенной мере неизбежно, поскольку без него невозможна экспериментальная проверка модели. Однако формальные модели обычно идут в этом отношении дальше, подчиняя единому плану не только технический аппарат модели, но и моделируемый фрагмент реального языка.

 С этой целью разработана формальная модель узбекского языка. Разработка формальной модели языка предполагается осуществить на базе концепций аксиоматических теорий математической логики. Применительно к естественному языку в целом формализацию не разрешима, потому что в любом естественном языке(узбекском, русском, английском) большое множество слов и очень много вариантов структуры предложений(разные виды простых и сложных предложений). Возможно лишь частичное решения если рассматривать естественный язык не в целом, а его подмножество со строгими определенными видами структуры предложений на ограниченным контексте(в частности рассматривается официально-деловой стиль), то выполнима построения(синтез) и распознавания(анализ) предложений, удовлетворяющих установленным требованиям. В связи с этим сделана попытка применения аксиоматической теории к моделированию грамматики узбекского языка. Аксиоматическая теория предварительно требует создания формальной теории, в частности формальной теории грамматики узбекского языка. В работе в качестве модели рассматриваются конструкции предложений узбекского языка. Разработанные модели не выходят за рамки официально-делового стиля узбекского языка.

Аксиомы: (изначальные правильные конструкции предложений)

подлежащее + {Æ, дополнение}+{Æ,обстоятельство}+ сказуемое

Правила вывода - логические операции, обеспечивающие переход от аксиом к тем допустимым в данной теории утверждениям: теорем.  В данном случае их 11.

Теоремы теории - описывающие основные конструкции узбекского языка. Их в данной работе 52.

Утверждения - о непротиворечивости, неизбыточности, полноты аксиоматической теории узбекского языка

Программная реализация - синтаксический анализатор.

Синтаксический анализатор предложений узбекского языка предназначен для синтаксического анализа простых, сложносочиненных и косвенных предложений и является экспериментальной версией. Она не ориентирована на использование массовым масштабом. Программа предназначена для анализа предложения только с орфографически-правильными словами и где каждый члены предложения состоят из одного слова. Программа сделана на языке Pascal, в среде программирования Borland Delphi.

-    все слова с указанием части речи(существительное, прилагательное, местоимение, наречие, числительное, глагол и формы глагола);

-    синтаксическая роль в предложении (подлежащее, сказуемое, дополнение, обстоятельство и определение);

-    все слова,  с указанием грамматических показателей (число, падеж, лицо, и другие);

-    тип предложения;

Формат результата работы анализатора:

- введенное предложение: некоторые служебные сообщения, если не известное слово (программа предназначена для конкретной базы данных, которое имеет возможность расширению, а при не обнаружения слово из базы выводится сообщение о не существования данного слово в базе);

-результаты разбора предложения;

 Примеры анализа. Вводится предложение, конструкция, которой не выходит из рамки формальной грамматики

            Менинг акам шащар мактабида малакали ы=итувчи - Мой брат в городской школе квалифицированный преподаватель.

Результаты анализа:

тип предложения - распространенное предложение с определением;

члены предложения:

менинг- мой: определение;

акам- брат: подлежащее;

шащар- в городской: определение;

мактабида- школе: обстоятельство;

малакали- квалифицированный :определение;

ы=итувчи- преподаватель: сказуемое

Примечание. Тезисы докладов публикуются в авторской редакции



Ваши комментарии
Обратная связь
[ICT SBRAS]
[Головная страница]
[Конференции]

© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск