Изучение научного наследия А.А. Ляпунова в области машинного перевода и математической лингвистики как элемент формирования информационной культуры студентов-гуманитариев

Токарева О.В.
Барнаульский государственный педагогический университет, Барнаул

В 1967 г. в книге Дм. Жукова "Переводчик, историк, поэт? Слово тебе, машина!" была напечатана фраза, которая как нельзя лучше подходит к содержанию настоящего доклада: "Электронные вычислительные машины навеки остались бы усовершенствованными счетами, если бы их не научили... языку". Эта фраза, на наш взгляд, и сегодня является ключевой к современным разработкам в области информатики и информационных технологий, когда на первый план выходят проблемы взаимодействия человека и компьютера.

Человечество вступило в третье тысячелетие - эру информатизации и компьютеризации, которая коснулась всех сфер человеческой деятельности, в том числе образования. С целью формирования информационной культуры подрастающего поколения в учебные планы средней и высшей школ введен предмет "Информатика" и утвержден примерный перечень изучаемых разделов.

В высшей школе изучение информатики предусмотрено не только для студентов естественнонаучных и технических направлений и специальностей, но и для гуманитарных, таких как филология, философия, лингвистика, история, юриспруденция и др. А поскольку в основе информационных технологий лежит математический аппарат, для студентов этих направлений введена комплексная дисциплина "Математика и информатика". Ее изучение направлено на формирование общего научного мировоззрения, целостного представления об основных этапах становления современной математики и информатики и их структуре, об основных понятиях и методах, о роли и месте этих наук в условиях становления информационного общества.

Жизнь и работа в таком обществе требует от человека наличия не просто компьютерной грамотности, а информационной культуры, которая включает в себя различные аспекты знания, умений, навыков работы с накопленными обществом информационными ресурсами.

Важным элементом информационной культуры является изучение истории информатики. Данному вопросу обычно уделяется мало внимания, во-первых, из-за ограниченности учебного времени, во-вторых, в связи с недостаточной проработанностью этой темы в учебных пособиях, в-третьих, из-за слабой подготовки в области истории науки самих преподавателей информатики. Первоначально в учебниках вообще не рассматривался раздел, посвященный истории информатики, а в учебниках последних лет как правило приводится эволюция вычислительной техники, что мало интересует будущих гуманитариев.

На занятиях по информатике на факультете иностранных языков Барнаульского государственного педагогического университета мы стараемся обращать внимание не столько на этапы развития технических средств, сколько на технологии, обусловленные возможностями этих средств, рассматриваем историю зарождения предшественницы информатики - кибернетики, драматизм ее развития в нашей стране, вклад зарубежных и отечественных ученых в становление и развитие кибернетики, информатики и компьютерных технологий. В этой связи хотелось бы отметить труды новосибирских ученых, академика РАЕН Д.А. Поспелова, профессора Я.И. Фета и др., благодаря которым пролит свет на многие события, связанные с рождением информатики в нашей стране, названы имена ученых, внесших весомый вклад в становление этой науки.

Я.И. Фет в статье "История информатики: исследования, публикации, преподавание" [5] указывает два способа преподавания истории информатики:

  1. систематическое соединение исторических сведений с разделами основного курса;
  2. введение специального курса по истории информатики.

Нам кажется, что оба эти способа могут быть реализованы. Второй хорош для студентов естественных и технических специальностей, для которых на информатику отводится больше часов. Для гуманитариев предпочтительней первый подход, т.е. включение исторических сведений в общий курс.

Обычно у студентов вызывают особый интерес исторические факты, связанные с их будущей профессиональной сферой. Так, студентам-лингвистам важно знать, что развитие кибернетики уже в первые годы затрагивало область лингвистики. Это создание искусственных языков (машинных и алгоритмических языков программирования, позднее языков интерфейсов) и машинный перевод (МП).

Поэтому в курс информатики для студентов факультета иностранных языков мы обязательно включаем тему "Эволюция языков программирования и технологий программирования", особое внимание уделяя способам и формам представления команд в языках различного уровня. Говоря о развитии языков программирования, нельзя не упомянуть имя А.А. Ляпунова как создателя операторного метода, положенного в основу будущих алгоритмических языков высокого уровня.

Языками программирования не ограничивается лингвистическое обеспечение современных ЭВМ,которое включает в себя также языки интерфейсов программных пакетов, операционных систем, языки управления заданиями, сетевые языки и др. Современный пользователь-гуманитарий должен владеть такими языками, даже не умея программировать.

Машинный перевод, компьютерное обучение языкам мы включили в раздел "Технологии обработки текстовой информации".

Машинный перевод относится к первым компьютерным технологиям. Тогда он назывался автоматический перевод. Действительно, перевод текстов с одного языка на другой представляет собой достаточно трудоемкий процесс, который необходимо автоматизировать. И это понимали ученые еще до создания ЭВМ. С появлением же первых компьютеров идея МП могла реализоваться на качественно новом уровне.

В 1947 г. профессор математики Массачусетского технологического института Н. Винер, основатель кибернетики, получил письмо от члена Американской национальной академии наук Уоррена Уивера, в котором была поставлена проблема перевода как принципа межнационального общения и предложено использовать электронные счетные машины, которые к этому времени появились. Винер, полиглот, владевший 13 языками, специалист по вычислительным машинам, представлял, насколько сложна данная проблема. Он ответил, что механизация языка преждевременна.

Тем не менее Уивер обратился к ученым из Лондонского университета, а в 1949 г. написал знаменитый меморандум "Перевод", в котором изложил свои соображения и разослал 200 знакомым специалистам в различных областях знаний. Так была провозглашена идея перевода с одного языка на другой с помощью ЭВМ.

Первая реализация МП была осуществлена 7 января 1954 г. в нью-йоркской конторе фирмы IBM на электронной счетной машине IBM-701. Это событие вошло в историю информатики как "Джорджтаунский эксперимент". Для перевода 60 несложных предложений с русского языка на английский были составлены словарь из 250 слов, 6 правил перевода и специальная программа. Примеры переведенных предложений: "Обработка повышает качество нефти", "Международное понимание является важным фактором в решении политических вопросов". Начало было положено, хотя до практического использования МП было еще очень далеко: профессиональные переводчики утверждают, что перевод научных текстов осуществить гораздо легче, чем литературную и разговорную речь, изобилующую сокращениями и сленгом.

Джорджтаунский эксперимент дал основание для разработок в области МП в нашей стране. К 1954 г. в Советском Союзе уже сложилась группа ученых, занимавшихся созданием первых ЭЦВМ, изучавших проблемы кибернетики, зарождалось поколение новых специалистов - программистов.

В этой связи нельзя не упомянуть имя Алексея Андреевича Ляпунова, который был одним из основателей кибернетики в нашей стране. Он считал, что за вычислительными машинами - будущее. А.А. Ляпунов в тот период много сделал для реабилитации кибернетики и ее дальнейшего развития, для применения принципов кибернетики и моделирования в биологии и лингвистике. Заслуга А.А. Ляпунова в том, что он видел дальше многих. Уже в те годы ставились вопросы о развитии логики, о параллельной вычислительной технике. Актуальными оставались вопросы: Что может машина? Может ли машина творить? В чем интеллектуализация машин?

В заключительном слове после обсуждения доклада "Об использовании математических машин в логических целях" на заседании методологического семинара Энергетического института АН СССР (24 июня 1954 г.) А.А. Ляпунов высказал мысль, что в будущем развитии машин перспективным является их использование как "подсобного средства мышления", и это будет иметь большее значение, чем непосредственное вычисление. Уже в те годы Алексей Андреевич задумывался, "как создать достаточно сложный логический механизм, чтобы он вел себя, как искусственный интеллект".

А.А. Ляпунов, обладая широким научным кругозором, выделял среди прикладных применений ЭВМ проблему машинного перевода. "Перевод текстов с одних языков на другие имеет большое значение для развития культуры и является необходимым звеном в обмене культурными ценностями, созданными различными народами" [2, с. 107-111]. А поскольку на перевод текстов затрачивается огромный труд, то А.А. Ляпунов считал назревшим "вопрос об автоматизации и механизации процесса перевода. В последнее время для механизации перевода открылись большие возможности, связанные с созданием автоматических электронных вычислительных машин" [2, c. 175].

Проблема МП оказалась достаточно сложной. "Для того, чтобы заставить машину переводить текст с одного языка на другой, нужно: 1) выработать систему правил, употребление которых в сочетании со специальным словарем позволит механически переводить текст; 2) записать эти правила, а также словарь на языке машины, т.е. составить программу, реализующую эти правила. Программа и словарь кодируются специальным образом и вводятся в машину. После этого машина подготовлена к переводу" [2, c. 176].

Ляпунов считал, что для успешного решения данных задач "необходимы совместные усилия как математиков, так и лингвистов, поскольку МП требует нового подхода к изучению языков и взаимоотношений между способами выражения одной и той же мысли на разных языках" [2, c. 176]. Так, первые опыты в Советском Союзе были предприняты математиками, специалистами по ЭВМ Л.Н. Королевым, С.А. Лебедевым, И.С. Мухиным, Д.Ю. Пановым, С.Н. Разумовским и лингвистом И.К. Бельской. В конце 1955 г. в результате их разработок был осуществлен перевод с английского языка при помощи БЭСМ отрывков из книги Милна "Численное решение дифференциальных уравнений".

Вскоре в Математическом институте АН СССР на ЭЦВМ "Стрела" под руководством О.С. Кулагиной, ученицы А.А. Ляпунова, был сделан еще один опытный перевод научного текста с французского языка на русский.

Эти два события имели большое значение для дальнейших разработок в области МП. В СССР им начали заниматься многие группы и лаборатории, так же как и в других странах: США, Мексике, Японии, Китае и т.д. Были проведены научные конференции, посвященные вопросам машинного перевода, опубликованы научные труды.

Об интересе к проблеме и размахе исследований говорит следующий факт. В 1967 г. в Москве под грифом Государственного комитета по науке и технике Совета министров СССР, Академии наук СССР, Всесоюзного института научной и технической информации, Института языкознания был издан критико-библиографический справочник [4], в котором были собраны практически все изданные за 15 лет (с 1949 по 1963 гг.) советские и зарубежные работы по вопросам автоматического перевода и смежные с ним. Всего приведено 1430 публикаций, затрагивающих вопросы истории автоматического перевода и его проблем, математической лингвистики, алгоритмизации, анализа языка и проблем обучения. А в числе языков, для которых были составлены программы перевода, упоминаются английский, французский, итальянский, турецкий, чешский, вьетнамский - всего 29 национальных языков.

Многие публикации принадлежат А.А. Ляпунову, его сподвижникам и ученикам. В них даются общие характеристики технических, математических, лингвистических проблем МП, обсуждаются вопросы создания языка-посредника. МП рассматривается как первый этап в решении более общей задачи - "обучения" машины языку. Предполагается создать универсальный алгоритм МП, способный "обучить" машину самым общим принципам перевода и "научить" ее самостоятельно применять эти принципы в конкретных случаях. Сообщается о разработке: 1) бинарных алгоритмов: французско-русском, англо-русском и венгерско-русском; 2) системы операторной записи алгоритмов; 3) формально-грамматической абстрактной системы, представляющей собой модель языка. Нельзя не отметить при этом большой вклад в практическую деятельность по МП ученицы Ляпунова О.С. Кулагиной.

Исследования подняли следующие основные проблемы:

  1. Построение строго формальной системы для описания существующих языков.
  2. Разработку алгоритмов для перевода.
  3. Разработку принципов программирования этих алгоритмов и кодирования
    материала в памяти машины.

Кроме того, возникли вопросы автоматизации ввода текста, проверки правописания, поиска эквивалентных слов в словаре, контекстного перевода, грамматического и семантического анализа текста. Проблемы МП оказались гораздо сложнее, а техническая база существующих ЭВМ не позволяла успешно решать их. И за рубежом, и в СССР наступает период спада энтузиазма. В 1959 г. философ И. Бар-Хиллел в статье "Будущее машинного перевода" выразил сомнение в том, что решение задачи полностью адекватного перевода вообще возможно средствами искусственного интеллекта. С начала шестидесятых годов в США уменьшается государственное финансирование программ по автоматизации перевода, а после опубликования американской Академией наук специального доклада, указывавшего на неэффективность разработанных к тому времени машинных методов для перевода научно-технических текстов и бесперспективность кардинального усовершенствования этих методов, многие проекты МП были вообще свернуты.

Новый период возрождения интереса к переводу в США приходится на семидесятые годы. NASA взяли на вооружение созданную на основе джорджтаунских разработок систему русско-английского автоматизированного перевода Systran. Пан-американская организация здравоохранения разработала свой эффективный вариант электронного переводчика для предварительного перевода медицинской документации. По заказу военно-воздушных сил США разработана система быстрого перевода метеорологических прогнозов. Хорошие результаты были достигнуты также в Японии.

Так, чередуясь взлетами и падениями интереса, развивалась идея МП. Юрий Николаевич Марчук, который много занимался историей и современным состоянием МП, выделяет следующие периоды [3, с. 19-22]:

1946-1957 гг. В этот период появилась сама идея. Работы велись с большим энтузиазмом. Ближайшие перспективы МП оценивались весьма оптимистично, что было связано с недопониманием перспектив развития самих ЭВМ, и не ясны были границы формализации такого сложного феномена, как естественный язык;

1957-1967 гг. Наиболее плодотворный, хотя и закончился некоторым "отходом" от задачи МП. В этот период много внимания уделялось созданию языка-посредника, эта идея не имела большого практического значения, но стимулировала разработку теоретических представлений о методах и средствах анализа и синтеза;

с 1967 г. Характеризуется возникновением нового статуса МП.

Говоря о состоянии МП в девяностые годы, Ю.Н. Марчук считает центром исследований моделирование действий человека-переводчика: "МП, возникший вне лингвистики, вошел в нее именно благодаря аспекту моделирования. Это сыграло большую роль в создании новых областей языкознания, таких как вычислительная лингвистика, инженерная лингвистика, теория математической лингвистики, количественная и статистическая лингвистика и др." [3, с. 13].

Сегодня любой школьник знает о программах-переводчиках, пользователи ПК стараются обязательно установить на свой компьютер хотя бы одну такую программу. Речь не идет о достижении идеального совершенства при переводе - машинный перевод быстрее и дешевле традиционного, он незаменим, когда важно понять смысл иностранного текста. Впрочем, алгоритмы перевода постоянно совершенствуются.

Значение МП велико для различных областей человеческой деятельности. В социальном плане перевод убирает межъязыковые барьеры, в то же время сохраняя само многообразие национальных языков. В научном плане МП интересен для реализации многих идей в области искусственного интеллекта. Большое значение имеет МП для коммерции, являясь инструментом развития международной торговли. Использование Интернет-технологий дало новые аспекты применения МП: электронная коммерция, реклама, быстрый перевод информации на иноязычных web-сайтах, и т.п. В июле 2001 г. российские компании Яндекс и ABBYY Software House запустили совместный Интернет-проект электронного on-line словаря Яндекс.Lingvo, которым может воспользоваться любой пользователь Интернет для online-перевода слов или словосочетаний с английского или на английский язык. Причем используется не только словарь общей лексики, но и экономический, научно-технический, по вычислительной технике и программированию, словарь синонимов.

Благодаря МП на стыке лингвистики, математики и кибернетики возникли новые отрасли науки - математическая лингвистика, прикладная или компьютерная лингвистика. Они изучают все аспекты взаимодействия человека с машинной средой (языки программирования и языки взаимодействия человека с компьютером), технологии работы с текстовой информацией (создание и редактирование текстовых документов, распознавание текста и устной речи, проверка правописания, машинный перевод с одного языка на другой). В свое время А.А. Ляпунов писал, что "проблематика МП как такового не покрывается и не совпадает ни с проблематикой одной только лингвистики, ни с проблематикой одной только кибернетики" [1, с. 67-94]. Далее он отмечал, что плодотворность разработок в области МП зависит от использования как лингвистических, так и математико-кибернетических методов, а это нередко привод к постановке новых задач, относящихся опять же как к той, так и к другой науке. Так например, более детально, чем раньше, пришлось разработать классификацию слов, возникло понятие грамматических конфигураций, которое устанавливает элементарные структурные соотношения между словами или представителями определенных классов и т.д.

Развивая свои мысли в области применения МП, Ляпунов предполагал, что начнется воздействие МП на естественные языки, поскольку авторы текстов, заинтересованные в их более широком и быстром распространении, будут приспосабливать свой язык к МП. Правда, Ляпунов считал, что это вопросы далекого будущего.

Сегодня развитие технологий в области компьютерной лингвистики идет в двух направлениях:

1. Системы искусственного интеллекта - это дальнейшее развитие кибернетики (МП, распознавание текста и речи, проверка правописания).

Проблема МП решается на уровне семантической адекватности переведенного текста. До сих пор еще полностью не решена проблема распознавания на уровне выполнения интеллектуализации функций человеком. В процессе совершенствования находятся технологии распознавания рукописного текста и слитной устной речи.

2. Интеллектуализация интерфейса пользователя (разработка средств диалога на естественном языке, речевой ввод, средства распознавания образов).

Графический объектно-ориентированный интерфейс - частичное решение проблемы межъязыкового общения. Эта технология многими считается более перспективной, чем использование естественных языков, а еще более перспективным представляется использование комбинированных интерфейсов.

Язык - незаменимый помощник человека как в мыслительной деятельности, в организации памяти, в коммуникации, так и в процессе взаимодействия человек-компьютер. Моделирование языков (естественных и искусственных) относится к проблеме моделирования способностей человека. Здесь широка сфера применения компьютерной лингвистики, основы которой были заложены еще в 50-е гг. XX в., и большая заслуга в этом принадлежит Алексею Андреевичу Ляпунову и его ученикам.

Изучение научного наследия в области МП и математической лингвистики позволит студентам-гуманитариям лучше представить современное состояние указанных технологий, а также повысить уровень своей информационной культуры.


Литература

1
Ляпунов А.А. О некоторых методологических вопросах, относящихся к машинному переводу. В кн.: О некоторых вопросах теоретической кибернетики и алгоритмах программирования. Новосибирск, 1971. (Совместно с Г.П. Багриновской и О.С. Кулагиной).

2
Ляпунов А.А. Основные проблемы машинного перевода // Вопросы языкознания, 1956, № 5. (Совместно с П.С. Кузнецовым и А.А. Реформатским). Вкл. в сб.: Ляпунов А.А. Проблемы теоретической и прикладной кибернетики. М.: Наука, 1980.

3
Марчук Ю.Н. Проблемы машинного перевода. М.: Наука, 1983.

4
Мельчук И.А., Равич Р.Д. Автоматический перевод 1949-1963. Критико-библиографический справочник. М., 1967.

5
Фет Я.И. История информатики: исследования, публикации, преподавание. http://newasp.omskreg.ru/intellect/f28.htm



Ваши комментарии
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2001, Сибирское отделение Российской академии наук, Новосибирск
© 2001, Объединенный институт информатики СО РАН, Новосибирск
© 2001, Институт вычислительных технологий СО РАН, Новосибирск
© 2001, Институт систем информатики СО РАН, Новосибирск
© 2001, Институт математики СО РАН, Новосибирск
© 2001, Институт цитологии и генетики СО РАН, Новосибирск
© 2001, Институт вычислительной математики и математической геофизики СО РАН, Новосибирск
© 2001, Новосибирский государственный университет
Дата последней модификации Wednesday, 10-Oct-2001 17:20:27 NOVST