Создание гипертекстовых страниц


Краткое содержание доклада, прочитанного на международном совещании по электронным публикациям El-Pub96.

Содержание

Язык HTML

Простейшие гипертекстовые страницы, подготовленные для WWW сервера, представляют простой текстовый файл ASCII, в который вставлены команды разметки (тэги). По структуре язык HTML, используемый для подготовки гипертекстовых страниц, очень напоминает известный в среде математиков текстовый процессор Д.Кнута \ТеХ. Тот же принцип выделения шрифтов, размещения текста, перечислений и списков.

В этом отношении подготовка страниц для WWW сервера не требует никакой специальной техники и специального математического обеспечения. Гипертекстовые документы можно создавать под управлением любой операционной системы, используя любой текстовый редактор, например, VI в UNIX'е или Notepad (Блокнот) в MS Windows.

Для удобства пользователей Новосибирского Академгородка мы перенесли ряд известных руководств по созданию простейших HTML страниц на наш сервер.

Начальные руководства по HTML или как создавать простейшие WWW страницы.

Ниже приведены ссылки на WWW-документы, из которых Вы получите более полную информацию о языке HTML и о формировании гипертекстовых страниц.

[В начало документа]

Специализированные редакторы HTML

Под специализированным редактором понимается редактор, автоматизирующий в каком-либо смысле работу пользователя. Так как и для \ТеХ'а пока не существует редактора HTML, позволяющего формировать страницы, подобно тому как мы это делаем, используя текстовый процессор MS Word for Windows, т.е. полный WYSIWYG. Большинство редакторов предоставляют некоторый набор макросов, позволяющих помимо набора текста, автоматизировать расстановку тэгов HTML.

Более того, используя автоматизированный набор HTML, трудно создать "хорошую" страницу -- язык HTML в этом смысле подобен TeX'у: не существует ни одного специализированного редактора, который бы позволил сделать высококачественную страницу наборщику, который не знает команд разметки гипертекста.

Большинство редакторов можно получить через Интернет (как коммерческих на пробу сроком 30 дней, так и свободно распространяемых). Ознакомиться с ними можно на сервере TUCOWS, зеркало которого расположено в центре управления сети Новосибирского научного центра (на сервере NSC.RU). Получить некоммерческие редакторы можно также с зеркала сервера TUCOWS, нажав кнопку DOWNLOAD в описании редактора.

Некоммерческие редакторы

Ниже приведено описание двух некоммерческих редакторов, сделанное еще в 1995 году и поэтому изрядно устаревшее. Трудно назвать число, существующих в настоящее время редакторов, предназначенных для набора (для облегчения набора) HTML страниц -- они разработаны на "все вкусы и все случаи жизни" (это утверждение конечно весьма условно).

Редакторы постоянно совершенствуются, что заниматься их описанием дело не благодарное. Лучше познакомится с ними самому, если есть такое желание, более того, что такая возможность имеется, не выходя из сети Новосибирского научного центра на зеркале сервера TUCOWS.

  HTML Writer -- свободно распространяемый редактор, работающий под MS Windows 3.11. Автор -- Kris Nosack. Последние новости по этому редактору можно получить по адресу http://lal.cs.byu.edu/people/nosack/. Наиболее примитивный, но правильно работающий редактор из доступных.

При аккуратном обращении может работать и под MS Windows 95. Для работы редактора необходимы библиотеки MS Windows для поддержки Visial Basic -- поэтому при работе под MS Windows 95 необходимо вместо библиотек, поставляемых вместе с редактором, использовать библиотеки MS Windows 95.

Редактор позволяет вставлять основные команды языка HTML, предназначенные для форматирования текста, а также имеется простейший интерфейс для вставки URL адресов. При наличии в MS Windows 95 утилиты для поддержки длинных имен (например, утилиты из Norton Navigator 95) может работать с файлами, имеющими длинные имена, используя формат MS DOS. Читает и записывает файлы правильно, однако понять с каким файлом в настоящий момент работаешь, - достаточно сложно. Кроме всего прочего редактор имеет возможность записывать файлы в формате UNIX.

Достоинства:

  • работает достаточно быстро и занимает мало места на диске (около 250К);
  • не требует большой оперативной памяти (работает в режиме виртуальной машины 8086);
  • не зависает;
  • при использовании MS Windows 95 позволяет использовать UNIX'овские имена файлов;
  • хорошо понимает кириллические шрифты MS Windows 95 и драйверы клавиатуры MS Windows 95 и КОИ8.
  • Недостатки

  • слишком мало команд форматирования;
  • отсутствуют таблицы;
  • конфликтует с другими приложениями MS Windows 95;
  • не работает с большими файлами;
  • может быть потерян файл при просмотре, если Вы его предварительно не записали;
  • плохо организовано подключение просмотра (brouser подключается только в случае, если он в настоящий момент не загружен);
  • мало развитый редактор гиперссылок.
  • Редактор (как и другие редакторы) можно получить с сервера TUCOWS, нажав кнопку DOWNLOAD в описании редактора.

      HTML Assistans -- свободно распространяемый редактор, работающий под MS Windows 3.11. Разработка H. Harawitz (Brooklyn North Software Works, Canada). Автор предлагает работать с этим редактором на свой собственный риск, т.е. претензии не принимаются, а предложениям всегда рад. Новости по этом редактору можно получить по адресу http://fox.nstn.ns.ca/

    Достоинства:

  • работает достаточно быстро и занимает мало места на диске (около 450К);
  • не требует большой оперативной памяти (работает в режиме виртуальной машины 8086);
  • не зависает;
  • при использовании MS Windows 95 позволяет использовать UNIX'овские имена файлов;
  • хорошо понимает кириллические шрифты MS Windows 95 и драйверы клавиатуры MS Windows 95 и КОИ8.
  • Недостатки

  • допускает сбои при работе команд редактирования MS Windows 95 (лучше использовать только команды редактора);
  • отсутствуют таблицы;
  • конфликтует с другими приложениями MS Windows 95;
  • не работает с большими файлами;
  • может быть потерян файл при просмотре, если Вы его предварительно не записали;
  • плохо организовано подключение просмотра (brouser подключается только в случае, если он в настоящий момент не загружен);
  • мало развитый редактор гиперссылок.
  • Коммерческие редакторы

    Список коммерческих редакторов также доступен на сервере TUCOWS. Как правило вы можете ознакомится с ними в течении 30 дней. Из наиболее популярных у нас в стране являются продукты фирмы Microsoft и Borland (например, MS FrontPage, MS Word, Borland InterDev). Относительно коммерческих редакторах можно сказать тоже самое -- качественных страниц с их помощью не создать. Более того, если посмотреть на WWW сервер фирмы Microsoft, то почему-то на нем очень мало страниц, подготовленных с помощью редактора этой фирмы MS Word, который фирма называет "шедевром" в области автоматизации набора гипертекстовых страниц.

    Замечание: Фирма Sausage Software, автор достаточно широко распространенного редактора HTML под названием Hot Dog, объявила о выпуске редактора анимаций Egor. Редактор можно получить "на пробу" сроком на 30 дней.

    Конверторы для перевода в HTML

    Из известных нам коверторов используются в настоящее время два типа: конверторы из MS Word в HTML и конверторы из \TeX (\LaTeX). Существуют также конверторы и из текстовых файлов, но вряд ли стоит их использовать.

    Ms Word

    В MS Word, который включен в состав MS Office97 (в MS Office95 соответствующее расширение не так давно можно было скачать с сервера Microsoft). Существующий в MS Word конвертор работает под MS Windows 95 и MS Windows NT. Для русскоязычных текстов существуют небольшие проблемы, связанные с не полным пониманием MS Word'ом русских кодовых страниц. Он совсем не понимает кодировок
    ISO-8859-5 и KOI8-R. А со своей родной кодировкой русского языка Windows-1251 правильно работает только в том случае, если конвертируемый текст вставлять в заранее подготовленный HTML-файл (шаблон) с выставленным в заголовке тегом META кодировки русского языка:
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Windows-1251">
    
    Даже в английском варианте конвертор работает не совсем чисто (вставляет очень много мусора - команд разметки, которые не влияют на форматирование текста) и после его работы необходима ручная правка текста.

    TeX & LaTeX

    Конверторы из \TeX (\LaTeX) в HTML работают более правильно и, если ваш текст не содержит математических выражений, то полученный после конвертирования файл практически не нуждается в доработке.

    Вопрос набора математических формул пока пока является открытым в стандарте разметки гипертекстовых страниц. Разные авторы решают его по разному: от вставки математических формул в виде графических файлов, как это сделано в коверторе LaTeX2HTML Никоса Дракоса, до загрузки дополнительных математических шрифтов, как это сделано в пакете WebEq. Более подробно проблемы математики на WWW изложены в моем докладе на конференции по электронным публикациям El-Pub97

    Для операционной системы MS Windows95(NT) можно рекомендовать достаточно простой конвертор TeX2RTF, переводящий стандартный текст \LaTeX в один из следующих форматов: RTF, HTML, XLP и WinHelp-RTF. Конвертор можно получить с нашего сервера. Оригинальная версия находится на

    anonymous ftp:
    ftp://ftp.aiai.ed.ac.uk:/pub/packages/tex2rtf
    
    Конвертор является частью свободно распространяемой библиотеки wxWindows, работающей под Sun Open Look, Motif, Windows 3.1, Windows 95/NT, non-GUI UNIX.
    Библиотека wxWindows доступна по адресу:
    anonymous ftp:
    ftp://ftp.aiai.ed.ac.uk:/pub/packages/wxwin
    


    Более подробный обзор конверторов из ТеХ'а в HTML можно найти здесь. Вопросам представления математических формул на WWW и конверторам из ТеХ в HTML посвящена также статья из журнала Вычислительные технологии.


    А.М.Федотов
    © 1996-1998, Институт вычислительных технологий СО РАН, Новосибирск

    Created on 6.04.1996
    Last updated on Saturday, 31-Oct-1998 00:00:00 NOVT