На главную
SGML - это система определения
языков разметки. Авторы
размечают свои документы, представляя информацию о
структуре, представлении и семантике в одном документе. HTML является
одним из примеров языка разметки. Вот пример документа на языке HTML:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"
"http://www.w3.org/TR/REC-html40/strict.dtd">
<HTML>
<HEAD>
<TITLE>Мой первый документ на языке HTML</TITLE>
</HEAD>
<BODY>
<P>Всем привет!
</BODY>
</HTML>
Документ HTML состоит из раздела заголовка (здесь - между тэгами
<HEAD> и </HEAD>) и тела (здесь - между заголовками <BODY> и
</BODY>). Заголовок документа отображается в заголовке (вместе с
другой информацией о документе), а содержимое документа находится в
теле. В этом примере тело документа состоит только из одного абзаца,
помеченного <P>.
Каждый язык разметки, определенный в SGML, называется
приложением SGML. Приложение SGML характеризуется:
-
Объявлением SGML.
SGML Объявление
указывает, какие символы и разделители могут отображаться в
приложении.
-
Определение типа документа (DTD) (DTD).
DTD определяет
синтаксис конструкций разметки. DTD может включать дополнительные
определения, например,
ссылки на комбинации символов.
- Спецификация, описывающая семантику, используемую в разметке.
Эта спецификация также налагает синтаксические ограничения, которые
невозможно выразить при помощи DTD.
- Экземпляры документа содержат данные (содержимое) и разметку.
Каждый экземпляр содержит ссылку на DTD, которое должно
использоваться для интерпретации.
Спецификация HTML 4.0 включает
объявление SGML , три определения типа документов (описание их см. в
разделе
информация о версии HTML ) и список
ссылок на символы.
В следующих разделах Вы познакомитесь с конструкциями SGML,
используемыми в HTML.
В приложении перечислены некоторые
функции SGML, которые не поддерживаются средствами HTML и агентами
пользователей, и использования которых следует избегать.
Определение типа документа SGML объявляет
типы элементов, представляющие структуры или
желательное поведение. HTML включает типы элементов, представляющие
абзацы, гипертекстовые ссылки, списки, таблицы, изображения и т.д.
Каждое
объявление
типа элемента обычно включает три части: начальный тэг,
содержимое и конечный тэг.
Имя элемента отображается в
начальном тэге (пишется
<имя-элемента>) и в
конечном тэге (пишется
</имя-элемента>); не забывайте про слеш перед именем
элемента в конечном тэге. Например, начальные и конечные тэги элемента
UL определяют список:
<UL>
<LI><P>...элемент списка 1...
<LI><P>...элемент списка 2...
</UL>
Некоторые типы элементов HTML позволяют авторам
опускать конечные тэги (например,
типы элементов
P and
LI). Несколько типов элементов также
позволяют опускать
начальные тэги; например,
HEAD и
BODY. HTML DTD указывает для каждого типа
элемента, являются ли начальный и конечный тэги обязательными.
Некоторые типы элементов HTML не имеют содержимого. Например, элемент
перехода на следующую строку
BR не имеет содержимого; его роль -
прерывание строки текста. Такие
пустые элементы никогда не имеют конечных тэгов.
Определение типа документа и текст
спецификации указывают, является ли тип элемента пустым (не имеет
содержимого) или, если он может иметь содержимое, что является
допустимым содержимым.
Имена элементов всегда
учитывают регистр.
Информацию о правилах, управляющих элементами, (например, что они
могут быть вложенными соответствующим образом, конечный тэг закрывает
все опущенные начальные тэги вплоть до соответствующего ему начального
тэга (раздел 7.5.1) и т.д.) см. в стандарте SGML.
Например, следующий абзац:
<P>Это первый абзац.</P>
...элемент блока...
можно перезаписать без конечного тэга:
<P>Это первый абзац.
...элемент блока...
поскольку начальный тэг <P> закрывается следующим элементом
блока. Точно так же, если абзац включен в элемент блока, например:
<DIV>
<P>Это абзац.
</DIV>
конечный тэг включающего элемента блока (здесь - </DIV>) служит
также конечным тэгом открытого начального тэга <P>.
Элементы - это не тэги. Некоторые люди называют
элементы тэгами (например, "тэг P "). Помните, что элемент - это
одно, а тэг (начала или конца, неважно) - другое. Например, элемент
HEAD всегда присутствует, даже если начальный и конечный тэги HEAD
отсутствуют.
Все типы элементов, объявленные в этой спецификации, перечислены в
указателе элементов.
С элементами могут быть связаны свойства, называемые
атрибутами, которые могут иметь значения (стандартные
или устанавливаемые авторами или сценариями). Пары атрибут/значение
помещаются перед закрывающей скобкой ">" начального тэга элемента. В
начальном тэге элемента может быть любое число (допустимых) пар
атрибут/значение, разделенных пробелами. Они могут указываться в любом
порядке.
В данном примере для элемента
H1 установлен атрибут
id: