Термин в Энциклопедическом Фонде

Язык разметки гипертекста

Язык разметки гипертекста (от англ. HyperText Markup Language, сокращённо HTML) - это стандартный язык разметки веб-документов, который определяет,  как и какие именно элементы должны будут располагаться на веб-странице. Многие считают, что HTML это язык программирования, но это не так, он не может выполнять простые действия (сложение, вычитание и т.п.), кроме того, в HTML не входят основные элементы всех языков программирования (функции, циклы, переменные и т.п.).

В  основном веб-страницы создаются при помощи языка HTML или XHTML (от англ.  Extensible Hypertext Markup Language - расширяемый язык разметки  гипертекста). Язык HTML интерпретируется браузером и отображается в виде  документа, в удобной для человека форме восприятия.

Язык HTML был разработан британским учёным Тимом Бернерсом-Ли  приблизительно в 1989-1991 гг. в стенах Европейского совета по ядерным  исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена  научной и технической документацией, пригодный для использования людьми,  не являющимися специалистами в области вёрстки. Таким образом с помощью HTML можно легко  создать относительно простой, но красиво оформленный документ.

Текст с разметкой HTML должен по идее одинаково воспроизводиться на оборудовании с  различной технической оснащённостью (монитор, планшет, мобильный телефон, и тп) и программным обеспечением, но на практике не всегда так. Потому что существует много различных браузерных движков (Presto, WebKit, Gecko, Trident), которые иногда отходят от стандартов или интерпретируют их по своему (к примеру Internet Explorer, для которого происходит "доделывание" веб-страницы под все его версии).

Современное применение HTML очень далеко от его  изначальной задачи. К примеру, тег table>, предназначен для  создания в документах обычных таблиц, но долгое время использовался для верстки веб-страниц, где таблицы с невидимой границей, позволяли разделять документ на модульные блоки. Теперь же ему на смену пришел более современный способ верстки с помощью слоев. Хотя и табличная верстка до сих пор популярна и используется.

С течением времени, основная идея  платформонезависимости языка HTML была отдана в своеобразную жертву  современным потребностям в мультимедийном и графическом оформлении. HTML - теговый язык разметки документов. Любой документ на языке HTML  представляет собой набор элементов, причём начало и конец каждого элемента  обозначается специальными пометками - тегами. Элементы могут быть пустыми,  то есть не содержащими никакого текста и других данных (например, тег  перевода строки ‹br>). В этом случае обычно не указывается закрывающий  тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их  свойства (например, выравнивание содержимого контейнера ‹div> по краю). Атрибуты указываются  в открывающем теге. Вот примеры фрагментов HTML-документа:

‹strong>Текст между двумя тегами - открывающим и закрывающим.‹/strong>
‹a href="http://www.example.com">Здесь элемент содержит атрибут href.‹/a>
А вот пример пустого элемента: ‹br>

Регистр, в котором набрано имя элемента и имена атрибутов, в HTML значения  не имеет (в отличие от XHTML). Элементы могут быть вложенными:

‹p>‹b>текст‹/b>‹/p>

Кроме элементов, в HTML-документах есть и сущности (англ. entities) -  "специальные символы". Сущности начинаются с символа амперсанда и имеют  вид &имя; или &#NNNN;, где NNNN - код символа в Юникоде в десятеричной  системе счисления.

Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии,  должен начинаться со строки декларации версии HTML ‹!DOCTYPE...>, которая  обычно выглядит примерно так:  

‹!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">

Эта строка поможет браузеру определить, как правильно интерпретировать данный документ. В данном случае мы говорим браузеру, что HTML соответствует международной спецификации версии 4.1 со строгим синтаксисом HTML. Как видно из примера, самый короткий html-документ состоит буквально из одной строки. Если эта строка не указана, то добиться корректного отображения документа  в браузере становится труднее.

Затем нужно обозначить начало и конец документа парными тегами ‹html> и ‹/html>  соответственно. Внутри этих тегов должны находиться теги заголовка  (‹head>‹/head>) и тела (‹body>‹/body>) документа.

Основные различия между XHTML и HTML
1) Все элементы должны быть закрыты. Теги, которые не имеют закрывающего тега (например, ‹img> или ‹br>) должны иметь на конце / (например, ‹br />).
2) Булевы атрибуты записываются в развёрнутой форме. Например, следует писать ‹option selected="selected"> или ‹td nowrap="nowrap">.
3) Имена тегов и атрибутов должны быть записаны строчными буквами (например, ‹img alt="" /> вместо ‹IMG ALT="" />).
4) XHTML гораздо строже относится к ошибкам в коде; ‹ и & везде, даже в URL, должны замещаться < и & соответственно. По рекомендации W3C браузеры, встретив ошибку в XHTML, должны сообщить о ней и не обрабатывать документ. Для HTML браузеры должны были попытаться понять, что хотел сказать автор.
5) Кодировкой по умолчанию является UTF-8 (в отличие от HTML, где кодировкой по умолчанию является ISO 8859-1).

Используемые источники
1) Фримен Эрик, Фримен Элизабет. Изучаем HTML, XHTML и CSS.
2) ru.wikipedia.org/wiki/HTML.
3) en.wikipedia.org/wiki/HTML.
4) w3.org.

Энциклопедический Фонд