Министерство Аграрной Политики Украины
Кафедра экономической кибернетики
Реферат
На тему:
«Создание HTMLстраниц. Основные команды языка.»
Изучение HTML
Настоящее пособие предназначено для людей, знакомых с ПК, обрабатывающих информацию, которая будет находится на сервере, и желающих узнать, что представляет собой World Wide Web (WWW). Если Вы не знакомы с HTML, Вам предоставляется возможность предварительно изучить вводные тексты.
О чем?
Рассматривая HTML, который на сегодня является наиболее рекомендуемой версией HTML - языка описания документов, используемого на Web.
· некоторые элементы из HTML, частично ограниченные или модифицированные; это особенно касается таблиц
· некоторые расширения поставщика, которые оговорены соглашением
Можно работать на Web без знания языка HTML, так как тексты HTML могут создаваться различными специальными редакторами и конвертерами. Писать непосредственно на HTML нетрудно. Возможно, это даже легче, чем изучать HTML-редактор или конвертер, которые часто ограничены в своих возможностях, содержат ошибки или производят плохой HTML код, который не работает на различных платформах.
Общие замечания по синтаксису HTML
Набор символов
Формально, набор символов, используемых в HTML документе должен
- включать ISO Latin 1, известную также как ISO 8859-1 кодировку, так как она принадлежит к набору стандартов ISO 8859
- быть совместимым с ISO 10646 и Unicode.
В практической работе должны использовать только ISO Latin 1 набор символов. Сейчас и в ближайшем будущем можно твердо рассчитывать на его обширную поддержку приложениями. Поддержка ISO Latin 1 должна существовать во всех броузерах, однако иногда с этим существуют проблемы. Также Вы можете придерживаться ASCII набора символов, которые являются подмножеством ISO Latin 1.
Если клавиатура или текстовый редактор не позволяет вводить
(т.е. сразу печатать) некоторые ISO Latin 1 символы, например, ä или ñ, можно использовать символьные escape последовательности.
Некоторые предупреждениядля тех, кто создает документы на микрокомпьютерах:
- Наборы символов DOS и Macintosh не совместимы с ISO Latin 1. Это касается использования любых символов вне набора ASCII, так как для них необходимо преобразование. Некоторые программы могут делать эти преобразования автоматически, однако в конверсионных таблицах могут быть ошибки.
- Набор символов Windows наиболее согласован с ISO Latin 1, однако есть некоторые кодовые позиции, которые зарезервированы в качестве управляющих символов в ISO Latin 1 и, тем не менее используются для изображения видимых символов в наборе символов Windows. Наиболее известные из них - два различных тире "en тире" и "em тире", которые не надо смешивать с дефисом (-) или подчеркиванием (_), принадлежащими к ISO Latin 1 (и даже к ASCII). Если Вы используете такие символы, пользователи Windows систем вероятно увидят их как положено, однако на всех других системах символы скорее всего будет выглядеть, как помарки. (Обычно, такие символы даже не выводятся совсем).
Теги HTML
Тег HTML состоит из следующих друг за другом в определенном порядке элементов:
- левой угловой скобки < (такого же, как "меньше чем" символа)
- необязательного слэша /, который означает, что тег является конечным тегом, закрывающим некоторую структуру
. Таким образом в этом контексте Вы можете читать символ /, как конец...
- имени тега
- необязательных, если даже тег может иметь их, атрибутов. Тег может быть без атрибутов или сопровождаться одним или несколькими атрибутами, например: ALIGN=CENTER
- правой угловой скобки > (такой же, как символа "больше чем").
Элементы HTML
Большинство, но не все теги HTML спарены так, что за открывающим тегом следует соответствующий закрывающий тег, а между ними содержится текст или другие теги.
В таких случаях два тега и часть документа, отделенная ими, образуют блок, называемый HTML элементом. Некоторые теги, например <HR>, являются элементами HTML сами по себе, и для них соответствующий конечный тег неверен. Далее мы будем называть теги по их именам, опуская обязательные угловые скобки.
Aтрибуты
Для каждого тега определяется множество возможных атрибутов
. Большинство тегов допускает один или несколько атрибутов, однако атрибутов может и совсем не быть. Спецификация атрибутасостоит из расположенных в следующем порядке:
- имени атрибута, например WIDTH
- знак равенства (=)
- значения атрибута, которое задается строкой символов, например, "80".
Всегда полезно заключить значение атрибута в кавычки, используя либо одинарные ('80'), либо двойные кавычки ("80"). Строка в кавычках не должна содержать такие же кавычки внутри себя. Так, если дата заключена в двойные кавычки, используйте одинарные кавычки для последующего заключения в кавычки, и наоборот. В пределах значения атрибута теги HTML не воспринимаются. А escape последовательности распознаются и интерпретируются, как символы. Значения атрибутов должны быть отделены пробелами или незаполненными строками.
Разделение на строки и использование пробелов и символов табуляции
Когда документ выводится на экран, пробелы и пустые линии не сохраняются, за исключением текста, заключенного в теги PRE (предварительно отформатированный текст). То есть любая последовательность пробелов, символов табуляции и пустых линий эквивалентна единственному пробелу в файле HTML. С другой стороны, пробел в файле HTML может быть представлен с использованием любого количества пробелов или новыми (пустыми) строками.
Термин newlin
(новая линия) используется, чтобы ТЕОРЕТИЧЕСКИ обозначить конец строки. SGML определяет, что строка (запись) должна начинаться стартовым символом (newline - перевод строки, LF, ASCII код 10) и заканчиваться символом конца записи (возврат каретки, CR, ASCII 13). На практике, HTML документы представляются и передаются с использованием newline представления, согласованного с данными компьютерными системами. Поэтому, броузеры HTML допускают поддержку любого из трех общепринятых представлений разделения строк, обозначаемых последовательностью CR LF, только CR, или только LF, и на основе такого допущения и выделяют ошибки представления начальных и конечных символов записи.
Таким образом, не имеет значения, как Вы разделите текст на строки, так как перевод строки эквивалентен пробелу.
Таким образом, для логичного представления Вашего документа, Вы должны использовать такие теги HTML, как Pили BR, чтобы при необходимости обеспечить перевод строки.
Что касается использования перевода строки в сочетании с тегами HTML, то есть специальные правила:
· Перевод строки, следующий сразу за начальным тегом, игнорируется
Точно также, игнорируется перевод строки предшествующий конечному тегу.
Символ горизонтальной табуляции (HT)
можно использовать в документе HTML. Но в пределах элемента PREсимвол табуляции имеет особую интерпретацию, эквивалентен пробелу и не несет в себе информацию о табуляции какого-либо вида. (Чтобы представить табулированные данные, используйте элемент table.) Практически лучше избегать включения символов табуляции в код HTML и использовать вместо этого соответствующее количество пробелов, если нужно отформатировать код источника HTML документа в табулированном виде.
Классификация элементов
Способы, которыми теги HTML могут сочетаться, определяются терминами элементов и их классификацией. Гораздо удобнее определить, например, что элемент H1 может содержать только текстовые элементы, чем давать длинный список подходящих элементов, особенно, если учесть, что один и тот же список должен появляться во многих контекстах, и этот список может изменяться при добавлении новых текстовых элементов к будущим версиям HTML.
Элементы HTML можно классифицировать на три основные категории:
- заголовочные элементы
, т.е. элементы, используемые в элементе и содержащие информацию о документе в целом
- блоковые элементы
, включающие элементы, которые специфицируют структуру документа
- текстовые элементы
. Текстовыми элементами могут быть:
- простой текст, возможно
- выражения разметки
- разметка шрифт:
- специальные элементы
- элементы формы
- Любой текстовый элемент, включая простой текст, может при необходимости появиться везде - путем задания абзаца
- Правило "большого пальца", которое может помочь в запоминании того, какой элемент - блоковый, а какой - текстовый: блоковые элементы завершают абзац, текстовые - нет.
Об Escape
последовательностях
(символьных объектах),
именах
,
цветовых атрибутах
,
ширине
,
пикселях
,
вертикальном выравнивании
,
непрерывных пробелах.
Escape последовательности (символьные объекты)
Escape последовательности или, точнее, символьные объекты, представляют собой метод представления специальных символов. Например, escape последовательность < обозначает символ "меньше чем" (<).
Некоторые символы, такие как <, используются в HTML в специальном значении, поэтому должен существовать способ их выражения, как символьных данных внутри самого документа или в URL.
Имена
При изучении HTML слово имя
используется, как технический термин. (Вероятно, более соответствующим термином мог бы быть идентификатор
, как бы в концепции грубого сходства с идентификатором в языках программирования). Имя представляет собой последовательность символов и начинающуюся с буквы. Строка символов, которая используется для иногда может содержать и другие символы, однако тогда она должна быть взята в кавычки.
Цвета
В элементах FONTи BODYнекоторые конструкции HTML могут быть использованы, чтобы специфицировать цвета: например, цвет фона, цвет текста по умолчанию или цвет текста связи. Так как все мониторы и программы могут отображать цвет, действительное отображение может быть черно-белым или с различными оттенками серого. Чтобы пользоваться предварительно определенными цветовыми именами, необходимо знать их числовые эквиваленты.
Атрибут WIDTH (ширина)
Значение атрибута WIDTH в тегах, например, HRили TABLE можно специфицировать двумя альтернативными путями:
- как процентную частьпромежутка между текущими левой и правой границами; в этом случае значение атрибута должно быть взято в кавычки и за числом процентов должен сразу следовать знак процента, например, WIDTH="80%"
- в пикселях
, при этом задается целое число (кавычки не требуются), например WIDTH=212.< /LI>
Первый вариант относительной спецификации более предпочтителен, т.к. автор не может знать размера пикселя на экране читающей программы пользователя.
Пиксели
Используемые в атрибутах значения пикселя определяют пиксели экрана. Физический размер пикселя определяется монитором пользователя.
При выводе документа на прибор с очень высоким разрешением, например, лазерный принтер, броузеры должны умножать значения в пикселях на соответствующий коэффициент. То есть, если программа просмотра имеет дисплей с 75 пикселями на дюйм, а вывод должен осуществляться на лазерный принтер с 600 точками на дюйм, значение атрибута HTML в пикселях умножается на 8.
Вертикальное выравнивание (VALIGN)
В некоторых тегах, связанных с таблицами, может быть использован атрибут VALIGN для управления вертикальным выравниванием, т.е. позиционированием в вертикальном направлении ячеек таблицы.
Чтобы позиционировать содержимое ячеек в верхней части, середине или нижней части ячейки таблицы соответственно, задаются следующие значения атрибута VALIGN: TOP (верх), MIDDLE (середина), BOTTOM (низ).
Непрерывный
пробел
( ) (Non-breaking spaces)
Последовательность является escape нотацией для символа, который в других контекстах обычно называется непрерывным пробелом, или, для краткости, NBSP. Согласно ISO 8859, этот символ должен быть представлен, как обыкновенный пробел (пропуск, пустое место), однако такой, который не заменялся бы переводом строки (как это часто бывает с обыкновенным пробелом в текстовой обработке). То есть для того, чтобы два слова были на одной строке с некоторым расстоянием между ними, между этими словами должны появиться непрерывные пробелы. (Действительная ширина промежутка между словами может меняться, и нет необходимости привязываться к определенному количеству пробелов в файле HTML.)
Более того, хотя HTML Ссылочные спецификациине вносят ясности в этот вопрос, в разделе описания атрибута NOWRAP элементов THи TD указывается, что знак должен действовать как непрерывный пробел, по крайней мере в пределах ячеек таблицы.
Если Вы используете непрерывные пробелы, используйте их вместообычных пробелов, а не в дополнение к ним. С другой стороны, в таблице в HTML может иметь совершенно другое значение, которое может быть описано, как непустое пространство
: когда таблица представлена с бордюром, ячейки без содержания (просто пробелы не учитываются) изображаются без бордюра, однако в разметке указывается!
Основные структуры HTML документа
Обязательная структура документа
Начнем с самого простого HTML документа, содержащего только простой текст Hello world
. В HTML файле содержимому обязательно должен предшествовать раздел HEAD, который минимально может состоять из двух конструкций.
То есть, за исключением первой строки, весь файл есть HTML элементкоторый содержит HEAD элемент, (включающий TITLE элемент)и BODY элемент, с простым текстом в качестве содержимого.
Таким образом, при отсутствии тегов HTML, HEAD, и TITLE броузер сам вставит их в нужные места. Поэтому Ваш документ всегда будет содержать HEADи BODY.
Рекомендуемая структура документа
В дополнение к обязательной
структуре настоятельно рекомендуется вставлять различные структурные детали. Существуют специальные рекомендации на различных сайтах, и Вы должны внимательно изучить соответствующие документы.
Здесь же мы просто подчеркнем, что каждый HTML документ должен содержать основную информацию о его происхождении. Частные рекомендации могут уточнить в деталях форму представления этой информации.
О происхождении документа должна быть представлена, по крайней мере, следующая информация:
- Автор
документа, имеющий уникальное имя. При этом должна быть задана связь с домашней страницей автора. Если у документа несколько авторов, определите их всех, а также роль каждого из них; например, ведущего автора, редактора, действующего спонсора, а также лиц, формально отвечающих за документ.
- Дата
создания документа или его последней модификации, или и та и другая. Представляемая дата должна быть понятна во всем мире; в частности, название месяца лучше писать словом, а не цифрой.
- Контекст
документа и его статус
, например: часть официальной документации компании об одном из ее продуктов, или часть личной информации о хобби автора, или что-то другое.
- Адрес
(URL) документа. Такая информация зачастую чрезмерна, однако она может быть очень полезной, когда кому-то нужна копия именно того документа, который он нашел. Лучше не полагаться на броузер (и пользователя), добавляющих такую информацию, когда сделана копия документа.
|