Содержание
Введение............................................................................................................ 3
1 Понятие и использование гипертекстовой технологии ............................... 5
1.1 Понятие гипертекстовой технологии ...................................................... 13
1.2 Использование гипертекстовой технологии в WWW.............................. 13
2 Языки гипертекстовой разметки................................................................. 20
2.1 Язык разметки HTML............................................................................... 20
2.2 Язык разметки XML................................................................................. 20
2.3 Язык разметки XHTML............................................................................ 23
Заключение...................................................................................................... 26
Глоссарий........................................................................................................ 29
Список использованных источников............................................................. 30
Приложение А. Упрощенная архитектура системы, обеспечивающей интеграцию информационных ресурсов XML и SQL……………………………… 31
ВВЕДЕНИЕ
Жизнь не стоит на месте. Все растет и развивается, стремится вперед, ускоряется…
Все в большей степени успешная практическая деятельность современного целеустремленного человека зависит от эффективной организации обмена информацией. Увеличились информационные потоки и повысились требования к скорости обработки, передачи данных, а так же своевременному владению информацией, ее усваиванию и скорости ее познания.
Совершенствование технических возможностей средств вычислительной техники, развитие коммуникационных средств и технологий управления информационными ресурсами в последние годы привели к появлению более крупных информационных систем. Имеются ввиду масштабы систем не только относительно объема поддерживаемых информационных ресурсов, но и числа их пользователей.
Объем информационных ресурсов Web в настоящее время исчисляется многими миллионами страниц.
В связи с этим развитием информационных технологий, сетей, а также информационных систем получили широкое распространение гипертекстовая технология, языки гипертекстовой разметки, в частности HTML. Информационные системы при этом рассматриваются как инструмент моделирования реальности, реализующей различные подходы.
В последние годы стали появляться инструментальные средства и крупные информационные системы, в которых совместно используются различные информационные технологии.
Для информационных технологий характерна деятельность по стандартизации различных аспектов. Такая деятельность направлена на обеспечение переносимости приложений и информационных ресурсов между различными программно – аппаратными платформами, повторное использование ресурсов, в частности это может быть использование программных компонентов приложений.
Информационные системы сегодня применяются во всех областях общественной жизни и научной деятельности.
Курсовая работа предназначена для обобщения накопленного отечественного и зарубежного опыта в разработке информационных систем связанная cинтернет–технологиями, выявление общих положений и принципов их построения и развития.
Данная курсовая работа показывает значимость и эффективность использования информационных систем в первую очередь для поддержки человеческой деятельности в различных областях науки, образования и культуры.
Целькурсовой работы –
изучить теоретический материал по тематике курсовой работы.
Для достижения поставленной цели были выделены следующие задачи:
Во-первых, проанализировать литературу по теме курсовой работы;
Во-вторых, рассмотреть и изучить понятия: «гипертекстовая технология»
В-третьих, охарактеризовать основные технологии Web, такие как: HTML, XML, XHTML;
Структура курсовой работы: работа состоит из введения, двух глав, заключения, глоссария, списка литературы, включающего в себя 10 источников и приложения.
Первая часть первой главы посвящена изучению основных понятий, таких как «гипертекстовая технология».
Во второй части первой главы данной курсовой работы рассматривается использование гипертекстовой технологии в WWW.
Третья глава посвящена характеристике языков гипертекстовой разметки: HTML, XML, XHTML.
1 Понятие и использование гипертекстовой технологии
1.1 Понятие гипертекстовой технологии
Технология обработки текстов является одним из средств так называемого электронного офиса. При работе с текстами пользователь должен иметь разнообразные функции (инструментарий), повышающие эффективность и производительность его деятельности.
Обработка текстов тесно связана с организацией гипертекста
.
Под гипертекстомпонимают систему информационных объектов (статей), объединенных между собой направленными связями, образующими сеть.
Гипертекст – это текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и так далее. Другими словами гипертекст – особая форма организации текстового материала, при котором его смысловые единицы (фразы, абзацы, разделы) представлены не в линейной последовательности, а как система возможных переходов и связей между ними. Принцип гипертекста распространяется на большое число распределенных материалов и документов. Работая с одним документом, легко переключиться на любой, связанный с ним документ, в котором, в свою очередь, могут содержаться ссылки на следующий.
Гипертекстовая технология – это представление текста в виде многомерной иерархической структуры типа сети.
Гипертекст формируется в результате представлений текста как ассоциативно связанных блоков информации. Ассоциативная связь – это соединение, сближение представлений, смежных, противоположных, аналогичных. Гипертекст значительно отличается от обычного текста. Обычные (линейные) тексты имеют последовательную структуру и предусматривают их чтение слева направо и сверху вниз.
Простейший пример гипертекста - это любой словарь или энциклопедия, где каждая статья имеет отсылки к другим статьям этого же словаря. В результате читать такой текст можно по-разному: от одной статьи к другой, по мере надобности, игнорируя гипертекстовые отсылки; читать статьи подряд, справляясь с отсылками; наконец, пуститься в гипертекстовое плавание, то есть от одной отсылки переходить к другой.
Концепция гипертекста достаточно проста. Есть база данных, в базе данных находятся объекты. Объекты это, чаще всего, небольшие текстовые разделы, посвященные тому или иному вопросу. Специальные механизмы и правила позволяют компьютеру поддерживать ссылки из одних текстовых фрагментов в другие. Человек или программный агент может устанавливать новые связи между текстовыми фрагментами. Система текстовых фрагментов или файлов с такой организацией получила название "гипертекст".
Гипертекст изначально создавался как среда поддерживающая взаимодействие нескольких людей. Культовая работа Ваннавера Буша "As we may Think", в которой он описал устройство Memex, была связаны с проблемами взаимодействия коллективов ученых после Второй Мировой Войны, когда стало ясно, что существующие системы плохо поддерживают коллективную мыслительную деятельность. Система Memex, по своей сути, представляла систему для обмена "мемами" - элементарными единицами культурной эволюции. Гипертекст изначально мыслился создателям как система общественной деятельности. Группа взаимосвязанных сообщений образовывала сеть, и эта гипертекстовая сеть документов поддерживала социальную сеть отношений между сообществом авторов коллективного гипертекста.
Использование гипертекста позволяет фиксировать отдельные идеи, мысли, факты, а затем связывать их друг с другом, двигаясь в любых направлениях, определяемых ассоциативными связями.
С развитием компьютерных средств мультимедиа гипертекст начал превращаться в более наглядную информационную форму, получившую название гипермедиа — эта информационная форма содержит не только текст, но и графику, видеоинформацию и звуки.
Обработка гипертекста открыла новые возможности освоения информации, качественно отличающиеся от традиционных способов.
Вместо поиска информации по соответствующему поисковому ключу гипертекстовая технология
предполагает перемещение от одних объектов информации к другим с учетом их смысловой, семантической связанности.
Обработке информации по правилам формального вывода в гипертекстовой технологии соответствует запоминание пути перемещения по гипертекстовой сети.
Гипертексты обладают определенной семантической (смысловой) сетевой структурой. При многократном просмотре, если гипертекст используется как учебник, эта структура будет сильно влиять на структуру знаний пользователя по изучаемому вопросу. Поэтому при построении гипертекстовых систем следует уделять внимание не только тому, как разбить исходный текст на части, но и тому, насколько пользователю будет понятно, легко и удобно работать с этими частями текста.
Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря
.
Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта.
Информационная статья
содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям.
Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира.
Тезаурус гипертекста – это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию.
Тезаурус гипертекста можно представить в виде сети: в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства.
Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок типа род – вид, часть – целое.
Алфавитный словарь включает в себя перечень наименований всех информационных статей в алфавитном порядке.
К основным элементам гипертекстовой технологии относятся:
- информационный фрагмент;
- тема;
- узлы;
- ссылки.
Информационный фрагмент гипертекста может представлять собой линейную последовательность строк текста, рисунок, видеофрагмент, аудиофрагмент.
Тема содержит краткое название информационного фрагмента. Информационный фрагмент может состоять целиком из множества тем либо включать в себя одну или несколько тем наряду с прочей информацией.
Узлом в гипертексте называется информационный фрагмент, из которого возможен переход к другим информационным фрагментам гипертекста.
Ссылка представляет собой слово, фразу или набор фраз, с помощью которых осуществляется переход от одного узла к другому. Ссылки могут быть референтными или организационными.
Референтные ссылки — это наиболее типичный вид ссылок в гипертекстах. Они, как правило, имеют два конца, обычно это направленные связи, хотя большинство гипертекстовых информационных систем поддерживает и обратное движение по ссылке. Исходный конец референтной ссылки называется «источник». Логически это отдельная точка или область в тексте. Другой конец называется «назначением» — это определенная точка или область в гипертексте. С источником ссылки связывается некоторая пометка, указывающая наличие ссылки, — она показывает имя ссылки, обычно изображается в виде последовательности символов и высвечивается как отдельная единица текста. Например, при щелчке по термину появится информационный фрагмент, разъясняющий значение этого термина.
Организационные ссылки устанавливают явные связи между двумя точками гипертекста и отличаются от референтных тем, что поддерживают иерархическую структуру в гипертексте. Организационные ссылки связывают узел-родитель с узлами-сыновьями и, таким образом, формируют древовидный подграф в рамках общего гипертекстового сетевого подграфа. Такие ссылки часто соответствуют отношению «быть частным случаем», и по этой причине операции над этими ссылками (при построении гипертекста) отличаются от операций над референтными ссылками
Область применения гипертекстовой технология очень широка. Это издательская деятельность, библиотечная работа, обучающие системы, разработка документации, законов, справочных руководств, баз данных, баз знаний и т.д.
1.2
Использование гипертекстовой технологии в
WWW
Термин гиперте́кст был введён Тедом Нельсоном в 1965 году для обозначения «текста ветвящегося или выполняющего действия по запросу». Обычно гипертекст представляется набором текстов, содержащих узлы перехода от одного текста к какому-либо другому, позволяющие избирать читаемые сведения или последовательность чтения. Общеизвестным и ярко выраженным примером гипертекста служат веб-страницы — документы HTML (язык разметки гипертекста), размещённые в сети. В более широком понимании термина, гипертекстом является любая повесть, словарь или энциклопедия, где встречаются отсылки к другим частям данного текста.
В компьютерной терминологии, гипертекст — текст, сформированный с помощью языка разметки, потенциально содержащий в себе ссылки.
Всеми́рная паути́на (англ. WorldWideWeb) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету[1]
. Всемирную паутину образуют миллионы web-серверов.
Веб-сайт (от англ. website: web — «паутина», «сеть» и site — «место», букв. «место в сети») или просто сайт — в компьютерной сети объединённая под одним адресом (доменным именем или IP-адресом) совокупность документов частного лица или организации. По умолчанию подразумевается, что сайт располагается в сети Интернет. Все веб-сайты Интернета в совокупности составляют Всемирную паутину.
Тим Бернерс-Ли является «отцом» основополагающих технологий веба — HTTP, URI/URL и HTML, хотя их теоретические основы были заложены ещё раньше. В 1940-х годах Ванневар Буш выдвинул идеи расширения памяти человека с помощью технических устройств, а также индексации накопленной человечеством информации для её быстрого поиска. Теодор Нельсон и Даг Энгельбарт предложили технологию гипертекста — «ветвящегося» текста, предоставляющего читателю разные варианты чтения. Xanadu, так и не законченная гипертекстовая система Нельсона, была предназначена для хранения и поиска текста, в который введены взаимосвязи и «окна». Нельсон мечтал связать перекрёстными ссылками все тексты, созданные человечеством.
«Отец» веба считал, что гипертекст может служить основой для сетей обмена данными, и ему удалось претворить свою идею в жизнь. Ещё в 1980 году Тим Бернерс-Ли создал гипертекстовое программное обеспечение Enquire, использующее для хранения данных случайные ассоциации. Затем, работая в Европейском центре ядерных исследований в Женеве (CERN), он предложил коллегам публиковать гипертекстовые документы, связанные между собой гиперссылками. Бернерс-Ли продемонстрировал возможность гипертекстового доступа к внутренним поисковику и документам, а также новостным ресурсам Интернета. В результате, в мае 1991 года в CERN был утверждён стандарт WWW.
Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы — браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета.
WorldWideWeb – глобальная компьютерная сеть на сегодняшний день содержит миллионы сайтов, на которых размещена всевозможная информация.Современные информационные возможности глобальной информационной сети в значительной мере определяются применением гипертекстовой технологии.
Так, поиск нужной информации осуществляется с использованием гипертекстовых ссылок, которые позволяют просматривать материалы в порядке выбора этих ссылок пользователем. Многие интерфейсы данной технологии позволяют выбирать интересующие материалы простым нажатием кнопки манипулятора «мышь» на нужном слове или поле графической картинки.
Всемирная паутина World Wide Web (WWW) является информационной гипертекстовой системой. Перемещаясь по этой паутине можно получать не только текстовую информацию, но и графику, таблицы, видео- и звуковые программы и другие виды специальных программ, которые хранятся в сотнях тысяч управляющих компьютерных систем в более чем 150 странах мира.
Вся технология WWW основана на трех основных элементах:
- язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
- универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
- протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).
Позже команда NCSA добавила к этим трем компонентам четвертый:
- универсальный интерфейс шлюзов CGI (Common Gateway Interface).
.Язык гипертекстовой разметки документов HTML (HyperTextMarkupLanguage) позволяет создавать WWW-страницы. Совокупность WWW – страниц с гипертекстовыми ссылками образует дерево страниц, в котором возможны переходы от одного документа в другой, вне зависимости от их физического расположения.
Например, гипертекстовая ссылка с какой-либо страницы может направлять пользователя на страницу, физически располагающуюся не только на другом компьютере, но и на другом континенте. Для Интернета неважно, где находится пользователь: в Америке или России. С помощью гипертекстовой технологии информация в Интернет становится доступной в следующую секунду после опубликования.
Большинство Web-документов содержат гипертекстовые ссылки или просто гиперссылки.
Гиперссылка – это объект Web-страницы, содержащий информацию об адресе другой Web-страницы. В качестве такого объекта обычно выступает фрагмент текста, выделенный цветом и подчеркиванием, или графическая иллюстрация, выделенная цветной рамкой.
Гипертекстовые ссылки обычно «указывают» на Web-страницу, тематически связанную со страницей, просматриваемой в данный момент. Текст, являющийся ссылкой, может описывать содержание нового документа. При наведении на гиперссылку указатель мыши принимает форму кисти руки с вытянутым указательным пальцем.
Чтобы перейти по гиперссылке, достаточно на ней щелкнуть мышью. При этом обозреватель загрузит новую Web-страницу, находящуюся по тому адресу, который указан в ссылке. Новая Web-страница может содержать новые гиперссылки, что позволяет продолжать просмотр документов, относящихся к той же теме.
Механизм гиперссылок является одной из тех особенностей WorldWideWeb, которые в наибольшей степени способствовали росту популярности этой службы.
Таким образом, гипертекстовая технология позволяет создавать и организовать информационно-поисковые массивы, в которых отдельные информационные элементы (документографические, фактографические полнотекстовые, графические и др.) связаны между собой ассоциативными отношениями, обеспечивающими быстрый поиск необходимой информации и / или просмотр взаимосвязанных указанными отношениями данных.
2 Языки гипертекстовой разметки
Когда осенью 1991 года Интернет впервые услышал позывные новой технологии, название которой легко уместилось в три буквы, почти никто не мог представить себе, что завоевания ее окажутся настолько глобальными. Сегодня для многих неискушенных пользователей слово Интернет прочно ассоциируется с WWW и с уст специалистов не сходит тема будущего информационных систем и влияния на это будущее всемирной сетевойпаутины.
Использование гипертекстовой разбивки текстового документа в современных информационных системах во многом связано с тем, что гипертекст позволяет создавать механизм нелинейного просмотра информации. В таких системах данные представляются не в виде непрерывного потока текстовой информации, а набором взаимосвязанных компонентов, переход по которым осуществляется при помощи гиперссылок.
Язык разметки документов - это набор специальных инструкций, называемых тэгами, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры. Тэги языка, или, как их иногда называют, управляющие дескрипторы, в таких документах каким-то образом кодируются, выделяются относительно основного содержимого документа и служат в качестве инструкций для программы, производящей показ содержимого документа на стороне клиента. В самых первых системах для обозначения этих команд использовались символы < и >, внутри которых помещались названия инструкций и их параметры. Сейчас такой способ обозначения тэгов является стандартным.
2.1 Язык разметки документов
HTML
Популярность World Wide Web и неотъемлемой ее части, HTML, безусловно, стала причиной повышенного внимания к системам гипертекстовой разметки документов. Хотя понятие гипертекста было введено В.Бушем еще в 1945 году и, начиная с 60-х годов стали появляться первые приложения, использующие гипертекстовые данные, всплеск активности вокруг этой технологии начался лишь тогда, когда возникла реальная необходимость в механизме объединения множества информационных ресурсов, обеспечения возможности создания, просмотра нелинейного текста. И примером реализации этого механизма послужила паутина WWW.
Самый популярный на сегодняшний день язык гипертекстовой разметки HTML, был создан специально для организации информации, распределенной в сети Интернет, и является одной из ключевых составляющих технологии WWW. С использованием гипертекстовой модели документа способ представления разнообразных информационных ресурсов в сети стал более упорядочен, а пользователи получили удобный механизм поиска и просмотра нужной информации.
HTML (HyperText Markup Language) - Язык гипертекстовой разметки, который в настоящее время используется в World Wide Web. Изначально создавался как язык для обмена научной и технической документацией. Стандартизацией языка HTML занимается W3C (WWW Consortium).
HTML является упрощенной версией стандартного общего языка разметки - SGML (Standart Generalised Markup Language), который был утвержден ISO в качестве стандарта еще в 80-х годах. Этот язык предназначен для создания других языков разметки, он определяет допустимый набор тэгов, их атрибуты и внутреннюю структуру документа. Контроль за правильностью использования дескрипторов осуществляется при помощи специального набора правил, называемых DTD- описаниями, которые используются программой клиента при разборе документа. Для каждого класса документов определяется свой набор правил, описывающих грамматику соответствующего языка разметки. С помощью SGML можно описывать структурированные данные, организовывать информацию, содержащуюся в документах, представлять эту информацию в некотором стандартизованном формате. Но в виду некоторой своей сложности, SGML использовался, в основном, для описания синтаксиса других языков (наиболее известным из которых является HTML), и немногие приложения работали с SGML- документами напрямую.
Гораздо более простой и удобный, чем SGML, язык HTML позволяет определять оформление элементов документа и имеет некий ограниченный набор инструкций - тэгов, при помощи которых осуществляется процесс разметки. Инструкции HTML, в первую очередь, предназначены для управления процессом вывода содержимого документа на экране программы-клиента и определяют этим самым способ представления документа, но не его структуру. В качестве элемента гипертекстовой базы данных, описываемой HTML, используется текстовый файл, который может легко передаваться по сети с использованием протокола HTTP. Эта особенность, а также то, что HTML является открытым стандартом и огромное количество пользователей имеет возможность применять возможности этого языка для оформления своих документов, безусловно, повлияли на рост популярности HTML и сделали его сегодня главным механизмом представления информации в Web.
В качестве основы написания кода HTML был выбран обычный текстовый файл. Таким образом, гипертекстовая база данных в концепции WWW — это набор текстовых файлов, размеченных на языке HTML, который определяет форму представления информации (разметка) и структуру связей между этими файлами и другими информационными ресурсами (гипертекстовые ссылки).
Разработчики HTML смогли решить две задачи:
- предоставить дизайнерам гипертекстовых баз данных простое средство создания документов;
- сделать это средство достаточно мощным, чтобы отразить имевшиеся на тот момент представления об интерфейсе пользователя гипертекстовых баз данных.
- Гипертекстовые ссылки, устанавливающие связи между текстовыми документами, постепенно стали объединять самые различные информационные ресурсы, в том числе звук и видео.
Система гиперссылок HTML позволяет построить систему взаимосвязанных документов по различным критериям. Язык HTML содержит команды (тэги), позволяющие управлять формой и размером шрифтов, размером и расположением иллюстраций, позволяет осуществлять переход от фрагмента текста или иллюстрации к другим html - документом – так называемую гипертекстовую ссылку. Документ в html - формате представляет собой текстовый файл, содержащий все необходимые сведения о выводимой на экран информации. Для управления сценариями просмотра страниц Website (гипертекстовой базы данных, выполненной в технологии World Wide Web) можно использовать языки программирования этих сценариев, например, JavaScript, Java и VBScript.
HTML обладает несложным набором команд и вполне успешно справляется с задачей описания текстовой информации и отображением ее на экране программы просмотра- броузера. Однако сами отображаемые данные никак не связаны с теми тэгами, которые используются для форматирования, поэтому у программ-анализаторов нет возможности использовать тэги HTML для поиска нужных нам фрагментов документа. Т.е. встретив, например, такое описание
<font color="red">rose</font>,
программа просмотра будет знать, каким цветом отобразить текст, содержащийся внутри тэгов и, вероятно, отобразит его правильно, но ей абсолютно безразлично, в каком месте документа встретился этот тэг, в какие другие тэги заключен текущий фрагмент, существуют ли вложенные в него фрагменты, правильно ли построены отношения между объектами. Такое "безразличие" к структуре документа приводит к тому, что поиск или анализ информации внутри него ничем не будет отличаться от работы со сплошным, не разбитым на элементы текстовым файлом. А это не самый эффективный способ работы с информацией.
Другим существенным недостатком HTML можно назвать ограниченность набора его тэгов. DTD- правила для HTML определяют фиксированный набор дескрипторов и поэтому у разработчика нет возможности вводить собственные, специальные тэги. Хотя время от времени появляются новые расширения языка, но долгий путь их стандартизации, сопровождаемый постоянными разногласиями между основными производителями браузеров делают практически невозможной быструю адаптацию языка, его использование для отображения специализированной информации (например, мультимедийной, математических, химических формул и т.д.).
Различают два вида html-документов – статические и динамические. Статические документы хранятся в файлах той файловой системы, которая используется web-сервером или браузером при просмотре локальных файлов. При размещении информации на web-сервере можно использовать динамические документы - такие, которые не существуют постоянно в виде файлов, а генерируются в момент запроса клиента. При чем для конечного пользователя не имеет значения динамический или статический способ представления документов.
Для генерирования динамического документа HTML требуется специально написанная программа по правилам, определяемым web-сервером. При планировании размещения информации на web-сервере, для правильного определения использования, какого либо вида документов, необходимо учитывать степень обновляемости данных, их объем и частоту обращения.
Динамический способ определяет хранение данных в формализованном виде, например в базе данных.
Если же данные хранятся в формализованном виде, то, используя шаблоны документов, в которых были произведены изменения, генерируются статические документы. Для генерирования статических документов можно использовать любые средства отчетов, имеющихся в той системе управления баз данных (СУБД), которой обработаны и формализованы данные.
Новых версий языка HTML не будет. HTML уже сегодня не удовлетворяет в полной мере требованиям, предъявляемым современными разработчиками к языкам подобного рода. И ему на смену был предложен новый язык гипертекстовой разметки, мощный, гибкий, и, одновременно с этим, удобный язык XML.
2.2 Язык разметки документов
XML
Язык XML (Extensible Markup Language - расширяемый язык разметки) появился в связи с необходимостью приспособить SGML для сетевой среды, особенно для Interner. Основное внимание в XML сосредоточено на данных. В XML проводится строгая линия раздела между структурной разметкой данных и представлением данных. Язык XML использует структуру тегов и определяет содержание гипертекстового документа. XML позволяет автоматизировать обмен данными, не прибегая к существенному объему программирования.
XML (Extensible Markup Language) - это язык разметки, описывающий целый класс объектов данных, называемых XML- документами. Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов. Сам по себе XML не содержит никаких тэгов, предназначенных для разметки, он просто определяет порядок их создания.
Аббревиатуру XML довольно часто используют для обозначения не только самого языка XML, но и некоторых других связанных с ним понятий — определяющего язык стандарта W3C, информационных ресурсов XML, комплекса основанных на языке XML стандартов консорциума W3C, составляющих платформу XML.
С языком XML связаны такие технологии, как XSL (Extensible Style-sheet Language - расширяемый язык листов стилей) и XSLT (XSL Transformations - расширяемый язык преобразования листов стилей), предоставляющие разработчику выбор способа представления документов XML. Языки XSL и XSLT созданы на основе прежней технологии, известной в свое время как DSSSL (Document Style Semantics and Specifications Language - язык семантики и спецификаций стилей документов).
Как и SGML (также один из родителей HTML), XML является метаязыком. Он представляет собой набор правил, позволяющих авторам создавать приложения и подмножества данных, уникальных для их задач.
Главная сфера применения стандартов платформы XML — это представление слабоструктурированных данных Web-сайтов в форме XML-документов. Собственно, для этой цели и создавался язык XML. Слабоструктурированные данные - такие данные, которые в отличие от данных в БД не имеют регулярной структуры, определяемой с помощью предписывающей схемы.
Применение XML в этой области позволяет не только представлять в среде Web гипермедийные страницы в форме XML-документов, но и поддерживать связанные с ними метаданные. Метаданные — свойства данных, определяющие их структуру, допустимые значения и способы их представления, взаимосвязи с другими данными, размещение и другие характеристики данных, которые помогают правильно их интерпретировать и использовать. Иначе говоря, это данные о данных. Благодаря этому можно создать такие поисковые машины Web, которые будут обеспечивать в результате обработки пользовательского поискового запроса гораздо более низкий уровень информационного шума по сравнению с нынешними HTML-технологиями.
Одной из важнейших целей создания платформы XML является привнесение в среду Web метаданных, описывающих свойства поддерживаемых в ней информационных ресурсов. Информационный ресурс - используемые в приложениях данные, которые представлены в базах данных, базах знаний, на Web-сайтах, в отдельных файлах различной природы или в процедурной форме с помощью продуцирующих их программных средств. Речь идет об описании структуры XML-документов и их смыслового содержания (семантики). Необходимость решения этой задачи основывается на стремлении к получению возможностей автоматической проверки правильности структуры XML-документов и снижения уровня информационного шума при отыскании нужных данных в Web с помощью различных поисковых машин. Это означает, что при наличии явного описания структуры документов проверку их правильности может осуществлять браузер.
Чаще всего не учитывается еще одно важное назначение метаданных, описывающих информационные ресурсы Web. Метаданные необходимы для создания принципиально новых высокоуровневых приложений Web, в частности основанных на интеграции информационных технологий и обеспечивающих интеграцию неоднородных информационных ресурсов. Приведенный в приложении А рисунок 1 иллюстрирует упрощенную архитектуру системы, в которой метаданные используются для обеспечения интеграции неоднородных информационных ресурсов.
Как язык разметки Web-документов XML обладает следующими достоинствами:
- Гибкость. XML позволяет обрабатывать уникальные данные в коммерческой и медицинской областях. Независимо от характера данных XML способен предоставить адекватные методы их хранения и обработки. Исключение составляют лишь двоичные данные и внедренные сценарии.
- Возможность настройки. Гибкость XML непосредственно связана с возможностью определять собственные дескрипторы, необходимость в которых возникает в процессе решения задачи.
- Согласованность. XML унаследовал синтаксическую целостность и строгую структуру своего родителя - SGML.
XML — естественный результат развития Web-технологий, следствие стремления к более эффективному использованию уникальных возможностей открытой глобальной информационной среды, которую они поддерживают. Создание платформы XML — это новая эпоха в развитии Всемирной паутины, это — начало нового, более наукоемкого и технологически более совершенного этапа в ее истории. Сегодня XML, несомненно, стал стандартом де-факто. Все ведущие поставщики программного обеспечения не только Web, но и систем баз данных, включают в свои программные продукты поддержку языка XML или даже создают специализированные системы.
Большую работу по продвижению стандартов платформы XML в практику ведет крупный Международный, некоммерческий консорциум OASIS (OrganizationforStructuredInformationStandards, Организация по стандартизации структурированной информации).
Технологии XML начинают распространяться и в нашей стране. В этой связи приобретает важное значение русскоязычная терминология в этой области.
Платформа XML имеет благоприятные перспективы для широкого практического применения. В пользу этого свидетельствуют не только богатые функциональные возможности рассмотренного семейства стандартов, но и высокая активность в области разработки и развития стандартов, а также производства программного обеспечения, на них основанного.
2.3 Язык разметки документов
XHTML
Языки HTML и XML предназначены для решения разных задач. Если мы попытаемся предвидеть будущие требования к языкам разметки и присмотримся к появляющимся технологиям, то увидим, что все более настоятельно проявляется необходимость в объединении возможностей этих языков.
Учитывая прекрасную структуру XML и место, реально занимаемое HTML в практике Web-дизайна, рабочая группа, связанная с консорциумом W3C, начала обсуждение возможностей объединения HTML и XML. В результате появился XHTML. Появление XHTML означает, что HTML переопределяется как приложение XML. Отныне HTML уже не двоюродный брат XML, а близнец потомка XML, следовательно, он должен подчиняться правилам XML.
Практически все современные браузеры поддерживают XHTML. Он также совместим и со старыми браузерами, т. к. в основе XHTML лежит HTML. Такая совместимость, к сожалению, в числе прочего, замедляет процесс перехода от HTML к XHTML.
Настоящая сила XHTML проявляется в его сочетании с каскадными таблицами стилей. Это позволяет отделить оформление документа от его содержимого.
Отличия переходного (англ. transitional) XHTML от HTML незначительны и предназначены лишь для приведения его в соответствие с XML. Самое главное требование заключается в том, чтобы все тэги были правильно вложены и семантически развиты. Кроме того, в XHTML все теги должны записываться строчными буквами, все атрибуты (включая численные) должны быть заключены в кавычки (что не является обязательным в SGML и, следовательно, в HTML, где кавычки не требуются для чисел и некоторых символов, включая все буквы). Также все элементы должны быть закрыты, включая те, которые не имеют закрывающего тега (закрываются добавлением слэша ('/') в конец тега). Минимизация атрибутов (к примеру <option selected> или <td nowrap>) также воспрещена.
В стандарте XHTML предлагается три варианта целевого языка для представления HTML-документов и тем самым три версии DTD
:
Вариант XHTML Strict полностью отделяет содержание документа от оформления, многие атрибуты (такие как, например, bgcolor и align) более не поддерживаются. Предназначен для чисто структурной разметки без применения элементов форматирования. Для целей форматирования можно при этом дополнительно использовать язык каскадных таблиц стилей (CSS).
Вариант XHTML Transitional будет, вероятно, наиболее популярным. Он допускает использование таблиц стилей, но имеется в виду, что будет внесена некоторая небольшая коррекция в разметку с тем, чтобы документ мог восприниматься и старыми браузерами, которые не поддерживают таблиц стилей. Предназначен для лёгкой миграции из HTML и для тех, кто использует инлайн-фрэймы.
Вариант XHTML Frameset обеспечивает поддержку фреймов. Это позволяет разбить окно браузера на несколько разделов (фреймов), с которыми ассоциируется некоторый набор функций управления.
Но существуют и специализированные дополнительные версии XHTML.
Заключение
Часто приходится слышать, что WWW - это очень просто. Однако за этой кажущейся простотой скрывается хорошо продуманная сложная система. При этом следует заметить, что система бурно развивается.
Глобальная информатизация общества приводит к тому, что потребность в информации, растет с каждым новым пользователем сети. При этом задачей специалистов в области информационных технологий обеспечить пользователей полной и достоверной информацией путем простого и удобного для пользователей доступа к накопленным массивам данных.
Гипертекстовая технология позволяет быстро и точно осуществить поиск необходимой информации не только в рамках отдельных документов на компьютера и web-страниц, созданных с их использованием, но и в локальных вычислительных сетях и всемирной сети Internet.
Идея гипертекстовой информационной системы состоит в том, что пользователь имеет возможность просматривать документы (страницы текста) в том порядке, в котором ему это больше нравится, а не последовательно, как это принято при чтении книг.
Простой на первый взгляд механизм построения ссылок оказывается довольно сложной задачей, т. к. можно построить статические ссылки, динамические ссылки, ассоциированные с документом в целом или только с отдельными его частями.
Расширение понятия гипертекста происходит за счет других информационных ресурсов, включая графику, аудио- и видео-информацию, до понятия гипермедиа.
Безусловно у электронных гипертекстовых систем есть множество преимуществ, по сравнению с обычными печатными текстами. Например:
- двунаправленный характер ссылок, по сравнению с направленными только вперед ссылками обычных текстов;
- комментарии к тексту могут быть сделаны в самом тексте, не нарушая в то же время его целостность;
- однажды пройденный маршрут легко запоминается и может быть автоматически пройден многократно; это равносильно тому, что читатель формирует свой личный текст;
- электронная форма представления текста позволяет автоматизировать процесс формирования массива ключевых слов путем автоматического компьютерного анализа текста, и прочие преимущества.
Но при всем многообразии преимуществ прослеживается и ряд недостатков:
- у пользователя теряется ощущение собственного положения и движения в многомерном документе и появляется дополнительная умственная нагрузка для выбора оптимального пути изучения материала;
- чтобы электронная гипертекстовая система была эффективной для пользователя, электронное информационное пространство должно быть достаточно обширным, а применяемые технические средства достаточно мощными;
- создание электронных гипертекстовых систем требует новых подходов к проблеме защиты авторского права: во-первых, это совместный труд большого числа специалистов (в том числе программистов); во-вторых, развитый аппарат электронных гипертекстовых систем обеспечивает возможность непосредственного включения в данную систему текстов других авторов.
При подготовке данной курсовой работы был изучен материал из нескольких книг, в которых поднимались вопросы гипертекстовой технологии, так же были использованы материалы глобальной сети Интернет с таких сайтов как http://www.citforum.ru – аналитическая информация, http://ru.wikipedia.org.
Подготовка этого курсового проекта очень помогла мне понять суть гипертекстовой технологии, необходимость гипертекста в жизни современного активного человека.
Материал данной курсовой работы дает необходимые сведения о гипертексте и пищу для размышлений, о нем можно рассказать еще много интересного и познавательного, для этого следует обратиться к специальным статьям, книгам и прочей информации, посвященной различным аспектам вопросов, посвященным гипертекстовым технологиям.
Глоссарий
№ п/п
|
Новое понятие
|
Содержание
|
1
|
2
|
3
|
1
|
Веб-сайт
|
в компьютерной сети объединённая под одним адресом (доменным именем или IP-адресом) совокупность документов частного лица или организации |
2
|
Всемирная паутина
|
распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету |
3
|
Гиперссылка
|
это объект Web-страницы, содержащий информацию об адресе другой Web-страницы |
4
|
Гипертекст
|
особая форма организации текстового материала, при котором его смысловые единицы (фразы, абзацы, разделы) представлены не в линейной последовательности, а как система возможных переходов и связей между ними |
5
|
Гипертекстовая технология
|
это представление текста в виде многомерной иерархической структуры типа сети |
6
|
Информационный ресурс
|
используемые в приложениях данные, которые представлены в базах данных, базах знаний, на Web-сайтах, в отдельных файлах различной природы или в процедурной форме с помощью продуцирующих их программных средств. |
7
|
Метаданные
|
свойства данных, определяющие их структуру, допустимые значения и способы их представления, взаимосвязи с другими данными, размещение и другие характеристики данных, которые помогают правильно их интерпретировать и использовать |
8
|
Слабострукткрированные данные
|
такие данные, которые в отличие от данных в БД не имеют регулярной структуры, определяемой с помощью предписывающей схемы. |
9
|
Тэг
|
специальная инструкция языка разметки документов |
10
|
Язык разметки документов
|
набор тэгов, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры |
Библиографический список
1. Барановская, Т.П.
Информационные системы и технологии в экономике: Учебник. – М.: Финансы и статистика, 2003.
2. Гохберг
Г. С. Информационные технологии [Текст] / Г. С. Гохберг [и др.]. – М. : Академия, 2007. с.123-141 ISBN 5-7695-1643-7
3. Закарян, И.
Что такое Internet, WWW и
HTML
. Первое знакомство [Текст] / И. Закарян, В. Рафалович. – М. : Интернет-Трейдинг, 2003
. ISBN: 5-86225-478-1
4. Информатика и информационные технологии [Текст] / И. Г. Лесничая [и др.]. – М. : ЭКСМО, 2006.
5. Коноплева, И.А.
Информационные технологии [Текст] / И. А. Коноплева. – М. : Проспект, 2007.ISBN 978-5-390-00286-5
6. Леонтьев, В.П
. Большая энциклопедия компьютера и Интернета. – М.: ОЛМА-ПРЕСС Образование, 2005. – 1104 с.
7. Олифер, В.Г.
Компьютерные сети. Принципы, технологии, протоколы
[Текст]/ В.Г. Олифер, Н.А Олифер
– Спб.: Питер, 2002.
8. Сервер Информационных технологий [Электронный ресурс] – режим доступа:
www.citforum.ru
9. «Википедия» [Электронный ресурс] – режим доступа:
http://ru.wikipedia.org
10. «Самоучка» [Электронный ресурс] – режим доступа: http://samouchka.net
Приложение А
Рисунок 1. Упрощенная архитектура системы, обеспечивающей интеграцию информационных ресурсов XML и SQL
[1]
«Википедия» [Электронный ресурс] – режим доступа: http://ru.wikipedia.org
|