DTD - Bloki konstrukcyjne XML
Głównymi blokami konstrukcyjnymi dokumentów XML i HTML są elementy.
Bloki konstrukcyjne dokumentów XML
Patrząc z punktu widzenia DTD, wszystkie dokumenty XML składają się z następujących bloków konstrukcyjnych:
- Elementy
- Atrybuty
- Podmioty
- PCDANE
- CDATA
Elementy
Elementy są głównymi blokami konstrukcyjnymi dokumentów XML i HTML.
Przykładami elementów HTML są "body" i "table". Przykładami elementów XML mogą być „uwaga” i „wiadomość”. Elementy mogą zawierać tekst, inne elementy lub być puste. Przykładami pustych elementów HTML są "hr", "br" i "img".
Przykłady:
<body>some text</body>
<message>some text</message>
Atrybuty
Atrybuty dostarczają dodatkowych informacji o elementach .
Atrybuty są zawsze umieszczane wewnątrz znacznika otwierającego elementu. Atrybuty zawsze występują w parach nazwa/wartość. Następujący element „img” zawiera dodatkowe informacje o pliku źródłowym:
<img src="computer.gif" />
Nazwa elementu to „img”. Nazwa atrybutu to „src”. Wartość atrybutu to „computer.gif”. Ponieważ sam element jest pusty, jest zamykany znakiem „/”.
Podmioty
Niektóre znaki mają specjalne znaczenie w XML, na przykład znak mniej niż (<), który definiuje początek znacznika XML.
Większość z Was zna encję HTML: „ ”. Ta jednostka „bez łamania spacji” jest używana w HTML do wstawiania dodatkowej spacji w dokumencie. Encje są rozwijane, gdy dokument jest analizowany przez parser XML.
Następujące encje są predefiniowane w XML:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDANE
PCDATA oznacza przeanalizowane dane znakowe.
Pomyśl o danych znakowych jako o tekście znajdującym się między znacznikiem początkowym a znacznikiem końcowym elementu XML.
PCDATA to tekst, który zostanie przeanalizowany przez parser . Tekst zostanie przeanalizowany przez parser pod kątem encji i znaczników .
Tagi wewnątrz tekstu będą traktowane jako znaczniki, a elementy zostaną rozwinięte.
Jednak przeanalizowane dane znakowe nie powinny zawierać żadnych znaków &, < ani >; muszą być reprezentowane przez & < i > podmiotów.
CDATA
CDATA oznacza dane znakowe.
CDATA to tekst, który NIE będzie analizowany przez parser . Tagi wewnątrz tekstu NIE będą traktowane jako znaczniki, a elementy nie zostaną rozwinięte.