Reguły składni XML
Zasady składni XML są bardzo proste i logiczne. Zasady są łatwe do nauczenia i łatwe w użyciu.
Dokumenty XML muszą mieć element główny
Dokumenty XML muszą zawierać jeden element główny , który jest rodzicem wszystkich pozostałych elementów:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
W tym przykładzie <note> jest elementem głównym:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Prolog XML
Ta linia nazywa się prologiem XML :
<?xml version="1.0" encoding="UTF-8"?>
Prolog XML jest opcjonalny. Jeśli istnieje, musi znajdować się na pierwszym miejscu w dokumencie.
Dokumenty XML mogą zawierać znaki międzynarodowe, takie jak norweskie øæå lub francuskie êèé.
Aby uniknąć błędów, należy określić używane kodowanie lub zapisać pliki XML jako UTF-8.
UTF-8 to domyślne kodowanie znaków dla dokumentów XML.
Kodowanie znaków można przestudiować w naszym samouczku dotyczącym zestawu znaków .
UTF-8 jest również domyślnym kodowaniem dla HTML5, CSS, JavaScript, PHP i SQL.
Wszystkie elementy XML muszą mieć znacznik zamykający
W XML pominięcie zamykającego znacznika jest nielegalne. Wszystkie elementy muszą mieć tag zamykający:
<p>This is a paragraph.</p>
<br />
Uwaga: Prolog XML nie posiada znacznika zamykającego! To nie jest błąd. Prolog nie jest częścią dokumentu XML.
Tagi XML uwzględniają wielkość liter
W tagach XML rozróżniana jest wielkość liter. Znacznik <Letter> różni się od znacznika <letter>.
Tagi otwierające i zamykające muszą być napisane z tą samą wielkością liter:
<message>This is correct</message>
„Etykiety otwierające i zamykające” są często określane jako „Etykiety początkowe i końcowe”. Użyj tego, co wolisz. To jest dokładnie to samo.
Elementy XML muszą być prawidłowo zagnieżdżone
W HTML możesz zobaczyć niewłaściwie zagnieżdżone elementy:
<b><i>This text is bold and italic</b></i>
W XML wszystkie elementy muszą być odpowiednio zagnieżdżone w sobie:
<b><i>This text is bold and italic</i></b>
W powyższym przykładzie „Właściwie zagnieżdżone” oznacza po prostu, że ponieważ element <i> jest otwarty wewnątrz elementu <b>, musi być zamknięty wewnątrz elementu <b>.
Wartości atrybutów XML muszą być zawsze cytowane
Elementy XML mogą mieć atrybuty w parach nazwa/wartość, tak jak w HTML.
W XML wartości atrybutów muszą być zawsze cytowane:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Referencje jednostek
Niektóre znaki mają w XML specjalne znaczenie.
Jeśli umieścisz znak taki jak "<" wewnątrz elementu XML, wygeneruje błąd, ponieważ parser zinterpretuje go jako początek nowego elementu.
Spowoduje to wygenerowanie błędu XML:
<message>salary < 1000</message>
Aby uniknąć tego błędu, zastąp znak „<” odwołaniem do jednostki :
<message>salary < 1000</message>
W XML istnieje 5 predefiniowanych odniesień do encji:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Tylko znaki < i & są całkowicie nielegalne w XML, ale dobrym zwyczajem jest zastąpienie > przez > także.
Komentarze w XML
Składnia pisania komentarzy w XML jest podobna do składni HTML:
<!-- This is a comment -->
Dwie myślniki w środku komentarza są niedozwolone:
<!-- This is an invalid -- comment -->
Białe znaki są zachowywane w XML
XML nie obcina wielu białych znaków (HTML przycina wiele białych znaków do jednej białej spacji):
XML: | Hello Tove |
HTML: | Hello Tove |
XML przechowuje nową linię jako LF
Aplikacje Windows przechowują nowy wiersz jako: powrót karetki i wysuw wiersza (CR+LF).
Unix i Mac OSX używają LF.
Stare systemy Mac używają CR.
XML przechowuje nową linię jako LF.
Dobrze uformowany XML
Dokumenty XML, które są zgodne z powyższymi regułami składni, są określane jako „dobrze uformowane” dokumenty XML.