XML文書(well-formed XML Document、整形式XML文書)はXML宣言とXMLインスタンス(タグ付けされた文書本文)から成る。
■XML宣言
- XML宣言そのものも省略できるが、記述することが推奨されている。記述した場合、version属性は省略できない。
- 書式 <?xml version="1.0" encoding="文字コード指定"
standalone="yes/no" ?>
- version属性・・・現在の最新versionは"1.0"。現在1.0以外はないので、version属性に1.0以外を指定するとエラーになる。
- encoding属性・・・文字コードを指定。原則はUnicode(UTF-8、UTF-16)を使う。この場合はencoding=を省略できる。Unicode以外の文字コードも使えるが、その場合、XML宣言で種類を指定し、使用する文字コードに対応したXMLプロセッサが必要。
- standalone属性・・・そのXML文書以外の外部DTDやパラメータ宣言を参照するかどうか。"no”を指定すると参照する。参照しない場合、"yes"を指定。省略可だが、記述しておけば読み込みの手間を省け処理効率が上がる。
■XMLインスタンス
- データ構造に合わせて、必要なタグ(要素、element)を自由に定義できる。
- XML文書の一番外側の要素”ルート要素”が1つだけ必須(本サンプルでは<root>〜</root>タグ)。XML文書のその他の全要素はこのルート要素内に配置される。
- 全要素の入れ子(ネスト)構造が完全であること。
- 要素(element)は、開始タグから始まり、必ず終了タグで閉じること。(空要素は例外で、終了タグを省略できる)
- 要素の開始タグ内に、付加情報を設定する属性を記述できる。書式は、<要素名 属性名="属性値">。同じ属性名は使えないが、1つのタグ内に複数の属性をスペースで区切り記述できる。
■要素名、属性名の名前付け規則
- 大小文字は区別される。
- 使用できる文字・・・半角アルファベット、半角数字、ひらがな、漢字、全角カタカナ、半角の結合文字、半角アンダースコア(_)、半角コロン(:)、半角ピリオド(.)、半角ハイフン(-)。ただし、半角数字、半角の結合文字、、半角ピリオド(.)、半角ハイフン(-)は名前の先頭には使えない。
- 予約語とキーワードは使用できない。
- "xml"は単独でも、先頭につく"xml***"も使用できない。
[XML文書を下のフレームに表示](本サンプルはスタイル書式が設定されていないので、XMLソースがそのまま表示されます)
XMLソース
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<root>
<item1>項目1</item1>
<item2>項目2
<sub1>サブ項目1</sub1>
<sub2>サブ項目2</sub2>
</item2>
<末尾>以上です(03/8/7)</末尾>
</root>
end(03/8/8)