Résumé
Dans cette section, nous allons présenter les composants de base d'un document XML. Ils peuvent être appelés noeuds [DOM]. Pour bien suivre, il est conseillé de consulter en parallèle des exemples de documents. Les descriptions que l'on retrouve dans ces sections ne sont pas formelles, elles visent plutôt à simplifier les concepts. Pour connaître tous les détails, il est préférable de consulter la norme.
<element attribut="valeur"/>.
Un attribut est une paire nom-valeur associée à un élément.
Un élément ne peut pas avoir deux attributs de même nom.
Un attribut ne peut être nul, il a toujours une valeur, même si c'est la chaîne vide (contrairement à SGML/HTML).
Unicode. Un document XML, c'est d'abord du texte (balisé). L'objet ne semble pas poser de problèmes informatiques insurmontables, pourtant, il y a loin entre une suite de bits, d'octets, de nombres en toutes bases, et nos lettres, et les autres alphabets, et les caractères chinois ou égyptiens.
Les schémas contiennent les règles que doivent respecter un document XML pour être valide. Autrement dit, quels sont les éléments et attributs autorisés, et dans quel ordre. De la même façon qu'on ne conçoit pas une base de données sans avoir déterminé sa structure, on ne devrait pas concevoir un système d'informations basé sur XML sans en avoir conçu le ou les schémas.
Le prologue des documents XML comporte plusieurs informations :
Préciser qu'il s'agit d'un document XML
Identifier le jeu de caractères utilisé
Identifier la grammaire utilisée (le schéma)