Martin Sévigny - Frédéric Glorieux - AJLSM

Noeuds
Structure d'un document XML

Résumé

Dans cette section, nous allons présenter les composants de base d'un document XML. Ils peuvent être appelés noeuds [DOM]. Pour bien suivre, il est conseillé de consulter en parallèle des exemples de documents. Les descriptions que l'on retrouve dans ces sections ne sont pas formelles, elles visent plutôt à simplifier les concepts. Pour connaître tous les détails, il est préférable de consulter la norme.

Menu

Les éléments
Les attributs

<element attribut="valeur"/>. 

  • Un attribut est une paire nom-valeur associée à un élément.

  • Un élément ne peut pas avoir deux attributs de même nom.

  • Un attribut ne peut être nul, il a toujours une valeur, même si c'est la chaîne vide (contrairement à SGML/HTML).

Le texte

Unicode.  Un document XML, c'est d'abord du texte (balisé). L'objet ne semble pas poser de problèmes informatiques insurmontables, pourtant, il y a loin entre une suite de bits, d'octets, de nombres en toutes bases, et nos lettres, et les autres alphabets, et les caractères chinois ou égyptiens.

Les schémas

Les schémas contiennent les règles que doivent respecter un document XML pour être valide. Autrement dit, quels sont les éléments et attributs autorisés, et dans quel ordre. De la même façon qu'on ne conçoit pas une base de données sans avoir déterminé sa structure, on ne devrait pas concevoir un système d'informations basé sur XML sans en avoir conçu le ou les schémas.

Le prologue

Le prologue des documents XML comporte plusieurs informations :

  1. Préciser qu'il s'agit d'un document XML

  2. Identifier le jeu de caractères utilisé

  3. Identifier la grammaire utilisée (le schéma)

Les entités

XML - quelques références

[xml-rec] XML La recommandation W3C . <http://www.w3.org/TR/2000/REC-xml-20001006> .
[tei] TEI - A Gentle Introduction to XML. <http://www.tei-c.org/P4X/SG.html> .
[dom] DOM Modèle Objet d'un Document .