Résumé
La norme XML définit très peu de choses, mais au moins cette idée essentielle : toute information, qu'elle soit de type documentaire ou données, doit pouvoir s'exprimer sans perte dans un format texte. Cette section, plutôt à destination des administrateurs de systèmes, réunit quelques analyses et réflexions sur un processus d'information XML.
Un documents XML est une abstraction sémantique. S'il on souhaite distinguer le contenu, c'est justement pour se donner toute liberté de présentation pour la diffusion. Il existe évidemment des présentations immédiates, en particulier pour l'édition (éditeurs spécialisés, navigateurs), mais l'intérêt de ce format réside surtout dans la fluidité de ses possibles transformations.
Un document XML est un arbre de noeuds. Cette nature hiérarchique est plus souple et large que de nombreux autres formats (tables, champs). De plus, cet arbre peut être contraint par un schéma, assurant l'homogénéité d'une collection de documents. Ces aspects, appartenant à la nature même de la norme, l'orientent tout directement pour en faire le format privilégié de documents structurés.
Les documents XML sont de bons candidats pour la conservation à long terme, et ce pour les raisons suivantes:
Le format est normalisé
Les documents sont indépendants des plates-formes ou systèmes ou logiciels
Les informations sont autodécrites
Les documents peuvent être lisibles à l'oeil
Les documents XML sont complètement indépendants des plates-formes, des logiciels, des systèmes d'exploitation, etc. De plus, leur nature hiérarchique permet de représenter des structures de données fort complexes. Ces deux raisons font en sorte que cette norme est utilisée comme le principal format d'échange de données entre systèmes hétérogènes, par exemple des bases de données.
Sortir tous les noms d'auteurs d'un livre, établir automatiquement une table des matières, faire la somme d'une colonne... toutes ces opérations (et bien d'autres) sont possibles avec des documents XML. Il suffit d'avoir balisé l'information au préalable, ensuite, XPath permet d'explorer les hiérarchies en détail.