Résumé
XML (eXtensible Markup Language), est une norme de balisage de texte issue de l'expérience SGML (1960 - 1970). Elle a été mise au point pour intégrer des gros projets documentaires (aéronautique). La norme s'avère très commode pour structurer bien d'autres informations, et surtout, permettre l'inter-opérabilité entre systèmes variables. La puissance du standard réside dans son indépendance (hors systèmes et applications), ce qui permet la collaboration de nombreuses compagnies et organisations au développement d'outils associés (XML.Schema, XSLT, XHTML ...).
Cette collection d'articles est développée dynamiquement à l'occasion d'interventions. Le contenu et l'organisation peuvent évoluer, mais ils répondent globalement à ce besoin : fournir des supports illustrant des notions XML. Ils ne peuvent suffire à une formation complète, mais peuvent servir d'aide-mémoire aux publics ayant assister à ces interventions.
Dans cette section, nous allons présenter les composants de base d'un document XML. Ils peuvent être appelés noeuds [DOM]. Pour bien suivre, il est conseillé de consulter en parallèle des exemples de documents. Les descriptions que l'on retrouve dans ces sections ne sont pas formelles, elles visent plutôt à simplifier les concepts. Pour connaître tous les détails, il est préférable de consulter la norme.
La norme XML définit très peu de choses, mais au moins cette idée essentielle : toute information, qu'elle soit de type documentaire ou données, doit pouvoir s'exprimer sans perte dans un format texte. Cette section, plutôt à destination des administrateurs de systèmes, réunit quelques analyses et réflexions sur un processus d'information XML.
Les schémas contiennent les règles que doit respecter un document XML pour être valide. Autrement dit, quels sont les éléments et attributs autorisés, et dans quel ordre. De la même façon qu'on ne conçoit pas une base de données sans avoir déterminé sa structure, on ne devrait pas concevoir un système d'informations basé sur XML sans en avoir conçu le ou les schémas.
XML est un format simple, c'est ce qui en fait la valeur. Dans l'idéal, il est conçu pour les Champollions du futur. Les contenus restent lisibles, tandis que la structure s'explique. Même si les alignements disparaissaient, un titre resterait encadré par <titre>titre</titre>, et l'ordre des parties par des emboitements de <section><section>...</section></section>. Partir de simple permet de construire des chaînes de traitement beaucoup plus subtiles que d'autres formats.
Ces articles organisés visent à constituer une introduction à XML. Ils ne prétendent pas faire référence, mais ils peuvent suffire à se faire une courte idée de ce que peut être ce format, de ce qu'il peut apporter dans un système d'information.
Le contenu et la modularisation des articles est certainement perfectible. Critiques et contributions sont accueillies, pourvu que les rédacteurs partagent l'esprit "libre" du projet.
On l'aura deviné, la source de ces documents est en XML. Le schéma initial (DTD) était une adaptation simplifiée et personalisée de docbook. Une transformation a pu être faite sans perte vers une adaptation de xhtml2 (+ autres espaces de noms). La récupération des données à pris moins d'une heure, le changement de la présentation est automatique [Ancienne version], tout le travail a pu se concentrer sur la seule tâche intelligente : le contenu et le plan.