Martin Sévigny - Frédéric Glorieux - AJLSM

Origine de XML

Résumé

Aucun standard ne nait de rien, et bien heureusement, ainsi chaque norme s'enrichit d'une expérience. XML a abouti à une recommandation en 1998, suite au succès d'un schéma "SGML" particulier, "HTML". Quelles réflexions ont présidé à l'élaboration du standard ?

1.1. SGML, le père spirituel
1.2. HTML, le cousin chéri, mal aimé puis renié
1.3. De l'ISO au W3C
1.4. L'avenir de XML

1) SGML, le père spirituel

Fondamentalement, XML apporte bien peu par rapport à SGML, le Standard Generalized Markup Language, ou ISO 8879:1986. En fait, on peut formellement dire que XML est un sous-ensemble de la norme ISO 8879. Qui dit sous-ensemble dit nécessairement moins de fonctionnalités, et c'est le cas avec XML.

Pourquoi faire tout un plat de XML alors que SGML est disponible depuis plus de 15 ans ? Difficile de trouver une réponse précise à cette question, mais on peut tout de même avancer ces quelques éléments :

  • SGML est une norme ISO, et souvent les normes ISO sont considérées comme inaccessibles ou inintéressantes à l'ère Internet ;

  • SGML a toujours été utilisé dans des systèmes documentaires très complexes, à très important volume d'information ;

  • SGML est d'une souplesse telle que les utilisateurs sont favorisés mais pas les développeurs d'applications ;

  • SGML impose certaines contraintes qui limitent sa facilité d'utilisation dans un réseau tel Internet ;

  • SGML impose certaines contraintes qui diminuent les performances des systèmes documentaires.

D'autres facteurs ont limité l'utilisation et l'intérêt de SGML récemment, mais ces facteurs se retrouvent aussi dans XML.

Pour tous ceux qui s'intéressent à l'histoire de la conception et de la normalisation de XML, avec en plus des éléments d'information sur l'histoire de SGML et de ses acteurs, je conseille vivement de lire The Annotated XML Specification, de Tim Bray, l'un des pères de XML. Il faut tout particulièrement lire les annotations de type historique ou culturelle, dénotées par la lettre H.

2) HTML, le cousin chéri, mal aimé puis renié

Théoriquement, la plus belle application documentaire avec SGML est le Web lui-même, car HTML est défini de façon formelle comme une application SGML. Théoriquement, parce que dans la pratique, aucun outil HTML populaire, des navigateurs aux éditeurs, n'a considéré HTML comme une application SGML.

HTML a permis la mise en place rapide du Web, le plus important système d'informations jamais conçu. Grâce à sa simplicité et sa puissance, de nombreuses personnes ont pu concevoir des sites Web simples ou complexes.

Fondamentalement, HTML est une mauvaise utilisation de SGML. En effet, plusieurs types de structuration sont possibles, et les logiciels et les auteurs ont presque tous choisi les pires formes.

Aujourd'hui, on constate les limites de HTML, fondamentalement parce qu'on réalise qu'il est quasiment impossible de réutiliser de l'information codée en HTML, mais aussi parce qu'on réalise qu'il peut être très utile de réutiliser de l'information électronique!

SGML aurait pu solutionner les problèmes de HTML, mais on a décidé qu'il fallait une norme à la mode Internet, et c'est ainsi qu'XML est né, de la tête et de l'esprit de la plupart des spécialistes SGML dans le monde. Avant que les grandes compagnies informatiques ne s'en mêlent.

3) De l'ISO au W3C

La normalisation de XML s'est faite dans le cadre du W3C, mais à une époque (1997 essentiellement) ou le W3C était plus petit qu'aujourd'hui et surtout moins tiraillé par la compétition entre les membres. Mais il ne faut pas oublier que pour participer aux discussions et au processus de normalisation du W3C, il faut en faire partie.

Aujourd'hui, la normalisation au sein du W3C est difficile. En effet, il s'agit d'une structure suffisamment souple pour que de nombreux projets de normalisation soient lancés, mais en même temps ces projets arrivent difficilement à terme, surtout lorsque des normes sont importantes, surtout lorsque des normes sont importantes pour un petit nombre de compagnies qui possèdent un marché.

4) L'avenir de XML

La force de la norme est sa simplicité, elle ne sera pas modifiée. Par contre on découvre et attend toujours plus de standards associés. (XSLT2, XForms, Xquery ...), beaucoup de groupes de travail rédigent des spécifications qui ne demandent plus qu'à être implantées.