Martin Sévigny - Frédéric Glorieux - AJLSM

Génération
Production de documents XML

1.1. Imports et récupération
1.2. Production

Générer du XML est très simple. Chacun peut s'y essayer avec un simple éditeur de texte. De la même manière, on peut facilement convertir des informations existantes pour des échanges entre systèmes, ou pour entrer dans une chaîne de transformation et de diffusion. Il peut y avoir une difficulté lorsqu'on souhaite tirer tout le parti hiérarchique d'un schéma, et produire directement de l'information nouvelle. Par définition, XML souhaite séparer le contenu de la la présentation. Cette abstraction s'opppose exactement aux habitudes WYSIWYG des logiciels habituels ("What You See Is What You Get"). En XML, on peut bien sûr voir ce qu'on fait, mais ce qu'on fait peut donner bien plus que ce qu'on voit (c'en est tout l'intérêt).

1) Imports et récupération

XML est un standard propre à représenter la plupart des informations (données ou documents) couramment échangées entre systèmes. Cependant, l'import d'informations ne se fait pas également selon les provenances, surtout lorsque le format source est beaucoup moins structuré que le XML souhaité. L'intelligence n'est pas automatisable.

1.1) Documents structurés

L'import de documents xml pose peu de problèmes avec les langages de transformation. Quels que soient les schémas source ou destination, il est généralement possible de réorganiser une information, pourvu qu'elle y soit. Une intervention intelligente est nécessaire lorsque l'on souhaite un degré supérieur de définition, qui ne peut pas être déduit de l'information originale.

1.2) Données tabulaires

Les données tabulaires en relation 1-1 ou 1-n ne posent aucun problème à être traduit en XML, et peuvent être contenues dans un même document. Les relations n-n obligent à des relations entre documents, qui sont plus dépendantes des systèmes hébergeants.

La plupart des fournisseurs de systèmes de gestion de bases de données relationnelles offrent maintenant des produits pour importer et exporter des données en format XML. La conversion est donc automatique. Il existe même des outils introduisant un peu de hiérarchie (par regroupement) dans les structures XML. Mais rappelons-le, le XML produit ne peut pas être mieux que le modèle relationnel dont il provient.

1.3) Texte mis en forme

Passer du texte mis en forme à un document structuré, d'un codage visuel à un balisage sémantique, c'est le défi du sens contre l'apparence. Un système automatique ne pourra pas trouver une distinction que le rédacteur n'a pas inscrite. Le balisage s'opère avec profit lorsque des conventions sont précisément suivies (styles, casse...)  mais une relecture intelligente ne peut qu'être profitable.

La migration d'un système d'information vers XML s'effectue de toute façon avec profit. Un import automatisé conservera toujours la totalité des informations inscrites dans le format source, par contre, le schéma de destination peut faire souhaiter un enrichissement intelligent (plus de rédaction entre les champs d'une table, plus de structure dans un document texte). Ce travail supplémentaire n'est pas causé par XML, mais par les utilisateurs et administrateurs, découvrant les limites de leurs formats précédents.

2) Production

1.2.1. Formulaires
1.2.2. Éditeurs

La production d'XML dans un schéma s'effectue directement dans le degré de définition attendu pour l'information. Il faut cependant distinguer les données représentables par formulaires (avec peu de texte mêlé entre les éléments), et les documents à dominante rédactionnelle.

2.1) Formulaires

Dans cette catégorie on peut regrouper toutes les interfaces de type champ-valeur, avec cette particularité XML de pouvoir répéter les champs (contrairement à une table), et d'ajouter

2.2) Éditeurs

Mais l'outil par excellence pour saisir des documents XML est l'éditeur XML. Il peut y en avoir plusieurs types, mais tous possèdent ces caractéristiques de base:

  • Les documents seront bien formés (pas d'erreur dans les balises)

  • Les documents peuvent être validés (contre un schéma)

  • Une aide à la saisie est proposée (selon les structures du schéma)

Ces éditeurs sont en fait des traitements de documents XML, par analogie avec les traitements de texte. Ils sont moins nombreux et plus dispendieux, mais ils peuvent être d'une très grande utilité. Ils possèdent tous la caractéristique d'être très configurable, permettant ainsi de définir des environnements de saisie très efficaces.

Dans cette catégorie, on retrouve principalement WordPerfect de Corel, XMetaL de Sofquad, Epic de Arbortext, Documentor de Excosoft. Leur prix est respectivement est assez élevé.