03/02/2004 - Frédéric Glorieux - DAPA

Quelques schémas publics

Résumé

Un effort de modélisation (quel que soit le langage adopté) rencontre généralement des standards. Utilisé comme format d'échange et de diffusion, un schéma XML est souvent documenté publiquement (il est plus rare de trouver un modèle relationnel sur Internet). Cet aspect modifie le processus d'élaboration d'une solution. La recherche documentaire et l'analyse de l'existant sont des phases importantes d'un projet. Elles sont d'autant plus enrichissantes que l'adoption d'un standard permet de bénéficier de ressources libres (transformations, développements) et d'informations d'une communauté plus large d'utilisateurs (documentation, listes). Cette section veillera à renseigner sur des schémas publics, selon le type d'objet concerné.

Schemas, exemples

Menu

XML et les documents structurés

On définira ici quelques éléments d'un document structuré (divisions, blocs ...) afin de présenter et de comparer plusieurs schémas XML "généralistes" (dont HTML, Docbook et TEI), selon qu'on souhaite diffuser, encoder ou créer des documents électroniques.

Bibliographie et XML

La bibliographie est un domaine très "balisé" dans l'informatique documentaire. Comparativement à d'autres milieux, les bibliothèques ont rapidement implanté des formats et des systèmes informatiques de cataloguage. Les normes "MARC" ont permis de répondre à des besoins que d'autres formats (exemple: SQL) ne représentaient pas aussi bien. XML permet de représenter correctement des informations codées en MARC, ainsi que d'autres (exemple: les contenus mixtes), ouvrant de nouvelles perspectives.

Illustrations

Les informations concernant les illustrations sont de plusieurs ordres, dont certaines font déjà partie de modules déjà définis. Une image est :

  • Un lien

  • Une ressource susceptible de métadonnées

  • Une description physique (taille, format, résolution ...)

  • La donnée même de l'image (binaire, vectoriel ...)

Un élément " <image/> " peut ainsi contenir bien des informations différentes.

Contacts
Liens

Il sera fait souvent référence aux DTDs généralistes comme Docbook ou TEI. Dans leur partie, seront aussi étudiés des schémas spécialisés.

Schemas, exemples

[da] DA - Dossier d'artistes. . La Direction des arts plastiques du Ministère français de la culture et la communication, comme de nombreuses organisations, concentre et produit une information d'intérêt public. Elle s'est engagée dans une démarche de dossier électronique XML, afin de : diffuser l'information existanteéchanger entre systèmesproduire de nouveaux dossiers Ce schéma donne un exemple de définition d'un document métier <Artiste> <PrixEtBourses/> <Oeuvres/> <Expositions/>....</Artiste> . Il a été conçu avant que la norme des espaces de noms soit arrêtée, il aurait pu en tirer parti pour une définition plus modulaire de certains aspects (personnes, bibliographies, calendriers).
[docbook] Docbook - schéma généraliste. <http://docbook.org/> . <http://www.docbook.org/tdg/en/html/docbook.html> . <http://www.docbook.org/tdg/simple/en/html/sdocbook.html> . Docbook est une référence incontournable de la production de texte structuré (à distinguer de l'encodage a posteriori). Il fut d'abord conçu comme un format de rencontre pour des projets documentaires ayant chacun leur syntaxe (aéronautique, informatique...) ; ce qui explique la cohabitation de structures concurrentes pour un même objet. La rédaction même de la DTD a donné lieu à la réflexion la plus approfondie sur la "paramétrabilité" d'un schéma. L'adaptation de cet imposant dictionnaire est ainsi encouragée, ce qui n'empêche pas d'employer les nombreux outils libres associés.
[tei] TEI - schéma généraliste. Text Encoding Initiative . <http://www.tei-c.org/> . La TEI ("Text Encoding Initiative", projet de balisage textuel) est une des DTDs les plus anciennes. Elle s'applique d'abord à pouvoir encoder logiquement (sans présager de la présentation), tout ce qui a pu être écrit ou imprimé. Le modèle contient beaucoup d'éléments, il est plus souvent utilisé dans une forme allégée, dite "TeiLite".