Guides d'implémentation accompagnant le schéma >> Guide pour les éléments transversaux >> Encodage XML/Dublin Core et modèle Illustration
| Date : | 2003-07-25 |
| Creator : | Glorieux, , Frédéric |
| Publisher : | , DAPA |
| Description : |
Le système descriptif de l'Illustration est un modèle utilisé pour décrire les documents figurés des bases nationales. Il sert de référence pour toutes les descriptions d'images des métiers du ministère. Aussi le schéma SDAPA doit-il être capable de le "traiter". Le modèle de l'Illustration et le schéma SDAPA n'ayant pas les mêmes objectifs, il y a des adaptations à faire. Ce document montre comment faire correspondre ces deux systèmes. |
Table des matières
Ce document propose un encodage XML / Dublin Core du système descriptif de l'Illustration, utilisé dans la base Mémoire<1> du Ministère de la culture et plus généralement comme modèle pour encoder l'information descriptive de documents figurés (photo, carte, plan, phototype, etc.). Cette première approche, pertinente dans le cadre du projet de création du schéma SDAPA car celui-ci est en partie basé sur le Dublin Core, permet de mesurer les principaux problèmes qu'il peut y avoir entre deux modèles aux approches différentes. En effet, l'Illustration est un système descriptif spécialisé pour les documents figurés et notamment les photographies. Tandis que le Dublin Core<2> est un modèle généraliste et simple pour des métadonnées.
Bibliographie
Dans Illustration, les principaux points traités sont les suivants :
La définition du document original versus le document
reproduit source
La description technique format
La localisation géographique coverage
Les références à des thesauri subject
Les données locales info
Liens vers des documents reliés
Il s'agit ici de surtout prêter attention au formalisme XML proposé par le schéma SDAPA pour traduire les exigences du système descriptif en tenant compte des remarques et évolutions relatives à son application.
Précipité dans une perspective documentaire généraliste, le modèle de données appliqué dans la base de données Mémoire prouve sa résistance et sa précision. Bien d'autres projets pourraient tirer parti de cette expérience. Une version XML permet d'en corriger un premier défaut, le nommage des champs (contraint par une technologie à des noms courts et en capitales). XML facilite aussi le groupage de l'information (distinction entre informations sur le document, et champs de contrôle). Il autorise aussi la répétition des éléments, ce qui évite l'inflation de noms du genre CHAMP1, CHAMP2 (particulièrement commode pour multiplier des relations interprétées par un système local). Certains problèmes ont cependant été rencontrés.
Titre
Quand on consulte des exemples d'enregistrement, on observe qu'ils n'ont pas tous des titres significatifs hors de tout contexte. En effet, le titre est généralement constitué d'un moissonnage de données de diverses provenances. Or assez simplement on pourrait souhaiter lire : Ville (n° de département) nom commun de l'édifice, nom commun de l'objet ?, légende ?. Cette ligne peut être reconstruite par une application à partir de champs répartis à d'autres endroits de la description. En particulier, ville, département, nom commun de l'édifice proviennent de l'adresse de localisation ; l'emplacement du nom commun de l'objet est à préciser, ainsi que celui d'une légende locale donnant des précisions sur la prise de vue.
Pour toujours considérer les métadonnées d'une illustration comme des données de portée générale, susceptibles d'être communiquées à d'autres systèmes, il n'est probablement pas possible de prévoir tous les cas possibles de légendes contextuelles, largement dépendantes du projet rédactionnel d'un auteur (ou d'un système). Un document généré sur un édifice n'a besoin que d'une légende précisant par exemple "vue aérienne", "façade sud", que ses métadonnées doivent pouvoir fournir ; un "parcours" sur un quartier n'a besoin que du nom de l'édifice. Par contre, une étude thématique (ex : "les toits aux sources du Lot") pourrait importer l'image et sa notice pour soutenir un autre propos (ex : "légende - nef en pierre sèches").
Une chose importante à noter est que le titre constitue dans un système d'information une clé d'accès et d'identification essentielle, c'est pourquoi il doit être explicite et représentatif de l'objet décrit.
Thesauri
Le contenu d'un certain nombre de champs de l'Illustration est assujetti à un contrôle lexical. Or quand on observe un enregistrement de la base Mémoire, il n'est pas possible d'identifier les champs soumis à un langage documentaire. En effet, seule la connaissance des spécifications d'édition d'un enregistrement le permet. Cependant cette information peut être intéressante à conserver et à notifier dans un enregistrement.
La liaison à des thesauri de désignation est une information essentielle, cependant, elle ne permet pas toujours de constituer un nom commun pour la désignation de l'édifice, il s'agit plutôt de descripteurs.
Auteurs
Un certain nombre d'acteurs interviennent dans le processus relatif à un objet. Cela soulève l'ambiguïté entre "créateurs" et "contributeurs" et leurs "rôles". Une partie de cette problématique relève des outils de reproduction. Comment conserver toute l'information ? A quoi se rapporte-elle : image vectorielle ou matricielle ?
Le problème avec les éléments graphiques est qu'il existe en général sous plusieurs formes et à différents niveaux d'une chaîne de reproduction : il s'agit entre autres de différencier le document original de ses reproductions et du coup les auteurs de tous ces objets. En plus, de tout cela, viennent se greffer les informations relatives à l'objet représenté.
Dans Illustration, cette problématique est représentée par
les champs EMET - Code du service émetteur, AUT - Auteur du
phototype, AUTD - Auteur du document graphique, AUTOR - Auteur du
document reproduit. Dans ce cas, il faut faire attention à ne pas
mélanger les informations relatives à l'objet décrit, ses autres
formes et ce qu'il représente. Ici, EMET correspond au publisher de la notice descriptive de
l'objet, AUT ou AUTD au creator,
auteur de l'objet décrit, et AUTOR est relatif à l'objet
représenté qui est décrit dans relation
> resource > info.
Relations
La problématique des relations entre divers documents est un point essentiel à résoudre dans le cadre d'une mise en place des dossiers électroniques et donc du schéma SDAPA. En effet, les mêmes documents peuvent intervenir dans plusieurs processus, des documents sont constitués à partir d'autres documents ou s'y référent. Quel que soit le cas, les liens existants doivent perdurer avec le schéma SDAPA et de nouveaux utiles à la gestion et inhérents à la nature de dossier électronique sont à considérer.
La notice d'une illustration est susceptible de nombreuses relations avec d'autres ressources. Il s'agit d'abord de distinguer les relations de portée générale (liens fermes vers des versions numériques, sources bibliographique ou d'archives, notices et documents sur l'image...), qu'on souhaiterait être des URI absolues ; et les relations contextuelles à un système hébergeant (souvent des URI relatives, parfois des codes), soit la navigation, les renvois vers un index, un glossaire, des notes, etc. Une politique d'URI pérennes pour identifier des ressources déborde de la portée de ce schéma, même s'il y encourage. On souhaiterait que le récepteur des notices puissent avoir les informations suivantes :
URI absolue de la notice consultée. Exemples : URIs d'autres versions (format, ou langue).
URI absolue d'un fichier numérique en taille originale de l'image renseignée. Si disponibles, versions dans d'autres tailles (image vignette, image plein écran, image tiers écran), d'autres formats.
URI absolue vers les notices des oeuvres représentées : exemple liens vers d'autres notices Mérimée, Palissy.
URIs absolues vers d'autres notices du même type (lien de type "voir-aussi", établis par un auteur humain).
Les sources documentaires peuvent être indiquées textuellement : exemple, référence bibliographique de l'ouvrage dont est tiré le document reproduit.
Eventuellement, des relations conventionnelles de navigation (premier, précédent, suivant, dernier, parent, 1er enfant)
On trouvera ici un versement exhaustif des champs du système descriptif de l'Illustration. Les champs sont indiqués par leurs codes. Cependant, il n'est pas inutile de se référer aux exemples, plus éclairant pour résoudre certaines particularités.
record id="notice-memoire" role="graphic"><!-- Cet exemple XML propose un versement des champs du système descriptif de l'Illustration [MCC] en SDAPA. N-B : Cette proposition n'est pas définitive. -->
<!--******************************************** Bloc INFO ********************************************-->
info><!-- titre alternatif, répétable -->
<!-- dates système -->
<!-- numéro de CD et vue dans le CD constituent un identifiant de type DOI <http://www.doi.org/> -->
<!-- identifiant Mérimée et numéro d'ordre, constituent un identifiant de type DOI -->
info><!-- ****************************************** Séquence Dublin Core ****************************************** -->
<!-- titre principal, la légende de l'image dans le contexte d'une notice sur la chose montrée. -->
description>description><!-- Il s'agit ici de préciser le créateur original de la ressource. L'attribut role prend la valeur des codes ORG. <affiliation>ORG</affiliation> -->
<!-- Un contributeur à préciser en cas de reproduction -->
contributor role="Repro">contributor><!-- Un éditeur généré sur l'identifiant EMET -->
<!-- Date éditoriale, fournie par l'émetteur. -->
<!-- L'aire d'étude est une information géographique spécifique à l'organisation -->
<!-- La localisation du sujet représenté doit pouvoir être importée à partir de l'identifiant Mérimée ou Palissy. La suggestion suivante de structuration est encore à l'étude. -->
coverage>place>placename><!-- L'élément <placename/> est conçu pour contenir une hiérarchie administrative de noms précisant un lieu, n'importe où dans le monde. <http://www.tei-c.org/P4X/ND.html#NDPLAC> <http://www.getty.edu/research/tools/vocabulary/tgn/about.html> <http://dublincore.org/documents/dcmi-terms/#coverage> -->
<!-- Il ne faut pas entendre l'élément <region/> dans un sens trop national, il est proposé comme générique pour province, état, département ... -->
placename>address><!-- l'élément <building/> est utilisé comme "complément d'identification du point géographique" <http://www.laposte.com/produits/courrier/fadress.htm> Il peut être employé pour indiquer la dénomination courante d'un édifice. -->
address>place>coverage>description>para>description><!-- généré selon les codes DC -->
<!-- t -->
<!-- Le contenu de l'élément <format/> (<http://dublincore.org/documents/dcmi-terms/#format>) doit permettre de renseigner une description physique de l'objet décrit. La ponctuation peut être fournie à l'avance. Les contenus des éléments peuvent être générés sur la valeur des attributs @code. -->
<!-- propriétés extraites automatiquement Etablir une liste d'autorité pour évaluer les format numérique -->
<!-- référencement d'une source d'archive -->
<!-- référencement d'une source bibliographique -->
<!-- mention d'une publication ou apparaît la ressource -->
relation role="reproduction">resource scheme="monographic">resource>relation><!-- mention d'une exposition ou apparaît la ressource -->
<!-- Relations à d'autres versions de l'image. -->
<!-- identifiants et relations dans le schème d'encodage Inventaire -->
<!-- URL pérenne de la notice consultée ici -->
<!-- URLs pérennes sur d'autres versions de cette notice (.html, .xml, .rdf ; en, de ...) -->
<!-- URLs pérennes sur l'image décrite -->
<!-- URL pérenne vers la notice du sujet représenté, générée. -->
relation role="work" uri="http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=MERIM">relation><!-- la mention des droits, distinguant le copyright et la nature de la licence -->
<!-- La relation avec les thesauri s'effectue avec l'élément répétable <subject/>. Un sujet peut être un nom structuré (<topicname/>) -->
subject scheme="url identifiante du thesaurus utilisé">subject><!-- par exemple -->
record>Les exemples sont tirés de :
Bibliographie
L'encodage insiste surtout sur le caractère spécifique de chaque cas. Des informations sans ambiguïtés peuvent avoir été omises pour améliorer la lisibilité.
record id="morez" role="graphic">title>proper value="façade antérieure de trois quarts gauche">façade antérieure de trois quarts
gauche</proper>title>relation role="work" uri="http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=IA39000550">unqualified/>relation>record>record id="mirambeau" role="graphic">title role="alternate">proper value="Fig. 4. Le château, vue aérienne depuis le nord-est.">Fig. 4. Le château, vue aérienne depuis le
nord-est.</proper>title>contributor>contributor>relation role="work" uri="http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=IA17001556">unqualified/>relation>record>record id="asnieres" role="graphic">title role="alternate">proper value="Fig. 5. Type de la villa urbaine, à mur mitoyen sur l’arrière. Un logement de gardiens donne sur la rue voisine.">Fig. 5. Type de la villa urbaine, à mur mitoyen
sur l’arrière. Un logement de gardiens donne sur la rue
voisine.</proper>title>record><1> http://www.culture.fr/public/mistral/memoire_fr (Mémoire)
<2> http://www.dublincore.org/documents/dcmi-terms/ (Dublin Core)
<3> http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=MERIM ( Notice Mérimée )
<4> http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=IA39000550
<5> http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=IA00042941
<6> http://www.culture.fr/public/mistral/merimee_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=IA17001556