Guides d'implémentation accompagnant le schéma >> Guide pour les éléments transversaux >> Information géographique
| Date (created) : | 2004-01-05 |
| Date (modified) : | 2004-06-10 |
| Creator : | Bougoüin, , Christine |
| Publisher : | Bordeaux : AJLSM |
| Description (abstract) : |
Ce document explicite le traitement de l'information géographique par le schéma SDAPA. Tout d'abord, il détaille sur les raisons qui ont guidé le choix de la solution adoptée : insertion d'éléments GML dans le schéma SDAPA . Ensuite les points particuliers et les détails de traitement de différents types d'information géographique. Un certain nombre d'exemples codés illustrent ces points. |
Table des matières
Ce document montre comment le schéma SDAPA permet de traiter l'information géographique. Cette information est particulièrement importante pour certaines institutions impliquées dans ce projet, notamment l'Inventaire et les Monuments Historiques.
Il est important de disposer de suffisamment d'informations pour pouvoir ensuite localiser l'objet décrit, sur un plan ou une carte. A cette fin, il faut être capable d'identifier la nature de l'information géographique que l'on traite. Plus celle-ci sera structurée précisément et plus facilement on pourra l'exploiter : positionnement sur une carte, tri par zone.
Ce document se base sur les réflexions effectuées sur le GML (SDAPA et GML). A partir de ces propos et en fonction des besoins répertoriés et des outils disponibles, une position a finalement été adoptée : inclure dans le schéma des éléments GML<1> (Geographical Markup Language) pour traiter le géoréférencement. Cette solution permet de définir des géométries en deux et trois dimensions et surtout d'inclure de l'information directement exportée d'un SIG (Système d'information géographique).
Dès que l'on aborde la notion de couverture géographique, on se heurte à la distinction avec la localisation. Ces deux aspects sont-ils pertinents tout le temps? Comment les distinguer? Le problème est d'autant plus vrai avec l'usage du Dublin Core<2> pour le traitement des métadonnées. Comment, en Dublin Core, traiter la localisation?
La couverture géographique se définit comme une zone géographique concernée par la ressource décrite. Par exemple, dans le cas d'un livre traitant de l'histoire de Bordeaux sous la Révolution, la couverture géographique est facile à déterminer, il s'agit de Bordeaux. Mais cette notion peut très vite devenir plus ambiguë suivant le type d'unité documentaire concernée. Cette question est particulièrement vraie dans le cas d'un monument. Ici, à priori, l'information géographique relève de la notion de localisation plutôt que de la couverture spatiale. Qu'en est-il d'une image représentant un bâtiment ?
Définition de l'élément coverage<3> dans la norme
Dublin Core :
The extent or scope of the content of the resource. Comment: Typically, Coverage will include spatial location (a place name or geographic coordinates), temporal period (a period label, date, or date range) or jurisdiction (such as a named administrative entity). Recommended best practice is to select a value from a controlled vocabulary (for example, the Thesaurus of Geographic Names [TGN]) and to use, where appropriate, named places or time periods in preference to numeric identifiers such as sets of coordinates or date ranges.
Dublin Core Metadata Element Set, Version 1.1: Reference Description, http://www.dublincore.org/documents/dces/.
Dans le traitement de l'information géographique, il faut distinguer deux notions : le géoréférencement et la géolocalisation. Le premier concerne la définition d'un lieu par ses coordonnées géographiques permettant de définir sa position exacte par rapport à un système de référence géodésique. Le second regroupe l'ensemble des éléments qui permettent de déterminer où se trouve le lieu décrit de manière lisible par l'humain (une adresse).
Le schéma SDAPA autorise les deux modes de traitement de l'information géographique.
Problème des multi-géolocalisations
Comment traiter les lieux qui s'étalent sur plusieurs
communes ou départements ? Cette question est
particulièrement cruciale dans le cas du traitement de surface
(zone de fouilles, espaces protégés). Une manière de traiter la
multilocalisation d'un lieu consiste à ordonner les éléments
region, locality de façon
logique. C'est-à-dire pour une zone qui s'étalerait sur deux
communes de deux départments différents, cela
donnait :
Cette solution n'est pas satisfaisante. Elle peut très vite devenir ingérable suivant qu'il y ait plusieurs communes de plusieurs départements dans plusieurs régions.
L'usage de l'élément location devrait plutôt mettre en
évidence les différentes géolocalisations qui s'appliquent de
manière distincte.
La description d'un élément géographique est constituée
d'une succession de propriétés qui décrivent différents aspects
sémantiques. Le schéma permet de traiter aussi bien le cas d'un
lieu que d'un bâtiment et pourquoi pas n'importe quel élément
géographique (montagne, rivière). Dans tous les cas, l'élément
racine est place.
Conformément à l'architecture générale du schéma SDAPA, la
plupart des éléments peuvent être à la racine d'un document, et
acceptent donc un bloc local de métadonnées (info), ce qui est notamment le cas
de place.
Le terme region est utilisé pour
désigner toutes divisions géographiques comprises entre la plus
grande country et la plus
petite locality, divisions
communes à tous les pays, soit la pays et la localité. Comme tous
les autres noms d'éléments du schéma SDAPA, il s'agit d'un terme
anglais et non pas une référence au terme français. Il traduit les
subdivisions administratives comprises entre le niveau pays et le
niveau localité. Il s'agit du niveau qui varie suivant les pays.
Cet élément se répète donc autant qu'il est nécessaire pour situer
sur une carte ou un plan le lieu décrit. Règle : country pour le
pays, locality pour les
divisions administratives ou autre plus petites que la commune
(selon les cas canton, commune, arrondissement municipal,
quartier).
Certains éléments étant utilisés pour coder différentes
notions de géolocalisation, comme par exemple region qui sert pour les régions et
pour les départements, comment distinguer leurs usages ? Ceci
se fait grâce aux attributs :
scheme pour indiquer la liste
d'autorité utilisée quand elle existe (exemple : liste
INSEE des communes, bureau distributeur de la Poste, liste
des départements, liste des pays, liste des régions,
éventuellement la liste de dénominations traditionnelles,
etc.)
role pour définir le type de
division géo-administratives
region code="n° du departement" role="departement" scheme="index-departement">{nom du
département}</region>code pour associer une valeur
codée au contenu de l'élément : le numéro de
département, le code INSEE d'une commune
On peut distinguer deux cas d'utilisation qui n'offrent
d'ailleurs pas les mêmes possibilités de profondeur de
l'information. Il s'agit de l'utilisation de l'enrichissement
sémantique, pour mettre en évidence des informations
relatives à un élément géographique au sein même d'un bloc de
texte grâce à l'élément de niveau texte geoname et la structuration de
l'information géographique en elle-même (équivalent d'une notice
descriptive d'un lieu géographique). Ce dernier cas recoupe aussi
les autres usages de l'élément place comme qualificatif de coverage et comme
traitement de la notion de l'emplacement d'un évènement.
Comment spécifier qu'il est question d'un lieu dans le courant d'un texte? En effet, il peut être intéressant de mettre en évidence un nom géographique dans un paragraphe soit pour lui appliquer un traitement particulier (constitution d'un index des noms géographiques), soit pour lui donner un rendu particulier (en gras, en lettres capitales).
geoname>
</geoname>, en bordure de la <geoname>
</geoname> qui conduit vers <geoname>
</geoname>. Il est situé dans le <geoname>
</geoname>, à l’est du vallon que parcourt l’<geoname>
</geoname>, le ruisseau qui descend de la combe de
Lourmarin.para>Le couple d'attributs id / uri permet éventuellement de
pouvoir lier la mention du nom dans le texte à une notice
géographique plus détaillée ou à son entrée dans un index des
noms géographiques.
geoname uri="URI vers metadonnees">
</geoname>, le ruisseau qui descend de la combe de <geoname id="identifiant_ancre">
</geoname>.para>Il est aussi possible de donner un identifiant à une
localisation elle-même, il suffit de renseigner l'attribut id de l'élément. De cette
manière, il est ensuite possible de signifier que plusieurs
références d'"enrichissement sémantique" se rapportent en fait à
un seul et même lieu. Cela se fait par l'intermédiaire de info>identifier>{identifiant d'un
lieu}.
L'élément geoname est aussi utilisé pour
qualifier les descripteurs géographiques. En fait, il suffit de
se rappeler que l'élément place
traite le géoréférencement et la géolocalisation. Tandis que
geoname est plutôt
pour l'enrichissement sémantique dans le texte. D'une manière
générale, les éléments finissant par name (persname, placename, topicname, geoname) ont cette
fonction ; il s'agit d'éléments de niveau texte au même
titre qu'emphasis.
Avec le
schéma SDAPA, il est possible de constituer des fiches
géographiques ou de décrire à l'intérieur d'autres éléments des
lieux. Il s'agit des cas introduits par l'élément place. Le balisage
de l'information géographique est constituée d'une série
d'informations ordonnées et structurées sémantiquement.
Néanmoins, le schéma est capable de s'adapter à plusieurs
situations, notamment l'importation de notices créées puis
exportées dans un autre logiciel, par exemple l'export GML de
formats shape à partir du logiciel ArcView.
Pour décrire un élément géographique, il faut au moins renseigner son nom. Il est aussi possible de préciser son adresse qui peut être différente de sa localisation (hiérarchie administrative), la personne responsable, ses coordonnées géodésiques.
Trois cas sont possibles :
structure uniquement SDAPA. Mais alors il n'est pas possible de préciser les coordonnées géographiques du lieu, seulement sa géolocalisation.
uniquement GML, mais dans ce cas, il faut être conscient que la sémantique et les métadonnées seront faibles mais que par contre, la description géométrique de l'élément géographique pourra être très détaillée.
une solution mixte qui permet à chacun des schémas de traiter ce pourquoi il est le plus adapté ; soit la géolocalisation pour SDAPA et le géoréférencement pour GML.
Certains éléments géographiques relativement courants peuvent apparaitre peu évidents à traiter. C'est pourquoi leur codage en SDAPA va être détaillé ici.
En dehors des divisions administratives courantes pays-region-département-commune, il existe d'autres divisions possibles. Comment ces dernières sont-elles traitées par le schéma SDAPA ?
La commune ou localité représente dans la plupart des pays la plus petite subdivision administrative qui est régie par des représentants élus.
Canton
Le problème d'un canton est que suivant la taille de la commune correspondante, le canton est ou plus grand que la commune ou plus petit. Le canton est une division "politique" car il constitue une circonscription en vue de certaines élections. Ainsi dans les villes, un canton correspond à une division territoriale d'un arrondissement alors qu'en zone rurale, la surface d'un canton peut s'étaler sur plusieurs communes. Néanmoins cette notion est utilisée dans certains métiers pour zoner le territoire français, notamment pour l'Inventaire. En dehors de ce contexte particulier, cette division n'a de sens que du point de vue des élections. En général, on parle du canton de telle ou telle commune mais on peut aussi parler du canton untel ; en fait les cantons peuvent avoir leur propre identité (soit indépendamment d'une commune, particulièrement en milieu rural). Le canton est aussi inclus dans un arrondissement. Toutefois les cantons évoluent en fonction de la démographie ; des cantons peu peuplés disparaissent d'autres surpeuplés sont divisés. Il ne s'agit donc pas d'une division pérenne (susceptibles d'évoluer tout comme les communes qui parfois changent de nom suite à des regroupements).
Arrondissement
Un arrondissement est une division territoriale, subdvision administrative entre le département et le canton pour les villes. Un arrondissement n'existe que par rapport à une ville. Il existe deux types d'arrondissements en France : l'un est une circonscription administrative à l'intérieur du département et l'autre, les arrondissements municipaux, est une division interne à certaines grandes villes. L'arrondissement peut lui-même être subdivisé en cantons et en communes. L'administration de l'arrondissement est confiée à un sous-préfet. Dans le premier cas, l'arrondissement est indépendant des communes, en fait il porte le nom de la sous-préfecture qu'il contient. Dans le deuxième cas, celui de l'arrondissement municipal, il est associé à la ville qu'il sectionne (Paris XVIIIème, Lyon V). Seules trois villes en France sont dans ce cas : Paris, Lyon et Marseille.
Quartier
Dans un certain sens, on peut considérer qu'un quartier se rapproche de la notion d'arrondissement municipal. Il s'agit d'un découpage supplémentaire d'une ville, sans valeur administrative.
Cadastre
Chaque commune dispose de son découpement parcellaire
cadastral. Aussi il paraît évident de considérer qu'une
parcelle cadastrale est une subdivision d'une commune. D'où
l'usage de l'élément locality pour coder cette
information.
Il est aussi possible de traiter avec le schéma SDAPA des entités géographiques, telles que des rivières, des montagnes, bref n'importe quel élément du relief. Néanmoins pour ce type d'objet géographique, il est recommandé d'utiliser plutôt des éléments issus du schéma GML, plus adapté. En effet, si l'on ne veut utiliser que les éléments propres de SDAPA, il n'est d'abord pas possible de donner les coordonnées ensuite la seule information qui s'applique est finalement le nom et la géolocalisation. Quelles informations structurées peut-on donner pour localiser une rivière ? La suite des communes ou des départements qu'elle traverse ? D'ailleurs est-ce utile de vouloir géolocaliser une rivière, une montagne ou tout autre élément du relief ?
Pour décrire une rivière, plutôt que de la géolocaliser, il est plus intéressant de la géoréférencer (donner l'ensemble des coordonnées des segments qui la dessinent). Ceci se fait à l'aide d'éléments GML.
Pour une montagne, c'est à priori plus simple. En effet, il est plus facile de la géolocaliser.
Dans certains cas (photographies, classement MH), l'objet documentaire à géolocaliser peut être une voie de circulation (ou l'ensemble des bâtiments qui la bordent). Là aussi, la description géométrique par des éléments GML semble plus adaptée que la géolocalisation, surtout si la voie décrite s'étend sur plusieurs communes, voire départements. Dans le cas où la voie décrite n'est pas trop longue, la géolocalisation est aussi utile pour la situer précisément.
<1> http://www.opengis.org/docs/02-023r4.pdf (GML)
<2> http://www.dublincore.org/ (Dublin Core)
<3> http://dublincore.org/documents/2003/11/19/dcmi-terms/#coverage (coverage)