sdapa/standards/      Texte structuré   Contact - informa    Bibliographie      Localisation         Les liens        Illustrations       
Création : 8/1/2003 - Révision : 27/1/2003 - Rédacteur : GLORIEUX Frédéric - Éditeur : DAPA

Les liens

Les liens sont l'intérêt et le point faible d'un système d'information XML. Internet l'a montré, un balisage textuel permet d'exprimer simplement (sans syntaxe de requête complexe) toutes sortes de relations en court de rédaction d'un document (hypertexte et images, styles et scripts ...). Cette communication repose sur une intégration mondiale des systèmes, où le navigateur du public sait faire répondre les serveurs des éditeurs. Mais cet idéal souffre parfois de "liens morts", où rien ne répond, parce qu'un identifiant n'est pas bon, parce que le document demandé n'existe plus, ou même que le site a disparu. Une application XML peut garantir l'intégrité des liens dans la collection qu'il administre, mais l'ouverture à l'extérieur doit s'accomoder de règles plus lâches.

1) Introduction

Un bon schéma pourra permettre une précision facile à renseigner par les applications, mais aussi par les utilisateurs. N'oublions pas qu'un document XML (et ses multiples transformations) doivent garder leur sens en de multiples situations (à l'intérieur d'un système intégré, relié à Internet, seul...). Dans l'idéal, il faudrait qu'un lien ne repose pas seulement sur des identifiants (souvent périssables), mais qu'il garde toujours assez d'informations pour reconstruire un lien mort dans un autre environnement.

2) TEI

Une fois de plus, la TEI définit très finement les besoins sémantiques, elle a inspiré largement d'autres standards, mais sa syntaxe n'a pas été conservée à l'identique. On y distingue classiquement les liens internes et externes. On remarquera la possibilité que tout élément puisse devenir pointeur ou cible d'un lien interne [xhtml2]. On appréciera aussi la possibilité d'interroger la structure d'un document XML externe [xpointer].

<!-- liens en TEI -->
voir <ref target="links">
<!-- lien interne -->
les liens
</ref>
en <ptr target="SEC12">
<!-- lien interne -->
Section 12
</ptr>
. On trouvera plus d'informations dans <xref doc="W3C-XLink" from="id (atts) child (3 p)" to="id (atts) child (5 p)">
<!-- lien externe à un document xml dont on connait la structure
                    afin de pointer plus précisément sur certains éléments -->
"les attributs xlink"
</xref>
... <div1 id="SEC12">
<anchor type="nav" id="top"/><head>Section 12</head><p>Les <seg type="concept" id="links">liens</seg> sont ...</p><p> En TEI, <title id="links">les liens</title>, ne se limitent pas à un <name lang="fr" id="element">élément</name> spécialisé. Toute <name id="tag" lang="fr" corresp="element">balise</name> peut devenir la source ou la cible d'un lien. Pour répondre aux besoins des linguistes et sémiologues, on peut ainsi truffer un réseau invisble de références en cours d'écriture. Avec ce paragraphe, une application pourra ainsi alimenter automatiquement un thesaurus multilingue, en repérant la relation balise-élément. </p>
</div1>

L'expressivité des liens TEI est très intéressante, malheureusement il est difficile de donner des exemples d'applications génériques (libre ou commerciale) permettant de renseigner cette précision avec des interfaces commodes pour l'utilisateur.

3) Docbook

Le module relationnel de Doccbook est court, mais formule des distinctions à retenir. Liens internes, qui a la responsabilité de l'intitulé d'un lien ? Celui qui interroge, ou celui qui répond ? Les deux manières ont leur intérêt, elles valent d'être distinguées, afin qu'il soit toujours possible de les combiner. Ici je cite "Les roses du mal", et j'ai bien peur de m'être trompé dans le titre. J'aurais bien voulu qu'une application renseigne automatiquement le contenu, surtout pour être certain que soit indexée une forme canonique. Ici je cite ce célèbre recueil de Baudelaire, par une périphrase plutôt imbécile mais répondant au commandement scolaire d'éviter les répétitions. Je souhaite lier au même livre que dans l'exemple précédent. Liens externes, les URI (Universal Ressource Identifier) ou URL (Universal Ressource Locator) se sont généralisées dans le monde. Dans l'intention, elles devraient fournir des identifiants absolus auxquels il y aurait toujourts un serveur pour répondre la ressource demandée. La vie réelle des organisations a plutôt montrer la valse des URLs (au sein même du W3C qui en formula le standard), et la difficulté de chasser les liens morts dans une grande collection éditoriale.

<!-- les liens dans docbook -->
<anchor id="ancre" xreflabel="texte affichable à la place d'un lien xref">
<!--
    Une ancre doit être vide et ne restitue aucun contenu.
    Elle sert de cible à des liens.
    Le commentaire suivant n'est pas considéré comme un contenu selon XML.
        -->
</anchor>
<!-- liens internes -->
<xref linkend="ancre">
<!--
    Cet élément doit être vide, il reçoit un contenu de la cible
    sur lequel il pointe (@linkend="id").
    Il peut aussi être renseigné par un attribut @endterm détaillé ci-dessous.
                -->
</xref>
<link linkend="identifiant-de-cible" endterm="identifiant-de-contenu" type=""> contenu clicable affiché, en place de l'attribut endterm par défaut </link>
<!-- liens externes -->
<olink targetdocent="tex" localinfo="utilisable par une application"> Lien résolu par référence à une entité. Sert à la gestion des liens relatifs entre documents pour une même application, ou à maintenir un catalogue d'URL distinct des documents. </olink><ulink url="http://www.ora.com/catalog/tex/" type="utilisable-par-un-environnement"> lien de type URL </ulink>

4) HTML

La syntaxe HTML a généralisé les liens à une échelle totalement imprévue. Le public ne connait pas toujours la syntaxe sous-jacente, par contre, il sait naviguer, et ne se laisse pas ballader aussi bêtement que le voudrait les publicitaires et autres communicants. Sur son ordinateur personnel, s'il en vient à rédiger, il veut lui aussi pouvoir lier ses textes.

La syntaxe relationnelle de HTML repose peu sur le vocabulaire, puisqu'il y a essentiellement une balise ( <a name="ancre" href="URI" title="Intitulé alternatif">texte affiché</a>). Les distinctions sont plutôt contenues dans le standard des URLs.

Liens internes
<a href="#id">ne fonctionne pas dans Netscape 4</a><a href="#ancre">fonctionne partout</a><p id="id"><a name="ancre"/> Paragraphe cible</p>
Liens relatifs
<a href="suivant.html">document dans le même répertoire</a><a href="./precedent.html">document dans le même répertoire</a><a href="../parent.html">document dans le répertoire supérieur</a><a href="../partie2/intro.html">document dans un répertoire frère</a><a href="TABLE_DES_MATIERES">n'est pas standard, dépend d'une configuration serveur.</a>
Lien absolus
<a href="http://www.w3.org">W3C</a><a href="http://www.w3.org/TR/xhtml2#s_linkmodule">Lien vers un ancre précise dans un document externe</a>
Qualifiants
Avec les liens, le W3C propose une liste de qualifiants qui précisent la relation entre la source et la cible. Cette information est destinée aux navigateurs pour qu'ils fournissent à l'utilisateurs une interface adaptée. Citons d'abord en entier la référence avant de la commenter.

Authors may use the following recognized link types, listed here with their conventional interpretations. A LinkTypes value refers to a space-separated list of link types. White space characters are not permitted within link types.

These link types are case-insensitive, i.e., "Alternate" has the same meaning as "alternate".

User agents, search engines, etc. may interpret these link types in a variety of ways. For example, user agents may provide access to linked documents through a navigation bar.

Alternate
Designates substitute versions for the document in which the link occurs. When used together with the hreflang attribute, it implies a translated version of the document. When used together with the media attribute, it implies a version designed for a different medium (or media).
Stylesheet
Refers to an external style sheet. See the Style Sheet Module for details. This is used together with the link type "Alternate" for user-selectable alternate style sheets.
Start
Refers to the first document in a collection of documents. This link type tells search engines which document is considered by the author to be the starting point of the collection.
Next
Refers to the next document in a linear sequence of documents. User agents may choose to pre-load the "next" document, to reduce the perceived load time.
Prev
Refers to the previous document in an ordered series of documents. Some user agents also support the synonym "Previous".
Contents
Refers to a document serving as a table of contents. Some user agents also support the synonym ToC (from "Table of Contents").
Index
Refers to a document providing an index for the current document.
Glossary
Refers to a document providing a glossary of terms that pertain to the current document.
Copyright
Refers to a copyright statement for the current document.
Chapter
Refers to a document serving as a chapter in a collection of documents.
Section
Refers to a document serving as a section in a collection of documents.
Subsection
Refers to a document serving as a subsection in a collection of documents.
Appendix
Refers to a document serving as an appendix in a collection of documents.
Help
Refers to a document offering help (more information, links to other sources information, etc.)
Bookmark
Refers to a bookmark. A bookmark is a link to a key entry point within an extended document. The title attribute may be used, for example, to label the bookmark. Note that several bookmarks may be defined in each document.

Ces qualifiants sont proposés pour être utilisés comme méta-données d'un document. Des liens spécifiés en-tête permettent ainsi de fournir une navigation dans le site autour du document. Un navigateur comme le dernier Opera ouvre ainsi une barre de navigation lorsqu'il rencontre une page ayant adopté cette convention. C'est rare, mais pouvez essayer ce site, ou W3C avec Opera.

5) DTD CI - Dossiers d'inventaire

<LIENARCH XML-LINK="SIMPLE" ROLE="dossier collectif/architecture" HREF="IA35011569.xml" TITRE="dossier collectif/architecture" VUE="REMPLACE | NOUVEAU | INCLUS" DIRECTION="VERS | DEPUIS | INDIFFERENT"/><LIENCOLL XML-LINK="SIMPLE" ROLE="hiérarchique/sous-dossier" HREF="IA35011340.xml" TITRE="hiérarchique/sous-dossier" VUE="REMPLACE" DIRECTION="VERS"/>


    sdapa/standards/      Texte structuré   Contact - informa    Bibliographie      Localisation         Les liens        Illustrations