Publié le: 10 octobre 2022 Publié par: Alain Commentaires: 0
Meta données GED

Dans le cadre de la mise en place d’une solution de GED, les métadonnées permettent de synthétiser un ensemble de données afin de faciliter la recherche et l’identification des documents.

Qu’est-ce qu’une GED ?

La GED, dont l’acronyme signifie : Gestion Électronique des Documents porte sur les documents et les données associées. Elle a vocation à optimiser leur gestion et leur exploitation.

L’utilisation des métadonnées dans une GED

Les métadonnées ont pour objectif de simplifier la lecture des informations et des données de façon à pouvoir archiver, classer ou rechercher un document au sein du système de GED mis en place. C’est grâce aux métadonnées que les documents sont classés en fonction de leur nature, de leur contenu, de la date d’acquisition etc. Les métadonnées facilitent donc la gestion globale des documents.

Les différents types de métadonnées

Il existe trois types de métadonnées principales parmi lesquelles :

  • Métadonnées descriptives : elles fournissent les informations permettant de retrouver un document en fonction de son nom ou de sa date par exemple afin de l’identifier. 
  • Métadonnées structurelles : elles permettent de structurer l’organisation d’une ressource (modèles de données).
  • Métadonnées administratives : elles permettent la gestion d’une ressource en traitant les informations telles que le nom du document, la date de création (ou acquisition) et les droits d’archivage.

Les métadonnées au service de la LAD (Lecture Automatique de Documents)

  • La RAD (Reconnaissance Automatique des Documents) dont l’objectif est de distinguer les documents de même nature.
  • La LAD (Lecture Automatique des documents) réunit quant à elle les technologies d’OCR (Reconnaissance Optique des Caractères) permettant de transformer un document scanné en texte. Elle permet également de reconnaître des images (qui sont des données non structurées). 
  • L’ICR (Reconnaissance Intelligente de Caractères) que l’on pourrait qualifier de version améliorée de l’OCR, permet quant à elle la reconnaissance de caractères manuscrits dans les documents appelés « documents structurés » ou « documents semi structurés”.

Qu’est-ce que les métadonnées ?

En informatique, une métadonnée est une donnée permettant de définir et décrire d’autres données. Elles proviennent des techniques de Web sémantique. Le web sémantique permet de fournir un modèle afin de “réutiliser et partager les données entre plusieurs applications, entreprises et groupes d’utilisateurs” selon le W3C (World Wide Web Consortium).

Cette vidéo explique ce que sont les métadonnées

Les métadonnées sont des éléments qui servent à décrire une ressource au sens large du terme. Cela peut être par exemple un livre, une collection de livres, ou même une bibliothèque. Pour chacune de ces données, il est possible de préciser des éléments de métadonnées.

Pour le livre par exemple, on peut indiquer son titre, son auteur, sa date de publication, et ainsi de suite. Mais à quoi cela sert-il ?

Et bien imaginons que l’on diffuse ce livre sur le web. Les métadonnées vont alors jouer un rôle important, notamment en facilitant la recherche de la ressource et en donnant des informations utiles aux internautes.

D’un point de vue technique, un simple tableur suffit pour décrire la ressource.

En revanche, pour que les métadonnées soient facilement exploitables par les machines, le tableau doit être construit dans un format permettant l’interopérabilité comme le format CSV.

Au premier abord, écrire une ressource à l’aide d’un tableau paraît simple. Il suffit de remplir les champs jugés pertinents pour décrire la ressource.

Mais comment être sûr de ne pas avoir oublié des informations importantes ou remplir correctement chaque champ pour que tout le monde le comprenne. Comment rédiger la date par exemple ?

Et bien avant de chercher quelles informations donner et comment les indiquer, sachez qu’il peut déjà exister un modèle correspondant à vos attentes.

Standard de métadonnées

C’est ce que l’on appelle un standard de métadonnées. Il existe de nombreux standards qui sont spécifiques à un domaine où a une finalité précise.

Certaines descriptions s’avèrent complexes, avec plusieurs contraintes et normes à respecter. Dans ces cas-là, un simple tableau n’est plus vraiment adapté.

C’est donc là que peuvent intervenir les schémas de métadonnées.

Schémas de métadonnées

La notion de schéma peut avoir des significations différentes selon les domaines comme l’informatique en philosophie ou en information documentation.

Ici le schéma est à considérer comme une construction organisée d’informations. Un schéma de métadonnées est donc une liste structurée composée d’éléments descriptifs reliés entre eux.

Pour chaque élément le schéma définit sa signification, par exemple ici se trouve le titre, ici l’auteur, et là la date de publication.

Le type de contenu attendu, comme du texte ou des nombres.

Sa formulation, ça peut être du texte libre, un format précis, ou encore une norme à respecter. Et enfin les valeurs qu’il est possible d’attribuer, comme un terme issu d’un thésaurus ou encore un choix à faire dans une liste fermée.

Le niveau d’obligation

Le schéma définit aussi ce qu’il est possible ou non de faire avec les éléments. On peut distinguer le niveau d’obligation, quels éléments sont obligatoires, conseillés ou simplement facultatifs. La possibilité de rajouter ou non des éléments.

Des règles plus spécifiques

Et enfin des règles plus spécifiques, par exemple si tel champ est renseigné alors celui d’après doit l’être aussi.

Un schéma de métadonnées et donc un plan logique, structuré, qui indique les relations entre les éléments qui le composent.

Le schéma DublinCore

Un exemple assez connu est le schéma DublinCore. C’est un schéma générique qui fait l’objet d’une norme ISO. Mais s’il en existe d’autres, ils ont leur propre profil souvent spécifique à un domaine et sont plus ou moins complets ou contraignants.

Par exemple dans DubinCore les dates peuvent être renseignées librement alors que dans d’autres schémas la norme ISO est requise.

Ces contraintes intrinsèques aux schémas ont des avantages.

Plus un schéma impose une description riche, précise et normalisée, plus la ressource décrite a de chances d’être visible sur le web.

Au contraire, si le schéma est très basique est plutôt imprécis, la ressource sera moins visible.

On peut alors se fixer certaines règles comme saisir les dates selon la norme ISO ou ajouter systématiquement un élément de description aux données.

Pour construire ces schémas complexes, il est souvent nécessaire d’utiliser le format XML qui, comme le format CSV, est capable de fonctionner avec d’autres systèmes.

Il est bien moins évident de gérer des fichiers XML que les fichiers CSV, des compétences informatiques sont nécessaires.

Néanmoins, c’est une des solutions les plus adaptées aux contenus complexes structurés en arborescence c’est pourquoi il est utilisé pour les schémas de métadonnées.

Lire aussi :