Open Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) est un protocole informatique développé par l'Open Archives Initiative afin d'échanger des métadonnées. Il permet de constituer et de mettre à jour automatiquement des entrepôts centralisés où les métadonnées de sources diverses peuvent être interrogées simultanément. Utilisé notamment par les Archives Ouvertes et les entrepôts institutionnels, il s'est aujourd'hui largement répandu dans les institutions patrimoniales et notamment les bibliothèques. Utilisé également par les moteurs de recherche, il peut être défini comme un dispositif d'API spécialisé pour les métadonnées documentaires.
Histoire
modifierL'OAI-PMH a été mis au point par l'Open Archive Initiative à la suite de la convention de Santa Fe (1999). À la suite des travaux de l'OAI, une première version du protocole (1.0) a été rendue publique en . En juillet de la même année, des changements mineurs ont été apportés au protocole (version 1.1) afin de prendre en compte des modifications apportées par le W3C au format XML[1]. Enfin, en juin 2002 a été publiée la version actuelle (2.0), qui introduit plusieurs changements techniques et améliorations, et n'est pas rétrocompatible avec les versions précédentes[2]. Cette version est considérée comme définitive.
Fonctionnement
modifierPrincipe
modifierCe protocole repose sur la présence de deux types d'acteurs distincts : les fournisseurs de données et les fournisseurs de service (moissonneurs). Les premiers vont donner accès à leur catalogue à travers ce que l'on nomme un « entrepôt OAI », un outil chargé de répondre aux requêtes formulées par les fournisseurs de service.
La réponse donnée est au format XML et contient selon la requête formulée : des informations sur l'entrepôt, une liste d'identifiants, de références (métadonnées) ou de « sets » (regroupement de notices, ou <record>, correspondant à un thème donné ou un ensemble de notices faisant sens intellectuellement).
Le fournisseur de données doit fournir ses données au format Dublin Core à minima mais peut, s'il le souhaite, proposer en supplément d'autres schémas : BiblioML, MarcXML, Dublin Core TERMS, etc. La liste des formats disponibles pour un entrepôt peut être obtenue à l'aide de la commande ListMetadataFormats (voir ci-dessous).
L'interrogation en OAI-PMH
modifierUn moissonneur pour interroger un entrepôt OAI utilise une requête sous la forme d'une URL classique construite en deux parties : L'url de base de l'entrepôt et la requête d'interrogation à proprement parler. Cette seconde partie se construit à partir de différents verbes prévus par le protocole et listés dans le tableau suivant :
Verbe | Rôle | Arguments |
---|---|---|
GetRecord | Récupération d'un enregistrement donné. |
|
Identify | Informations sur l'entrepôt de données. | Aucun |
ListIdentifiers | Récupère la liste des identifiants disponibles. |
|
ListMetadataFormats | Demande la liste des formats de métadonnées disponibles. Sans paramètres tous les formats disponibles pour au moins un item sont retournés. Avec le paramètre identifier, ne sont retournés que les formats disponibles pour l'item concerné |
|
ListRecords | Retourne une liste d'enregistrements correspondant aux différents paramètres (dates, ensemble) demandés. |
|
ListSets | Demande la liste des ensembles disponibles sur un entrepôt. La réponse peut être sur plusieurs pages. | resumptionToken |
Ainsi pour obtenir des informations générales sur l'entrepôt OAI-PMH @archiveSIC, aujourd'hui dans HAL (entrepôt francophone spécialisé en Sciences de l'Information et de la Communication) la requête à utiliser est la suivante :
https://api.archives-ouvertes.fr/oai/hal/?verb=Identify
Par la suite, la combinaison des verbes avec leurs différents arguments permet d'obtenir des ensembles précis et de récupérer les métadonnées descriptives contenues dans l'entrepôt.
Usages
modifierL'OAI-PMH est à la base du moissonnage des métadonnées pour la construction de moteurs de recherche et portails académiques et patrimoniaux[3].
La communauté OAI-PMH
modifierEnregistrement des sites OAI-PMH
modifierLe protocole OAI est maintenant de plus en plus utilisé au niveau mondial par de nombreux acteurs du monde des archives ouvertes et des bibliothèques numériques. Pour favoriser la coopération des sites ayant une interface OAI-PMH, l'enregistrement est vivement encouragé.
Voici quelques exemples d'annuaires de sites compatibles OAI-PMH :
- la liste maintenue par l'initiative « The Open Archives »[4] ;
- le registre de l'université de l'Illinois à Urbana-Champaign[5] ;
- The Celestial OAI registry[6] ;
- Eprint’s Institutional Archives Registry[7] ;
- Openarchives.eu : le répertoire européen des référentiels OAI-PMH dans le monde[8] ;
- A worldwide service and registry : ScientificCommons[9].
Notes et références
modifier- (en) http://www.openarchives.org/OAI/1.1/openarchivesprotocol.htm Protocol Version 1.1 of 2001-07-02
- (en) http://www.openarchives.org/OAI/openarchivesprotocol.html Protocol Version 2.0 of 2002-06-14
- Par exemple, ISIDORE : https://documentation.huma-num.fr/isidore/#oai-pmh-ou-sitemaprdfa
- La liste maintenue par l'initiative « The Open Archives »
- Le registre de l'université de l'Illinois à Urbana-Champaign
- (en) The Celestial OAI registry
- (en) Eprint’s Institutional Archives Registry
- Openarchives.eu « Copie archivée » (version du sur Internet Archive) : le répertoire européen des référentiels OAI-PMH dans le monde
- ScientificCommons.org A worldwide service and registry : ScientificCommons.
Voir aussi
modifierArticles connexes
modifierDes outils compatibles avec le protocole OAI-PMH :
- ORI-OAI : Outil de Référencement et d'Indexation pour un réseau de portails OAI-PMH
Liens externes
modifier- Suleyman Demirel University Open Archives Harvester
- (en) Définition du protocole sur le site de l'OAI. (Consulté le 24/06/2006)
- (en) Openarchives.eu - Guide aux Archives Ouvertes OAI-PMH dans le monde
- - Projet ORI-OAI