Information scientifique et technique d'excellence


Istex est un réservoir de plus de 28 millions[1] de publications scientifiques multilingues et multidisciplinaires s’étalant sur 700 ans. Il représente une ressource pour deux usages : un usage documentaire (pour accéder à des documents scientifiques), un usage de fouille de textes (pour constituer un corpus à des fins d’analyse textuelle).

Istex (Information scientifique et technique d'excellence)
Description de l'image Istex.svg.

Informations
Première version
Dépôt https://github.com/istex
État du projet En développement actif
Taille des données 28 180 024 documents (en 2024)
Langues 51 langues
Type Base de donnéesVoir et modifier les données sur Wikidata
Documentation https://doc.istex.fr
Site web https://www.istex.fr

Ce réservoir est le fruit du partenariat entre le CNRS, l’Abes, Couperin et l'Université de Lorraine, agissant en son nom et pour le compte de France Universités. Il dessert l’ensemble des établissements français de l’enseignement supérieur et de la recherche. La plateforme Istex, opérée par le CNRS et les équipes de l'Inist, se positionne dans le paysage de la science ouverte[2] puisqu’elle permet l’accès à des publications parfois inaccessibles sur les sites éditeurs.

Historique

modifier

Istex est né en 2011 d’une impulsion nationale dans le cadre du Programme d’Investissements d’Avenir (PIA) du ministère de l’Enseignement supérieur, de la recherche et de l’innovation (Mesri) financé par l’Agence Nationale de la Recherche (ANR). Ce projet a initialement permis l’achat de plus de 25 millions de documents scientifiques et la création d’une plateforme numérique accessibles via l’environnement numérique de travail des établissements ayants droit. Depuis le 8 mars 2022, Istex est un projet d’infrastructure de recherche[3] dans la feuille de route nationale du Mesri[4].

La base Istex

modifier

Les publications Istex sont des acquisitions qui proviennent d’achats d’archives scientifiques au travers de licences nationales[5] menées dans le cadre du Programme d'Investissement d’Avenir Istex[6] (2012 - 2018). Les marchés signés avec les éditeurs en application du Plan de soutien à l’édition scientifique française[7] (2017-2018) et des acquisitions pérennes des licences nationales complémentaires des abonnements courants[8] ont ensuite permis d’étoffer le contenu de la ressource Istex. Depuis 2019, les acquisitions se poursuivent également dans le cadre du GIS CollEx-Persée[9].

Outils et services autour de l’API Istex

modifier

Les publications présentes dans Istex sont des données accessibles en un seul lieu, interopérables, homogénéisées, et enrichies[10]. Plusieurs ressources et outils ont été développés autour de l’API Istex[11] permettant de décrire son contenu, de faciliter son interrogation ou de télécharger des documents.

Accéder aux ressources Istex

  • L'outil Istex Search, qui remplace le démonstrateur et Istex-DL[12], permet d'interroger le réservoir, d'explorer les résultats, de télécharger massivement des données dans plusieurs formats et propose des passerelles vers des outils d'analyse de corpus.
  • Google Scholar et l'extension Click & Read offrent d'accéder à des articles grâce à des requêtes OpenURL.

Se documenter

Se former

Aller plus loin dans la fouille de textes

Istex contient des liens vers des services d’aide à la recherche développés à l’Inist-CNRS pour aller plus loin vers la fouille de textes en :

  • utilisant des corpus scientifiques prêts à l’emploi pour entraîner des outils de fouille de textes ;
  • préparant, explorant et publiant des données grâce à l’outil open-source Lodex ;
  • enrichissant des données grâce à des web-services ;
  • consultant TM tools-Explorer : une liste de trois cents outils libres spécialisés dans le traitement automatique des langues et l'exploration de texte ;
  • utilisant ou partageant des ressources terminologiques grâce à la plateforme Loterre.

Notes et références

modifier
  1. En date du 18 octobre 2024. Le réservoir est enrichi régulièrement. Pour en savoir plus, consulter les actualités du site istex.fr.
  2. « Science ouverte », sur cnrs.fr, (consulté le ).
  3. Alexandra Petitjean-Monnin, Raluca Pierrot et Cécilia Fabry, « Istex : de la plateforme de référence à l’infrastructure de recherche », Arabesque, no 107,‎ , p. 20 (DOI 10.35562/arabesques.3090, lire en ligne)
  4. Pour consulter le détail des corpus éditeurs chargés dans Istex se reporter au site : https://loaded-corpus.data.istex.fr.
  5. « La participation de l’Abes aux programmes d’acquisition de ressources électroniques sous licence nationale », sur abes.fr (consulté le ).
  6. Raymond Bérard, « Istex, vers des services innovants d’accès à la connaissance », Synthèse rédigée à partir du dossier de candidature d’Istex aux Initiatives d’excellence et des réunions de travail des partenaires du dossier,‎ (lire en ligne [PDF])
  7. « Le soutien à l'édition scientifique », sur enseignementsup-recherche.gouv.fr, (consulté le ).
  8. Stéphanie Gregorio, « Elsevier, 2009 à 2012, de nouvelles années disponibles sur Istex », sur istex.fr, (consulté le ).
  9. « CollEx-Persée : des collections d'excellence au service des chercheurs », sur enseignementsup-recherche.gouv.fr, (consulté le ).
  10. Pascal Cuxac et Nicolas Thouvenin, « Archives numériques et fouille de textes : le projet Istex », Atelier TextMine, conférence EGC,‎ (lire en ligne [PDF])
  11. Claude Niederlender, « L’API Istex : le sésame pour accéder aux ressources acquises », Arabesques, no 84,‎ , p. 17-19 (DOI 10.35562/arabesques.497, HAL hal-0300807, lire en ligne)
  12. Pascale VIOT, « Istex Search : un service dédié à la constitution de corpus », sur Istex, (consulté le )

Bibliographie

modifier