ISTEX Linked Data

Le site data.istex.fr est issu du travail des expérimentations successives LODEX puis Triplex sur les données de la plateforme ISTEX.

Nous exposons les données ISTEX produites et/ou transformées à l'Inist selon les normes du web sémantique, ce qui signifie que nous les modélisons. Mais cela se fait progressivement : nous traitons le corpus (de plus de 18 millions de documents) non pas dans sa globalité (tous les champs en même temps), mais facette par facette (un champ à la fois). Cela se fait via l'outil LODEX, dont nous avons plusieurs instances ci-dessous :

Liste des corpus ISTEX chargés
Jeu de données types de contenu
Jeu de données types de publication
Jeu de données entités nommées Istex
Jeu de données sur l'entité PlaceName
Jeu de données catégories Web Of Science
Jeu de données catégories Science-Metrix
Jeu de données catégories Inist
Jeu de données liste des éditeurs
Jeu de données sur les outils des enrichissements
Jeu de données sur les ayants droits ISTEX
Jeu de données sur les langues de publication

Ensuite, nous exportons ces données en N-Quads et les chargeons dans un triple store. Vous pouvez interroger ce triple store via le formulaire d'interrogation en SPARQL.

Vous pouvez aussi utiliser le SPARQL endpoint directement, par programmation : https://data.istex.fr/sparql.

data.istex.fr en quelques mots

data.istex.fr expose le Triple Store des données ISTEX via son SPARQL Endpoint.

CNRS
Créé par l'INIST-CNRS