Wikipédia:Prise de décision/Utilisation des données Wikidata dans les articles/Préliminaires

Présentation

modifier

Wikidata est une base de données active dans le cadre des projets Wikimédia. Elle offre une structure de stockage pour des données centralisées accessibles aux différents projets Wikimédias (toutes les Wikipédias, mais aussi Wikisource, Wikinews, …).

Une première application de Wikidata a été la gestion des interwikis entre Wikipédias. Cette application est bien acceptée et n'est pas l'objet de cette prise de décision. Les questions d'esthétique ne sont pas non plus prises en considération dans cette prise de décision.

L'objet de cette prise de décision est de préciser les conditions de l'utilisation dans les articles de données stockées dans Wikidata. Utiliser une donnée Wikidata dans un article signifie créer un lien entre l'article Wikipédia et la donnée Wikidata : toute modification de la donnée dans Wikidata modifie alors directement l'article Wikipédia.


Fonctionnalités, avantages et inconvénients de l'utilisation de Wikidata dans les articles

modifier

Fonctionnalités disponibles

modifier

Seul l'état de Wikidata au moment de la prise de décision doit être pris en compte : les développements en cours de Wikidata ne peuvent être considérés comme une solution, car rien n'assure une implémentation rapide et en conformité avec les désirs des contributeurs. La question de la révision des décisions de cette PDD au cours de l'introduction de nouvelles fonctionnalités et des fonctionnalité en cours de développement reste ouverte, Wikidata restant un projet en développement actif. La situation actuelle est la suivante concernant les fonctionnalités de Wikidata sur Wikipédia :

  • Des modèles développés dans le langage de programmation Lua permettent d'afficher dans un article Wikipédia les données de l'élément Wikidata correspondant à l'article. Il est également possible d'afficher dans un article des données d'autres éléments Wikidata.
  • Des filtres peuvent être développés pour extraire des données en fonction de n'importe quel critères (par exemple, ne pas afficher la nationalité renseignée dans Wikidata d'une personne née avant une certaine date). Réaliser ces filtres nécessite un travail de programmation sur Wikipédia via des modules en Lua. Plusieurs valeurs pour une même donnée peuvent être disponibles sur Wikidata : la programmation des modules Lua permet de filtrer la valeur qui convient, ou de choisir de les afficher toutes ; Wikidata inclus aussi une possibilité de privilégier par défaut certaines valeurs en les déclarant « préférées », « normales » ou « obsolètes » (voir cette page d'aide Wikidata à ce sujet).
  • Les modifications de l'élément Wikidata lié à l'article de Wikipédia sont affichables dans les listes de suivi, mais pas dans l'historique de l'article. Ainsi une donnée peut être modifiée sur Wikidata et affichée sur Wikipédia sans que cette modification n'apparaisse dans l'historique de l'article. Il est toutefois possible d'activer une fonction qui ajoute les éléments de Wikidata liés aux articles marqués dans la liste de suivi Wikipédia du contributeur (« Voir les modifications de Wikidata dans votre liste de suivi »). Ainsi toutes les modifications dans Wikidata d'un de ces éléments apparaîtra dans la liste de suivi Wikipédia avec un D en gras pour le différencier des modifications des articles de Wikipédia. Les modifications faites sur les autres éléments non liés à l'article mais d'où ce dernier extrait des données ne peuvent pas être rendues visibles dans dans la liste de suivi Wikipédia du contributeur (mais ces modifications apparaissent dans Wikidata dans l'historique des éléments concernés).

Quels sont les intérêts ?

modifier

Pourquoi utiliser Wikidata comme base de données des informations affichées sur Wikipédia ? La principale raison est la mise en commun de toutes les données des Wikipédias ainsi que de leurs références dans un seul système. Les Wikipédias profiteraient donc des données déjà apportées par l'ensemble des wikimédiens et de partager les données des différentes versions linguistiques de Wikipédia. De plus, la structure de Wikidata, qui sépare les données de la mise en forme, est appropriée pour le travail des bots qui peuvent effectuer des ajouts, des corrections ou des suppressions sans à avoir à gérer toutes les syntaxes particulières des infobox ; plus besoin de faire faire de modifications par des bots sur chaque Wikipédia, les bots peuvent travailler directement sur Wikidata et chaque version linguistique de Wikipédia en profite. Il est aussi possible de créer automatiquement des listes, des graphiques et autres applications visuelles. Des outils existent sur Wikidata pour vérifier certaines contraintes sur les données. À titre d'exemple Wikidata sait si un élément correspond à un humain ou à un métier, et détectera l'utilisation d'un humain là ou un métier est attendu, ainsi qu'une vaste liste d'autres rapports sur la qualité des données qu'on peut consulter par exemple sur d:Wikidata:Database reports (Il est hors cadre de cette prise de décision d'en faire la liste).

L'utilisation de Wikidata permet d'alléger le wikitexte en évitant que toutes les données nécessaires aux modèles soient présentes dans l'article. Le cas classique des infobox peut être réduit à une ligne au lieu de dizaines de lignes de code.

Wikidata peut permettre de privilégier certaines sources et d'homogénéiser certains types de données affichées dans différents articles Wikipédia. En effet, lorsqu'on dispose dans Wikidata de plusieurs valeurs possibles pour une donnée, avec pour chacune une source, il est possible d'afficher les valeurs d'une source particulière en priorité et de construire ainsi des modèles ou infobox qui affichent des valeurs de qualité homogène. Cela peut s'appliquer par exemple aux données démographiques : on peut sélectionner dans Wikidata une source comme celle des offices nationaux chargés de la statistique et ainsi avoir dans toutes les infobox d'un pays les données démographiques issues de la même source officielle et correspondant à la même année.

Wikidata permet de mutualiser la détection de vandalismes entre les différentes wiki. Outre les moyens habituels des wikis (balises sur les éditions, modifications marquées à relire), Wikidata dispose aussi des rapports d'erreurs qui fournissent aussi des moyens de détecter les vandalismes qui sont passé entre les mailles du filet. Mutualisation des données rime avec mutualisation et augmentation des moyens de détection des vandalismes.

Quels sont les inconvénients ?

modifier

Wikidata est un projet Wikimédia avec sa logique et sa structure propre. La division des sujets est par exemple différente avec, dans certains cas, plusieurs éléments dans Wikidata pour un seul article sur Wikipédia. L'environnement également est différent et plus contraignant par certains aspects du fait de la standardisation des données, ce qui implique un apprentissage pour ceux qui veulent travailler dans Wikidata, et de préférence une bonne maîtrise de l'anglais, qui est utilisé habituellement comme langue de travail pour pouvoir participer aux discussions structurantes ou en cas de divergence d'avis sur des données ponctuelles, bien que les échanges puissent se faire en n'importe quelle langue. Actuellement, sans gadgets dédiés, pour modifier les données dans Wikidata, il faut se rendre sur le site de Wikidata. Les habitudes culturelles propres à chaque communauté linguistique ne pouvant être toutes prises en compte par Wikidata[Information douteuse], le respect de ces conventions peut être rendu difficile lors de l'utilisation de Wikidata dans les articles Wikipédia. Le fonctionnement de Wikidata est cependant similaire à celui de Wikipédia concernant le suivi des modifications (liste de suivi avec résumé automatique).

La modification des données Wikidata conduit à la modification des articles de Wikipédia utilisant ces données sans que cette modification n'apparaisse à l'heure actuelle dans l'historique des articles. Toutefois, indépendamment de Wikidata, la modification des modèles utilisés dans les articles conduit déjà à des changements n'apparaissant pas dans l'historique des articles ; ce type de modification concerne généralement la présentation des informations mais concerne parfois aussi les informations elles-mêmes (c'est le cas pour les tableaux démographiques des communes de France).

Les données peuvent être modifiées dans wikidata par n'importe quel contributeur sans qu'il ait connaissance des conséquences que peuvent avoir ces modifications dans les différents projets Wikimédia utilisant ces données : ces modifications peuvent conduire à des incohérences là où ces données sont utilisées. Par ailleurs, Wikidata pourrait être une cible pour les vandales puisqu'une seule modification peut avoir un impact sur plusieurs dizaines de Wikipédias.

L'importation des données de Wikidata et leur exploitation nécessite l'utilisation du langage de programmation Lua. Le langage Lua est différent du langage Wikitexte utilisé habituellement pour construire des modèles, pour l'instant une minorité de contributeurs maîtrisent ce langage. Bien que le langage Lua soit bien plus puissant et bien plus lisible que le langage Wikitexte, il rend plus grand le « ticket d'entrée » pour les codeurs d'infobox. Cependant il existe des infobox comme {{Infobox Logiciel}} qui exploitent Wikidata sans utiliser directement le langage Lua dont l'utilisation peut être masquée par l'usage de modèles comme {{Wikidata}}.