Wikipédia:RAW/2023-02-01

Données clés
CIM-11	459420954<img alt="Voir et modifier les données sur Wikidata" src="//up.wiki.x.io/wikipedia/commons/thumb/7/73/Blue_pencil.svg/10px-Blue_pencil.svg.png" decoding="async" width="10" height="10" class="mw-file-element" data-file-width="600" data-file-height="600">
MeSH	C537840

Regards sur l’actualité du mouvement Wikimedia

Infolettre francophone mensuelle n^o 253

2022-12-01 | 2023-01-01 | 2023-02-01 | 2023-03-01

S'inscrire ou se désinscrire

Brèves

▲ Bilan 2022 — En janvier, nous avons publié une liste des articles les plus consultés en 2022 de Wikipédia en français. Wikimédia France a depuis publié un billet de blog sur le sujet.

noframe

▲ 20 ans de noirceur canadienne — Nous vous avions informé en novembre 2018 de la volonté d'augmentation de 20 ans de la période d'attente au Canada pour qu'une œuvre s'élève dans le domaine public (donc de vie+50 ans à vie+70 ans) dans le cadre du nouvel accord Canada–États-Unis–Mexique (ACEUM). Avec l'entrée en vigueur de l'accord en juillet 2020, un certain flou était entretenu sur cette clause particulière, laissant entendre, notamment, que le droit ne serait étendu que pour qui en ferait la demande explicite. Ce flou a été levé par des modifications de la loi canadienne sur le droit d'auteur pour passer à vie+70 ans. Ces modifications sont entrées en vigueur le 30 décembre 2022. Elle font en sorte qu'aucune œuvre n'entrera dans le domaine public canadien au cours des vingt prochaines années^[1]. Toutefois, toutes les œuvres qui sont dans le domaine public en 2022 et avant y restent^[2].

Mastodon est un réseau social décentralisé. Chaque utilisateur peut choisir l'instance sur laquelle il souhaite s'inscrire.

▲ Communauté wikimédienne sur Mastodon — En décembre dernier, nous évoquions la montée en puissance du réseau social Mastodon suite aux déboires de Twitter. On retrouve une communauté Wikimédienne sur Mastodon avec notamment deux instances dédiées à Wikimédia : l’instance Wiki.world^[3] et l’instance wiki.style^[4] (voir meta:Mastodon). On peut suivre les comptes de Wikimédia France (@Wikimedia_Fr@wikis.world) ^[5], du Wiktionnaire (@wiktionnaire@mastodon.top)^[6], des sans pagEs (@lessanspages@framapiaf.org)^[7], Wiki research (@wikiresearch@mastodon.social), Wikidata (@wikidata@wikis.world)^[8], Wikifunctions (@wikifunctions@wikis.world), Wikimedia Suisse (@WikimediaCH@wikis.world), Vikidia (@vikidia@wikis.world), Wikimedia Canada ( @WMCA@wikis.world) ou encore Lingua Libre (@lingualibre@wikis.world). Enfin, on peut aussi suivre les hashtags comme #Wikipedia ou #Wikidata.

▲ Les Mille Pages — Le Projet:Les Mille Pages lancé en décembre 2022 entreprend, pour contribuer à diminuer le fossé de genre, de traduire automatiquement, mettre en forme et publier 1 000 biographies de scientifiques américaines. Pour ce faire, le wikipédien Roland45 utilise l'outil DeepL et un code VBA pour la wikification. Suite aux retours de la communauté, Roland45 a finalement décidé de publier les articles en brouillon dans l'espace du projet. Chacun peut relire un article et le basculer dans l'espace principal après validation.

▲ Une décision de justice du tribunal judiciaire de Paris contraint la fondation Wikimedia à communiquer aux autorités françaises l'adresse IP d'un utilisateur. —

Voir la discussion sur le bistro du 6 janvier

▲ Le Signpost devient bimensuel. — L'excellente revue de la Wikipédia anglophone, The Signpost, passe d'une publication mensuelle à une publication toutes les deux semaines. Pour en savoir plus, lire We heard zoomers liked fortnights: the biweekly Signpost rides again.

▲ Noircir Wikipédia — Le Courrier est allé observer un atelier de l'association Noircir Wikipédia : https://lecourrier.ch/2023/01/26/savoir-decolonise/

▲ Toujours plus d'IA — Nous vous informons périodiquement d'enjeux liés à l'utilisation de plus en plus fréquente d'intelligence artificielle (IA) sur le web. Ces temps-ci, c'est l'agent conversationnel chatGPT qui prend toute la place. Celui-ci soulève des enjeux dans des domaines très variés et l'univers du savoir libre n'est pas épargné.
En effet, différentes communautés liées à ce domaine, notamment celles de Wikipédia dans les langues maîtrisées par l'outil, s'interrogent sur ce qui est une utilisation acceptable ou non de ce dernier. Ainsi, la communauté de Wikipédia en anglais a eu une longue discussion sur le sujet et le sujet a été abordé sur le Bistro de Wikipédia en français. (en)[1]

Cette image, générée par une IA, est-elle sujette au droit d'auteur ? L'apposition du modèle PD-algorithm sur la page du fichier pourrait laisser croire que non, mais la réponse semble plus compliquée que cela.

Dans les coulisses de la Wikimedia

▲ Des nouvelles d'Abstract Wikipedia — Dans son édition du 1^er janvier 2023, Signpost revient sur les risques d'échec du projet Abstract Wikipedia. Lancé en 2020 par la fondation Wikimedia sous l'impulsion de Denny Vrandečić, Abstract Wikipedia est une extension conceptuelle de Wikidata qui vise à générer du contenu multilingue à partir de Wikidata. En 2022, une équipe de la fondation Google.org a été embarquée dans le projet pour y contribuer. Après 6 mois de collaboration, l'équipe de Google.org a remis un rapport soulignant de forts risques d'échec pour l'Abstract Wikipedia. Les auteurs du rapport remettent notamment en cause le choix de développer un nouveau langage informatique pour générer du langage naturel plutôt que de s'appuyer sur des outils existants. L'équipe d'Abstract Wikipédia a publié une réponse dans laquelle elle rejette les recommandations de l'équipe Google.org. 👉 Lire l'article du Signpost Wikimedia Foundation's Abstract Wikipedia project "at substantial risk of failure"

noframe

▲ Coolest tool award — Le 16 décembre dernier, le comité des Coolest Tool Awards a annoncé les lauréats 2022^[9]. Les vainqueurs sont :

novice – Citation Hunt – https://citationhunt.toolforge.org/en?id=0fc6e1a2
éditeur – More Menu – meta:MoreMenu
réutilisable – PetScan – https://petscan.wmflabs.org/
développeur – Patchdemo – https://patchdemo.wmflabs.org/
nouveau venu – Bullseye – https://bullseye.toolforge.org/
diversité – Wiki99 – meta:Wiki99
impact – Scholia – https://scholia.toolforge.org/
mobile – TwinkleMobile – en:User:Plantaest/TwinkleMobile
batteur à œufs – OpenRefine – https://openrefine.org/

▲ Mois du sourçage — En janvier, c'est le mois du sourçage sur Wikipédia en français. Pour cette quatrième édition de janvier 2023, 42 wikipédistes ont enrichi 1683 articles en ajoutant des sources ou en mettant en formes des références.

Enquête sur les souhaits de la communauté

▲ Enquête sur les souhaits de la communauté — Chaque année, l'équipe technique de développement consulte la communauté sur ses souhaits pour 2023. L'enquête débute le 23 janvier. Dans la première phase, chacun peut déposer une proposition. Dans la seconde phase, l'équipe technique fait des retours sur les différentes propositions. Dans la dernière phase, la communauté vote sur les différentes propositions. En savoir plus : Community Wishlist Survey 2023

▲ Ontologie de Wikidata — Wikimedia Deutschland lance une enquête sur l'ontologie de Wikidata : https://wikimedia.sslsurvey.de/ontology-issues/

▲ Refonte du processus de labellisation d'articles — La communauté de la Wikipédia francophone discute de l'éventualité d'une prise de décision sur la refonte du processus de labellisation d'articles. La discussion est ouverte depuis le 26 janvier. Voir Discussion Wikipédia:Prise de décision/Refonte du processus de labellisation d'articles.

Wikidata et limites structurelles

James Hare en octobre 2016.

Nous avons souligné périodiquement dans cette infolettre les problèmes de plus en plus fréquents de TIMEOUT de l'outil de requêtes SPARQL de Wikidata. Le wikimédien James Hare, l'un des premiers et plus grands contributeurs de Wikidata, a publié un billet de blogue sur le sujet.

Harej affirme ainsi que le système de gestion de base de données orientée graphe et triplestore Blazegraph, utilisé par Wikidata, a été racheté il y a un certain temps par Amazon. Harej considère aujourd’hui Blazegraph comme étant proche d’un abandongiciel^{[note 1]}.

Cette absence de développement de Blazegraph fait en sorte que Wikidata est de plus en plus limitée dans son évolution et sa consultation. Cela force les contributeurs devant faire des requêtes impliquant des millions d'éléments à créer leur propre version de Wikidata, souvent à partir de dumps.

Harej explore dans son billet différentes manières de créer sa propre version de Wikidata afin d'éviter les TIMEOUT. Il affirme que Blazegraph demeure la meilleure voie pour ce faire, mais qu'il est difficile d'installation. Harej parle également de l'outil QLever (d), développé par l'université de Fribourg-en-Brisgau, affirmant que celui-ci est, pour le moment, la meilleure alternative à Blazegraph et beaucoup plus facile à installer que ce dernier. Il a cependant comme défaut l'impossibilité de mettre à jour la base de connaissance. Il faut recommencer le processus du début avec chaque nouveau dump.

Hare termine son billet en disant qu'il faudra tôt ou tard que Wikidata se penche sur ces enjeux, quitte même à remettre en question l'idée que le SPARQL soit le langage de requête.

Tribune

Les RAW encouragent les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

Réflexion sauvage sur la rédaction automatisée dans Wikipédia

par PAC2

Dans cette tribune, j'essaie de rassembler mes réflexions autour du thème de la création massive d'articles et du recours à des outils de rédaction automatisée comme DeepL ou ChatGPT.

Évidemment, le sujet est très large et mériterait sans doute de plus longs développements. Voici néanmoins mes premières interrogations sur le sujet.

Un foisonnement d'initiatives

En décembre 2022, Roland45 entreprend la création massive de 1000 articles concernant des scientifiques américaines (Projet:Les Mille Pages). A partir d'une sélection d'articles de la Wikipédia anglophone, Roland45 utilise DeepL pour effectuer une traduction automatique et effectue un ensemble de traitements dans Excel pour corriger la mise en forme et publier les articles. Suite à des discussions avec la communauté, Roland45 a modifié son approche. Les 1000 articles ont été publiés en brouillon dans l'espace projet. Chacun peut relire un article et le basculer dans l'espace principal.

En avril 2022, Angela Fan, chercheuse chez Meta AI, communique sur un algorithme capable de générer des biographies de femmes pour combler le fossé de genre^[10]^,^[11].

En juillet 2022, Fabio Petroni, également chercheur chez Meta AI, publie Cite, un système qui trouve automatiquement une référence pour les passages non sourcés sur la Wikipédia en anglais^[12].

Le 15 novembre 2022, Meta AI et Papers with code publient Galactica, un modèle de langage entraîné sur 48 millions d'articles scientifiques. Les auteurs mettent en avant le fait que le modèle pourrait générer des articles Wikipédia automatiquement. Des utilisateurs ont d'emblée remarqué que Galactica était capable d'écrire des articles Wikipédia absurde comme cet article sur les ours vivants dans l'espace^[13]^,^[14].

Fin novembre, OpenAI publie ChatGPT, un modèle de langage qui séduit de nombreux utilisateurs. Des utilisateurs ont évidemment testé la possibilité d'utiliser ChatGPT pour générer des articles. Par exemple, l'article Artwork title de la Wikipédia anglophone a été rédigé dans sa première version par ChatGPT et publié par l'utilisateur Pharos^[15]^,^[16].

Toutes ces initiatives reposent sur l'idée que l'on pourrait améliorer Wikipédia en utilisant des outils de traduction automatique ou de génération automatique.

Peut-on réduire ou combler un biais de l'encyclopédie grâce à la rédaction automatique ?

Angela Fan ou le Projet Les Mille Pages se donnent pour objectif de réduire le biais de genre sur Wikipédia en utilisant des méthodes de rédaction automatique. Derrière l'intention qui est louable, on peut se demander si c'est vraiment ce qu'on veut. Le biais de genre comporte deux aspects essentiels, le fossé de la participation (surreprésentation des hommes parmi les contributeur·rices) et le biais dans le contenu (surreprésentation des hommes dans les articles biographiques). On n'aura rien gagné si on réduit la seconde dimension sans réduire la première. Augmenter automatiquement le nombre de biographies consacré à des femmes ne réduirait qu'artificiellement le biais de genre. Ce qu'on veut vraiment c'est diversifier la communauté des contributeur·rices, avoir des points de vues diversifiés, des centres d'intérêt diversifiés, des références diversifiées, etc. Est-ce que ç'a vraiment du sens de réduire le biais de genre avec des bots ou des outils de rédaction automatisée ?

Qui prendra soin des articles créés automatiquement ?

Le projet de créer massivement et automatiquement des articles laisse de côté la question de l'entretien des articles. Écrire un article, ça n'est pas seulement le créer à une date donnée. C'est aussi y revenir de temps en temps, l'améliorer, le relier à d'autres articles, etc. Pour un article créé automatiquement au milieu de centaines d'autres, personne n'aura dans un coin de sa tête d'y revenir de temps en temps pour voir ce qu'il est devenu. On risque de se retrouver avec un grand nombre d'articles en jachère. Est-ce qu'in fine une création massive d'articles avec des outils de création automatique ne risque pas de dégrader la qualité de l'encyclopédie ?

Est-ce qu'on veut déléguer aux bots des tâches de mise en forme ou est-ce que les bots vont nous déléguer les basses besognes de mise en forme ?

Dans son ouvrage En attendant les robots, le sociologue Antonio Casilli pose la question suivante : « Les humains vont-ils remplacer les robots ? ». Il montre que derrière les intelligences artificielles, il y a souvent (ou toujours) du travail humain de tâcheron pour labelliser les données, corriger ou superviser les sorties de l'algorithme. En bref, ce qu'il appelle du travail du clic ou du digital labor. Alors que l'intelligence artificielle est sensée nous délivrer les tâches subalternes pour nous permettre de nous concentrer sur l'essentiel, c'est bien souvent le contraire qui se produit puisque une armée de travailleurs invisibles sont employés à produire les données labellisées.

On retrouve cette même question avec la création automatique d'articles. Par exemple, dans le Projet Les Mille Pages, on délègue au bot le travail créatif de rédaction et aux humains le travail rébarbatif de relecture et de mise en forme. On va peut-être plus vite mais est-ce qu'on y prend plus de plaisir ? Est-ce que les contributeurs et contributrices ont envie sur leur temps libre et par plaisir de faire un travail riche et créatif de rédaction ou un travail rébarbatif de mise en forme et de relecture ?

Les bots ont-ils une faculté de jugement ?

La tentation d'utiliser des modèles de langage comme BERT, GPT-3, Galactica ou ChatGPT pour rédiger Wikipédia risque de devenir de plus en plus grande. Dans un article célèbre, les chercheuses Emily Bender, Timnit Gebru, Angelina McMillan-Major et Margaret Mitchell ont avec justesse défini ces modèles de langage comme des perroquets stochastiques^[17]. Comme l'explique très bien Emily Bender, ChatGPT est un modèle de langage, pas un modèle de connaissance. Il produit des énoncés vraisemblables mais sans que l'on n'ait aucun moyen de savoir si l'énoncé est vrai ou non^[18]. Comme le dit Olivier Ertzscheid, le problème c'est qu'il faut être soi-même expert du domaine pour savoir si la réponse de ChatGPT est pertinente. On risque de dépenser plus d'énergie à vérifier ou réfuter ce que dit ChatGPT qu'autre chose^[19]. Iris van Rooij va plus loin et propose d'entrer en résistance contre ChatGPT. Pour elle, les textes générés par ChatGPT relèvent du plagiat^[20].

« Je ne vois pas l'intérêt d'écrire des dissertations en produisant la forme d'une dissertation. »^[21]

— Emily Bender, citée par Iris van Rooij

On pourrait reprendre la citation d'Emily Bender et l'adapter à Wikipédia : Au-delà de la hype actuelle, quel est l'intérêt d'écrire des articles de Wikipédia en reproduisant simplement la forme d'un article de Wikipédia ?

Bien sûr, ChatGPT permet de générer facilement du texte qui ressemble à un article de Wikipédia mais ChatGPT ne sait pas distinguer le vrai du faux, n'a aucune faculté de jugement et ne cite jamais ses sources. La valeur de Wikipédia ne vient pas tant de la somme des textes rédigés que de la somme des jugements des contributeurs et contributrices qui attestent que tel ou tel énoncé est vrai ou à minima vérifiable.

Le chat(GPT) va-t-il se mordre la queue ?

Les modèles de langage sont entraînés sur des corpus de texte issus du Web. Évidemment, Wikipédia est un corpus très largement utilisé pour entraîner tous les modèles de langage. Si Wikipédia devient lui-même écrit par des générateurs automatiques de langage, on risque à l'avenir d'entraîner les futurs IA sur des corpus eux-mêmes rédigés par des IA. Cela créerait une sorte de boucle algorithmique infinie. Est-ce qu'on n'aurait pas envie de préserver certaines zones comme Wikipédia de la génération automatique de textes rien que pour garder une sorte de « zone naturelle » du langage ? Est-ce que Wikipédia ne pourrait pas être une zone à défendre numérique ?

Où allons-nous ? Où voulons-nous aller ?

Je ne sais pas quelles règles la communauté va se donner concernant les outils de rédaction automatisée mais je me dis que, quelle que soit la décision finale, il faut garder en tête de :

faire grandir la communauté, pas seulement le contenu ;
prendre soin des articles et les faire grandir au-delà de leur création ;
laisser aux humains le travail créatif plutôt que le travail rébarbatif ;
c'est la somme des jugements humains qui fait la qualité de Wikipédia et que l'usage de telle ou telle solution automatisée ne pourra jamais se substituer au jugement humain.

Pages à créer du mois

Après le succès bœuf du mois dernier, qui a mené à pas moins de zéro créations (congé des Fêtes ? propositions merdiques ?), nous vous invitons à nouveau à créer des pages wiki au cours de ce mois-ci.

gros lot progressif (en), parce que Mega Millions dépasse pour la troisième fois le milliard de dollars américains en jeu.
Amazon Neptune (en), parce que présenté comme une alternative à Blazegraph.
Lolo ball (en) (terme inconnu en français), parce qu'une étudiante m'a enfin appris|rappelé comment s'appelle cette sorte de jouet auquel je compare souvent la forme de la Voie lactée.
heure, minute et seconde d'ascension droite (de), parce que ça fait près de 20 ans que j'enseigne l'astronomie et que je ne faisais pas suffisamment la distinction auprès des élèves entre ce système de notation et celui impliquant les minutes et secondes d'arc.
pépinologue

« Simon Villeneuve – qu'est-ce qu'un pépinologue
ChatGPT – Un pépinologue est une personne qui étudie les pépins de fruits (principalement les pépins de raisin) afin d'en déterminer l'espèce, la variété, la qualité et l'origine. Les pépinologues utilisent des techniques de microscopie et d'analyse génétique pour identifier les pépins et peuvent également utiliser des méthodes de datation pour déterminer l'âge de la plante. Les pépinologues peuvent travailler dans des domaines tels que l'agronomie, l'œnologie, la génétique et l'archéologie.
Simon Villeneuve – je croyais que c'était plutôt une forme d'actuaire
ChatGPT – Effectivement, un pépinologue peut également être une forme d'actuaire, c'est-à-dire une personne qui utilise des statistiques et des mathématiques pour évaluer les risques financiers et évaluer les polices d'assurance. Les pépinologues actuariels peuvent utiliser des données démographiques, économiques et financières pour évaluer les risques liés aux produits d'assurance et développer des plans d'assurance pour les entreprises et les individus. Il est donc possible que le sens de "pépinologue" varie en fonction du contexte. Effectivement, un pépinologue peut également être une forme d'actuaire, c'est-à-dire une personne qui utilise des statistiques et des mathématiques pour évaluer les risques financiers et évaluer les polices d'assurance. Les pépinologues actuariels peuvent utiliser des données démographiques, économiques et financières pour évaluer les risques liés aux produits d'assurance et développer des plans d'assurance pour les entreprises et les individus. Il est donc possible que le sens de "pépinologue" varie en fonction du contexte.
Simon Villeneuve – tu es certain de cette réponse ?
ChatGPT – Je suis désolé, je me suis trompé dans ma réponse précédente. En fait, le terme "pépinologue" n'a pas de lien direct avec la profession d'actuaire. Il est utilisé uniquement pour désigner une personne qui étudie les pépins de fruits pour en déterminer l'espèce, la variété, la qualité et l'origine, comme je l'ai mentionné dans ma première réponse. Je m'excuse pour toute confusion que cela a pu causer. »

Insolite

▲ Le saviez-vous ? —

L'embrasement généralisé éclair (EGE), ou flashover en anglais, est un phénomène thermique, une phase du développement d'un feu dans un local semi-ouvert où l'apport de comburant se fait de moins en moins. En effet, un tel local permet, d'une part une alimentation convenable de l'incendie en oxygène (contrairement à l'explosion de fumées, l'EGE ne se produit pas du fait d'un afflux soudain d'air), d'autre part une accumulation de chaleur.

Prenez un peu de monarchie, ajoutez un underdog royal prêt à publier un livre (en) qui montre que tout ce beau monde n'a rien de divin et boom, vous obtenez un EGE.

noframe

La tenségrité^[22], soit l'intégrité en tension ou la compression flottante, est en architecture, un principe structurel basé sur un système de composants isolés sous compression à l'intérieur d'un réseau en tension continue, et disposés de telle sorte que les éléments comprimés (généralement des barres ou des entretoises) ne se touchent pas tandis que les éléments tendus précontraints (généralement des câbles ou des tendons) délimitent le système dans l'espace.

ce résumé introductif (RI) est en lice pour le prix du RI le moins compréhensible de l'encyclopédie. Précisons que nous voulions porter à votre attention cette notion derrière certains montages impressionnants diffusés sur les médias sociaux (exemple)

L'article inégalités hommes-femmes mentionne 15 femmes et 14 hommes. Il est quasiment paritaire^[23].

Le syndrome du mal de débarquement, ou MdDS, est un trouble neurologique survenant généralement après une croisière, un vol en avion ou un autre événement de mouvement soutenu. Le MdDS est généralement diagnostiqué par un neurologue ou un otorhinolaryngologiste (ORL) lorsqu'une personne signale une sensation persistante de balancement interne (de haut en bas), de balancement avant-arrière ou de balancement gauche-droite. Cela suit généralement une croisière ou une autre expérience de mouvement. ^{[note 2]}

▲ Jouer au cricket comme Rohit Sharma — Il y a pas moins de 5 Rohit Sharma qui jouent suffisamment bien au cricket pour qu'on ait jugé bon de leur créer un élément Wikidata :

et vous, quel est le plus grand nombre de personnes homonymes au sein d'une même discipline que vous ayez vu ?

Humour

Wikipédia est une entreprise sérieuse. Néanmoins, un peu d'humour peut aider à la rendre moins austère.

▲ Le saviez-vous? — Pour apparaître sur Wikiquote en français, une citation doit être âgée d'au moins 10 ans.

« 2033
La dernière citation humaine digne d'intérêt, datant de 2023, aurait pu être intégrée cette année à Wikiquote en français. Mais bon, comme tout le monde le sait, il n'y a plus de Wikiquote et les humains qui restent ne savent plus lire et écrire depuis longtemps. »

— OmniGPT, Chronologie de l'ère des machines

▲ Vide — La thématique du XXI^e siècle est enfin expliquée ! En effet, au début des années 2010, des chercheurs ont découvert que la Voie lactée se situe dans une région très peu peuplée de l'Univers observable, appelée le vide KBC.

Vous comprenez maintenant pourquoi les Conférence des Parties sont aussi vides : on y respecte la nature profonde de l'environnement extra-galactique !

▲ Article zen du mois — nez juif^{[note 3]}

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

▲ Merci — Un grand merci à PAC2 et Simon Villeneuve pour ce travail de qualité, un numéro que j'ai pris plaisir à lire et que je vais relire au calme car il y a de la matière. Le buzz autour de chatGPT m'a tout de suite alerté sur l'arrivée prochaine de trolls virtuels pour détourner notre contenu et désorganiser ce qu'il reste de la communauté francophone. Avec un peu de savoir-faire, qui ne sera plus très long à développer, on pourra avoir des agents de ce type se faire élire sysops ou bureaucrates, voire nommés vérificateurs d'adresses ou masqueurs de modifications, laissant le contrôle du wiki à des corporations ou des cybercriminels. Quand je vois comment un militant d'extrême-droite isolé et pas spécialement discret a pu provoquer un « embrasement généralisé éclair » sur l'article informaticien ( ! ) en agitant un non-sujet pour leurrer tout son monde, on peut douter de la résistance de notre communauté à une attaque coordonnée un peu maîtrisée. À bientôt, — Bob Saint Clar (discuter) 1 février 2023 à 07:25 (CET)[répondre]

▲ Toujours plus d'IA —▲ Refonte du processus de labellisation d'articles —Modeste contributeur, plusieurs choses m'agacent et nuisent à la qualité de wiki: la création en série de pages squelettiques et il n'y a pas besoin d'IA pour ce faire, je pense qu'une bonne page doit être créée ou avoir pour contributeur conséquent un contributeur motivé, il suivra la page, évitera le style répétitif de certains paragraphes indigne d'une IA et qui ne fait que singer un style encyclopédique. Ce lissage du style est peut-être une conséquence de la multi-contribution nécessaire mais la recherche de la neutralité et le consensus ne doivent pas rendre un article rébarbatif. Quant à la labellisation des articles, il faut peut-être se poser la question de l'évaluation : faite souvent à la chaine sans vrai lecture, sans tenir compte des critères elle est souvent là pour décourager les contributeurs non "professionels" (il faudra qu'on m'explique comment on peut faire 50 à 100 contributions en une journée sans robot déclaré) mais peut-être que ces taches répétitives sont du ressort d'une IA ? On aimerait pouvoir s'appuyer ou participer aux portails (relecture, évaluation, labellisation) mais leur niveau d'activité est trop souvent et malheureusement le signe de leur sommeil.--Brunodumaine (discuter) 1 février 2023 à 13:25 (CET)[répondre]

▲ Limites de Wikidata — Je suis surpris de constater que l'exploration de la problématique des TIMEOUT de Wikidata par Harej s'apparente beaucoup à la mienne. N'ayant pas ses connaissances en informatique, j'ai cependant la chance d'avoir un frère qui les a. Nous avons donc nous aussi installé notre version locale de Wikidata. Après avoir essayé, sans succès, l'installation avec Blazegraph, nous nous sommes rabattus sur QLever et, comme le dit Harej, ça a été straigthforward (direct).
J'aimerais bien lire l'avis de personnes de la Foundation, ou de wmde, sur le sujet. - Simon Villeneuve 30 janvier 2023 à 02:14 (CET)[répondre]

▲ Jouer au cricket comme Rohit Sharma — : on a quatre Adama Traoré, footballeurs --Remy34 (discuter) 1 février 2023 à 10:23 (CET)[répondre]

On a 19 cardinaux Colonna, qui plus est tous de la même famille… --Laurent Jerry (discuter) 1 février 2023 à 10:57 (CET)[répondre]

Merci de vous prêter au jeu !
Oh la la, 19 ! Sont-ils suffisamment séparés dans le temps pour éviter les confusions (j'ai pas suivi le lien) ? Sinon, avaient-ils de petits noms pour se distinguer ? - Simon Villeneuve 1 février 2023 à 12:20 (CET)[répondre]

insérez ici le mot de la fin
– insérez ici l'entité à l'origine du mot de la fin

Rédigé/traduit par PAC2 et Simon Villeneuve

Citations originales

Notes

↑ Probablement parce qu'Amazon désire pousser l'utilisation de son équivalent propriétaire Amazon Neptune (en), qui coûterait des milliers de dollars mensuellement à quiconque voudrait faire rouler son propre service Wikidata.
↑ Tiré du Bistro du 30 janvier.
↑ Tiré du Bistro du 17 janvier

Références

↑ https://www.ledevoir.com/culture/776372/arts-la-duree-de-protection-du-droit-d-auteur-prolongee-de-20-ans
↑ https://actualitte.com/article/106923/international/le-canada-prolonge-la-duree-du-droit-d-auteur-a-70-ans
↑ https://wikis.world/about
↑ https://wiki.style/explore
↑ https://vis.social/@Wikimedia_Fr@wikis.world
↑ https://mastodon.top/@wiktionnaire
↑ https://framapiaf.org/@lessanspages
↑ https://vis.social/@wikidata@wikis.world
↑ 30-minute award voir l'annonce sur YouTube
↑ https://www.ictjournal.ch/articles/2022-04-20/feminiser-wikipedia-avec-des-biographies-generees-automatiquement
↑ https://about.fb.com/news/2022/03/generating-biographies-of-marginalized-groups/
↑ https://tech.facebook.com/artificial-intelligence/2022/07/how-ai-could-help-make-wikipedia-entries-more-accurate/
↑ https://www.technologyreview.com/2022/11/18/1063487/meta-large-language-model-ai-only-survived-three-days-gpt-3-science/
↑ https://mobile.twitter.com/meaningness/status/1592634519269822464
↑ (en) Stephen Harrison, « Should ChatGPT Be Used to Write Wikipedia Articles? », Slate,‎ 12 janvier 2023 (lire en ligne).
↑ Voir aussi Bistro/5 janvier 2023
↑ (en) Emily Bender, Timnit Gebru, Angelina McMillan-Major et Shmargaret Shmitchell, « On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 », FAccT '21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency,‎ mars 2021, p. 610–623 (DOI 10.1145/3442188.3445922)
↑ https://mastodon.social/@emilymbender@dair-community.social/109456744841315414
↑ Olivier Ertzscheid, « GPT-3 : c’est toi le Chat. », Affordance,‎ 2 janvier 2023 (lire en ligne).
↑ https://irisvanrooijcogsci.com/2023/01/14/stop-feeding-the-hype-and-start-resisting/
↑ Citation originale: « I don’t see the point of writing essays as producing the form of an essay. » - (en) Iris van Rooij, « Against automated plagiarism », Blog d'Iris van Rooij,‎ 29 décembre 2022 (lire en ligne).
↑ Le terme serait l'invention de Richard Buckminster Fuller en 1949. C’est un mot-valise formé sur tensile integrity.
↑ Données extraites de l'outil de mesure de la diversité de genre au 16 janvier 2023: https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article?wikipedia=fr.wiki.x.io&article=In%C3%A9galit%C3%A9s_hommes-femmes, initialement publié sur Mastodon: https://vis.social/@pac2/109551660344013448

[10] Probablement parce qu'Amazon désire pousser l'utilisation de son équivalent propriétaire Amazon Neptune (en), qui coûterait des milliers de dollars mensuellement à quiconque voudrait faire rouler son propre service Wikidata.

[25] Tiré du Bistro du 30 janvier.

[26] Tiré du Bistro du 17 janvier

[1] ttps://www.ledevoir.com/culture/776372/arts-la-duree-de-protection-du-droit-d-auteur-prolongee-de-20-ans

[2] ttps://actualitte.com/article/106923/international/le-canada-prolonge-la-duree-du-droit-d-auteur-a-70-ans

[3] ttps://wikis.world/about

[4] ttps://wiki.style/explore

[5] ttps://vis.social/@Wikimedia_Fr@wikis.world

[6] ttps://mastodon.top/@wiktionnaire

[7] ttps://framapiaf.org/@lessanspages

[8] ttps://vis.social/@wikidata@wikis.world

[9] 30-minute award voir l'annonce sur YouTube

[11] ttps://www.ictjournal.ch/articles/2022-04-20/feminiser-wikipedia-avec-des-biographies-generees-automatiquement

[12] ttps://about.fb.com/news/2022/03/generating-biographies-of-marginalized-groups/

[13] ttps://tech.facebook.com/artificial-intelligence/2022/07/how-ai-could-help-make-wikipedia-entries-more-accurate/

[14] ttps://www.technologyreview.com/2022/11/18/1063487/meta-large-language-model-ai-only-survived-three-days-gpt-3-science/

[15] ttps://mobile.twitter.com/meaningness/status/1592634519269822464

[16] (en) Stephen Harrison, « Should ChatGPT Be Used to Write Wikipedia Articles? », Slate,‎ 12 janvier 2023 (lire en ligne).

[17] Voir aussi Bistro/5 janvier 2023

[18] (en) Emily Bender, Timnit Gebru, Angelina McMillan-Major et Shmargaret Shmitchell, « On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 », FAccT '21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency,‎ mars 2021, p. 610–623 (DOI 10.1145/3442188.3445922)

[19] ttps://mastodon.social/@emilymbender@dair-community.social/109456744841315414

[20] Olivier Ertzscheid, « GPT-3 : c’est toi le Chat. », Affordance,‎ 2 janvier 2023 (lire en ligne).

[21] ttps://irisvanrooijcogsci.com/2023/01/14/stop-feeding-the-hype-and-start-resisting/

[22] Citation originale: « I don’t see the point of writing essays as producing the form of an essay. » - (en) Iris van Rooij, « Against automated plagiarism », Blog d'Iris van Rooij,‎ 29 décembre 2022 (lire en ligne).

[23] Le terme serait l'invention de Richard Buckminster Fuller en 1949. C’est un mot-valise formé sur tensile integrity.

[24] Données extraites de l'outil de mesure de la diversité de genre au 16 janvier 2023: https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article?wikipedia=fr.wiki.x.io&article=In%C3%A9galit%C3%A9s_hommes-femmes, initialement publié sur Mastodon: https://vis.social/@pac2/109551660344013448

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[note 1]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[note 2]

[note 3]