Discussion Wikipédia:Sondage/Configuration d'InternetArchiveBot
Discussions avant le lancement du sondage
modifierGestion des discussions en cours
modifierBonjour,
Pour clarifier la situation (et pour éviter l'éparpillement des discussions) je précise que des discussions sont en cours dans :
- la section
Wikipédia:Bot/Statut#Premier jour de fonctionnementDiscussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot, où CyberPower678 (dresseur d'InternetArchiveBot) répond (en anglais) aux questions en cours sur le fonctionnement actuel du bot ; - cette pdd, pour préparer le sondage.
Dans ces discussions, les sujets abordés sont très proches. À mon avis, la section Wikipédia:Bot/Statut#Premier jour de fonctionnement Discussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot devrait "se stabiliser", puis la formulation du sondage pourrait changer pour prendre en compte des éléments de cette section stabilisée (par exemple : des impossibilités techniques), puis les questions/choix du sondage pourraient être expliqués (en anglais) à CyberPower678 (pour qu'il comprenne les choix proposés et signale d'éventuelles impossibilités), puis la formulation du sondage pourrait encore changer pour prendre en compte les réponses de CyberPower678, avant la publication du sondage.
Cordialement --NicoScribe (discuter) 17 septembre 2017 à 19:10 (CEST)
- Je pense qu'il
faut maintenant oublierne faut plus compléter Discussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot et concentrer nos questions à CyberPower678 dans cette pdd, même si :- il ne faut pas oublier les problèmes non résolus listés dans Discussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot ;
- ce sondage est toujours en pause en attendant la conclusion de la discussion très complexe entre CyberPower678 et Pmartin dans #Reviving this discussion → Discussion utilisateur:Pmartin#I left you a message! ;
- des personnes font des remarques dans Discussion utilisateur:InternetArchiveBot, en ignorant le #REDIRECT vers la pdd du bot sur WP en anglais.
- --NicoScribe (discuter) 12 mai 2018 à 11:00 (CEST) → 13 avril 2019 à 20:03 (CEST)
Remarques (sur plusieurs sujets) de Zebulon84 et d'Archimëa
modifier[Ci-dessous : les messages datés entre le 17 septembre 2017 à 07:31 (CEST) et le 17 septembre 2017 à 11:54 (CEST) sont issus de Discussion module:Biblio/Lien web#Remarques sur les modifications d'InternetArchiveBot → ils ont été déplacés ici parce qu'ils concernent le sondage. --NicoScribe (discuter) 17 septembre 2017 à 19:10 (CEST)]
- En ce moment j'ai du mal à m’intéresser à cette question, donc j'ai lu la discussion en travers.
- Pour que les contributeurs puisse répondre au sondage en toute connaissance de cause, il faudrait rappeler l'implémentation récente des paramètres archive-url et archive-date, car je ne pense pas que ceci soit très connu. Le choix de laisser le lien vers le site d'origine au lieu de le remplacer par archive-url même lorsque celui-ci est déclaré comme mort peut d'ailleurs être validé ou infirmé par une question sur ce sondage.
- Et s'il faut re-modifier le comportement du modèle pour s'adapter au fonctionnement du bot fonctionnant sur d'autre wiki (et donc avoir un meilleur compatibilité de notre modèle aux import lors des traduction), je peux le faire. Il faut juste me spécifier le nouveau comportement. — Zebulon84 (discuter) 17 septembre 2017 à 07:31 (CEST)
- NicoScribe, JackPotte et Zebulon84 : OK, pour la présentation et l'info de la modif du modèle ajoutant les paramètres.
- Pour la modifs du modèle, la proposition pourras être faite au dresseur. Mais le comportement du modèle français (en terme de paramètre (les paramètres sont identiques, mais le comportement et l'affichage est légèrement différent) ) étant équivalent à son homologue anglais, il ne doit pas y avoir besoin de modifier.
- Pour l'usage du lien archivé en lien principal dans le paramètre url, c'est demandé à la question 3bis.
- Mais, tus peu être levé un flou. Là, la question propose soit ce dernier comportement soit l'usage des paramètres.
- Il faudrait peut être modifier pour privilégier un comportement, soit l'un soit l'autre, mais accepter l'autre. Non ?
- Cela peut se faire en rajoutant une question, ce qui me semble le plus simple. EX : "Si vous estimez que cette forme doit être privilégiée, mais l'autre peut être tolérée" : "votez oui", "contre = l'autre forme privilégié et l'autre tolérée". -- Archimëa [Toc 2 Mi] 17 septembre 2017 à 11:06 (CEST)
- Il faudrait déplacer cette discussion sur la pdd du sondage, non ? peut-être laisser les deux trois premiers messages et mettre un modèle déplacer vers... ? -- Archimëa [Toc 2 Mi] 17 septembre 2017 à 11:49 (CEST)
- NicoScribe, JackPotte et Zebulon84 : nouvelle question 1 : Je vois un soucis à l'autorisation d'Intenret archivebot
- Il me semble qu'il ne teste que la Wayback Machine, donc s'il rencontre un lien mort qui n'est pas archivé sur la WM, il met le modèle lien brisé. Cependant le lien peut-être archivé sur Wikiwix, Webcite et Archive.is (si d'autre sites d'archivage existent précisons-le).
- Que peut-on faire ? demander si Cyberpower peut rajouter le test pour vérifier l'archivage vers ses cites ? il me semble que oui.
- Ceci m'amène à poser une nouvelle question 2 Quel site d'archivage privilégier ? là quelqu'un a une idée à proposer ? -- Archimëa [Toc 2 Mi] 17 septembre 2017 à 11:49 (CEST)
- NicoScribe :
PS : je n'arrive pas à retrouver l'annonce de Zebulon84 annoncant l'implémentation des nouveaux paramètres sur sur bistro- Edit : trouvé, sur la pdd du modèle : [1] -- Archimëa [Toc 2 Mi] 17 septembre 2017 à 11:54 (CEST)- NicoScribe : un avis sur les deux question ci-dessus ? -- Archimëa [Toc 2 Mi] 19 septembre 2017 à 18:17 (CEST)
- Zebulon84 et Archimëa : désolé pour le délai de réponse. Souvent je préfère gérer les "urgences" remontées par ma liste de suivi (ou dériver vers plein de petites tâches) plutôt que me pencher sur des sujets aussi complexes.
- Zebulon84, j'ai modifié l'introduction pour rappeler l'implémentation des paramètres d'archive. Est-ce que ça te convient ? Moi il y a un truc qui me gêne énormément (et qui m'avait déjà gêné dans notre longue discussion préparatoire lorsque tes exemples du 17 mai 2017 ont eu plusieurs comportements successifs). Dans quelques années, {{Lien web}} et {{Lien brisé}} auront évolué, donc les exemples dans l'intro ne voudront plus rien dire → ce sondage sera beaucoup moins compréhensible. Alors serait-il possible de recréer un mini-écosystème "modules + modèles" en sous-pages du sondage, pour avoir un comportement local stable des exemples dans l'intro ?
- Archimëa, je n'ai pas encore assez bien étudié la formulation + l'enchaînement + la complétude des questions du sondage pour répondre à ta question de 11:06 ci-dessus. J'y re-réfléchirai. Pour ta question 1 de 11:49 ci-dessus : InternetArchiveBot teste le lien direct (si OK : il ne fait rien de plus), puis le lien Wikiwix (si OK : il ne fait rien de plus, cf. discussion 25-26 août 2017 sur Méta-Wiki), puis le lien Wayback Machine (si OK : il l'utilise dans Lien web, sinon il met Lien brisé). Étant donné que Cyberpower678 est payé par Internet Archive (via des accords avec la Wikimedia fundation [2]), je nous vois mal lui demander de tester/ajouter des liens vers Webcite et Archive.is... Pour ta question 2 de 11:49 : je ne sais pas trop. Pour moi, le contexte est : Wikiwix est le site d'archivage par défaut et Wayback Machine est le seul autre site d'archivage valorisé par un bot. Si nous laissons InternetArchiveBot fonctionner comme il le fait actuellement, Wikiwix restera le site d'archivage le plus exploité, par défaut, puis il y aura Wayback Machine (quand InternetArchiveBot sera passé par là), puis Webcite et Archive.is (quand des wikipédiens ont mis des liens directs). Tant que Webcite et Archive.is ne seront pas valorisés par des bots faisant la course avec InternetArchiveBot, ils resteront derrière... Mais tout cela est-il vraiment un problème : à notre niveau nous voulons juste avoir des sources accessibles pour atteindre WP:V.
- --NicoScribe (discuter) 20 septembre 2017 à 18:43 (CEST)
- Zebulon84 et Archimëa : désolé pour le délai de réponse. Souvent je préfère gérer les "urgences" remontées par ma liste de suivi (ou dériver vers plein de petites tâches) plutôt que me pencher sur des sujets aussi complexes.
- NicoScribe : un avis sur les deux question ci-dessus ? -- Archimëa [Toc 2 Mi] 19 septembre 2017 à 18:17 (CEST)
Remarques de Pmartin
modifierExtrait du message de NicoScribe du 20 septembre 2017 à 18:43 et déplacement du premier message de Pmartin, issus du fil de discussion ci-dessus.
┌─────────────────────────────────────────────────┘
Pour ta question 1 de 11:49 ci-dessus : InternetArchiveBot teste le lien direct (si OK : il ne fait rien de plus), puis le lien Wikiwix (si OK : il ne fait rien de plus, cf. discussion 25-26 août 2017 sur Méta-Wiki), puis le lien Wayback Machine (si OK : il l'utilise dans Lien web, sinon il met Lien brisé). Étant donné que Cyberpower678 est payé par Internet Archive (via des accords avec la Wikimedia fundation [3]), je nous vois mal lui demander de tester/ajouter des liens vers Webcite et Archive.is... Pour ta question 2 de 11:49 : je ne sais pas trop. Pour moi, le contexte est : Wikiwix est le site d'archivage par défaut et Wayback Machine est le seul autre site d'archivage valorisé par un bot. Si nous laissons InternetArchiveBot fonctionner comme il le fait actuellement, Wikiwix restera le site d'archivage le plus exploité, par défaut, puis il y aura Wayback Machine (quand InternetArchiveBot sera passé par là), puis Webcite et Archive.is (quand des wikipédiens ont mis des liens directs). Tant que Webcite et Archive.is ne seront pas valorisés par des bots faisant la course avec InternetArchiveBot, ils resteront derrière... Mais tout cela est-il vraiment un problème : à notre niveau nous voulons juste avoir des sources accessibles pour atteindre WP:V. --NicoScribe (discuter) 20 septembre 2017 à 18:43 (CEST)
- "je nous vois mal lui demander de tester/ajouter des liens vers Webcite et Archive.is... Pour ta question 2 de 11:49 : je ne sais pas trop. Pour moi, le contexte est : Wikiwix est le site d'archivage par défaut et Wayback Machine est le seul autre site d'archivage"
- Wikiwix ne gère pas un monopole sur les archives de wikipedia puisque la communauté à le pouvoir de positionner n'importe quel outil d'archivage via le javascript. Par contre le fait de déployer ce robot oblige les autres à suivre le standard de la WayBackMachine. Ma question est donc comment peut on incorporer un futur concurrent sur ce robot qui se déploie sur tous les wikipedia ? Ce changement est un changement est un changement profond car la communauté accepte de changer les contenus de l'encyclopédie par un robot payé par une Fondation où est donc le vote communautaire Francophone avant de lancer le paramétrage ? "InternetArchiveBot a obtenu le statut de bot le 13 septembre 2017. Depuis, ses contributions ont poussé quelques contributeurs à présenter des griefs (cf. historique ci-dessus). Cyberpower678 y a répondu. Cependant, quelques problématiques perdurent." es ce que la communauté a été sensibilisé sur le fait que la waybackMachine archive des données aux détriments du droit d'auteurs lors de ce vote communautaire dont je ne trouve aucune trace en Français . In fine qu'on ne prouve que la solution qui sera déployé permettra aisément de déployer des éventuels concurrents sur ce monopole qui s'instaure et tu me convaincras ? Pmartin (discuter) 22 septembre 2017 à 01:51 (CEST)
- Bonjour Pmartin merci pour ton intervention et de proposer ton point de vue. Je suis tout à fait d'accord avec ta première affirmation, ce pourquoi j'ai au départ posé la question 2, et je n'avais pas encore répondu à NicoScribe sur sa dernière intervention (étant un peu embêté). Si je dois parler de mon expérience personnelle, la quasi-totalité des liens que j'ai besoin de trouver en version archivée ne sont pas archivé sur Wikiwix. Je rédige des articles sur des sujets relativement anciens, que des sites d'archivage plus vieux ont déjà archivés... J'y vois aussi un côté vraiment pas pratique puisqu'a priori, il n'y a pas de moteur de rechercher sur ton site et il faut se cogner un copier-coller du début du lien + le lien à faire revivre. Une vraie galère. (PS: j'ai désactivé par défaut l'affichage du lien [archive] sur les liens externes depuis très longtemps). bref. Pour moi privilégier ce/ton site me pose problème. Bref j'ai cependant conscience que mon expérience personnelle n'est pas partagée par tout le monde -- enfin je dois pas être le seul.
- Qu'en pense la communauté ? HEUuuuuuuu, ce sondage, ce vote communautaire, est ici. Cette page est la pdd de ce (futur) vote. Il est destiné justement à interroger la communauté sur ce changement profond. Je savais que c'était un changement très impactant, donc c'est pour cela que je l'ai proposé. à voir en dernier lieu, quand le sondage sera dans une version définitive/solide, s'il y a lieu de le transformer en PDD, ce qui je crois devra être fait (mais attendons que le sondage soit carré, il y a le temps).
- Les droits d'auteurs : franchement, c'est pas le sujet. La Wayback Machine est largement acceptée sur Wikipédia en français et ce n'est pas le but de ce sondage de répondre à cette question. Si ce sujet pose réellement problème, l'interdiction du site est à réfléchir globalement. Utiliser un lien archivé n’enfreint pas les usages et les règles édictée par la communauté. La valeur ajoutée est pour moi indiscutable entre un lien mort et un lien sur archive.org, nonobstant le fait de "déployer" des liens vers un site ne respectant pas toujours les droits d'auteurs (déployer est tout relatif, Wikipédia en français doit déjà comporter des milliers et milliers de liens vers ce site).
- Plutôt que de rester dans l'incantatoire, que proposes-tu ? Personnellement, je suis beaucoup plus pragmatique que cela : InternetarchiveBot pourrait chercher sur archive.is ou webcite ? Que propose-s-tu ? Quelle est ta vision ? Tu es plutôt contre l'autorisation et rester sur le système affichant [archive] ou l'usage du modèle Lien brisé proposant plusieurs alternatives ? -- Archimëa [Toc 2 Mi] 22 septembre 2017 à 08:42 (CEST)
- A priori ce robot a été mis en place, et arrêter sans PDD :) je propose que lorsqu'un lien détecté est KO, d'apposer un modèle qui permet de prendre en charge un ou plusieurs archiveurs. Cela permet à la communauté de pouvoir ajouter ou de retirer les archiveurs via un modèle unique. Cette solution me paraît relativement sage plutôt que de remplacer le lien directement par un lien vers IA. Ce modèle doit laisser accessible le lien d'origine pas mal de lien côté en.wikipedia ont été remplacés suite à des mauvaises détections. Ce robot peut être assujetti à des ban massif lui interdisant les accès ( surtout si il ne respecte pas les normes de crawl ). --Pmartin (discuter) 22 septembre 2017 à 12:38 (CEST)
- Concernant le robot, il est hébergé par la wikimedia fondation ? Respecte t'il les normes du crawl, c'est un sujet à creuser. Car si ce robot ne respecte pas ces directives qui est donc responsable pour répondre aux injonctions des éditeurs de sites qui ne supportent pas les robots qui ne respectent pas les directives contenus dans le fichier robots.txt ?--Pmartin (discuter) 22 septembre 2017 à 13:14 (CEST)
- Pmartin: oui, sur les tools, comme la majorité des bots de Wikipédia dont le mien. Pour info, l'interface est accessible à toollabs:iabot. --Framawiki ✉ 22 septembre 2017 à 18:50 (CEST)
- Framawiki: on a une idée si le robot d'IA gère correctement la balise no-robot, et si il se fait bannir comment il traite les liens ? --Pmartin (discuter) 23 septembre 2017 à 10:33 (CEST)
- Pmartin: Bonne question, je ne sais pas. A demander au créateur du bot. --Framawiki ✉ 23 septembre 2017 à 18:37 (CEST)
- Framawiki: on a une idée si le robot d'IA gère correctement la balise no-robot, et si il se fait bannir comment il traite les liens ? --Pmartin (discuter) 23 septembre 2017 à 10:33 (CEST)
- Pmartin: oui, sur les tools, comme la majorité des bots de Wikipédia dont le mien. Pour info, l'interface est accessible à toollabs:iabot. --Framawiki ✉ 22 septembre 2017 à 18:50 (CEST)
- Concernant le robot, il est hébergé par la wikimedia fondation ? Respecte t'il les normes du crawl, c'est un sujet à creuser. Car si ce robot ne respecte pas ces directives qui est donc responsable pour répondre aux injonctions des éditeurs de sites qui ne supportent pas les robots qui ne respectent pas les directives contenus dans le fichier robots.txt ?--Pmartin (discuter) 22 septembre 2017 à 13:14 (CEST)
- Je propose également de fournir un webservice pour détecter tous les nouveaux liens afin de pouvoir lancer les archives sur les principaux sites d'archives. Pmartin (discuter) 22 septembre 2017 à 13:35 (CEST)
- Pmartin : Si je te suis, IAbot doit, s'il tombe sur un lien mort archivé, qu'il soit dans le modèle {{Lien web}}, dans des crochets carrés [ ] ou nu, le remplacer par un modèle tel que {{Lien brisé}} (certes l'affichage de ce modèle pourrait être amélioré)
Tout choix se ferait alors manuellement après la détection, ou la catégorisation (cachée) dans Catégorie:Article contenant un lien mort.
En fait, tu proposes de confirmer ce qui est globalement l'usage actuel par ce sondage ?
Est-ce qu'un modèle {{Lien web}} ayant évolué un peu pour proposer les différents archiveurs principaux conviendrait ?
Et finalement tu serais contre l'usage des paramètres d'archivage sur le modèle {{Lien web}}, sauf si il a affiché au préalable tous les archiveurs et que les contributeurs ont eux-mêmes décidés du choix du lien ?
- disons qu'un modèle la communauté a la main dessus, et ainsi elle peut toujours décider d'ajouter ou de supprimer un archiveur de la liste.— Le message qui précède, non signé, a été déposé par Pmartin (discuter), le 22 septembre 2017 à 18:11.
- Concernant les normes du crawl, je ne connais pas assez ce point. Je sais que Archive.org aurait archivé pas mal de choses malgré les robots.txt (à confirmer). Le site aurait confirmé qu'il allait outrepasser ce fichier pour archiver et proposer les sites utilisant ce fichier, ou des sites l'ayant utilisé dans le passé. L'article que j'ai lu, sur un blog d'archive.org indique que c'est une procédure en cours oèu en train d'être mise en place, je ne sais pas si cela a été officialisé. Ce point me semble cependant pas de notre ressort, tant que les liens archivés ne proposent que des sites internet.
- Je parle du robot qui détecte les pages KO, pas de celui qui stockent le contenu. Si ce robot se fait bloquer par des sites quel est son comportement, car celui ci est hébergé par la WMF , respecte t'il par exemple la balise no-robot ? — Le message qui précède, non signé, a été déposé par Pmartin (discuter), le 22 septembre 2017 à 18:11.
- Je trouve que c'est une excellente nouvelle si elle pouvait être coordonnée à un modèle. Maintenant si un lien était systématiquement archivé chez chaque archiveurs, un modèle proposant tout les archiveurs pourrait être laissé en ligne. Libre au lecteur de choisir sur quel site il veut lire. J'imagine que c'est le concept ? C'est une bonne idée, reste à gérer le passé et pas seulement le présent et l'avenir.
Il faudrait que ce système aille chercher les liens anciens chez les autres archiveurs pour faire également un multi-archivage... -- Archimëa [Toc 2 Mi] 22 septembre 2017 à 14:02 (CEST)
- A la limite, il pourrait y avoir un modèle qui renverrai vers une page qui listerai les archiveurs qui traiterai les urls des archiveurs, sur le même principe que les espaces de téléchargement.— Le message qui précède, non signé, a été déposé par Pmartin (discuter), le 22 septembre 2017 à 18:11.
- Pmartin : Si je te suis, IAbot doit, s'il tombe sur un lien mort archivé, qu'il soit dans le modèle {{Lien web}}, dans des crochets carrés [ ] ou nu, le remplacer par un modèle tel que {{Lien brisé}} (certes l'affichage de ce modèle pourrait être amélioré)
┌─────────────────────────────────────────────────┘
Ces remarques sont fondamentales, alors je vais demander des avis complémentaires, sur le bistro. --NicoScribe (discuter) 22 septembre 2017 à 17:49 (CEST)
- Il y a également la possibilité à la communauté via le modèle de passer les paramètres nécessaires aux archiveurs ( url , date de création du lien, ... ) et que ce soit les archiveurs qui analysent ces paramètres pour permettre l'accès à l'archive. Pmartin (discuter) 23 septembre 2017 à 10:30 (CEST)
Merci de m'avoir notifié, mais je ne souhaite pas participer davantage que cela à la discussion. Je vous souhaite néanmoins une bonne réflexion. Thémistocle (discuter) 23 septembre 2017 à 21:42 (CEST)
- Bonjour, je n'ai pas trop suivi les différentes discussions mais suite à une discussion sur le bistro [4], notamment sur la question des liens morts temporaires, j'ai l'impression que la meilleure solution serait double :
- Lien archive systématique comme actuellement avec Wikiwix, avec ouverture éventuelle à d'autres archiveurs qui s'engagent à archiver préventivement quasiment tous les liens, le choix par l'utilisateur pourrait se faire via un popup ou des préférences. Ça serait bien d'avoir une question là-dessus. L'intérêt pour l'utilisateur est d'avoir toujours accès aux archives en cas de besoin alors qu'avec un robot détecteur il y aura toujours un délai, plus le problème des liens morts temporaires, des modifs des articles à répétition, etc.
- Dans un temps plus long, un robot détecte les liens définitivement morts avec plusieurs essais étalés dans le temps et si possible depuis plusieurs réseaux pour être sûr, ensuite il insère un modèle type lien mort qui pourrait proposer les mêmes archiveurs. L'intérêt est d'avertir les contributeurs que le lien est mort, de limiter les faux-positifs et les modifs des articles.
- –Akeron (d) 28 septembre 2017 à 14:04 (CEST)
- Pour le premier point, je n'y vois aucun inconvénient et je pousse également à une solution pour éviter la centralisation de ces contenus. Mon seul souci est que chez wikiwix nous n'archivons que ce qui est légalement archivable ( tout document ne contenant pas la balise noarchive soit dans la page soit dans le fichier robots.txt ), libre à la communauté d'indiquer ou pas, que le contenu qui est archivé représente une violation du droit d'auteur. Je peux fournir une API afin de permettre la détection des nouveaux liens contenus dans toutes les langues de Wikipedia.
- Je peux également fournir un serveur via Renater sur lequel sont hébergées les archives wikiwix afin d'aider à la détection des liens morts. Pmartin (discuter) 28 septembre 2017 à 22:15 (CEST)
Où en est-on ?
modifierHello,
J'ai du mal avec toutes les discussions techniques plus haut. Ce que j'ai vu dans les modifs d'InternetArchiveBot :
- il indique qu'il s'agit d'une archive et de sa date : ça, c'est une très bonne chose ;
- par contre, ce qui me gêne au plus haut point, il réintroduit un lien mort dans un nombre important de cas. C'est vraiment contre-productif puisqu'il n'est pas expliqué au lecteur qu'on lui présente un lien comme celui de la source et que le lecteur ne sait pas que celui-ci est mort avant de cliquer dessus et que c'est malgré tout présenté comme un progrès par rapport à la version précédente où le seul lien était intuitif et menait à la source souhaitée.
Si un lien mort est réintroduit pour information, il faudrait soit indiquer que ce lien est mort soit il faudrait désactiver le lien et ne garder que le lien d'archive permettant d'accéder à ce que l'on souhaite accéder sans que le lecteur ne se torde l'esprit. Est-ce possible de demander ça ?
S'il peut indiquer que c'est une archive et sa date sans réintroduire un lien, ça me va aussi, si c'est possible, demandons-lui ça.
Si ni l'un ni l'autre n'est pas possible, je pense qu'il ne faut pas le réactiver.
Pour la question 1bis et les questions qui en dépendent, pour savoir quoi répondre, qu'entraîne la wikification d'un lien mort ? est-ce indiqué que ce lien est mort ? peut-on avoir l'adresse du lien sans que le lien soit cliquable ?
GabrieL (discuter) 29 septembre 2017 à 13:11 (CEST)
Reviving this discussion
modifier@Pmartin I understand you are the maintainer of Wikiwix. I went over the discussion as best as possible with a translator, so I apologize if I got some of this wrong. I would like to clarify numerous aspects about IABot.
- Firstly, yes, this bot is being funded by Internet Archives, but I did make the terms very clear before signing the contract with them. IABot is NOT EXCLUSIVE to the Wayback Machine. While it only queries the Wayback Machine for new archives, since it is the largest and fastest service to query from, IABot does learn about the other archives being used and will use them in other places if needed. This means if someone is using an Archive IS link or a WebCite link, IABot will save it for future use. IABot recognizes 22 different archive services, including Wikiwix. InternetArchiveBot started out as a voluntary project. The sole reason for funding, is to have me dedicate time to it's development.
- For the French Wikipedia, IABot prioritizes Wikiwix archives over its own. Before ever adding an archive, it checks if it exists on Wikiwix. If it does, it moves on, and if it doesn't it will either tag the link as dead or add it's own archive.
- As for pinging websites, IABot does not appear as a robot. It's not crawling their site but rather pinging an individual URL found on Wikipedia, and only looks for an HTTP Response Code. It pings a site once a week if it's seen as alive, or every 3 days if it is dying, and makes a HEAD request to go easy on the server it's pinging. IABot does in most cases detect if it got blocked from accessing a site and will automatically whitelist the site. IABot does rarely get blocked though. This means the bot no longer pings that site, and will not erroneously assume it is dead.
- If you have any more questions to ask me, please do.—CYBERPOWER (discuter) 14 novembre 2017 à 16:55 (CET)
- Pour ne pas polluer la page de discussion de ce sondage, nous discutons sur https://fr.wiki.x.io/wiki/Discussion_utilisateur:Pmartin#I_left_you_a_message.21 --Pmartin (discuter) 23 novembre 2017 à 21:36 (CET)
Usage : « brisé le »
modifier« Hello Cyberpower678 :
Since 9 March 2018, InternetArchiveBot has done more than 50,000 contributions. But all the additions of the parameter brisé le=empty
into {{Lien web}} are useless. You can see it by comparing the display of the references 69 and 70 in this InternetArchiveBot's edit and in my edit. Technically, brisé le
is an alias of deadurl
but, in the French Wikipedia, the contributors expect brisé le=date
or deadurl=oui
, but neither brisé le=oui
nor brisé le=empty
.
I don't understand why your bot is adding brisé le=empty
, because you said that you would make the correction from brisé le=oui
to brisé le=date
, on 15 September 2017, in question E of Discussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot. Moreover, you have been warned about the problem of the missing date on 29 March 2018, in Discussion utilisateur:InternetArchiveBot#Missing date.
Why don't you stop the bot? And when do you plan to correct the bot? And do you plan to check the more than 50,000 contributions of the bot, to fill brisé le
?
Regards --NicoScribe (discuter) 12 mai 2018 à 11:02 (CEST) »
Depuis le 9 mars 2018, InternetArchiveBot a fait plus de 50 000 contributions. Mais tous les ajouts du paramètre
brisé le=vide
dans {{Lien web}} sont inutiles. Vous pouvez le voir en comparant l'affichage des références 69 et 70 dans cette modification d'InternetArchiveBot et dans ma modification. Techniquement,brisé le
est un alias dedeadurl
mais, dans Wikipédia en français, les contributeurs s'attendent àbrisé le=date
oudeadurl=oui
, mais nibrisé le=oui
nibrisé le=vide
.
Je ne comprends pourquoi votre bot ajoutebrisé le=vide
, parce que vous aviez dit que vous feriez la correction debrisé le=oui
versbrisé le=date
, le 15 septembre 2017, dans la question E de Discussion Projet:Bot#Premier jour de fonctionnement d'InternetArchiveBot. De plus, vous avez été prévenu du problème de date manquante le 29 mars 2018, dans Discussion utilisateur:InternetArchiveBot#Missing date.
Pourquoi n'arrêtez-vous pas le bot ? Et quand prévoyez-vous de le corriger ? Et prévoyez-vous de contrôler les plus de 50 000 contributions du bot, pour remplirbrisé le
?
Cordialement --NicoScribe (discuter) 12 mai 2018 à 11:02 (CEST) »
«
- @NicoScribe Sorry about that. I've been incredibly busy over the last months, not only with IABot 2.0, but also in real life, and I haven't had the opportunity to take a thorough look. I have classified this as a lower priority problem because the empty parameter isn't actually causing any damage to the article. If it's too much of an issue I can go ahead and shut the bot down. In the future update of IABot, IABot will recognize the empty parameters as non-existent and fill them as needed so the render will be correct to the readers.—CYBERPOWER (discuter) 12 mai 2018 à 15:28 (CEST) »
« [Ci-dessous : traduction du texte de Cyberpower678, par NicoScribe (discuter) 13 mai 2018 à 17:53 (CEST)
- @NicoScribe Désolé pour cela. J'ai été très occupé ces derniers mois, non seulement avec IABot 2.0, mais aussi dans la vraie vie, et je n'ai pas pu y regarder en détail. J'ai classé cela en problème de basse priorité parce que le paramètre vide n'endommage pas l'article. Si c'est un gros problème, je peux arrêter le bot. Dans la future mise à jour d'IABot, IABot va considérer que les paramètres vides sont non-existants et les remplir au besoin pour que l'affichage soit correct pour les lecteurs.—CYBERPOWER (discuter) 12 mai 2018 à 15:28 (CEST) »
« Cyberpower678 : yes, the problem is invisible for the readers, but fills the articles' histories and the contributors' watchlists. I am just the third contributor to signal it to you (after LeFnake and Jean-Frédéric on the bot's talk page). --NicoScribe (discuter) 13 mai 2018 à 17:53 (CEST) »
« Cyberpower678 : oui, le problème est invisible pour les lecteurs, mais remplit les historiques d'articles et les listes de suivi des contributeurs. Je suis juste le troisième contributeur à vous le signaler (après LeFnake etJean-Frédéric sur la page de discussion du bot). --NicoScribe (discuter) 13 mai 2018 à 17:53 (CEST) »
Bot Réactivé
modifier@NicoScribe https://fr.wiki.x.io/wiki/Wikip%C3%A9dia:Le_Bistro/12_avril_2019#Archive_IABOT nous avons cherché le consensus, et prouver notre bonne foi à vouloir travailler avec Cyberpower qui semble t'il à oublier son engagement IABot is NOT EXCLUSIVE to the Wayback Machine. While it only queries the Wayback Machine for new archives, since it is the largest and fastest service to query from, hormis en nous lançant dans une guerre d'édition nous sommes dans une impasse que je ne ferai pas pour ne pas violer un principe fondamental de la communauté. Pmartin (discuter) 12 avril 2019 à 17:55 (CEST)
- Pour info : j'ai répondu sur le bistro, à cette époque là. --NicoScribe (discuter) 5 août 2019 à 23:31 (CEST)
Peut t-on clôturer le sondage
modifier« [Below: translation of the text of Nemo Le Poisson, by NicoScribe (discuter) 5 août 2019 à 23:28 (CEST)]
Hello, NicoScribe, Pmartin and Archimëa:, is it possible to close the survey? -- Nemo Discuter 4 août 2019 à 12:55 (CEST) »
« Bonjour, NicoScribe, Pmartin et Archimëa :, le sondage peut-il être clôturé ? -- Nemo Discuter 4 août 2019 à 12:55 (CEST) »
«
- Hello Nemo Le Poisson :
- Yes, I think the survey can be closed because:
- Nouill has already categorized this survey as closed, surely because the text has not been changed for a long time;
- Archimëa, who has created this survey, thinks that this survey is "dead and buried [...] the community did not seem so interested in it";
- the survey was paused because 3 paid editors ( Pmartin, Cyberpower678 and GreenC) are doing large scale modifications on the Wikiwix / InternetArchiveBot coordination (see #Reviving this discussion + #Bot Réactivé). But they have been doing this since November 2017, so I think several survey questions are now obsolete. I hope that Pmartin, Cyberpower678 and GreenC will inform the community when their coordination is stabilized and will explain to the community the new state of the archiving system. After that, if necessary, a survey could be recreated to refine community expectations.
- Regards --NicoScribe (discuter) 5 août 2019 à 23:35 (CEST) »
«
- Bonjour Nemo Le Poisson :
- Oui, je pense que le sondage peut être clos parce que :
- Nouill a déjà catégorisé ce sondage comme clos, certainement parce que le texte n'est plus modifié depuis longtemps ;
- Archimëa, qui a créé ce sondage, pense que ce sondage est « mort et enterré [...] la communauté n'a pas semblé tant intéressée que ça » ;
- le sondage était en pause parce que 3 contributeurs rémunérés ( Pmartin, Cyberpower678 et GreenC) font des travaux de grande ampleur sur la coordination Wikiwix/InternetArchiveBot (cf. #Reviving this discussion + #Bot Réactivé). Mais ils y travaillent depuis novembre 2017, alors je pense que certaines questions du sondage sont maintenant obsolètes. J'espère que Pmartin, Cyberpower678 et GreenC informeront la communauté quand leur coordination sera stabilisée et lui expliqueront le nouvel état du système d'archivage. À ce moment là, si nécessaire, un sondage pourrait être recréé pour affiner les attentes de la communauté.
- Cordialement --NicoScribe (discuter) 5 août 2019 à 23:35 (CEST) »
« [Below: translation of the text of Nemo Le Poisson, by NicoScribe (discuter) 8 août 2019 à 00:23 (CEST)]
« [Below: translation of the text of Pmartin, by NicoScribe (discuter) 11 août 2019 à 23:25 (CEST)]
Nemo Le Poisson and NicoScribe one task is ongoing since the opening of this survey, so for 2 years, for Cyberpower. Currently, the system of Cyberpower and GreenC is participating in the monopoly of the WayBack Machine for Wikipedia's archives. This monopoly problem had to be solved before the production start of the archiving system as the project had committed itself to the Wikipedia community. I have followed up and asked for a progress report on this task but the progress rate has remained at 0% for more than two years. Pmartin (discuter) 10 août 2019 à 12:54 (CEST) »
« Nemo Le Poisson et NicoScribe une tâche est en cours depuis l'ouverture de ce sondage donc depuis 2 ans côté de Cyberpower. Actuellement, le système mis en place par Cyberpower et par GreenC participe au monopole des archives de Wikipedia envers la WayBack Machine. Ce problème de monopole devait être résolu avant la mise en production du système d'archivage comme le projet s'était engagé vis à vis de la communauté Wikipedia. J'ai relancé et demandé un état d'avancement au sujet de cette tâche mais le taux d'avancement reste à 0 % depuis plus deux ans. Pmartin (discuter) 10 août 2019 à 12:54 (CEST) »