Wikipédia:Bot/Requêtes/Archives/2023/06

Dernier commentaire : il y a 1 mois par Escargot bleu dans le sujet Corrections dans le paramètre site des sources
Archive.Ceci est une page de requêtes archivées. Vous pouvez consulter la page des requêtes non archivées du même mois.
État des requêtes
Requête en cours de traitement {{Requête en cours}}
Requête traitée {{Requête fait}}
Requête refusée {{Requête refus}}
Requête en attente d'informations complémentaires {{Requête info}}
Requête démarrée puis mise en instance {{Requête pause}}
Requête arrêtée suite à un problème {{Requête stop}}
Requête à archiver sans suite {{Requête sursis}}
Requête non prise en charge depuis un moment {{Requête perdue}}
Requête non prise en charge par un bot {{Requête caduque}}
Requête à archiver sans suite {{Requête sans suite}}
Mois 02 03 04 05 06 07 08 09 10
Archives 02 03 04 05 06 07 08 09 10


Enlever le mot magique « TOC »

modifier

Demande du 13 juin 2023, par : Nouill 14 juin 2023 à 00:02 (CEST)Répondre

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Bonjour, Il faudrait juste enlever les "TOC", parce qu'ils servent à rien car ils ne servent à rien pour l'interface par défaut (utiliser par une écrasante part des lecteurs, au pif je dirais 99 %). Sans compter que la majorité des "TOC" est placé à l'emplacement du sommaire par défaut, et donc ne servaient à rien même avant. Et sans compter que mettre à un autre endroit le sommaire, à rapport à l'emplacement par défaut et bien je ne vois pas l'utilité (à part peut-être des cas particuliers).

Suivi de la demande :
 En cours, RobokoBot (d · c) dressé par Thibaut120094 (d) travaille. (14 juin 2023 à 09:42 (CEST))Répondre
 Terminé, RobokoBot (d · c) dressé par Thibaut120094 (d) a terminé son travail. (14 juin 2023 à 10:21 (CEST))Répondre


Requête traitée Ajout portail:Xbox sur des articles

modifier

Demande du 17 juin 2023, par : Goombiis (Discuter) 18 juin 2023 à 00:46 (CEST)Répondre

Nature de la demande et discussion éventuelle :
Bonjour, je viens de créer un portail consacré à Xbox (la marque). Je voulais avoir s'il serait possible de faire passser un bot sur les articles de certaines catégories pour ajouter ce portail (s'il n'y est pas déjà) ? Il s'agirait des catégories (et sous catégories) suivantes :

Merci d'avance.

Bonjour Goombiis  
Je pense que Modèle:Portail Xbox devrait inclure modèle:Portail jeu vidéo (plutôt Catégorie:Portail:Jeu vidéo/Articles liés dans le modèle), et qu'il faudrait retirer le doublon en apposant ledit nouveau portail. Qu'en dis-tu ? — LD (d) 27 juin 2023 à 04:44 (CEST)Répondre
Hello @LD ! Je ne sais pas trop. Lors de la création du Portail:Ubisoft on avait plutôt opté (côté projet JV) de doubler les portails (avoir celui JV + Ubisoft). Mais effectivement cela peut se discuter. Goombiis (Discuter) 28 juin 2023 à 01:21 (CEST)Répondre
@Goombiis merci de ta réponse.
D'usage, c'est ce qui est fait pour ne pas avoir à passer deux fois ; du moins, je l'ai fait pour mes dernières appositions : Portail:Cinéma indien (en retirant Cinéma, Inde et d'autres), ou Portail:Musique classique en retirant Musique et cie., etc.
En théorie, rien n'empêche d'ajouter le portail et faire une autre demande plus tard si besoin est, mais je me dis que si rien ne presse, autant poser la question au projet en voyant quel principe de Wikipédia:Liens vers les portails s'applique puis traiter la demande.
Dans tous les cas, la demande ne pose aucun problème technique, c'est faisable  . LD (d) 28 juin 2023 à 02:00 (CEST)Répondre
Merci @LD. Je lance la discussion sur le projet JV on va voir ce que ça donne car le projet n'est pas super actif. Goombiis •~d~• 2 juillet 2023 à 00:37 (CEST)Répondre
@LD Comme prévu, très peu de mouvement sur le projet JV. Il y a seulement une réponse qui part sur ce que je proposais : maintenir en parallèle le portail xbox et JV (quand applicable). Qu'en penses-tu ? Goombiis •~d~• 10 juillet 2023 à 23:24 (CEST)Répondre
Pas de problème pour moi @Goombiis.   LD (d) 10 juillet 2023 à 23:36 (CEST)Répondre

Suivi de la demande :
 En cours, LD AWBot (d · c) dressé par LD (d) travaille. (10 juillet 2023 à 23:36 (CEST))Répondre
 Terminé, LD AWBot (d · c) dressé par LD (d) a terminé son travail. (11 juillet 2023 à 00:46 (CEST))Répondre


Requête traitée Diffusion des objets du New General Catalogue

modifier

Demande du 7 juin 2023, par : Berdea (discuter) 7 juin 2023 à 16:33 (CEST)Répondre

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Je souhaite diffuser les éléments de la Catégorie:Objet du New General Catalogue dans les différentes sous-catégories. Par exemple ranger NGC 161 dans la sous-catégorie Catégorie:NGC 1 à 499. Pour se faire on substitue [[Catégorie:Objet du New General Catalogue|0161]] par [[Catégorie:NGC 1 à 499|0161]]. Je ne sais si c'est faisable "facilement" par un bot ?

Bonjour Berdea  
Je prends mais la réaliserais en plusieurs temps. LD (d) 10 juillet 2023 à 23:54 (CEST)]]Répondre
Merci. Il n'y a pas d'urgence. — Berdea (discuter) 11 juillet 2023 à 00:09 (CEST
Il y a une petite erreur pour la dernière catégorie. Tu as utilisé Catégorie:NGC 7500 à 7999 au lieu de Catégorie:NGC 7500 à 7840. NGC 7840 est en effet le dernier objet du catalogue. — Berdea (discuter) 11 juillet 2023 à 17:14 (CEST)Répondre
@Berdea Pas mâlin, en effet. Je vais corriger. LD (d) 11 juillet 2023 à 17:21 (CEST)Répondre
  LD : Merci pour le travail. Grâce au catalogage plus précis, on s'aperçoit maintenant facilement qu'il manque pas mal d'articles sur des objets dans les 3 dernières catégories du classement. — Berdea (discuter) 12 juillet 2023 à 14:28 (CEST)Répondre

Suivi de la demande :
 En cours, LD AWBot (d · c) dressé par LD (d) travaille. (10 juillet 2023 à 23:54 (CEST))Répondre
 Terminé, LD AWBot (d · c) dressé par LD (d) a terminé son travail. (11 juillet 2023 à 17:12 (CEST))Répondre


Requête traitée Articles sans images

modifier

Demande du 14 juin 2023, par : Triton (discuter) 14 juin 2023 à 19:23 (CEST)Répondre

Nature de la demande et discussion éventuelle :
Bonjour, serait il possible de créer/inscrire la mise de la page Projet:Créatures légendaires/Articles à illustrer. L'idée étant de suivre régulièrement les articles n'ayant aucune illustration, même hors infobox, pour aller les chercher. A priori cela correspondrait à la requête https://petscan.wmflabs.org/?psid=25141831 si j'ai bien compris. Merci par avance!

Bonjour Triton  , si Modèle:Requête petscan est toujours pris en charge par User:Framabot, la liste sera générée automatiquement. A voir sous 24 heures donc. LD (d) 10 juillet 2023 à 23:47 (CEST)Répondre
Merci @LD, je ne connaissais pas (plus?) ce modèle. Par contre bizarrement il sort une liste beaucoup plus longue que la requête Petscan...étrange. Triton (discuter) 11 juillet 2023 à 09:54 (CEST)Répondre
En plus, il y a 4 articles :
Peut-être que Framawiki sait pourquoi. LD (d) 11 juillet 2023 à 10:01 (CEST)Répondre
Ah j'avais l'impression que c'était encore plus mais j'ai peut être focalisé sur ceux là. Merci en tout cas!! Triton (discuter) 11 juillet 2023 à 17:18 (CEST)Répondre
Bonsoir LD et Triton  , n'est-ce pas juste que pour ces 4 pages ont été modifiés aujourd'hui, depuis le passage du bot? image ajoutée [1] ou portail retiré [2], qui fait que ces pages étaient listées par petscan la nuit dernière comme n'ayant pas d'image?
Je n'ai pas accès au script pour déclencher manuellement une mise à jour, on verra demain après l'actualisation si le nombre est identique entre wp et petscan.
(il est très bête mon bot, il se contente de faire un copier-coller de petscan  ) Cordialement, -Framawiki 11 juillet 2023 à 18:35 (CEST)Répondre
@LD et @Framawiki Oui peut être simplement, et j'ai du avoir des hallucinations en en imaginant qu'il y avait plus de différences. Bref, dans tous les cas ce n'est pas très grave, merci à tous les deux (je dirais bien "on peut cloturer" mais c'est déjà fait  ).
PS: bizarre que Zuzidun Txakurra ait été considéré sans image par Petscan alors qu'il y en avait plusieurs, mais plus quand l'image a été passée en première ligne Triton (discuter) 11 juillet 2023 à 18:50 (CEST)Répondre

Suivi de la demande :
 Terminé, Framabot (d · c) dressé par Framawiki (d) a terminé son travail. (11 juillet 2023 à 17:19 (CEST))Répondre


Requête à archiver sans suite Demande de renommage d'articles

modifier

Demande du 14 juin 2023, par : Luna Lyons (discuter) 14 juin 2023 à 11:49 (CEST)Répondre

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Bonjour, l'objet de ma requête est de résoudre quelques incohérences concernant le nommage d'articles liés aux routes, il s'agit plutôt de DEUX demandes :

Concernant ma première requête : sans que je n'ai pu trouver d'explications réelles à cette situation, les articles concernant les autoroutes allemandes sont titrés en allemand (exemple : Bundesautobahn 1), au lieu du français ("Autoroute A1 (Allemagne)") comme c'est le cas pour tous les autres pays et régions non-francophones (pour reprendre mes exemples issus de la discussion : France, Pays-Bas, Belgique (dans la partie non-francophone), Italie, Pologne, Irlande). La seule discussion que j'ai pu avoir avec quelqu'un sur le sujet (voir mon premier lien) n'a pas été très concluante et tend à confirmer qu'il s'agit d'une anomalie à corriger.

Concernant la seconde : une simple requête par soucis de cohérence, je pense qu'il faudrait également renommer les articles des autoroutes britanniques (exemple : Autoroute britannique M20 vers "Autoroute M20 (Grande Bretagne)" (et non "Royaume-Uni", puisque l'Irlande du Nord a son propre système).

Bonjour Luna Lyons  
Pour accéder à une telle demande, il faudrait fournir la liste des pages à renommer tout en indiquant la cible de renommage. Exemple :
Bundesautobahn 1 → Autoroute A1 (Allemagne)
LD (d) 11 juillet 2023 à 15:02 (CEST)Répondre
Bonjour @LD,
C'est-à-dire ? Il y a déjà une liste des autoroutes de l'Allemagne, la palette liée et la catégorie liée. Que puis-je faire de plus ? Désolée d'avoir oublié ces liens au moment d'écrire ma demande s'ils sont suffisants, ça ne m'a pas semblé évident sur le coup :') Luna Lyons (discuter) 11 juillet 2023 à 17:26 (CEST)Répondre
Je comprends mieux. Disons que pour qu'un robot soit efficace, il faut lui donner le chemin pour sortir du labyrinthe ou alors des règles pré-établies (une logique) pour rechercher la sortie.
  • Si « Bundesautobahn <chiffre> » est toujours « Autouroute <chiffre> (Allemagne) », alors ce cas peut être traîté puisque cela devient une règle.
  • Si « Autoroute britannique M<chiffre> » est toujours « Autouroute <chiffre> (Royaume-Uni) », alors ce cas peut également être traîté.
Est-ce bien cette logique donc ? LD (d) 11 juillet 2023 à 17:32 (CEST)Répondre
J'ai oublié la notification : @Luna Lyons. LD (d) 11 juillet 2023 à 17:33 (CEST)Répondre
Oui c'est exactement cette logique (au détail près que les nom finaux doivent être "Autoroute A<chiffre> (Allemagne)" et "Autoroute M<chiffre> (Grande Bretagne)" pour qu'ils soient correct). Luna Lyons (discuter) 11 juillet 2023 à 17:52 (CEST)Répondre
Bonjour Luna Lyons. Je reviens sur cette requête qui a été oubliée.
Ce que veut dire LD, c'est que ce n'est pas au dresseurs de bots de faire les listes de choses à modifier, tu dois faire ces listes, et alors on peut programmer un bot pour accomplir la demande. À chacun sa part du travail. Cordialement, Şÿℵדαχ₮ɘɼɾ๏ʁ 28 octobre 2023 à 10:17 (CEST)Répondre
En l'absence de réponse de l'auteur après plusieurs mois, je classe la requête sans suite. La requête n'indique pas clairement les modifications attendues, et il manque un consensus sur la nécessité de ce changement. Escargot (discuter) 20 novembre 2023 à 12:43 (CET)Répondre

Suivi de la demande :


✔️ Corrections dans le paramètre site des sources

modifier

Demande du 21 juin 2023, par : Wyslijp16 (discuter) 21 juin 2023 à 19:34 (CEST)Répondre

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Au niveau des sources, dans le paramètre site, il y a des « http:// » ou des « https:// », ce qui en fait des liens externes. Pourtant ce paramètre ne devrait pas contenir de liens externes (contrairement au paramètre url). Il faudrait donc retirer les http/https afin que les liens externes deviennent du simple texte ou des liens internes.

Simplifié par @Irønie que je remercie énormément : « Un bot pourrait bêtement retirer le "https" et les trucs après "/". Exemple "https://fu.bar.com/machin" -> "fu.bar.com" ».

En effectuant une simple recherche (insource:/site=http:/) je trouve déjà 11 462 résultats. Et une autre recherche (insource:/site=https:/) en affiche 9 758. Donc plus de 21000 articles avec cette erreur !

Une très grosse proportion de ces liens correspond à des objets célestes et est insérée sous la forme site=le [https://ssd.jpl.nasa.gov site du Jet Propulsion Laboratory] [3]. Escargot (discuter) 23 octobre 2023 à 23:18 (CEST)Répondre
Bonjour @Wyslijp16
Je viens de lancer mon bot. Je profite de ce passage pour ajouter des brisé le sur les liens web en erreur 404 et des points en fin de référence. Pour l'instant, je traite uniquement les http / https qui ne sont pas placés entre crochets. Escargot (discuter) 24 octobre 2023 à 18:09 (CEST)Répondre
Au passage, je me demande si pour les liens vers Google Maps il ne faudrait pas laisser google.com/maps plutôt que juste google.com Escargot (discuter) 24 octobre 2023 à 18:10 (CEST)Répondre
Auriez-vous un exemple précis de liens ? Si google.com fait une redirection vers google.com/maps, ce serait en effet très bénéfique (même si je ne pense pas qu'il y ait beaucoup de liens vers Google Maps dans les sources) ! Wyslijp16 (discuter) 24 octobre 2023 à 18:16 (CEST)Répondre
Bonjour Escargot bleu  , merci beaucoup et à votre bot de vous occuper de ma requête !  
J’espère que cela pourra améliorer les sources de tous les articles, malgré la complexité du problème. Wyslijp16 (discuter) 24 octobre 2023 à 18:14 (CEST)Répondre
En regardant un peu la liste du lien (et la multitude de site=le [https://ssd.jpl.nasa.gov site du Jet Propulsion Laboratory]), je me dis qu'on pourrait simplement le remplacer par site=[[Jet Propulsion Laboratory]] non ? Wyslijp16 (discuter) 24 octobre 2023 à 18:19 (CEST)Répondre
Tous ces articles ont été créé automatiquement par @Roland45. Je ne sais pas si il y a une raison à ce choix de mise en forme. Escargot (discuter) 24 octobre 2023 à 21:27 (CEST)Répondre
Bonjour, Je signale un problème : sur l'article https://fr.wiki.x.io/w/index.php?title=Isotta_Fraschini_Tipo_6_LMH-C&diff=prev&oldid=209261776, le robot a mis en rouge une mulititude de liens vers fr.motorsport.com, alors que les liens ne sont pas brisés. Chrisalmon (discuter) 2 novembre 2023 à 11:03 (CET)Répondre
Le site renvoie des codes 404 sur des liens qui sont effectivement fonctionnels. J'ai coupé le bot pour le moment, je regarderai plus tard. Escargot (discuter) 2 novembre 2023 à 12:17 (CET)Répondre
Je viens de relancer le bot.
Parmi les (rares) sites qui renvoient un code erreur erroné quand on leur demande les entêtes (requests.head en Python), la plupart renvoient le bon code en demandant le code de la page (requests.get). Dans mon nouveau code, je commence par demander les entêtes, puis fait un get en cas de code 301 ou 404. Le problème à demander tout le code html est que la requête est plus lourde, ce qui ralentit le bot et charge les serveurs de Wikimedia Cloud Service sur les pages avec beaucoup de liens brisés (quand la charge devient trop importante, le bot se fait kill automatiquement). Escargot (discuter) 19 novembre 2023 à 14:33 (CET)Répondre
  Escargot bleu : Y'a de vieux serveurs web qui n'acceptent pas les requêtes HEAD et renvoient donc une erreur. Donc le résultat négatif d'un HEAD n'est probablement pas suffisant pour qualifier un lien comme mort. :'( - Irønie (d) 19 novembre 2023 à 15:37 (CET)Répondre
Si tu crawl en masse divers sites pour vérifier les liens morts, fais gaffe aux bans d'IP ; Youtube, Google Search… Si t'utilises IP Wikimedia Cloud ça impacterait d'autres tools. (CodexBot se cache derrière Tor) Irønie (d) 19 novembre 2023 à 15:46 (CET)Répondre
En fait, le script tourne actuellement sur mon ordinateur, en faisant uniquement des get parce que je n'arrive pas à mettre un timeout sur les liens comme [4] trop lourds à charger (et qui se font kill sur WCS). Le paramètre timeout du module requests ne change rien et les solutions avec le module signal [5] arrêtent totalement le bot (mais peut-être que je fais mal quelque chose). Escargot (discuter) 19 novembre 2023 à 16:32 (CET)Répondre
Je ne maitrise pas Python, mais d'après la doc request:timeouts, .get() a 2 timeouts (connection+read) et pour read c'est le temps max avant de recevoir le premier byte. Avec le commentaire "(Specifically, it’s the number of seconds that the client will wait between bytes sent from the server. In 99.9% of cases, this is the time before the server sends the first byte)". A savoir qu'un gros fichier est envoyé en plein de paquets, ce que je crois comprendre c'est que ce time-out ne coupe pas la request HTTP, si elle fonctionne mais que le download de la page/fichier dure 10 minutes...
J'imagine qu'il faut trouver un module plus sophistiqué ou bien une manière d'intégrer le get() dans une fonction chronométrée (Signal pour Unix).
Bon courage. Have fun ! :) - Irønie (d) 19 novembre 2023 à 17:58 (CET)Répondre
J'ai réussi à le faire avec signal.
@Irønie en faisant des get à chaque fois, mon antivirus s'est réveillé à plusieurs reprises. Je suppose que je ne risque pas grand chose puisque les scripts ne sont pas exécutés, mais est-ce que tu appliques un traitement particulier avec CodexBot pour gérer les liens compromis ? Escargot (discuter) 28 novembre 2023 à 10:52 (CET)Répondre
@Escargot bleu Hou ! Non, je ne check pas les virus. J'y avais même jamais pensé ! Faudrait trouver une API antivirus GRATUITE !... Côté Google Web risk API, services ? A moins d'un service gratuit/rapide, j'ai peu d'espoir.
Par contre, j'étudie la gestion des nom de domaine usurpés (cybersquatting): une liste de domaines avec le bot qui passera les liens en {lien brisé}. Inspiré par ce qui se fait sur enwiki. Et création d'une page WP qui permettra de signaler de nouveaux domaines usurpés. -> Si cette tâche t'intéresse, voir en:WP:USURPURL, en:WP:Link rot/Usurpations et le bot en:WP:WAYBACKMEDIC.
- (dispo sur Discord pour talk tech) Irønie (d) 28 novembre 2023 à 11:29 (CET)Répondre
Après recherche rapide, je trouve en solution : 1) (lourd) installation d'un antivirus et traitement du contenu HTML des pages. Par exemple Clam sur linux. 2) facile ? l'API Google URL blocklisting (équivalent gratuit à Google Web Risk $$), avec envoi de batch de 500 url. Google API Safe browsing. Faudrait voir sur enwiki s'ils font du traitement automatique (au-delà de la spamlist). -- Irønie (d) 28 novembre 2023 à 12:24 (CET)Répondre

  Escargot mécanique et Escargot bleu : Bonjour ! Dans ce diff, le bot n'enlève pas seulement les "http(s)" mais aussi les "www.", ce n'est pas souhaitable. Peut-on revenir dessus ? Cordialement. Artvill (discuter) 3 décembre 2023 à 22:15 (CET)Répondre

@Artvill Les trois w ne font pas partie du nom du site, pourquoi vouloir les conserver ? On peut aussi bien accéder à un site sans qu'avec, ils rendent seulement le nom de domaine moins lisible. Escargot (discuter) 3 décembre 2023 à 22:32 (CET)Répondre
  Escargot bleuEh bien, tous les sites n'en ont pas, comme https://fr.wiki.x.io/ donc si les rédacteurs ont choisi de les conserver, ce n'est pas à supprimer. Cordialement. Artvill (discuter) 3 décembre 2023 à 22:39 (CET)Répondre
C'est différent dans le cas des sous-domaines. Quand sous-domaine il y a, je n'y touche pas. Mais pour le domaine principal, https://www.wiki.x.io/ et https://wiki.x.io/ renvoient à la même chose. Le nom déposé pour un domaine est toujours le nom sans www. www est juste le sous-domaine par défaut, j'ai vraiment du mal à voir ce que ça apporte.
L'argument du choix des utilisateurs n'est pas forcément pertinent. En l'occurrence, un certain nombre de personnes ont également choisi de mettre des http/https, ce qui ne justifie pas de les laisser. Escargot (discuter) 3 décembre 2023 à 22:48 (CET)Répondre
En l'occurrence, le problème généré par les http(s) est la création d'un lien externe non souhaité. D'où cette requête. A priori, personne n'a demandé aussi de retirer les www. qui ne posent pas de problème. Donc je ne comprends pas comment et pourquoi ils ont été intégrés à la requête. Artvill (discuter) 4 décembre 2023 à 00:26 (CET)Répondre
@Artvill. Même avis que @Escargot bleu :
  • le paramètre site est seulement destiné à l'information du lecteur. Donc le www est totalement inutiles ici, car il n'apporte aucune information supplémentaire à l'humain quant à l'identification sur site web (à l'identique de http). Souvent, la valeur de site est même remplacée par le nom du site, du genre « Facebook » sans détail du domaine Internet.
  • Les "www" sont conservés dans le paramètre url qui génère l'hyperlien cliquable, donc la navigation est correcte.
- Irønie (d) 4 décembre 2023 à 16:33 (CET)Répondre
Bonjour Artvill   !
Merci beaucoup pour votre remarque ainsi que vos observations des modifications !  
En effet, le www n'était pas dans la demande mais je suis d'accord avec l'avis d'@Irønie ; c'est le nom du site (et si possible son article) qui est demandé, pas son nom de domaine. C'est une information pour les lecteurs et non une information technique.
En tout cas, si quelqu'un pourrait le faire, je propose de remplacer le nom de domaine/le nom du site dans le paramètre site= par l'article au sujet du site (lorsqu'il existe). Wyslijp16 (discuter) 6 décembre 2023 à 14:31 (CET)Répondre

Suivi de la demande :
 En cours, Escargot mécanique (d · c) dressé par Escargot bleu (d) travaille. (24 octobre 2023 à 18:09 (CEST))Répondre
 Terminé, Escargot mécanique (d · c) dressé par Escargot bleu (d) a terminé son travail. (6 septembre 2024 à 12:49 (CEST))Répondre