Discussion utilisateur:OrlodrimBot/Suivi catégorie

Dernier commentaire : il y a 2 ans par Frenouille dans le sujet Renommages

nbMax

modifier

@  Orlodrim :, si le champ "nbMax" n'est pas renseigné, le nombre d'articles affichés est-il indéfini ou alors limité à un nombre par défaut ? Merci pour la précision, Orphée [||] 27 août 2015 à 10:33 (CEST)Répondre

  Orphée :
Le paramètre nbMax vaut 10 par défaut. Sa valeur maximale est 5000. Cependant, il n'a pas d'effet lorsque "type=liste alphabétique" : dans ce cas, la liste complète est toujours affichée (sauf s'il y a plus de 5000 pages).
Orlodrim (discuter) 27 août 2015 à 22:08 (CEST)Répondre
  Orlodrim : Merci beaucoup pour cette précision. Bonne soirée, Orphée [||] 27 août 2015 à 22:12 (CEST)Répondre

union

modifier

Bonjour Orlodrim, y a-t-il une limite au nombre de catégories qu'on peut unir ? Merci d'avance pour ta réponse. Gentil Hibou mon arbre 4 octobre 2015 à 19:26 (CEST)Répondre

  Gentil Hibou : Bonjour. Actuellement, la limite est de 100 catégories distinctes dans une même page. Orlodrim (discuter) 4 octobre 2015 à 19:32 (CEST)Répondre
Merci bien ! Gentil Hibou mon arbre 4 octobre 2015 à 20:13 (CEST) Edit : ça marche super bien, merci ! Gentil Hibou mon arbre 4 octobre 2015 à 20:58 (CEST)Répondre

Paramètres

modifier

Je ne vois pas de description des paramètres "description1" et "lier pdd". Cela serait bien également de mettre la syntaxe complète avec tous les paramètres existants. — Berdea (discuter) 10 avril 2018 à 13:25 (CEST)Répondre

Le contenu description1 est documenté (voir descriptionN). Le paramètre "lier pdd" est obsolète et devrait être remplacé par article() ou discussion() dans l'expression qui décrit la combinaison de catégories à suivre. Orlodrim (discuter) 11 avril 2018 à 07:23 (CEST)Répondre

Ajout/retrait

modifier

Bonjour Orlodrim  . J'ai l'impression que si une catégorie est enlevée puis ajoutée à nouveau, l'article apparait encore dans "type=retrait", mais pas dans "type=ajout". --Lewisiscrazy (discuter) 8 septembre 2019 à 11:35 (CEST)Répondre

  Lewisiscrazy :
Bonjour,
En regardant rapidement, j'ai trouvé un problème sur Projet:Les sans pagEs/Annonces automatiques parce qu'une catégorie avait été renommée (Spécial:Diff/162481566). Du coup, tous les articles étaient considérés comme des "anciens" articles de la catégorie supprimée. C'est ce cas-là ou autre chose ?
Orlodrim (discuter) 8 septembre 2019 à 11:50 (CEST)Répondre
Ah oui c'est cela (j'aurais dû être plus précis). Merci. --Lewisiscrazy (discuter) 8 septembre 2019 à 12:01 (CEST)Répondre

Sous-catégories ?

modifier

Bonjour Orlodrim   ! Il me semblait que ce modèle était pour suivre les articles d’une catégorie, or les sous-catégories apparaissent aussi (mais pas les articles qui sont dans les sous-catégories, comme attendu). Cf. Utilisateur:TED/Suivi AIM où apparaissent les sous-catégories de Catégorie:Auteur incomplet ou manquant. Serait-il possible que le modèle ne prenne pas en compte les catégories ? ou d’ajouter un paramètre pour avoir le choix ? TED 4 février 2020 à 02:55 (CET)Répondre

  TED : Croise la catégorie avec ns0 (Utilisateur:OrlodrimBot/Suivi catégorie#Opérateurs). Orlodrim (discuter) 4 février 2020 à 08:37 (CET)Répondre
Merci Orlodrim   ! Je n’avais pas compris le sens de ce paragraphe. TED 4 février 2020 à 13:30 (CET)Répondre

Texte si vide en dehors des balises includeonly

modifier

Bonjour Orlodrim   : est-ce normal qu’Orlodrimbot mette le « texte si vide » en dehors des balises includeonly (avec le paramètre transclusion) ? Cf. ici par exemple. TED 10 février 2020 à 23:53 (CET)Répondre

  TED : Tu as raison, ce serait mieux que ce soit dedans. J'ai corrigé. Le bot devrait repasser dans la nuit dans les pages concernées. Orlodrim (discuter) 11 février 2020 à 19:33 (CET)Répondre
Merci Orlodrim   ! TED 11 février 2020 à 19:35 (CET)Répondre

Suivi catégorie ou Articles récents

modifier

Bonjour Orlodrim et Framawiki.
Pour lister les articles récents d'un portail existent plusieurs solutions. Les plus courantes en fonctionnement sont Utilisateur:OrlodrimBot/Suivi catégorie et {{Articles récents}}.
Pour les cas simples où le portail n'a pas besoin d'une spécificité offerte par l'une ou l'autre des solutions, laquelle faudrait-il privilégier ? Pour des questions de fiabilité, économie de ressources, etc ? Quelles sont les différences essentielles entre les deux ? Merci d'avance. --Ideawipik (discuter) 21 février 2020 à 21:19 (CET)Répondre

  Ideawipik :

Comparaison des modèles de suivi
Modèle {{Articles récents}} {{Utilisateur:OrlodrimBot/Suivi catégorie}}
Fonctionnalités
  • Suivi d'une seule catégorie
  • Paramètre "recurse" pour descendre dans les sous-catégories.
  • Pour éviter l'affichage de vieux articles ajoutés à un portail, option de masquer les articles créés depuis plus de X heures.
  • Suivi de combinaisons de catégories
  • Pour éviter l'affichage de vieux articles ajoutés à un portail, option de trier les articles par date de création.
  • Permet de créer des sous-sections par jour/mois/année
Fiabilité
  • Tourne sur Wikimedia Cloud Services (semble fiable aujourd'hui)
  • Il y a eu une panne longue récemment (du 4 janvier au 8 février)
  • Géré par Toto Azéro (d · c) (en long wikibreak) et Framawiki (d · c) (en wikislow selon sa page)
  • Tourne sur un serveur OVH (fiable aussi)
  • Le code est assez stable (dernier bug majeur connu le 28 janvier entre 10:43 et 12:20, et sinon rien depuis de nombreux mois à part les problèmes d'indisponibilité des serveurs de Wikipédia).
  • Les erreurs peuvent être difficiles à corriger vu que c'est stateful.
  • Géré par Orlodrim (d · c) (pas de wikislow en perspective, mais je suis une seule personne et je n'ai pas d'accès au serveur quand je pars en vacances).
Code source
  • En python, GPLv3, assez simple (573 lignes). Probablement reprenable par quelqu'un d'autre.
  • En C++, pas encore publié (j'y travaille, mais pas avant quelques mois), assez complexe (6600 lignes + système de réplication des catégories + client MediaWiki perso). Difficile à reprendre par quelqu'un d'autre.
Performance
  • Je ne suis pas au courant de problèmes de performance.
  • Pas de problème actuellement (mise à jour incrémentale, la présence du modèle ne coûte quasiment rien tant que la liste ne change pas)
Pour une page en particulier, si les deux modèles conviennent, peu importe, mais comme je l'ai dit dans Wikipédia:Le Bistro/23 janvier 2020#Bot toujours en panne, je préfèrerais que {{Articles récents}} ne soit pas systématiquement remplacé par {{Utilisateur:OrlodrimBot/Suivi catégorie}}. Orlodrim (discuter) 22 février 2020 à 11:05 (CET)Répondre
Bonjour, rien de particulier à redire, tableau très complet.
A titre personnel, je trouve dommage d'éditer en continu des centaines de pages: ces informations pourraient idéalement figurer sur un site externe avec une interface plus accessible que les tableaux actuels, le tout sans remplir les dumps des certainement gigas de données que représentent ces deux bots. Un travail de longue haleine...
Commentaire concernant la panne d'un mois qui a eu sur ZéroBot il y a quelques semaines: personne ne m'a prévenu, et je ne regarde pas tous les matins les contributions des robots :) N'hésitez pas à me notifier si vous voyez des problèmes avec ce compte. --Framawiki 22 février 2020 à 15:07 (CET)Répondre
Merci à tous les deux pour ces réponses complètes et ce tableau bien explicatif. Bien entendu, il n'était pas question, pour ma part, de remplacer l'un par l'autre mais plutôt d'équilibrer les tâches des deux bots, en réponse à quelques requêtes en attente, tout en favorisant la méthode la moins gourmande en ressources si l'une s'était détachée par rapport à l'autre.
Je souscris aussi à la remarque sur le nombre d'éditions (dumps, numéro d'oldid,...). Bien souvent, visualiser une « Spécial:Suivi des liens » en se limitant aux créations suffirait à répondre aux attentes des utilisateurs de ces pages de listes pour du suivi en temps presque réel. Pour les retraits de catégorie, cas moins fréquents, l'urgence de contrôle est peut-être moindre.
  1. Dans tous les cas, peut-être serait-il sage de réduire un peu les fréquences d'édition des bots. La différence se verrait uniquement pour les catégories évoluant vite.
  2. Il y a aussi certainement des pages inutilisées. Exemple:Utilisateur:SyntaxTerror/Retraits du modèle Lien à corriger (Pour info   SyntaxTerror   désactivé Şÿℵדαχ₮ɘɼɾ๏ʁ 23 février 2020 à 18:33 (CET)) avec, en quatre ans, plus de 5800 éditions par bot pour à peine 175 vues, surtout concentrées sur les premiers mois. On peut d'ailleurs se questionner sur la pertinence d'un suivi de pages corrigées... Un tri/ménage s'impose certainement pour des pages de ce type.Répondre
  3. Autre question : un projet comme jeu-vidéo possède une ribambelle de sous-pages de suivi de catégorie sur lesquelles un bot est en fonctionnement. Dans l'absolu, serait-il mieux de regrouper les pages pour limiter le nombre d'éditions ou de conserver des pages nombreuses mais plus petites. Autrement dit le système de dumps et de modifications dans Wikipédia fonctionne-t-il avec sur un principe de différences ou sur un stockage de chaque version d'une page.
Une solution externe serait idéale.   Framawiki, tu penses à quelque chose en particulier : un site comme le très bon site de statistiques wstats.fr, suivez mon regard  , un autre wiki dédié uniquement à ces "journaux" non-encyclopédiques, un outil à développer sur tools.wmflabs.org ?
Techniquement comment est-il possible d'insérer du contenu depuis une page externe ? ou du contenu dynamique comme les listes de suivi ou des résultats de requête...
--Ideawipik (discuter) 23 février 2020 à 00:08 (CET)Répondre
Idéalement, ça devrait être intégré à MediaWiki. J'avais fait une proposition lors de l'enquête sur les souhaits de la communauté (meta:Community Wishlist Survey 2015/Categories#UI to display category members by timestampphab:T120448) qui s'est classée 85 / 107, donc c'est pas tout à fait une priorité pour la WMF pour le moment.
J'ai peu d'espoir que ça puisse migrer sur un site externe. J'ai l'impression que les wikipédiens n'aiment pas trop sortir de Wikipédia. J'avais commencé à publier des listes de liens rouges sur wstat (comme ça). Au final on m'a demandé de les publier dans les sous-pages des projets, et maintenant c'est beaucoup plus utilisé via {{Utilisateur:OrlodrimBot/Articles manquants}}. Avec les pages d'articles récents, les mettre ailleurs empêcherait de les avoir en liste de suivi, ce qui est difficile à régler (même si c'était techniquement faisable d'afficher le contenu d'un autre site directement sur Wikipédia, ce ne serait sans doute pas envisageable pour des raisons de confidentialité, à moins de passer par un gadget à activer manuellement).
Pour la manière dont les révisions sont stockées : mw:Manual:Reduce size of the database. À mon avis, ce n'est pas la peine de trop se prendre la tête avec l'optimisation du stockage (il me semble que dans le budget de la WMF, salaire des employés >> coût des serveurs pour la lecture >> coût de stockage du contenu). Le dump compressé de Wikipédia en français avec les historiques tient sur 200 Go, soit une fraction d'un seul disque dur moderne. Même si la base de données est répliquée et pas autant compressée, le coût de stockage de toutes les modifications faites par mon bot doit être faible.
Orlodrim (discuter) 23 février 2020 à 01:57 (CET)Répondre
J'insiste sur la phrase "la présence du modèle ne coûte quasiment rien tant que la liste ne change pas" et j'ai détaillé sur Utilisateur:OrlodrimBot/Suivi catégorie/Algorithme. Le bot ne "passe" pas réellement sur chaque page toutes les 5 minutes. Ça ne servirait à rien de réduire la rapidité de mise à jour pour les pages peu fréquemment mises à jour (et à l'inverse, pour les pages très souvent mises à jour, le délai passe de 5 minutes à une heure, dans l'unique but de limiter le nombre d'éditions).
Par ailleurs, j'ai choisi cette méthode parce que mon bot tourne sur un serveur externe, mais consommer du stockage local pour faire moins de requêtes aurait moins de sens pour ZéroBot. Il est possible que ZéroBot soit plus économique globalement, même s'il coûte plus cher à Wikimedia du simple fait qu'il est hébergé là-bas (ce qui est justifié par son utilité !).
Orlodrim (discuter) 23 février 2020 à 19:08 (CET)Répondre

Paramètre id

modifier

Bonjour Orlodrim  

Pourrais-tu préciser quelles valeurs peut prendre le paramètre id ? Notamment, si je veux faire apparaître le nom de la catégorie ou toute autre variable dans le résumé de diff, que dois-je indiquer ? Merci d'avance.

Pharma (discuter) 17 juillet 2021 à 18:17 (CEST)Répondre

  Pharma :
Bonjour,
La valeur est copiée telle quelle dans le résumé de modification, entre crochets, avant la liste des changements effectués. Il n'y a pas de restriction particulière à part la limite de longueur des résumés de modification (quelques centaines de caractères).
Par contre, il n'est pas possible d'utiliser des variables comme "%(page)". C'est une valeur fixe associée au modèle qui apparaît une seule fois à chaque modification, quel que soit le nombre de pages ajoutées ou supprimées de la liste. Par exemple, dans ce diff où deux pages ont été ajoutées et l'id du modèle est "PàS", le commentaire est "[PàS] + Pétros Papadópoulos, Craig Pedersen".
Orlodrim (discuter) 17 juillet 2021 à 19:51 (CEST)Répondre
Parfait, voilà qui va m'aider. Merci pour ta réponse et pour tes outils très utiles. — Pharma (discuter) 17 juillet 2021 à 21:00 (CEST)Répondre

Renommages

modifier

Bonjour @Orlodrim, tout d'abord merci pour cet outil très intéressant. Je le teste en ce moment sur la page Projet:Une pomme est un fruit/Dépommage qui servira si tout va bien à établir le prochain bilan des pommes. Il se passe un truc bizarre sur deux exemples de renommages pas encore "dépommés" :

je ne comprends pas d'où vient cet écart. Frenouille (discuter) 9 mai 2022 à 14:51 (CEST)Répondre

  Frenouille :
Bonjour,
Normalement, les renommages ne sont pas affichés comme des suppressions. Je crois que le second cas est dû au fait que le bot lit les modifications récentes et les catégories séparément, et que le renommage a eu lieu juste entre les deux opérations, provoquant une situation mal gérée :
  • Une modification normale a eu lieu sur la page encore nommée Mancomunidad "Plana Alta" à 13:22.
  • Juste avant le renommage, le bot a consulté les modifications récentes. En raison de cette première modification, il a décidé qu'il fallait vérifier si les catégories de la page avaient changé...
  • À 13:26, la page a été renommée en Mancomunidad Plana Alta
  • ... et quelques secondes plus tard, le bot a lu les catégories de l'ancienne page désormais transformée en redirection, sans être au courant du renommage (puisqu'il avait lu les modifications récentes juste avant).
  • Ne trouvant plus de catégories sur la page mais n'ayant pas vu le renommage, il en a déduit que les catégories avaient simplement été retirées.
Je vais essayer de voir comment améliorer ça, mais ce n'est pas évident.
Orlodrim (discuter) 12 mai 2022 à 19:31 (CEST)Répondre
Merci pour l'explication en tous cas. Frenouille (discuter) 12 mai 2022 à 23:11 (CEST)Répondre
Retour à la page de l’utilisateur « OrlodrimBot/Suivi catégorie ».