Wikirenconte

modifier

Salut, je vois que tu viens de t'inscrire pour le pique-nique de ce midi. si tu veux échanger des numéros de portable pour se retrouver en cas d'imprévu, écris-moi un mail. À bientôt. --Coyau 28 juillet 2007 à 10:38 (CEST)Répondre

trop tard mais merci quand même de la proposition. Pmartin 29 juillet 2007 à 16:50 (CEST)Répondre

Common

modifier

Je trouve que l'intégration des moteurs de recherches en de est bien meilleure que la version fr. Celle-ci permet d'accéder beaucoup plus facilement au moteur de recherche que la francophone. Est - il possible de modifier la version francophone ? Cordialement Pmartin (d) 18 février 2008 à 13:53 (CET)Répondre

J'aurais besoin de précisions, je connais très mal commons (honte à moi Sifflote). Tu parles surement de la page commons:Special:Search. En quoi est elle plus aboutie que WP:fr ? --Zelda ♪ 18 février 2008 à 20:21 (CET)
Avant de commencer, je tiens à te préciser que je suis l'éditeur de l'un des moteurs de recherche externes ( wikiwix ). Et que je ne suis pas que sur fr également sur nl, es, ... ,en, de. Je pense que les visiteurs fr, ne trouvent pas la listbox ( liste déroulante ), présente sur cette page http://fr.wiki.x.io/wiki/Special:Recherche?search=&fulltext=Rechercher, alors qu'il la trouve parfaitement lorsqu'il vont sur cette page http://de.wiki.x.io/wiki/Special:Recherche?search=&fulltext=Rechercher en effet nous avons un fort potentiel de visiteurs provenant des langues où il y a un checkbox (bouton de sélection). Ceux ci s'explique par la visibilité aux différents moteurs de recherche externe le qu'apporte la checkbox par rapport à la listbox. D'ailleurs j'en avais parlé http://fr.wiki.x.io/wiki/Discussion_MediaWiki:Common.js#Proposition_concernant_la_barre_de_recherche_de_WP_fr la listbox n'est pas aussi intuitive pour la personne lambda. En fait les personnes lambda tournent en rond lorsque le moteur interne ne leur répond pas les résultats satisfaisant leur requètes. Et je trouve que la listbox masque trop les moteurs de recherches externe. Pmartin (d) 19 février 2008 à 03:14 (CET)Répondre
Merci pour ces précisions. Le coup de la checkbox me parait en effet être une bonne idée qui pourrait améliorer l'accessibilité de la recherche. Je pense que ça vaut le coup de poser un petit sondage sur le bistro, savoir ce que les gens en pensent. J'essaierai de lancer la discussion demain. Bonne soirée --Zelda 19 février 2008 à 19:07 (CET)Répondre
Je ne t'ai pas oublié, je suis juste un peu occupé ces temps ci. J'ai entamé la discussion ici, n'hésite pas à y intervenir. a+ --Zelda 23 février 2008 à 09:44 (CET)Répondre
J'ai trouvé le retour plutôt positif sur la recherche façon wp.de. J'ai récupéré le code pour le tester ici. Je te tiens au courant de l'avancement. Par contre je risque d'être un peu moins présent les quelques semaines qui viennent pour cause de déménagement, en attendant d'avoir internet. a+ --Zelda 1 mars 2008 à 18:02 (CET)Répondre

Hello

modifier

Salut Pm, ça fait un bail, ravi de voir que l'équipe travail toujours d'arrache pied. Like tears in rain {-_-} 11 juin 2008 à 21:10 (CEST)Répondre

Salut Thrill merci de tes encouragements , il faut bien s'occuper un peu Pmartin (d) 12 juin 2008 à 17:07 (CEST)Répondre

cache

modifier

Suite à nos diverses discussion voici un bref résumé

Il nous faudrait donc un cache statique généré à l'heure ou le lien est créé et ouvert (généralement par le bot). avec à l'intérieur un bandeau recensant les différentes versions du cache ainsi que un lien offrant la possibilité de modifier la date et l'heure du cache statique ...


Concernant le fait que vous analysiez les lien un liste unicodée de type :

(sur deux lignes) pour un lien :

(u'[[http://www.example.com title]]', u'[[http://www.example.com {{lien brisé|title}}'),
(u'url=http://www.example.com|titre=title', u'url=http://exemple.com|titre={{lien brisé|title}}'),

Serait la bienvenue pour alimenter le bot dans ses remplacements de liens mort.

--  Cordialement. Micthev (parler) 7 juillet 2008 à 22:09 (CEST)Répondre

Avant d'aller plus avant dans votre projet, vous feriez vraiment mieux de demander d'abord un conseil juridique, vous allez droit dans le mur là, on ne peut pas recopier sur son site des textes dont on ne possède pas les droits. Pwet-pwet · (discuter) 21 juillet 2008 à 18:34 (CEST)Répondre
Ok, moi je disais ça pour vous. Cela dit l'article que tu cites concerne le droit américain, en droit français rien de tel que le fair use; le droit français est beaucoup plus protecteur des auteurs. Pour Wikipediaondvd, on pouvait encore arguer du fait que le contenu n'a pas été vérifié même si c'était très limite, mais là il s'agit d'une violation délibérée du droit d'auteur. Vous feriez bien de demander confirmation à un avocat, car ça n'a rien à voir avec Wikipediaondvd; il serait dommage d'avoir travaillé pour rien et de se retrouver dans la merde le jour où un auteur vous fera un procès parce que vous avez pompé son texte sans autorisation. Si des textes disparaissent du net, c'est peut-être aussi que les auteurs souhaitent qu'ils ne soient plus accessibles. Ce n'est pas pour rien que google ne met pas tout en cache... Une piste pourrait être de demander préalablement les autorisations aux auteurs; je crois que beaucoup seraient heureux de voir leurs textes pérennisés, et cela en évitant le risque de se voir coller un procès par ceux qui ne veulent pas. J'ai déjà participé un projet similaire où la question légale était encore beaucoup plus délicate étant donné la nature des documents (auteurs anonymes ou pseudonymes), je peux te donner des détails par mail si tu veux. Là avec votre projet vous avez l'énorme chance d'avoir la possibilité de contacter les auteurs, ça serait bête de ne pas l'utiliser. Pwet-pwet · (discuter) 22 juillet 2008 à 10:59 (CEST)Répondre
Bonjour, bonjour, pourriez-vous m'indiquer un endroit ou lire des informations expliquant votre démarche sur le cache de liens externes avec wikiwix ? Le sujet m'intéresse. J'ai beaucoup travaillé sur la mise à jour des liens vers Légifrance quand ils ont modifié leur site et créé un bot pour faciliter la maintenance ; j'ai également traduit la page Aide:Pywikipedia/weblinkchecker.py. Voilà pour mes références. Dans l'attente de vous lire, cordialement, ILJR (d) 19 août 2008 à 10:33 (CEST)Répondre
Pour l'instant, il n'y a pas de page récapitulant l'état du projet, et c'est exactement la question que je me posais. En fait vu que ce n'est pas un projet "gérer" par la Fondation Wikimedia je ne sais pas si il est très approprié d'ouvrir un espace à ce sujet sur le fr.Wikipedia.org . D'un autre coté je crains que l'on nous taxe de publicité si cette démarche n'est pas sur Wikipedia. Plusieurs pages ont été créés à ce sujet là au sein de WP sur différentes tentatives. C'est un sujet très sensible comme tu peux le voir sur le bistro du 14 Aout. Donc en fait je n'ai pas réellement de solution pour avoir un espace public à ce sujet. Pmartin (d) 19 août 2008 à 11:00 (CEST)Répondre
Voir ce message. Il me semble que vous avez besoin d'une page de documentation et de discussion sur fr:WP.
Pour info, voir les discussions de ma demande de statut de bot.
Je suis peut-être hors sujet n'ayant pas une vision claire de votre projet, si c'est le cas veuillez m'en excuser.
ILJR (d) 19 août 2008 à 11:42 (CEST)Répondre

Je propose de faire un brouillon dans une sous-page du Projet:Correction des liens externes, cela aidera dans un premier temps pour y renvoyer tout ceux voulant en savoir plus, sur notre démarche, ect. Et surtout cela va devenir indispensable pendant le test, car cela permettra d'y canalyser les discussions. Amicalement, Dodoïste [réveille-moi] 19 août 2008 à 14:46 (CEST)Répondre

test du cache

modifier

En prenant un article au hasard, mon premier test du cache a été ici : Picasa. Je note :

  1. présentation adéquate   Bravo !
  2. le premier lien n'affiche pas les hyperliens du haut (Gmail Agenda Documents Photos Reader Web plus ▼ YouTube Images Maps Actualités Vidéo Groupes Livres Blogs et encore plus ») Ce que je remarque sur d'autres tests : la navigation en se fait pas "comme si on était dans le site à l'heure de sa création" ,contrairement à internet archive.
  3. Les deux suivants affichent le code source de la page :  

Dans l'article Cinéma,

  1. ref 123, une erreur bien compréhensible (voir tentative de cache, site)

J'espère que cela peut t'aider. Et bravo pour l'énorme travail fourni. Bonne continuation! Amicalement, Dodoïste [réveille-moi] 25 juillet 2008 à 04:11 (CEST)Répondre

Hello ! J'espère que tu vas bien. J'ai aussi trouvé cette erreur sur Fédération générale autonome des fonctionnaires, note 10. Bonne continuation ! Dodoïste [réveille-moi] 3 août 2008 à 16:27 (CEST)Répondre

Un nouvel archiveur

modifier

Tout est dit ici: Projet:Sources/Chez_Manon#Pour_garder_une_trace_des_pages_Web_.C2.AB_volatiles_.C2.BB. Bien à toi, Dodoïste [réveille-moi] 25 juillet 2008 à 01:52 (CEST)Répondre

j'ai lu et vu mais en effet comme tu le dis si bien de nombreux défauts comparables à ceux de google-cache ou internet archive enfin why not ? Cordialement. Micthev (parler) 25 juillet 2008 à 11:59 (CEST)Répondre

archive

modifier

Si j'ai bien vu, wikiwix ne mets pas en cache les adresse renvoyant vers un site en général ( http://www.scc.asso.fr par exemple) alors que si on choisit une page spécifique ([1]) de l'espace de nom elle est directement mise en cache c'est bien cela?

C'est ingénieux dans le mesure ou lorsque l'on renvoie de manière aussi imprécise à un site ce n'est pas pour y faire une référence, et un gros site à moins de chance d'être inaccessible qu'un page seule.

Par contre je ne suis pas sûr d'avoir bien compris cette démarche, si tu as quelque chose à ajouter vas-y   Amicalement, Dodoïste [réveille-moi] 28 juillet 2008 à 20:28 (CEST)Répondre

Ah mon exemple marche pas les liens des pages de discussion ne sont pas archivées -_-' Enfin bon c'est une observation faite sur les articles. Dodoïste [réveille-moi] 28 juillet 2008 à 20:30 (CEST)Répondre
Euh de ce coté là, il vaudrais mieux que tu vois avec Pmartin, j'avaoues ne pas être trop au courant. Cordialement. Micthev (parler) 28 juillet 2008 à 21:22 (CEST)Répondre
Donc je déplace ici. Bonjour Pmatin   Dodoïste [réveille-moi] 28 juillet 2008 à 21:34 (CEST)Répondre

Ton gadget sur le cache

modifier

Ta sous page /cache.js créé un bogue sur la fonction AddCustomButton (pas celle de Mediawiki:Common.js, mais celle de user:stef48/aide.js par exemple). Si tu peux voir s'il est possible de résoudre le conflit entre ces deux fonctions — Steƒ (  Стеф  ) 3 août 2008 à 17:44 (CEST)Répondre

Merci  Steƒ (  Стеф  ) 6 août 2008 à 10:32 (CEST)Répondre

quand une référence contient plusieures sites

modifier

Voir Cuisine_suisse#Notes_et_r.C3.A9f.C3.A9rences, il y a de nombreuses urls dans une même référence. Amicalement, Dodoïste [réveille-moi] 12 août 2008 à 00:12 (CEST)Répondre

Salut,

Tu as déjà essayé de quantifier la proportion des liens webs non accessibles sur la totatlité ? Ludo Bureau des réclamations 14 août 2008 à 15:44 (CEST)Répondre

cache

modifier

Bien noté merci ;) Cordialement. Micthev (parler) 20 août 2008 à 22:10 (CEST)Répondre

Un détail

modifier

Bonjour, juste un détail esthétique pour User:Pmartin/cache.js :

 last.appendChild(document.createTextNode("("));

Rajouter un espace (ou un  ) séparerait le « (cache) » du lien qui le précède, ce ne serait pas un mal.
À part ça, j'aurais plutôt vu un <small> au lieu d'un <sup>. Enfin, tout cela est bien futile.  

Cordialement,
— Delhovlyn — « ... » ?, le 28 août 2008 à 00:45 (CEST)Répondre


C'est corrigé pour l'espace :) Pmartin (d) 28 août 2008 à 09:07 (CEST)Répondre
J'ai fait quelques propositions concernant l'apparence du lien sur Discussion Utilisateur:Pmartin/cache.js, j'attends votre avis.   — Delhovlyn — « ... » ?, le 27 septembre 2008 à 22:19 (CEST)Répondre

Wikiwix

modifier

Wikiwix vient d’apparaître dans l’espace encyclopédique. La version actuelle est <euphémisme>pauvre</euphémisme> (on a même eu une demande de SI sur IRC  ), pourrais-tu l’améliorer, ajouter des sources, etc. ? Cdlt, VIGNERON * discut. 17 septembre 2008 à 22:07 (CEST)Répondre

Félicitations pour le cache

modifier

Bonjour Pmartin.

Même si je ne comprends rien à son fonctionnement, un grand merci pour ton cache qui permet de visualiser les liens brisés le l'IGN (erreur 404 depuis le 2 octobre) car il restitue le sourçage d'informations essentielles des 36782 communes de France, comme la superficie, les altitudes mini et maxi ainsi que les coordonnées (latitude et longitude). Béni sois-tu. Cordialement. Père Igor (d) 13 octobre 2008 à 15:47 (CEST)Répondre

Protection de Utilisateur:Pmartin/cache.js

modifier

Bonjour, j'ai protégé cette sous-page pour éviter que quelqu'un s'amuse à la modifier pour vandaliser ou essayer de hacker les comptes qui utilisent ce script. N'hésite pas à me demander si tu souhaites faire des changements dessus. Moyg hop 15 octobre 2008 à 23:09 (CEST)Répondre

Désolé, je croyais que seuls les monobooks étaient protégés comme ça, je ne savais pas que c'était tous les js. J'ai déprotégé. Moyg hop 16 octobre 2008 à 22:02 (CEST)Répondre


User:Pmartin/cache.js

modifier

Parfaite, la nouvelle apparence. Merci beaucoup.   Et félicitations pour la prise de décision. À la réflexion, je me demande parfois si l'option « script lancé automatiquement pour tout le monde » est idéale. Je réfléchis actuellement à un script pour détecter les liens morts, qui pourrait servir si l'option « modèle » est retenue. — Delhovlyn — « ... » ?, le 27 octobre 2008 à 12:20 (CET)Répondre

Hello ^_^ Merci pour ta proposition de filer un coup de main   Alphos (d · c · b) bosse sur un bot en php : DeepBlue (d · c · b). Il demande des avis et des conseils sur la manière de programmer son bot, sans résultat jusque-là hormis les quelques remarque ( peu compétentes et probablement ennuyeuse ) que j'ai pu lui faire ( étant noob en programmation ).
Il serait ravi d'avoir une personne compétente à qui parler. -_^ Voici La section du projet consacrée à son bot, et sa demande de bot flag qui a été mise en attente. Il est presque toujours sur WP:IRC.
La prise de décision laisse le choix entre une application du cache par script ou par modèle. Je suis pour ma part favorable à un modèle et je propose une nouvelle version du modèle lien web à cet effet.
Merci de tes avis et bonne lecture   Amicalement, Dodoïste [réveille-moi] 27 octobre 2008 à 18:29 (CET)Répondre
"À la réflexion, je me demande parfois si l'option « script lancé automatiquement pour tout le monde » est idéale." ==> c'était le but de la PDD, a savoir qu'elle visibilité donné au cache. "Je réfléchis actuellement à un script pour détecter les liens morts, qui pourrait servir si l'option « modèle » est retenue." ==> le fait d'affecter un modèle est lourd de conséquences, une journée comme aujourd'hui avec l'ensemble des sites institutionnels de haute-normandie sont coupés du reste du monde est amha à prendre en compte avant de détecter si un lien est en erreur 404. Pmartin (d) 28 octobre 2008 à 23:59 (CET)Répondre
Non, il ne s'agit pas de détecter si le lien est mort ou pas. Il s'agit de mettre le cache à disposition sur tous les liens, comme le propose le script, en utilisant un modèle. Comme tu le signale, les liens sont tantôt valides, tantôt morts, pour des raisons peu prévisibles. Il est donc utile d'avoir un cache sous la main quoiqu'il arrive. Je désire modifier le modèle {{Lien web}}, qui est déjà très utilisé et que Alphos peut répandre sur tous les liens externes. Je propose que lien web affiche un lien vers le cache identique au script. Voir ceci. Amicalement, Dodoïste [réveille-moi] 29 octobre 2008 à 13:01 (CET)Répondre
J'aime bien la nouvelle version du modèle que tu proposes, Dodoïste (juste, je n'ai pas trouvé comment désactiver simplement tout lien vers une version en cache). Mais j'aime bien aussi l'idée du script JavaScript. Les deux pourraient-ils être complémentaires ? Pour le peut-être futur bot d'Alphos, ça me paraîtrait moyennement réalisable vu la variété des présentations de liens qu'on peut trouver, mais.. je peux me tromper (sinon, aucune connaissance en PHP pour ma part). À mon avis, de très nombreux liens ne pourront pas être convertis en {{Lien web}}, donc je pense que comme ça les deux moyens sont complémentaires. Mais il faudrait réfléchir à un moyen pour que le script ignore les liens générés par ce modèle (suffit de donner un classe particulière à l'ensemble).
@Pmartin : Pas de problème, je reste sur ma position donnée dans la PDD.   — Delhovlyn — « ... » ?, le 29 octobre 2008 à 13:44 (CET)Répondre
Il n'y a pas de moyen de désactiver tout lien vers le cache car je en sais pas faire cela. Tu as une idée ?
Pour le bot, il a déjà été testé sur 200 pages. La seule erreur remarquée concernait des liens où le titre ne devait pas apparaître, étant dans un modèle ( car cela prends trop de place ! ). Alphos l'a résolu, et corrigé son script. Mais maintenant qu'il y a un lien obligatoire vers wikiwix, cela risque de compliquer le tout. Pour le reste je te répondrai sur ta PDD. Amicalement, Dodoïste [réveille-moi] 29 octobre 2008 à 14:13 (CET)Répondre

cache

modifier

Bonjour, je t'ai répondu par mail. Cordialement, Pwet-pwet · (discuter) 7 novembre 2008 à 22:22 (CET)Répondre

Pourquoi Wikiwix n'est pas le moteur de recherche par défaut de Wikipédia ?

modifier

Bonjour,

Une discussion sur ce thème à lieu sur le bistrot du jour Wikipédia:Le Bistro/15 décembre 2008#Pourquoi Wikiwix n'est pas le moteur de recherche par défaut de Wikipédia ?. Ton avis pourrait-être utile.Je viens de voir que tu avais vu. Sinon, il y a un lien mort sur ta page perso (Trademarks, je n’ai pas trouvé le nouveau lien). Cdlt, VIGNERON * discut. 15 décembre 2008 à 12:48 (CET)Répondre

Bistro du 31 janvier

modifier

Pour information. Hégésippe | ±Θ± 31 janvier 2009 à 02:37 (CET)Répondre

Voir Bistro du 1er février pour la suite (levée de la restriction des 50 liens). --Lgd (d) 1 février 2009 à 10:00 (CET)Répondre
merci de l'information Pmartin (d) 1 février 2009 à 10:28 (CET)Répondre

Blog wikiwix ajouté au planet

modifier

Voilà, désolé pour le retard, mais le technicien de la fondation Wikimedia a zappé plusieurs de mes emails avant de corriger le problème.

Ton flux devrait apparaitre sous peu dans le planet, le temps que la mise à jour se fasse. nojhan 1 février 2009 à 22:21 (CET)Répondre

Adieu

modifier

Je signe ici mon adieu wikipédien, en espérant pouvoir te croiser sur d'autres sphères telles que MSN, je fut ravi d'avoir travailler avec toi. Chaleureux remerciements, Micthev (parler) 28 février 2009 à 03:03 (CET)Répondre

Moteurs du cherche au sv.wikipedia

modifier

Salut Pascal! J'ai changé le lien Yahoo dans sv:MediaWiki:Common.js selon Bugzilla:18448. (sv:MediaWiki-diskussion:Common.js#External search engines). Si ce code est commun dans les autres sites, peut-etre il faut réparer le meme probleme autrefois aussi... --Brion (d) 20 mai 2009 à 01:17 (CEST)Répondre

Bonjour Brion! Le nouveau code pointe maintenant sur l'adresse générale search.yahoo.com, pour éviter tout problème de ce type. Pmartin (d) 8 juin 2009 à 12:44 (CEST)Répondre

Frise (cf. Bistrot du 29 mai)

modifier

Je l'avais mis dans mon monobook, mais aussitôt viré : ça bloquait mes autres bricolages. Dommage. --Acer11 ♫ Χαίρε 30 mai 2009 à 08:25 (CEST)Répondre

FF 3.0.8 ; avec XP. --Acer11 ♫ Χαίρε 30 mai 2009 à 11:00 (CEST)Répondre

Search option bug for secure login

modifier

Bonjour!

On Swedish Wikipedia, we are using your javascript in common.js to enhance the search page with links to Google, Yahoo, etc. However, the Wikipedia search does not work if you are logged in through the secure server. For instance, see [2]. If you do a Wikipedia search from there, you will get an error because there is no directory /w/. It should be /wikipedia/fr/w/.

I do not have a solution for this, but I think there is a javascript variable with the install path. If you can fix it, please update (or let us know) on svwiki as well! It is not very urgent, because not many people use the secure login, but I think it should be fixed.

Regards, Caesar (d) 15 juin 2009 à 14:21 (CEST)Répondre

Problèmes avec les œ et les oe.

modifier

Bonjour,

Copié tel quel du Bistro, à la recommandation de Jérôme.
En espérant que vous pourrez y faire quelque chose.
Cordialement. --Blufrog (d) 21 juin 2009 à 00:05 (CEST)Répondre

Pour comprendre l'origine de ce qui m'a amemé à soulever ce problème : voir ma remarque "La page révolution des OEillets introuvable par le moteur de recherche de XP:fr" à la page de discussion de l'article "révolution des œillets" [[3]].

Le problème WP:fr est puriste, et c'est très bien, et utilise le plus souvent la graphie œ et pas oe, (mais pas toujours, il y a donc incohérence, mais ce n'est pas le coeur du problème, ces erreurs peuvent rapidement être modifiées), ce qui fait que sur le moteur de recherche http://www.wikipedia.fr , les mots entrés par oe ne renvoient pas aux articles idoines si ceux-ci utilisent la graphie œ.

Je pense qu'il faudrait en tenir compte car quasiment personne ne tape œ au clavier, d'où de nombreuses requètes qui se perdent. Je vous transmets le bébé ne sachant qu'en faire. --Joël DESHAIES (d) 20 juin 2009 à 18:40 (CEST)Répondre

Redirigeons, redirigeons --CQui bla 20 juin 2009 à 18:54 (CEST)Répondre
Ou alors opter pour une distribution Linux qui permet d'avoir un "œ" en tapant "AltGr+o". Pymouss [Tchatcher] - 20 juin 2009 à 19:27 (CEST)Répondre
Effectivement, il y a un problème ! Et pourtant, il a bien été créé des pages de redirection de révolution des Oeillets et révolution des oeillets vers révolution des Œillets. Donc, il n'y a pas ce problème de recherche à l'intérieur de Wikipedia.
En revanche, avec le moteur de recherche, tout se passe comme s'il recherchait en priorité le terme dans un article, et non l'article lui-même : il donne en effet la priorité au terme « Révolution des Oeillets » qui figurait dans Histoire de l'Angola et dans Charles Maurras, au détriment des pages de redirections. Tout ça parce la Révolution des Oeillets était mal orthographiée dans ces deux articles (entre autres) !
Il faudrait donc au minimum qu'il y ait dans le moteur de recherche le même choix que dans Wikipedia entre « Lire » (un article) et « rechercher » (un terme). Ou, à défaut, que les pages de redirection soient privilégiées par rapport à la simple recherche d'un terme.
Il y a cependant une difficulté supplémentaire dans ce cas précis : en effet, il n'y a pas de page de redirection révolution des OEillets (avec deux majuscules), car ce cas est géré automatiquement dans la recherche de Wikipedia... mais pas dans les liens ! Curieux... Blufrog (d) 20 juin 2009 à 19:21 (CEST)Répondre
Ce n'est pas à nous de réduire notre qualité éditoriale pour se mettre à la portée du moteur de recherche, mais au moteur de s'améliorer pour se mettre à la portée du contenu de l'encyclopédie. Google se débrouille par exemple très bien avec les "œ", je ne vois pas pourquoi ça ne pourrait pas être le cas pour http://wikipedia.fr . Pwet-pwet · (discuter) 20 juin 2009 à 23:18 (CEST)Répondre
Le site que tu donnes, http://www.wikipedia.fr n'est pas le moteur interne de Wikipédia et il n'est pas directement lié à la Fondation Wikimedia. Le domaine appartient à l'association Wikimedia France (loi 1901) et les requêtes sont transmises au site http://www.wikiwix.com (fait par une entreprise commerciale française). Le problème que tu rapportes vient du moteur de recherche ; ses concepteurs seront très contents d'avoir un rapport de bug pour pouvoir le corriger. Tu peux les contacter sur leur blog à http://blog.wikiwix.com/2008/08/18/contact/ ou laisser un message à l'utilisateur pmartin (d · c · b), qui est directement en contact avec ces personnes. — Jérôme 20 juin 2009 à 23:21 (CEST)Répondre

Merci pour cette intervention. J'ai relayé à Joël DESHAIES (d), à l'origine de la remontée du problème via le Bistro.
Bonne journée ! Blufrog (d) 22 juin 2009 à 11:05 (CEST)Répondre

Extention du cache

modifier

Bonjour,
désolé, j'ai manifestement raté un message sur ta Pdd que je croyais y avoir posté ce matin. Mais je vois que tu as suivi la discussion sur le Bistro.

Sur le fond, je n'aime pas la solution utilisée dans Utilisateur:Lgd test/cache.js : tous les liens externes présents dans des listes (UL, OL) sont affectés indifféremment, ce qui constitue une contrainte pour des évolutions ultérieures du contenu de Wikipédia, qui devront, si besoin, prévoir explicitement de gérer le script. Une démarche rigoureuse voudrait que l'on n'exécute le script que sur des cibles clairement identifiées. Et d'autre part, du côté ergonomie, la multiplication des liens d'archives signifie aussi celle des occurrences non pertinentes pour le lecteur où le cache est interdit ou non géré.

Mais bon, le mieux peut-être l'ennemi du bien, et la fonctionnalité n'a pour le moment pas suscité de soucis majeurs  .

Bien-sûr, tu es le premier dont les avis sont attendus. Cordialement, --Lgd (d) 20 juillet 2009 à 12:23 (CEST)Répondre

Je ne suis jamais très loin :). A la limite on pourrait fournir un listing des sites dont la mise en cache est interdite, ce qui éviterai l'affichage du dit lien. Pmartin (d) 20 juillet 2009 à 13:16 (CEST)Répondre

Common.js on lv.wiki

modifier

Could you comment on this? Thanks. --Marozols (d) 11 août 2009 à 04:41 (CEST)Répondre

Thanks for your answer. I left my reply here. --Marozols (d) 18 août 2009 à 04:30 (CEST)Répondre

Chapter Wikimedia Belgium

modifier

Bonjour,

Vous vous-êtes inscrit sur la liste des personnes intéressées par la création d'un chapitre Wikimedia Belgium, merci de vous inscrire sur cette mailing list https://lists.wikimedia.org/mailman/listinfo/wikimediabe-l . Merci à vous ! --M0tty [Plaidoyers et jérémiades] 18 août 2009 à 22:23 (CEST)Répondre

Lien archive

modifier

Merci de cette attention : eh bien ils ne s'affichent sur aucuns articles alors qu'ils s'affichaient avant... même phénomène avec les boîtes déroulantes. Pourtant je n'ai rien modifier nulle part, serait-ce un virus ? - Siren - (discuter) 9 septembre 2009 à 18:53 (CEST) PS : je viens de faire le test avec les liens archives, ils apparaissent en IP ! c'est mon log qui change et je ne vois pas pourquoi, la page de mon monobloc n'a pas été modifiée.Répondre

Archives

modifier

Pas de problème. Thierry Caro (d) 18 mars 2010 à 13:26 (CET)Répondre

stop.hu

modifier

Hi Martin. Thank you for the fix. Did you have any progress on creating a bot to put in the archive links if it detects a dead link? --Bdamokos (d) 21 avril 2010 à 19:16 (CEST)Répondre

Recherche de divinités

modifier

Bonjour, je me permets de te signaler cette section du bistro où je soulève un résultat étrange retourné par Wikiwix. Cordialement, --Maurilbert (discuter) 3 juillet 2010 à 16:31 (CEST)Répondre

Page to explain why we need the wikiwix cache on huwiki

modifier

Hi Martin,

This is just a quick note that I have started translating en:WP:Linkrot into Hungarian and I will add in the relevant information about Wikiwix as well. I hope to finish it next week.

Thanks, --Bdamokos (d) 29 juillet 2010 à 22:36 (CEST)Répondre

Rencontre ?

modifier

Bonjour,

Suite à ta/votre message sur ma page de discussion le 21 décembre dernier, je voulais te faire part du fait que je ne suis pas membre du board de Wikipédia, même si j'avais déposé ma candidature à cet effet en temps utile. Je connais mal wikiwix et tutti quanti, mais je suis prêt à en entendre parler, voire à en discuter plus avant, cependant, et, pourquoi pas, à se rencontrer quand même !... Dans l'attente de ta réponse, bien cordialement. Aruspice (d) 27 janvier 2011 à 12:29 (CET)Répondre

Wikiwix

modifier

Hello. I see your message in, and, I and want to know how reliable that is the Wikiwix. Please respond here. Sorry my bad English. Good editions. Bruno Ishiai (d) 3 avril 2011 à 18:53 (CEST)Répondre

Sous-page

modifier

Bonjour,

Il a été demandé la suppression immédiate de Utilisateur:Pmartin/recrutement redacteurs, voir Wikipédia:Demande de suppression immédiate#Utilisateur:Pmartin/recrutement redacteurs. Je viens juste t'en informer. De fait, cette page est out of scope de ce que WP accepte. Il serait surement préférable de la travailler ailleurs. Ludo Bureau des réclamations 7 juin 2011 à 13:10 (CEST)Répondre

Bonjour,
Bien je désapprouve totalement la manière de faire du contributeur qui a soulevé cette question, force est de constater que Utilisateur:Pmartin/recrutement redacteurs ne répond pas aux usages prévus des pages personnelles de compte sur Wikipédia (voir Aide:Page utilisateur), étant donné qu'il ne s'agit pas de traiter du contenu de WP mais de celui d'autres sites (si j'ai bien compris).
Vous aviez eu la sagesse et le bon réflexe initialement de blanchir cette page après la première requête. La restaurer ne peut qu'alimenter une polémique sans intérêt pour Wikipédia et ne semble donc pas une bonne idée. je vous recommande donc de blanchir définitivement cette page, et de... tourner la page  . Cordialement, --Lgd (d) 10 juin 2011 à 12:25 (CEST)Répondre
On a tous des sous-pages users qui n'aident en rien la rédaction de Wikipédia. J'en ai, Nemoi en a. On fait quoi ? On supprime la sienne, les tiennes, les miennes celles de Nemoi, etc. ? Ludo Bureau des réclamations 10 juin 2011 à 12:38 (CEST)Répondre

ƝEMOI – Bonjour, Pmartin. Tu utilises une de tes pages personnelles comme espace publicitaire, ce qu’il est clairement conseillé d’éviter, en détournant donc l’espace mis à ta disposition de son objectif, la discussion autour de la rédaction d’une encyclopédie. Je t’invite à la reblanchir de toi-même, afin que tu ne puisses pas être accusé de sciemment contourner un avertissement pour usage publicitaire. Merci d’avance, ce 10 juin 2011 à 13:59 (CEST).

Je ne vois pas en quoi déposer des annonces rentre dans le critère "Publicité".
La publicité est une forme de communication, dont le but est de fixer l'attention d’une cible visée (consommateur, utilisateur, usager, électeur, etc.) pour l'inciter à adopter un comportement souhaité : achat d'un produit, élection d'une personnalité politique, incitation à l'économie d'énergie, etc. cf Publicité. En aucun cas je fais du démarchage commercial, je cherche des compétences au sein de la communauté pour lequel ma société est impliqué ( par l'archivage des liens externes, par l'offline reader, par un moteur de recherche ). Il me paraît bien plus que normal de proposer à la communauté les quelques euros que je peux faire partager en réutilisant leur compétence. D'autant plus que c'est indiqué que ce sont exclusivement des postes pour des étudiants qui préfère peut - être valorisé leur temps libre, leur CV sur de la rédaction plutôt que d'être livreur de pizzas.
Lgd, certes mais en regardant un peu latitude de Nemoi [4], je persiste à dire que c'est réellement un harcèlement inutile de sa part. Cordialement Pmartin (d) 10 juin 2011 à 16:25 (CEST)Répondre
Comme déjà dit, l'attitude de Nemoi est plus que regrettable. Mais le mal étant fait, l'important serait de ne pas laisser tout cela devenir une montagne (comme il s'y efforce). Cordialement, --Lgd (d) 10 juin 2011 à 17:09 (CEST)Répondre

ƝEMOI – Comme il me semblait que Lgd était d’accord pour dire que cette page n’avait rien à faire ici, je me suis permis de demander l’avis de la communauté sur le Bistro. Avec sympathie, ce 10 juin 2011 à 17:01 (CEST).

Je me retiens surtout de qualifier ton attitude et tes actions dans cas, Nemoi. A part créér (une nouvelle fois) du bordel, on en cherche l'intérêt. --Lgd (d) 10 juin 2011 à 17:04 (CEST)Répondre

Alerte ! Les liens en archive sont parasités !

modifier

Je viens de recevoir un courriel sur OTRS qui m'a révélé ce piratage de redirection. Tous les liens présents et accompagnés de leur archive renvoient, lorsqu'on clique sur [Archive] sur la même page : Mihai Iorga. Visiblement, archive.wikiwix.com a été piraté ! Qui sait comment les contacter pour le leur signaler ? − ©éréales Kille® [Speak to me]* en ce samedi 18 juin 2011 à 18:22 (CEST)Répondre

Juste pour tester le fait : http://archive.wikiwix.com/cache/? et vous serez alors édifié. − ©éréales Kille® [Speak to me]* en ce samedi 18 juin 2011 à 18:26 (CEST)Répondre
C'est corrigé [5] merci de nous avoir prévenu. Cordialement Pmartin (d) 20 juin 2011 à 09:38 (CEST)Répondre

Liens archives, dates, etc.

modifier

Bonjour,
Je me suis permis d'avancer un avis à propos de ce que vous faites dans le Bistro du jour. Un complément d'information serait certainement nécessaire. Ne pas hésiter si je me suis trompé à me le faire savoir. Cordialement, --Lgd (d) 8 février 2012 à 15:32 (CET)Répondre

Il faut enlever ca, c'est commerciel.

modifier

Il faut absolument enlever ca, c'est trop commerciel et en plus ca n'a rien a voir avec l'anatomie de l'atlas. Pourriez vour éliminer ca? http://archive.wikiwix.com/cache/?url=http://www.atlasprofilax.ch/fr/carte.php&title=Br%C3%AAve%20pr%C3%A9sentation%20de%20la%20m%C3%A9thode%20d'atlasologie%20de%20Sch%C3%BCmperli%3AAtlasprofilax 89.204.136.52 (d) 1 octobre 2012 à 08:10 (CEST)Répondre

Comprends pas la question :) --Pmartin (d) 1 octobre 2012 à 17:30 (CEST)Répondre

Wikimedia Belgique

modifier

Bonjour, Pmartin, en 2008, vous vous êtes inscrit sur cette liste en montrant votre intéret pour la création de Wikimedia Belgium. Aprés plusieurs années infructueuses, nous avons relancé le processus permettant la création d'un nouveau chapter en Belgique (et au Luxembourg) en 2011 et nous sommes actuellement en train de travailler pour concrétiser le chapitre en 2012/2013. Si vous êtes toujours interessés par la création d'un chapter en Belgique, merci de vouloir vous inscrire sur la. Soyez les bienvenus, en vous remerciant. Romaine (d) 23 novembre 2012 à 02:49 (CET)Répondre

Comment faire sur autre Wikipédia lien archive + mise en cache ?

modifier

Bonjour, Dr Brains me dit que c'est plutôt toi qui saurais répondre à ma demande sur sa pdd : j'ai dit sur Wikipédia hongrois que les liens « archive » des références de Wikipédia français sont très pratiques pour le problème des sources devenues liens morts, et maintenant ce serait bien que je leur fournisse un peu de documentation sur ce qu'il faut comme code et installation pour faire fonctionner sur un autre Wikipédia le lien archive et la mise en cache de la source. — Oliv☮ Éppen hozzám? 29 novembre 2012 à 10:33 (CET)Répondre

J'ai bien trouvé le gadget hongrois et celui qui a initié ça là-bas, il me dit que ça fait un lien où on trouve le contenu de la source (comme j'avais compris) mais qu'il ne sait pas si c'est archivé automatiquement, parce que par exemple il avait fait archiver sur webcitation.org tous les liens externes de Wikipédia hongrois il y a un ou deux ans. Que je comprenne bien : sur wikiwix ça n'est pas archivé comme ça tout à une seule date, mais automatiquement quand le lien est mis en référence, pour que la source reste la même quand le site change ou disparaît, c'est pour ça qu'il n'y a pas de date dans le lien comme archive.org par exemple, c'est ça ? En tout cas j'ai essayé le gadget hongrois et le lien wikiwix marche, même pour des liens vers des infos en hongrois d'il y a quelques jours. — Oliv☮ Éppen hozzám? 29 novembre 2012 à 23:27 (CET)Répondre

Oui c'est archivé normalement automatiquement, en fait nous suivons les recent change des wiki de la fondation via irc , mais il est possible que la nous perdons la désynchronisation. Sinon un simple clic sur le lien archive enregistre automatiquement.La date a été enlevée car nous avons transféré les datas vers un autre datacenter et du coup nous avons perdu les dates d'enregistrements. Mais nous ne sauvegardons qu'une version de la page ce qui permet de ne pas à avoir à la communauté de se soucier de la version. --Pmartin (d) 30 novembre 2012 à 00:22 (CET)Répondre

J'ai en suivi ta pdd, et j'ai transmis tes remarques sur le Bistro technique hongrois où ça part un peu dans tous les sens : aspect du lien plus discret ou plus explicite, résistance prévisible ou pas si le gadget est mis par défaut pour tous, impossibilité de réarchiver si par exemple un site d'actualité est complété de façon intéressante, etc ; pas sûr qu'il en sorte quelque chose. — Oliv☮ Éppen hozzám? 3 décembre 2012 à 09:54 (CET)Répondre
"aspect du lien plus discret ou plus explicite" la communauté à la main mise sur çà, "impossibilité de réarchiver si par exemple un site d'actualité est complété de façon intéressante" nous avons une interface de gestion pour ce type de demande. Nous avons monté le projet pour la communauté francophone, il est tout à fait possible que nous l'adaptions en fonction des désidérata de la communauté Hongroise...--Pmartin (d) 3 décembre 2012 à 12:38 (CET)Répondre

Question sur les archives

modifier

Comme je vois que tu n'es plus très actif ces temps-ci, je e permets d'attirer ton attention sur cette demande. JackPotte ($) 22 avril 2013 à 21:33 (CEST)Répondre

Liens Wintersport-news.it

modifier

Bonjour. J'espère que tu es toujours par ici...

Le site http://www.wintersport-news.it a changé, les url ne mènent plus à rien. Pas de problème, il y a les archives Wikiwix ! Mais ça ne fonctionne pas... Par exemple, sur la page Coupe du monde féminine de saut à ski 2012-2013 le lien vers http://www.wintersport-news.it/it_IT/10774,Flash.html mène à la page d'accueil du nouveau site : http://archive.wikiwix.com/cache/?url=http://www.wintersport-news.it/it_IT/10774,Flash.html&title=Saltatrici%20norvegesi%20per%20le%20gare%20di%20Coppa%20del%20Mondo%20di%20Sapporo%20e%20Zao

Comment fait-on ? Merci. -- MGuf (d) 24 octobre 2013 à 13:12 (CEST)Répondre

WiKiwix ignores robots.txt

modifier

Hi Pmartin, I don't speak French. Are you the responsible author of WiKiwix? WiKiwix cached http://www.hangblog.org/panart/Booklet_franzoesisch_GzD1.pdf although I added the recommended robots.txt with

User-agent: wikiwix-bot

Disallow: /

What can I do now? --Ixkeys (discuter) 21 novembre 2013 à 16:30 (CET)Répondre

Scripts liens archive wikiwix

modifier

Bonjour,

J'ai réalisé de nouvelles versions du script pour les liens : Utilisateur:Od1n/MediaWiki:Gadget-ArchiveLinks.js et Utilisateur:Od1n/MediaWiki:Gadget-ExtendedArchiveLinks.js. Les améliorations sont assez conséquentes.  

J'ai toutefois un petit doute qui subsiste : je vois que tu avais fait ajouter des paramètres "title" (ici et ) ; fais-tu usage de ce paramètre sur wikiwix, et si oui pourrais-tu m'en dire davantage ?

En te remerciant, od†n ↗blah 3 avril 2015 à 14:51 (CEST)Répondre

C'est un paramètre que nous pouvons nous passer, au démarrage il nous servait pour effectuer des recherches dans les archives, mais personne n'utilisait la fonctionnalité, comme nous avons eu besoin des serveurs pour monter autre chose tu peux le retirer.

Je regarderai ce que tu as fait plus en détails la semaine prochaine. Petit souci sur la montée en charge du nouveau serveur des archives :( --Pmartin (discuter) 3 avril 2015 à 15:02 (CEST)Répondre

Non accès aux liens wikiwix sur les communes

modifier

Bonjour. Y a-t-il un problème actuellement sur les archives wikiwix (exemple) qui fonctionnaient encore très bien il y a une semaine et qui actuellement retournent l'information « 2Le cache est actuellement en lecture seule » ? Père Igor (discuter) 8 avril 2015 à 16:10 (CEST)Répondre

Bonjour, c'est bon c'est revenu.--Pmartin (discuter) 8 avril 2015 à 16:40 (CEST)Répondre
Merci. Étant donné que c'est un lien brisé dont l'archive wikiwix est conservée, j'ai mis le lien wikiwix en direct sur toutes les communes de la Dordogne pour lesquelles c'était possible (ébauches d'article créées par DasBot (d · c · b) en 2005 ou 2006), ainsi que d'autres communes françaises. Père Igor (discuter) 9 avril 2015 à 12:27 (CEST)Répondre
Bonjour. Autre type de lien que j'ai mis sur les communes, celui du calendrier de recensement de l'Insee (exemple sur Faux (Dordogne), la référence n° 4). Si le lien en lui-même était redirigé sur une page d'accueil depuis plusieurs années, l'archive wikiwix fonctionnait correctement, et je la substituais de temps à autre au lien original sur les articles que je passais en revue. Dernière modification dans ce sens le 23 mars, et ça fonctionnait. Or, depuis quelques jours, c'est fini, et je trouve ça pénible. Est-ce irrémédiable ? Père Igor (discuter) 11 avril 2015 à 12:08 (CEST)Répondre
On regardera çà mardi, mais rien n'est irrémédiable, actuellement nous transférons encore les datas de l'ancien serveur vers le nouveau serveur. Du coup, lorsque sur le nouveau serveur l'archive n'est pas présente, elle est automatiquement créé, mais cette version sera écrasée par l'ancienne version. Mardi nous mettrons en priorité les archives lié au domaine de l'insee.Bon week end --Pmartin (discuter) 11 avril 2015 à 13:43 (CEST)Répondre
On a été pragmatique on a fini de passer la lettre i ( insee, ign ) depuis mardi :) --Pmartin (discuter) 16 avril 2015 à 01:42 (CEST)Répondre
Grandiose ! Super ! Fantastique ! Merci beaucoup. Père Igor (discuter) 17 avril 2015 à 08:46 (CEST)Répondre

L'article Wikiwix est proposé à la suppression

modifier
  Bonjour,

L’article « Wikiwix » est proposé à la suppression (cf. Wikipédia:Pages à supprimer). Après avoir pris connaissance des critères généraux d’admissibilité des articles et des critères spécifiques, vous pourrez donner votre avis sur la page de discussion Discussion:Wikiwix/Suppression.

Le meilleur moyen d’obtenir un consensus pour la conservation de l’article est de fournir des sources secondaires fiables et indépendantes. Si vous ne pouvez trouver de telles sources, c’est que l’article n’est probablement pas admissible. N’oubliez pas que les principes fondateurs de Wikipédia ne garantissent aucun droit à avoir un article sur Wikipédia.

Rome2 [Discuter], le 1 juin 2017 à 22:34 (CEST)Répondre

Ton message de ce matin sur le bistro

modifier

Bonjour

J'ai essayé de résumer la situation du sondage et de l'autorisation d'IABot suite à ton message. Les gens peuvent alors y répondre sur ce sujet ou répondre à ton message initial... j'imagine.

J'espère que cela ne te dérange pas.

Cordialement. -- Archimëa [Toc 2 Mi] 26 septembre 2017 à 09:04 (CEST)Répondre

Archimëa Non du tout, encore un cas de plus à gérer le cas des liens qui revient d'une erreur 404. Pmartin (discuter) 26 septembre 2017 à 19:40 (CEST)Répondre
Bonsoir, j'étais plutôt pour les paramètres, mais ta proposition me semble intéressante. (le passé restant à gérer pour moi dans ce système). Donc je suis un peu neutre maintenant.
Je pense que tu aurais du faire une liste plus claire des problèmes pour indiquer pourquoi tu soulèves le problème. notamment "normes du crawl" non respectée, surexposition et dépendance à un seul site d'archivage... enfin, ca reste mon avis. -- Archimëa [Toc 2 Mi] 26 septembre 2017 à 21:01 (CEST)Répondre

I left you a message!

modifier

I thought I would inform you that I left you a message here, and invite you to ask further questions, or make suggestions.—CYBERPOWER (discuter) 14 novembre 2017 à 17:16 (CET)Répondre

hi @Cyberpower678, I have read your message, I will answer you as soon as possible.--Pmartin (discuter) 22 novembre 2017 à 22:46 (CET)Répondre
I look forward to it. I'm hoping I can address all of your concerns regarding IABot.—CYBERPOWER (discuter) 22 novembre 2017 à 23:02 (CET)Répondre
@Cyberpower678 "IABot is NOT EXCLUSIVE to the Wayback Machine. While it only queries the Wayback Machine for new archives, since it is the largest and fastest service to query from" I have need to contact our data center ( https://en.wiki.x.io/wiki/Renater ) before answer you Pmartin (discuter) 22 novembre 2017 à 23:25 (CET)Répondre
Sure. I'll be here. Just ping me in case I miss the response. :-)—CYBERPOWER (discuter) 23 novembre 2017 à 01:59 (CET)Répondre
@Cyberpower678Comment marche wikiwix ( :) ), wikiwix est à la base un moteur de recherche sur l'ensemble des wikis de la WMF, nous nous servons de ce crawling pour récupérer les nouveaux liens dans les wikis. Un simple Javascript sur common.js permet d'afficher le lien d'archivage sur toutes les liens en source, pourquoi ne pas partir sur ce modèle d'implémentation ?--Pmartin (discuter) 23 novembre 2017 à 21:33 (CET)Répondre
There are two problems here. The first Wikiwix does not use a snapshot timestamp to identify when the archive is done. This is a requirement on just about every Wikipedia IABot runs on. The second is that a lot of wikis do not want archive links to be displayed when the original still works. It's considered cluttering the page. This is especially true for enwiki. Also, a lot of links on enwiki don't seem to be on wikiwix. I did a random sample of ten links from random pages and only 2 of them actually existed.—CYBERPOWER (discuter) 23 novembre 2017 à 21:57 (CET)Répondre
@Cyberpower678Nous pouvons fournir un horodatage pour T1 2018. Comment marche IABot, il prend les pages une par une et regarde le statut des liens à chaque passage ? --Pmartin (discuter) 24 novembre 2017 à 00:10 (CET)Répondre
Correct. IABot goes through each article on Wikipedia one by one and does a check on all of the links found on it. If the link comes back as non-functional IABot will act. It will then query the Wayback Machine for a snapshot that was still confirmed as working, or use an archive URL it already knows is functional. While IABot recognizes 21 different archiving services, including Wikiwix, it only pings the Wayback Machine since it has dedicated resources setup for InternetArchiveBot. They have the fastest and most responsive API as well as the largest archive collection out there, and a Multi-query API specifically for use for IABot.—CYBERPOWER (discuter) 24 novembre 2017 à 01:00 (CET)Répondre
@Cyberpower678Es ce que IAbot peut intégrer Wikiwix (ou tout autre de l'un des 22 systèmes archives ) au même titre que la Wayback Machine, et rediriger vers une page, qui serait par exemple sur le tools server https://toolserver.org/ , qui listerait l'ensemble des sauvegardes d'un lien 404, cela rendrait beaucoup moins exclusif que de créer un lien exclusif vers la Wayback Machine, et qui satisferait pleinement la communauté en.wikipedia ?--Pmartin (discuter) 24 novembre 2017 à 01:15 (CET)Répondre
The Wayback Machine isn’t really proprietary. A majority of the archive services IABot supports uses the Wayback Machine code as a framework for accessing content. If you are referring to allowing users and bots to associate known URLs with other services that are not Wayback, then that is already possible. Please see https://tools.wmflabs.org/iabot/index.php?page=manageurlsingle&wiki=frwiki. On enwiki however the majority of links being used are Wayback links, WebCite, and Archive.is links. Wikiwix is only known to be used on the French Wikipedia.—CYBERPOWER (discuter) 24 novembre 2017 à 16:08 (CET)Répondre
Hi @Cyberpower678, i'm johan, i'm a technical ressource at Linterweb. I'll try to translate you Pascal's questions about the IABot. First, about the snapshot timestamp, Pascal said that wikiwix could add it during the 1st half 2018 if it's a prerequisites for wikipedia IABot. Second, we deleted lots of non-french contents in our archives to save storage space, that explains why you can found only 2 of 10 links from enwiki. Third, Pascal proposed to redirect a 404 link to the selection of active archived links (wayback Machine, Wikiwix and others) hosted on toolserver.org; we understand that it requires an additionnal click for user. Finnaly, it looks your way for checking if wikiwix archive exists don't be supported by our front server (sending lots of HEAD requests), and so you get "blacklisted". In fact to avoid overload problems, the front server check the traffic and your requests didn't look like accepted (not like our normal traffic), so it looks you missed lots of Wikwiwix archives in frwiki. I hope my english is not too bad.--Johan linterweb (discuter) 30 novembre 2017 à 14:27 (CET)Répondre
IABot checks if URLs are alive with HEAD requests, or GET requests if HEAD isn't supported. When checking for Wikiwix, it checks it by doing a full GET request and screen scrapes the HTML checking for factors that always are present if the archive actually exists. I believe your iframe embedding display.php is what the bot looks for to see if the archive exists. It should be carrying the user agent identifying it as Cyberbot. IABot requires an archive snapshot timestamp along with the archive URL to be considered a valid archive. As of this moment IABot recognizes wikiwix archives, but doesn't acknowledge them as valid. If IABot can use some form of API on Wikiwix, preferably using JSON, that would make things a whole lot easier in terms of Wikiwix integration. IABot caches that information so it won't persistently check for the existence of an archive or for the timestamp of said archive. However, if these archives are getting deleted for storage reasons, that sort of defeats the purpose of caching the existence information.
Toolserver went down many years ago. Now it's hosted on Toolforge. If you want to, you can integrate IABot's API into Wikiwix. For missing archives you can quickly fetch an archive URL from the bot's DB that the bot knows to be working and automatically redirect the user to said archive. Here's a sample request to the API. https://tools.wmflabs.org/iabot/api.php?action=searchurldata&urls=http://www.eirin.jp/ You would normally need to url encode the url being looked up, and you can look up more than one by separating them with newlines. This DB maintains a list of URLs the bot has encountered on the Wikis it runs on including the French Wikipedia.—CYBERPOWER (discuter) 30 novembre 2017 à 15:00 (CET)Répondre
Hi @Cyberpower678, we will work on the archive snapshot timestamp the earlier possible at start of the year 2018, we are concious than except on french wikis, all others projects already use it. Maybe also we will make an API to be integrated easily in IABot. The main trouble we have actually is: you said IABot use prioritary Wayback Machine if there is a external link without already known archive link, it means all new external links from now will be shown archived only by Wayback machine, even if others services have it. So in long term, all others archivers present on wikis project will become useless and less visible (so less traffic, less utility); that's why we think it should be better to show the list of archivers having this link archived in place of the direct link to wayback machine url. Wayback machine works good, it's not our problem: the problem is it will "capture" all the new (or actual) archive links, and do not let the choice for user to use (and support) this or that archive service. --Johan linterweb (discuter) 21 décembre 2017 à 09:39 (CET)Répondre
The priority is because the Wayback Machine is the fastest, largest, and most responsive service likely to provide meaningful data. Archive.is has a very high chance of providing bad snapshots, making it way too unreliable to use as a service automatically, and WebCite takes a long time to deliver responses, and is prone to a similar problem. You know the reason for Wikiwix at current. :-) The remaining smaller services are just too small to make worthwhile to integrate. With that being said, IABot can be told to use them. If you for example ran a bot to add Wikiwix archives to URLs that have no archives associated with them in IABot's DB, IABot will use those.—CYBERPOWER (discuter) 21 décembre 2017 à 14:20 (CET)Répondre
Hi @Cyberpower678, here will start the end of year holidays. We will come back to you near mid january, the time we contact our institutionnal datacenter and organize our future work. We wish you to spend good holidays for end of years. --Johan linterweb (discuter) 22 décembre 2017 à 10:55 (CET)Répondre
Thank you and you too. :-)—CYBERPOWER (discuter) 22 décembre 2017 à 14:48 (CET)Répondre
"maineditsummary": "Récupération des sources de {linksrescued} et taggage de {linkstagged} comme mort.",
"errortalkeditsummary": "Notification des erreurs rencontrées lors de la tentative d'archivage des liens",
"talkeditsummary": "Notification des sources altérées nécessitant un ré-examen"

I did a random sample of 30 WikiWix URLs from the IABOt database. 21 of them don't work. Here are the non-working links:

All of these are in the IABOt database as active. The WikiWix API reports status 200. It suggests that 66% of the 1 million links in the IABot database don't work. They are bleeding into EnWiki and creating a huge problem. -- GreenC (discuter) 12 avril 2018 à 17:46 (CEST)Répondre

@Johan linterweb ^—CYBERPOWER (discuter) 12 avril 2018 à 17:55 (CEST)Répondre
  • Since the status codes are not available or reliable, the only way is web scrape and build rules in a filter, like a spam filter. I did this with archive.is and reduced soft-404's results from 60% to 10%. Archive.is had the same problem of not tracking status codes creating millions of soft-404s in its database. This is a very unfortunate mistake. I keep refining and adding to the filter. It takes time and work to build the rules, entering one at a time based on what is discovered filtering on keywords like "page not found", "404" etc.. -- GreenC (discuter) 13 avril 2018 à 16:31 (CEST)Répondre

15 May 2018

modifier

From the interface logs:

00:34, 15 May 2018 Wikiwix-bot(frwiki) Changed the archive URL of http://danhollander.com/ from (none) to http://archive.wikiwix.com/cache/20121201011644/http://danhollander.com/ (url not yet archived (wikiwix))

danhollander.com does not exist on fr.wiki.x.io but does exist on en.wiki.x.io .. How does Wikiwix-bot find links to upload archives for? @Cyberpower678 et @Johan linterweb -- GreenC (discuter) 15 mai 2018 à 02:48 (CEST)Répondre

Other examples: danskate.dk danhirschhorn.com

Johan linterweb, I don't think it will work with French as project. It will still return all URLs in all projects. To determine if a URL exists on French Wikipedia, either use MediaWiki API API:Exturlusage to search for the URL on French Wiki, or the IABot API function action=searchpagefromurl and count how many articles are returned. The first method is hard because encoding in the IABot database may be different than in the Wiki text. The second method is resource intensive since you have to download one URL at a time because when downloading multiple URLs eg. action=searchpagefromurl&urlids=145|348|578 .. the JSON returned does not distinguish which URLs are contained in which articles (c.f. Phab T194406). I've opened Phab T194755 for an API feature to report if a URL exists in a Wiki language. -- GreenC (discuter) 15 mai 2018 à 16:59 (CEST)Répondre
Also, I see I blocked the bot after you responded, I am sorry as I didn't see your post initially. If you agree to stop the upload script until it is fixed (to search for the URL in French wiki) I can remove the block so that you can run tests etc.. -- GreenC (discuter) 15 mai 2018 à 18:39 (CEST)Répondre
Hi GreenC (discuter), sorry we were busy with GDPR work here, i stopped our bots when i saw we were blocked. If you could unblock us, we could relaunch bots without this one causing the issue. We will work on this URL check. --Johan linterweb (discuter) 28 mai 2018 à 08:37 (CEST)Répondre
@Cyberpower678 et @GreenC, could you unblock wikiwix-bot on IABOT API please ? --Johan linterweb (discuter) 31 mai 2018 à 09:39 (CEST)Répondre
At this time there are too many quality problems. The timestamp dates are not accurate. The ratio of soft-404s is very high pages in the database were not corrected. Many pages don't replay correctly. It would not be responsible to add them into the database, since they are propagated to other language Wikis besides French. I'm replacing with other archives higher quality. As an option discuss with @Cyberpower678 to create a separate database field dedicated to WikiWix and only for use on frwiki. Until then I can't allow bot additions without community approval in other languages given the scope of the problem. -- GreenC (discuter) 3 juin 2018 à 18:58 (CEST)Répondre
I'm inclined to agree with GreenC at the moment, however I won't mind unblocking if I'm assured Wikiwix-bot stays off until such problems are resolved. GreenC specializes in dealing with detecting bad snapshots, so I would really encourage you and him to work together to improving the Wikiwix system. It could only further benefit both frwiki, and InternetArchiveBot. Our end-goal is to be able to preserve all sources on all wikis with the highest reliability, that means sourcing archives from one dozens of archiving services. Not just the Wayback Machine or Wikiwix.—CYBERPOWER (discuter) 4 juin 2018 à 04:37 (CEST)Répondre
The upload rate needs to be limited to batches so I have time to manually check. There are four main issues: 1) A soft-404 rate of less than 5% is acceptable every other archive can do achieve this. WikiWix uploads in the database are 50% or more. 2) The timestamps are used to verify content per core policy WP:V. Inaccurate timestamps are misleading and can cause real-world problems for when people are trying to determine when something occurred, such as in a legal case, or investigations by the media. If WikiWix does not have accurate timestamp information, it needs to be disclosed to the community including how the timestamps were derived so they can properly judge how to use the information. 3) WikiWix uses frames making it impossible to web scrape and verify the content. Content should be verifiable no other archive service makes it impossible to web scrape. 4) Pages often don't render correctly, the HTML is mangled even though not technically a soft404 it is a low-quality save. -- GreenC (discuter) 4 juin 2018 à 15:46 (CEST)Répondre

Hi GreenC (discuter), here is an update of our status. We have added more soft404 filters, our detection rate is better: it remains 2 URLs from the previous 30 sample of wikiwix URLs not detected. We know that we firstly put lots in the IAbot database, we was running a script to fix or remove them from the db but it stopped with the wikiwix-bot block. Should it be possible to unblock us so we could resume the "cleaning" script only (not those pushing datas into the db). About the inaccurate datetime problem, we identified a bug from our dev work on multiple versionning of URLs with differents datetime, it should be quite better now (possibly some dates have been reseted). We also working on a new access without frames use, still in dev but it can be tested here http://archive.wikiwix.com/cache/index2.php?url=http://www.imdb.com/name/nm1102727/ . For the 4th point, we are not sure to understand what you mean by mangled: is it about the style missing ? or are there content missing ? do you have some URLs as examples so we could look what are the problems ? --Johan linterweb (discuter) 4 juillet 2018 à 10:08 (CEST)Répondre
ping @GreenC @GreenC (discuter), i don't know if you get notified. --Johan linterweb (discuter) 6 juillet 2018 à 09:22 (CEST)Répondre
Johan linterweb, the problem is not only with the IABot database but also links that are added into the dozen language Wikipedia that IABot runs on - these are much harder to fix because it requires a bot able to read/write wikisource in many languages, manual checking wikiwix links to verify they work, and bot permission to run in each language. There is currently no bot able to do this, and it would take a long time to setup and manage such a bot. Thus, to prevent further unrepairable damage, given the scope of the problems with dates and soft404s and number of links (1.4 million), I replaced most of the Wikiwik links in the IABot database. The policy of Wikiwix importing its data into the unclaimed archive spots doesn't make sense, and never really did because there are other archive providers, and there is overlap between French links and other languages so it's not limited to French wikipedia. If the French Wikipedia community requires Wikiwix, there could be a separate database field for Wikiwix, or some other policy.
  • Seeing improvements in dates, still seeing problems, a mixture of some work and others not. Example with content dated 2017 and snapshot dated 2011.
  • The mangled (fidelity) errors. Compare this and this. The only way to see it is by loading in 100s or 1000s of pages at random and manually looking for fidelity errors - this is what I did before but didn't save the examples. What technology are you using to record pages?
  • Soft404s have a very long tail of problems. Any soft404 algo will be an active ongoing development checking 10s of thousands of pages if not more. Those 30 test pages are the start. Other providers have a soft404 API call so that developers get back the result if the page is considered a soft404 or not, which is useful for developers. There are also other ways to determine a soft404 besides scraping for keywords such as looking for redirect URLs to the root domain name, or if many pages redirect to the same URL.
  • @Cyberpower678 -- GreenC (discuter) 6 juillet 2018 à 15:34 (CEST)Répondre
    The soft404 API seems useful for IABot. I'd like to know more details about it. Can you give me details in our Conference room on Phabricator? You seem to have this issue under control in regards to Wikiwix, so I'll leave it to you GreenC, this allows me to getting back to the primary issue of IABot, expanding the DB to handle different archive services. Thanks for keeping me informed. :-)—CYBERPOWER (discuter) 6 juillet 2018 à 15:49 (CEST)Répondre

I've noticed snapshot dates sometimes don't make sense. For example:

http://archive.wikiwix.com/cache/20070301071118/http://danielpearl.org/

This page dates from 2007. But it contains content dated 2015. I've seen other pages like it. @Cyberpower678 et @Johan linterweb -- GreenC (discuter) 15 mai 2018 à 03:22 (CEST)Répondre


I have blocked the bot. Please discuss why links not on the French Wikipedia are being archived (three examples above) and seemingly invalid snapshot dates. -- GreenC (discuter) 15 mai 2018 à 14:54 (CEST) @Cyberpower678 et @Johan linterweb -- GreenC (discuter) 15 mai 2018 à 14:55 (CEST)Répondre

hi do you see my last message https://fr.wiki.x.io/wiki/Discussion_utilisateur:Pmartin#19/07 ? @Cyberpower678 @GreenC @Johan linterweb Pmartin (discuter) 2 août 2018 à 21:46 (CEST)Répondre

@Cyberpower678 @GreenC @Johan linterweb

Task 1: datetime erros (Johan linterweb)

modifier

Our DB is actually in an update process, but it could take some time be fully treated, we hope it will be finished next to august end. As you could imagine, we have more than 100 millions entries to process.

Task 2: mangled errors (Johan linterweb)

modifier

The fidelity errors are generally quick to fix, but hard to detect depending the mime type of the archived file, the fact we render it in html and the fact we also archive ftp:// url. We use our own technology to create the archives. OK

Task 3: soft404 errors/API (Johan linterweb| GreenC)

modifier

We could do this kind of API, but we need to know exactly in what it consists. We already have an api type response (json) which say if the URL is a 404 (soft or hard). http://archive.wikiwix.com/cache/?url=http://boogiechillindetroit.blogspot.com/2008/01/from-italy-with-love.html&apiresponse=1

Task 4: IABOT DB expanding for others archive services (Cyberpower678)

modifier

The soft404 API seems useful for IABot. I'd like to know more details about it. Can you give me details in our Conference room on Phabricator? You seem to have this issue under control in regards to Wikiwix, so I'll leave it to you GreenC, this allows me to getting back to the primary issue of IABot, expanding the DB to handle different archive services. Thanks for keeping me informed. :-)—CYBERPOWER (discuter) 6 juillet 2018 à 15:49 (CEST)" Effectively, it seems to me a good choice for the community too.

Task 5: model to manage this expanded DB (GreenC)

modifier

We think it could be nice to use a model to give people the access to the differents archive services that IABot will know in its expanded DB, it will be a less exclusive solution, and let the possibilty to add/remove/hide archive services without edit articles sources. This kind of model is already used, like for the geolocalisation, in mediawiki projects.

Pmartin (discuter) 19 juillet 2018 à 21:23 (CEST)Répondre

cache: white page

modifier

Hello there! Thanks for your service cache. Links with this domain only shows white pages. I guess it's a technically problem, can you do something to solve it or not? Thanks for your answer. --KurtR (discuter) 16 juillet 2018 à 16:35 (CEST)Répondre

cant connect db

modifier

Bonjour. Il semble y avoir un problème de connexion à la base de donnée de archive.wikiwix.com

Cordialement. -- Archimëa [Toc 2 Mi] 21 août 2018 à 20:33 (CEST)Répondre

@Archimëa notre système interne nous avait remonté le problème. Petit problème corrigé lié aux évolutions souhaitées par GreenC et Cyberpower sur notre système d'archivage. Tout est de nouveau normal. Cordialement Pmartin (discuter) 23 août 2018 à 14:04 (CEST)Répondre
@Archimëa ( http://www.jeuxvideopc.com/jeux/trackmania-2/preview-test-trackmania-2.html ) je reviens vers toi avant la fin de la semaine prochaine.Pmartin (discuter) 23 octobre 2018 à 20:36 (CEST)Répondre
@ArchimëaLe fichier robots.txt renvoyé par jeuxvideopc.com à notre demande d'archivage n'est pas le même que celui que nous recevons via un navigateur. Mais du coup on a un non droit d'archivage. Pmartin (discuter) 11 novembre 2018 à 20:55 (CET)Répondre
Ok. Merci pour l'information. -- Archimëa [Toc 2 Mi] 15 novembre 2018 à 23:57 (CET)Répondre

Archives wikiwix de l'ancien site IGN pour les communes françaises

modifier

Bonjour Pmartin. Depuis plusieurs semaines, l'accès aux archives wikiwix des anciens sites de l'IGN pour les communes françaises ressortent en erreur 404 (exemple). Ce problème est récurrent et intervient régulièrement tous les un ou deux ans. Peux-tu faire quelque chose ? Père Igor (discuter) 22 octobre 2018 à 12:03 (CEST)Répondre

Je prends note on va résoudre cela dans la semaine. Pmartin (discuter) 23 octobre 2018 à 19:32 (CEST)Répondre
@Père_Igor C'est corrigé, effet de bord des évolutions demandés par IAbot :) Pmartin (discuter) 11 novembre 2018 à 20:51 (CET)Répondre
Merci. Après purge du cache, c'est redevenu normal. Dis donc, tu as apparemment des semaines trèèèèès longues  . Père Igor (discuter) 12 novembre 2018 à 17:59 (CET)Répondre
Oui du coup mes années comptent moins de semaines, je milite activement contre le Calendrier_grégorien :). Plus sérieusement, il a fallu qu'on fasse un rattrapage de données spécifique à l'INSEE lié au nouveau formalisme de réponse obligé par le couple Cyberpower et GreenC. D'ailleurs je pourrai te faire un retour à toi et @Archimëa sur les longues conversations suite à ton alerte ( https://fr.wiki.x.io/wiki/Discussion_Projet:Bot#Premier_jour_de_fonctionnement_d'InternetArchiveBot ) et des efforts de développement que l'on a du fournir pour nous mettre en conformité avec IABot et finalement aucun retour. Pmartin (discuter) 14 novembre 2018 à 21:06 (CET)Répondre
Bonjour   Pmartin et Père Igor :
Tout d'abord, une petite remarque pratique : Pmartin, vous avez modifié votre texte ci-dessus pour ajouter une notification vers   Archimëa : il ne va pas la recevoir. C'est normal, car une notification marche uniquement quand vous faites la notification et que vous ajoutez votre signature dans la même contribution.
Ensuite, vous envisagez de faire un retour à Père Igor et Archimëa : très bien, mais je vous rappelle que toute la communauté attend ce retour depuis presque 1 an dans Discussion Wikipédia:Sondage/Configuration d'InternetArchiveBot où vous êtes intervenu dans plusieurs discussions. À mon avis, la pdd du sondage est l'endroit où devraient se tenir les discussions concernant InternetArchiveBot. Le sondage est en pause depuis que vous avez commencé votre longue discussion technique avec Cyberpower678.
Cordialement --NicoScribe (discuter) 15 novembre 2018 à 16:55 (CET)Répondre
Bonjour   En effet, je n'avais rien reçu...
Sinon, je pensais que ce sondage était mort et enterré... D'autant plus que la communauté n'a pas semblé tant intéressée que ca à mettre à plat le sujet de "la mise en forme des liens", de "l'archivage des liens" et des agissement de divers bots, en l’occurrence IAbot... -- Archimëa [Toc 2 Mi] 15 novembre 2018 à 17:01 (CET)Répondre
Bonjour  NicoScribe et Archimëa :, je profite du quelques temps de libre pour récapituler un peu où nous en sommes. En fait, IABot gère une base de données bijective de liens 404 détectés sur l'ensemble des langues de Wikipedia et les associe à un lien de la waybackmachine. Nous avons eu l'autorisation de compléter les liens 404 où la WaybackMachine n'avait pas d'archive ( principalement des PDF, car la WaybackMachine ne les gérai pas par le passé) et de remplacer les liens de Wikipedia Francophone que nous avions en lieu et place de ceux de la WaybackMachine. Un effet de bord est survenu sur les autres langues de Wikipedia du à la bijection d'IABot, les liens wikiwix sont donc apparus dans les autres langues où la template de lien mort a été couplé à IaBot. Du coup la communauté Anglophone a demandé un retour arrière sur les entrées de wikiwix et nous nous sommes mis en conformité avec le template anglophone. Nous avons réalisé les développements suivants : mise en place d'une API permettant de renvoyer les dates d'archivages, meilleures gestions des erreurs 404, retirer le frame d'affichage. Cyberpower quant à lui devait rendre le système d'IABot non bijectif afin de pouvoir gérer plusieurs url d'archiveurs, mais aucune nouvelle sur l'état de son développement.
Parallèlement à çà, wikiwix est capable de gérer des archives de plusieurs dates différentes. Il nous reste à faire de détecter les éventuels changements avant de sauvegarder les pages ( par souci d’énergie notre souhaitons stocker que le contenu que ci-celui a été modifié ), et la bascule vers notre nouveau système. Je précise que notre nouveau système d'archivage repose toujours sur un seul serveur le coût de revient de notre solution est de moins de 40 euros / mois coût de l'électricité. Le financement du développement est assuré conjointement par un CIR et repose sur un seul salarié. Je reste toujours persuader qu'une fois que le développement d'IABot finalisée, la meilleure solution repose sur un template de lien brisé qui renverrai vers une page qui afficherai les différents liens des archiveurs ( un peu comme les miroirs de téléchargement ).
@NicoScribe je peux faire un retour mais à date il n'y a eu aucune avancée significative du projet IABot concernant les liens vers les autres archiveurs, et notre api n'est pas consommé par IABot ce qui provoque des paramètres manquants ex https://fr.wiki.x.io/wiki/Hibakusha. Je relancerai CyberPower en début d'année pour faire le point. Cordialement Pmartin (discuter) 28 décembre 2018 à 15:56 (CET)Répondre

Archives wikiwix systématiquement bloquées par un anti-virus

modifier

Bonjour Pmartin. Depuis quelque temps, toutes les archives wikiwix sont bloquées par mon anti-virus Norton avec motifs « Page web dangereuse bloquée » et « Ceci est une page web dangereuse connue. Il est fortement recommandé de ne PAS visiter cette page ». Es-tu au courant ? Père Igor (discuter) 25 avril 2019 à 17:31 (CEST)Répondre

Lol   Père_Igor : non merci de l'information peux tu m'envoyer un imprim écran, je pense que je vais finir par penser au gros complot international contre les archives Francophone si ça continue comme ça. Ce qui est sur c'est que nos serveurs sont sous contrôle de Renater donc si vraiment Wikiwix avait un usage malveillant nous aurions été alerté par cette voie. Je fournirai les informations à Renater ils auront nécessairement plus de poids que Linterweb concernant cette affaire. Pmartin (discuter) 25 avril 2019 à 18:16 (CEST)Répondre
  Père_Igor : on a trouvé la cause du problème mintour.gov.cm un site gouvernemental qui contient un mineur de cryptomonnaie si maintenant il faut qu'on surveille çà on est pas rendu :). Nous allons effacer les pages demain. Pmartin (discuter) 25 avril 2019 à 20:24 (CEST)Répondre
Merci pour l'info, dont j'ignore totalement ce que ça signifie. Quelles pages allez-vous effacer ? Père Igor (discuter) 26 avril 2019 à 13:59 (CEST)Répondre
Des pages archivées contiennent des outils malveillants [27] mais nous regarderons nous avons une protection contre ce type d'attaque. Nous allons effacer les pages qui paraissent contaminer afin de débloquer la situation rapidement. Je te fournirai le listing des urls que nous effacerons. Cordialement 92.152.255.202 (discuter) 26 avril 2019 à 18:57 (CEST)Répondre
Merci mais inutile de me fournir la liste : il suffira juste d'indiquer le motif de la suppression et si cela intervient sur une de mes 6 680 pages en suivi, j'en serais automatiquement avisé. Cordialement. Père Igor (discuter) 26 avril 2019 à 19:05 (CEST)Répondre
Ce sont des pages contaminées que nous avons décidé de reprendre dans une nouvelle version. Au fait nous sommes en mesures maintenant de maintenir plusieurs pages ayant une même url si cela t'intéresse pour les données de l'insee, fais moi signe. Normalement nous ne devrions plus être blacklisté par Norton Antivirus Pmartin (discuter) 22 mai 2019 à 01:29 (CEST)Répondre

Les archives wikiwix ne sont plus connectées

modifier

Bonjour Pmartin. De nouveau, les archives wikiwix des pages de l'IGN concernant les communes françaises sont défaillantes. Cette fois-ci, elles affichent « cant connect db » (exemple avec [28] pour l'archive du site IGN de Lembras). Apparemment, ce problème concerne aussi toutes les autres archives wikiwix. Peux-tu regarder ce qui se passe et le corriger ? Merci d'avance. Père Igor (discuter) 24 février 2020 à 19:03 (CET)Répondre

Bonjour Père Igor, ce problème arrive régulièrement depuis quelques semaines, le problème est apparu depuis que nous sommes en mesure de pouvoir gérer plusieurs sauvegarde d'une même page. Nous allons renforcer temporairement nos contrôles afin d'être plus réactif et avoir une solution qui permette un rétablissement de la solution plus rapide que ce que nous avons actuellement. Les archives sont KO entre 24 heures et 36 heures lorsque nous avons ce type d'incident. Pmartin (discuter) 24 février 2020 à 19:26 (CET)Répondre
C'est de nouveau opérationnel. Amicalement Pmartin (discuter) 26 février 2020 à 10:31 (CET)Répondre
Merci. À une prochaine fois... Père Igor (discuter) 26 février 2020 à 11:23 (CET)Répondre
  Père_Igor : tu peux vérifier quelques liens, nous avons modifié profondément notre archiveur afin de le rendre plus stable.Pmartin (discuter) 28 juillet 2020 à 09:40 (CEST)Répondre
Bonjour. Hier, le lien wikiwix IGN de Lembras était correct, aujourd'hui, il est en erreur 404. Père Igor (discuter) 30 juillet 2020 à 11:55 (CEST)Répondre
le problème est résolu, nous avions oublié de reporter le correctif nécessaire pour les liens IGN. Cordialement Pmartin (discuter) 30 juillet 2020 à 14:38 (CEST)Répondre

Can Wikiwix archive these URL's

modifier

Hi, I don't speak French well enough, so I've to do this in English.
Can Wikiwix archive these URL's:

  1. https://www.handbal.nl/uitslagen-standen/#poules:uitslagen:%20:27044
  2. https://www.handbal.nl/uitslagen-standen/#poules:standen:%20:27044
  3. https://www.handbal.nl/uitslagen-standen/#poules:matrix:%20:27044

Wayback Machine can archive none. archive.today can archive only the first.
Furthermore, can I manually tell Wikiwix to archive a random URL?
Sb008 (discuter) 29 juin 2020 à 08:21 (CEST)Répondre

Hi you could check on this url http://archive.wikiwix.com/ and give me your feedback. Pmartin (discuter) 2 juillet 2020 à 22:56 (CEST)Répondre
I don't know what I'm supposed to see there, I get some generic page content, but no actual data. Furthermore I get some meaningless dates.
If I enter this URL on the page: https://www.handbal.nl/uitslagen-standen/#poules:standen:%20:28917 (this is a different URL than the 3 above) I get as response:
"This page is a cached version at date 03/07/2020 04:24:10 of this URL.
It appears as it used to be at the time it was inserted as an external link in Wikipedia.
10/06/2020 02:05:21, 23/06/2020 21:24:08, 29/06/2020 14:05:29, 03/07/2020 04:24:10,"
I very much doubt the URL was cached at 03/07/2020 04:24:10, because I didn't insert this link on any Wiki page, and consider it unlikely someone else did.
I have no idea what these dates are supposed to mean?: 10/06/2020 02:05:21, 23/06/2020 21:24:08, 29/06/2020 14:05:29, 03/07/2020 04:24:10
Of those dates 3 are from June and 1 from July. In June the page didn't exist yet. So these 3 dates don't relate to the page.
What seems more likely is that Wikiwix is reporting about the URL https://www.handbal.nl/uitslagen-standen/ without the "#poules:standen:%20:2891" part, and that's not what I'm interested in.
Sb008 (discuter) 3 juillet 2020 à 05:35 (CEST)Répondre

Bonjour,

A l'article "Xavier, duc d'Aquitaine", il est mentionné un ouvrage d'Habasque qui serait archivé. Or, l'archive est illisible. Que faut-il faire? Merci. warlin@wanadoo.fr — Le message qui précède, non signé, a été déposé par Warlin (discuter), le 8 octobre 2020 à 00:00 (CEST)Répondre

Archives wikiwix défaillantes

modifier

Bonjour Pmartin. À nouveau, certaines archives Wikiwix sont défaillantes sur les articles des communes. Sur Mareuil (Dordogne) par exemple, la référence no 5 retourne une erreur 404 et le lien externe de bas de page vers l'archive sur le site de l'Institut géographique national (archive) aboutit à une vieille page d'accueil de l'IGN au lieu de la page spécifique à Mareuil. Ces deux liens existent sur la plupart des communes ou anciennes communes de la Dordogne, soit environ 600 articles. C'est rattrapable ? Père Igor (discuter) 1 avril 2021 à 16:08 (CEST)Répondre

Je pense que oui :) On s'en occupe c'était l'avant dernier gros chantier que nous avions à traiter afin de résoudre les "Can't connect DB". Pmartin (discuter) 2 avril 2021 à 09:11 (CEST)Répondre
on est bon pour l'archive {{n°|5}. Pmartin (discuter) 8 avril 2021 à 10:38 (CEST)Répondre
OK merci. Est-ce que je peux envisager de remplacer ce lien initial par son archive Wikiwix sur plusieurs centaines d'articles ? Père Igor (discuter) 8 avril 2021 à 11:23 (CEST)Répondre
pas d'inconvénients. Pmartin (discuter) 8 avril 2021 à 11:25 (CEST)Répondre

L'article Wikiwix est proposé à la suppression

modifier
  Bonjour,

L’article « Wikiwix » est proposé à la suppression (cf. Wikipédia:Pages à supprimer). Après avoir pris connaissance des critères généraux d’admissibilité des articles et des critères spécifiques, vous pourrez donner votre avis sur la page de discussion Discussion:Wikiwix/Suppression.

Le meilleur moyen d’obtenir un consensus pour la conservation de l’article est de fournir des sources secondaires fiables et indépendantes. Si vous ne pouvez trouver de telles sources, c’est que l’article n’est probablement pas admissible. N’oubliez pas que les principes fondateurs de Wikipédia ne garantissent aucun droit à avoir un article sur Wikipédia.

Ο Κολυμβητής (You know my name) 19 juillet 2021 à 16:56 (CEST)Répondre

Bistro 5.07 et 17.07

modifier

Salut, désolé de ne pas avoir répondu à ta question Discussion utilisateur:Patafisik (WMF)#q:Wikiquote:Le Salon/avril 2021, mais j’ignore totalement la marche à suivre et j’ai pas le temps d’approfondir ces détails techniques pour le moment… d’ailleurs, là le lien archive dispo en historique pointe vers un 404 donc ça semble réglé (comment ? Mystère et boule gomme _^^_). Merci pour le signalement de la PàS bistro 17. Bonne semaine, Malik (discuter) 19 juillet 2021 à 23:02 (CEST)Répondre

Oui j'ai modifié pour renvoyer une erreur 404, je peux prendre le point de faire évoluer le gadget, j'en profiterai pour proposer l'affichage du lien dans la version mobile, et un nettoyage de la partie extended cache ( google cache, et quelques autres ne semblent plus approprié). Pmartin (discuter) 20 juillet 2021 à 17:27 (CEST)Répondre
Hello @Malik2Mars j'ai poussé là ta demande en même temps que la mienne Wikipédia:Demande_d'intervention_sur_un_message_système#Gadgets_ArchiveLinks_et_ExtendedCache Pmartin (discuter) 24 juillet 2021 à 13:12 (CEST)Répondre
Hello, merci et bon week-end. Malik (discuter) 24 juillet 2021 à 15:28 (CEST)Répondre

Article « Linterweb »

modifier

Bonjour Pmartin  
Enchanté de faire ta connaissance   la planète Wikipédia est grande, en faire le tour prend des années  
Je me permet de répondre à ta question sur ta page de discussion afin de ne pas parasiter la page de Wikiwix/Suppression dont l'objet est de garder ou supprimer l'article en cours.

« Wikiwix, Okawix (pas mal d'articles de presse en dehors de wikipédia) sont des produits de Linterweb, pourquoi ne pas renommer l'article Linterweb et y mettre les différents produits ? » (lien).
La nature des propos présent n'engage que ma personne et ne sont pas nécessairement aux reflets de la pensée communautaire. Comme mentionné en DRP (lien) : « La motivation de cette rédaction est due à l'existence du nom de « Wikiwix » dans tous les articles utilisant le modèle {{lien brisé}} … et dans sept autres langues ». Un article concernant la société Linterweb et ses produits représente une dérive pour laquelle l'article n'obtiendrait pas les critères d'admissibilité (Notoriété des entreprises, sociétés et produits) et quitterait l'objectif premier. Pour indication, parmi les références proposées dans la rubrique « Autres sources et liens », un seul lien est exploitable concernant l'article en cours (Rapport d'activité du CRIHAN de 2007). Les autres liens sont, soit déjà cités dans l'article, soit leurs contenus ne sont pas directement en lien avec le moteur de recherche (service). Avec un sincère respect  , mais compte tenu du peu de pratique concernant la création d'articles ou de contributions (lien Wikiscan), j'émets quelques craintes sur l'avenir de l'article en cours et de devoir effectuer un très gros travail rédactionnel pour rendre éligible un article sur la société Linterweb (m'intéressant au sujet depuis quelques temps  ).
L'encyclopédie Wikipédia ne fonctionne pas avec une logique additionnelle ou soustractive (exemple : « j'ai cinq produits cités dans l'encyclopédie, donc ma société peut avoir son article »). Si les articles peuvent avoir indépendamment un intérêt encyclopédique, la logique ne s'applique pas nécessairement auprès de la société créatrice. Par métaphore, ce n'est pas parce que l'on apprécie une musique d'un groupe que l'on émet le désir de connaître la vie de ce dernier.

En espérant ne pas être choquant de mes propos sincères, tout en m'ayant offert le plaisir de répondre au mieux à la question posée  
Cordialement, —— DePlusJean (Discuter) 21 juillet 2021 à 15:13 (CEST)Répondre

Enchanté de faire ta connaissance, et de l'intérêt que tu portes au dernier des Mohicans de Linterweb, okawix exploite la technologie du moteur de recherche wikiwix https://linuxfr.org/nodes/96954/comments/1420846 cf le commentaire de Guillaumito, on va dire que okawix et kiwix V1 ( https://standblog.org/blog/post/2007/04/26/Wikipedia-is-on-a-CD-and-Mozilla-is-backstage Tristan_Nitot ) contenaient une version allégée du moteur de recherche wikiwix. Effectivement Wikiwix part l'intermédiaire des archives est excessivement liée dans wikipedia, mais Okawix me paraît bien plus notoire que wikiwix. Okawix est un lecteur offline mais surtout un moteur de recherche pour permettre de trouver les articles dissocier les deux est compliqué, d'où ma proposition de parler des produits de "Linterweb", quand on fait un moteur de recherche en 253 langues l'ensemble des produits qui en découlent sont nombreux. Après l'activité de libriste libertaire a fait impliquer ma société dans ce type de mouvement https://nuit-debout.fr/blog/2018/11/30/assemblee-le-1-decembre/ https://coordination.assembleesdesgiletsjaunes.org/d/L2DVaeuy/historique-de-la-plateforme et du coup me ferme pas mal de portes pour des "sources traditionnelles" et il y a quinze ans il était malvenue de concurrencer google en france https://sebsauvage.net/rhaa/index.php?2007/03/30/00/00/00-mea-culpa mais pas en hollande https://www.google.com/search?q=wikiwix+zoekmachine.Pmartin (discuter) 21 juillet 2021 à 16:08 (CEST)Répondre
Merci de ta gentillesse  
Sur tous les points, je suis à 110 % d'accord avec toi. L'objectif de l'étape actuelle est la validation de l'article, dans la mesure de la volonté de la communauté, face aux versions précédentes pour lequel il a été supprimé. En effectuant le rédactionnel de la page, mes pensées et mon énergie n'étaient pas voués aux désirs de l'effacement de contenus. D'ailleurs, à cette heure, je ne sais même pas si je m'autorise de voter sur la page  
Petite anecdote faisant la vie wikipédienne   : Je n'ai pas osé annuler ta contribution sur l'article à 10:09 CEST pour laquelle le mot « ingénieur » a été remplacé par « docteur », ce qui n'est plus conforme au contenu de la source ([PDF] lien). Dans le cadre de la patrouille, nous avons régulièrement des utilisateurs qui modifient un mot par un autre pour augmenter leurs compteurs de contribution afin d'atteindre le quota de statut autopatrolled pour se retrouver en situation de moindre contrôle (et commencer à faire des bêtises)} ou de créer des comptes dormants, en attente de meilleurs jours pour vandaliser.
Cordialement, —— DePlusJean (Discuter) 21 juillet 2021 à 17:22 (CEST)Répondre
Oui je n'ai plus de site institutionnel www.linterweb.fr ( une vieille archive 50,50 :) http://archive.wikiwix.com/cache/index2.php?url=http%3A%2F%2Fwww.linterweb.fr%2Fspip%2Fspip.php%3Frubrique6 ) et ces dernières semaines je suis occupé par la mise en place d'un nouveau serveur d'archive en lieu et place de l'ancien et par le système d'annotation de documents ex http://archive.wikiwix.com/cache/index2.php?url=http%3A%2F%2Flinuxfr.org&annotations=1 qui va s'incorporer courant Septembre dans les pages d'archives. Je vais également solliciter la communauté pour pouvoir faire évoluer le gadget archive : vérifier la pertinence des outils d'archivage ( certains sont off ), et indiquer qu'un vote de la communauté doit s'étendre à l'ensemble des outils de visualisation http://fr.m.wiki.x.io/wiki/Ruelle_des_Chats#Notes_et_r%C3%A9f%C3%A9rences, car je vais être prêt à absorber la charge. Quand on me demande quel est ton métier je dis j'archive le contenu des liens externes sur mes deux serveurs. Mais d'accord avec toi laissons voter la communauté. Je vote Neutre simplement pour montrer que je suis impliqué, même si je ne fais qu'intervenir dans les espaces de discussions.Pmartin (discuter) 21 juillet 2021 à 21:07 (CEST)Répondre

Fédération Wikipédia dédiée

modifier

Bonjour, la création d'une « fédération dédiée qui partage les mêmes règles que la Fondation » pour toutes les archives liées aux articles de Wikipédia me semble pertinente, afin que le contenu de ces archives soit conforme aux exigences éditoriales du projet Wikipédia. Mais comment allez-vous contrôler que les annotations ajoutées sont conformes aux exigences éditoriales de Wikipédia ? --ContributorQ() 6 août 2021 à 20:42 (CEST)Répondre

Bonjour et merci de rebondir sur ma pdd :) , Il me paraît très sain de ne faire intervenir ma société uniquement en tant qu'hébergeur supporter par Renater et de contributeur à une solution logicielle sous licence WTFPL et donc de se dédouaner de la partie éditoriale.
Je vois plusieurs pistes de réflexion sans avoir la liste exhaustive des possibilités pour mettre en place la conformité :
  1. validation des annotations via communauté wikipedia,
  2. annotations ouvertes uniquement à la communauté wikipedia,
  3. suppression//nettoyage à posteriori de l'annotation par la communauté wikipedia.
  4. ...
Pmartin (discuter) 7 août 2021 à 01:35 (CEST)Répondre
Je doute que la communauté wikipédienne accepte d'assurer le contrôle qualité du contenu d'une ressource extérieure au projet — à l'écosystème Wikimédia même —, mais je ne peux évidemment pas parler en son nom.
Je vous recommande de lui exposer en toute transparence les moyens de contrôle éditorial que vous pouvez lui garantir et de tenter d'obtenir son approbation en organisant une consultation communautaire. --ContributorQ() 7 août 2021 à 07:50 (CEST)Répondre
La suppression de la fédération "Archive Wikipedia français" est en cours, c'était un exemple, l'outil est encore en phase de développement. Je préfère trouver un consensus avant de parler officiellement d'une "Fédération Wikipedia dédiée". Il faudrait voir le ressenti de la communauté wikipedienne pour une fédération dédiée avant de lancer une consultation. Une autre piste qui pourrait être intéressante serait de s'appuyer sur Wikipédia:Observatoire_des_sources pour annoter les pages liées et ainsi avoir le contrôle des annotations. J'ai vu que vous étiez actif sur ce projet Wikipédia:Mois_du_sourçage une piste pour présenter l'outil ? Pmartin (discuter) 12 août 2021 à 11:05 (CEST)Répondre
modifier

Bonjour Pmartin   j'imagine que votre sondage à bien lieu ce mois ci en 2021 et non 31 ? ;-) Je me suis permis de corriger.--RawWriter (discuter) 8 décembre 2021 à 12:27 (CET)Répondre

Oui merci :) Pmartin (discuter) 8 décembre 2021 à 14:29 (CET)Répondre

SpecialSearch.js

modifier

Hi Pmartin, can you please add language parameter in search URL like hl=bn at this link. And one more request to add https://duckduckgo.com to the search engines list. Thank you for your awesome script. --- Aishik Rehman (discuter) 16 septembre 2022 à 03:14 (CEST)Répondre

Archive à purger

modifier

Bonjour Pascal, un journal a supprimé un article en ligne dont le contenu portait préjudice au sujet d'un article (sans être légalement répréhensible). Si c'est d'usage, peux-tu effacer la version archivée ? Chez nous, j'ai supprimé par ce diffJohnNewton8 (SysOp) [Viens !] 14 octobre 2022 à 13:10 (CEST)Répondre

Bonjour, c'est la première fois que j'ai une demande émanant directement de la communauté.
Ma première réflexion mais je n'ai aucune dépendance avec la WMF ne concerne que Wikiwix, la demande de suppression a été demandée à la communauté Wikipedia, pas pour Wikiwix.
Dans ce cas précis l'action, qui est juste une suppression d'une source apportée par un autre bénévole sur l'article, est très bien car elle élimine le lien vers wikiwix.
La communauté n'a pas d'obligation d'alerter les différents archiveurs vous ne pouvez pas vous engager sur la non accessibilité d'un lien sur un tier de Wikipedia, pour moi cela peut être potentiellement qualifié comme travail dissimulé
Il en reste pas moins que pour les cas où cela nécessite un effacement express comme le Revenge_porn ou une Décapitation, sans que la liste soit exhaustive, mais pour éviter la propagation d'information à caractère personnelle, je suis bien entendu réactif.
Au passage j'ai eu çà https://archive.wikiwix.com/cache/index2.php?url=http%3A%2F%2Fwww.moliere.paris-sorbonne.fr%2FTartuffe_1664_reconstruit.pdf%2Findex.html#federation=Problemes%20lies%20aux%20archives&tab=url.Pmartin (discuter) 14 octobre 2022 à 16:26 (CEST)Répondre
Ok, je comprends ta réponse. En y réfléchissant, ma sollicitation était à prendre comme une suggestion de suppression. Telle personne morale ou physique a obtenu d’un média la suppression d’un article la concernant, par voie judiciaire ou non, et nous en fait part via VRTS
  • il s’offre deux options à la communauté : conserve l’information en s’appuyant sur m’archive Wikiwix, ou supprimer l’information. En l’occurrence, j’ai supprimé, malgré m’archive Wikiwix
  • de ton côté, tu peux soit anticiper une demande de suppression de l’archive par la personne concernée, soit attendre que cette demande arrive (up to you, ce n’est pas l’affaire de la communauté en effet)
Pour info je viens à l’instant de traiter un cas similaire sur Juan Branco : suppression d’un chapitre étayé par un article de GQ que le journal a retiré. Pour info donc, il reste l’archive Wikiwix
Cordialement —JohnNewton8 (SysOp) [Viens !] 20 octobre 2022 à 18:32 (CEST)Répondre

AVAST et navigateur

modifier

Bonjour,
Depuis quelques temps, j'ai le même problème que celui signalé ici, mais avec Firefox sur macOS (dernières versions pour les deux). Est-il possible d'y remédier ? Cordialement, Daniel*D, 15 mars 2023 à 14:49 (CET)Répondre

Merci pour l'info je vais voir ce que je peux faire, les manitous du web doivent certainement partager le même fichier. Pmartin (discuter) 15 mars 2023 à 16:01 (CET)Répondre
Ok, merci d'avance. Daniel*D, 15 mars 2023 à 16:05 (CET)Répondre
J'ignore si vous avez pu faire quelque chose, mais en tout cas ça remarche correctement. Merci, Daniel*D, 16 mars 2023 à 15:25 (CET)Répondre
Enfin une bonne nouvelle, j'ai juste alerté sur twitter et on sait que j'ai la gâchette facile surtout quand j'arrête de fumer. Quelqu'un du "web" a du faire une mauvaise manipulation et s'est fait gronder :) Bonne continuation à vou sur Wikipedia et merci pour l'alerte. Pmartin (discuter) 16 mars 2023 à 16:07 (CET)Répondre
https://fr.wiki.x.io/w/index.php?title=Wikip%C3%A9dia:Le_Bistro/13_mars_2023&diff=prev&oldid=202371515 la bonne nouvelle se propage :) Pmartin (discuter) 17 mars 2023 à 10:43 (CET)Répondre

Mise à jour des scripts utilisateur sous Vector

modifier

Bonjour,

Si vous utilisez l'habillage « Vector (2022) », ce message vous concerne, sinon vous pouvez l'ignorer. Pour vérifier l'habillage utilisé, rendez-vous sur le lien suivant : Spécial:Préférences#mw-prefsection-rendering-skin, ou cliquez sur l'onglet « Préférences », puis « Apparence » et consultez la section « Habillage ».

Depuis le 18 mars 2024, les deux habillages Vector sont dissociés (Vector (2010) et Vector (2022)). Ainsi, les comptes qui utilisent Vector (2022) doivent faire renommer deux pages :

Si tel est votre cas, cliquez sur le bouton ci-dessous pour formuler les demandes de renommage puis sur « Publier les modifications » :

Demander le renommage

Bonne journée,

Plus d'informations sur cette page.

lien okawix ne marche pas

modifier

Bonjour. j'arrive pas à accéder au lien sur ta page. C'est ironique. Franchement! (discuter) 16 mai 2024 à 15:20 (CEST)Répondre

Il y a bien des années que ce projet n est plus opérationnel. Pmartin (discuter) 20 mai 2024 à 18:21 (CEST)Répondre