Discussion utilisateur:Pmartin/Cache
divers
modifierJe ne sais si il s'agit de moi mais sur Cinéma et Paris les liens cache s'affichent pas... Les articles sont trop longs ? (+ de 200 ko) Dodoïste [réveille-moi] 21 août 2008 à 00:57 (CEST)
- Nous avons mis une sécurité afin que le javascript ne mette pas en erreur le navigateur, je viens de rehausser celle-ci et de la positionner à 250 au préalable elle était à 50. Pmartin (d) 21 août 2008 à 08:51 (CEST)
compatibilité
modifierUser:Xic667 me signale à l'instant une incompatibilité avec le gadget réservé aux admins MediaWiki:JSScripts/NavigAdmin. Voilà Dodoïste [réveille-moi] 21 août 2008 à 06:27 (CEST)
Sur l'article Elie Wiesel
modifier2 liens ou le php pose un problème :
- Traduction de l'article d'Élie Wiesel sur le site d'une université canadienne
- Le réseau de salles de cinéma Écrans de Paris appelle à la guerre contre l'Iran
ILJR (d) 21 août 2008 à 14:00 (CEST)
- Le problème est corrigé pour le premier lien, pour le second, c'est plus complexe : c'est une des (innombrables) pages qui détectent si elles sont ouvertes dans un cadre et le font "sauter". Il faut que je trouve un moyen sur de faire sauter le javascript des pages pour le résoudre. Guillaumito (d) 21 août 2008 à 14:53 (CEST)
- Le deuxième lien est maintenant fonctionnel Guillaumito (d) 21 août 2008 à 16:11 (CEST)
cache de pages de wikipedia.org
modifierSans être génant, ce n'est peut-être pas nécessaire :
Exemple sur l'article Nils Olav :
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Nils Olav » (voir la liste des auteurs).
Le modèle crée un lien vers http://en.wiki.x.io/w/index.php?title=Nils_Olav%26oldid=232179047 et donc wikiwix garde en cache une version de l'article sur en.wiki.x.io : http://wikiwix.com/cache/?url=http://en.wiki.x.io/w/index.php?title=Nils_Olav%26oldid=232179047
Plusieurs questions techniques
modifier- J'aurais aimé avoir des stats précises sur les temps d'exécution du script
- La page d'aide dit Il y a la possibilité de désactiver le cache en ajoutant no_external_cache = true; à votre monobook.. Il serait normal que ça soit le fonctionnement inverse, ie par défaut c'est normal, et si le lecteur le souhaite, il a accès à cette fonctionnalité.
Maloq causer 23 août 2008 à 15:36 (CEST)
- Pour la deuxième question : actuellement c'est ainsi. Seulement, il convient de savoir quelle utilité on veut donner au cache, et les conditions dans lesquelles il arrive.
- Le nombre de liens morts est très importants(environ 5% ), là je ne t'apprends rien.
- Par contre quelle est la réaction des gens devant un lien mort? Eh bien ils l'enlèvent, tout simplement, même si il s'agit d'une source. La plupart ne connaissent pas internet archive et encore moins savent ce que l'on peut en faire. Ce n'est pas parce qu'il existe un gadget qui ajoute une fonction obscure que cela va changer grand chose.
- Vu que les gens ne savent que faire, et que le nombre de liens à corriger est énorme et pratiquement impossible à robotiser, il faut leur donner un cache qui rends les liens valides.
- Il y a une autre éventualité à laquelle je viens de penser. On peut demander à un robot de poser le modèle {{lien brisé}} à côté de chaque lien mort. Ce modèle renvoie à un mode d'emploi. On peut ajouter au mode d'emploi la possibilité d'ajouter le js cache au monobook, voir la page en cache par wikiwix, et corriger le lien en liant à wikiwix. Par contre il faut avoir bonne foi en la main d'œuvre qui va s'atteler aux 20'000 liens morts. Amicalement, Dodoïste [réveille-moi] 23 août 2008 à 17:20 (CEST)
- Qu'entends tu par des stats précises sur les temps d'exécution du script Maloq ?
- Quant à ta deuxième question, un outil comme le cache est un outil justement pour les lecteurs de Wikipedia.fr qui eux n'ont pas nécessairement de compte utilisateurs. Il me semble donc important que celui-ci s'affiche par défaut mais que les utilisateurs puissent le désactiver. En effet, le cache permet de rendre accessible les sources qui le tolère, de wikipedia.fr et par là même que les lecteurs puissent vérifier l'information produite sur WP. Je pourrai me renseigner sur le nombre de compte utilisateurs Wikipedia et ainsi avoir un ratio lecteur utilisateurs // non utilisateurs si celà t'intéresse. Pmartin (d) 24 août 2008 à 11:23 (CEST)
- Bon, je suis opposé à son intégration par défaut sans prise de décision (désolé, c'est un peu lourd comme procédure, mais le changement n'est pas mineure). Pour une intégration en gadget, je ne voit pas de probleme, tant qu'on est sur quil n'y a pas de probleme de compatibilité avec les autres.
- Pour les stats, sur un PC moyen ,le chargement d'une grosse page peut occasionner entre 500ms et 1500ms d'éxécution de scripts, ce qui est bcp trop. Il faudrait donc avoir des chiffres sur l'impact au chargement de ce script. Maloq causer 24 août 2008 à 19:22 (CEST)
- Mais, moi aussi je suis opposé à son intégration par défaut sans prise de décision, même si les modifications ne s'effectuent que sur le fichier common.js, elles restent suffisament importantes à mes yeux pour qu'il y ai une consultation de la communauté.
- Le script détecte les liens externes et ajoutent un lien vers le cache, nous avons mis en place une sécurité afin que celui-ci ne s'exécute pas sur les pages contenant plus de 250 liens. Mais je fournirai un benchmark de l'execution du temps des scripts, qui comme tu l'as bien fait remarqué dépende de la machine de l'utilisateur. Pmartin (d) 24 août 2008 à 20:13 (CEST)
Amusant
modifieren testant le cache, j'ai observé que:
- si on place obtenir("BistroDuJour"); avant loadJs("User:Pmartin/cache.js"), ni l'un ni l'autre ne fonctionnent
- les liens vers webcitation.org ne fonctionnent pas (voir les 3 premiers liens externes de John Key)
- Je viens de tester sur mon monobook.js les deux fonctionnent ,
- Oui ca doit venir de la frame du haut , je corrigerai celà demain Pmartin (d) 12 novembre 2008 à 23:56 (CET)
FaQ
modifierIl me semble temps de créer une FaQ, et une page où reporter les bugs. Sur cette page-ci si tu veux, et je veux bien me charger de rédiger tout cela. Je propose d'afficher sur le iframe (c'est bien cela non ?) :
- « Vous pouvez obtenir plus d'informations sur la FAQ et reporter un bug ou nous donner votre avis sur cette page. »
User:Loudon dodd vient de me signaler que cette archive est en erreur 404 alors que l'original fonctionne. Peut-être qu'il était en 404 lors du crawl ? Je note aussi que lorsque l'archive est en 404, il n'y a pas de lien où reporter un bug, alors que c'est principalement dans ce genre de cas qu'il est nécessaire. Bien à toi, Dodoïste [réveille-moi] 13 novembre 2008 à 18:35 (CET)
- Oui Dodoïste, pardon j'avais pas compris ta requête , oui pas de soucis si tu veux la rédiger, pourquoi dans un iframe et pas dans la page directement ? Pmartin (d) 20 novembre 2008 à 19:33 (CET)
- Ah c'était donc un malentendu ^_^
- Pardon, j'ai pas dû m'exprimer clairement. En fait je propose juste de modifier le texte affiché en haut des pages en cache.
- Actuellement, le texte affiché est : « Vous pouvez obtenir plus d'informations et nous donner votre avis sur le cache sur cette page. »
- J'aimerais qu'il soit changé en : « Vous pouvez obtenir plus d'informations sur la foire aux questions et reporter un bug ou nous donner votre avis sur cette page. »
- Ensuite je me propose de rédiger la FAQ sur Utilisateur:Pmartin/Cache et de faire les quelques retouches qui s'imposent sur Discussion_Utilisateur:Pmartin/Cache.
- Cela te convient-il ? Bien à toi, Dodoïste [réveille-moi] 20 novembre 2008 à 19:48 (CET)
Cache vers liens externe
modifierBjr,
Comment purger le cache pour avoir la dernière version du site ? Les MaJ du cache sont effectués a quel rythme ?
Slts
- Bonjour, actuellement aucun système "automatique" n'a été mis afin de gérer les mise à jours du cache. Car celui-ci est prévu pour stoker la version originelle des liens sources de Wikipédia. Crodialement Pmartin (d) 18 novembre 2008 à 11:57 (CET)
- Vous utilisez le principe de cache de Google ou d'Heritrix ? (Si google cache, pour ne plus avoir tjrs la même critique (voir plus bas) sur la vétusté des pages sauvegardées, vous devriez prévoir un mécanisme de mise a jour automatique ou la possibilité de le mettre à jour manuellement.) Olive028 (d) 20 novembre 2008 à 10:02 (CET) Slts.
- la possibilité de le mettre à jour manuellement ==> on y pense mais ce n'est pas aussi évident qu'il n'y parait, si on part du principe que des sites par exemple peuvent être mis en parking http://www.cezac.com/ ou bien que le contenu ne correspondent plus du tout à la source qui avait été linké. J'écarte par la même toute mise à jours automatique, mais plutôt un outil manuel, que nous disposons en interne. Après je ne pense pas que la communauté puisse gérer ce travail de mise à jours. Je réfléchis mais tant que je n'ai pas The solution ... Pmartin (d) 20 novembre 2008 à 17:24 (CET)
- Non en effet, mettre à jour manuellement les je-ne-sais-combien de millions de liens externes que nous avons me paraît inconcevable. Autant revenir à un système de détection manuel des liens morts. Et pour la fiabilité des sources, il est essentiel d'avoir la version originale, et volontairement celle qui date.
- Je ne comprends pas le souci du webmaster ci-dessous, il me semble être complètement infondé. Personne ne va regarder la version archivée d'une page web si la version courante est disponible. En refusant l'archivage, il risque uniquement de perdre des lecteurs : à chaque fois que son site sera en erreur (404 par exemple), les lecteurs ne pourront pas accéder à son site. Donc refuser l'archivage me semble desservir les intérêts de ce webmaster.
- la possibilité de le mettre à jour manuellement ==> on y pense mais ce n'est pas aussi évident qu'il n'y parait, si on part du principe que des sites par exemple peuvent être mis en parking http://www.cezac.com/ ou bien que le contenu ne correspondent plus du tout à la source qui avait été linké. J'écarte par la même toute mise à jours automatique, mais plutôt un outil manuel, que nous disposons en interne. Après je ne pense pas que la communauté puisse gérer ce travail de mise à jours. Je réfléchis mais tant que je n'ai pas The solution ... Pmartin (d) 20 novembre 2008 à 17:24 (CET)
- Vous utilisez le principe de cache de Google ou d'Heritrix ? (Si google cache, pour ne plus avoir tjrs la même critique (voir plus bas) sur la vétusté des pages sauvegardées, vous devriez prévoir un mécanisme de mise a jour automatique ou la possibilité de le mettre à jour manuellement.) Olive028 (d) 20 novembre 2008 à 10:02 (CET) Slts.
- @Pmartin : Tu veux vraiment pas me répondre au sujet de la FAQ ? Juste un oui ou un non que je sois fixé. Sache que cela permettrait de renseigner les lecteurs et d'éviter que tous posent la même question, ou ne comprennent pas bien le but et les intérêts du fonctionnement actuel de l'archive. À long terme, une telle attitude ne peut que nous desservir. Bien à toi, Dodoïste [réveille-moi] 20 novembre 2008 à 17:47 (CET)
- Je comprends l'utilité du cache mais je vais prendre un cas précis. Sur l'article Gabriel Viardot le lien externe est mis en cache et c'est parfait sauf que depuis il y a un copyright sur l'image du site mais pas sur l'image du cache wikipedia. Une MàJ manuelle m'aurais permis de recharger le cache avec la bonne image. La seule solution est de supprimer le lien et de le replacer plus tard. Olive028 (d) 22 novembre 2008 à 16:51 (CET)
- Encore un fois, tous les liens de Gabriel Viardot sont valides. Si on veut la bonne version de l'image il suffit d'aller faire un tour sur le site.
- Ensuite, je serais favorable moi aussi à un système d'archivage doté de plusieurs versions. Par contre je suis contre la mise à jour de la page. Une archive est une archive, pas un cache. Or la prise de décision a aboutit au choix d'une archive (voir les discussions). Bien à toi, Dodoïste [réveille-moi] 22 novembre 2008 à 17:16 (CET)
- C'est un dialogue de "sourd" ce n'est pas un pb de lien ou de mise en cache ou d'utilité du cache, mais un pb de mise a jour de contenu du cache. Il faut implémenter une mise a jour du cache. En votre qualité de lecteur d'un article sur wikipeia vous lisez la dernière version de l'article mais certainement pas la première version de l'article qui date de 2004. En quoi cela vous gêne t'il de mettre a jour le cache avec le dernier contenu du site pointé ? Olive028 (d) 23 novembre 2008 à 15:50 (CET)
- Si une mise à jour automatique du cache pourrait avoir des avantages, ne pense-tu pas qu'elle pourrait également avoir des désavantages ? Si un site peut s'améliorer, il peut aussi décider d'enlever la partie qui sert de source à l'article qui l'utilise. C'est pourquoi le cache n'est pas mis à jour par défaut. La date du cache est la date où le lien a été inséré dans Wikipédia : ainsi on est sûr que la source remplit son rôle premier. Amicalement, Dodoïste [réveille-moi] 23 novembre 2008 à 18:43 (CET)
- Voir plus bas
- Si une mise à jour automatique du cache pourrait avoir des avantages, ne pense-tu pas qu'elle pourrait également avoir des désavantages ? Si un site peut s'améliorer, il peut aussi décider d'enlever la partie qui sert de source à l'article qui l'utilise. C'est pourquoi le cache n'est pas mis à jour par défaut. La date du cache est la date où le lien a été inséré dans Wikipédia : ainsi on est sûr que la source remplit son rôle premier. Amicalement, Dodoïste [réveille-moi] 23 novembre 2008 à 18:43 (CET)
- C'est un dialogue de "sourd" ce n'est pas un pb de lien ou de mise en cache ou d'utilité du cache, mais un pb de mise a jour de contenu du cache. Il faut implémenter une mise a jour du cache. En votre qualité de lecteur d'un article sur wikipeia vous lisez la dernière version de l'article mais certainement pas la première version de l'article qui date de 2004. En quoi cela vous gêne t'il de mettre a jour le cache avec le dernier contenu du site pointé ? Olive028 (d) 23 novembre 2008 à 15:50 (CET)
- Olive028, il ne faut surtout pas que le cache soit vu comme un système de contrainte pour la communauté. Il est parfaitement possible de mener un projet cache sans que qui ce soit se sentent léser. Il est parfaitement légitime que le cache puisse se mettre à jours en fonction de vos souhaits. C'est le but de passer par nous, car nous sommes disponibles pour pouvoir améliorer celui-ci. Il est tout à fait envisageable que la communauté puisse avoir des actions de type administrations sur cette outil , qui pourrait être forcé les mises à jours, régler certains sites en mise à jours automatique, ... C'est pour cela qu'il serait intéressant de monter un projet "Archive liens externes" afin de mettre en centraliser un peu toutes les demandes, et qui du même coup pourrait contenir la FAQ que rédige Dodoïste.Pmartin (d) 22 novembre 2008 à 19:29 (CET)
- le cache n'ai pas une contrainte et je suis d'accord avec vous (Archive liens externes), mais qui s'en charge et sur quelle page ? Olive028 (d) 23 novembre 2008 à 15:50 (CET)
- Je suis d'accord moi aussi pour mettre en place un tel système. Il faut de toute façon une page pour reporter certains bugs, c'est l'occasion de faire d'une pierre deux coups.
- Je pense que sa meilleure place serait : Wikipédia:Archive des liens externes (FAQ, discussions générales, reports de bugs) et Wikipédia:Demande de mise à jour d'une archive (un requête à ajouter aux 9 requêtes aux administrateurs existantes). Est-ce bien comme cela que vous le voyez aussi ? Bien à vous, Dodoïste [réveille-moi] 23 novembre 2008 à 18:43 (CET)
- Ok, comme vous le signalez une mise a jour auto pose des pbs, mais une MàJ par un admin pose un peu le même pb dans la mesure ou un "admin bêta" en charge de la MàJ peut très bien ne pas avoir les connaissances nécessaires pour évaluer la pertinence de la MàJ du contenu. Mais ajouter une 10 requête sécurise le processus, je ne sais plus quoi penser. La nuit porte conseil...Olive028 (d) 23 novembre 2008 à 22:39 (CET)
- C'est bien ce que je dis il va falloir se creuser la tête pour trouver une bonne formule. Dodoiste ca ne serait pas mieux un projet ?? Pmartin (d) 23 novembre 2008 à 23:02 (CET)
- Pourquoi veux-tu un projet ? Pour qu'il y ait une demande aux admins il faut une page à cet effet. Par souci d'organisation et de participation de la part des admins il vaudrait mieux qu'elle soit identique aux autres requêtes aux admins : n'étant pas admin, je ne pourrai accéder aux requêtes en question. Un projet ne suscite pas souvent une énorme participation de contributeurs...
- Il me semble que concernant le cache lui-même (et la FAQ qui va avec), il ne s'agit plus d'un projet, suite à notre PDD et son application. Donc je pense que l'espace Wikipédia est maintenant approprié. Amicalement, Dodoïste [réveille-moi] 24 novembre 2008 à 02:13 (CET)
- J'émettais juste une hypothèse afin de ne pas écarter un espace d'emblée une solution. Si tu estimes que c'est la meilleure solution est de gérer cela dans l'espace wikipedia, je n'y vois aucun soucis. Pmartin (d) 24 novembre 2008 à 09:15 (CET)
- C'est bien ce que je dis il va falloir se creuser la tête pour trouver une bonne formule. Dodoiste ca ne serait pas mieux un projet ?? Pmartin (d) 23 novembre 2008 à 23:02 (CET)
- Une solution intermédiaire serait un outil en javascript; seul un utilisateur inscrit et vérifié pouvant l'installer et l'utiliser; Il faut laisser la possibilité aux contributeurs de modifier une archive les seuls a avoir les "compétences nécéssaires" sur un l'article. Olive028 (d) 25 novembre 2008 à 14:58 (CET)
- Oui j'y ai pensé mais comment déterminer les seuls a avoir les "compétences nécéssaires" sur un l'article d'un autre coté je ne sais pas si en terme de sécurité c'est possible de passer par un javascript, car cela voudrait dire que les paramètres du type nom d'utilisateur serait facilement falsifiable. Pmartin (d) 25 novembre 2008 à 16:12 (CET)
- Ok, comme vous le signalez une mise a jour auto pose des pbs, mais une MàJ par un admin pose un peu le même pb dans la mesure ou un "admin bêta" en charge de la MàJ peut très bien ne pas avoir les connaissances nécessaires pour évaluer la pertinence de la MàJ du contenu. Mais ajouter une 10 requête sécurise le processus, je ne sais plus quoi penser. La nuit porte conseil...Olive028 (d) 23 novembre 2008 à 22:39 (CET)
- le cache n'ai pas une contrainte et je suis d'accord avec vous (Archive liens externes), mais qui s'en charge et sur quelle page ? Olive028 (d) 23 novembre 2008 à 15:50 (CET)
Javascript et compétences
modifier- "les compétences nécéssaires" : Aucune c'est le principe même de WP, quand vous modifiez un article vous ne demmandez d'autorisation à personne et un reverse est tjrs possible. Dans votre base vous devez prévoir un historique.
- "Sécurité Javascript" : Le liveRC marche comment pour révoquer une modif par exemple ? Dansl'historique de la page le pseudo apparaît; Il y a bien interaction entre Java et la session d'identification du compte en php.
Slts Olive028 (d) 25 novembre 2008 à 18:41 (CET)
- Le liveRC peut récupérer la session car tous les deux sont sur le même serveur. Il n'est pas possible pour nous de récupérer une session sur Wikiwix qui a été initialisé sur le site de Wikipedia. Par contre on peut monter cette interface d'administration au sein de Wikipedia, comme cela le problème est résolu. Pmartin (d) 26 novembre 2008 à 11:01 (CET)
- D'accord, mais votre conclusion ? Vous êtes partant pour le faire ou vous avez encore des "réticences" ? Olive028 (d) 26 novembre 2008 à 16:51 (CET)
- Non je n'ai aucune réticence à créer une interface d'admin pour la communauté. Le tout c'est que nous trouvions un peu de temps pour le faire. Cordialement Pmartin (d) 30 novembre 2008 à 13:48 (CET)
- D'accord, mais votre conclusion ? Vous êtes partant pour le faire ou vous avez encore des "réticences" ? Olive028 (d) 26 novembre 2008 à 16:51 (CET)
Help je veux supprimer cet ignoble cache
modifierBonjour, je voudrais vraiment supprimer cet ignoble cache qui aboutit à une très vieille version toute pourrie de la page d'accueil de mon site, mais comment faire ? merci de me l'expliquer en langage normal, pas en jargonaute technico-informatique à deux balles.Mais qui donc a eu l'idée de mettre en place un truc pareil ????
- Bonjour, voilà qui devrait répondre à vos attentes http://searchengineland.com/meta-robots-tag-101-blocking-spiders-cached-pages-more-10665.php Cordialement Pmartin (d) 18 novembre 2008 à 13:22 (CET)
- Bonjour,
- pour ne plus voir "l'ignoble cache", il faut ajouter "no_external_cache = true;" dans un fichier javascript en sous-page de votre page utilisateur (oui, il faudra créer un compte pour cela)
- pour la "vieille version toute pourrie", j'ai corrigé quelques problèmes d'affichage (notamment du aux commentaires html dans la balise style) et j'en ai profité pour mettre à jour le cache de la page (cf http://wikiwix.com/cache/?url=http://www.shellerophile.fr/ )
- la décision de mise en place du cache a été communautaire et est passée par un processus appelé "prise de décision", processus auquel tout contributeur de Wikipédia peut participer.
- En ésperant avoir répondu à vos questions sans avoir été trop obscur :) Guillaumito (d) 18 novembre 2008 à 15:55 (CET)
- La question ne portait pas sur la suppression des liens « archives » dans l'interface wikipédia, mais sur la suppression de la mise en cache d'un site par wikiwix.
- Si une FAQ est mise en place, elle devrait d'ailleurs donner les éléments de base de réponse (fichier robots.txt, meta robots), et renvoyer pour plus d'informations sur robotstxt.org qui est ce qui se rapproche le plus d'une référence normative dans ce domaine.
- a ce propos: quel est le useragent de wikiwix ? --Lgd (d) 24 novembre 2008 à 05:20 (CET)
O.o Coment as-tu réussi à faire cette modif ? La page est censée être réservée aux admins, par sécurité... On en parle sur le BA. Amicalement, Dodoïste [réveille-moi] 24 novembre 2008 à 02:25 (CET) ~
- Je viens de répondre Pmartin (d) 24 novembre 2008 à 09:50 (CET)
Moment de la sauvergade
modifierBonjour,
J'aimerais savoir à quel moment la sauvergarde en cache se fait? Régulièrement? Au moment de l'insertion du lien? À la suite d'une modification de l'article? Merci. --Riba-- (d) 29 décembre 2008 à 22:09 (CET)
- Lors de la première insertion du lien. Et elle n'est pas mise à jour. Amicalement, Dodoïste [réveille-moi] 29 décembre 2008 à 22:18 (CET)
- Merci. --Riba-- (d) 29 décembre 2008 à 23:03 (CET)
cache
modifierJe cherche à visualiser une page et les photos n'apparaissent pas. Comme visualiser les images sur une page avec fonction cache? Merci de me répondre si quelqu'un sait.
- Hello. Peux-tu préciser la page dont il est question ? Amicalement, Dodoïste [ dring-dring ] 20 février 2009 à 00:57 (CET)
Une Archive qui n'a pas marché
modifierSur la page http://fr.wiki.x.io/wiki/Jean-Marie_D%C3%A9guignet il a été ajouté le lien vers http://grandterrier.net/wiki/index.php?title=Carnets_d%27Anatole_Le_Braz_%26_Ergu%C3%A9-Gab%C3%A9ric
Le résultat est un lien Archive tronqué (sans doute à cause du & en %26) : http://grandterrier.net/wiki/index.php?title=Carnets_/'Anatole_Le_Braz
J'ai bien tenté une redirection sur le site distant en question, mais comme les archives sur wikiwix ne sont pas modifiées ...
Cordialement, Jcognard (d) 30 juin 2009 à 09:27 (CEST)
- c'est corrigé merci. Pmartin (d) 2 juillet 2009 à 11:29 (CEST)
La référence 19 sur l'effet placebo dans l'article homéopathie possède une lien archive dont la page cible ne comporte aucune information pertinente. Il faudrait peut être supprimer cette référence faute de pouvoir l'évaluer. Cordialement Pr Helianthus(d)23 août 2019 à 22:55 (CEST)
Cache trop récent (page non accessible)
modifierBonjour,
Sur l'article de l'émission littéraire D@ns le texte, un lien a été ajouté le 19 mars 2009 vers un contenu du site d'arrêt sur images (une référence sur http://www.arretsurimages.net/contenu.php?id=1746 page créée le 10 mars)
Certains contenus de ce site sont disponibles gratuitement, et celui-ci l'a sûrement été puisqu'il a été mis en lien sur Wikipedia, mais le cache de cette page a été mis à jour aujourd'hui, date à laquelle la page n'est plus accessible que pour les abonnés du site.
J'aurais bien aimé (et je pensais que c'était l'utilité du cache mais je me trompe peut-être) que la page gardée en archive soit celle que pouvait voir Speculos le 19 mars en rajoutant ce lien.
Merci, Yuga (d) 8 juillet 2009 à 23:60 (CEST)
- C'est délicat. Il arrive régulièrement qu'une personne désire retirer du net des informations personnelles. Dans ce cas, elle dispose de plusieurs méthodes pour demander aux moteurs de recherche et aux archives Web d'ignorer son site (en ne l'indexant pas), et donc de la faire "disparaître" de la toile. Voir la documentation en anglais sur searchengineland.com : Meta Robots Tag 101: Blocking Spiders, Cached Pages & More. Ce qu'il faut comprendre, c'est que copier et diffuser un document sous copyright n'est pas légal. Sur le net, tant que l'archivage respecte la volonté de l'auteur du site, soit la diffusion de l'information, cela ne pose pas de problème. Mais si l'auteur d'un site a décidé de rendre son site payant, alors l'archive se doit de respecter ce souhait. Du moins c'est là mon avis. Bonne continuation ! Dodoïste [ dring-dring ] 9 juillet 2009 à 01:40 (CEST)
Cache vers page BNF
modifierBonjour,
J'ai mis un lien vers la notice autorité d'un auteur sur le catalogue de la BNF (cf. Antoine Caillot), à partir de l'adresse permanente de la notice, mais le lien "cache" renvoie vers une page de recherche vide. Y a-t-il quelque chose à faire ? Cordialement, Acélan (d) 12 juillet 2009 à 10:52 (CEST)
- Quand j'essaie d'ouvrir la page en question (Antoine Caillot sur le catalogue BNF), j'obtiens une page vide un peu semblable à celle du cache (archive). Le site m'indique également : « Un incident technique (14) est survenu pendant votre navigation. Veuillez renouveler votre demande. » Je ne suis pas sûr que le cache soit en cause ici ? Amicalement, Dodoïste [ dring-dring ] 13 juillet 2009 à 04:06 (CEST)
- Ce matin, ça fonctionne normalement. Il faut dire que le serveur de la BNF est coutumier des "incidents techniques". Toujours est-il qu'il y a des moments où le lien direct fonctionne correctement, mais le cache ne fonctionne jamais pour cette page. Amicalement, Acélan (d) 13 juillet 2009 à 09:42 (CEST)
- Wikiwix, comme toute archive web, met une page en cache à un moment donné. Donc au moment de la mise en cache, le lien ne fonctionnait pas. Il faut demander à Pmartin d'actualiser le cache au bon moment, si il lit cette discussion il le fera probablement. :-) Dodoïste [ dring-dring ] 13 juillet 2009 à 14:03 (CEST)
- Le cache pour cette page a été mise à jours. Pmartin (d) 13 juillet 2009 à 14:08 (CEST)
- Merci à tous les deux. Cordialement, --Acélan (d) 13 juillet 2009 à 14:59 (CEST)
- Le cache pour cette page a été mise à jours. Pmartin (d) 13 juillet 2009 à 14:08 (CEST)
- Wikiwix, comme toute archive web, met une page en cache à un moment donné. Donc au moment de la mise en cache, le lien ne fonctionnait pas. Il faut demander à Pmartin d'actualiser le cache au bon moment, si il lit cette discussion il le fera probablement. :-) Dodoïste [ dring-dring ] 13 juillet 2009 à 14:03 (CEST)
- Ce matin, ça fonctionne normalement. Il faut dire que le serveur de la BNF est coutumier des "incidents techniques". Toujours est-il qu'il y a des moments où le lien direct fonctionne correctement, mais le cache ne fonctionne jamais pour cette page. Amicalement, Acélan (d) 13 juillet 2009 à 09:42 (CEST)
Archivage Page Youtube & page books.google.fr
modifierSur l'article René-Louis Baron que je documente, les archives wikipédia fonctionnent très bien avec les pages web contenant du texte et des images.
Exemple : http://wikiwix.com/cache/?url=http://www.realcomposer.com/Medal%20-%20RevuePresse2.htm
Cependant, quand il s'agit d'une page « précise » sur Youtube, le robot mémorise bizarrement la page d'accueil de Youtube et affiche un bandeau rose : « L'URL contient un ID vidéo incorrect » ?
Exemple : http://wikiwix.com/cache/?url=http://www.youtube.com/watch?v=PuST5RWalhY
au lieu de : http://www.youtube.com/watch?v=PuST5RWalhY
Je comprends qu'il serait délicat de mémoriser des vidéos, le robot ne pouvant certainement pas encore savoir s'il s'agit d'une oeuvre libre de droit ou non. Ne pensez-vous pas qu'il serait peut-être intéressant de pouvoir d'ors et déjà, mémoriser la page exacte sans la vidéo c.a.d. avec le titre, la desciption de l'oeuvre (« plus d'info » en haut à droite) et les commentaires inscrits ??? Etant wikiphile débutante , je ne peux malheureusement pas vous aider. Cordialement. --JCAILLAT (d) 24 août 2009 à 22:37 (CEST)
- non il s'agit tout simplement d'un bug que nous allons corriger dans la journée.Pmartin (d) 25 août 2009 à 08:51 (CEST)
- C'est corrigé Pmartin (d) 26 août 2009 à 08:27 (CEST)
- Super : Merci pour les wikipédiens !--JCAILLAT (d) 5 octobre 2009 à 13:57 (CEST)
- Mais de rien Pmartin (d) 7 octobre 2009 à 11:21 (CEST)
- Super : Merci pour les wikipédiens !--JCAILLAT (d) 5 octobre 2009 à 13:57 (CEST)
- C'est corrigé Pmartin (d) 26 août 2009 à 08:27 (CEST)
- Bonjour Pmartin
Je reviens vers vous pour éclaircir ma faible lanterne. Dans l'article René-Louis Baron j'avais un lien vers un ouvrage de Gabriel Cousin qui fonctionnait très bien (ci-dessous j'enlève les balises 'ref' sinon rien ne s'affiche mais vous pouvez vérifier le lien de la référence n°3 (lire en ligne) de l'article sur Gabriel Cousin :
« Gabriel Cousin, dramaturge et poète contemporain, Université de Saint-Étienne, 1983, (ISBN 978-2901559030) p. 140, [?id=85zXRyFIiLEC&pg=PA140&dq=gabriel+cousin+ren%E9+baron+carcassone#v=onepage&q=&f=false lire en ligne (page consultée le 19 août 2009)]. »
Je ne sais pas par quelle manipulation extérieure (robotique ou non), il était devenu corrompu suite à un changement de code devenu :
« Gabriel Cousin, dramaturge et poète contemporain, Université de Saint-Étienne, 1983, (ISBN 978-2901559030) p. 140, [lire en ligne (page consultée le 19 août 2009)]. »
Ci-dessus, j'ai mis en gras le changement de code que j'ai trouvé : Plus de point d'interrogation derrière « ... books.google.fr/books »...
Je viens de m'en apercevoir en créant l'article Gabiel Cousin où j'utilise ce même lien. Je vous écris aussi parceque la page du lien en question n'est plus en mémoire (quand on clique sur archive). Je vous demande de m'excuser pour tant de dérangement. Cordialement.--JCAILLAT (d) 17 octobre 2009 à 15:19 (CEST)
- Il semble en effet y avoir un problème avec la mise en archive de ce lien, mais dans tous les cas nous prenons maintenant en compte le tag meta noarchive (qui permet à un site d'interdire l'archivage de ses pages) et Google Books utilise ce tag, nous ne pouvons donc pas la mettre en cache. Guillaumito (d) 22 octobre 2009 à 09:23 (CEST)
Bonjour, Le cache n'a pas fonctionné correctement sur le résultat de calcul statistique de l'Index Translationum. Il me semble que la séparation des arguments d'URL n'a pas fonctionné correctement.
L'URL correcte est http://databases.unesco.org/xtrans/stat/xTransStat.a?VL1=A&top=50&lg=1
Le cache va chercher http://databases.unesco.org/xtrans/stat/xTransStat.a?VL1=A%26top=50%26lg=1
Je n'ai peut être pas tout compris...
Merci - Rouletabille (d) 7 novembre 2009 à 22:18 (CET)
Affichage de pages différentes
modifierR. Zaharia (http://fr.wiki.x.io/wiki/Utilisateur:Zaharia) 30/01/2010 J'ignore si cela a déjà été documenté sur cette page: dans l'article sur André Gorz la note 12 renvoie a un article du Journal Le Monde (cet article n'est bien sur plus disponible gratuitement). La page en cache ne montre pas davantage l'article en question, mais donne la procédure (et le tarif) pour se le procurer... Il se trouve qu'étant abonné au Monde... je peux accéder a cet article (je pourrais même vous le communiquer). J'ignore evidemment s'il serait possible /légal de remplacer l'actuel contenu en cache par le veritable contenu relatif a André Gorz ...
Bonjour. Tout petit problème : Sur la référence n°1 de l'article Gabriel Cousin le lien ci-dessous fonctionne (bon affichage de la biographie de l'auteur) cependant, l'archive (bouton adjacent) affiche autre chose ? Comment peut-on corriger celà ? Est-ce encore le résultat du fameux « tag meta noarchive » inscrit sur certains sites ? Biographie de Gabriel Cousin Cordialement. --JCAILLAT (d) 10 novembre 2009 à 16:36 (CET)
- Bonjour, le problème dans ce cas vient de l'url dans l'url :)
- D'un coté notre code le gérait mal et je viens de le corriger
- D'un autre coté, le javascript de Wikipédia gérant l'affichage des liens le gère mal aussi, il affiche ce lien (qui ne fonctionne pas) au lieu de celui ci (qui fonctionne). Je vais donc essayer de trouver quelqu'un pour installer une version corrigée du javascript. Guillaumito (d) 16 novembre 2009 à 10:22 (CET)
- Suite et fin : la modification du javascript vient d'être effectuée par un administrateur du wiki et le lien est maintenant correct. Il peut s'avérer nécessaire de vider le cache de son navigateur pour que la modification soit prise en compte. Guillaumito (d) 16 novembre 2009 à 10:59 (CET)
- Bonjour et merci beaucoup pour votre aide. Cordialement. --JCaillat > M'écrire 14 décembre 2009 à 15:03 (CET)
Interrogations importantes
modifierBonjour
Je n'ai jamais trouvé d'utilité au cache wikiwix. Il y a t-il vraiment une mise en cache ? Si oui de quel pourcentage de pages ? J'ai lancé une discussion sur Wikipédia:Le Bistro/13 janvier 2010#Cache cache. --Manu1400 (d) 13 janvier 2010 à 20:21 (CET)
- As-tu regardé Wikipédia:Prise de décision/Système de cache et Projet:Correction des liens externes ? Dodoïste [ dring-dring ] 13 janvier 2010 à 20:29 (CET)
- Oui j'ai vu ces deux pages. Le chiffre actuel de 15% de liens morts me semble erroné, voir vraiment loin de la réalité. --Manu1400 (d) 14 janvier 2010 à 19:06 (CET)
- Ça fait environ 2 liens morts sur 13. Cela correspond à ce que j'ai observé sur le terrain. Au début aussi, je croyais que c'était beaucoup. Puis je me suis rendu compte que je ne regardais pas souvent les longues listes de liens en références. Et en fouillant parmi ceux-ci, j'arrivais souvent à un ratio proche de 15% de liens morts.
- Il ne faut pas oublier non plus que, sur chacun des 36 000 articles des communes de France, il y a un lien mort. Et vu l'énorme travail que les robots abattaient auparavant, je ne suis pas surpris de l'ampleur de l'affaire. Dodoïste [ dring-dring ] 14 janvier 2010 à 20:44 (CET)
- Ok, as tu déjà vu le nombre total de liens rouges, il est pas mal non plus... Tant qu'on reste dans les stats, as tu le pourcentage de liens morts dans les autres wikipédias ? et dans certains sites importants ? --Manu1400 (d) 14 janvier 2010 à 22:35 (CET)
- Je n'ai pas vu l'ombre d'une trace de ce genre de stats. Peut-être que des gros moteurs de recherche pourraient donner des stats à ce sujet, ou Internet Archive, par exemple. Mais ça doit être difficile d'avoir des stats fiables à ce sujet. Dodoïste [ dring-dring ] 15 janvier 2010 à 01:22 (CET)
- Ok, as tu déjà vu le nombre total de liens rouges, il est pas mal non plus... Tant qu'on reste dans les stats, as tu le pourcentage de liens morts dans les autres wikipédias ? et dans certains sites importants ? --Manu1400 (d) 14 janvier 2010 à 22:35 (CET)
- Oui j'ai vu ces deux pages. Le chiffre actuel de 15% de liens morts me semble erroné, voir vraiment loin de la réalité. --Manu1400 (d) 14 janvier 2010 à 19:06 (CET)
- C'est dommage que le cache n'accepte pas les "&" dans les URL, revoir Wikipédia:Le Bistro/13 janvier 2010#Cache cache. --Manu1400 (d) 14 janvier 2010 à 19:21 (CET)
- Nous regarderons le problème concernant les & la semaine prochaine. Si tu as un exemple je suis preneur. Pmartin (d) 14 janvier 2010 à 19:50 (CET)
- voici l'exemple, il est issu du bistro. --Manu1400 (d) 14 janvier 2010 à 22:35 (CET)
- Je vois pas le problème Dodoïste Pmartin (d) 18 janvier 2010 à 21:34 (CET)
- Je pense que Manu1400 parle d'un léger changement de l'URL, entre l'URL originale, et celle utilisée par Wikiwix. L'URL de base est http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087&CommuneId=67394 et celle utilisée par wikiwix est http://wikiwix.com/cache/?url=http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=67394 : le « & » devient « %26 ». Quand à savoir si c'est vraiment un problème, je ne sais pas. Apparemment, « %26 » est le code pour « & » en format url. Si je demande à MediaWiki, et que j'écris « {{urlencode:&}} », j'obtiens « %26 ». À priori, tout baigne. Avons-nous besoin que l'URL soit identique ? Dodoïste [ dring-dring ] 19 janvier 2010 à 23:45 (CET)
- Je vois pas le problème Dodoïste Pmartin (d) 18 janvier 2010 à 21:34 (CET)
- voici l'exemple, il est issu du bistro. --Manu1400 (d) 14 janvier 2010 à 22:35 (CET)
- Nous regarderons le problème concernant les & la semaine prochaine. Si tu as un exemple je suis preneur. Pmartin (d) 14 janvier 2010 à 19:50 (CET)
- Pour moi il y avait environ 6% de lien morts. Cordialement Pmartin (d) 15 janvier 2010 à 14:14 (CET)
- J'ai vu une situation assez gênante. Dans une page, on indique mon site comme la source d'une information et c'est mis en cache, mais dans les liens externes, on donne un lien vers un autre site (quelqu'un dont le travail est en général de mauvaise qualité et en partie copié du mien), mais pas le lien vers ma page qui est la source originale. D'ailleurs, je note qu'on n'a pas demandé l'avis à ceux dont les pages sont ainsi pillées (appelons les choses par leur nom) mais à ceux qui pillent les pages (même si c'est légal quand on rephrase, ce que ne fait pas le cache).
- Je comprends pas la question. Pmartin (d) 18 janvier 2010 à 21:43 (CET)
- Soit une page web X sur un site. Page avec de la pub et qu'on pille (parce que votre histoire de cache, c'est du pillage et rien d'autre). Cette page est indiquée comme la source d'une information wikipedia. Cette page est citée comme source de l'information, mais au lieu d'un lien vers cette page au bas de l'article, on trouve des liens vers d'autres sites.
- De toutes façons, c'est écrit au bas de la présente page "Ne copiez pas de texte, ni d'une page web, ni d'un autre support : respectez le droit d'auteur" alors que le cache, c'est exactement cela. Soyons logique. Si la page est déplacée, c'est souvent parce que ce n'était pas la source de l'information. Placer en cache, c'est donc rendre crédible une information qui n'a aucune valeur. C'est démontrer que wikipedia est mauvais. Mettez vos efforts ailleurs que dans ce cache.
- Pour terminer, il faudrait indiquer le nom du moteur à ajouter au robots.txt si on veut interdire le plagiat par wikipedia. no-cache, c'est demander à google de ne pas indexer un site (ce qu'on veut souvent éviter), et c'est très différent d'interdire à wiki de plagier notre travail. Un lien à la limite, mais pas de cache ou du moins une façon simple et directe d'interdire la mise en cache par wiki.
- Bonjour, vous faîtes au moins deux amalgames le premier étant que le système de cache qui est proposé n'est nullement attaché à Wikipedia, il est développé par ma société Linterweb, le deuxième il ne s'agit pas de positionner le paramètre no-cache mais plutôt le no-archive avec le robot wikiwix-bot. Concernant vos propos sur le soit disant pillage, je vous invite à prendre contact avec mon cabinet d'avocat qui vous répondra sur la légalité de cet outil. Cordialement Pmartin (d) 19 janvier 2010 à 08:02 (CET)
- Que le robot soit dans wikipedia ou ailleurs, cela ne change rien. Vous ne faites que détourner la conversation pour éviter le vrai problème, soit comment bloquer votre cache sans affecter les autres moteurs. Bon, je vais tout bonnement interdire à wikiwix-bot d'indexer quoique ce soit dans mon site et l'affaire sera terminée (et vous devriez indiquer plus précisément cette information). Quant à votre avocat, il doit sans doute utiliser l'espace "sans loi" qu'est Internet pour beaucoup. Que pense-t-il de sites comme 123people.com ou webmii.fr qui créent artificiellement des millions de pages en pillant d'autres sites via Yahoo API et qui ainsi devancent dans les moteurs de recherche les sites qu'ils ont pillés ?
- Bonjour, vous faîtes au moins deux amalgames le premier étant que le système de cache qui est proposé n'est nullement attaché à Wikipedia, il est développé par ma société Linterweb, le deuxième il ne s'agit pas de positionner le paramètre no-cache mais plutôt le no-archive avec le robot wikiwix-bot. Concernant vos propos sur le soit disant pillage, je vous invite à prendre contact avec mon cabinet d'avocat qui vous répondra sur la légalité de cet outil. Cordialement Pmartin (d) 19 janvier 2010 à 08:02 (CET)
- Je comprends pas la question. Pmartin (d) 18 janvier 2010 à 21:43 (CET)
- J'ai vu une situation assez gênante. Dans une page, on indique mon site comme la source d'une information et c'est mis en cache, mais dans les liens externes, on donne un lien vers un autre site (quelqu'un dont le travail est en général de mauvaise qualité et en partie copié du mien), mais pas le lien vers ma page qui est la source originale. D'ailleurs, je note qu'on n'a pas demandé l'avis à ceux dont les pages sont ainsi pillées (appelons les choses par leur nom) mais à ceux qui pillent les pages (même si c'est légal quand on rephrase, ce que ne fait pas le cache).
- Pour moi il y avait environ 6% de lien morts. Cordialement Pmartin (d) 15 janvier 2010 à 14:14 (CET)
- Pour les caractères "&" dans les URL, où es ce que c'est précisé qu'il faut les transformer pour que le lien vers le cache fonctionne ? J'ai une idée au sujet du cache : Il pourrait retourner des pages archivées uniquement quand elles seraient plus disponible. --Manu1400 (d) 20 janvier 2010 à 13:18 (CET)
- Mais... grrrrr ! Donne plus de détails, répéter la même chose ne sert à rien ! Le lien "[archive]" est fonctionnel. Pourquoi as-ton besoin de changer quoique ce soit ?
- Concernant ton idée, c'est plus complexe qu'il n'y paraît. Et là aussi, trop peu de détails font qu'ils y a de nombreuses manières de procéder, et je ne sais pas ce que tu as en tête. Quoiqu'il en soit, le statut des pages — « fonctionnel » ou « lien mort » — est extrêmement variable, et peut changer durant une journée, une heure, ou indéfiniment. Le contenu des pages peut aussi changer du tout au tout, et ne plus comporter les informations qui servaient de source. Une copie statique est donc la solution la plus sûre et pérenne que l'on puisse choisir. Amicalement, Dodoïste [ dring-dring ] 21 janvier 2010 à 02:49 (CET)
- Pour le problème du "&" j'ai du mal à comprendre que le problème soit pas compris, passons pour le moment.
- Oui, c'est bon j'ai compris, le problème venait de la partie javascript qui est en fonctionnement sur le site wikipedia, qui nous renvoyait des mauvaises urls. Mais ce problème a été résolu. Pmartin (d) 25 janvier 2010 à 08:08 (CET)
- Concernant mon idée, il suffirai de tester la présence de la page et si le serveur répond par exemple par une erreur 404, d'afficher la page stockée dans le cache.
- et quid des pages qui ont été modifié, la solution retenue lors de la PDD étaient que les nouveaux liens devait être enregistrés sans tenir compte des mises à jours. Ce qui a été retenue , c'est que si une source est jugé comme telle par un membre de la communauté, c'est au moment de son insertion dans wikipedia. Pmartin (d) 25 janvier 2010 à 08:08 (CET)
- Peux-t-on avoir des statistiques sur le cache ? (Combien de pages contient-t-ils ? par exemple mais aussi "quelles sont les pages du cache les plus demandés ?").
- Aucun soucis, mais il me faut en connaître un peu plus sur ce que vous souhaitez comme stats. --Manu1400 (d) 23 janvier 2010 à 22:08 (CET)
- Pour le problème du "&" j'ai du mal à comprendre que le problème soit pas compris, passons pour le moment.
Pmartin (d) 25 janvier 2010 à 08:08 (CET)
- Ok ! Combien de pages contient le cache ? Quelles sont les pages du cache les plus demandés ? (Ça peut servir pour détecter des liens morts.) --Manu1400 (d) 1 février 2010 à 19:12 (CET)
- Pas de réponse... Serai ce possible que savoir "où en est" le projet de cache ? --Manu1400 (d) 16 juin 2010 à 18:48 (CEST)
- Pardon, nous étions en plein chantier et du coup j'avais oublié ta demande, on est entrain d'installer un awstats ( logiciel de visualisation de log ), cela va permettre de connaître l'activité au niveau du cache. Si tu as d'autres demandes n'hésites pas, on a un peu de disponibilité les semaines à venir. Cordialement Pmartin (d) 17 juin 2010 à 12:00 (CEST)
- OK. Je souhaite si possible avoir les réponses aux questions posées ci-dessus. Merci d'avance. --Manu1400 (d) 18 juin 2010 à 17:49 (CEST)
- Pardon, nous étions en plein chantier et du coup j'avais oublié ta demande, on est entrain d'installer un awstats ( logiciel de visualisation de log ), cela va permettre de connaître l'activité au niveau du cache. Si tu as d'autres demandes n'hésites pas, on a un peu de disponibilité les semaines à venir. Cordialement Pmartin (d) 17 juin 2010 à 12:00 (CEST)
- Pas de réponse... Serai ce possible que savoir "où en est" le projet de cache ? --Manu1400 (d) 16 juin 2010 à 18:48 (CEST)
- Ok ! Combien de pages contient le cache ? Quelles sont les pages du cache les plus demandés ? (Ça peut servir pour détecter des liens morts.) --Manu1400 (d) 1 février 2010 à 19:12 (CET)
Désactiver la mise en cache
modifierJ'ai copié ces lignes dans mon fichier robots.txt, puis demander le rafraîchessement du cache et la page est toujours affichée. Le fichier robots.txt a pourtant été lu, mais la page en question n'a pas été relue (et pour cause, sa lecture par un robot est maintenant interdite). Alors, comment bloquer votre cache ???
Mon fichier robots.txt contient :
User-agent: wikiwix-bot
Disallow: /
- Pourriez vous m'indiquer l'URI (ou le nom d'hôte) dont vous souhaitez désactiver la mise en cache afin que je puisse diagnostiquer le problème ? Guillaumito (d) 25 janvier 2010 à 10:04 (CET)
Barres de défilement
modifierBonjour, est-ce moi ou est-ce que les barres de défilements disparaissent sur la page suivante: http://wikiwix.com/cache/?url=http://msdn.microsoft.com/en-ca/library/aa176565%28SQL.80%29.aspx. Je tenais à le souligner au cas où c'est un problème qui mérite une investigation. Cordialement, --Solitarius (d) 8 février 2010 à 15:27 (CET)
- Problème corrigé, merci de nous avoir prévenu. Guillaumito (d) 9 février 2010 à 17:15 (CET)
display.php
modifierBonjour
Dans Le Crotoy, il y a un lien mort vers un fichier excel. Celui ci est disponible dans le cache mais sous le nom "display.php" donc inutilisable pour les windowsiens (et peut être d'autres utilisateurs). --Manu1400 (d) 15 février 2010 à 19:23 (CET)
- Je viens d'ajouter un entête "Content-Disposition" pour certains types mimes (notamment les fichiers Excel), qui ce qui devrait corriger le problème. Guillaumito (d) 25 février 2010 à 11:16 (CET)
- Cela ne règle pas le problème au sujet des PDF (problème fréquent !). Exemple. Pourquoi ne pas conserver systématiquement l'extension du fichier ? --Manu1400 (d) 30 août 2010 à 18:56 (CEST)
- Pas de réponse ? --Manu1400 (d) 31 août 2010 à 12:00 (CEST)
- Je vois pas où est le problème :( Sur mon firefox j'ai bien le fichier qui s'ouvre dans la page, ou alors je n'ai pas compris. Cordialement Pmartin (d) 31 août 2010 à 14:17 (CEST)
- Tu "n'as pas" le problème car tu as une visualisation PDF dans ton navigateur, ce qui n'est pas le cas de tous. Un fichier au format PDF mais avec l'extension .php PEUT poser divers problèmes, de plus le nom du fichier n'étant pas garder ce qui est dommage (lors d'un enregistrement du fichier, le nom "display.php" est "généralement" utilisé. --Manu1400 (d) 1 septembre 2010 à 21:35 (CEST)
- Je vois pas où est le problème :( Sur mon firefox j'ai bien le fichier qui s'ouvre dans la page, ou alors je n'ai pas compris. Cordialement Pmartin (d) 31 août 2010 à 14:17 (CEST)
[Résolu] Désactiver la mise en cache (reloaded)
modifierbonjour,
J'ai essayé de faire comme le message plus haut et ça ne fonctionne pas. Peut-être que "wikiwix-bot" n'est pas le bon nom de robot ?
La domaine en question est le suivant :
http://blablou.xlphp.net/
le fichier robots :
http://blablou.xlphp.net/robots.txt
Et pourtant la page de cache reprend la 1re page avant la mise en place du contenu donc le fichier robots n'est pas pris en compte :
http://wikiwix.com/cache/?url=http://blablou.xlphp.net/
--Blablou (d) 26 février 2010 à 15:43 (CET)
- C'était en effet un problème avec le nom du robot, j'ai modifié la vérification de notre coté ce qui a résolu le problème : http://wikiwix.com/cache/?url=http://blablou.xlphp.net/ Guillaumito (d) 1 mars 2010 à 10:03 (CET)
-
- À la base, le problème était pour un autre domaine que je ne veux pas citer ici. Le problème est aussi résolu pour cet autre domaine donc cela est très bien. Bon courage pour votre travail sur cet outil. --Blablou (d) 4 mars 2010 à 14:05 (CET)
Pas de cache des images <TABLE BACKGROUND="...">
modifierL'image indiquée par une URL dans l'attribut BACKGROUND du tag TABLE n'est pas archivé. Voici un exemple :
En l'occurrence, l'archivage est particulièrement important car :
- le lien dans la page d'origine n'est valide que temporairement (l'image est probablement extraite d'une base de données, puis supprimée après un délai)
- l'image manquante n'est pas qu'un fond de table : il s'agit d'une information fondamentale de la page ; le créateur de la page semble utiliser cette astuce comme mécanisme anti-copie
- Problème corrigé. Guillaumito (d) 11 mai 2010 à 17:26 (CEST)
Supprimer les protections anti-copie (attributs de <body>)
modifierLa page [1] contient des dispositifs "anti-copie" qu'il serait utile de supprimer lors de l'archivage car ils empêchent l'extraction du texte. Ce dispositif capture par JavaScript les évènements liés à l'activation du menu contextuel ou à la sélection de texte. Ce sont les attributs suivants du tag <BODY> :
oncontextmenu="return false"
onselectstart="return false"
ondragstart="return false"
- Ces attributs sont maintenant retirés des pages Guillaumito (d) 3 mai 2010 à 18:31 (CEST)
stats cache
modifierArticle SoundFonts
modifierBonjour, dans l'article SoudFonts, nous n'avons pas de mise en archive des pages de deux liens externes vers « www.syntfont.com » (Notes et références). Pourriez-vous nous aider s'il vous plait ? --JCaillat > M'écrire 27 juin 2010 à 22:33 (CEST)
mode d'emploi ?
modifierLe système de cache est-il compatible avec les mises à jour des pages de références codées en lien ? A titre d'exemple une des pages de référence liées à un article auquel je contribue est "bloquée" sur son état courant 2009, alors que depuis cette date cette page a été enrichie. L'appel de notes de l'article renvoie systématiquement à l'ancienne version de la page, ce qui est dommage... Comment dois-je faire ? Je ne conteste pas l'utilité de l'outil. Webmestre moi-même, je râle contre les liens brisés irrécupérables -au point de bricoler des copies de sauvegarde. Mais ici le dispositif fige le système de références dans un état passé, et je ne sais comment le court-circuiter... Merci. Cordialement. Adamantane [m'écrire] 12 juillet 2010 à 17:37 (CEST)
- Oui le système ne se met pas à jour automatiquement, car c'était la décision de la communauté cf la PDD. Mais effectivement, nous pouvons tout à fait faire évoluer le système de manière de façon à ce que certains liens soit mis à jours automatiquement. Cordialement Pmartin (d) 15 juillet 2010 à 12:25 (CEST)
- Merci. En fait, la mise à jour automatique serait un plus. La décision de la communauté cf la PDD a certainement son bien-fondé mais elle implique quelques inconvénients qu'il faut bien contourner. En l'absence, et en l'attente, comment faire ? Dans le cas qui m'intéresse, je suis allé faire un "annule et remplace" sur le lien, mais sans résultat. S'il faut que je change l'URL de la cible, quelle complication...Je viens en fait de découvrir l'existence d'une disposition qui, en ce cas spécifique, car rien n'est parfait en ce bas monde :-)) se retourne contre le lecteur. Merci de m'indiquer une procédure, même manuelle, qui puisse servir d'échappatoire. Adamantane [m'écrire] 15 juillet 2010 à 15:05 (CEST)
- Nous avons réfléchi à votre problème, la solution consiste à ajouter un paramètre ("&nosave" ) dans les liens que vous estimez à avoir un rafraichissement régulièrement. Nous traiterons ce paramètre dès le mois de Septembre. Cordialement Pmartin (d) 3 août 2010 à 10:41 (CEST)
- Merci. En fait, la mise à jour automatique serait un plus. La décision de la communauté cf la PDD a certainement son bien-fondé mais elle implique quelques inconvénients qu'il faut bien contourner. En l'absence, et en l'attente, comment faire ? Dans le cas qui m'intéresse, je suis allé faire un "annule et remplace" sur le lien, mais sans résultat. S'il faut que je change l'URL de la cible, quelle complication...Je viens en fait de découvrir l'existence d'une disposition qui, en ce cas spécifique, car rien n'est parfait en ce bas monde :-)) se retourne contre le lecteur. Merci de m'indiquer une procédure, même manuelle, qui puisse servir d'échappatoire. Adamantane [m'écrire] 15 juillet 2010 à 15:05 (CEST)
Copie d'une ressource
modifier- Copie de Wikipédia:Questions techniques/semaine 31 2010#Copie d'une ressource, sur conseil de Stef48. Visite fortuitement prolongée (d) 5 août 2010 à 21:52 (CEST)
- J'ai une ressource (liens externe) qui vient d'être dépubliée, et archive.org et wikiwix.com n'en ont pas copie. Cependant google.com l'a encore en cache. Est-il possible de demander à wikiwix.com d'aller chercher l'archive de google ? Visite fortuitement prolongée (d) 5 août 2010 à 21:34 (CEST)
- Bonjour, quelle est l'adresse de la page qui est à sauvegarder ? Cordialement Pmartin (d) 6 août 2010 à 10:06 (CEST)
- Bonjour, l'adresse est http://www.irr.org.uk/2009/july/ha000011.html (caches http://www.google.com/search?q=cache:http://www.irr.org.uk/2009/july/ha000011.html et http://wikiwix.com/cache/?url=http://www.irr.org.uk/2009/july/ha000011.html ). L'article est toujours publié et accessible (j'ai commis une coquille que je viens de corriger, et j'essayais une mauvaise adresses), mais j'aimerais quand même savoir si wikiwix.com récupère (peut et veut récupérer) des pages web dans le cache de google.com. Pardon pour le dérangement, et merci d'avance pour vos éventuelles réponses. Visite fortuitement prolongée (d) 6 août 2010 à 23:41 (CEST)
- Oui tout à fait wikiwix.com est capable de récupérer les pages du cache de google.com , et d'archive.org. Corddialement Pmartin (d) 9 août 2010 à 10:16 (CEST)
- Bonjour, l'adresse est http://www.irr.org.uk/2009/july/ha000011.html (caches http://www.google.com/search?q=cache:http://www.irr.org.uk/2009/july/ha000011.html et http://wikiwix.com/cache/?url=http://www.irr.org.uk/2009/july/ha000011.html ). L'article est toujours publié et accessible (j'ai commis une coquille que je viens de corriger, et j'essayais une mauvaise adresses), mais j'aimerais quand même savoir si wikiwix.com récupère (peut et veut récupérer) des pages web dans le cache de google.com. Pardon pour le dérangement, et merci d'avance pour vos éventuelles réponses. Visite fortuitement prolongée (d) 6 août 2010 à 23:41 (CEST)
Projets frères
modifierMon robot n'est apparemment pas utile ici grâce au système "cache", en attendant que quelqu'un rédige sa page d'aide, Dodoiste me renvoie vers toi pour que ce projet remplace mon robot sur les projets frères (vu tout ce que j'ai nettoyé sur Wikilivres je suis sûr que Wikiquote est truffé d'URL en erreur 404). JackPotte ($♠) 16 août 2010 à 00:55 (CEST)
- En gros, JackPotte te demande d'étendre ton cache Wikiwix aux autres projets francophones. :-) Dodoïste [ dring-dring ] 16 août 2010 à 01:06 (CEST)
- Commençons par tous les projets francophones (je venais d'y proposer mon robot mais si ce système est mieux autant rebondir dessus). JackPotte ($♠) 16 août 2010 à 21:10 (CEST)
- Je supporte cette bonne initiative. Attention sur la méthode toutefois: il faut s'assurer que les communautés des autres projets comprennent l'intérêt d'adopter ce cache. Peut-être en leur montrant Wikipédia:Prise de décision/Système de cache. D'abord s'assurer qu'ils sont d'accord ou qu'ils ne s'opposent pas, et ensuite mettre en place ce cache. Bien à toi, Dodoïste [ dring-dring ] 16 août 2010 à 21:21 (CEST)
- en fait une fois que ce js est implanté soit en gadget comme pour les hongrois [2] soit dans le Common [3] les liens apparaissent. Après si tu veux lancer la sauvegarde en temps réel , c'est à dire dès qu'un lien est ajouté sur wikipedia on le sauvegarde, ou bien qu'on préremplisse le cache avec les liens externes déjà présent, je peux le faire dès demain sur l'ensemble des projets francophone ( ou autres ). Cordialement Pmartin (d) 16 août 2010 à 22:01 (CEST)
- OK c'est parti, je vais écumer les bistros... JackPotte ($♠) 17 août 2010 à 03:18 (CEST)
- Comment ça va être éventuellement géré/affiché dans les statistiques du cache si plusieurs projets adoptent ce système ? --Manu1400 (d) 30 août 2010 à 19:08 (CEST)
- Un simple ajout de paramètre dans le javascript nous permettra de faire le distinguo des différents projets. Pmartin (d) 31 août 2010 à 09:32 (CEST)
- Je ne comprends pas quel(s) paramètre(s) doit être modifié (en plus du chemin.indexOf("wikipedia.org")) :
- Un simple ajout de paramètre dans le javascript nous permettra de faire le distinguo des différents projets. Pmartin (d) 31 août 2010 à 09:32 (CEST)
- Comment ça va être éventuellement géré/affiché dans les statistiques du cache si plusieurs projets adoptent ce système ? --Manu1400 (d) 30 août 2010 à 19:08 (CEST)
- OK c'est parti, je vais écumer les bistros... JackPotte ($♠) 17 août 2010 à 03:18 (CEST)
- en fait une fois que ce js est implanté soit en gadget comme pour les hongrois [2] soit dans le Common [3] les liens apparaissent. Après si tu veux lancer la sauvegarde en temps réel , c'est à dire dès qu'un lien est ajouté sur wikipedia on le sauvegarde, ou bien qu'on préremplisse le cache avec les liens externes déjà présent, je peux le faire dès demain sur l'ensemble des projets francophone ( ou autres ). Cordialement Pmartin (d) 16 août 2010 à 22:01 (CEST)
- Je supporte cette bonne initiative. Attention sur la méthode toutefois: il faut s'assurer que les communautés des autres projets comprennent l'intérêt d'adopter ce cache. Peut-être en leur montrant Wikipédia:Prise de décision/Système de cache. D'abord s'assurer qu'ils sont d'accord ou qu'ils ne s'opposent pas, et ensuite mettre en place ce cache. Bien à toi, Dodoïste [ dring-dring ] 16 août 2010 à 21:21 (CEST)
- Commençons par tous les projets francophones (je venais d'y proposer mon robot mais si ce système est mieux autant rebondir dessus). JackPotte ($♠) 16 août 2010 à 21:10 (CEST)
addOnloadHook(function () {
if (wgNamespaceNumber == 0) {
if ((typeof no_external_cache != "undefined") && (no_external_cache)) return;
addcache();
}
function addcache() {
var external_links;
if (document.getElementsByClassName) {
external_links = document.getElementsByClassName('external');
} else {
external_links = getElementsByClass('external',document.getElementById("bodyContent"),'a');
}
for( i = 0;i < external_links.length;i++)
{
var chemin = external_links[i].href;
if(chemin.indexOf("http://wikiwix.com/cache/")==-1 && chemin.indexOf("http://web.archive.org/web/*/")==-1 && chemin.indexOf("wikipedia.org")==-1 && chemin.indexOf("wikimedia.org")==-1 && chemin.indexOf("stable.toolserver.org")==-1)
{
var li = external_links[i].parentNode;
if (li.className == "noarchive") continue;
var depth = 0;
while ((depth < 3) && (li.tagName != "OL") && (li.parentNode != null)) {
li = li.parentNode;
depth++;
}
if (li.tagName != "OL" || !($(li).hasClass('references')) ) continue;
var titre = getTextContent(external_links[i]);
var last = document.createElement("small");
last.setAttribute("class", "cachelinks");
last.style.color = "#3366BB";
last.appendChild(document.createTextNode("\u00a0["));
insertAfter(external_links[i].parentNode, last, external_links[i]);
var link = document.createElement("a");
link.setAttribute("href", "http://wikiwix.com/cache/?org=" + wgServer + "&url=" + chemin.replace(/%/g, "%25").replace(/&/g, "%26") + "&title=" + encodeURIComponent(titre));
link.setAttribute("title", "archive de "+ titre);
link.appendChild(document.createTextNode("archive"));
link.style.color = "#3366BB";
last.appendChild(link);
last.appendChild(document.createTextNode("]"));
}
}
}
}
);
JackPotte ($♠) 31 août 2010 à 19:41 (CEST)
- J'ai positionné un XXXX.ORG à remplacer dans le script. Pmartin (d) 31 août 2010 à 19:52 (CEST)
- modification du script Pmartin (d) 31 août 2010 à 21:44 (CEST)
Projets frères en
modifierSuite aux installations fructueuses sur le Wiktionnaire, la Wikiversité et Wikilivres, j'ai relancé les 3 autres projets francophones, et prévu les 7 anglophones. JackPotte ($♠) 31 août 2010 à 23:46 (CEST)
Monétisation et Copie
modifierBonjour, je constate que les parties liées à la monétisation des pages mis en cache sont supprimées. Pourquoi ? Pour mémoire la plupart des contenus repris en cache sont en infraction avec les lois sur la copie il me semble (reprise intégrale). J'aime beaucoup la mise en garde en bas de page ici -> → Ne copiez pas de texte, ni d'une page web, ni d'un autre support : respectez le droit d'auteur (aide) ; Hormis le caractère de copie de contenu, ce projet n'est il pas une illustration du non respect des webmestre vivant de leur site ? Merci pour vos éclaircissements.
cordialement.
- Bonjour, le cache ne stocke que ce qui est interne au domaine, souvent les publicités sont gérées via des serveurs externes auquel cas ceux-ci ne sont pas pris en compte. Lorsqu'un domaine autorise l'archivage par le biais de la non existence de la balise meta noarchive ou dans le robots.txt il est tout à fait tolérer de stocker son contenu, mais pas ce qui est externe. Cordialement Pmartin (d) 26 octobre 2010 à 18:23 (CEST)
- Bonsoir, Le stockage est en effet implicitement possible comme dit ici (balise meta ...) puisque non explicitement interdit seulement la loi est très claire à ce sujet et s'il n'est pas marqué vol interdit sur un véhicule, cela ne signifie pas pour autant que le vol est possible pour ce véhicule.
l'usage privé du copiste : art. L.122-5 2° : il ne peut s'agir que d'un usage individuel du copiste lui-même, non destiné à une utilisation collective. |
- Pour ce qui est du contenu copié la réutilisation d'un contenu privé a quelques fin que ce soit est elle moins permise. Comprenez bien que le fait de détenir une information est une chose en faire usage en est une autre. Si l'on considère vos pages présentant le contenu d'un site à une date X on se rend vite compte (passons sur les encarts de monétisation pour lesquel vous ne répondez pas et sur lesquels je reviendrai) que votre ? / le site wikiwix.com procède a une copie textuelle de contenu protégé et procède de plus a une copie graphique du site archivé. Pour ces deux copies il y a une atteinte directe aux droits d'auteurs qui ne peut en aucun cas être contesté.
Tout auteur est titulaire d'un droit de propriété sur son œuvre qui consiste à en contrôler toutes les exploitations. Lui seul peut autoriser les exploitations de son œuvre telles que la représentation, la reproduction, ainsi que des transpositions comme la traduction, l'adaptation, la transformation et l'arrangement (art.L.122-4 du code de la propriété intellectuelle). |
- Pour revenir sur le contenu que vous qualifiez d'externe (encarts de monétisation) l'étude du code source des pages du site wikiwix.com montre clairement une intervention sur les constituants actifs du site copié (javascript) qui eux sont en effet en charge de la gestion du contenu publicitaire mais propres au site copié (s'il fallait s'en convaincre, il suffirait de constater la présence d'identifiants uniques destinés à en identifier le propriétaire légitime sur les versions d'origine des pages). La démarche de "nettoyage du code" est donc bien une démarche volontaire visant le site copié et non une altération lié a un contenu externe. Si l'on résonne maintenant de façon plus procédurale, la page visité est chargé dans le navigateur d'un visiteur (code javascript qualifié plus avant de constituant actif compris) ensuite le navigateur génère un rendu visuel de la page chargé et a ce moment seulement les encarts externes sont créés dynamiquement. Les pages copiées sont donc bien volontairement altérées en amont puisque le contenu actif en est supprimé par le robot d'indexation qui lui au moment de la collecte n'a pas de contenu externe visible. J'ajouterai pour me rapprocher de la notion d'étique, que cette démarche peut clairement être perçue comme cavalière et préjudiciable dans la mesure on le processus de rendu visuel de la page effectué par le navigateur, est a quelques détails près similaire dans le cas des CSS et des JAVASCRIPT (code de nature différent mais interprété par le navigateur).Comment expliquer une altération dans un cas et pas dans l'autre alors. c'est sur ce point que j'estime peu éthique la démarche de filtrage des pages.
- Une dernière piste a explorer serait celle du préjudice financier suporté par les auteurs originels dans la mesure ou la notoriété de wikipédia n'étant plus a faire, la présence de liens vers ses pages "mises en cache" entraine fatalement une perte d'exploitation pour l'auteur du site copié.
Comprenez bien que je ne cherche pas polémique, je souhaite seulement avoir ici l'assurance que la respectable fondation wikipédia est consciente d'enfreindre délibérément, quoique indirectement, le code de la propriété en mettant en avant un site produisant un contenu pouvant être qualifié a première vue d'illégal tout en privant certains editeurs plus ou moins gros de leur revenus légitimes.
cordialement.
- Donnez moi l'url de votre site afin que je puisse vous retirez de notre système d'archivage. Cordialement Pmartin (d) 27 octobre 2010 à 12:00 (CEST)
Archives mises à jour quotidiennement
modifierBonjour. Voir la question posée sur Wikipédia:Le Bistro/29 octobre 2010#A quoi sert le lien [archive]?
« En cliquant sur les liens [archive] des trois liens externes de l'article sur le pont de la Motte, je suis tombé les trois fois sur "une image de la page telle qu'elle était le 29/10/2010", soit aujourd'hui! C'est inutile. Pourquoi ces liens sont-ils présents? Qu'est-ce qui m'échappe? »
— Marc Mongenet (d) 29 octobre 2010 à 17:56 (CEST)
Dodoïste [ dring-dring ] 30 octobre 2010 à 14:11 (CEST)
- Effectivement, nous avons un bug depuis quelques semaines, nous détectons bien les nouveaux liens en temps réel, mais nous ne les archivons plus. Nous avons travaillé la semaine dernière sur le problème et nous sommes proches de la solution. Pour pallier la perte de la synchronisation, nous allons récupéré les liens du dumps [4] qui date du premier Novembre, et relancer une procédure d'initialisation. Cordialement Pmartin (d) 1 novembre 2010 à 11:17 (CET)
- Merci pour les informations. Cependant, ces liens ont été créé avec l'article, le 1er octobre 2007 [5]. C'est donc apparemment un autre problème. Marc Mongenet (d) 1 novembre 2010 à 16:01 (CET)
- Il est possible également que lors du dump initiale seul les liens externes contenu dans la section "note et référence" soit retenu. Ensuite il y a une une extension sur "les sources" qui ont été ajoutés et que je suis sur que nous n'avons pas vérifié. Je pense que l'initialisation devrais remettre d'équerre tout çà. Cordialement Pmartin (d) 1 novembre 2010 à 16:14 (CET)
- Merci pour les informations. Cependant, ces liens ont été créé avec l'article, le 1er octobre 2007 [5]. C'est donc apparemment un autre problème. Marc Mongenet (d) 1 novembre 2010 à 16:01 (CET)
Redirections
modifierBonjour,
Parfois les pages supprimées ne se traduisent pas par des erreurs 404 ou 500 mais par des redirections. Exemple : [6]. La page est redirigée vers l'accueil, et c'est l'accueil qui s'affiche dans wikiwix.
Pourtant au final le résultat est le même : la page originale n'est plus accessible. Dans le cas présent, la page est sur web.archive.org, mais ce n'est pas toujours le cas. Y a-t-il un moyen de parcourir l'historique du cache de wikiwix (s'il existe) pour retrouver une version spécifique ?
Merci, — Calimo [á quete] 1 novembre 2010 à 12:40 (CET)
Et sur la Wikipédia anglophone
modifierComme je te l'ai dit par mail, il y a déjà des contribureurs qui demandent l'adoption de Wikiwix en tant qu'archive sur Wikipédia en anglais. Qu'en dis-tu ? Ne te fatigues pas à répondre là-bas, je te fais volontiers les traductions. Concentres-toi sur les manips techniques, chacun son domaine. ;-) Dodoïste [ dring-dring ] 7 février 2011 à 23:23 (CET)
Statistiques francophones
modifierCe lien n'a plus l'air de fonctionner : http://wikiwix.com/cache/?task=stats Bien à toi, Dodoïste [ dring-dring ] 8 février 2011 à 18:13 (CET)
- [7] ici c'est mieux :) Pmartin (d) 10 février 2011 à 11:45 (CET)
- Merci. :-) Dodoïste [ dring-dring ] 13 février 2011 à 15:01 (CET)
Backup de l'archive Wikiwix
modifierDes contributeurs anglophones, effrayés par la perspective d'un possible Point individuel de défaillance, demandent si :
- Wikiwix utilise un système de backup régulier (je suppose que oui) ;
- Oui
- Si Wikiwix fournira bien un backup à la communauté au cas où son service serait arrêté ou suspendu ;
- Nous n'avons pas le droit de diffuser les archives, elles ne sont pas libre de droit, si le dump du backup est distribué cela sous entend que nous mettons à la disposition des sources propriétaires.
- Si la WMF peut disposer d'un backup régulier de l'archive Wikiwix.
- Le cas est différent car il s'agit d'une copie de sauvegarde gérer par la WMF.
Bien à toi, Dodoïste [ dring-dring ] 13 février 2011 à 15:01 (CET)
- Cordialement Pmartin (d) 14 février 2011 à 11:32 (CET)
- Merci pour ces renseignements. Donc, si je comprends bien, la WMF pourrait disposer d'un backup de l'archive Wikiwix, à des fins de sécurité uniquement et pas de diffusion (le contenu était sous Copyright). C'est bien cela ? Merci encore. :-) Dodoïste [ dring-dring ] 14 février 2011 à 18:45 (CET)
- Pas exactement, mais on a le droit de disposer de quelques backup décentralisé ( grosso modo un pour la WMF et/ou deux ou trois personnes de la communauté ) mais nous n'avons pas le droit de diffuser le backup à la communauté. Pmartin
- Merci pour ces renseignements. Donc, si je comprends bien, la WMF pourrait disposer d'un backup de l'archive Wikiwix, à des fins de sécurité uniquement et pas de diffusion (le contenu était sous Copyright). C'est bien cela ? Merci encore. :-) Dodoïste [ dring-dring ] 14 février 2011 à 18:45 (CET)
= Annonce sur le bistro
modifier[8] le 25 Février déplacement du cache, modification de la date d'insertion. Pmartin (d) 25 février 2011 à 01:34 (CET)
TESA (Instruments de mesure) | cache: france3
modifierCoucou sur la page Tesa (instruments de mesure) j'ai ajouté une source. Le lien est vers france3.fr et une erreur PHP s'affiche. Apparemment "parse_url" d'un fichier css externe à wiki mais interne à fr3. http://wikiwix.com/cache/?url=http://lorraine.france3.fr/entreprendre-lorraine/spip.php?article32&title=http%3A%2F%2Florraine.france3.fr%2Fentreprendre-lorraine%2Fspip.php%3Farticle32
Je me demandais également si le cache enregistrait la vidéo, qui contient pas mal d'infos. ??? Merci ! --Pols12 (d) 11 avril 2011 à 16:49 (CEST)
- Le problème est corrigé. Les vidéos ne sont pas stockés nous n'avons pas le droits compte tenu qu'il y a un droit à l'image qui vient se greffer. Cordialement Pmartin (d) 21 juin 2011 à 01:47 (CEST)
Cache Vidéo Youtube (cette page ne peut pas être affichée dans un cadre)
modifierBonjour Pmartin, Je vous écris au sujet de la fonction : "If you wish to prevent this website to be cached here, please use the website blocking form."J'ai voulu tester par curiosité cette fonction de cache d'une page externe (Youtube) sur un nouveau lien que je viens de saisir dans l'article René-Louis Baron. Il s'agit du lien externe n°1 (« laboratoire de recherches ») en fin du 3ème paragraphe du Préambule de la page et vers http://www.youtube.com/watch?v=Zt2IDNi14ZE. Vu que le lecteur de l'archive arrive maintenant sur une page affichant le message « Une erreur s'est produite... » puis « Ce contenu ne peut pas être affiché dans une cadre », j'ai voulu réinitialiser la valeur du paramètre de la nouvelle fonction mais impossible (ou bien, je ne trouve pas ?)... S'il vous plait, pouvez-vous m'indiquer ce que je dois faire pour obtenir cette réinitialisation. MERCI d'avance.--JCaillat > M'écrire 26 mai 2011 à 18:47 (CEST)
Le cache sur ro.wp
modifierBonjour,
J-ai lance une proposition sur ro.wp pour utiliser le system cache de wikiwix aussi sur pour notre Wikipedia. En analysant la page, j'ai observe qu'il y a 2 petits problèmes:
- D'une part, le contenu de la page n'est pas traduit. Est-ce que vous pourriez nous indiquer la façon de la traduire?
- D'autre part, pas tous les liens externes existent dans le cache. Y a-t-il quelque chose qu'on doit faire pour que les liens de ro.wp soient indexes?
Merci d'avance pour votre réponse.--Strainu (d) 4 juin 2011 à 13:21 (CEST)
- D'une part, le contenu de la page n'est pas traduit. Est-ce que vous pourriez nous indiquer la façon de la traduire?
- de quelle page parler vous ?
- D'autre part, pas tous les liens externes existent dans le cache. Y a-t-il quelque chose qu'on doit faire pour que les liens de ro.wp soient indexes?
- Rien hors mis ce script à placer dans le commons.js pour rendre visible le cache [9]
- Cordialement Pmartin (d) 6 juin 2011 à 18:09 (CEST)
- Je parlais de l'en-tete de la page de chache, e.g.[10]--Strainu (d) 11 juin 2011 à 08:49 (CEST)
- Il faut juste m'indiquer la traduction roumaine et on s'occupe du reste. Pmartin (d) 11 juin 2011 à 15:27 (CEST)
- Je parlais de l'en-tete de la page de chache, e.g.[10]--Strainu (d) 11 juin 2011 à 08:49 (CEST)
- La traduction roumaine est:
Această pagină este o versiune arhivată a _acestui URL_.
Ea apare așa cum arăta în momentul în care a fost introdusă ca legătură externă în Wikipedia.
Puteți găsi informații și ne puteți oferi opinia dvs. legată de arhivă _pe această pagină_. | Dacă nu doriți ca acest sit să fie arhivat aici, vă rugăm să folosiți _formularul de blocare a siturilor_.
- J'ai aussi trouve un bug: si le titre est un URL, je recois cette erreur de wikiwix: Warning: strpos() [function.strpos]: Empty delimiter in /home/wikiwix/cache/include/class.robots.php on line 55. Est-ce que le parametre title est obligatoire ou on peut l'eviter?--Strainu (d) 11 juin 2011 à 18:55 (CEST)
- La traduction passera en production Mardi, le bug a été je pense corriger. Cordialement Pmartin (d) 12 juin 2011 à 01:28 (CEST)
Nous avons fait un petit experiment. Un collegue a ajoute un lien vers [11] mais il n'as pas visite le cache que ce matin. Le resultat est que [12] montre l'heure de ce matin, ce qui peut montrer que la page est mise en cache que lors du premier acces au cache. Est-ce que cette hypothese est vraie? Mersi.--Strainu (d) 17 juin 2011 à 08:40 (CEST)
- Normalement, tous les liens qui sont ajoutés sur wp sont sauvegardés avec un délai max de 24 heures , mais je confirmerai cela Lundi. Pmartin (d) 17 juin 2011 à 10:01 (CEST)
- Ce sont uniquement les liens du namespace principales qui sont stockés dans les 24 heures. Les autres sont stockés avec une périodicité d'environ tous les 3 mois. Cordialement Pmartin (d) 21 juin 2011 à 01:35 (CEST)
Mettre en référence un Site
modifierJe cherche desesperement à mettre en réference le site du festival de Lyon Charbonnière sur l'article à propos de René Arrieu pour la pièce Coriolan de Juillet 1953. C'est complexe et une petite aide + explications de ta part seraient un vrai bonheur... Salut et Fraternité--Zanatany (d) 12 juin 2011 à 13:10 (CEST)
Suite problème cache
modifier[13] il s'agissait d'un bug, en fait nous avons stocké une page index.html à la racine du système, ne permettant plus l'accès à la page index.php. Cordialement Pmartin (d) 20 juin 2011 à 09:33 (CEST)
yo, c'est bizarre. au moment où j'ai rajouté le lien en ref2 (crossword puzzles) la page était active vu que je venais de lire l'article. j'ai remarqué hier que le lien n'était plus actif [14] et bizarrement ça se répercute sur le cache [15]. j'ai raté un truc ? - mirror ☣ Rᴑᴙᴚim 4 janvier 2012 à 10:23 (CET) PS: au cas où l'article sur google cache [16]
- Pas évident le problème on essaye de résoudre le problème actuellement. Cordialement Pmartin (d) 16 janvier 2012 à 17:40 (CET)
- merci ! - mirror ☣ Rᴑᴙᴚim 16 janvier 2012 à 21:04 (CET)
Le jours où tu as mis le lien, la sauvegarde ne s'est pas effectué ( soit perte de la synchro, soit serveur irc de la WMF hs, soit ...) et la page de google que tu m'as donnée n'est pas archivable ( car elle contient la balise no archive ) comme toutes les pages de google. Donc impossible pour nous de récupérer le contenu, je t'invite pour plus de sureté la prochaine fois que tu ajoutes un lien de cliquer sur le lien archive qui est généré ca lance le stockage immédiatement et désolé pour la perte du contenu du lien. Cordialement --Pmartin (d) 25 janvier 2012 à 18:14 (CET)
- ha super. je savais pas du tout comment ça fonctionnait. j'y penserai dorénavant et merci encore pour ton travail - mirror ☣ Rᴑᴙᴚim 25 janvier 2012 à 18:29 (CET)
Problème avec le cache de la page d'accueil de Seeks Project
modifierBonjour,
J'ai voulu sourcer la licence de Seeks, mais vu que je n'ai pas l'habitude, j'ai dû mal m'y prendre ou alors il y a un bug... "Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia." → En fait, l'affichage de la page source est bon en suivant le lien, mais l'archive est une page complètement différente et s'affiche mal !
J'espère que tu pourras m'aider, merci d'avance ! --Flûte (d) 14 janvier 2012 à 19:54 (CET)
- Beaucoup plus facile cf discussion plus haut :) , "j'ai dû mal m'y prendre ou alors il y a un bug" pas de bug juste que la page était déjà mis en lien dans wikipedia du coup l'archive date un peu. Je peux tout simplement faire une mise à jours ce qui resoudera par la même le problème d'(affichage. Cordialement Pmartin (d) 16 janvier 2012 à 17:43 (CET)
Oups, désolé, je n'ai pas tout lu... (je ne vois pas de quel passage tu parles, je lirais plus attentivement dès que possible). Pour la mise à jour, ce serait bien, sauf si ça remplace l'ancienne capture... Est-ce le cas ? En effet, je ne sais pas si les informations de la capture précédente, qui sont différentes, sont utilisées pour un autre article... As-tu moyen de vérifier ça avant de supprimer ?
Merci pour ta réponse rapide ! Flûte (d) 16 janvier 2012 à 23:54 (CET)
- le seul lien que j'ai trouvé est dans l'infobox de l'article, donc à toi de voir si je mets à jours ou pas. Cordialement --Pmartin (d) 17 janvier 2012 à 11:04 (CET)
Si je comprends bien, l'archive existe depuis que quelqu'un a mis un lien vers cette page externe ? Donc l'archive existait mais ne pouvait pas être utilisée car il n'y avait pas de lien vers celle-ci ?
Du coup, oui, je veux bien une mise à jour, stp ! :) Merci d'avance ! Flûte (d) 23 janvier 2012 à 21:35 (CET)
- done --Pmartin (d) 25 janvier 2012 à 18:09 (CET)
C'est mieux maintenant ! :) Merci. Flûte (d) 21 février 2012 à 00:53 (CET)
Cache vers .rtf
modifierBonsoir, il semble y a avoir un léger problème avec un cache ici. Il pointe vers un fichier de type rtf qui a quelques difficultés à s'ouvrir normalement. Problème lié au cache, au format, à un intermédiaire php, à la compatibilité, à mon ordinateur ? Existe-t-il un moyen de régler cela pour simplifier la démarche du lecteur ? Merci d'avance. --Tryonisos (d) 11 avril 2012 à 00:49 (CEST)
- done , c'est juste qu'on autorisait pas le stockage des fichiers .rtf. Cordialement --Pmartin (d) 11 avril 2012 à 13:28 (CEST)
lien archive ne fonctionnant pas dans l'article mutualisme étudiant en France
modifierBonjour,
Le deuxième lien externe de cet article ne fonctionne pas, l'archive également. Je ne sais pas ce qu'il faut faire donc je m'adresse à vous pour régler ce souci.
Merci d'avance
Cordialement --Lushie (d) 28 avril 2012 à 08:18 (CEST)
Bonjour, je vous écrivais pour vous tenir compte de l'erreur d'archivage pour la référence de la page Sébastien_Cauet#cite_note-11.
En effet, en cliquant sur le lien archivage, j'ai cette erreur This page uses a tag to prevent archiving of its content, thus we're not archiving it.
Merci donc de corriger le problème si cela est possible. Bonne continuation --Kcchouette [m'écrire!] 3 mai 2012 à 22:04 (CEST)
redirection automatique
modifierLorsque je cherche l'historique de la page http://www.premier-ministre.gouv.fr/information/actualites_20/vers_une_refondation_fonction_57549.html je vois dans un premier temps quelque-chose s'afficher une fraction de seconde et presque instantanément la page http://archive.wikiwix.com/cache/?url=http://www.premier-ministre.gouv.fr/information/actualites_20/vers_une_refondation_fonction_57549.html&title=http%3A%2F%2Fwww.premier-ministre.gouv.fr%2Finformation%2Factualites_20%2Fvers_une_refondation_fonction_57549.html contenant "Jean-Marc Ayrault est nommé Premier ministre"; comment peut on éviter la redirection automatique, pour voir la page d'origine?? Pano38 (d) 25 mai 2012 à 17:39 (CEST)
Pano38
modifierJe te fais une ici demain Aide:Liens_archives
Référence Jean-Luc Mélenchon
modifierLa référence "86":
↑ Daniel Fouray, Jean-Luc Mélenchon s'explique sur ses revenus, entretien vidéo accordé à Ouest-France, 14/04/2012, en ligne [archive], sur le site www.ouest-france.fr
abouti sur la page http://www.ouest-france.fr/actu/actuDet_-Presidentielle.-Jean-Luc-Melenchon-s-explique-sur-ses-revenus_6346-2066214_actu.Htmentretien = erreur 404!!
le cache http://archive.wikiwix.com/cache/?url=http://www.ouest-france.fr/actu/actuDet_-Presidentielle.-Jean-Luc-Melenchon-s-explique-sur-ses-revenus_6346-2066214_actu.Htmentretien&title=en%20ligne abouti sur: Le cache est actuellement en lecture seule et rien de plus!!
Pano38 (d) 28 mai 2012 à 08:30 (CEST)
reference Bernard Kouchner
modifierLe refrence 58: http://209.85.229.132/search?q=cache:szPVAdrNg6kJ:tf1.lci.fr/infos/biographie/0,,3848760,00-bernard-kouchner-.html+kouchner+contrat+nouvelle+embauche&cd=1&hl=fr&ct=clnk&gl=fr donne une erreur 404 et l'archive donne "Le cache est actuellement en lecture seule" sans rien d'autre??!! Pano38 (d) 29 mai 2012 à 11:33 (CEST)
Persée, Google Book et l'archivage
modifierBonjour,
Je mets souvent des liens vers des articles ou livres numérisés, comme ici. Il n'y a pas de problèmes pour le lien externe, en revanche l'archive refuse de s'afficher. On voit quelques éléments du site d'origine, mais pas le document lui-même. Que faire ? Zythème (d) 5 juillet 2013 à 15:54 (CEST)
Liens Wintersport-news.it
modifierBonjour. J'espère que tu es toujours par ici...
Le site http://www.wintersport-news.it a changé, les url ne mènent plus à rien. Pas de problème, il y a les archives Wikiwix ! Mais ça ne fonctionne pas... Par exemple, sur la page Coupe du monde féminine de saut à ski 2012-2013 le lien vers http://www.wintersport-news.it/it_IT/10774,Flash.html mène à la page d'accueil du nouveau site : http://archive.wikiwix.com/cache/?url=http://www.wintersport-news.it/it_IT/10774,Flash.html&title=Saltatrici%20norvegesi%20per%20le%20gare%20di%20Coppa%20del%20Mondo%20di%20Sapporo%20e%20Zao
Comment fait-on ? Merci. -- MGuf (d) 24 octobre 2013 à 13:18 (CEST)
- Bonjour. J'ai eu ta réponse, merci.
- Je constate également un autre problème :
- Wikiwix allergique au saut à ski ? -- MGuf (d) 27 octobre 2013 à 10:57 (CET)
Les liens fis-ski.com et wintersport-news.it, c'est foutu alors ? :-( -- MGuf (d) 12 novembre 2013 à 09:23 (CET)
- Bonjour les liens vers wintersport-news.it sont revenus je regarde ce que je peux faire pour fis-ski.com--Pmartin (discuter) 13 novembre 2013 à 11:45 (CET)
- Ben non, ça ne fonctionne pas :
- Exemple : le titre de la news est "Saltatrici italiane per le gare di Coppa del Mondo di Sapporo", et le lien "attaché" est [archive : on arrive "quelque part" sur le site, mais pas à la news "Saltatrici italiane per le gare di Coppa del Mondo di Sapporo" de fin janvier ou début février 2013 .
- -- MGuf (d) 13 novembre 2013 à 13:34 (CET)
- Bonjour les liens vers wintersport-news.it sont revenus je regarde ce que je peux faire pour fis-ski.com--Pmartin (discuter) 13 novembre 2013 à 11:45 (CET)
Bon, on en est où avec wintersports ? Ici non plus ça ne marche pas :
Bonjour/bonsoir,
Il y a un lien brisé parmi les références de l'article : un lien vers une image. Quand je clique sur Wikiwix, j'obtient un écran séparé horizontalement tout blanc, avec dans le panneau supérieur "404" et dabs l'inférieur "Erreur 404".
Pour info, je ne trouve d'archive de ce lien nulle part...
Cordialement, --Daehan (discuter) 18 novembre 2013 à 17:50 (CET)
Liens d’archive curieux dans l’article Immigration en France
modifierBonsoir,
J’ai trouvé trois liens d’archive curieux dans l’article Immigration en France : celui-ci et celui-là indiquent « 2Le cache est actuellement en lecture seule » pour seul résultat. Quand à celui-ci il donne quelque chose mais dans un sale état (et ça ne semble pas être la bonne page de toutes façons, voici une version archivée correcte).
Précision : j’ai corrigé ces liens, il faut se reporter à cette version de l’article pour les retrouver. Ce sont les notes 142, 143 et 144.
Cordialement, XoLm56 (discuter) 26 novembre 2013 à 21:40 (CET)
Archivage de fichiers xls
modifierBonjour,
J’ai un comportement curieux de l’archivage sur cette page à la référence 53 : l’archive renvoie vers un ficher « display.php » alors que le lien pointe vers un fichier xls. À noter que l’archivage fonctionne correctement à la note 52 juste au-dessus qui est également un fichier xls.
Cordialement, XoLm56 (discuter) 13 décembre 2013 à 18:09 (CET).
Lien(s) mort(s), dont wikiwix
modifierBonjour,
Comme indiqué sue la page http://fr.wiki.x.io/wiki/Projet:Correction_des_liens_externes#J.27ai_trouv.C3.A9_un_lien_mort.2C_que_faire_.3F je rapporte ici un lien wikiwix qui n'est pas à proprement parler mort, mais qui renvoie : This page uses a tag to prevent archiving of its content, thus we're not archiving it. Et, malheureusement, les autres liens de cette note ne sont pas plus vaillants.
Référence : note 5 de la page « Jean Frydman »
Cordialement,
--
--Francis.gernet (discuter) 20 février 2014 à 10:41 (CET)
Et si l'original s'améliore?
modifierJe constate que la page extérieure http://geosite.jankrogh.com/vennbahn.htm comprend de nouvelles vues aériennes en plus de la carte schématique reprise à http://archive.wikiwix.com/cache/?url=http://geosite.jankrogh.com/vennbahn.htm&title=Vennbahn%20%28German%20exclaves%20in%20Belgium%29. Que faire? L'auteur (détenteur de la propriété intellectuelle du site) permet-il qu'une nouvelle cache soit prise? Mais dans ce cas, celle-ci n'apparaîtrait plus «comme la page était lorsque le lien a été inséré dans Wikipédia» mais comme elle était (avec des améliorations) à une date ultérieure. Et cetera.
P.S. En prévisualisation, je vois que des liens [archive] ont été ajoutés automatiquement après chacun des liens externes ci-dessus. Aurais-je sans le savoir fait juste ce qu'il fallait? Je n'ose y croire, d'autant moins que le second ajout serait une archive du site wikiwix lui-même. (Et le tout, soit dit en passant, sur une page de discussion.) Tonymec (discuter) 1 mars 2014 à 10:42 (CET)
Du vol manifeste de la part de wikipédia !
modifierLe texte intégral de la page publié ici par wikipedia est du vol de contenu ! http://archive.wikiwix.com/cache/?url=http://www.cristobal-colon.net/Colon/C05p10.htm&title=%C2%AB%C2%A0O%C3%B9%20est%20enterr%C3%A9%20christophe%20Colomb%C2%A0%3F%C2%A0%C2%BB
Le site cristobal-colon.net est fermé depuis 2011 à cause du piratage effectué principalement par les auteurs de wikipedia.
Sur une autre page concernant Colomb, http://fr.wiki.x.io/wiki/Christophe_Colomb la note 84 indique que la page est en archive, c'est faux !! Cette page n'est dans aucun cache, sur aucun site, puisque le site est fermé et le contenu a été détruit sur notre serveur!!!
Sur une autre page une idiotie indique que je les autorise à mettre ma page dans leur cache : http://archive.wikiwix.com/cache/?url=http://www.cristobal-colon.net/Colon/C05p10.htm&title=%C2%AB%C2%A0O%C3%B9%20est%20enterr%C3%A9%20christophe%20Colomb%C2%A0%3F%C2%A0%C2%BB
Nous n'avons jamais autorisé quiconque à nous piller ! C'est tout simplement du vol organisé par wikipedia malgré les mentions légales portées au bas de ma page dont le texte est le suivant :
"Rappel important : Conformément à l'article L.122-4 du code de la propriété intellectuelle toute représentation ou reproduction non expressément autorisée, intégrale ou partielle et par quelque procédé que ce soit est illicite et constitue une contrefaçon sanctionnable par les articles L.335-2 et suivants du code de la propriété intellectuelle. "
Ce n'est pas la première fois que nous avons à nous plaindre de ce type de comportement de la part des pilleurs de wikipedia.
C'est à cause du vol incessant sur notre site, effectué par de prétendu rédacteurs de wikipedia, que l'Association "L'Amiral de la Mer Océane" a été fermé. Désormais les communications et les transmission informations se font par CD-rom et sur papier, uniquement aux membre de l'association.
ccolonfr@gmail.com
- Cette page n'est plus archivée par le serveur de wikiwix. Cordialement --Pmartin (discuter) 10 avril 2014 à 09:53 (CEST)
Des petites images (gif) ne s'affichent pas sur une page en cache
modifierSur cette page en cache, les petites images ne s'affichent pas, bien que les liens sous-jacents soient actifs. La page originale a été déplacée et j'ai trouvé où, aussi je vais corriger le lien dans Électron-volt, et la page en cache va peut-être disparaître du cache, si qqn veut corriger le bug si besoin, il risque de devoir retrouver la page dans les archives du cache (est-ce possible ?), à moins que la nouvelle page en cache ait le même bug. Le bug pourrait être que la mise en cache de l'image gif a ajouté une entête donnant la provenance de l'image, mais du coup ce n'est plus une image gif valide. SGlad (discuter) 17 novembre 2014 à 14:19 (CET)
- [17] je pense que c'est bon ? --Pmartin (discuter) 2 avril 2015 à 11:41 (CEST)
"elle elle" dans le bandeau
modifierDans le bandeau des pages archivées :
Vous êtes en train de consulter une version archivée de cette URL. Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia.
Merci de corriger. SGlad (discuter) 17 novembre 2014 à 15:06 (CET)
- On s'occupe de çà maintenant--Pmartin (discuter) 2 avril 2015 à 12:49 (CEST)
Toponymie Montlhéry
modifierPourquoi cette page est-elle mise en cache ? https://books.google.fr/books?id=NZw-AAAAcAAJ&pg=PA53&dq=etymologie+Montlh%C3%A9ry&hl=fr&sa=X&ei=cSPZVPKqKsf2UPWGgogP&ved=0CEAQ6AEwBjgK#v=onepage&q=etymologie%20Montlh%C3%A9ry&f=false </ref>
Texte archivés et modifications d'URL
modifier--89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST)--89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST)Bonjour A 83 ans, je ne suis pas de la génération informatique. Mon problème concerne les liens archivés. J'ai publié sur Wiki plusieurs textes concernant Etienne Chevalier et consorts (Montreuil 93, baronne de Dannemoine, etc... . Archivés sous l'URL http://perso.numericable.com/rconnat/ puis suite en .html. Cette URL est maintenant caduque car j'ai quitté numericable comme provider) Ma nouvelle URL est maintenant http://pontonnier93.fr/ suite en . html Mon provider étant maintenant Gandi et mon domaine .www.pontonnier93.fr . J'ai changé aujourdhui mercredi 8 mars l'ancienne URL pour la remplacer par la nouvelle mais mon texte étant archivé, j'ignore si j'ai bien fait car j'ai toujours l'erreur 404. Pourriez-vous jeter un œil car je poursuit un travail sur cette famille et j'envisage de la publier, mais avant je veux être certain que ma nouvelle URL soit visible. Cordialement 89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST) René Connat pour historic93
Comment peut-on "rafraichir" le cache ?
modifierBonjour,
Nouveau contributeur, je cherche comment obtenir la suppression du cache suivant : http://archive.wikiwix.com/cache/?url=http%3A%2F%2Fwww.icem-pedagogie-freinet.org%2Fnode%2F15654, du 26 avril 2016, pour le remplacer par une version corrigée de la même page, à savoir : http://www.icem-pedagogie-freinet.org/node/15654, telle qu'elle est aujourd'hui : 29 avril 2016.
En effet, la page mise en cache comportait des coquilles gênantes, lesquelles ont été corrigées à ma demande.
J'ai cru comprendre qu'il suffirait que je supprime le lien pour que le cache soit supprimé, mais j'ai essayé et cela n'a pas fonctionné.
J'ai aussi envoyé un message via : http://archive.wikiwix.com/fr/contact. Si cela fait double emploi, veuillez m'en excuser.
Avec tous mes remerciements
--Alain594 (discuter) 29 avril 2016 à 19:18 (CEST)
- Alain594 : Non le fait de retirer un lien sur wikipedia ne supprime pas le cache, pour la bonne et simple raison qu'un lien peut être présent sur d'autres articles. Mais effectivement nous pourrions mettre en place un système de mise à jours des liens à la demande. Mais à la base de la prise de décision, il était très important que la mise à jours d'une page ne soit pas automatique. Je viens de mettre à jours la page dans le cache. --Pmartin (discuter) 12 mai 2016 à 10:51 (CEST)
- Pmartin : Merci beaucoup pour ces informations et pour la mise à jour du cache. Il me semble en effet qu'un système de mise à jour des liens à la demande aurait son utilité. Cela n'implique pas que l'archive initiale doivent être supprimée (elle peut toujours être conservée pour servir en cas de nécessité), mais l'archive visible de tous gagnerait à pouvoir être mise à jour selon une procédure officielle. Encore merci !
Page non archivée alors que l'originale est accessible
modifierLa page http://archive.wikiwix.com/cache/?url=http%3A%2F%2Fwww.bortzmeyer.org%2F7208.html donne "Unable to download this file" alors que l'original http://www.bortzmeyer.org/7208.html est accessible (vu dans les notes de Sender Policy Framework). -- SGlad (discuter) 15 mai 2016 à 14:25 (CEST)
- SGlad :Oui c'est assez surprenant ce qu'il se passe depuis hier [18] j'ai créé un ticket incident pour résoudre le problème dès mardi.--Pmartin (discuter) 15 mai 2016 à 15:45 (CEST)
- SGlad : le problème est résolu Pmartin (discuter) 17 mai 2016 à 11:53 (CEST)
- Pmartin : Merci. (Quel était le problème ?) -- SGlad (discuter) 17 mai 2016 à 12:42 (CEST)
- SGlad : une attaque sur les serveurs qui prenait les ressources de l'infrastructure.--Pmartin (discuter) 17 mai 2016 à 13:39 (CEST)
- Pmartin : Merci. (Quel était le problème ?) -- SGlad (discuter) 17 mai 2016 à 12:42 (CEST)
- SGlad : le problème est résolu Pmartin (discuter) 17 mai 2016 à 11:53 (CEST)
Mettre les archives en https ?
modifierWP étant désormais préférentiellement en https, beaucoup de réfs externes sont en https, mais l'archive a l'air d'être en http, p.ex. "http://archive.wikiwix.com/cache/?url=https%3A%2F%2Fwww.cs.duke.edu%2F~ychen%2Fpapers%2FCuckoo_Hotplanet10.pdf" dans Microblog.
Ne serait-ce pas préférable que les archives des https au-moins soient aussi en https ? -- SGlad (discuter) 17 mai 2016 à 16:07 (CEST)
- SGlad : il est possible de mettre toutes les archives en https ( https://archive.wikiwix.com ) mais pas de mettre uniquement les liens qui sont en https, le https fonctionne en tout ou rien. Mais cela rehausserait le coût pour l'achat d'un certificat SSL , et également la charge sur les serveurs. Il faut d'abord que je mesure l'impact financier et ressources serveurs avant de basculer en SSL, mais j'ai planifié cela avant la fin de cette année.--Pmartin (discuter) 20 mai 2016 à 11:47 (CEST)
site noarchive
modifierPar exemple, [19] ou [20], dans ces caches, il apparaît:
Impossible d'archiver cette url (robots.txt ou noarchive).
Serait-il difficile de ne pas mettre en cache ces pages, et donc de ne pas avoir de liens correspondants [archive] sur une page wikipedia? J’imagine que les directives à prendre en compte proviennent de l'entête "X-Robots-Tag", ou de la balise meta name="robots" ou du fichier robots.txt. --Yvore (discuter) 21 mars 2017 à 00:28 (CET)
- Les liens [archive] sont placés pour tous les liens externes présents sur un article (Javascript pour tous les href), indépendamment du fait que ce lien ait été archivé ou non. Cela permet de garder une certaine indépendance pour les deux parties :) --Framawiki ✉ 21 mars 2017 à 19:30 (CET)
3 questions sur l'archivage Wikiwix
modifierBonjour Pmartin :
J'ai 3 questions sur l'archivage Wikiwix :
- Si un lien externe a été ajouté dans un article le 1er janvier 2017, puis a été ajouté dans un autre article le 2 février 2017, est-ce que la sauvegarde Wikiwix (créée le 1er janvier 2017) de la page externe a été mise à jour le 2 février 2017 ?
- Quand on ajoute un lien externe sur Wikipédia, la page externe correspondante est archivée sur archive.wikiwix.com et l'archive est consultable en cliquant sur [archive]. Pourquoi, lorsque le lien externe pointe directement sur une archive, le lien [archive] n'apparaît pas ? Exemples : le lien dans la section "Liens externes" de Kaos Studios (vers une archive Wikiwix) et le dernier lien dans la section "Liens externes" de Yūzō Takada (vers une archive web.archive.org).
- La sauvegarde d'une page externe sur Wikiwix dépend de son utilisation sur Wikipédia. Si Wikipédia n'a plus de lien vers une page externe, l'archive correspondante est supprimée sur Wikiwix. Y-a-t-il un risque, pour le lien dans la section "Liens externes" de Kaos Studios, que l'archive directement pointée soit supprimée ? Autrement dit, est-ce que cette archive Wikiwix existe (et sera maintenue) parce qu'elle est pointée directement (ou juste parce que l'url primaire est utilisée ailleurs dans Wikipédia) ?
Cordialement --NicoScribe (discuter) 18 mai 2017 à 19:18 (CEST)
Bonjour NicoScribe :
- C'est l'archive à date du 1 er janvier 2017, qui est accessible, mais nous pouvons revoir le processus pour avoir plusieurs copies à des dates différentes.
- C'est à la communauté de choisir , en se basant sur un vote qui permet de positionner l'archive ex https://fr.wiki.x.io/wiki/Wikip%C3%A9dia:Sondage/Affichage_du_lien_archive_Wikiwix . Actuellement le lien est accessible sur les sections des modèles ( notes et références , et box des liens externes ).
- Non, nous ne procédons pas à l'effacement des pages sources non liées dans wikipedia.
Cordialement --Pmartin (discuter) 29 juillet 2017 à 17:39 (CEST)
- Bonjour Pmartin et merci pour vos réponses.
- Je n'ai pas de préférence mais, si le processus peut être revu, ça vaut le coup d'interroger la communauté. Par ailleurs, la mise à jour d'une archive pourrait être souhaitée lorsque la source évolue. Dans ce diff par exemple, j'ai constaté la mise à jour d'une source, alors j'aurais bien aimé forcer la mise à jour de l'archive Wikiwix (je fais un raisonnement général, même si mon exemple est mauvais car cette source là n'est pas archivable à cause de "robots.txt ou noarchive").
- Là aussi, ça vaut le coup d'interroger la communauté, mais je ne comprends pas complètement votre réponse. Dans le sondage que vous citez, la communauté souhaite voir les liens [archive] dans toutes les sections. Pourtant, dans cet exemple, je ne vois pas [archive] à côté du lien dans la section "Liens externes". En supposant que MediaWiki:Gadget-ArchiveLinks.js gère l'affichage de [archive], ma question initiale est maladroite. J'aurais dû demander : est-ce qu'une archive est créée dans le cache Wikiwix si la source ajoutée dans un article est déjà une archive, par exemple est-ce vous avez une archive du dernier lien dans la section "Liens externes" de Yūzō Takada ?
- Je ne comprends pas votre réponse. Ai-je eu tort en écrivant "Si Wikipédia n'a plus de lien vers une page externe, l'archive correspondante est supprimée sur Wikiwix." ? La page Utilisateur:Pmartin/Cache indique "Lors de la suppression d'un lien externe dans un article, celui-ci sera effacé du cache de façon automatique après vérification que celui-ci n'est plus lié à aucun article."
- Cordialement --NicoScribe (discuter) 30 juillet 2017 à 19:08 (CEST)
- Bonjour @Pmartin NicoScribe : 3. paraît pourtant clair : Si Wikiwix "ne procède pas à l'effacement des pages sources", toute page y reste archivée à la même adresse y compris quand disparaît le lien vers la source initiale. (Voir aussi ci-dessus : "12 mai 2016 à 10:51... le fait de retirer un lien sur wikipedia ne supprime pas le cache".) — Valp 1 août 2017 à 10:40 (CEST)
- Valp : oui, j'ai encore fait une formulation maladroite, la réponse 3 de Pmartin est très claire (et cette réponse est une bonne nouvelle pour plein de raisons). Mais cette réponse m'a beaucoup surpris, parce que j'étais convaincu du contraire et parce qu'elle contredit le passage cité de Utilisateur:Pmartin/Cache. --NicoScribe (discuter) 1 août 2017 à 17:29 (CEST)
- Bonjour @Pmartin NicoScribe : 3. paraît pourtant clair : Si Wikiwix "ne procède pas à l'effacement des pages sources", toute page y reste archivée à la même adresse y compris quand disparaît le lien vers la source initiale. (Voir aussi ci-dessus : "12 mai 2016 à 10:51... le fait de retirer un lien sur wikipedia ne supprime pas le cache".) — Valp 1 août 2017 à 10:40 (CEST)
Bonsoir,
- Une astuce existe pour enregistrer plusieurs versions d'une même page, il suffit d'ajouter un paramètre à la page ce qui change l'url et provoque donc la création d'une nouvelle archive. Par exemple : http://archive.wikiwix.com/cache/?url=http://quelle-heure.org/ http://archive.wikiwix.com/cache/?url=http://quelle-heure.org/?parametre. Je pense qu'il est possible d'automatiser l'enregistrement d'une nouvelle archive, en fonction de la date de création de la dernière et de la provenance du lien.
- Le mot archive, ne s'affiche que sur un lien qui n'est pas une archive, en l’occurrence le lien est http://archive.wikiwix.com/cache/?url=http://www.kaosstudios.com est une archive donc c'est normal.
- oui cela a été vraie pendant des années, mais plus d'actualité. Toute archive reste présente dans le système d'archivage.
Cordialement, --Pmartin (discuter) 2 août 2017 à 03:38 (CEST)
Bonjour, Voyez svp Hébron#cite_note-60 où tous les liens vers Euronews sont morts, càd 5 liens dont wikiwix.com/cache. Pouvez-vous le corriger ou me dire ce qu'il faut faire dans ce cas? Merci. — Valp 11 juillet 2017 à 20:18 (CEST)
- Réponse à ma question : Via Google, cherché et trouvé deux autres pages encore actives pour remplacer le lien mort (recherche de: « "25 octobre 2008" Hébron »). — Valp 1 août 2017 à 11:06 (CEST)
- Pouvez-vous me fournir les liens qui vous semblent KO ? Pmartin (discuter) 12 août 2020 à 20:11 (CEST)
Note de bas de page n°37 du mathématicien Aryabhata ne fonctionne pas...
modifier... ni sa version archivée. Magnon86 (discuter) 18 septembre 2018 à 01:13 (CEST)magnon86
L'archive affiche la page d'accueil actuelle
modifierBonsoir,
sur la page de The Red Pill, la deuxième source (The Red Pill#cite_note-2) - un article d'Atlantico - retourne vers la page d'accueil actuelle du journal et le lien d'archive Wikiwix a le même comportement.
J'ai ajouté une balise lien brisé et une autre archive.
Cordialement, Go seek truth again (discuter) 1 décembre 2018 à 18:52 (CET)
- Normalement c'est bon, désolé pour la réponse tardive. Pmartin (discuter) 12 août 2020 à 20:09 (CEST)
Jacques Cartier
modifiercorrect: https://www.thecanadianencyclopedia.ca/en/article/jacques-cartier
".com" changé-> ".ca" Eisbaer44 (discuter) 5 août 2019 à 18:52 (CEST)
- L'URL de L'Encyclopédie canadienne est modifié. Que faire? --Eisbaer44 (discuter) 11 août 2019 à 00:46 (CEST)
- Il n'y a rien à faire les deux liens sont sauvegardés http://archive.wikiwix.com/cache/index2.php?url=https%3A%2F%2Fwww.thecanadianencyclopedia.ca%2Fen%2Farticle%2Fjacques-cartier http://archive.wikiwix.com/cache/?url=https%3A%2F%2Fwww.thecanadianencyclopedia.com%2Ffr%2Farticle%2Fjacques-cartier Pmartin (discuter) 12 août 2020 à 20:06 (CEST)
Hors-ligne en septembre 2019
modifierBonjour PMartin !
Pour information, le cache hébergé sur Wikiwix semble à nouveau hors-ligne depuis quelques jours, avec le message « cant connect db ». Bon courage pour la réparation ! —Pols12 (discuter) 1 octobre 2019 à 22:14 (CEST)
- Désolé pour la réponse tardive mais merci Pols12 pour tes encouragements, nous avions un système que nous estimions énergivore qui était en doublon avec notre nouveau système. Le "can't connect db" est du à un problème matériel que nous sollicitons du coup moins, mais qui du coup risque de se reproduire. Pmartin (discuter) 12 août 2020 à 20:02 (CEST)
Archive avec programme php
modifierJ'ai ajouté un lien dans l'article wikipedia "Déduction naturelle" section "Lien externe" vers un logiciel php situé à l'adresse teachinglogic.liglab.fr/DN.
Mais il y a deux problèmes avec l'archive
1)le lien est obsolète
2) Quand on utilise un bouton du programme php, les requêtes se font à l'adresse ci-dessus sans le DN et se terminent par une page d'erreur, car la version archivée utilisait l'adresse teachinglogic.liglab.fr
Aussi, dans mon cas, l'archivage d'un lien obsolète est génante et je souhaiterais l'éviter. Sans trop comprendre les indications fournies, j'ai placé à l'adresse teachinglogic.liglab.fr/DN le fichier robots.txt contenant :User-agent:wikiwix-bot
Disallow:/
Est-ce la bonne solution pour éviter l'archivage ?
Liviusbarbatus (discuter) 22 novembre 2019 à 13:49 (CET)
- Vous pouvez tester votre configuration sur cette page http://archive.wikiwix.com/cache/cache.php . Pmartin (discuter) 12 août 2020 à 19:16 (CEST)
Redirection du Guardian - resultat illisible pour l'utilisateur lambda
modifierLe lien http://archive.wikiwix.com/cache/?url=https%3A%2F%2Fwww.theguardian.com%2Fscience%2Fpolitical-science%2F2013%2Fsep%2F06%2Fscience-policy-australian-election-2013 parait rediriger vers la page http://archive.wikiwix.com/cache/index2.php?url=https%3A%2F%2Fwww.theguardian.com%2F%2Femail%2Fform%2Ffooter%2Ftoday-uk, ce qui rend le résultat inutilisable pour le lecteur-rice lambda. Boud (discuter) 21 décembre 2019 à 23:14 (CET)
- Désolé pour ma réponse tardive mais a priori nous avons corrigé le problème ? Pmartin (discuter) 12 août 2020 à 19:15 (CEST)
vieux liens qu'il faudrait conserver
modifierJe suis toute nouvelle et ne connais pas les bons termes ou même si je suis au bon endroit - excusez mes erreurs, s.v.p.-
Si je suis au mauvais endroit et que vous savez comment rediriger mon message au bon endroit, je vous en serais reconnaissante.
Je viens de créer ma première page (sur Éthel Groffier) pour laquelle je me suis servi de ce lien:
http://worldcat.org/identities/lccn-no95009605/ (Atala). Ce site m'a semblé bien vieux et en danger de disparaître, ce qui me troublerait beaucoup.
Si j'ai bien compris le message d'un bénévole de Wikipédia que je viens de voir sur ce site (worldcat....Atala), on étudie ici la possibilité que Wikipédia conserve de tels vieux liens qui sont à risque de disparaître. Je vous écris pour donner mon avis fortement en faveur de la conservation de tels liens, et de ce lien en particulier dont je viens de me servir. En dehors de mes désirs personnels, je trouve très frustrant de tomber sur des liens inactifs quand je lis des pages de Wikipédia. Il me semble très désirable POUR LA RÉPUTATION DE WIKIPÉDIA de ne pas avoir tous ces vieux liens inactifs.
Merci.
Mon nom d'utilisateur: Wikilou30-4-1944
lien cassé Mondoloni
modifierJ'ai corrigé le lien caduc de la note 72 de https://fr.wiki.x.io/wiki/Championnat_d%27%C3%A9checs_de_Paris
https://www.echecs64.com/2009/07/22/mondoloni-du-neuf-sur-9-au-cht-de-paris/
mais je ne sais pas comment corriger l'archive. Merci Chessbutton (discuter) 18 janvier 2021 à 10:18 (CET)
- Il suffit juste de cliquer sur le lien d'archive : http://archive.wikiwix.com/cache/index2.php?url=https%3A%2F%2Fwww.echecs64.com%2F2009%2F07%2F22%2Fmondoloni-du-neuf-sur-9-au-cht-de-paris%2F
Jean Dagnaux
modifierBonjour Le lien externe de la notice biographique ne fonctionne pas. Je suis nouveau et ne sais pas le réparer...! cordialement. --Conductrain (discuter) 18 novembre 2021 à 14:56 (CET)
- il est malheureusement irréparable, j'ai regardé sur la wayback machine et c'est pareil, désolé.Pmartin (discuter) 24 novembre 2021 à 00:10 (CET)
lien mort wikiwix
modifierinfo le wikiwix de la page Melfor est Modèle {{Lien brisé}} : paramètres « url
» et « titre
» manquants.
77.131.3.93 (discuter) 7 décembre 2021 à 11:42 (CET)
- Bonsoir merci de préciser votre question. Pmartin (discuter) 8 décembre 2021 à 00:06 (CET)
GCVS ne fonctionne pas
modifierBonjour,
La mise en archive des liens vers les pages des députés sur le site du grand conseil valaisan ne fonctionne jamais.
Exemple (Michael Graber, heureusement encore en fonction) :
- https://parlement.vs.ch/app/fr/person/311
- https://archive.wikiwix.com/cache/index2.php?url=https%3A%2F%2Fparlement.vs.ch%2Fapp%2Ffr%2Flink%2F311#federation=archive.wikiwix.com
Cette mise en archive est pourtant très utile, car dès que le député quitte sa fonction (ce qui est souvent le cas après qu'il soit élu au parlement fédéral et qu'il devienne donc admissible pour WP), la page est supprimée sur le site.
Bien à vous, — Omnilaika02 [Quid ?] 28 décembre 2021 à 13:26 (CET)
- Bonjour @Pmartin, n'ayant pas eu de retour je me permets de vous relancer. Cordialement, — Omnilaika02 [Quid ?] 29 janvier 2022 à 20:08 (CET)
- Bonsoir, je pense qu'il y a du mieux au moins sur la page indiquée pour laquelle il ne manque que la photo, que je vais tenter de récupérer. Je regarderai ce qu'il en est sur les autres pages qui sont liées dans Wikipedia via https://fr.wiki.x.io/w/index.php?target=https%3A%2F%2Fparlement.vs.ch%2F&title=Sp%C3%A9cial%3ARecherche_de_lien. Vous avez bien fait de me relancer j'avais loupé votre remontée.Pmartin (discuter) 30 janvier 2022 à 03:26 (CET)
- Bonjour @Omnilaika02 je n'ai pas pu récupérer ces contenus là le plus sur c'est de cliquer sur le lien archive à chaque nouvelle entrée https://parlement.vs.ch/common/idata/parlement/vos/docs/2012/08/1983_01_Session_de_janvier_1983(1).pdf https://parlement.vs.ch/common/idata/parlement/vos/docs/2012/09/1999_05_Session_de_mai_1999_1.pdf https://parlement.vs.ch/common/idata/parlement/vos/docs/2012/12/77_1983_Recueil%20des%20lois.pdf https://parlement.vs.ch/rails/active_storage/sitrox/eyJfcmFpbHMiOnsibWVzc2FnZSI6IkJBaDdDVG9JYTJWNVNTSWhNMll5TmpFeE5tUmtaVGt4TWpNeU1XRXdNalEwWWpReE5EVXdNQVk2QmtWVU9oQmthWE53YjNOcGRHbHZia2tpU1dsdWJHbHVaVHNnWm1sc1pXNWhiV1U5SWtkRE1UZGZSaUIzWldJdWNHUm1JanNnWm1sc1pXNWhiV1VxUFZWVVJpMDRKeWRIUXpFM1gwWWxNakIzWldJdWNHUm1CanNHVkRvUlkyOXVkR1Z1ZEY5MGVYQmxTU0lVWVhCd2JHbGpZWFJwYjI0dmNHUm1CanNHVkRvUmMyVnlkbWxqWlY5dVlXMWxPaE56YVhSeWIzaGZjM1J2Y21GblpRPT0iLCJleHAiOiIyMDIxLTEwLTE3VDEyOjI0OjI4LjE0MFoiLCJwdXIiOiJibG9iX2tleSJ9fQ==--b24175e7488464065a4148cdbc5c9ebac7fefaaa/GC17_F%20web.pdf https://parlement.vs.ch/sites/parlement/FR/1/docview/35644 https://parlement.vs.ch/common/idata/parlement/vos/docs/2012/09/1993_09_Session%20prorog%C3%A9e%20de%20mai%201993%20(septembre%201993)(1).pdf Pmartin (discuter) 24 février 2022 à 20:21 (CET)
- Bonsoir, je pense qu'il y a du mieux au moins sur la page indiquée pour laquelle il ne manque que la photo, que je vais tenter de récupérer. Je regarderai ce qu'il en est sur les autres pages qui sont liées dans Wikipedia via https://fr.wiki.x.io/w/index.php?target=https%3A%2F%2Fparlement.vs.ch%2F&title=Sp%C3%A9cial%3ARecherche_de_lien. Vous avez bien fait de me relancer j'avais loupé votre remontée.Pmartin (discuter) 30 janvier 2022 à 03:26 (CET)