Wikiwix

moteur de recherche

Wikiwix est un moteur de recherche sémantique multilingue opensource et un service d'archivage du Web, entre autres pour Wikipédia en français, créé en 2002 par la PME française Linterweb[2].

Logo de Wikiwix

Adresse wikiwix.com
Slogan « the ultimate Wikipedia articles search engine » (L'ultime moteur de recherche d'articles de Wikipédia)
Commercial non[1]
Type de site Moteur de recherche
Langue Multilingue
Inscription Aucune
Siège social Val de Reuil (Eure)
Drapeau de la France France
Propriétaire Pascal Martin
Lancement 1 avril 2006
État actuel  Actif

Historique

modifier

Domiciliée également sur la commune de Val-de-Reuil (Eure) jusqu'en 2019[3], la société Linterweb ( dissolution[4] le 31 Aout 2024 ) devient une EURL en 2006 et son siège social est installé à Caden (Morbihan)[5].

Le logo de Wikiwix symbolise un oiseau terrestre : le kiwi (Apterygidae), qui cueille de la nourriture avec son bec sur le sol. Le moteur de recherche utilise la description anglaise « the ultimate Wikipedia articles search engine » (L'ultime moteur de recherche d'articles de Wikipédia) comme slogan dans toutes les versions linguistiques.

Jeune entreprise régionale en 2007, la société recrute deux docteurs pour le développement avec l'aide d'Oséo, du Centre Régional Informatique et d'Applications Numériques de Normandie (CRIANN) et du Laboratoire d'informatique, de traitement de l'information et des systèmes (LITIS) dont la problématique est de traiter un ensemble de recueils de textes parmi les 550 000 articles en français pour lequel la fondation Wikimédia se heurte aux choix de sélection. Le projet doit avoir la fonction de maintenance de l'historique des versions[6]. Cette collaboration[Note 1] aboutit à la publication du « DVD Wikipédia » v0.5 contenant une sélection de 2 000 articles anglophones[7],[8],[9].

En 2008, sous le nom de Kiwix, une application est développée pour emporter les textes de l'encyclopédie en totale autonomie de connexion dont la capacité est de 1,36 Go[10],[11],[12]. Faisant partie des premières versions, le moteur de recherche spécialisé sur le contenu de l'encyclopédie Wikipédia offre un navigationnel dans un nouveau système d'exploration temporelle[13]. Durant cette même année, l'association Wikimédia France utilise les résultats proposés par Wikiwix dans le nom de domaine « wikipedia.fr » fréquenté par environ 20 000 personnes par jour[14]. À la suite d'une prise de décision de la communauté[Note 2] validée le , le service indépendant de la fondation Wikimédia d'archivage des liens externes de l'encyclopédie est automatiquement effectué par Wikiwix.

En 2009, sur la base du moteur de recherche, la société Linterweb propose le service de « My Wikiwix », dont la fonctionnalité est de disposer d’un moteur de recherche sur un site web dédié, incluant les techniques de recherche sémantiques[15].

En 2010, avec une volumétrie approximative de 150 liens/seconde, le moteur de recherche implémente les fonctionnalités d'affichage de liens proposés dans les Tweets du réseau social de Twitter[16]. Le Centre Régional Informatique et d'Applications Numériques de Normandie (CRIANN) apporte son support d'hébergement pour Wikiwix afin de poursuivre le projet de recherche en complément du financement d'Oséo pour accroître le nombre de serveurs requis par l’augmentation du trafic généré[8],[17]. Le rédacteur en chef du site « openDemocracy » félicite l'initiative[18].

En 2011, une étude sur l'archivage des adresses web (URL) place Wikiwix parmi les cinq sites permettant la mise en cache des contenus afin de préserver la masse d'informations qui disparaît inexorablement au quotidien[19]. Durant cette même année, un ouvrage collectif de vulgarisation sur les technologies de l'information et de la communication (TIC) relate les fonctionnalités originales des moteurs de recherche plus spécialisés comme Wikiwix ou Yippy[20].

En 2015, le journaliste Damien Bancal, spécialisé dans la sécurité informatique, constate une faille de vulnérabilité de type « cross-site scripting » (abrégé XSS) sur le site gérant le cache des sources sur les articles de Wikipedia. Un correctif est déployé quelques jours plus tard[21].

En , dans le cadre de la refonte de la page « wikipedia.fr », Wikimédia France remplace Wikiwix par l’interface de programmation d’applications (API) de MediaWiki[Note 3] en intégrant un filtre de recherche pour choisir parmi 21 versions linguistiques, comprenant le français et les langues régionales de France comme le breton, l’occitan ou le créole guyanais[22]. Parallèlement, un membre de l'association réalise une étude sur le classement des liens externes de Wikipédia, pour lequel le service Wikiwix fait partie du « Top 20 français » parmi les sites les plus sollicités[23]. Avec Wayback Machine d'Internet Archive, le service archive.wikiwix.com fait partie des deux seuls outils d'archivage de la Wikipédia Francophone permettant l'accès aux liens morts[23].

Depuis sa création Wikiwix ou archive.wikiwix est cité dans la parution d'ouvrages[24],[25], de sites institutionnels[26],[27] et sur des sites plus généralistes[28],[29].

Fonctionnalités

modifier

Sur la base d'une recherche initiale dédiée à Wikipédia et aux projets de la fondation, Wikiwix permet d'effectuer un maillage sur les termes voisins et connexes afin de naviguer entre les aperçus des articles tout en intégrant des annonces de Google dans ses résultats[30],[31].

Wikiwix permet d'effectuer trois types de recherches, dans les articles, les images et dans l'Atlas (basé sur Google Maps), le tout dans les dizaines de langues que propose Wikipédia[32].

Disponible dans la barre d'icônes, l'application libre et gratuite Okawix (précédemment Kiwix) permet de télécharger l’intégralité de Wikipédia, avec ou sans images, pour pouvoir ensuite consulter les contenus localement hors-ligne (sans connexion internet)[10]. Okawix inclut 253 langues et les projets de la Fondation Wikimedia (Wikisource, Wiktionnaire, Wikiquote et Wikibooks).

Notes et références

modifier

Références

modifier
  1. « Analyse du site : Wikiwix.com », sur SimilarWeb, (consulté le ).
  2. Gwilh, « Tapis Volant #26 : Linterweb », sur gwilh.me, (consulté le ) ( dissolu.
  3. « Linterweb - 27100 », sur societe.com, (consulté le ).
  4. « LINTERWEB SARL - DISSOLUTION », sur Paris Normandie, (consulté le )
  5. « Linterweb », sur societe.com, (consulté le ).
  6. Jean-Christian Cordier, « Rapport d’activités 2007 : volet technique (LinterWeb) » [PDF], sur criann.fr, (consulté le ), p. 44 / 50.
  7. (en) Wikipedia:Version 0.5/To do, publié sur le site Wikipédia en anglais (consulté le ).
  8. a et b « Linterweb : Recherche », sur consultants.linterweb.fr (consulté le ).
  9. (en) « Wikipedia 0.5 available on a CD-ROM », sur wikipediaondvd.com (consulté le ).
  10. a et b Jean-Luc Goudet, « Kiwix : une version de Wikipédia hors ligne », sur Futura-Sciences, (consulté le ).
  11. Philippe Crouzillacq, « Wikipédia au format poche », sur 01net, (consulté le ).
  12. Guillaume Belfiore, « Kiwix : Wikipedia en mode déconnecté », sur Clubic, (consulté le ).
  13. Olivier Andrieu, « WikiWix explore le temps à travers Wikipedia », sur abondance.co, (consulté le ).
  14. « Création du portail de recherche wikipedia.fr » [PDF], sur Wikimédia France, (consulté le ), p. 8 /13.
  15. (fr + en + de) Matthieu, « My Wikiwix, le moteur de recherche qui vous va bien », sur blog.wikiwix.com, (consulté le ).
  16. Olivier Andrieu, « Wikiwix intégre les liens Twitter », sur abondance.com, (consulté le ).
  17. « Rapport d’activités : Support aux projets innovants » [PDF], sur criann.fr, (consulté le ), p. 17 / 19.
  18. (en) Tony Curzon Price (en), « Quick plug for our custom search provider, Wikiwix and their new Wiki/Twitter search », sur opendemocracy.net, (consulté le ).
  19. (en) Gwern Branwen, « Archiving URLs : Remote caching (Prevention) », sur gwern.net, (consulté le ).
  20. David Grout, Gérard Peliks (dir.), Sadry Porlon, Nicolas Ruff et Philippe Vacheyrout, Mythes et légendes des TIC, Paris, Forum ATENA, , 303 p., 21 × 29,7 cm (présentation en ligne, lire en ligne [PDF]), p. 40.
  21. Damien Bancal, « Méfiez-vous du cache des sources des articles de Wikipedia », sur Zataz, (consulté le ).
  22. Amélie Cabon, « Notre moteur de recherche wikipedia.fr fait peau neuve », sur Wikimédia France, (consulté le ).
  23. a et b Pyb, « Wikipédia et les liens externes », sur wikirider.blogspot.com, (consulté le ).
  24. Philippe Pascot et Graziella Riou Harchaoui, Délits d’élus : 400 politiques aux prises avec la justice, Paris, Max Milo (réimpr. 2016) (1re éd. 2014), 448 p., 15 × 23 cm (ISBN 2315005442 et 2315007097, OCLC 874921681, BNF 44269850, SUDOC 177220724, présentation en ligne, lire en ligne), p. 136.
  25. Patrice Schoch, Intelligence stratégique localisée : vers une gestion active et pertinente des réseaux d'influence, Saint-Denis, Publibook, Connaissances et savoirs, coll. « Géopolitique et sciences politiques », , 235 p., 20 cm (ISBN 2753905770 et 978-2-7539-0577-1, OCLC 1039732812, BNF 45511116, SUDOC 227339207, présentation en ligne, lire en ligne), p. 220.
  26. « Feuillet d'épreuve du Bac Général 1re : Spécialité physique-chimie » [PDF], sur quandjepasselebac.education.fr (Ministère de l'Éducation nationale), (consulté le ), p. 2 / 9.
  27. Jean-Claude Tibe, « La lutte des états du golfe de Guinée pour la conservation et l'utilisation durable de leur biodiversite marine et côtière à l’épreuve du développement durable » [PDF], sur Organisation des Nations unies (ONU), (consulté le ), p. 126 / 320.
  28. Ronan Hénaff, « Scénarios n'ayant jamais été produits », sur SensCritique, (consulté le ).
  29. Elara Bertho, « Transmettre l'histoire : Med Hondo, une voix anticoloniale », Cahiers d'histoire. Revue d'histoire critique, Paris, OpenEdition Journals, no 149,‎ , p. 139-144 (ISSN 1271-6669, lire en ligne, consulté le ).
  30. Kreatic, « Le moteur de recherche WikiWix », sur actu-ref.fr, (consulté le ).
  31. (en) Ann Smarty, « WikiWix: Additional Help with Your Keyword Research », sur searchenginejournal.com, (consulté le ).
  32. Mr Xhark, « Wikiwix : un méta-moteur de recherche pour Wikipedia », sur blogmotion.fr, (consulté le ).

Voir aussi

modifier

Articles connexes

modifier

Sur les autres projets Wikimedia :

Lien externe

modifier