Aide:Wikipédia hors-connexion

(Redirigé depuis Wikipédia:DUMP)

L'objet de cette page est de répertorier les différents moyens de disposer de Wikipédia hors connexion. Pour cela :

  • il existe des logiciels tiers qui permettent de consulter aisément Wikipédia hors-ligne ;
  • il y a plusieurs moyens de créer des fichiers pdf avec du contenu de Wikipédia que vous sélectionnez, ou même d'obtenir une sélection d'articles sous forme de livre papier ;
  • plusieurs solutions pour mobiles sont proposées.

Par ailleurs, la fondation Wikimedia publie des sauvegardes de la base de données sur le site http://dumps.wikimedia.org/. Ces sauvegardes peuvent être téléchargées et utilisées pour consulter Wikipédia hors-ligne après avoir installé localement son logiciel MediaWiki. Les dumps permettent aussi de créer un site miroir ou faire tout type de traitement automatique sur le contenu. Tout le texte contenu est réutilisable selon les termes de la licence Creative Commons paternité partage à l’identique.

Avec un lecteur hors-ligne

modifier
 
Capture d'écran de la version 0.9

Kiwix est un lecteur hors-ligne pour contenus issus du Web qui fonctionne sous MacOS, GNU/Linux, iOS, Android et Windows. Il a été conçu pour rendre accessible Wikipédia lorsqu'il n'y a pas d'accès à Internet. Kiwix est une sorte de mini-navigateur qui, au lieu d'aller sur le Web, lit des fichiers ZIM, format de fichier contenant des pages web compressées.

On peut se procurer ces fichiers contenant l'ensemble des articles de Wikipédia, sur clé USB. Les articles peuvent même être consultés depuis la clé sans avoir été copiés dans l'ordinateur (c'est une application portable). On peut aussi télécharger ces fichiers (voir ci-contre ou ci-dessous) et éventuellement les reproduire sur clé USB ou autres supports.

Le logiciel lecteur Kiwix peut aussi être utilisé sans installation depuis la clé USB.

Voici ses principales fonctionnalités :

  • Interface simple et disponible dans plus de 100 langues
  • Moteur de recherche dans le texte insensible à la casse comme aux caractères accentués
  • Système de suggestions pour la recherche
  • Gestionnaire intégré de contenus/téléchargements
  • Gestionnaire d'onglets
  • Export des articles en PDF et HTML
  • Gestionnaire intégré de Notes et de signets
  • Mode serveur HTTP

Pour des raisons de civisme, mais aussi parce que les téléchargements sont de grande taille et peuvent être interrompus inopinément, le téléchargement par BitTorrent est un choix adéquat. Voici la liste des torrents : https://library.kiwix.org/?lang=fra Voir aussi :

XOWA (en) est une application gratuite et open source qui permet de télécharger Wikipédia sur un ordinateur. Accédez à l'intégralité de Wikipédia hors ligne, sans connexion Internet ! Elle est actuellement en phase de développement bêta, mais elle est fonctionnelle. Elle est disponible en téléchargement ici (GitHub)

Autres utilitaires pour PC

modifier

À la date de janvier 2013, les logiciels suivants ne permettent pas l'accès aux illustrations. Certains ont l'avantage d'être disponibles pour des systèmes d'exploitation non pris en charge par Kiwix. Ils ne sont pas forcément libres ou gratuits. Ils peuvent également proposer diverses options supplémentaires.

  • (en) Wikitaxi [1] (possible site officiel) s'alimente directement à partir des sauvegardes régulières du contenu de la Wikipédia, ce qui permet d'avoir un contenu très à jour. Il permet également d'examiner le texte source (en format mediawiki) de chaque page, ce que n'autorise pas Kiwix. Dernière version : 2011[2]. Cet utilitaire est gratuit. Attention, toutes les versions ne sont pas compatibles : des fichiers générés par la première version ne sont pas lisibles par la (les ?) version(s) successive(s).
  • (es) CDpedia. Projet pour consulter Wikipédia hors-connexion en castillan (papier, DVD et téléchargement des bases de données).

Smartphones, tablettes tactiles

modifier
  • (fr) Aarddict. Aard2 est un logiciel libre pour les appareils Android (et les PC par l'intermédiaire d'un émulateur). Il permet de télécharger des dictionnaires et des versions sans images de Wikipédia dans leur intégralité pour en disposer hors ligne. Les fichiers d'extension .slob ont le double avantage d'être fortement compressés et multivolumes ce qui permet de les copier aussi sur des cartes SD formatées en FAT32 ainsi que des clés USB utilisables avec un smartphone au moyen d'un adaptateur OTG. Les images des pages consultées peuvent être affichées en ayant une connexion Internet si l'option est choisie.
  • Minipédia - Encyclopédie hors ligne [1] Minipédia est une manière rapide et facile d'accéder aux articles de Wikipedia en utilisant votre iPhone ou iPad sans connexion à un réseau.
  • Autre (fr + en) AutoWikiBrowser est un outil pour réaliser des éditions semi-automatiques sur Wikipédia. Il peut charger et analyser le contenu des dumps XML.

Disposer d'une sélection d'articles en pdf, livre électronique ou papier

modifier

Les livres Wikipédia

modifier

« Sur Wikipédia, vous pouvez créer un « livre », c’est-à-dire une collection d’articles, que vous pouvez ensuite sauvegarder et télécharger sous différents formats » :

  • PDF, pour imprimer directement, ou lire avec une mise en page fixe (titres, colonnes, images) sur les écrans assez grands, tels que les ordinateurs ;
  • OpenDocument, permettant d'avoir à disposition un document pour le remanier ou le copier dans un traitement de texte ;
  • OpenZIM, un format adapté pour de très gros e-books ; adapté au logiciel Kiwix ;
  • EPUB, un format qui autorise une mise en page dynamique pour s'adapter à l'écran des petits appareils, tels que les liseuses, les tablettes, ou les smartphones... C'est devenu le format standard des EBooks.

Vous pouvez également commander votre sélection en tant qu’ouvrage imprimé livré à domicile[3].

 
Livres d’articles de Wikipédia imprimés par PediaPress.

Exporter en XML

modifier

Pour télécharger un sous-ensemble de la base de données au format XML, comme une catégorie spécifique ou une liste d'articles, voir Spécial:Exporter, dont l'utilisation est décrite à (en) Help:Export.

Avec les dumps bruts et MediaWiki

modifier

MediaWiki est le logiciel avec lequel fonctionne Wikipédia. Il est possible de l'installer sur son propre ordinateur ou serveur et d'y importer les dumps pour créer un site miroir ou disposer de MediaWiki sur son ordinateur. Attention, cette solution est très gourmande en mémoire vive, et n'est pas adaptée aux débutants.

1re étape : installer MediaWiki

modifier
  • Pour des informations concernant le téléchargement et l'installation de MediaWiki, voir : Aide:MediaWiki

2e étape : télécharger les dumps

modifier

Vous devez tout d'abord télécharger toutes les pages comme Dump XML.

Pour chaque projet, les fichiers suivants sont disponibles :

  • pages-articles.xml.bz2 - révisions courantes, sans les autres espaces de noms (c'est probablement celle que vous voudrez si vous voulez créer un site miroir ou faire des analyses du contenu des articles). Inclut les modèles, exclut les pages de discussion et les pages utilisateur.
  • pages-meta-current.xml.bz2 - révisions courantes, toutes les pages.
  • pages-meta-history.xml.bz2 - toutes les révisions, toutes les pages.
  • abstract.xml.gz - pages résumées.
  • all_titles_in_ns0.gz - les titres des articles uniquement.
  • des fichiers SQL pour les interwikis, les catégories et les modèles sont également disponibles.

Les dumps contiennent les pages de description des images, mais pas les images elles-mêmes (voir la section « Images » ci-dessous). Il n'y a pas de dump public des pages supprimées. Certaines sauvegardes sont peut-être incomplètes - portez attention aux mises en garde de type « Dump complete, 1 item failed » près du fichier.

Un nouveau dump est réalisé pour chaque projet un peu plus d'une fois par mois. Par ailleurs, des dumps quotidiens partiels, contenant uniquement les articles modifiés pendant la journée concernée, sont disponibles sur http://dumps.wikimedia.org/other/incr/.

Images et médias téléchargés en amont

modifier

Le site http://dumps.wikimedia.org ne propose pas de sauvegarde des images elles-mêmes (bien que les dumps contiennent les pages de description des images). Il est cependant possible de télécharger des dumps, voir http://lists.wikimedia.org/pipermail/xmldatadumps-l/2012-May/000491.html.

Avertissement : contrairement au texte des articles, les images ne sont pas nécessairement disponibles sous une licence libre. Leur utilisation en dehors de Wikipédia peut être illégale. Consultez Wikipédia:Exceptions au droit d'auteur pour les règles appliquées sur Wikipédia en français et en:Wikipedia:Non-free content pour celles de Wikipédia en anglais. De plus, dans la quasi-totalité des cas, les images requièrent un crédit, une paternité et éventuellement d'autres informations sur le droit d'auteur jointes aux fichiers. Ces informations sont incluses dans les pages description des images, qui font partie du texte de sauvegarde disponible sur http://dumps.wikimedia.org/.

Voir aussi

modifier

Pour consulter le Wiktionnaire hors connexion

modifier

Voyez Consulter le Wiktionnaire hors-connexion sur le Wiktionnaire.

Articles connexes

modifier

Références

modifier