Discussion Projet:Catégories/Méthodes de catégorisation

Dernier commentaire : il y a 3 ans par Popsygel dans le sujet Relation de rapport
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Portail de qualité
  • Bon portail
  • Lumière sur
  • À faire
  • Archives
  • Commons

Relation catégorie-catégorie

modifier

J'ai du mal à saisir la relation catégorie-catégorie, en particulier le cas où l'on peut mettre une catégoriser une catégorie. L'exemple donné me laisse perplexe. Je ne comprends pas pourquoi [[Histoire de la Corse]] aurait plus sa place en tant dans la sous-catégorie de [[Catégorie:Région française]] que de celle de [[Catégorie:Île]]. L'histoire de la Corse n'est pas une région française... Helldjinn 1 avril 2006 à 13:07 (CEST)Répondre

L'histoire de la Corse va plus simplement dans les départements de la France, car à l'instant oçù nous parlons, la Corse est un département français et que toutes les histoires des autres départements français se situent dans [[:Catégorie:Région française]] même si celles-ci ont été romaines, celtes, franches, germanes, espagnoles, normandes, saxones, anglaises, italiennes, arabes, ... pendant un laps de temps plus ou moins long. Mais l'article Corse se retrouve catégorisé non seulement sous Catégorie:Île, mais aussi sous [[:Catégorie:Corse]]/[[:Catégorie:Département français]]/[[:Catégorie:Région française]]/[[:Catégorie:France]]/[[:Catégorie:Géographie]] (du plus spécifique au plus général) et autres si on inclue de l'histoire, les spécialités régionales, les tenants et aboutissants économiques, les diverse politiques, ...
Et pour l'instant, on attaque pas encore les paradoxes spaciaux temporels, ça va encore. :D --Lolo le 13 1 avril 2006 à 14:46 (CEST)Répondre
Je comprends ta perplexité, qui s'explique par le flou régnant sur la définition des articles entrant dans chaque catégorie. Il ne faut pas perdre de vue cette définition  : les catégories relatives aux régions françaises regroupent tous les articles concernant ces régions, dont leur histoire, tandis que la catégorie îles regroupe seulement des îles, me semble-t-il , mais j'admet qu'on pourrait aussi décider que la catégorie régions française ne regroupe que les 25 articles sur ces régions. Spedona 3 avril 2006 à 23:22 (CEST)Répondre
C'est sûr qu'on peut considérer les régions françaises comme des entités historico-politico-(...)-géographique, contrairement à une île qui est un concept purement géographique. Là, ça va. Je pense qu'on est cependant tous d'accord pour que chaque catégorie contienne un petit descriptif des articles que la catégorie est amenée à recevoir. Helldjinn 4 avril 2006 à 09:59 (CEST)Répondre
Je trouve aussi, qu'un déscriptif est important, et déjà possible. Mais pour l'instant peu de contributeurs s'en servent. Traumrune 4 avril 2006 à 19:45 (CEST)Répondre
Problème du même ordre dans les sous catégories de Catégorie:Enseignement supérieur : la Catégorie:Institut d'études politiques inclut unesous-Catégorie:Ancien élève de Sciences Po. Ce qui fait qu'on y récupère des pesonnalités comme Fanny Ardant ou Christine Okrent qui n'ont rien à voir avec l'enseignement. Mica 14 mai 2006 à 15:59 (CEST)Répondre

Nombre d'entrées dans une catégorie

modifier

Bonjour. Dans certaines catégories, surtout celles concernant des personnalités françaises, il y a des centaines de noms et je me demande s'il n'y a pas une possibilité de sous-catégories. Mais cela devrait être assez simple pour que les auteurs des articles puissent le faire. Actuellement, on troue énormement de nom dans Projet:Articles sans catégories. Eventuellement quelque chose au niveau des ébauches personnalité. (Mais à ce niceau, je ne connais rien).Traumrune 3 avril 2006 à 23:07 (CEST)Répondre

C'est un autre débat qui mériterait une page ad-hoc. Mon avis c'est qu'il faut trouver un compromis et peut-être éviter de trop morceler les catégories. Spedona 4 avril 2006 à 20:21 (CEST)Répondre

Contre-proposition

modifier

A quoi sert une catégorie?

modifier

Une catégorie c'est simple: c'est une page qui apparaît quand on navigue dans wiki à travers les liens "catégories". On s'en sert en principe pour chercher de l'information (ou de l'inspiration).

Ca permet de trouver un thème (rarement hélas) par recherche descendante (du général au particulier), ou (plus probablement) quand on tombe sur un thème intéressant, de circuler non seulement à travers les liens horizontaux, mais en remontant à la catégorie pour faire un panoramique automatique sans dépendre de la manière dont le rédacteur a sélectionné ses liens.

Effectivement, "voyage au bout de la nuit" est utilement rattaché à une catégorie "céline", qui me permet de trouver d'autres informations sur un thème qui m'a intéressé; mais pas uniquement "Céline": ce voyage comporte de nombreux autres aspects.

Sinon, ça ne sert à rien d'autre, non?...

Dommage, ça ne marche pas. J'ai essayé de trouver un article sur les idéogrammes chinois (une de mes marottes) en passant par les catégories ... essayez pour voir, c'est édifiant. En trois clics, on ne sait plus où on est.

Conclusion: le système est à revoir. Si le seul intérêt c'est le plaisir intellectuel d'une poignée de participants, c'est cher payé.

Même catégorie = Même thème ou sujet

modifier

Ce que je veux trouver dans une page "catégorie", c'est typiquement:

  • Les articles traitant du même thème général que ce que j'ai lu (contenu de la catégorie);
  • La liste des thèmes connexes: plus spécialisés, voisins, plus général,... (lien entre catégories).

Pour faire un travail utile de ce point de vue, celui qui catégorise une catégorie doit théoriquement se poser comme question:

  • Quel est le sujet commun qui unit tous ces articles?
  • Quels sont les thèmes spécialisés associés?
  • Quels sont les thèmes généraux auxquels ce thème se raccroche?

... théoriquement, parce que pratiquement, on ne peut pas gérer les thèmes spécialisés à partir d'une catégorie (ce sont les filles qui engendrent les mères). Donc on ne travaille que sur les thèmes plus généraux, pour catégoriser une page préexistante. En revanche, on peut imaginer de pré-capturer des thèmes spécialisés par mots clefs (voir infra).

Enchaînement des catégories : relation "voir aussi"

modifier

La question de la transitivité ou non des catégories est un faux problème: dans certains cas, le regroupement est tel que la catégorie est effectivement transitive (eg, les parties successives pays > région de pays > départements de région > etc). Pour d'autres usages, il n'y a aucune raison qu'il y ait une transitivité quelconque. Typiquement, si je créé une catégorie intermédiaire "monde chinois", j'aurai des sous-catégories géographiques, linguistiques, touristiques, ... qui sont simplement différents aspects du monde chinois, mais la relation "inclusion" ou la relation "est_un" est totalement hors sujet.

Raisonnons par l'absurde: tout se rattache finalement à la catégorie "racine", donc tout "est-une" racine ??? Tout ce qui aboutit à l'arborescence "loisir" est-un loisir ???

Un torrent est effectivement un sujet intéressant pour qui s'intéresse à la montagne, donc "torrent" doit apparaître dans une sous-catégorie de "montagne". Certes, mais ce n'est qu'une minuscule partie du travail, un torrent est également intéressant pour qui s'intérese à l'hydrogéologie, à l'érosion,...

Catégorie: mal nommée

modifier

En fait, ce que j'attend d'une "catégorie" n'est pas du tout la même chose suivant que je suis sur un article ou sur une page de catégorie.

  • Dans un article: il faut qu'elle fonctionne comme un mot clef (et de préférence, qu'un article ait plusieurs mots clefs)
  • Dans une catégorie, il faut circuler non pas dans une arborescence, mais dans un treillis: une page a plusieurs parents, et un parent plusieurs enfants, de natures hétéroclites.

Par pitié, faites passer le mot, affichez les avertissement automatiques, pour que:

  • les auteurs d'articles mettent plusieurs mots clefs;
  • les catégorisateurs de catégories pensent à plusieurs rattachements;
  • ceux qui crééent une catégorie doivent essayer d'en retrouver le chemin depuis la racine (s'ils ont perdu, ils gagnent le droit de mettre de nouveaux chemins).

Les considérations sur l'inclusion, la transitivité,... relèvent de la sodomisation de diptères: si la catégorie ne sert pas à circuler, elle ne sert à rien ni à personne. Soyons pragmatiques, et ne cherchons pas de règles "logiques" là où il n'y a que de la "pratique".

Ce n'est que par la multiplicité que les voies d'exploration peuvent être exploitables via les catégories.

Suggestions de robots

modifier

Pour les "hackers" locaux:

  • algorithme pour indexer chaque catégorie par son "niveau de profondeur" depuis la racine commune.
  • algorithme pour mettre en bannière d'un article l'arborescence la plus courte remontant vers la racine, avec des liens actifs à chaque étape (on aurait des surprises, à mon avis...).
  • récupérer non seulement les catégories "mères", mais également des "soeurs" pour circuler horizontalement.
  • Pré-indexer tous les articles contenant tel ou tel mot clef = doter les catégories d'une possibilité d'équation de recherche,
  • ... vous en voulez d'autres?

Michelet 13 avril 2006 à 21:28 (CEST)Répondre


Relation de rapport

modifier

Autant la relation d'identité (est un) et la relation d'appartenance (est un élément de) aide à catégoriser un article, autant la relation de rapport, à mon sens, apporte de la confusion. Prenons l'exemple du roman Voyage au bout de la nuit : on le met dans la Catégorie:Louis-Ferdinand Céline (puisque le rapport est évident), on va sans doute mettre aussi dans cette catégorie, l'article Louis-Ferdinand Céline. Et puis, imaginons un nouvel article traitant d'une anecdote historique concernant Céline et une autre personne célèbre. Le rédacteur s'empressera de mettre son article dans Catégorie:Louis-Ferdinand Céline. Céline est un écrivain français donc la Catégorie:Louis-Ferdinand Céline va devenir une sous catégorie de Catégorie:Écrivain français. Et là, on ne respecte plus la règle : "Il faut que chaque élément contenu dans la catégorie-fille puisse être catégorisable dans la catégorie-mère."

A mon sens, la relation de rapport s'effectue par le lien interne et non par la catégorie.

J'ai un autre cas "d'espèce" avec 2 catégories : Metteur en scène et Métier du théâtre. Si je mets la catégorie Metteur en scène dans la catégorie Métier du théâtre, ça ne fonctionne pas puisque je vais avoir des articles sur des personnes dans une catégorie qui concerne des métiers. Donc, à mon sens, je ne dois mettre que l'article principal Metteur en scène dans la catégorie Métier du théâtre pour que l'arborescence fonctionne. xila 6 mai 2006 à 19:28 (CEST)Répondre


Méthode pour faire avancer la réflexion

modifier

J'ai remarqué que Wikipédia offre de multiples possibilités de liens. On pourrait donc lister d'une part toutes les relations entre articles et entre catégories :

  • relations d'identité
  • relations de rapport (préciser les différents cas)
  • ... etc

et d'autre part ce qu'offre Wikipédia :

  • les liens internes simples
  • les liens internes des articles connexes (partie "voir aussi")
  • les catégories
  • les entêtes de catégories ou on met les catégories connexes
  • ... etc

puis discuter sur les règles à établir : pour exprimer tel type de relation, à priori privilégier tel type de liens.

Par ailleurs, je pense qu'il y a une vraie attente pour des règles sur l'organisation d'arborescence de portail ou de projet. Xila 16 mai 2006 à 12:00 (CEST)Répondre

C'est une très bonne idée de rationalisation, j'essaiera de donner un avis un peu plus constructif rapidement. Boeb'is 21 mai 2006 à 12:59 (CEST)Répondre
Les pistes avancées sont tout à fait interessantes, mais j'ai du mal à voir les perspectives concrètes.
Un des problèmes que j'avais trouvé en débatant/trollant sur les catégories était la question de savoir si on devait catégoriser en fonction de ce que l'article a apporté à la catégorie, ou sur ce que la catégorie a apporté au tout. Cela soulignait notamment la différence entre les catégories assez consensuelles, et celles qui se fondent sur des aspects secondaires.
Toute une partie des catégories se fondent sur un rapprochement entre articles qui ne pourrait pas se faire par les liens internes, et sont pour moi assez peu pertinent. Elles se bornent à faire des rapprochements bruts, à faire des liens type base de donnée sans tenir compte de la navigation.
Exemple: les catégories femmes, années de naissance ou de mort, religion, établissement soclaire passé... Ce sont des catégories qui n'ont plus du tout le sens de "voir aussi". Boeb'is 26 mai 2006 à 14:34 (CEST)Répondre
Je pense que tes questions sont au coeur du débat : Qu'est-ce qu'une catégorie ? Dans Aide:Catégorie, on donne cette définition : "les catégories doivent être considérées comme des contenants — des boîtes de rangement, en quelque sorte" et on précise : "les différents articles de Wikipédia constituent le véritable contenu encyclopédique". Pour complèter cette définition, on peut se poser cette question : à quoi sert une catégorie ?
Réponse : C'est un contenant qui sert à ranger, à mettre ensemble du contenu, pour le rendre plus lisible, plus accessible en l'ordonnant. Et c'est cette volonté de rendre lisible le contenu qui devrait, à mon sens, permettre de résoudre de façon pragmatique, les cas qui apportent plus de confusion que de clarté. Car il y a d'autres moyens qui rendent le contenu plus lisible. Se restreindre à n'utiliser que le moyen le plus pertinent permet à tous les moyens de garder leur rôle et donc de rester efficace (enfin bon, c'set général ce que je dis là, c'est plus une volonté de rationaliser).
Prenons l'exemple des personnes, anciens élèves d'une grande école. Une liste rendra bien plus lisible le contenu existant qu'une catégorie. On saura qui a fait cette école, quand ils l'ont faite, ce qu'ils sont actuellement ou ce qu'ils ont été.
C'est une tâche complexe mais passionnante : il faudrait définir les rôles des différents moyens mis à disposition par wikipédia.
Xila 27 mai 2006 à 13:47 (CEST)Répondre
Vos idées sont tout à fait pertinantes. Mais il me semble que beaucoup de créateurs d'articles ont tout simplement du mal à mettre leur article dans une catégorie appropriée. Il m'est arrivée de demander à des contributeurs de préciser leur article et de mettre une catégorie. Ils ont ajoutés les informations et m'ont laissé le soin de trouver la catégorie. Càd, ici on mène une discussion pour initiés, qui passe au-dessus de la tête d'un bon nombre. Mais je ne crois pas que s'est genant. J'aimme assez ajouter les catégories et il est urgent de les précisier Traumrune 27 mai 2006 à 23:22 (CEST)Répondre
Exact, il est nécessaire de rédiger des recommandations (peut-être à inclure dans l'aide). Voici ce que j'ai proposé dans Discussion Projet:Théâtre/Catégories, comme recommandations pour les catégories :
  1. Dans l'entête de la catégorie, définir quels sont les articles attendus (Proposition de Utilisateur:Helldjinn dans la section 1 de cette discussion)
  2. Toujours dans l'entête de la catégorie, indiquer quelles sont les catégories connexes (ou voisines) => rend plus lisible les arborescences en les allègeant, tout en offrant une naviguation large.
  3. Choisir le titre de la catégorie en fonction des articles attendus. exemple : il y a 175 articles sur des pièces de théâtre d'Eugène Labiche, donc une catégorie s'impose. Il me semble préférable de donner comme titre Pièce de théâtre d'Eugène Labiche que Eugène Labiche.
  4. S'interroger avant de mettre une catégorie dans une autre catégorie : Faut il mettre l'article qui traite du sujet ou bien la catégorie ? Est-ce que tous les articles de cette catégorie correspondent à la sur-catégorie ? => exemple : ne mettre que l'article principal Metteur en scène dans la catégorie Métier du théâtre, plutôt que de mettre la catégorie Metteur en scène dans la catégorie Métier du théâtre, autrement confusion : articles sur des personnes dans une catégorie qui concerne des métiers.

Xila 29 mai 2006 à 13:31 (CEST)Répondre

38 000 catégories, certaines quasi vides, et quand on veut catégoriser on s'y perd un peu

modifier

Bonjour à tous. Nouveau sous wikipédia, je veux trouver dans quelles catégorie mettre mes articles, et je tombe sur une liste fabriquée par un robot de ... 38000 catégories, qu'on ne peut consulter que 500 à la fois, en commençant par 10 pages de numéros et dates ... pas hyper simple. En plus je voulais mettre ici un lien vers cette page, mais je ne la retrouve plus... Alors je me dis plusieurs choses :

  • si on regroupait ces catégories dans de grandes pages permettant de trouver facilement les catégories adhoc ?
  • si on mettait un système pour qu'une catégorie ne commence vraiment à apparaître comme sérieuse que quand elle a au moins 3 articles (ça supprimerait beaucoup de catégories quasi vides). On pourrait faire une exception pour les catégories systématiques (ex fictif : album de rock de 1973 même sans article dedans pourrait rester si les album de rock de 1972 ou de 1971 ou de 1974 ... en contiennent pas mal, histoire de ne pas casser la série).
  • si on créait une liste des nouvelles catégories créées, qui attendraient une validation pour entrer dans la structure générale (histoire qu'on n'ait pas à repasser les 38 OOO en revue pour toute mise à jour des tables, histoire aussi de trouver des candidats à étoffer les catégories encore trop peu remplies pour être promues).
  • si on mettait une page Catégorie, histoire que quand on recherche catégorie dans "rechercher" on tombe sur quelque chose qui guide ?

Ces questions sont-elles idiotes ? Peut-être qu'existe déjà tout ou partie de ce que je raconte, mais que simplement je ne connais pas. Merci de m'éclairer alors. Je suis pret alors à me mettre au travail sur ces points. Cordialement, et wikiment vôtre, lafud.

Bonsoir. Le plus simple est de cliquer dans la page d'accueil sur "Table des catégories" sur cette page tu peux choisir la lettre de l'alphabet que tu veux, puis préciser. Tu sais sûrement si ton article parle de littératuer, de sport ou de chimie, etc. Un autre truc (que j'utilise souvent) regarder dans un article d'une thématique proche, comment il a été catégorisé. Bonne chance. Traumrune 8 juillet 2006 à 23:10 (CEST)Répondre

Thèmes ou catégories ?

modifier

Bonjour, Ignorant l'existence de cette page j'ai entamé un débat sur le thème des catégories sur le bistro. Peps 2 août 2006 à 22:02 (CEST)Répondre

Relation de rapport

modifier

Bonjour,
Je crois que j'exhume une page morte, mais en même temps elle est dans la section "À faire" du Projet:Catégorie, alors... Et puis toutes les pages que j'ai pu trouvé traitant de ce sujet sont éteintes, mais encore là, comme si la discussion s'était soudainement arrêtée sans que de solution soit trouvée.
Pour en revenir au sujet, le problème semble quand même venir du mélange de type de relations dans les catégories. La relation de rapport, particulièrement, pose problème car sa non-transitivité la rend incompatible avec les deux autres. Ne faudrait-il pas admettre qu'un seul espace de noms pour représenter trois choses différentes ne fonctionne pas ?
Comme cela avait déjà été proposé... quelque part, la relation de rapport fonctionnerait mieux avec des étiquettes (tags). C'est un fonctionnement pourtant très répandu dans le web, et je suis surpris de ne pas le retrouver sur Wikipédia. Ou pas en fait, car il est vrai que l'utilisation de ces "hashtags", mots-dièses, etc, n'est souvent pas très rigoureuse. Par contre, contrairement aux propositions que j'ai pu lire ici ou là, la mise en place de ces étiquettes ne doit pas signifier la fin des catégories. La guerre indexeur Vs découpeur n'a lieu que parce que chacun veut utiliser le même outil pour son idée. La mise en place d'un outil chacun pourrait résoudre bien des problèmes.
En résumé : on garderait les catégories pour le découpage par relations d'identité et d'appartenance, et on mettrait en place des étiquettes pour l'indexation par relations de rapport.
Évidemment, la mise en place d'un nouvel outil est long et compliqué, mais où en sont tous ces projets sémantiques ? Tous les liens dans les anciennes discussions sont morts.
J'arrive peut-être après la guerre, mais si une décision consensuelle et fonctionnelle a été prise, il faudrait alors mettre à jour les pages d'aide et de projet, car en pratique l'arborescence est toujours un joyeux bazar aujourd'hui.
Popsygel (discuter) 10 décembre 2020 à 08:44 (CET)Répondre

Revenir à la page « Catégories/Méthodes de catégorisation ».