Discussion:TF-IDF

Dernier commentaire : il y a 4 ans par Rguillome dans le sujet Modification de la section exemple "point final"
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

On utilise pas plutôt Tf•idf, au lieu du tiret ?? Sylenius 18 octobre 2007 à 21:45 (CEST)Répondre

Je pense que pour des raisons pratiques, le tiret a été préféré pour la dénomination de cette mesure. Les autres Wiki ont fait ce choix en tout cas. On peut faire un redirect à la rigueur pour tf*idf. Dake@ 18 octobre 2007 à 22:49 (CEST)Répondre

Modification de la section exemple "point final"

modifier

La conclusion : Le premier document apparaît ainsi comme « le plus pertinent ». dans la section point final ne sert a rien, car IDF est constant sur tout les documents. Ce qui est important c'est de mettre un calcul de deux termes pour avoir un TF et IDF utile, et ainsi montrer que l'un des deux termes est plus représentatif dans le document.

Je n'ai pas le temps pour le moment de faire la modification dans le wiki, mais voici un point facile à améliorer.

--== Imprécision sur l'explication IDF dans l'introduction ==

C'est pourquoi le schéma propose d'augmenter la pertinence d'un terme en fonction de sa rareté au sein du corpus : la fréquence du terme dans le corpus (IDF) est élevée

Ne faut-il pas préciser "la fréquence inverse est élevée" ou plus exactement : le poids associé à un terme est inversement proportionnel à sa fréquence dans le corpus. {{--Rguillome (discuter) 4 décembre 2020 à 10:05 (CET)|Rguillome|4 décembre 2020 à 09:49 (CET)|177259898}}Répondre

Revenir à la page « TF-IDF ».