Discussion:Analyse des données/Article de qualité

Dernier commentaire : il y a 12 ans par Udufruduhu
Autres discussions [liste]

Cet article a été rejeté au label Article de qualité en vertu de ce vote.

Merci de remplacer ce modèle par {{Instructions pAdQ}} si le vote est remis en cause.

Cet article a été reconnu Bon article en vertu de ce vote.
Merci de remplacer ce modèle par {{Contestation BC}} si le vote est remis en cause.

Article accepté comme « bon » au terme du second tour.

  • Bilan : 3 pour, 7 bon article, 0 attendre, 2 autre(s) vote(s).
  • Commentaire : (pour) / (pour + bon article + attendre) = 30 % < 75 % mais (pour + bon article) / (pour + bon article + attendre) = 100 % ≥ 66 %

Udufruduhu (d) 29 février 2012 à 00:09 (CET)Répondre

Article en second tour.

  • Bilan : 3 pour, 4 bon article, 0 attendre, 1 autre(s) vote(s).
  • Commentaire : Au moins 8 votes et (pour) / (pour + bon article + attendre) = 42,8 % ≤ 90 % mais (pour + bon article) / (pour + bon article + attendre) = 100 % > 50 %

Udufruduhu (d) 15 février 2012 à 00:19 (CET)Répondre

Analyse des données

modifier

Proposé par : Jackverr (d) 14 janvier 2012 à 14:14 (CET)Répondre

Je vous propose cet article, au vote pour le label AdQ suite à la relecture effectuée par PAC2, que je remercie ici pour son soutien. « L'Analyse des données (statistiques) est l'ensemble des méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives (F.Husson) ». Je pense que l'ensemble de ce sujet est couvert par l'article, des efforts ont été fait pour se référer aux sources les plus sérieuses et ne pas rendre l'article trop technique.

Format : Motivation, signature.

Article de qualité

modifier
  1.   Article de qualité : en tant que proposant.--Jackverr (d) 14 janvier 2012 à 14:24 (CET)Répondre
  2.   Article de qualité : Je ne suis pas un expert et je ne dis pas que Malosse ou Lebrouillard sont dépourvu d'arguments, mais l'article est de bonne facture et il mérite au moins le BA (je vote AdQ pour faire pencher un peu la balance vers le positif et parce que je n'ai pas personnellement d'objection). Psemdel (d) 7 février 2012 à 13:26 (CET)Répondre
  3.   Article de qualité les critères me semblent remplis, quoique l'article est effectivement dur à « digérer ». Rien de rédhibitoire cependant. - Bzh99(d) 12 février 2012 à 17:05 (CET)Répondre

Bon article

modifier
  1.   Bon article Article touffu mais détaillé. Je suis un semi-amateur dans le domaine. Par exemple l'analyse en composants indépendants n'est pas vraiment explicitée. Il manque une introduction pour le mathématicien qui est habitué à raisonner en bourbakiste (ensemble, application etc...)Malosse (d) 16 janvier 2012 à 06:06 (CET)Répondre
    Je me demande s'il faut laisser dans l'article, les passages sur l'ACI, après tout elle ne fait pas vraiment partie de l'Analyse des données? --Jackverr (d) 16 janvier 2012 à 22:06 (CET)Répondre
    J'ai regroupé les sections des paragraphes Définition, Historique, et Domaines d'application pour rendre le début de l'article non pas Bourbakien   mais un peu plus clair.. du moins je l'espère.--Jackverr (d) 17 janvier 2012 à 22:43 (CET)Répondre
  2.   Bon article Très bien techniquement, et extrêmement utile pour servir de poly à des étudiants dans le secteur, mais l'article ne s'adresse pas au grand public. J'ai fait de l'analyse de données pendant 60h en école d'ingé et j'ai eu du mal à terminer la lecture de l'article sans froncer les sourcils (j'ai jamais été une bête en la matière, mais bon...). N'y a-t-il pas moyen de le rendre plus abordable à tout un chacun ? Pas d'éléments dans l'article sur les faiblesses de la méthode ? Lebrouillard demander audience 1 février 2012 à 01:12 (CET)Répondre
    Merci. Je ne sais pas faire plus simple. J'ai pourtant fait un effort pour rendre cet article le moins technique possible. apparemment ce n'est pas suffisant. Pour les faiblesses il y en a. Ce que je n'ai pas ce sont des références sur ces faiblesses. Je vais chercher du coté des anglais .--Jackverr (d) 1 février 2012 à 21:02 (CET)Répondre
    je n'ai pas trouvé de références crédibles contenant des critiques de ces méthodes, à partir du moment où elles sont employées dans le cadre pour lesquelles elles ont été créées. Les anglais critiques le fait que ce sont des méthodes purement descriptives et ne permettent pas formellement de trouver des schémas (patterns), mais on ne peut pas critiquer une méthode pour ce qu'elle n'est pas, à mon avis. De plus cette critique est assez diffuse dans la littérature, je n'ai pas trouvé d'articles faisant une analyse critique systématique (je me répète).--Jackverr (d) 5 février 2012 à 13:02 (CET)Répondre
  3.   Bon article Après hésitations, l'article est en effet assez complet mais je pense qu'il pourrait y avoir des efforts supplémentaires pour rendre cet article plus facile à lire pour le lecteur lambda. La définition pourrait notamment être un peu plus explicitée, car en l'état, la première phrase du paragraphe aurait de quoi dégoûter de poursuivre l'article. Je pense qu'on pourrait se passer de la dernière phrase de l'intro (le résumé du résumé...). Sinon je sais pas trop quoi pensé du paragraphe Domaines d'applications, qui m'a semblé plus une liste d'exemples (je ne dit pas que les exemples sont inutiles loin de là) sans traiter tous les cas où on peut utiliser l'analyse de données (presque infinis).--Ben23 [Meuh!] 13 février 2012 à 00:33 (CET)Répondre
    j'ai supprimé la dernière phrase inutile de l'intro.--Jackverr (d) 13 février 2012 à 22:21 (CET)Répondre
  4.   Bon article Idem que Ben23, mais félicitation pour ce très beau travail ! --Babouba Envie de me répondre ? 13 février 2012 à 14:16 (CET)Répondre
    merci--Jackverr (d) 19 février 2012 à 19:37 (CET)Répondre
  5.   Bon article Je viens de relire l'article, j'ai modifié quelques majuscules pour garder une cohérence entre les sigles. L'article me parait bien expliqué avec des liens vers les articles plus détaillés, des exemples à chaque fois. Beaucoup de noms cités, des sources pour chaque argument, des livres qui semblent de référence. Je ne peux pas voter pour un AdQ, n'étant pas spécialiste du domaine et ne sachant pas juger les informations écrites et/ou manquantes, même si l'auteur semble être bien au courant du sujet. J'aurais apprécié une « belle » image en tête d'article histoire de le rendre plus attractif vu qu'il n'y a que du texte pendant les 3 premières sections. Ipipipourax (d) 20 février 2012 à 11:54 (CET)Répondre
    OK, je vais essayer de trouver une illustration à mettre en tête de l'article.--Jackverr (d) 20 février 2012 à 20:29 (CET)Répondre
    je viens d'inclure une image représentant les différentes sorties graphiques qu'on peut obtenir après une analyse factorielle multiple. Je ne suis pas trop content du résultat. Je ne sais pas si je vais la laisser......--Jackverr (d) 20 février 2012 à 22:36 (CET)Répondre
    Effectivement on a une vue globale mais finalement on voit pas grand chose. Peut-être faut-il choisir une image même si ce n'est qu'un exemple. Ipipipourax (d) 21 février 2012 à 17:21 (CET)Répondre
    les Iris...peut-être?pas mal les Iris non?--Jackverr (d) 21 février 2012 à 22:31 (CET)Répondre
    Les iris je trouve ca tres bien, exemple parlant, historique et esthetique. Bon choix, a mon gout. Ipipipourax (d) 23 février 2012 à 16:15 (CET)Répondre
  6.   Bon article Il n'y a rien de faux dans cet article, mais je ne pense pas qu'il ait les caractéristiques de l'article encyclopédique parfait. Je suis bien conscient que l'exercice est difficile, c'est avant tout un domaine technique, et cet article général doit jongler avec une liste de résumés d'articles plus détaillés. J'ai trouvé les résumés beaucoup trop orientés vers le côté technique, et pas assez vers le côté fonctionnel. On a par exemple à de nombreuses reprises des expressions du type "l'analyse s'applique à p variables sur n individus", alors que ni p, ni n ne sont réutilisés par la suite, bref, plein de petites technicités inutiles. Par contre, rien n'indique vraiment à quoi servent les analyses, leurs avantages, leurs inconvénients, leur interprétation, etc. Par exemple, les analyses sont abondamment illustrées par des graphiques, mais on ne donne pas les clés de lecture ; je pense qu'on est à la limite de la décoration. J'ai également repéré deux défauts importants: le recours inutile à des citations (y compris pour définir le sujet, ce qui me gène pas mal), et l'absence de nombreux liens internes nécessaires à la compréhension (j'en ai rajouté quelques uns, mais il en manque beaucoup). Arnaudus (d) 22 février 2012 à 09:20 (CET)Répondre
    Rien n'est faux dans l'article, merci de le dire. J'ai lu beaucoup de commentaires sur des articles proposés en BA ou en Adq, je n'ai jamais lu un commentaire comme celui-ci. Je pense que vous exagérez en parlant de décoration. Je fais référence aux illustrations dans l'article, pas dans tous les paragraphes, c'est vrai, mais les commentaires des illustrations peuvent servir d'explication. En outre, si vous voulez des compléments, vous pouvez vous rendre sur les articles détaillés. Cet article n'a pas vocation à remplacer les articles détaillés, mais plutôt à donner une vue d'ensemble de l'analyse des données. En ce sens peut-être qu'il n'est pas complet, donc pas Adq. Quant au but de l'analyse des données, je croyais avoir été clair, mais apparemment je me suis trompé, c'est de réduire les dimensions sans une trop grande perte d'information. et les techniques sont différentes selon les données en entrée. Sur les liens internes, vous exagérez aussi, vous en avez créé deux et en fin d'article seulement. Vous avez sans doute raison en disant qu'il en manque, mais à vous lire il semblerait qu'il n'y en a pas. Pourquoi les deux citations vous gênent, je ne le sais pas. Peut-être que vous n'aimez pas les auteurs? Il n'est pas dit dans les recommandations qu'il ne faut pas avoir recours aux citations. Dans l'introduction elle sert à cerner le sujet, ce que j'ai lu dans ce livre me parait concis et précis. Je l'ai réutilisé. Et la citation de JP Benzécri, apporte quelque chose à l'article, là aussi. Elle rend peut-être aussi l'article plus vivant, en tout cas c'est aussi pour cela que j'ai voulu la placer ici. Néanmoins tout ce que vous dites donne des pistes sans doute pour améliorer l'article et le faire évoluer vers quelque chose de meilleur.--Jackverr (d) 22 février 2012 à 21:03 (CET)Répondre
  7.   Bon article. Je pense que le proposant a réalisé un gros travail et que après recherche, il me semble qu'il traduit la façon dont on aborde la question. Mais cette façon technico-technique me pose des problèmes proches de ceux d'autres votants. En effet, selon moi, cela conduit à faire des articles sur les techniques d'analyse des données (qui pour moi serait le titre exact de l'article), pas sur l'analyse des données. En effet il manque tout l'aspect critique. Dans les champs que je connais l'économie et la politique cela me pose réellement de gros problèmes. En effet cela tend trop à faire apparaître les techniques comme des "sciences dures" alors que ce ne sont que des éléments destinés à rationaliser les débats économiques et politiques. Mais encore une fois cette critique s'adresse moins à l'auteur qu'à la façon dont la question semble traiter de nous jours.-- fuucx (d) 24 février 2012 à 18:23 (CET)Répondre
    c'est une constante et donc une réalité, tous les commentaires montrent que cet article est trop technique. A sa décharge, l'article fait partie du projet probabilités et statistiques et non pas de celui des sciences sociales. Mais Là encore c'est une piste d'amélioration à suivre je pense pour les futurs contributeurs. merci pour votre participation au vote et vos commentaires.--Jackverr (d) 24 février 2012 à 21:35 (CET)Répondre

Attendre

modifier

Neutre / autres

modifier
  1.   Neutre Vote technique afin d'atteindre le quorum pour passage au second tour. Gemini1980 oui ? non ? 14 février 2012 à 14:36 (CET)Répondre
  2.   Bon article Merci pour la qualité de l'article et plus généralement pour vos diverses contributions. La principale difficulté du sujet est qu'il est tellement vaste que chaque lecteur peut regretter qu'un domaine ne soit pas davantage développé. En tout cas, quelques exemples supplémentaires aideraient à la compréhension du public. — Le message qui précède, non signé, a été déposé par Jeromede nice (discuter) moins de 50 contributions au lancement de la procédure
    merci, mais quel domaine regrettez-vous qu'il ne soit pas développé, ou pas assez? ça m'aiderait à comprendre pourquoi les lecteurs ne le trouve pas complet, et par conséquent à l'améliorer.--Jackverr (d) 19 février 2012 à 19:37 (CET)Répondre

Discussions

modifier

Toutes les discussions vont ci-dessous.

Remarques/question de Binabik155 (d · c · b)

modifier

Bonjour,

Après une première lecture peu approfondie de l'article, je me pose quelques questions. Pour moi, l'article en l'état ne traite que de ce que l'on pourrait appeler l'« exploration statistique de données » (et vous l'avez très bien fait, il faut être honnête). Mais si l'on parle d'« analyse des données » au sens large, il me semble que des pans entiers du domaine ne sont même pas évoqués (la qualité des données, l'analyse de données qualitatives [du moins plusieurs autres types d'analyse], les démarches/méthodologies d'analyse, la modélisation des données [exemple basique, représenter un échantillon par une loi normale], l'analyse prédictive [très légèrement abordée], etc.). Je me demande donc comment cet article pourrait prétendre couvrir le sujet. Cordialement, Binabik (d) 15 janvier 2012 à 15:19 (CET).Répondre

Bonjour,
tout d'abord je vous remercie pour votre retour de lecture. Mais, je ne crois pas qu'on parle de la même chose. Cet article ne traite pas des statistiques en général, ni même de la statistique exploratoire multidimensionnelle, mais de ce que François Husson et coll. définissent dans leur livre "Analyse des données avec R" comme «l'ensemble des méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives». Donc en fait de ce qu'on appelle l'Analyse des données « à la française ». Il n'y a pas d'hypothèses statistiques formulées dans ces techniques. Mais vous soulevez peut-être un défaut de l'article qui est que son périmètre n'est pas clairement énoncé.--Jackverr (d) 15 janvier 2012 à 18:52 (CET)Répondre
J'ai aussi voulu aborder les liens qui existent entre l'analyse des données et les techniques prédictives, d'où le paragraphe sur les régressions, pour indiquer que cette analyse descriptive n'est pas cantonnée dans le domaine de la description des phénomènes abordés mais sert aussi ailleurs- ce n'est pas une technique isolée en stats.--Jackverr (d) 15 janvier 2012 à 19:07 (CET)Répondre
En effet, clarifier le périmètre me semble vital. Le problème à mon avis est que l'expression « Analyse de données » se retrouve dans bien des domaines, y compris pourquoi pas dans l'anthropologie sociale ou la démarche expérimentale (ou pour vous un champ des statistiques descriptives). Du coup, suivant les lunettes qu'on porte, cet article peut sembler bien surprenant ou ne pas du tout couvrir son sujet. Binabik (d) 15 janvier 2012 à 19:54 (CET)Répondre
Je vais modifier les deux premières phrases de l'intro pour que ce soit plus clair. merci encore de votre aide.--Jackverr (d) 15 janvier 2012 à 20:09 (CET)Répondre

Remarques et question de PST (d · c · b)

modifier

Bonjour,

En l'état, si le contenu de l'article me semble ambitieux, pertinent et correct (dans la limite de mes connaissances, et pour ce que j'en ai lu), la forme ne me semble pas exactement être celle attendue pour un AdQ de wikipédia. Je fais quelques remarques pour expliquer mon sentiment :

  • Dans le résumé introductif :
    • Le ton de la fin du premier paragraphe me semble plus proche de celui d'un enseignant dispensant un cours que de celui d'un article encyclopédique. Cela tien, principalement à l'usage de phrases de la forme « [...] ce qu'on appelle [...] », « On cherche [...] », «On peut également [...] ». Les tournures de phrase de l'article y gagneraient à être relues au regard des convention de styles en usage sur Wikipédia (voir notamment la section #Impersonnel) ,
Je suis d'accord et ajouterai aussi les "nous" qui sont un peu bizarre. Psemdel (d) 19 janvier 2012 à 14:41 (CET)Répondre
  Les "nous" et les "on" viennent d'être supprimés, les phrases réécrites.--Jackverr (d) 19 janvier 2012 à 22:25 (CET)Répondre
  • Dans le corps de l'article
    • Je ne comprends pas le découpage des paragraphes dans la plupart des sessions (Définition et Histoire notamment). En l'état ils me semblent trop succins (ils ne sont composés que d'une ou deux phrases, le plus souvent), et je pense qu'ils gagneraient à être regroupés pour rendre la lecture moins hachée.  --Jackverr (d) 21 janvier 2012 à 13:06 (CET)Répondre
    • La source <exp>i1</exp> ( Philippe Besse, « Introduction à la Statistique exploratoire multidimensionnelle », 2010. Consulté le 27 décembre 2011 ) n'est pas convaincante. Il semble s'agir d'un flyer de cours. Je suis convaincu que des publications académiques plus solides (avec comité de lecture) peuvent être trouvées pour appuyer la définition de ce domaine des statistiques ? 
    • idem pour <exp>i2</exp> ( Noboru Ohsumi, Charles-Albert Lehalle, « Benzecri, Tukey and Hayashi (maths) », 2006. Consulté le 6 Novembre 2011. Il s'agit d'un blog...
    • et pour <exp>i3</exp> : il s'agit d'un discourt à la mémoire d'un défunt selon les usages bouddhistes... Si cette source me semble malvenue pour la section définition, je regrette qu'elle n'ait pas été utilisée pour documenter la section histoire.
    • L'utilisation de phrases de la forme « On pourrait dire [...] » me semble aussi malvenue (notamment dans la section "Histoire") que dans la le résumé introductif. --Jackverr (d) 21 janvier 2012 à 13:06 (CET)Répondre

Je dois arrêter là ma relecture pour l'instant. J'espère avoir été utile.

PST (d) 16 janvier 2012 à 12:17 (CET)Répondre

Merci pour cette analyse riche en améliorations à apporter. J'ai déjà commencé à suivre vos conseils.
dans l'introduction, suppression de la référence, et adoption d'un ton plus neutre. liens vers d'autres articles.
(to be continued)
--Jackverr (d) 16 janvier 2012 à 22:01 (CET)Répondre
voir ma réponse plus haut sur les sections regroupées dans les paragraphes Définition , Bref Historique et Domaine d'Application.--Jackverr (d) 17 janvier 2012 à 22:47 (CET)Répondre

Remarques de Fuucx

modifier

Article très intéressant mais très technique. Ne pourriez-vous pas mieux le situer dans son contexte. Pourquoi a-t-on besoin d'analyser les données à partir du XIXe siècle ? quel est son apport aux autres disciplines ? (il me semble que vous oubliez l'économie notamment) Que cache réellement la différence d'approche d'avec les anglo-saxons ? (à priori à vous lire, ils auraient disons une approche plus "proactive" ou plus "risqué " que nous) . -- fuucx (d) 21 janvier 2012 à 02:36 (CET) . En économie par exemple Stanley Jevons a été un des premiers à s'occuper de ce domaine. -- fuucx (d) 21 janvier 2012 à 08:36 (CET)Répondre

Toute proportion gardée, il me semble que sur cette partie, vous pourriez vous inspirer un peu de ce qui a été fait l'article Histoire du procédé Haber-Bosch vous permettrait de mieux situer le contexte. -- fuucx (d) 21 janvier 2012 à 08:36 (CET)Répondre
Je vais essayer de suivre vos conseils qui vont dans le sens de l'amélioration de l'article effectivement. Je n'ai pas la culture historique des auteurs de l'article que vous citez ni les références, mais je vais essayer. merci d'avoir donné votre opinion.--Jackverr (d) 21 janvier 2012 à 13:11 (CET)Répondre
J'ai essayé de répondre à vos questions dans l'article : je suis persuadé bien que je ne l'ai pas écrit parce que je n'ai pas de référence sur ce point, que ce qui a motivé tout cela est le livre de Darwin « De l'origine des espèces », qui a inspiré son cousin Francis Galton, ensuite la création des tests psychologiques a poussé les statisticiens a trouver de nouvelles techniques mathématiques. J'ai aussi, dans deux notes parce que ce n'est pas le sujet de l'article il me semble, précisé la différence avec « Data Analysis ». Et j'ai complété les applications en y incluant notamment l'Economie.
Pour l'influence de Darwin vous avez raison d'après ce que j'ai lu. C'est lui qui va inspirer certains politiques notamment formés à la Fabian Society à s'intéresser à la question de l'analyse des données. Dés que j'aurais un peu de temps je compléterais un peu cette partie. Il me semble que soit en économétrie soit en analyse de données quelques auteurs importants sont issus de la London School of Economics. Dans ce courant on est d'aprés moi dans l'école anglosaxone où l'analyse des données s'inscrit dans un procesus de décision politique qui débouchera sur la méthode IMC de Herbert Simon. Par ailleurs, il me semble qu'un wikipedien vous a fait des observations sur les prévisions. Or avec la crise financière le problème des prévisions fondées sur l'analyse des données a été centrale voir notamment le Virus B de Christian Walter et Michel de Pracontal au seuil -- fuucx (d) 29 janvier 2012 à 14:55 (CET)Répondre
OK, merci pour la future contribution si vous avez le temps. Pour la prévision, si c'est au sujet de la différence avec Data Analysis, je crois avoir répondu, sinon je vais voir.--Jackverr (d) 29 janvier 2012 à 15:20 (CET)Répondre
Il s'agit peut-être du commentaire de Binabik155 à qui j'ai répondu que l'analyse des données telle qu'on l'entend ici et telle qu'elle avait été abordée par les créateurs de l'article était retreinte à l'analyse descriptive. Si on étend trop le sujet de cet article, on va déborder sur l'analyse multidimensionnelle.--Jackverr (d) 29 janvier 2012 à 17:58 (CET)Répondre

Erreurs dans les renvois bibliographiques

modifier

Bonjour,
L'article comporte 2 liens de renvois bibliographiques erronés, indiqués ci-dessous (pour corriger, s'assurer que des identifiants identiques sont générés par le modèle {{harvsp}} en ref et par le modèle {{ouvrage}}, {{article}} etc. dans la section bibliographique). Cordialement, --Lgd (d) 29 janvier 2012 à 17:13 (CET)Répondre

   Entrée #Tenenhaus_1998 appelée par la référence [b 3]
   Entrée #Tenenhaus_1998 appelée par la référence [b 4]
c'est corrigé. il y avait un blanc en trop. merci.--Jackverr (d) 29 janvier 2012 à 17:44 (CET)Répondre
Revenir à la page « Analyse des données/Article de qualité ».