Discussion:Méthode de Viola et Jones/Article de qualité

Autres discussions [liste]

Admissibilité
Neutralité
Droit d'auteur
Article de qualité
Bon article
Lumière sur
À faire
Archives
Commons

Cet article a été promu comme Article de qualité en vertu de ce vote.
Merci de remplacer ce modèle par {{Contestation CdQ}} si le vote est remis en cause.

Article promu au terme du premier tour.

Bilan : 12 pour, 0 bon article, 0 attendre, 2 autre(s) vote(s).
Commentaire : au moins 8 votes Article de qualité et (pour) / (pour + bon article + attendre) = 100% > 90%

Sardur - allo ? 28 novembre 2010 à 00:25 (CET)Répondre

Méthode de Viola et Jones

Dernier commentaire : il y a 14 ans34 commentaires14 participants à la discussion

Proposé par : Sylenius (d) 27 octobre 2010 à 23:23 (CEST)Répondre

Il est toujours délicat de présenter des articles techniques aux labels, mais je fais une exception pour celui-ci, en raison du wikiconcours, et parce que ça m'amuse: j'ai initié une PàS sur ce même article au début de l'année Voilà, voilà...

Plus sérieusement, article technique certes, mais avec des applications directes qui, je l'espère, sont suffisament parlantes pour les non-initiés. Plusieurs paragraphes (historique, applications, implémentations) devraient être compréhensibles sans s'arracher les cheveux. Sylenius (d) 27 octobre 2010 à 23:32 (CEST)Répondre

Votes

Format : Motivation, signature.

Article de qualité

Article de qualité Proposant. Sylenius (d) 27 octobre 2010 à 23:32 (CEST)Répondre
Article de qualité Article complet, précis et didactique. --Indif (d - c) 27 octobre 2010 à 23:51 (CEST)Répondre
Article de qualité Pour un non-initié, j'arrive à comprendre la méthode. Un très bon travail de compréhension a été faite. cédricGravelle 28 octobre 2010 à 23:03 (CEST)Répondre
Article de qualité Big brother est en marche. Skiff (d) 30 octobre 2010 à 07:42 (CEST)Répondre
Article de qualité Excellent article. JÄNNICK Jérémy (d) 31 octobre 2010 à 17:26 (CET)Répondre
Article de qualité Bien, accessible aux profanes Prosopee (d) 7 novembre 2010 à 13:30 (CET)Répondre
Article de qualité Bien, rien à redire Matei13 (d) 9 novembre 2010 à 07:11 (CET)Répondre
Article de qualité Article clair et complet. Bon travail --K2Death (d) 11 novembre 2010 à 13:10 (CET)Répondre
Article de qualité Didactique, complet sans être obscur. Xiawi (d) 13 novembre 2010 à 13:59 (CET)Répondre
Article de qualité Article complet et surtout accessible à tous. Bserin ^{(Bar des Ailes)} 17 novembre 2010 à 13:58 (CET)Répondre
Article de qualité J'ai presque tout compris, --Jigsaww (d) 19 novembre 2010 à 21:07 (CET)Répondre
Article de qualité Ne manquerait plus qu'un schéma et de la complexité Philippe Giabbanelli (d) 26 novembre 2010 à 01:01 (CET)Répondre

Bon article

Attendre

Neutre / autres

Neutre Devoir de réserve, en tant que juré. Gemini1980 oui ? non ? 30 octobre 2010 à 01:02 (CEST)Répondre
idem Udufruduhu (d) 9 novembre 2010 à 13:56 (CET)Répondre

Discussions

Toutes les discussions vont ci-dessous.

Lecture de Philippe

Bonjour. C'est toujours délicat d'essayer de faire des articles techniques. Et c'est plus rarement qu'on les voit mit en PàS puis en AdQ par la même personne J'apprécie l'effort sur l'accessibilité au grand public. J'ai quelques questions. « À performances équivalentes, Viola et Jones notent que la détection par leur méthode est 15 fois plus rapide que le détecteur de Rowley-Kanade »

Cela m'étonnerait que le coût exact de l'algorithme soit 15 fois moindre, donc j'imagine qu'on est en train de parler d'un testbed particulier. Il faut préciser lequel. De même, on peut dire ce qu'on entend par performance. Je pense qu'on se dirige vers : "Viola et Jones notent que leur méthode est 15 fois plus rapide que celle de Rowley-Kanade, pour un même taux de détection des visages dans les images issues de ...".

Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

Je n'ai trouvé aucune complexité temps/espace, ni des algorithmes cités dans leurs ensembles, ni de leurs étapes. Je pense qu'il serait bien de donner la complexité là où on la connaît, et d'avoir un résumé pointant les étapes où on ne sait pas quel sera le temps (un encadrement ?).

Il n'y pas à ma connaissance d'analyse en complexité ou en temps de ce type (et je ne suis pas sûr que ce soit approprié ici). N'oublie pas non plus que la communauté des gens en vision par ordinateur est disparate et que l'analyse de la complexité est un loin d'être un réflexe, c'est un truc d'informaticien ça !

Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

« La méthode de Viola et Jones est une approche basée apparence[12], qui consiste à parcourir l'ensemble de l'image en calculant un certain nombre de caractéristiques dans des zones rectangulaires qui se chevauchent »

Une approche basée apparence ? Quézaco ? Il n'est pas clair si ce qui suit ("qui consiste à...") définisse ce qu'est une méthode basée apparence en général, ou la méthode de Viola et Jones en particulier. Je pense qu'une section d'introduction des éléments à comprendre serait idéale. On nous parle dès l'histoire d'utiliser « des caractéristiques construites à partir d'ondelettes de Haar » sans avoir clairement défini ce qu'on entend par caractéristique. Oui, toutes ces choses là sont dans des articles séparés, mais je trouve que c'est le problème des articles techniques. Je pense qu'un petit résumé de ces notions fondamentales aiderait.

Il manque une wikification ici sur méthode basée apparence, ça mériterait au moins une définition qqpart, voir un article. Sur la définition des caractéristiques, c'était normalement le rôle de la première phrase du paragraphe caractéristique, j'ai remanié pour que cela soit un peu plus clair. Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

« en calculant un certain nombre »

Quand la méthode a été introduite, est-ce qu'il s'agissait d'un cadre qui laissait libre choix quant aux caractéristiques utilisées, ou est-ce qu'elle disait précisément quelles caractéristiques étaient utilisées ?

La méthode précise les caractéristiques mais laisse entendre que l'on peut utiliser autre chose. Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

« Une deuxième innovation importante est la sélection de ces caractéristiques par boosting, en interprétant les caractéristiques comme des classifieurs. »

Probablement pas compréhensible de la plupart des gens, même en jonglant entre les articles boosting et classifieurs. Je serais pour en parler dans une première section de notions essentielles. Sinon, les gens vont devoir continuer dans la section qui en parle dans l'article, puis revenir en arrière pour recoller les morceaux.

« architecture pour combiner les classifieurs boostés en un processus en cascade »

Pareil. Pas compréhensible, serait bien d'expliciter davantage à cet endroit.

voir la remarque plus bas. Si on commence à dérouler la pelote maintenant, on est fichu. Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

« ce qui apporte un net gain »

Mesuré comment ? de quel ordre ?

à ce stade, on reste dans le descriptif, les détails et les chiffres, c'est plus loin. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« Plutôt que de travailler directement sur les valeurs de pixels, et pour être à la fois plus efficace et plus rapide »

Plus efficace et plus rapide veut dire qu'en ne travaillant pas directement sur les pixels, il y un gain en "efficacité" autre que le temps. D'accord... quelle efficacité exactement ? Est-ce que ne pas travailler directement sur les pixels améliore le taux de classification avec succès ? Mais si on calcule toutes les statistiques à partir des pixels à chaque fois, tout devrait être pareil sauf le temps, non ?

Si on travaille directement avec les pixels, il est probable que ça ne marche tout simplement pas. Ceci est une affirmation très générique, et qui est l'une des bases de la vision par ordinateur, l'utilisation de représentations intermédiaires condensées en information à la place des pixels, ça n'aurait pas trop de sens de quantifier cela ici maintenant. Je ne suis pas sûr de bien comprendre la question, , mais en gros, c'est la magie de la transformation de l'espace des pixels à l'espace des caractéristiques, on passe d'une représentation redondante et peu structurée à quelque chose de synthétique et plus informatif. Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

« typiquement de 24 × 24 pixels[2] ou de 20 × 15 pixels[13] »

Pourquoi ces nombres ?

Parce que

. Bon, le 24x24, c'est pour du visage, donc un carré, le 20 × 15, c'est pour des personnes, donc plus haut que large. Sur les valeurs exactes, c'est ce qu'on trouvé les auteurs comme ce qui marchait le mieux. ça change suivant les données, les databases ou les objets à détecter, Purement empirique. Sylenius (d) 19 novembre 2010 à 23:14 (CET)Répondre

Pour la section Calcul, un exemple sous forme de galeries de la façon dont la fenêtre se déplace et change de taille me semblerait très pratique.

Oui, ça serait bien. A voir. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« aux variations d'illumination »

Homonymie. Variations de lumière ?

La wikification n'avait pas de sens en effet. Variations d'illumination est le terme adéquat. On peut utiliser conditions d'éclairage, mais c'est un peu ambigu. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« c'est-à-dire au moins légèrement meilleurs que le hasard »

Expliciter (=dont les performances sont au moins supérieures à celle d'un classifieur retournant une réponse aléatoire)?

C'est ça.

« couple (caractéristique, seuil) »

Qu'est-ce que c'est ce seuil ? Je vois qu'on le défini mathématiquement après, mais quelques mots seraient utiles.

« génère l'erreur la plus faible »

Comment est calculée l'erreur d'un classifieur ? 10-fold cross validation, puis racine ?...

L'erreur est donnée par la formule, et est une somme pondérée des différences entre la réponse du classifieur et la "valeur réelle" de l'exemple d'apprentissage. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« aux exemples difficiles à classer »

Comment est-ce qu'on mesure qu'ils sont difficiles à classer ?

Ils produisent une erreur importante.

précisé. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« Idéalement, le but est d'obtenir un classifieur h qui prédise exactement les étiquettes pour chaque échantillon »

Ce ne serait pas quelque chose à éviter d'avoir un fit excessif pour un classifieur sur l'ensemble de test ?

sur l'ensemble d'apprentissage tu veux dire ? oui, ça serait de l'overfitting. Ici, je ne fais cette remarque que pour introduire la notion d'erreur et aussi clarifier les notations et le principe en donnant le but visé, y=h(x). Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« les classifieurs les plus simples, donc les plus rapides, sont situés au début de la cascade, et rejettent très rapidement la grande majorité des exemples négatifs »

Pourquoi est-ce que ces classifieurs ne peuvent pas avoir de faux négatifs ? On parle après du taux de fausse alarme, mais...

les faux négatifs existent, d'ailleurs on les voit sur la courbe de résultats. Lorsque l'on parle de taux de détection, on est sensé se douter qu'il n'est pas de 100% Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« les résultats sont globalement proches des autres détecteurs, quoique légèrement inférieures aux résultats de Rowley-Kanade pour un faible nombre de fausses alarmes, et légèrement supérieurs pour un nombre de fausses alarmes élevées »

Vague. La pratique courante est d'avoir un graphique avec plusieurs courbes montrant les performances des uns et des autres sur le même ensemble test.

oui, mais ici sur wp, cette phrase me semble suffisante et appropriée. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

« temps de traitement moyen de 0,067 secondes pour une image [...] Une autre limitation importante de la méthode de Viola et Jones concerne le temps d'apprentissage de la cascade, compris généralement entre plusieurs jours et plusieurs semaines de calcul[ »

Je pense qu'il serait utile avant de parler du temps de traitement moyen de préciser qu'il y a, avant ça, un temps long à passer pour l'entraînement.

C'est vrai que cette info n'est pas présente avant, je vais essayer de la caser quelque part. Sylenius (d) 20 novembre 2010 à 16:43 (CET)Répondre

J'avoue que j'ai eu un peu de mal, mais en répondant à ça, ça devrait s'éclairer (ou s'illuminer ). Philippe Giabbanelli (d) 17 novembre 2010 à 08:00 (CET)Répondre

Merci d'avoir pris le temps de lire l'article en profondeur. Je vais répondre à certaines de tes remarques de manière générale, notamment celles où je n'ai pas vraiment de solution. Tout d'abord, je ne pense pas qu'il soit possible de comprendre tout le fonctionnement en détail de la méthode à partir seulement de cet article, surtout sans connaissances préalables, et d'ailleurs, ce n'est pas vraiment le but non plus. Ce n'est qu'une porte d'entrée, qui donne les principales notions et résultats, et n'est pas la somme complète des connaissances sur la méthode (d'ailleurs ça ne serait pas sourçable), et encore moins un guide d'implémentation.

Sur le fait de faire des allers-retours pour recoller les morceaux, je ne sais pas comment l'éviter, en particulier ici où beaucoup de choses sont imbriquées. D'ailleurs, ça ne me semble pas si néfaste que ça, sur ce genre d'article technique, il y a toujours de toute façon plusieurs passes de la part du lecteur pour pouvoir comprendre, c'est un processus normal d'apprentissage que de faire des allers-retours. La présentation de la méthode au début de l'article comporte donc quelques phrases que je sais incompréhensibles en première lecture, car très générales, et possiblement plus compréhensibles après lecture entière de l'article et recollage des morceaux. Sylenius (d) 19 novembre 2010 à 22:23 (CET)Répondre

Ajouter un sujet