Noyau (statistiques)

fonction de pondération utilisée dans les techniques d'estimation non-paramétrique

Un noyau est une fonction de pondération utilisée dans les techniques d'estimation non-paramétrique. Les noyaux interviennent dans l'estimateur par noyau pour estimer la densité de probabilité d'une variable aléatoire, ou encore dans la régression paramétrique (à noyau) pour estimer des espérances conditionnelles. Pour les séries temporelles, le noyau permet d'estimer la densité spectrale.

Définition

modifier

Un noyau est une fonction positive, intégrable et à valeurs réelles, notée K, qui doit vérifier les deux conditions suivantes :

  • normalisation :  
  • symétrie :   pour toutes les valeurs de u.

La première condition assure que l'estimation à noyau soit bien une densité de probabilité, la seconde assure que l'espérance de l'estimateur est égale à celle de la fonction estimée.

Si K est un noyau, alors il en ira de même pour K* = 1/λK(u/λ), où λ > 0. Cette méthode permet de choisir une échelle adaptée aux données.

Les différents noyaux courants

modifier

Plusieurs types de noyaux sont couramment utilisés : uniforme, triangle, d'Epanechnikov, quadratique, cubique, gaussien, et circulaire.

Ci-dessous, on note   la fonction indicatrice qui vaut 1 lorsque p est vrai, 0 sinon.

 
Tous les noyaux évoqués représentés dans le système de coordonnées usuel.

Uniforme

modifier

La forme du noyau est une fonction porte :

 

La fonction estimée aura alors la forme d'un histogramme et n'aura d'intérêt que pour avoir une première estimation de la forme du modèle lisse.

Triangle

modifier

La forme du noyau est une fonction triangulaire :

 

La fonction estimée sera alors linéaire par morceaux.

Epanechnikov

modifier

On parle aussi de noyau « parabolique ». Il porte le nom de V.A. Epanechnikov, qui l'a utilisé et étudié pour la première fois en 1969[1] :

 

Ce noyau permet d'avoir l'estimateur le plus efficace pour la densité.

Quartique

modifier
 

Cubique

modifier
 

Gaussien

modifier
 

Circulaire

modifier
 

Voir aussi

modifier

Références

modifier
  1. (en) V. A. Epanechnikov, « Non-Parametric Estimation of a Multivariate Probability Density », Theory Probab. Appl., vol. 14, no 1,‎ , p. 153–158 (DOI 10.1137/1114019)

Liens externes

modifier