Erreur statistique

Afin en premier lieuer les sources d'erreurs en statistique, nous allons prendre l'exemple d'un sondage sur un référendum.



Catégories :

Statistiques

Recherche sur Google Images :


Source image : tomroud.com
Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur.

Page(s) en rapport avec ce sujet :

  • ... Dans un premier temps il peut y avoir des erreurs systématiques.... Il faut remarquer ici que l'erreur statistique est par conséquent la différence entre une... (source : w3.uohpsy.univ-tlse2)
  • Remarquons que l'erreur statistique est .... Les erreurs de mesure s'ajoutent aux erreurs statistiques déjà prohibitives pour la. Belgique.... (source : statbel.fgov)
  • L'erreur statistique est malgrt tout minime. Les causes..... cueillies par sondage puis extrapolation i la totalité de la population..... L'application A ces formules des mtthodes de calm1 d'erreurs relatives... (source : doi.wiley)

Afin en premier lieuer les sources d'erreurs en statistique, nous allons prendre l'exemple d'un sondage sur un référendum. D'une part parce que cela concerne l'ensemble des citoyens, et d'autre part le nombre de réponses envisageables, égal à deux, simplifie largement l'étude.

Les erreurs statistiques

Si le sondeur interroge seulement une personne, le résultat du sondage indique un résultat de 100% pour le choix de l'unique sondé. Ce qui est aberrant. On ne peut pas interpoler le résultat d'un échantillon infime à la totalité de la population. Seule la consultation de la totalité des électeurs permettra de connaître la vraie répartition. Malheureusement en pratique on peut seulement sonder un échantillon de cette population. Il faut alors entacher le résultat du sondage par une erreur dite statistique. Cette erreur sera d'autant plus petite que le nombre de sondés tendra vers la population entière. Notez que pour une mesure physique le nombre de mesures parfait est illimité.

Un référendum consiste à répondre par oui ou non. Soit deux possibilités. On peut par conséquent modéliser le référendum par la loi binomiale. Imaginons que r = 255 sondés répondent oui sur un total de n = 500 personnes sondées. On obtient alors une probabilité pour l'oui de p = \frac{r}{n} = 0,51. La variance sur r vaut V (r) = np (1 − p) . Par conséquent la variance sur p est V(p) =
\frac{p(1-p)}{n}. On retrouve d'un point de vue mathématique le comportement intuitif précédent. Si n = 1 la variance est maximale, si n tend vers l'infini la variance devient nulle. Dans notre cas on a un écart type de 2, 2% pour une probabilité pour l'oui de 51%, soit une probabilité comprise entre 48, 8% et 53, 2% pour l'oui, et comprise entre 46.8% et 51.2% pour le non. On ne peut par conséquent tirer aucune conclusion valable sur ce sondage, le nombre de sondés étant manifestement choisi trop petit.

Les erreurs systématiques

Nous avons vu que la principale difficulté pour un sondage est de choisir un échantillon suffisant. Mais cela n'est pas l'unique source d'erreur. Il faut aussi tenir compte de biais à caractère systématique. Dans le cas d'un sondage nous pouvons énumérer les sources d'erreurs suivantes :

Le premier est intéressant, car il interfère avec les erreurs statistiques. En effet les erreurs statistiques sont dues à des fluctuations statistiques dans l'échantillonnage de la population. C'est à dire, les erreurs statistiques sont la conséquence de l'impossibilité de choisir l'échantillon parfait. Une autre façon d'étudier ce phénomène consisterait à calculer la probabilité de souiller un échantillon parfait en intervertissant un, deux, trois etc sondés entre l'oui et le non. Imaginez un bac de bille contenant 51% de billes rouges et 49% de billes bleues. Quelle serait la configuration d'un sac de bille selon sa taille, rempli à partir d'une infime partie du bac ? Ceci est cependant un effet de second ordre. Le sondeur doit prendre garde à ne pas sonder seulement un groupe d'individus orientés pour l'oui ou le non, sinon le résultat serait totalement biaisé. Cependant, cela n'est pas si facile en pratique.

Il est bien plus complexe d'évaluer ce type d'erreurs. Ce qui nous amène à douter toujours plus du résultat précédent sur notre sondage.

Voir aussi

Recherche sur Amazone (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Erreur_statistique.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu