Test d'hypothèse

En statistiques, un test d'hypothèse est une démarche consistant à rejeter une hypothèse statistique, nommée hypothèse nulle, en fonction d'un jeu de données.



Catégories :

Test statistique - Statistiques

Recherche sur Google Images :


Source image : xavier.hubaut.info
Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur.

Page(s) en rapport avec ce sujet :

  • Une fois établies l'ensemble des règles du test d'hypothèse, on doit prélever un échantillon et calculer la valeur de l'indice statistique qui permet d'estimer... (source : er.uqam)
  • Notion de test d'hypothèse. La description de "la" réalité en statistiques se fait avec "variables" qui sont des colonnes de valeurs numériques.... (source : info.univ-angers)

En statistiques, un test d'hypothèse est une démarche consistant à rejeter (ou plus rarement à accepter) une hypothèse statistique, nommée hypothèse nulle, en fonction d'un jeu de données (échantillon).

On cherche par exemple à tester si un certain paramètre θ, qui peut par exemple être la valeur moyenne d'une grandeur, prend une certaine valeur θ0. L'hypothèse nulle dans ce cas est «la moyenne vaut θ0» et l'hypothèse contraire sera «la moyenne est différente de θ0».

Risque de première espèce et de deuxième espèce

Une notion principale concernant les tests est la probabilité qu'on a de se tromper. Dans l'idéal on souhaiterait avoir un test qui renvoie toujours le "bon" résultat. Par exemple on aimerait avoir un test qui choisisse toujours l'hypothèse nulle quand celle-ci est vérifiée et qui rejette tout le temps l'hypothèse nulle quand celle-ci est fausse.

Il y a deux façons de se tromper lors d'un test statistique :

Dans l'idéal on aimerait quoique ces deux erreurs soient nulles, malheureusement ce n'est pas envisageable, en tout cas quand on ne dispose que d'un nombre fini d'observations, et il faut alors faire un choix.

Tests classiques et tests bayésiens

Pour les tests classiques qui forment la majeure partie des tests statistiques, ces deux erreurs jouent un rôle asymétrique. On contrôle seulement le risque de première espèce à un niveau α (principe de Neyman) ; cela revient à considérer que le risque de rejeter l'hypothèse nulle tandis que cette hypothèse est vraie est bien plus coûteux que celui de la conserver à tort (ce dernier risque n'étant pas maîtrisé).

Pour les tests bayésiens on peut quelquefois pondérer ces deux risques grâce à la connaissance d'une probabilité a priori. La connaissance de cette probabilité a priori fait partie des fondements de la statistiques bayésienne et forme l'une de ses difficultés majeures. Si on cherche par exemple à tester le fait qu'un certain paramètre θ vaut une certaine valeur θ0 cette probabilité a priori sera une loi de probabilité sur θ qui donne la probabilité qu'on a d'observer θ. Cette loi a priori est aussi nommée croyance a priori ou croyance bayésienne. Ces tests sont fréquemment d'une mise en œuvre plus complexe que les tests statistiques la raison principale est qu'ils nécessitent de "trouver" une bonne loi a priori puis de la réviser grâce à la révision des croyances.

Classification

D'ordinaire on range les tests dans deux catégories les tests paramétriques et les tests non paramétriques. Les premiers testent la valeur d'un certain paramètre. Ces tests sont le plus souvent les tests les plus simples. Les tests non paramétriques quant à eux ne font pas intervenir de paramètre. C'est par exemple le cas des tests de correction à une loi ou des Test du χ².

On peut aussi distinguer les tests d'homogénéité et les tests de corrections :

Déroulement d'un test

Pour le cas spécifique d'un test unilatéral, le test suit une succession d'étapes définies :

  1. Énoncé de l'hypothèse nulle H0 et de l'hypothèse alternative H1.
  2. Calcul d'une variable de décision correspondant à une mesure de la distance entre les deux échantillons dans le cas de l'homogénéité, ou entre l'échantillon et la loi statistique dans le cas de la conformité. Plus cette distance sera grande et moins l'hypothèse nulle H0 sera probable. En règle générale, cette variable de décision se base sur une statistique qui se calcule à partir des observations. A titre d'exemple, la variable de décision pour un test unilatéral correspond à rejeter l'hypothèse nulle si la statistique dépasse une certaine valeur fixée selon le risque de première espèce.
  3. Calcul de la probabilité, en supposant que H0 est vraie, d'obtenir une valeur de la variable de décision au moins aussi grande que la valeur de la statistique qu'on a obtenue avec notre échantillon. Cette probabilité est nommée la p-value.
  4. Conclusion du test , en fonction d'un risque seuil αseuil, en dessous duquel on est prêt à rejeter H0. Fréquemment, un risque de 5% est reconnu comme acceptable (c'est-à-dire que dans 5% des cas lorsque H0 est vraie, l'expérimentateur se trompera et la rejettera). Mais le choix du seuil à employer dépendra de la certitude désirée et de la vraisemblance des alternatives.
  5. Si la p-value est plus grande que α on accepte l'hypothèse H0. Si la p-value est plus petite que α on la rejette.

La probabilité pour que H0 soit acceptée tandis qu'elle est fausse est β, le risque de deuxième espèce. C'est le risque de ne pas rejeter H0 lorsque on devrait la rejeter. Sa valeur dépend du contexte, et est particulièrement difficilement évaluable (voire impossible à évaluer), c'est pourquoi seul le risque α est utilisé comme critère de décision.

Tests classiques

Article détaillé : Test (statistique) .

Il existe de nombreux tests statistiques classiques parmi lesquels on peut citer :

En méthodes bayésiennes, on utilise le psi-test (mesure de distance dans l'espace des envisageables) dont on démontre que le test du χ2 représente une excellente approximation asymptotique quand il existe la plupart d'observations.

Voir aussi

Liens externes

Logiciels

Recherche sur Amazone (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Test_d%27hypoth%C3%A8se.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu