Analyse des données
L'analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données ainsi qu'à en tirer une information...
Page(s) en rapport avec ce sujet :
- De même, étant donné que l'analyse des données est concernée par autre... de l'analyse statistique des données, Richard Bertrand, ISBN 2-7605-0382-8... (source : books.google)
- Quels outils pour l'analyse de données qualitatives ?. X Briffault..... spécifiquement rébarbatif de l'analyse des données est celui de la retranscription des .... Analyse des données qualitatives, De Bœck, 2003, ISBN 2-7445-0090-3.... (source : 193.49.126)
L'analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données ainsi qu'à en tirer une information statistique qui sert à décrire de façon plus succincte les principales informations contenues dans ces données. On peut aussi chercher à classer les données en différents sous groupes plus homogènes.
Par exemple l'âge, le sexe et la catégorie socioprofessionnelle des joueurs de golf peuvent être étudiés simultanément.
Dans l'acception française, la terminologie analyse des données sert à désigner un sous-ensemble de ce qui est nommé d'une façon plus générale la statistique multivariée. Elle comprend essentiellement :
- L'analyse en composantes principales (ACP), utilisée pour des données quantitatives.
- L'analyse factorielle discriminante (AFD) ou analyse discriminante qui permet d'identifier des groupes homogènes au sein de la population du point de vue des variables étudiées,
- L'analyse factorielle des correspondances (AFC), utilisée pour des données qualitatives (tableau d'association).
- La classification automatique.
- L'analyse en composantes indépendantes (ACI).
Ces méthodes permettent surtout de manipuler et de synthétiser l'information provenant de tableaux de données de grande taille.
Pour cela, il est particulièrement important de bien estimer les corrélations entre les variables qu'on étudie. On a alors fréquemment recours à la matrice des corrélations (ou la matrice de variance-covariance) entre les variables.
Les pères de l'analyse des données sont :
- Jean-Paul Benzécri
- John Tukey (sous le terme de Exploratory Data Analysis, ou EDA)
- Chikio Hayashi (sous le terme de Data Sciences)
De nombreux logiciels permettent d'effectuer de l'analyse des données directe ou indirecte.
Références
- (fr) Benzécri J. -P. et al. (1976), L'Analyse des données, Paris, Dunod
- (en) The Collected Works of John W. Tukey (ISBN 0412063212) ; (ISBN 0534051014)
- (en) J W Tukey, Graphical Analysis of Multiresponse Data, K E Basford (ISBN 0849303842)
- (fr) Michel Volle, Analyse des données, Economica, 4e édition, 1997 (ISBN 2717832122)
- (fr) Jean-Marie Bouroche et Gilbert Saporta, L'Analyse des données, P. U. F, 8e édition, 2002 (ISBN 2 13 052495 8)
Liens externes
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.