Examen 2003 IUP IG2E 1ère année Analyse des données
Examen 2003 IUP IG2E 1ère année Analyse des données. Analyse des ... Faites
une analyse descriptive rapide du tableau de données (annexe 1). 2.Une ACP ...
Part of the document
Analyse des Données Durée 3 heures
CORRECTION A. Une étude des conditions de vie a été réalisée dans 60 pays répartis sur
les différents continents, sur la base de quelques indicateurs macro-
économiques (Annexe 1). No N° du Pays dans l'ACP N° de l'indicateur dans l'ACP
PAYS Nom du Pays
IDH Indicateur de développement humain
EspVie Espérance de vie (années) 1
ISF Indice Synthétique de Fécondité (Nb. Moyen d'enfants/femme) 2
Vaccin% pourcentage d'enfants vaccinés rougeole 3
%malnutri pourcentage d'enfants insuffisamment nourris 4
?MortInf mortalité infantile pour mille 5
PNB/educ pourcentage du PNB consacré à l'éducation 6
AlphaAd pourcentage d'adultes alphabétisés 7
Téléf? Nombre de téléphones fixes pour mille habitants 8
Mobil? Nombre de téléphones mobiles pour mille habitants 9
InternOrd? ordinateurs raccordés à Internet pour mille habitants 10
PIB/h PIB par tête en dollars US 11
Milit/pnb pourcentage du PNB consacré à l'armée 12
CO2/h production de C02 par individu et par an en tonnes 13 B. Pour information : le Programme de Nations Unies pour le Développement
considère trois catégories de pays selon leur IDH :
IDH > 0,800 = pays à indice IDH élevé,
0,800>IDH > 0,500 = pays à IDH moyen,
IDH>0,499 = pays à IDH faible QUESTIONS
1. Faites une analyse descriptive rapide du tableau de données (annexe 1)
2.Une ACP normée a été effectuée sur les colonnes n° 1 à 13 des 60 pays.
Les résultats obtenus sont fournis en annexe 2 (tableaux des valeurs), 3
(plan factoriel F1F2 des colonnes) et 4 (plan factoriel F1F2 des lignes).
a. Justifiez le choix de l'analyse multivariée ;
b. Interprétez l'analyse et entourez les points significatifs sur les
plans factoriels ;
c. En utilisant les indications du paragraphe B., interprétez le
nuage de points lignes (annexe 4) ;
3. Etablir une corrélation entre Espérance de vie et ISF, puis entre Nombre
de téléphones fixes et PIB par tête.
4. Comparer les trois catégories de pays définis en 2c. pour leur
pourcentage du PNB consacré à l'armée et commenter la position du point 12
sur le plan factoriel F1F2 des colonnes (annexe 3). 1. Faites une analyse descriptive rapide du tableau de données (annexe 1)
4 points Nous sommes en présence d'un tableau de 60 lignes et de 14 colonnes dont 13
ont été soumises à une AFCM.
Les 60 lignes correspondent à un ensemble de pays que l'on peut diviser en
3 groupes sur la base de leur IDH : pays développés (n° 1 à 10) avec IDH
>0,80 ; pays à développement moyen (n° 21 à 40), avec IDH entre 0,8 et
0,5 ; pays faiblement développés (n° 41 à 60) avec IDH 5000 en italique dans tableau)
permet de constater que les points des variables Etats et Indicateurs bien
représentés par l'axe correspondent généralement aux points ayant des CA
élevées. Leur rôle et leur importance sont donc de ce fait confirmés. En ce
qui concerne les Etats, l'axe 1 représente particulièrement bien des Etats
riches (1 à 20) à des Etats pauvres (41 à 60 sauf 49) tandis que l'axe 2
représente surtout bien des pays à développement moyen (21 à 39) c. En utilisant les indications du paragraphe B., interprétez le nuage
de points lignes (annexe 4) ; 3 points
L'utilisation des CA et CR de l'annexe 3 en conjonction avec les 3
catégories de pays définis par leur IDH permet de distinguer trois nuages
de points sur le plan factoriel F1F2 : un nuage pour les pays les moins
développés à IDH faible (n° 41 à 60), un autre pour les pays à IDH moyen
(n° 21 à 40) situé au centre de F1 et en haut de F2, et un troisième pour
les pays à IDH élevé (n° 1 à 20), à droite de l'axe F1.
3. Établir une corrélation entre espérance de vie et ISF, puis entre Nombre
de téléphones fixes ? et PIB par tête. 4 points Entre espérance de vie et ISF
Nous nous proposons de définir si espérance de vie et ISF, deux variables
quantitatives continues, sont liées ainsi que la force de la liaison en
utilisant le test de corrélation de Spearman.
Nous posons l'hypothèse nulle H0 qu'il n'y a pas de lien significatif entre
les 2 variables et l'hypothèse alternative H1 qu'il y a une liaison entre
les deux variables (hypothèse bilatérale), avec un risque d'erreur de 95%
(ou alpha = 0,05).
Les résultats obtenus sont :
Pour 60 individus et un ddl de 58, nous avons rs = -0,8767 et t = -13,88,
avec une probabilité bilatérale de p bilat < 0,000001
Nous pouvons rejeter H0 car p bilat est largement inférieur au risque
d'erreur défini.
Il existe une corrélation négative fortement significative entre ces deux
variables.
Plus l'ISF est réduit (plus le nombre d'enfants par femme est réduit), plus
longue est l'espérance de vie et inversement. Entre le nombre de téléphones fixes et le PIB par tête
Pour utiliser les valeurs de PIB/h dans le calculateur, il faut diviser par
100 (valeurs trop grandes pour calcul en JS).
Nous nous proposons de définir si le nombre de téléphones fixes et le PIB
par tête, deux variables quantitatives continues, sont liés ainsi que la
force de la liaison en utilisant le test de corrélation de Spearman.
Nous posons l'hypothèse nulle H0 qu'il n'y a pas de lien significatif entre
les 2 variables et l'hypothèse alternative H1 qu'il y a une liaison entre
les deux variables (hypothèse bilatérale), avec un risque d'erreur de 95%
(ou alpha = 0,05).
Les résultats obtenus sont :
Pour 60 individus et un ddl de 58, nous avons rs = 0,9279 et t = 18,95,
avec une probabilité bilatérale de 0,000001
Nous pouvons rejeter H0 car p bilat est largement inférieur au risque
d'erreur alpha défini.
Il existe donc une corrélation positive fortement significative entre ces
deux variables.
Plus le PIB/tête est élevé, plus le nombre de téléphone pour mille
habitants est important et inversement. 4. Comparer les trois catégories de pays définis en 2c. pour leur
pourcentage du PNB consacré à l'armée et commenter la position du point 12
sur le plan factoriel F1F2 des colonnes (annexe 3). 4 points
En considérant la variable PNB/armée (colonne12), nous réalisons un tableau
de 20 lignes et 3 colonnes (colonne 1 : pays à IDH élevé ; colonne 2 pays à
IDH moyen, colonne 3 pays à IDH faible).
Nous disposons donc de 3 échantillons indépendants pour une variable
quantitative continue (car issue d'un résultat impliquant multiplication et
divis