Exercices récapitulatifs :Tableau de contingence :
Exercices récapitulatifs :Mesures d'association : corrigé. Le garage L. Harnack
dispose du tableau suivant qui résume l'état des ventes de voitures l'an dernier ...
Part of the document
Exercices récapitulatifs :Mesures d'association : corrigé
Le garage L. Harnack dispose du tableau suivant qui résume l'état des
ventes de voitures l'an dernier en fonction de leur prix de vente et de
leur cylindrée. Tableau : répartition des ventes de voitures (nombre de voitures vendues)
| |Prix (10³E) | |
| |]6, 10] |]10, 20]|]20, 30]|Total |
|Cyl. |]9, 15] |35 |10 |5 |50 |
|(10² | | | | | |
|cm³) | | | | | |
| |]15, 19] |10 |60 |20 |90 |
| |]19, 21] |0 |5 |25 |30 |
| |Total |45 |75 |50 |170 | On vous demande de : 1. Calculer toutes les mesures d'association spécifiques aux variables
quantitatives. Pour ce faire, il faut d'abord disposer des centres de classe des deux
variables : - pour le prix : 8, 15, 25 (10³E) - pour la cylindrée : 12, 17, 20 (10² cm³) On calcule alors les moyennes marginales des deux variables : Le prix moyen sera calculé comme : [pic] [pic] donc le centre de gravité G = (16,16) Ce qui permet de calculer les écarts centrés (ec) et quadratiques (eq) des
centres de classe reportés dans le tableau suivant : (N.B. On prendra pour raisons pédagogiques les moyennes arrondies plutôt
que celles calculées avec leurs décimales, ceci facilite la présentation
des écarts. Il va de soi qu' calcul professionnel DOIT conserver les
décimales tout au long des calculs.)
[pic][pic] | | | | | Prix | |
| | | |eq |64 |1 |81 | |
| | | |ec |-8 |-1 |9 | |
| |eq |ec | |8 |15 |25 |Tot. |
|Cy|16 |-4 |12 |35 |10 |5 |50 |
|l.| | | | | | | |
| |1 |1 |17 |10 |60 |20 |90 |
| |16 |4 |20 |0 |5 |25 |30 |
| | | |Tot|45 |75 |50 |170 |
| | | |. | | | | |
Il est donc possible de calculer la variance marginale de chaque variable
ainsi que la covariance entre elles : [pic] [pic] Donc les écart-types des deux variables sont calculés : [pic] [pic] et la covariance vaut : [pic] On peut donc conclure que la liaison est positive entre les deux variables,
mais nous ne savons encore rien de l'intensité de la relation entre elles.
Pour calculer l'intensité de la liaison entre les variables, nous disposons
du coefficient de corrélation : [pic] Le coefficient de corrélation étant normé entre -1 et +1, cette valeur de
0,6133 indique une liaison positive significative mais pas complète entre
les deux variables
2. A partir des valeurs calculées pour ces mesures d'association de
répondre aux deux questions suivantes : a. La cylindrée d'une voiture vendue est-elle un bon prédicteur du
prix de cette même voiture ? b. Le prix d'une voiture vendue est-il un bon prédicteur de la
cylindrée de cette même voiture ?
Nous cherchons des prédicteurs, c'est-à-dire des variables qui, si nous
connaissons leur valeur, pourraient nous aider à prévoir la valeur d'une
autre variable. La régression linéaire peut nous aider. Pour la réponse à la question 2.a., on va supposer le modèle linéaire
suivant : px = a + b cyl et estimer les valeurs de a , l'intercept de la droite de régression et b,
la pente de cette même droite. [pic] et [pic] ainsi que son coefficient de détermination : [pic]
Pour la réponse à la question 2.b., on va supposer le modèle linéaire
suivant : cyl = c + d px et estimer les valeurs de c , l'intercept de la droite de régression et d,
la pente de cette même droite. [pic] et [pic] ainsi que son coefficient de détermination : [pic] Le coefficient de détermination nous indique qu'un peu plus du tiers de la
variance de la variable dépendante de chacune des régression est
« expliquée » par la relation linéaire la liant à l'autre variable, la
variable « explicative ». Il existe donc d'autres explications à trouver dans la théorie économique,
dans l'observation, etc.
La cylindrée et le prix sont bien des prédicteurs de l'autre variable mais
loins d'être parfaits.
Interprétation de a, b, c, d : - a est l'intercept de la régression 2.a., il signifie que le prix moyen
d'une voiture, indépendamment de sa cylindrée est de
-6,1838 10³E, ...
- b, la pente de la régression 2.a., représente l'effet marginal de la
cylindrée sur le prix d'une voiture, sa valeur de 1,3869 par unité de
cylindrée (10²cm³) nous dit qu'en moyenne, quand la cylindrée varie de 100
cm³, le prix de la voiture varie dans le même sens de 1,3869 10³E.
- c, intercept de la régression 2.b., vaut 11,6957. Cette valeur signifie
qu'indépendamment du prix, la cylindrée moyenne des voitures vendues vaut
11,6957 10²cm³ ( 1200 cm³.
- d, la pente de la régression 2.b., représente l'effet marginal du prix
sur la cylindrée d'une voiture, sa valeur de 0,2712 par unité de prix
(10³E) nous dit qu'en moyenne, quand le prix varie de 1000 E, la cylindrée
de la voiture varie dans le même sens de 0,2712 10²cm³.