doc

L'histogramme et le polygone des effectifs donnent une vue globale et détaillée
de ... par 49 élèves à un examen, rangés par classes de 10 pourcents de large: ...

Part of the document

|Chapitre 3: |
|Caractérisation des données |
L'histogramme et le polygone des effectifs donnent une vue globale et
détaillée de la distribution des individus dans un échantillon ou une
population. Il est souvent très utile d'extraire de cette information des
grandeurs numériques qui en résument les caractéristiques essentielles. Nous passerons tout d'abord en revue les grandeurs mesurant le centre de la
distribution. Ensuite, nous considérerons les différentes mesures de l'étalement ou
dispersion de la distribution. 3.1. Centre d'une distribution 3.1.1. Le mode Il correspond au sommet de la distribution:
|le mode est la valeur la plus fréquente |
c'est la valeur la plus « à la mode ». On appelle distribution unimodale, une distribution présentant un seul mode
[pic]
Une distribution bimodale est une distribution présentant deux modes [pic] Une distribution multimodale est une distribution présentant plusieurs
modes (2,3,...). Elle est souvent le reflet d'une population composée de
plusieurs sous-populations distinctes. Par exemple, le polygone des fréquences ci-dessous, qui représente la
distribution de la taille des individus dans une population adulte,
présente deux modes. Ceux-ci sont le reflet de la présence de deux sous-
populations : les femmes et les hommes, ces derniers étant généralement
plus grands. [pic] 3.1.2. La médiane Elle correspond au milieu de la distribution:
|la médiane est la valeur pour laquelle il y a autant |
|d'individus à gauche qu'à droite dans l'échantillon |
Pour déterminer la médiane d'un échantillon ou d'une population : (1) on classe les individus par ordre croissant
(2) on prend celui du milieu
Exemple : ( Soit un échantillon de 9 personnes dont le poids est : [pic] classés par ordre croissant : [pic] ( Si le nombre d'individus est pair, on prend la moyenne entre les
deux valeurs centrales : [pic] [pic] En règle générale, si n est le nombre d'individus dans l'échantillon, la
médiane porte le numéro d'ordre [pic] dans la suite des individus classés
par ordre croissant. Lorsqu'on obtient un numéro demi entier (ex : 24,5), on calcule la moyenne
des deux valeurs adjacentes. Calcul de la médiane pour les grands échantillons répartis en classes (1) Déterminez le numéro d'ordre de la médiane. (2) Déterminez dans quelle classe elle se situe à l'aide du tableau des
nombres cumulés (total des individus de cette classe et des
précédentes). (3) Rangez par ordre croissant les éléments (individus) de cette classe. (4) Sélectionnez l'élément (individu) correspondant au numéro choisi.
Exemple : Soient les pourcentages obtenus par 49 élèves à un examen, rangés par
classes de 10 pourcents de large: Classe nombre nombre cumulé
1-10 2 2
11-20 4 6
21-30 5 11
31-40 8 19
41-50 7 26
51-60 9 35
61-70 6 41
71-80 6 47
81-90 2 49 49 individus la médiane porte le n°25 [pic] car, d'après le tableau des nombres cumulés, cette classe contient les
individus portant les numéros d'ordre 20 à 26. Examinons le contenu de cette classe : 46 - 42 - 45 - 44 - 50 - 43 - 49 Rangeons-les par ordre croissant : 42 - 43 - 44 - 45 - 46 - 49 - 50 Il y a 19 individus dans les classes précédentes Le premier de cette classe porte le n°20 et nous devons choisir le 25e Numéro : 20 21 22 23 24 25 26
Valeur : 42 43 44 45 46 49 50 La médiane vaut donc 49.
3.1.3. La moyenne Elle correspond à une répartition « équitable » de la grandeur mesurée sur
tous les individus:
|la moyenne est la somme des grandeurs mesurées divisée par |
|le nombre d'individus |
Exemple : ( Dans le précédent échantillon de 9 personnes, le poids moyen vaut : [pic] ( Dans le second échantillon de 10 personnes, le poids moyen vaut : [pic] Pour un échantillon de n individus, la moyenne est calculée par :
|[pic] |
En utilisant la lettre grecque ( pour représenter une somme, on obtient la
notation compacte suivante : |[pic] |
Pour des données groupées en classes, on peut calculer une valeur
approximative de la moyenne en supposant que tous les individus d'une
classe se situent au centre de celle-ci. Dans l'exemple précédent (9 personnes), la répartition est la suivante: Classe Centre Nombre 45-55 50 3
55-65 60 3
65-75 70 2
75-85 80 0
85-95 90 1 [pic]
Si x est le centre de la classe et f le nombre d'individus dans celle-ci,
la formule approchée s'écrit : |[pic] |
Dans l'exemple précédent, la formule approchée donne un poids moyen de 62,2
kg au lieu de 62 kg. La formule approchée donnera des résultats d'autant meilleurs que : ( les classes seront étroites
( le nombre d'individus par classe sera grand. 3.1.4. Positions relatives des trois mesures du centre d'une distribution a) Distribution unimodale et symétrique Dans une distribution unimodale et symétrique, le mode, la médiane et la
moyenne sont confondus. [pic]
b) Distribution asymétrique Si la distribution est étalée à droite, on a généralement: mode < médiane <
moyenne [pic] Si la distribution est étalée à gauche, on a généralement: moyenne <
médiane < mode [pic]
3.1.5. Qualité comparée des trois mesures du centre d'une distribution Exemple : Répartition des revenus dans une population.
[pic] Le mode est la plus mauvaise mesure du centre, car la classe la mieux
représentée n'est pas nécessairement au centre de la distribution. Si les valeurs extrêmes sont modifiées, la médiane ne change pas car elle
n'est pas sensible aux valeurs extrêmes. Par contre la moyenne change car
elle tient compte de toutes les valeurs. On préférera la médiane ou la moyenne selon que l'on veut une mesure
sensible ou non aux valeurs extrêmes. [pic]
3.2. Etalement d'une distribution 3.2.1. Dispersion d'une distribution Supposez que l'on désire comparer les revenus des ouvriers d'une usine à
ceux de l'ensemble de la population de leur région. Les résultats sont résumés sur l'histogramme suivant : [pic] Dans ce cas, les deux distributions ont le même centre mais elles sont
manifestement différentes : elles diffèrent par leur dispersion Mesures de la dispersion Exemple : Les poids de 35 garçons de 2e candi. communication (97-98) sont repris dans
le tableau et l'histogramme suivants :
|classe (kg)|individus : poids en kg |
|50-54 |52 |
|55-59 |58 |
|60-64 |62 |60 |60 |63 |62 | | | | | |
|65-69 |65 |65 |66 |65 | | | | | | |
|70-74 |72 |70 |72 |74 |74 |74 |70 | | | |
|75-79 |75 |75 |75 |75 |76 |75 |75 |75 |75 |78 |
|80-84 |80 |80 |80 | | | | | | | |
|85-89 |89 |88 |88 |87 | | | | | | |
[pic] Pour caractériser l'étendue d"une distribution, les statisticiens ont
introduit toute une série de grandeurs, dont nous allons considérer les
principales. 3.2.2. L'étendue L'étendue est la différence entre la plus grande valeur et la plus petite
valeur. Dans l'exemple précédent, le calcul exact donne : 89-52 = 37 kg Un calcul approché, prenant en compte le centre des classes, donnerait : 87-52 = 35 kg [pic]
3.2.3. L'étendue interquartile Le premier quartile est l'individu ayant 25 % de l'échantillon en-dessous
de lui et 75% de l'échantillon au-dessus. Le deuxième quartile est l'individu ayant 50 % de l'échantillon en-dessous
de lui et 50 % de l'échantillon au-dessus: c'est donc la médiane Le troisième quartile est l'individu ayant 75 % de l'échantillon en-dessous
de lui et 25 % de l'échantillon au-dessus.
|L'étendue interquartile est la différence entre le troisième et le premier |
|quartiles |
Dans notre exemple, on a : 1er quartile = 65 kg
2me quartile = 76 kg Etendue interquartile (EIQ) = 76 ( 65 = 11 kg |n° |poids (kg)| | | |
|1 | |52 | | |
|2 | |58 | | |
|3 | |60 | | |
|4 | |60 | | |
|5 | |62 | | |
|6 | |62 | | |
|7 | |63 | | |
|8 | |65 | | |
|9 |[pic] |65 |1er |EIQ : 76 -65 = 11 kg|
| | | |quartile | |
|10 | |65 | | |
|11 | |66 | |