Cours magistral quan.. - of /tuyaux
Corrélation de Pearson (covariance et régression) entre deux variables ......
diagonalisation de la matrice, extraction de valeurs propres et de vecteurs
propres? ..... Ces conclusions sont confirmées par l'examen des tableaux de
corrélations ...
Part of the document
PLAN DU COURS
Les parties sont indépendantes, l'ordre est indifférent !
1. Rappel
variables et autre 2. Analyses uni -variées
distribution de fréquences et pourcentages
mesure de tendance centrale, dispersion et variation 3. Analyses bi -variées
estimation, intervalles de confiance, régression, corrélation
tests paramétriques (Les variables quantitatives ont une distribution
proche de la
normale), comparaison de deux échantillons, de moyennes, test du Chi
Deux, comparaison de moyennes, tableau croisé ou de contingence
4. Analyses multi -variées anova à 1 ou plusieurs facteurs
analyse en composantes principales
analyse factorielle des correspondances 1 Les catégories La statistique descriptive se compose de 3 domaines distincts : . Statistique univariée: répartition d'une population selon une variable
(la taille, le poids...)
. Statistique bivariée: étudie la relation qui peut exister entre deux
variables (entre la taille et le poids, par exemple...)
. Statistique multivariée: étudie les relations entre plusieurs variables.
[pic] 3 étape : décrire - expliquer - synthétiser
1. Rappel Statistique . Ensemble des méthodes de dénombrement, de classement et de présentation
des données relatives à une population donnée.
. Objectif est de synthétiser les données brutes, les comprendre, les
présenter à d'autres acteurs.
Statistique inférentielle . Objectif est de généraliser à toute une population donnée des
observations et conclusions tirées à partir des résultats obtenus sur un
petit nombre d'individus (échantillon) appartenant à cette population.
[Échantillon ( population]
Vocabulaire . Population: à l'origine « groupement humain ». Actuellement c'est
l'ensemble complet des unités que l'on désire étudier : des personnes,
des sociétés, des objets, des actions...
. Echantillon: tout sous-ensemble de la population
. Surreprésentation : lorsqu'un type d'individu (individus ayant une
caractéristique X) est proportionnellement plus nombreux dans
l'échantillon que d'autres types d'individus. (Ex: 70% de français contre
30% de Belge)
. Unité statistique: élément sur lequel porte l'observation. Exemple: un
individu, un étudiant...
. Observation (ou caractère, ou variable): caractéristique qui est observée
sur chaque individu constituant l'ensemble. Exemple: l'âge de
pensionnaires
. Modalités: les différentes situations où les éléments de l'ensemble
peuvent se trouver à l'égard du caractère considéré. Exemple: étude de la
taille des villes selon trois modalités (petite, moyenne, grande).
Synonyme = valeur, item.
. Distribution de fréquences ou distribution: répartition des individus de
l'échantillon ou de la population suivant les valeurs ou les états que
prend, dans cette population ou cet échantillon, l'observation (variable,
caractère) considérée. Exemple: répartition des pensionnaires selon leur
âge.
Présentation des données . Sous forme de tableau: système de lignes et de colonnes. Chaque ligne
représente un individu et chaque colonne un caractère (ou variable)
. Sous forme de graphique: moins précis que les tableaux, ils font
généralement ressortir de façon plus claire les relations entre les
variables.
|Types de variables |Echelles de mesures (façon dont une variable peut |
| |être mesurée) |
| | |
|Variables |Soit : |
|quantitatives | |
| |de mesures (mensurations) |
|s'expriment par des |= variables de nature continue |
|nombres sur lesquels |peut prendre un nombre infini de valeurs réelles. |
|des opérations |Exemples: |
|arithmétiques telles |la t° (35.5°), le poids (65.5 kg)... |
|que somme, moyenne, | |
|... ont un sens. |de dénombrements (comptages) |
|Exemple: poids d'une |= variables de nature discrète ou discontinue |
|personne. |prend uniquement un nombre limité de valeurs |
| |entières. Il n'y a pas de valeurs intermédiaires. |
| |Exemple: nombre d'enfants dans une famille. |
| | |
| |. Echelle d'intervalle: permet de tenir compte de |
| |la différence entre deux valeurs d'une variable. |
| |Les valeurs observables sont ici numériques. |
| |Exemple: échelle de t° Celsius. Le choix de |
| |l'origine (le zéro) de l'échelle est arbitraire. |
| |Le rapport entre les valeurs n'a pas de sens en |
| |soi. |
| | |
| |. Echelle de rapport: semblable à l'échelle |
| |d'intervalle mais avec l'existence d'une origine |
| |significative (zéro « naturel » ou « absolu »). Le|
| |rapport entre les valeurs a un sens précis. |
| |Exemple: durée de vie, taille, vitesse... |
| | |
|Variables |Soit : |
|discontinues ou | |
|qualitatives |nominales ou catégorielles |
| |permet d'affecter les individus à des catégories |
|s'expriment de façon |sans relation hiérarchique (nationalité, sexe, |
|littérale ou par un |appartenance à un parti politique...) |
|codage sur lequel les| |
|opérations |ordinales ou de rangements |
|arithmétiques telles |permet d'affecter les individus à des catégories |
|que moyenne, somme, |avec une relation hiérarchique qui rend possible |
|..., n'ont pas de |leur comparaison (petit -moyen -grand) |
|sens. Exemple: | |
|couleur des yeux. | |
| | |
Types ou nature de variable & échelles de mesure : schéma [pic] Traitement des NR (non-réponses) ou NSP (ne sais pas) : Si elles sont contenues dans le questionnaire comme possibilité de réponse,
il s'agira à ce moment-là d'une échelle nominale et non plus ordinale
(contenant seulement 1, 2,3 ...10). On ne pourra donc plus calculer de
moyenne. La Règle : 1) Comprendre la raison des NR
- Les questions sont trop difficiles
- La personne ne sait pas répondre dans les termes formulés par la
question, ne rend pas compte de la finesse de la réponse
- Question embarrassante pour la personne
- La personne n'est pas concernée par la question. On peut savoir
cela, en analysant ces réponses aux autres questions et déterminer
un Profil de personne. Ex : une personne dit ne jamais utiliser de
préservatif à une question, lorsqu'on lui demande s'il trouve que le
préservatif est cher selon lui, il ne sera pas répondre.
2) Différencier la solution en fonction du fait qu'il y a beaucoup ou peu
de NR. Si elles sont peu nombreuses, elles affectent peu les résultats.
3 possibilités s'offrent à nous.
- Soit on les élimine. Ce qui n'est pas la meilleure des solutions car
selon les questions ce ne seront pas toujours les mêmes types
d'individus qui ne répondront pas aux questions. Ce qui fait que
l'on fini par
- éliminer un nombre important d'individu au total.
- Soit on remplace les NR par la moyenne du groupe. On suppose donc
que les personnes qui ne répondent pas pensent comme les autres, or
ce n'est pas spécialement vrai.
- Soit on remplace les NR par la valeur au milieu de l'échelle
proposée (5,5). On suppose ainsi que l'individu n'a pas su se placer
entre JAMAIS et TOUJOURS, et donc c'est une manière de faire le
moins d'erreur. La Question de l'Echelle dans les questionnaires Echelle à basse fréquence : sensibles aux petites valeurs, aux phénomènes
rares. Echelle à haute fréquence : sensibles aux grandes valeurs. Il a été observé que selon les échelles proposées dans le questionnaire,
les réponses des individus différaient quelque peu. Explication : 1) Attraction des valeurs centrales
2) Estimation floue à partir de vision de société et à partir de
l'échelle. L'échelle est interprétée par les individus comme la manière
dont le phénomène est distribuée dans la société. Ils se placent donc
dans la moyenne.
2. Analyses uni -variées.
Il est souvent astucieux lorsqu'on est confronté à une variable (ex : la
taille) de faire un graphique pour avoir une représentation visuelle, qui
plus facile à se représenter que des formules abstraites. | |Echelle |Nominale |Ordinale |Quantitative |
|1 variable | | | | |
|