CH6.doc

Matrice d'inertie : On appelle matrice d'inertie S associée à X la matrice . .... les
vecteurs propres associés déterminant les axes du nouveau repère. ..... L'
examen des plans factoriels permettra de visualiser les corrélations entre les
variables ...

Part of the document


CH6 : Généralités sur les méthodes d'analyse factorielle A- PRESENTATION
Les méthodes d'analyse factorielle se proposent de synthétiser
l'information contenue dans de grands tableaux de données de dimension n*p,
en général sous forme de visualisation graphique.
Pour cela, l'idée est de réduire les dimensions du tableau de données en
représentant les associations entre les individus et les variables dans des
espaces de faible dimension.
On recherchera donc des sous-espaces de faible dimension [pic]qui ajustent
au mieux les données, de façon à ce que les proximités mesurées dans ces
sous-espaces reflètent autant que possible les proximités réelles. Le sous-
espace de dimension q que l'on retiendra s'appelle l'espace factoriel.
Le calcul des proximités ou des distances qui en découlent diffèrent selon
la nature des lignes et des colonnes du tableau analysé, qui à son tour
dépend du type de variables étudiées.
Les colonnes peuvent être des variables continues ou des variables
nominales ou bien des catégories dans le cas de tables de contingence. Les
lignes peuvent être des individus ou des catégories.
Il existe trois techniques fondamentales : . L'analyse en composantes principales (ACP) s'applique à des tableaux
n*p de type individus-variables, dont les colonnes sont des variables
quantitatives continues [pic]et les lignes sont des individus : 1,2,
n (on les notera [pic] dans cette partie du cours ), c'est-à-dire
à une série p-dimensionnelle de n individus :
|Individu |[pic] |[pic] | |[pic] | |[pic] |
|e1 |[pic] |[pic] | |[pic] | |[pic] |
|e2 |[pic] |[pic] | |[pic] | |[pic] |
| | | | | | | |
|ei |[pic] |[pic] | |[pic] | |[pic] |
| | | | | | | |
|en |[pic] |[pic] | |[pic] | |[pic] | Le nombre [pic] étant la valeur de la variable [pic] prise par l'individu
[pic]. Les proximités ou liens entre variables s'interprètent en terme de
corrélation. Les proximités entre individus s'expriment en terme de
similitudes globales des valeurs observées (différence des valeurs prises
par les différentes variables sur les individus, appréciées dans leur
ensemble). L'ACP peut donner lieu à différentes variantes en s'appliquant
par exemple à un tableau de rangs, ou encore après élimination de l'effet
de certaines variables (analyses partielles). . L'analyse factorielle des correspondances (AFC) s'applique à des
tableaux de contingence (comme pour le calcul du Chi2), c'est-à-dire
des tableaux obtenus par le croisement des modalités de deux variables
qualitatives [pic] sur n individus. [pic]. La cellule (i,j) du tableau
représente le nombre d'individus possédant la modalité [pic] de [pic]
(variable à k modalités) et la modalité [pic] de[pic] (variable à l
modalités) :
|[pic] |[pic] |[pic] | |[pic] | |[pic] |
|[pic] | | | | | | |
|[pic] |[pic] |[pic] | |[pic] | |[pic] |
|[pic] |[pic] |[pic] | |[pic] | |[pic] |
| | | | | | | |
|[pic][pic|[pic] |[pic] | |[pic] | |[pic] |
|] | | | | | | |
| | | | | | | |
|[pic] |[pic] |[pic] | |[pic] | |[pic] | Le nombre [pic] étant le nombre d'individus ayant la modalité i de [pic]
et j de [pic].
L'analyse fournit des représentations de l'association entre lignes et
colonnes du tableau, c'est-à-dire de la liaison existant entre les deux
variables, en utilisant la distance entre profils (distance du chi2).
. L'analyse des correspondances multiples (ACM) : est une extension du
domaine de l'AFC au cas de plusieurs variables qualitatives. Les
lignes de ces tableaux sont généralement des individus, les colonnes
sont des modalités de variables qualitatives. Ces tableaux sont
appelés tableaux disjonctifs, ils sont composés de 0 et de 1. B- RAPPELS D'ALGEBRE LINEAIRE
Tous les résultats de cette section sont donnés sans démonstration. Ces
dernières peuvent être trouvées dans n'importe quel ouvrage d'algèbre
linéaire de premier cycle. I-Matrices 1-Définitions générales
a. Définition
On appelle matrice de dimension n*p un tableau à n lignes et p colonnes de
valeurs numériques :
[pic][pic]. En abrégé, on note[pic], et [pic]s'appelle le terme général de A. b. Matrices particulières :
. matrice nulle de dimension n*p : matrice de dimension n*p dont tous
les éléments sont nuls : [pic]
. matrice carrée d'ordre p : toute matrice de dimension p*p.
. matrice symétrique d'ordre p : toute matrice carrée d'ordre p dont les
termes symétriques par rapport à la diagonale sont égaux : [pic]
. matrice diagonale d'ordre p : toute matrice carrée d'ordre p dont tous
les éléments hors de la diagonale sont nuls : [pic]
. matrice unité d'ordre p : la matrice diagonale d'ordre p dont tous les
termes diagonaux sont égaux à 1 :[pic] et [pic]. Elle est notée [pic]
(ou [pic]lorsqu'il n'y a pas d'ambiguïté).
. Vecteur( colonne) de dimension n : toute matrice de dimension n*1.Le
terme « colonne » est souvent omis.
. vecteur ligne de dimension p : toute matrice de dimension 1*p.
Remarques :
- une matrice diagonale d'ordre p est un cas particulier de matrice
symétrique d'ordre p.
- la matrice unité et la matrice carrée nulle d'ordre p sont des cas
particuliers de matrices diagonales. c. Exemples : [pic] est la matrice nulle d'ordre 2, [pic] est la matrice unité d'ordre
2,
[pic] est une matrice diagonale d'ordre 2.
[pic] est une matrice symétrique d'ordre 3. u=[pic] est un vecteur colonne
de dimension 3. 2-Trace et déterminant d'une matrice carrée
a. Trace d'une matrice carrée . Définition
Soit A une matrice carrée d'ordre p. On appelle trace de A la somme de ses
termes diagonaux :
[pic] . Propriétés
> [pic]
> tr(A+B)=tr(A)+tr(B)
> Soit [pic] un nombre réel. Alors tr([pic]A)= [pic]tr(A)
> tr(AB)=tr(BA)
> tr(ABC)=tr(BCA)=tr(CAB) mais tr(ABC)[pic]
Exemple :
[pic] [pic]
b. Déterminant d'une matrice carrée
. Définition Le déterminant d'une matrice carrée [pic]est un nombre, noté Det(A) ou
[pic] caractérisant la régularité de A. . Calcul du déterminant
* Cas d'une matrice carrée d'ordre p=2
[pic] [pic]
* Cas d'une matrice carrée d'ordre p=3 Soit A=[pic]. Le principe de calcul de [pic] est le suivant :
- On affecte à chaque élément [pic]de la matrice le signe [pic] :
[pic]
- On choisit une ligne ou une colonne quelconque : [pic]
- on calcule le déterminant de la façon suivante, en respectant la
règle des signes : [pic] [pic]. Remarque : il est astucieux de développer selon la ligne ou la colonne
contenant le plus de valeurs nulles.
* Cas d'une matrice carrée d'ordre p quelconque
- On se ramène au calcul de déterminants de dimension (p-1) suivant la
méthode précédente.
- On itère le processus jusqu'à obtenir des déterminants d'ordre 2, que
l'on sait calculer.
. Déterminant d'une matrice diagonale
Si D est une matrice diagonale d'ordre p, alors son déterminant est le
produit de ses éléments diagonaux :
[pic] . Propriétés [pic] 3- Opérations sur les matrices : a. Somme de deux matrices
Soient A et B deux matrices de même dimension n*p. On appelle somme de A et
B la matrice C, notée C=A+B de terme général : [pic] b. Produit de deux matrices . Définitions
- Multiplication par un réel : Soit A une matrice de dimension n*p et
[pic] un nombre réel quelconque. On appelle produit de [pic] par A et
on note [pic]A la matrice de terme général [pic][pic]. - Multiplication de deux matrices : Soit A une matrice de dimension
n*p et B une matrice de dimension p*q. On appelle produit de A par B
la matrice C, de dimension n*q, notée C=AB dont le terme général est
égal à : [pic]. Cette opération n'est possible que si le nombre de
colonnes A est égal au nombre de lignes de B. . Propriétés du produit de deux matrices
> [pic]
> [pic] n'implique pas A=0 ou B=0
> (A+B)²=A²+B²+AB+BA
> (A-B)²=A²+B²-AB-BA
> (AB)²=ABAB
> [pic] . Produit de deux matrices diagonales
Si A et B sont deux matrices diagonales, AB=BA et D=AB est
diagonale de termes diagonaux [pic]. . exemple : A=[pic] [pic]
[pic]
[pic] c. Transposition d'une matrice
. Définition :
Soit A une matrice de dimension n*p. On appelle transposée de A et on note
[pic] ou A', la matrice d'ordre p*n de terme général [pic], c'est-à-dire la
matrice obtenue en permutant les lignes et les colonnes de A. . Exemple : [pic] . Propriétés : [pic] . Cas particulier d'une matrice symétrique - S est une matrice symétrique si et seulement si [pic]
- Soit A une matrice. Alors la matrice [pic] est symétrique, semi-définie
positive (voir plus bas la définition). Inversement, toute matrice
symétrique semi-défin