Examen de statistique appliquée - Art and Science Projects

Connaissances élémentaires en analyse mathématique : notions de dérivation et d'intégration. ... d'un modèle; Construction de composantes et interprétation de leur paramétrisation ..... Donnez l'équation de la composante principale.


un extrait du document




Contrat didactique du cours de statistique publique Prérequis et articulation avec le cursus : Connaissances élémentaires en analyse mathématique : notions de dérivation
et d'intégration. Connaissances élémentaires en statistique univariée et en
calcul des probabilités : moyenne, variance, fonction de répartition,
distributions usuelles Compétences de formation développées Les compétences sont à placer dans le contexte général de l'appropriation
de la notion de modèle mathématique et de son utilisation pratique en
gestion publique ce qui implique : L'appropriation du contenu des modèles statistiques de façon à les utiliser
optimalement en gestion publique en toute connaissance de leur contenu et
de leurs hypothèses implicites
L'acquisition d'une certaine indépendance visant à chercher éventuellement
d'autres modèles mieux appropriés Objectifs de l'activité d'enseignement : Le but est d'amener l'étudiant à poser un problème de gestion de bases de
données publiques et à mettre en place différentes techniques de
représentation de ces bases de données et également d'en calculer une
paramétrisation interprétable et utilisable concrètement. Il doit donc être capable de réaliser une analyse descriptive d'une série
statistique bivariée, d'estimer ses paramètres et doit pouvoir les
interpréter dans un cadre gestion publique. Présentation du contenu Rappels en statistique élémentaire : représentation et paramétrisation de
bases de données
Analyse de séries statistiques bivariées
Méthodes de régression linéaires (LSS), exponentielles et logarithmiques
conduisant à l'estimation et à l'interprétation des paramètres d'un modèle
Construction de composantes et interprétation de leur paramétrisation Organisation du travail / attentes vis-à-vis des étudiants : Cours magistral
Séances d'exercices
Séances d'exercices au labo d'informatique
Mise en place de modèles statistiques et de procédures de résolution de
problèmes et de calculs utilisant un tableur Modalités et critères d'évaluation : Épreuve écrite comprenant trois types d'évaluation : Des questions théoriques évaluant le niveau de savoir approprié
Des questions pratiques évaluant la compétence des étudiants à appliquer
des techniques de calcul et à critiquer les ordres de grandeur des
résultats obtenus
Des questions d'interprétation portant sur des fichiers de bases de
données, sur leur représentation, ou encore sur des fichiers de calcul L'évaluation se fait sur base du contrat de confiance (EPCC) mis en place
par le didacticien français André Antibi
De séries de questions types pouvant être légèrement modifiées lors de
l'examen sont proposées aux étudiants et reprennent 80% de l'examen Support(s) de cours et bibliographie : Notes de cours fournies en support pdf
La statistique par l'analyse, Daniel Justens, éditions du Céfal, 2004, 327
pages, ISBN 287130178-X
Eléments de statistique - JJ Droesbeke - Editions de l'Université de
Bruxelles-2001
Fichiers de bases de données en format xls
Présentations powerpoint Exemples de questions dans le cadre EPCC Reprendre les séances de questions concernant régression, composantes et
lois des grands nombres, déjà mises sur le site, ainsi que la première
séance consacrée au théorème de Moivre Interpréter la notion et le signe de la covariance. Présenter succinctement la méthode dite « des moindres carrés ». Donner
une application de cette méthode. Critiquer cette méthode Mettre en équation le problème de régression linéaire simple avec une
variable explicative et une constante. Détailler les calculs permettant
l'obtention d'une équation introduisant tous les paramètres statistiques
usuels. Interpréter le résultat obtenu. Déterminer la puissance explicative
du modèle linéaire en termes de variance, en termes d'écarts-types. Montrer comment on peut passer de la régression linéaire simple à la
construction de composantes (dimension 2) dans le plan. Montrer pourquoi il
est nécessaire, ici, de présenter deux modèles théoriques. Déterminer la
puissance explicative de ce modèle linéaire en termes de variance, en
termes d'écarts-types dans le cas d'un coefficient de corrélation positif
(resp. négatif). Le tableau qui suit donne l'évolution du taux de mortalité des Belges de 40
ans de sexe féminin et masculin depuis la fin du 19e siècle (source:
Institut national de Statistique)
|années |femmes |hommes | |
|1885 |0,00985 |0,01082 | |
|1930 |0,00541 |0,00649 | |
|1948 |0,00314 |0,00536 | |
|1960 |0,00184 |0,00285 | |
|1970 |0,001545 |0,00282 | |
|1980 |0,001457 |0,002588 | |
| | | | |
|moyennes | | | |
|1945,5 |0,003873667 |0,00515467 | |
|variances | | | |
|984,583333 |9,00232E-06 |8,5452E-06 | |
|covariances | | | |
| |-0,092855167|-0,09035067|8,68086E-06|
Représenter les données graphiquement et justifier si possible les
hypothèses menant à la régression dans les 3 cas suivants : Série chronologique des femmes pour les étudiantes
Série chronologique des hommes pour les étudiants
Série bivariée hommes-femmes pour tout le monde Expliquer la notion de covariance et interpréter son signe. Dans les deux
cas, calculer et interpréter intuitivement et quantitativement le
coefficient de détermination. Commenter et interpréter le fichier suivant : |Année |Taux | | | | | |
| | |ln (taux)| | | | |
| | | | | | | |
| | | | | | | |
|1930 |19,11 |2,9502117| | | | |
| | |6 | | | | |
|1948 |15,12 |2,7160183| | | | |
| | |7 | | | | |
|1961 |11,01 |2,3988039| | | | |
| | |5 | | | | |
|1971 |10,303 |2,3324351| | | | |
| | |1 | | | | |
|1981 |8,502 |2,1403014| | | | |
| | |3 | | | | |
|1995 |5,899 |1,7747828| | | | |
| | |5 | | | | |
| | | | | | | |
|moyenne |1964,333| | | | | |
|x |33 | | | | | |
|moyenne |11,65733|2,3854255| | | | |
|y |33 |8 | | | | |
|Var x |453,2222| | | | | |
| |22 | | | | | |
|Var y |18,81668|0,1440387| | | | |
| |19 |3 | | | | |
|Cov |-91,4134|-8,000053| | | | |
| |444 |07 | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | | Détailler le raisonnement suivi et critiquer les deux modèles obtenus.
Quel modèle retenez-vous et pourquoi ? Le fichier qui suit donne la statistique du nombre de chômeurs de moins de
25 ans et de plus de 25 ans en Belgique entre 2005 et 2010 (données
incomplètes sur l'image) |Chômeurs en Belgique | | |
|Période |Plus de 25 ans|Moins de 25 ans|
|2005/01 |590865 |130322 |
|2005/02 |589379 |126611 |
|2005/03 |584428 |122401 |
|2005/04 |573100 |117352 |
|2005/05 |567456 |112135 |
|2005/06 |569028 |112879 |
|2005/07 |620735 |148729 |
|2005/08 |628884 |157230 |
|2005/09 |628232 |157221 |
|2005/10 |612117 |146681 |
|2005/11 |595404 |136524 |
|2005/12 |597141 |132111
....