Systèmes d'Information - LRI

UML propose des standards de schématisation des données (approche ...... mis
en place (voir à ce sujet l'importance de la facilité d'utilisation d'une application,
...... Trois organismes sont accrédités pour fournir, après examen, les
certifications ITIL. .... transformation and loading, qui constitue une « fouille » des
données) ;.

Part of the document


Informatique et Techniques Numériques en Economie Session de Janvier 2007
Tous documents autorisés. Les cinq problèmes sont indépendants. 1. Problème de mots. Soit l'automate A défini par Q={1,2,3} où 1 est l'état initial, 3 l'état
final et les transitions sont définies par le graphe ci-dessous.
a. Trouver un mot de longueur au moins 5, accepté et un autre
rejeté. Quel est le langage défini par cet automate.
b. Pour la distance d'édition, quelle est la distance du mot
ababacba au langage de l'automate.
c. Trouver un automate distinct de A, dont le langage soit distinct
de celui de A, qui soit (-proche de A. [pic] 2. Problème XML. Soit la DTD suivante :
a. Trouver un arbre valide pour cette DTD avec au moins 5 n?uds et
le fichier XML correspondant . Quel est le langage d' arbres
défini par cette DTD.
b. Pour la distance d'édition avec déplacement, quelle est la
distance de l'arbre
[pic]
au langage de la DTD.
c. Trouver une DTD1, qui soit (-proche de cette DTD et dont le
langage d'arbres soit différent, et une autre DTD2 qui soit (-
loin de cette DTD.
3. Problème de Schéma relationnel.
a. Définir les termes suivants : Schéma d'une Base de Données, Requêtes,
Requêtes imbriquées, Jointure.
b. Une université souhaite informatiser la gestion de ses salles de cours.
Elle dispose pour cela du nom des élèves, des cours auxquels ils sont
inscrits, et de créneaux de disponibilité dans ses salles (un créneau est
représenté par une heure de début et une heure de fin d'occupation d'une
salle). Proposez un schéma entité-relation de la base correspondante à ce
besoin.
c. Décrire un schéma relationnel associé.
d. Expliciter des dépendances fonctionnelles et les clés.
4. Problème OLAP. Une université cherche à étudier les facteurs influant sur la réussite de
ses étudiants aux examens. Pour cela elle décide de construire un entrepôt
de données (datawarehouse). Elle souhaite pouvoir répondre aux questions suivantes:
Quel est le nombre de réussites aux examens par cours, pour l'année
2003?
Quel est le nombre de réussites aux examens d'un cours obligatoire,
pour l'année
2003?
Quel est le nombre de réussites aux examens par sexe (féminin,
masculin), pour
l'année 2003?
Combien d'étudiants ayant un âge de 22 ans ont réussi leurs examens de
bases de
données relationnelle?
Quel est le nombre de réussites aux examens pendant le semestre
d'hiver 2002? Pour cela elle dispose des données suivantes anonymes: Pour chaque examen
passé, on connaît l'âge et le sexe de l'étudiant, le nom du cours (les
cours peuvent être regroupés en cours obligatoire et cours à option), la
date de l'examen, la note obtenue et si l'examen est réussi ou non. Questions. 1. Proposez un schéma étoile pour cette application. Recherchez tout
d'abord les différentes dimensions et proposez une hiérarchie pour ces
dimensions. Pour chaque mesure, vous devez préciser le type
d'agrégation nécessaire. 2. Donnez les expressions OLAP (chemin, mesure, agrégation) associée à
deux requêtes (parmi les 5 exemples). 5. Fouille de Données Vous avez appliqué un algorithme permettant de générer un arbre de décision
sur une base de données contenant les données sur les passagers du Titanic.
Cette base de données présente quatre attributs pour chacun des 2201
passagers du titanic.
. CLASS avec comme valeurs: Ist, 2nd, 3rd, crew
o La classe dans laquelle voyageait le passager ou s'il
s'agissait d'un membre d'équipage.
0. SEX avec comme valeurs : female, mâle
1. SURVIVED avec comme valeurs: no, yes
o Est-ce que le passager a survécu? La question est de trouver un lien entre la classe, le sexe et le fait
d'avoir survécu ou non au naufrage du Titanic. [pic] Questions : a. Expliquez l'arbre de décision. Donnez des hypothèses sur les
données (proportion de passagers en 1ère, 2ème et 3ème classe,
proportion d'hommes et de femmes) qui permettraient de conclure
que ce arbre est une bonne approximation pour la fonction qui
décrit si une personne a survécu ou non. Rappeler la notion
d'approximation utilisée. b. Supposons que toutes les femmes aient survécu et qu'aucun homme
n'ait survécu. Quel serait un arbre de décision dans ce cas ?
----------------------- [pic]