Qualité et datawarehouse - Free

Qualité et datawarehouse ... Ce problème est typiquement illustré par l'examen
médical la conception des données entreposent où le problème est de trouver ...

Part of the document


Qualité et datawarehouse La qualité de données a été définie comme fraction d'exécution au-dessus de
l'expectative, ou comme la perte a donné à la société du temps un produit
est embarqué [BBBB95]. Nous croyons, bien que, que la meilleure définition
est celui trouvé dedans [TaBa98, Orr98, WaSG94] : la qualité de données est
définie en tant que « forme physique pour l'usage ». La nature de cette
définition implique directement que le concept de la qualité de données est
relatif. Par exemple, sémantique de données (l'interprétation
d'information) est différent pour chaque utilisateur distinct. Comme
[Orr98] mentionne « le problème de la qualité de données est
fondamentalement entrelacé dans la façon dont les utilisateurs de [...]
emploient réellement les données dans système ", puisque les utilisateurs
sont réellement les juges finals de la qualité des données produites pour
elles : si personne n'emploie réellement les données, alors personne fera
jamais attention pour améliorer sa qualité. Comme système d'information
d'aide à la décision, un entrepôt de données doit fournir la qualité à
niveau élevé des données et qualité de service. La concordance, la
fraîcheur, l'exactitude, l'accessibilité, la disponibilité et l'exécution
sont parmi les dispositifs de qualité requis par les utilisateurs de
l'entrepôt de données. Toujours, un trop grand nombre des dépositaires sont
impliqués dans le cycle de vie de l'entrepôt de données ; tous semblent
avoir leur qualité conditions. Comme déjà mentionné, le décideur utilise
habituellement un outil de question d'OLAP pour obtenir réponses
intéressant à lui. Un décideur est habituellement concerné par la qualité
des données stockées, leur opportunité et la facilité de les questionner
par les outils d'OLAP. L'entrepôt de données L'administrateur a besoin des
équipements tels que le reportage d'erreur, l'accessibilité de méta-données
et la connaissance du opportunité des données, afin de détecter des
changements et des raisons de eux, ou des problèmes dans stocké
l'information. Le concepteur d'entrepôt de données doit mesurer la qualité
des schémas des données entreposez l'environnement (existant et
nouvellement produit) et la qualité des méta-données aussi bien. En outre,
il a besoin des normes d'évaluation de logiciel pour examiner les
progiciels qu'il considère achat. Les programmeurs des composants
d'entrepôt de données peuvent faire la bonne utilisation du logiciel normes
d'exécution afin d'accomplir et évaluer leur travail. Méta-données
rapportant le bidon facilitez également leur travail, puisqu'elles peuvent
éviter des erreurs liées à l'information de schéma. Basé sur ceci analyse,
nous pouvons sans risque arguer du fait que les différents rôles impliquent
une collection différente d'aspects de qualité, qui devrait être idéalement
traité d'une manière cohérente et signicative. Du précédent elle suit que,
d'une part, la qualité des données est de nature fortement subjective et
devrait idéalement être traité différemment pour chaque utilisateur. En
même temps, les buts de qualité de l'impliqué les dépositaires sont
fortement divers en nature. Ils ne peuvent ni être évalués ni réalisés
directement mais exigez la mesure, la prévision, et les techniques de
conception complexes, souvent sous forme d'interactif processus. D'une
part, les raisons des insuffisances de données, de la non-disponibilité ou
des problèmes de reachability soyez certainement objectif, et dépendez la
plupart du temps de la définition et de l'exécution de système
d'information. En outre, la prévision de la qualité de données pour chaque
utilisateur doit être basée sur des facteurs de qualité objectifs cela sont
calculés et comparés aux utilisateurs des espérances. La question qui se
pose, puis, est comment à organisez la conception, l'administration et
l'évolution de l'entrepôt de données de telle manière que tous le
différent, et parfois l'opposition, des conditions de qualité des
utilisateurs peuvent être simultanément satisfait. Comme nombre
d'utilisateurs et complexité des données les systèmes d'entrepôt ne
permettent pas à atteignez la qualité totale pour chaque utilisateur, une
autre question est comment donner la priorité à ces conditions satisfaites-
les en ce qui concerne leur importance. Ce problème est typiquement
illustré par l'examen médical la conception des données entreposent où le
problème est de trouver un ensemble de vues matérialisées qui optimisent le
temps de réponse de demandes d'utilisateur et les données globales
entreposent le coût d'entretien en même temps.