Note actualisée en février 2010 Promoteur Chercheur Charlotte ...

le possible champ d'application d'un "datawarehouse";. - les conditions ...
Premier examen des conditions de faisabilité d'une intégration verticale. Un
premier ...

Part of the document

Note actualisée en février 2010 Promoteur Chercheur
Charlotte VANNESTE Benjamin MINE
1. Objet de la recherche
L'objet de cette recherche est de procéder à une analyse exploratoire
portant sur les conditions de faisabilité d'une articulation des
différentes bases de données statistiques relatives au fonctionnement de la
justice pénale via le développement d'un "datawarehouse". Le projet se base sur le constat d'une impossibilité, dans l'état actuel de
dispersion des bases de données, de satisfaire à un objectif de production
d'une statistique criminelle "intégrée" et tout particulièrement de
répondre à l'objectif d'intégration verticale, à savoir de pouvoir analyser
le flux des affaires et des personnes et leur trajectoire à travers
l'ensemble du système pénal. La recherche examine plus particulièrement (à ce stade) les conditions
d'articulation et d'exploitation "intégrée" des bases de données suivantes:
celles des parquets correctionnels (TPI), des maisons de justice (SIPAR) et
des établissements pénitentiaires (SIDIS). La réalisation de ce projet de recherche, financé par le SPF Politique
Scientifique, s'inscrit dans le cadre d'un programme plus large mené au
sein du Direction Opérationnelle Criminologie de l'I.N.C.C. visant à
développer des compétences scientifiques sur l'ensemble des bases de
données constituées au sein du SPF Justice. II. Contexte et objectifs principaux de la recherche Le projet fait suite à une demande formulée le 1er octobre 2008, par le
Ministre de la justice, Jo Vandeurzen, au directeur général de l'I.N.C.C..
Il y exprimait sa volonté d'entreprendre le développement d'un
"datawarehouse" en vue d'une meilleure administration de la justice pénale.
Un objectif statistique y étaient particulièrement visé à travers la
production d'une statistique criminelle intégrée reposant sur
l'articulation entre elles des bases de données relatives à chacune des
phases du processus pénal. Une telle approche devant permettre le suivi du
flux de dossiers à travers l'ensemble du système d'administration de la
justice pénale (SAJP). En réponse à cette demande ministérielle, une première note de proposition
fut remise en décembre 2008[1], répondant à ce volet statistique, dans
laquelle sont abordés notamment :
- le cadre théorique de référence (objectif de statistique criminologique
intégrée) ;
- les différentes initiatives statistiques prises dans le champ de la
justice pénale ;
- le possible champ d'application d'un "datawarehouse";
- les conditions relatives au respect de la vie privée ;
- l'état de la situation par rapport au quadruple objectif d'intégration
(interne, horizontal, vertical et contextuel) ; Outre la nécessité de poursuivre les objectifs d'intégration interne et
horizontale, le rapport insiste sur l'attention particulière qui doit être
portée aux conditions de faisabilité d'une intégration verticale dans la
mesure où il s'agit de l'aspect actuellement le plus déficient. Or, c'est
précisément à travers la réalisation de cette dimension qu'il devient
possible de rendre accessible à l'analyse quantitative le fonctionnement du
système de justice pénale dans son intégralité, à savoir le flux de
personnes et d'affaires qui le parcourent et les trajectoires qui s'y
inscrivent. III. Premier examen des conditions de faisabilité d'une intégration
verticale Un premier examen des conditions de faisabilité d'une intégration verticale
a été réalisé, celui-ci a permis de mettre en exergue trois problèmes
déterminants : A. L'absence d'un identifiant unique pour les personnes et les affaires Si la plupart des bases de données sectorielles disposent d'un numéro
d'identification des personnes (et/ou des affaires) utilisable soit au
niveau local, soit au niveau central, il n'est pas possible actuellement de
joindre des informations disponibles dans différentes bases de données,
ceci en l'absence d'enregistrement (systématique) d'un même identifiant. Au niveau des personnes, une solution qui se profile est l'enregistrement
dans chacune des bases de données du numéro de registre national pour ce
qui concerne la population belge et du numéro de l'Office des étrangers -
lorsqu'il existe - pour les non nationaux. Une solution devrait encore être
trouvée pour les personnes ne faisant pas partie des deux premières
catégories. Au niveau des affaires, c'est l'instauration d'un rôle national
pour chaque nouvelle affaire créée qui serait envisagée. Une telle
hypothèse requiert nécessairement une convention préalable sur ce qu'il y a
lieu d'entendre par « affaire » dans le cadre de la procédure pénale. L'enregistrement de ces numéros pose cependant deux types de difficultés
qu'il s'agirait d'analyser au cours de la phase exploratoire de la
recherche: des obstacles juridiques d'une part, des difficultés d'accès ou
d'enregistrement informatique d'autre part. Ces difficultés résolues, il
faudrait ensuite que l'inscription soit rendue obligatoire pour que l'on en
dispose de façon systématique. 1. L'aspect juridique : privacy L'utilisation du numéro de registre national dans le cadre du
"datawarehouse" suppose une autorisation du Comité sectoriel du Registre
national de la Commission de la protection de la vie privée[2]. Son
utilisation doit par ailleurs être examinée au regard de la loi du 8
décembre 1992 relative à la protection de la vie privée à l'égard des
traitements de données à caractère personnel[3]. D'aucuns considèrent
cependant qu'il est préférable d'instaurer des numéros d'identification
distincts par domaine en raison des possibilités de croisements
d'informations sensibles qu'offre un numéro d'identification
transversal[4]. L'étude exploratoire devra donc envisager dans le cas du
recours à un identifiant unique, les moyens d'assurer la sécurisation des
informations ainsi que la préservation de l'anonymat des justiciables tant
au niveau du transfert des données que de leur traitement (par exemple, au
moyen d'un « cryptographic hash algorithms » et/ou d'une élévation du
niveau d'agrégation des informations). 2. L'aspect technique Même lorsque l'accès au numéro de registre national est légalement assuré,
il appert que des problèmes se posent soit au niveau de la possibilité
d'inscription dans un champ spécifique, soit au niveau de la lourdeur de la
procédure, soit par le fait que le numéro doit être réencodé provoquant
ainsi des erreurs de saisie, soit encore que ce numéro n'apparaît pas à
l'écran. L'on sait que des démarches sont actuellement en cours notamment au niveau
de SIPAR, SIDIS et SURTAP, mais une information actualisée devrait être à
ce propos collectée auprès des différents services et autorités concernés. B. L'absence d'harmonisation entre les différentes nomenclatures
Aux différentes phases du système d'administration de la justice pénale,
des nomenclatures servent de référentiel au codage des faits et
infractions, des décisions ou encore des caractéristiques personnelles. De
façon variable selon les cas, une harmonisation interne et horizontale
(différents parquets, différentes maisons de justice, différentes prisons
...) est déjà actuellement assurée. Mais l'intégration verticale suppose
également que ces nomenclatures soient cohérentes à travers l'ensemble du
système pénal. L'objectif d'intégration a généralement été pris en compte au moment
d'opter pour les différentes nomenclatures. Les bases d'une intégration ont
donc été posées par la référence à un même système de codification (codes
de prévention, codes de qualification, pour les infractions ...). Ce n'est
toutefois pas systématique (pour les infractions dans SIPAR par exemple).
Les nomenclatures existantes ne sont par ailleurs pas totalement
satisfaisantes: ainsi peut-on relever dans les codes de prévention, par
exemple, des imprécisions dans les définitions ou des recouvrements de
catégories qu'il importe de résoudre. Les questions relatives à cette
articulation devront être identifiées au cours de l'étude exploratoire. C. La qualité variable des données Il ne faut pas oublier que la qualité des données qui seront introduites
dans le "datawarehouse" dépend directement de la qualité des données
enregistrées à chaque niveau et dans chaque secteur du système de justice
pénale. Cette qualité est encore très inégale. Parallèlement au projet
d'articulation des données entre elles, il est donc nécessaire de faire en
sorte que chaque secteur soit (progressivement) "couvert" et dispose des
moyens adaptés pour produire des informations adaptées et fiables. Il
s'agira au cours de l'étude exploratoire de faire état de la situation,
d'identifier les secteurs défaillants et de proposer une stratégie pour y
remédier. IV. Que faut-il entendre par un "datawarehouse" ?
"Datawarehouse" se traduit littéralement par "entrepôt de données", un tel
outil est généralement utilisé pour rassembler et stocker des informations
provenant d'autres bases de données. Il convient d'envisager un
"datawarehouse" comme un environnement, un environnement qui est construit
à partir de données provenant de différentes bases de données ayant trait à
un domaine d'activité donné. Ces données sont nettoyées, standardisées et
intégrées afin de proposer une lecture homogène et cohérente de la réalité
visée par ce domaine d'activité.
Les données qui composent un "datawarehouse" sont intégrées, stables,
hist