Recherche de cas médicaux multimodaux à l'aide d'arbres de décision

1- Revue et examen de la littérature 12 ... 3- L'aide à la décision en univers
conflictuel (hostile) 93 ... Chapitre 4 - SYSTÈMES D'AIDE À LA DÉCISION 104.

Part of the document


Recherche de cas médicaux multimodaux à l'aide d'arbres de décision
Multimodal medical case retrieval using decision trees
G. Quelleca,c,*, M. Lamardb,c, L. Bekrib,c,d, G. Cazuguela,c, B.
Cochenerb,c,d, C. Rouxa,c
a ENST Bretagne, GET-ENST, Brest, F-29200 France
b Univ Bretagne Occidentale, Brest, F-29200 France
c Inserm, U650, Brest, F-29200 France
d CHU Brest, Service d'Ophtalmologie, Brest, F-29200 France
Résumé
Nous proposons dans cet article un système de raisonnement à base de cas
pour la recherche de dossiers patients similaires à un cas donné en
requête. Nous nous intéressons à des dossiers patients constitués de
plusieurs images accompagnées d'informations contextuelles (telles que
l'âge, le sexe et les antécédents médicaux du patient). Plusieurs sources
d'informations (parfois incomplètes) sont en effet généralement nécessaires
pour diagnostiquer une pathologie. Nous proposons un outil de recherche
basé sur les arbres de décision, qui sont bien adaptés pour traiter de
l'information hétérogène et incomplète. Pour prendre en compte des images
dans ce système, nous leur associons une signature définie à partir de leur
contenu numérique. La méthode est évaluée sur une base de rétinopathies
diabétiques classifiées. Sur cette base de données, les résultats sont
intéressants : la précision atteint 79,5% pour une fenêtre de retrouvaille
de 5 cas, doublant pratiquement les résultats obtenus en n'utilisant que le
contenu numérique d'une image.
Abstract
In this article, we present a Case-based Reasoning system for the retrieval
of patient files similar to a case placed as query. We focus on patient
files made up of several images with contextual information (such as the
patient age, sex and medical history). Indeed, medical experts generally
need varied sources of information (which might be incomplete) to diagnose
a pathology. Consequently, we derive a retrieval framework from decision
trees, which are well suited to process heterogeneous and incomplete
information. To be integrated in the system, images are indexed by their
digital content. The method is evaluated on a classified diabetic
retinopathy database. On this database, results are promising: the
retrieval sensitivity reaches 79.5% for a window of 5 cases, which is
almost twice as good as the retrieval of single images alone.
Mots clés : arbres de décision ; indexation d'images ; information
contextuelle ; information incomplète; rétinopathie diabétique
Keywords: contextual information; decision trees; diabetic retinopathy;
image indexing; incomplete information
* Auteur correspondant. Adresse e-mail : gwenole.quellec@enst-bretagne.fr
(G. Quellec). Introduction En médecine, la connaissance des experts résulte des connaissances
encyclopédiques et d'expériences à travers des cas cliniques réels. Aussi,
le raisonnement à base de cas (RBC ou Case-based reasoning - CBR) [1],
présenté aux débuts des années 1980, connaît-il un intérêt croissant pour
le développement de systèmes d'aide à la décision médicale [2]. L'idée sous-
jacente du RBC est que des problèmes proches ont des solutions voisines,
une idée confirmée par l'expérience des médecins. Dans le RBC,
l'interprétation d'une nouvelle situation passe par la recherche, dans une
base de cas, de cas similaires au cas en question. L'interprétation de ces
cas connus est ensuite adaptée au cas étudié.
A l'origine, le RBC à été mis au point pour traiter des cas structurés,
typiquement des vecteurs de paramètres, textuels ou numériques. Des
informations plus complexes telles que des images ne sont pas prises en
compte par les systèmes standards. Or les médecins se basent sur des
sources d'information très variées pour établir un diagnostic. Ainsi, pour
les examens de Rétinopathie Diabétique (RD), les ophtalmologistes analysent
des images multimodales, conjointement à de l'information structurée :
l'âge du patient, son sexe, ses antécédents médicaux, etc.
Les méthodes d'indexation des images par leur contenu numérique, utilisées
pour la recherche d'images en associant des index numériques à des images
(Content-based Image Retrieval - CBIR [3]), permettent de mesurer la
similarité entre deux images et ainsi étendre le RBC à des cas contenant
des images. Ces méthodes sont particulièrement intéressantes pour leur
objectivité et leur reproductibilité.
La définition d'un système RBC est ici conditionnée à la résolution de
plusieurs problèmes, en particulier l'agrégation d'attributs hétérogènes
(des images, des attributs nominaux ou continus), et la gestion de
l'information manquante. Nous proposons de résoudre simultanément ces
différents problèmes en définissant une mesure de similarité entre deux cas
cliniques, à partir d'arbres de décision [4-5], généralement utilisés pour
des problèmes de classification. Le système proposé est générique et
applicable à toute sorte de base de données. Nous l'avons appliqué à la
rétinopathie diabétique.
Après une présentation de la base de données (§2), nous préciserons les
objectifs du système (§3). Nous décomposerons la présentation du système en
trois parties : tout d'abord la présentation des descripteurs de dossiers
patients (§4.1), puis l'apprentissage du système (§4.2) et enfin son
utilisation (§4.3). Nous terminerons par les résultats et les conclusions
(§5). La base de rétinopathie diabétique
La base de rétinopathies diabétiques, développée spécifiquement pour
l'étude, contient des images rétiniennes de patients diabétiques, associées
à des informations anonymes sur la pathologie.
Le diabète est un trouble métabolique caractérisé par un excès constant de
sucre dans le sang. Cet excès affecte progressivement les vaisseaux
sanguins dans plusieurs organes (atteinte des tissus, rétrécissement), ce
qui peut entraîner de sérieuses complications rénales, cardiovasculaires,
cérébrales et également rétiniennes. Différentes lésions apparaissent sur
les vaisseaux endommagés, pouvant entraîner la cécité.
Notre base de données comprend actuellement 63 dossiers patients, contenant
au total 1045 photographies. Les patients sont tous diabétiques, ils ont
été vus en consultation au centre hospitalier universitaire de Brest. Les
dossiers utilisés dans l'étude sont les 63 premiers, par ordre
chronologique de la consultation. Les informations cliniques associées aux
images sont saisies à partir du dossier patient de l'hôpital.
Les images de la rétine ont été acquises par un ophtalmologiste, à l'aide
d'un appareil numérique Topcon Retinal Digital Camera (TRC-50IA) connecté à
un ordinateur (voir figure 1). Elles ont une définition de 1280 pixels par
ligne pour 1008 lignes par image et sont compressées sans perte. Pour mieux
identifier les différentes lésions, les images sont acquises dans
différentes modalités : les rétinophotos (de simples photographies
couleur), des photographies obtenues par application d'un filtre vert
(anérythre) et d'un filtre bleu, ainsi que les séries angiographiques. Pour
obtenir une série angiographique, un produit de contraste (la fluorescéine)
est injecté dans le système sanguin du patient et des photographies de la
rétine sont acquises à trois temps différents, afin d'étudier la
circulation sanguine dans la rétine. En sus des images du pôle postérieur,
quatre photographies sont acquises sur la périphérie de la rétine au temps
intermédiaire. Ainsi les dossiers patients sont constitués idéalement de 10
images par ?il (voir figure 1).
Pour chaque patient, un expert décrit les lésions présentes dans les images
et en déduit le niveau de sévérité ICDRS [6] de la pathologie, sur une
échelle de 0 à 5, 0 correspondant à l'absence de lésions. La distribution
des niveaux de sévérité parmi les 63 patients de la base de données est
fournie dans le tableau I. Objectifs
1 Technique d'examen
Afin de déterminer le niveau de sévérité de la RD, l'ophtalmologiste doit
acquérir un ensemble de photographies multimodales (voir figure 1) et les
analyser de manière différentielle. Le niveau de sévérité est ensuite
déterminé en fonction du nombre, du type et de la localisation de ces
lésions. L'ophtalmologiste s'aide également du contexte médical du patient
pour établir son diagnostic. L'analyse et l'interprétation des images est
coûteuse en temps, surtout lorsque la qualité des images est mauvaise.
Chaque niveau de sévérité entraîne une procédure spécifique (traitements,
fréquence des contrôles, etc.).
2 Système d'aide au diagnostic proposé
Afin de diminuer le temps d'interprétation des images, notamment pour les
cas difficiles, nous proposons aux médecins un système d'aide au diagnostic
de la RD. Plusieurs études ont été menées pour analyser automatiquement un
dossier patient en segmentant les lésions caractéristiques de la RD dans
les images et utiliser les résultats de segmentation pour calculer le
niveau de sévérité de la pathologie [7]. Cette solution présente cependant
des inconvénients : 1) compte tenu du nombre de types de lésions (9) et de
modalités d'images (6), il faut paramétrer un nombre important
d'algorithmes de détection, 2) ces algorithmes de détection sont
généralement sensibles aux variations de qualité des images, ainsi qu'au
changement de matériel. Nous proposons une solution alternative : nous
caractérisons les images par une méthode générique, basée sur leur contenu
numérique, et nous utilisons un algorithme de fouil