Recalage d'imagesEn traitement d'image, le recalage est une technique qui consiste en la « mise en correspondance d'images »[1], dans le but de comparer ou combiner leurs informations respectives. Cette méthode repose sur les mêmes principes physique et le même type de modélisation mathématique que la corrélation d'images. Cette mise en correspondance se fait par la recherche d'une transformation géométrique permettant de passer d'une image à une autre. Cette technique comprend de nombreuses applications, allant de l'imagerie médicale, afin par exemple de fusionner plusieurs modalités d'imagerie, au traitement de vidéos, comme le suivi de mouvement et la compression, ou à la création de mosaïques d'images (panoramas). Les images à recaler peuvent provenir d'une même source (ex. : scanner, caméra) ou être « multi-sources » (ex. : images satellitales, aériennes et carte d'un même territoire[2]). Principe de l'algorithmeSoient deux images données[3], l'image fixe et l'image déformable où est une position dans le domaine de l'image et .
qui permet de minimiser l'écart entre deux images après la transformation: . La métrique s'appelle le critère de similarité dans le paragraphe suivant.
Et la minimisation se fait par un algorithme d'optimisation. Classification des méthodesLes méthodes de recalage peuvent être classifiées selon quatre critères principaux[4] :
Les attributs de l'imagePour estimer la transformation, on peut utiliser l'intensité ou des primitives géométriques. Approche géométriqueCes méthodes furent parmi les premières à être proposées de par leur similitude avec la méthode utilisée par un être humain pour mettre en correspondance deux images. Elles se fondent en effet sur l'extraction à partir de chacune des images de primitives géométriques (points saillants, coins, contours...). Par la suite, ces primitives sont appariées afin de déterminer la transformation entre les deux images. Cette approche est intéressante car ces primitives sont faciles à manipuler et elles permettent d'être indépendante des modalités. Cependant, extraire ces attributs n'est pas toujours aisé. Approche iconiqueCette classe de méthodes se fonde essentiellement sur l'utilisation des intensités des deux images via l'utilisation d'une mesure de similarité, sans prendre en compte l'information géométrique. Cette approche peut également s'appuyer sur une information dérivée des caractéristiques différentielles de l'image ou sur une transformée de Fourier. Cependant, dans le cas du recalage multimodal ou monomodal inter-patients, la relation entre l'intensité des images n'est pas toujours triviale à calculer. De plus, on n'extrait pas un sous-ensemble d'attributs, et par conséquent le nombre de données à traiter est élevé (l'entièreté de l'image). Approche hybrideCette approche tente de tirer parti des deux approches sus-citées. Critère de similaritéLa mesure de similarité entre les images dépend des attributs considérés. Information fondée sur les attributs géométriquesC'est une information, comme des points (landmarks, coordonnées), des lignes ou des surfaces, qu'il faut mettre en correspondance. L'opération consiste à minimiser les distances entre les attributs homologues. Information fondée sur l'intensitéDe nombreuses mesures de similarité ont été développées à ce jour, supposant chacune une relation différente entre les intensités lorsque les images sont recalées. Parmi elles, les plus utilisées sont notamment :
Modèles de transformationTransformation linéaireLa transformation géométrique recherchée peut tout d'abord être linéaire, c'est-à-dire pouvant s'écrire sous la forme d'un polynôme de degré 1. Cette classe comprend notamment les transformations rigides (rotation, translation), les similitudes, les transformations affines et les transformations projectives. Pour des raisons pratiques, ce type de transformation est par ailleurs souvent représenté sous une forme matricielle. On parle alors de représentation en coordonnées homogènes. Par exemple, les transformations linéaires ne comportant que des translations ou des rotations sur les axes sont des recalage dit rigide. Ils sont notamment utilisés en imagerie médicale pour le recalage d'image intra-sujet et intra-modalité mais ayant été acquis à des dates différentes[5]. Transformation non linéaireLa transformation peut également être non linéaire. Elle est alors d'ordre supérieur par exemple les thin-plate splines, les combinaisons de B-Splines, etc. Dans la littérature de traitement d'images, ces transformations peuvent également être nommées élastiques, déformables ou encore non rigides. Il existe deux approches pour modéliser la transformation non rigide : l'approche paramétrique et l'approche non paramétrique. Approches paramétriquesMéthode polynomialeFonctions de base (Basis function)Fonctions de base radiale (Radial Basis function)FFD- Free Form Deformations (transformation globale ou locale)FEM- Finite Element MethodApproches non paramétriquesMéthodes différentielles
Méthodes statistiques
Stratégie d'optimisationLes méthodes d'optimisation constituent le lien entre le critère de ressemblance et la transformation optimisée, utilisant les informations issues du ou des critères choisies afin de déduire la transformation entre les images. De ce fait, ces algorithmes dépendent de la transformation optimisée et du critère. Les méthodes géométriques produisent souvent un ensemble d'appariements entre divers points des images. Dans ce cas, et si la transformation recherchée le permet, un algorithme dit des moindres carrés, ainsi que ses variantes robustes, peut être utilisé afin d'obtenir la transformation optimale. Les critères iconiques sont quant à eux souvent optimisés via des méthodes de descente de gradient en fonction des paramètres de la transformation ou, lorsque le gradient ne peut être calculé, la méthode de Powell peut être utilisée afin d'optimiser la transformation. On distingue quatre grandes stratégies d'optimisation: Les méthodes directesLes méthodes exhaustivesLes méthodes numériques itératives d'ordre supérieurLes méthodes non déterministesApplicationsLe recalage est utilisé en imagerie médicale où ses applications sont nombreuses. Il permet notamment de fusionner plusieurs images d'un même patient, ceci par exemple afin de pouvoir exploiter les informations fournies dans différentes modalités comme l' imagerie scanner, l'imagerie par résonance magnétique, l'échographie ou l'échographie doppler, l'imagerie Tomographie à émission de positron (TEP), la scintigraphie, l'imagerie infrarouge... Mais il peut également être utilisé pour l'étude de l'évolution au cours du temps d'un patient.
En traitement d'imagerie médicale, il y a beaucoup d'applications cliniques et de recherches au recalage d'images. Les quatre grands domaines de recherches sont:
D'autres applications dans le domaine du traitement d'images sont notamment reliées au morphing permettant de générer une transition entre deux images. Mais il est également très important en imagerie satellitaire, pour la création de panoramas d'images, etc. Enfin, une application étonnante est la souris optique. La plupart des technologies existantes utilisent en effet un recalage entre les images acquises par la souris afin d'estimer le mouvement de celle-ci. Dans le domaine de mécanique, il existe aussi la technique du recalage avec le nom corrélation d'images numériques qui permet de mesurer les champs de déplacements entre deux images. Le principe de la méthode reste pareil à celui du recalage mais la corrélation d'images se focalise particulièrement sur la transformation et les déplacements entre images afin d'identifier des propriétés mécaniques des matériaux. Il existe un outil open source de recalage d'image elastix[6] qui comprend la plupart de fonctionnalités courantes (Plusieurs modèles de transformation, critères de similarité etc.). L'utilisateur peut obtenir les résultats désirés comme image de sortie, champs de déplacements. Un autre outil d'intérêt pour ses fonctionnalités est le framework open-source et cross-platform de développement d'application Insight Segmentation and Registration Toolkit (ITK)[7] utilisé dans le Visible Human Project. Ce framework, c++ et disposant d'un wrapper java, est utilisé conjointement avec framework open-source et cross-platform de développement d'application Visualization Toolkit (VTK)[8] qui se concentre essentiellement sur la visualisation. Notes et références
Voir aussiArticles connexes
Liens externesBibliographie
|
Portal di Ensiklopedia Dunia