Momentos de imagen

En procesamiento de imagen, visión artificial y campos relacionados, un momento de imagen es cierto promedio ponderado particular de las intensidades de los píxeles de una imagen; o también una función de tales momentos.

Los momentos de imagen son útiles de describir objetos luego de una segmentación. Algunas propiedades simples de la imagen, tales como centroide, área y orientación, se obtienen a partir de esos momentos.

Momentos espaciales

Para un función 2D continua f(x,y) el momento de orden (p + q) está definido por

para p,q = 0,1,2,...

El dominio de una imagen es discreto, y está dado por las coordenadas de sus píxeles. Tales coordenadas se expresan con números enteros.

Adaptando la formulación anterior al dominio discreto de una imagen, e interpretando la función f(x,y) como las intensidades de los píxeles I(x,y), los momentos de una imagen se calculan de la siguiente manera:

En el caso particular pero muy frecuente de imágenes binarias, el valor de I(x,y) sólo puede ser 0 o 1, y la fórmula anterior se expresa de manera más compacta, en el dominio de coordenadas x,y donde I(x,y) = 1:

Por sus aplicaciones en el análisis de imágenes, los momentos de orden 0 a 3 son de interés general, mientras que órdenes superiores se reservan para aplicaciones muy específicas.

Interpretaciones y aplicaciones

Dos propiedades básicas de la imagen derivan de los momentos espaciales de órdenes 0 y 1:

  • Área de una imagen binaria:
  • Centroide

Momentos centrales: invariantes traslacionales

Los momentos centrales se definen como

donde e son las coordenadas del centroide.

La fórmula adaptada a imágenes

Los momentos centrales de orden hasta 3 son:

Los momentos centrales tienen interés a partir del segundo orden. Los de primer orden son cero, y en orden cero no difiere del momento espacial.

Los momentos centrales son invariantes a la traslación.

Aplicaciones

La orientación y la excentricidad se pueden obtener de los momentos centrales, construyendo una matriz de covarianza y calculando sus autovalores y autovectores.

Los elementos de la matriz de covarianza son:

La matriz de covarianza de la imagen es

Orientación

Los autovectores de esta matriz corresponden a los ejes mayor y menor de la figura de la imagen. El autovector dominante (el correspondiente al mayor autovalor) indica la orientación.

Alternativamente, el ángulo del eje mayor respecto del eje cartesiano más cercano (eje x o eje y) se puede calcular directamente a partir de los momentos centrales:

El ángulo se expresa entre -45° y 45°.

Usualmente esta fórmula no evita el cómputo de autovectores, necesario para determinar el eje cartesiano de referencia para ese ángulo.

Excentricidad

Los dos autovalores de la matriz de covarianza se obtienen así:

La excentricidad es un valor entre 0 y 1. 1 es la excentricidad de una circunferencia, 1 es la de un segmento. Se obtiene a partir de los autovalores (λ1 es el mayor autovalor):


Momentos normales: invariantes a la escala

Los momento normales ηi j son invariantes a la traslación y a la escala, y se pueden calcular a partir de los momentos centrales dividiendo por una potencia apropiada del momento de orden cero:

Dónde i + j ≥ 2. Nota que translational la invariancia directamente sigue por único utilizando momentos centrales.

Momentos de Hu: invariantes de rotación

Los invariantes de Hu son 7 momentos bien conocidos, invariantes a la rotación, escala y traslación, y se calculan a partir de los momentos normales:[1][2]

El primer invariante de Hu, I1, es análogo al momento de inercia alrededor de centroide, donde las intensidades de los píxeles son análogas a densidad física.

El último invariante de Hu, I7, es invariante torcida, el cual lo habilita para reconocer imágenes espejadas. Dos valores de igual magnitud y diferente signo corresponden a imágenes espejadas.

Posterior al trabajo de Hu, J. Flusser elaboró una teoría general sobre conjuntos completos e independientes de invariantes rotacionales derivados de momentos.[3]​ Demostró que el conjunto invariantes de Hu no es ni completo ni independiente: por un lado I3 es redundante, pues es dependiente de otros, y por otro falta un invariante, propuesto por Flusser y denominado "octavo invariante de Hu":

Aplicaciones

Los invariantes de Hu se utilizan para reconocer formas 2D en diferentes posiciones (traslaciones), orientaciones (rotaciones) y tamaños (escala).

Invariancia 2D

Las invariancias mencionadas se limitan al espacio 2D de la imagen. Estos momentos no son invariantes a cambios de perspectivas y ni a rotaciones en ejes que no sea el eje perpendicular a la imagen.

Enlaces externos

Referencias

  1. M. K. Hu, "Visual Pattern Recognition by Moment Invariants", IRE Trans. Info. Theory, vol. IT-8, pp.179–187, 1962
  2. http://docs.opencv.org/modules/imgproc/doc/structural_analysis_and_shape_descriptors.html?highlight=cvmatchshapes#humoments Hu Moments' OpenCV method
  3. J. Flusser: "On the Independence of Rotation Moment Invariants", Pattern Recognition, vol. 33, pp. 1405–1410, 2000.