En procesamiento de imagen, visión artificial y campos relacionados, un momento de imagen es cierto promedio ponderado particular de las intensidades de los píxeles de una imagen; o también una función de tales momentos.
Los momentos de imagen son útiles de describir objetos luego de una segmentación. Algunas propiedades simples de la imagen, tales como centroide, área y orientación, se obtienen a partir de esos momentos.
Momentos espaciales
Para un función 2D continua f(x,y) el momento de orden (p + q) está definido por
para p,q = 0,1,2,...
El dominio de una imagen es discreto, y está dado por las coordenadas de sus píxeles. Tales coordenadas se expresan con números enteros.
Adaptando la formulación anterior al dominio discreto de una imagen, e interpretando la función f(x,y) como las intensidades de los píxeles I(x,y), los momentos de una imagen se calculan de la siguiente manera:
En el caso particular pero muy frecuente de imágenes binarias, el valor de I(x,y) sólo puede ser 0 o 1, y la fórmula anterior se expresa de manera más compacta, en el dominio de coordenadas x,y donde I(x,y) = 1:
Por sus aplicaciones en el análisis de imágenes, los momentos de orden 0 a 3 son de interés general, mientras que órdenes superiores se reservan para aplicaciones muy específicas.
Interpretaciones y aplicaciones
Dos propiedades básicas de la imagen derivan de los momentos espaciales de órdenes 0 y 1:
- Área de una imagen binaria:
- Centroide
Momentos centrales: invariantes traslacionales
Los momentos centrales se definen como
donde e son las coordenadas del centroide.
La fórmula adaptada a imágenes
Los momentos centrales de orden hasta 3 son:
Los momentos centrales tienen interés a partir del segundo orden. Los de primer orden son cero, y en orden cero no difiere del momento espacial.
Los momentos centrales son invariantes a la traslación.
Aplicaciones
La orientación y la excentricidad se pueden obtener de los momentos centrales, construyendo una matriz de covarianza y calculando sus autovalores y autovectores.
Los elementos de la matriz de covarianza son:
La matriz de covarianza de la imagen es
Orientación
Los autovectores de esta matriz corresponden a los ejes mayor y menor de la figura de la imagen. El autovector dominante (el correspondiente al mayor autovalor) indica la orientación.
Alternativamente, el ángulo del eje mayor respecto del eje cartesiano más cercano (eje x o eje y) se puede calcular directamente a partir de los momentos centrales:
El ángulo se expresa entre -45° y 45°.
Usualmente esta fórmula no evita el cómputo de autovectores, necesario para determinar el eje cartesiano de referencia para ese ángulo.
Excentricidad
Los dos autovalores de la matriz de covarianza se obtienen así:
La excentricidad es un valor entre 0 y 1. 1 es la excentricidad de una circunferencia, 1 es la de un segmento. Se obtiene a partir de los autovalores (λ1 es el mayor autovalor):
Momentos normales: invariantes a la escala
Los momento normales ηi j son invariantes a la traslación y a la escala, y se pueden calcular a partir de los momentos centrales dividiendo por una potencia apropiada del momento de orden cero:
Dónde i + j ≥ 2.
Nota que translational la invariancia directamente sigue por único utilizando momentos centrales.
Momentos de Hu: invariantes de rotación
Los invariantes de Hu son 7 momentos bien conocidos, invariantes a la rotación, escala y traslación, y se calculan a partir de los momentos normales:[1][2]
El primer invariante de Hu, I1, es análogo al momento de inercia alrededor de centroide, donde las intensidades de los píxeles son análogas a densidad física.
El último invariante de Hu, I7, es invariante torcida, el cual lo habilita para reconocer imágenes espejadas. Dos valores de igual magnitud y diferente signo corresponden a imágenes espejadas.
Posterior al trabajo de Hu, J. Flusser elaboró una teoría general sobre conjuntos completos e independientes de invariantes rotacionales derivados de momentos.[3] Demostró que el conjunto invariantes de Hu no es ni completo ni independiente: por un lado I3 es redundante, pues es dependiente de otros, y por otro falta un invariante, propuesto por Flusser y denominado "octavo invariante de Hu":
Aplicaciones
Los invariantes de Hu se utilizan para reconocer formas 2D en diferentes posiciones (traslaciones), orientaciones (rotaciones) y tamaños (escala).
Invariancia 2D
Las invariancias mencionadas se limitan al espacio 2D de la imagen. Estos momentos no son invariantes a cambios de perspectivas y ni a rotaciones en ejes que no sea el eje perpendicular a la imagen.
Enlaces externos
Referencias