Centralidad de intermediación

Ejemplo de un mismo grafo donde se visualizan distintas medidas de centralidad:
A) intermediación
B) cercanía
C) vector propio
D) grado
E) centralidad armónica
F) centralidad de Katz
Las tonalidades van del rojo (más centrales) al azul (más periféricos).
Las tonalidades que van desde el rojo (valor 0) hasta el azul (valor máximo) indican la intermediación de los nodos en el grafo.

En análisis de redes sociales, la centralidad de intermediación, o simplemente intermediación (en inglés, betweenness) es una medida de centralidad que cuantifica la frecuencia o el número de veces que un nodo se encuentra entre las geodésicas o caminos más cortos de otros actores. Un actor tendrá una alta intermediación si es un vértice de corte para muchas geodésicas entre actores.[1][2]

Para Freeman (1977), esta medida permite cuantificar el control de un humano en la comunicación existente con otros humanos en una red social. La idea intuitiva es que si se eligen dos nodos al azar, y luego también al azar uno de los eventuales posibles caminos más cortos entre ellos, entonces los nodos con mayor intermediación serán aquellos que aparezcan con mayor probabilidad dentro de este camino.[3]

Historia

En los años 1940,Bavelas (1948) sugirió que los actores ubicados entre muchas geodésicas eran centrales en una red.Shimbel (1953) sugirió que esto podría representar una medida del «estrés» que podían experimentar los actores durante la actividad en la red,[4]​ mientras que para Shaw (1954), estos actores también actuaban como «intermediadores», que podrían negarse a transmitir mensajes, dificultando la comunicación en la red.[5]Cohn y Marriott (1958), por su parte, también destacaron la importancia estructural de este tipo de actores.[6]​ No obstante lo anterior, la medida fue formalizada más tarde, con Anthonisse (1971) y Freeman (1977).[7][1]

Si bien la medida fue inicialmente definida para grafos no dirigidos, una década más tarde,Gould (1987) demostró que también funcionaba para grafos dirigidos (o redes sociales asimétricas).[8]

Definición formal

En lo que sigue, se define formalmente un grafo como un par ordenado , donde es su conjunto de nodos o vértices y su conjunto de aristas. El número de vértices se denota como .

Formalmente, la intermediación de un nodo en una red o grafo se define como:[2]

donde es el número de caminos más cortos desde el nodo hasta el nodo , y el número de caminos más cortos desde hasta que pasan a través del nodo .

Para normalizar esta medida, y asumiendo que el grafo no tiene bucles o que estos no se consideran, se puede dividir por el mayor número posible de pares de actores, excluyendo el nodo que se está midiendo. Así, por lo tanto, para grafos no dirigidos y dirigidos se obtiene, respectivamente:[1]

o bien

En su versión normalizada, los valores de la medida siempre varían entre 0 y 1. Por ejemplo, para un grafo estrella, el nodo central tiene intermediación 1 y los nodos periféricos, intermediación 0. Note también que, a diferencia de la medida de cercanía clásica, la intermediación sí se puede calcular sobre grafos disconexos.[1]​ Los nodos con una alta intermediación suelen jugar un rol crítico en la estructura de la red, especialmente cuando hay grandes flujos de información que son transportados por nodos pertenecientes a grupos compactos. En una red social, este tipo de actores están relacionados con los agujeros estructurales (en inglés, structural holes), es decir, con aquellos nodos de los que depende la integración de algunas componentes de la red.[2]​ Los nodos que poseen una posición de intermediarios de alguna manera son también controladores o reguladores del flujo de información. Así, en un proceso de difusión, los nodos con una alta intermediación pueden actuar como brókers o «porteros» (en inglés, gatekeepers).[9]​ Adicionalmente, los actores con una alta intermediación también se pueden considerar como con una alta «influencia interpersonal».[1][10][11]

En complejidad computacional, determinar el camino más corto para cada par de nodos de un grafo puede calcularse en tiempo (por ejemplo, usando el algoritmo de Floyd-Warshall) y utilizando un espacio .[2]​ En un grafo disperso, el algoritmo de Johnson puede lograr lo mismo en tiempo , y si el grafo es sin pesos, se puede lograr en tiempo y espacio utilizando el algoritmo de Brandes.[12]

Variantes de la intermediación

La centralidad de intermediación tiene algunas restricciones. Si bien supone que todas las geodésicas tienen la misma probabilidad de ser elegidas, los actores con un alto grado podrían tener mayor probabilidades de ser elegidos para conectar otros actores, al pertenecer a más geodésicas entre actores. Bajo este razonamiento, solo en las redes regulares todos los actores tendrían la misma probabilidad de ser elegidos. Por otra parte, esta medida solo se centra en las geodésicas, pero en varios contextos (por ejemplo, en redes de telecomunicaciones) es razonable pensar en elegir caminos más largos que las geodésicas.[1]

Newman (2005) propuso una versión alternativa de la medida de intermediación, basada en considerar caminos aleatorios del grafo, y no exclusivamente los más cortos. La idea es tomar en cuenta todos los caminos posibles, y calcular la medida de acuerdo a los elegidos aleatoriamente. Formalmente se define como:[2]

donde es la matriz cuyos elementos contienen la probabilidad de ocurrencia de un camino al azar desde hasta y que contiene al nodo como nodo intermediario.

Centralidad de información

La centralidad de información nace de la idea de aplicar la teoría de la información en la definición de medidas de centralidad.[1]​ Los primeros acercamientos, bastante matemáticos, se deben a Mackenzie (1966) y su índice de participación total.[13]​ Más tarde,Bolland (1988) definió el índice de flujo continuo, que como el anterior, considera todos los caminos posibles de la red, pero sin considerar el recuento de la intermediación.[14]

La centralidad de información de Stephenson y Zelen (1989) es una variante de la centralidad de intermediación que, como sus antecesores, no se restringe solo a las geodésicas sino a todos los caminos posibles de la red. Esta medida está además motivada por la teoría de estimación estadística. Los pesos de los caminos se definen como las inversas de sus varianzas y representan la cantidad de información que circula a través de los respectivos actores. Dado que el flujo de información se asume independiente entre las aristas, entonces estas varianzas equivalen a las longitudes de los caminos. Las geodésicas normalmente asumen valores 1, mientras que los caminos más largos, valores inferiores, lo que representa una disminución de información. Esta medida determina la longitud media armónica de los caminos que acaban en un nodo , la que será pequeña si se conecta con muchos otros nodos a través de caminos cortos.[15][1]

Véase también

Referencias

  1. a b c d e f g h Wasserman y Faust, 2013, «Centralidad y prestigio», pp. 191-240.
  2. a b c d e Sun, Jimeng; Tang, Jie (2011). «A survey of models and algorithms for social influence analysis». En Charu C. Aggarwal, ed. Social network data analytics (Nueva York: Springer): 177-214. doi:10.1007/978-1-4419-8462-3. 
  3. Freeman, L. (1977). «A set of measures of centrality based upon betweenness». Sociometry 40 (1): 35-41. 
  4. Shimbel, A. (1953). «Structural parameters of communication networks». Bulletin of Mathematical Biophysics 15: 501-507. 
  5. Shaw, M. E. (1954). «Group structure and the behavior of individuals in small groups». Journal of Psychology 38: 139-149. 
  6. Cohn, B. S.; Marriott, M. (1958). «Networks and centres of integration in Indian civilization». Journal of Social Research 1: 1-19. 
  7. Anthonisse, J. M. (1971). The rush in a directed graph. Amsterdam: Mathematische Centrum. 
  8. Gould, R. V. (1987). «Measures of betweenness in non-symmetric networks». Social Networks 9 (3): 277-282. 
  9. Abbasi, A.; Hossain, L.; Leydesdorff, L. (2012). «Betweenness centrality as a driver of preferential attachment in the evolution of research collaboration networks». Journal of Informetrics 6 (3): 403-412. 
  10. Freeman, L.C. (1979). «Centrality in networks: I. Conceptual clarification». Social Networks 1: 215-239. doi:10.1016/0378-8733(78)90021-7. 
  11. Friedkin, N. E. (1991). «Theoretical foundations for centrality measures». American Journal of Sociology 96: 1478-1504. 
  12. Brandes, U. (2001). «A faster algorithm for betweenness centrality». Journal of Mathematical Sociology 25: 163-177. doi:10.1080/0022250X.2001.9990249. 
  13. Mackenzie, K. D. (1966). «The information theoretic entropy function as a total expected participation index for communication network experiments». Psychometrika 31: 249-254. doi:10.1007/BF02289511. 
  14. Bolland, J. M. (1988). «Sorting out centrality: An analysis of the performance of four centrality models in real and simulated networks». Social Networks 10 (3): 233-253. doi:10.1016/0378-8733(88)90014-7. 
  15. Stephenson, K. A.; Zelen, M. (1989). «Rethinking centrality: Methods and examples». Social Networks 11 (1): 1-37. doi:10.1016/0378-8733(89)90016-6. 

Bibliografía

  • Wasserman, Stanley; Faust, Katherine (2013) [1994]. Análisis de redes sociales: Métodos y aplicaciones. Madrid: Centro de Investigaciones Sociológicas. ISBN 978-84-7476-631-8. OCLC 871814053.