Le Modèle d’Auto-régression simultanée (« Simultaneous AutoRegressive Model » ou « SAR ») est une généralisation du modèle de régression linéaire défini pour tenir compte de l'autocorrélation spatiale dans les problèmes de classification et de régression spatiale[1],[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe détecte une dépendance entre l'observation effectuée et le lieu géographique, il doit employer un modèle non stationnaire tels que SAR, CAR ou GWR.
Description
Ce modèle prend la forme suivante :
où et sont des coefficients d’auto-régression, et sont les matrices de poids spatiaux, x les variables explicatives, y la variable expliquée, et représentent les erreurs[1].
Selon que les paramètres et sont nuls ou non le modèle peut prendre les quatre formes suivantes[1] :
le modèle de décalage spatial (« spatial lag model »), où la dépendance spatiale est portée par la variable réponse et apparait dans le modèle comme une variable explicative supplémentaire
le modèle d'erreur spatiale (« spatial error model »), où la dépendance spatiale est portée par la perturbation
On l'utilise ces modèles dans la fouille de données spatiales. Le modèle de décalage spatial est utilisé lorsque l'analyste suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. L'analyste utilise le modèle d'erreur spatiale lorsque la dépendance est présente et identifié dans les résidus[1].
L'estimation des coefficients du modèle est en général effectuée à l'aide de la méthode du maximum de vraisemblance[3], bien que extrêmement consommatrice de ressource machine[4].
(en) Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, , 458 p. (ISBN978-1-4200-7397-3).
(en) Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, , 360 p. (ISBN978-3-6420-2664-5)
(en) Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, CRC Press, , 3e éd., 605 p. (ISBN978-1-4200-8586-0)
Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, , 251 p. (ISBN978-2-911762-52-9, lire en ligne)