En sciences sociales et dans les sciences expérimentales, notamment pour des applications statistiques, un proxy ou une variable proxy (au Québec, la traduction recommandée est variable de substitution ou variable substitutive[1]) est une variable qui n'est pas significative en soi, mais qui remplace une variable utile mais non observable ou non mesurable[2]. Pour qu'une variable soit un bon proxy, elle doit avoir une bonne corrélation, pas nécessairement linéaire, avec la variable utile. Cette corrélation peut être positive ou négative.
Sciences sociales
Le PIB par habitant est souvent utilisé en tant que proxy pour des mesures du niveau de la vie ou de la qualité de la vie. Mark R. Montgomery et al. ont étudié plusieurs des proxys utilisés, et ont mis en évidence des limites d'utilisation pour chacun d'eux, en énonçant : « Dans les pays pauvres, aucune mesure empirique unique ne peut visualiser tous les aspects du concept de revenu. Notre avis est que la consommation par adulte est la meilleure mesure à prendre en compte parmi celles collectées dans les enquêtes transversales. »[3].
Le nombre d'années d'études et le GPA (moyenne des notes d'un étudiant) constituent des proxies pour l'aptitude cognitive[4].
Helge Toutenburg et Götz Trenkler, « Proxy variables and mean square error dominance in linear regression », Journal of Quantitative Economics, vol. 8, , p. 433–442
Peter Stahlecker et Götz Trenkler, « Some further results on the use of proxy variables in prediction », The Review of Economics and Statistics, The MIT Press, vol. 75, no 4, , p. 707–711 (DOI10.2307/2110026, JSTOR2110026)
Götz Trenkler et Peter Stahlecker, « Dropping variables versus use of proxy variables in linear regression », Journal of Statistical Planning and Inference, NORTH-HOLLAND, vol. 50, no 1, , p. 65–75 (DOI10.1016/0378-3758(95)00045-3)