Analyse par enveloppement des donnéesL'analyse par enveloppement des données (en anglais, data envelopment analysis - abrégée DEA) est une méthode d'analyse comparative non paramétrique de l'efficience. Elle a pour but de comparer des unités de production (ou plus généralement, des unités de prise de décision (en) , en anglais decision making unit abrégé DMU) selon les ressources qu'elles utilisent (les facteurs de productions, ou inputs) et les biens ou services produits produits (outputs). La DEA est basée sur le concept d'ensemble des technologies qui est l'ensemble des plans de productions, c'est-à-dire les outputs pour des facteurs de productions donnés, réalisables technologiquement. Cette méthode d'analyse a été inventée par Abraham Charnes, William W. Cooper et Edward Rhodes. HistoriqueLa DEA a été inventée par Abraham Charnes, William W. Cooper et Edward Rhodes. Alors doctorant au collège John Heinz III (en) à l'université Carnegie-Mellon sous la supervision de Cooper, Edward Rhodes effectue dans les années 70 une étude sur les résultats du programme fédéral Projet Follow Through, un programme d'éducation pour les élèves provenant de milieux défavorisés ayant été mis en place dans les écoles publiques américaines. Le but de l'étude de Rhodes était de comparer les efficiences relatives des écoles entre celles qui participaient ou non au programme, en les comparant sur base d'inputs utilisés et d'outputs mesurables produits. Cela fut fait grâce à la première forme de DEA, appelée alors « rapport CCR » (des initiales des chercheurs)[1],[2],[3]. Principe et formulation mathématiqueLa DEA a pour but d'étudier les choix de décision de production pris par des unités de prise de décision (en) (en anglais, décision making unit, abrégé DMU)[4]. L'analyse par DEA se fait en deux étapes. Premièrement la détermination de l'ensemble des technologies et secondement le calcul des efficiences par optimisation linéaire. Le concept d'ensemble des technologies, central à la DEA, est défini comme l'ensemble des points (input X, output Y) tels qu'il est possible, technologiquement, de produire l'output Y avec l'input X. Les unités de production, appelées DMU (pour decision making unit) sont définies par un couple (input, output) correspondant à leur plan de production. Ce couple de points doit appartenir à l'ensemble des technologies. Pour effectuer une DEA, il faudrait connaitre cet ensemble des technologies, cependant, celui-ci est théorique et la plupart du temps inconnu. Il faut donc, en partant d'hypothèses (listées plus bas), déduire l'ensemble des technologies sur bases des données (input,output) des DMU de l'analyse. Le calcul des efficiences se fait par un calcul d'optimisation. L'efficience est calculé comme le facteur optimal par lequel il faut multiplier les inputs (si l'on recherche l'efficience relative aux inputs) ou bien les outputs (si l'on recherche l'efficience de production pour des inputs donnés) pour que le couple (input, output) se retrouve sur la frontière estimée de l'ensemble des technologies. Mathématiquement, pour chaque DMU (ici indiquée par k), l'efficience relative aux inputs est définie par
où est l'ensemble des technologies estimé
Ici, l'ensemble dépend des hypothèses prises sur l'ensemble des technologies (voir section suivante). Formulation des hypothèsesHypothèses d'estimation de l'ensemble des technologiesL'ensemble des technologies est un concept central en DEA . Il est défini comme l'ensemble formé de tous les couples d'inputs et d'outputs accessibles théoriquement par la technologie actuelle. Lorsque l'on étudiera des entreprises produisant des biens, on parlera de plans de production ; mais la définition d'ensemble des technologies s'applique aussi pour les productions de services. Cependant, cet ensemble n'est, à priori, pas connu. Par exemple, si l'on produit un service et que l'output est le bien-être du consommateur, on ne peut pas savoir quel output maximal est réalisable. On a donc besoin, pour effectuer une DEA, d'estimer l'ensemble des technologies. L'estimation va, sur base d'hypothèses, délimiter la zone des couples d'inputs/outputs réalisables, tout en imposant que tous les points se situent dans l'estimation effectuée (toutes les DMU ont un plan de production accessible, par définition)[1]. Hypothèse de disponibilité libreL'hypothèse de libre disponibilité (en anglais free disposability hypothesis ou FDH) consiste a supposer que, pour tout couple input/output donné, il y a toujours moyen de produire la même quantité d'output avec plus d'input (en laissant de côté l'input excédentaire non utilisé). De même, pour un input et un output donnés, il y a toujours moyen de produire moins d'output (en laissant de côté l'output excédentaire produit). Enfin, il y a aussi moyen, en mélangeant les deux assertions ci-dessus, de produire moins d'outputs avec plus d'inputs. la FDH dit donc que l'on a toujours la libre disponibilité de faire moins bien qu'un plan de production donné. Mathématiquement, pour chacune des DMU, dont le couple d'input/output est , l'hypothèse FDH implique que les points produisant moins avec plus, où et appartiennent tous à l'estimation du technology set. La relation d'ordre prise ici n'est pas totale. En effet, s'il y a par exemple deux variables d'inputs, disons et , il peut arriver que, pour un output donné, une DMU A utilise moins d'input (1) que la DMU B, mais que la DMU B utilise moins d'input (2) que la DMU A. On ne pourra donc pas les comparer : et On peut graphiquement représenter le technology set résultant de l'hypothèse de disponibilité libre lorsqu'il n'y a qu'un input et qu'un output. L'input est conventionnellement représenté sur l'axe horizontal et l'output sur l'axe vertical. Dans ce cas, le technology set est l'union des zones formées par les « coins inférieurs droits » de chaque plan de production des DMU, c'est-à-dire l'ensemble des points en dessous ou à gauche de chaque plan de production. Sur le graphique ci-contre, le technology set est la zone à droite de la ligne brisée. Hypothèse de rendements d'échelle variablesL'hypothèse de rendements d'échelles variables consiste à dire que, si plusieurs DMU ont des plans de productions (couples inputs/outputs) différents, alors une moyenne pondérée de ces plans de productions est un plan de production réalisable. Autrement dit, le point correspondant à cette moyenne pondérée appartient au technology set. Mathématiquement, si les DMU A et B ont les plans de productions et respectivement, alors tous les points qui sont une moyenne pondérée de ces plans,
appartiennent à l'estimation de l'ensemble des technologies. Cela se généralise pour un nombre fini de points, : si les DMU ont les plans de productions , alors tous les points qui sont une moyenne pondérée de ces plans,
appartiennent à l'estimation de l'ensemble des technologies. Cela se comprend graphiquement de la manière suivante : pour deux DMU, tous les points qui se situent sur le segment de droite qui les relie sont dans le technology set. La généralisation a plusieurs points signifie que tous les points situé dans le polygone convexe formé par les DMU appartiennent au technology set. La frontière est donc composée d'une ligne brisée. La partie reliant les DMU entre elles provient de l'hypothèsen VRS, l'autre partie de la frontière vient de l'hypothèse de disponibilité libre (qui est toujours assumée). Les points qui se situent à la limite entre ces deux parties s'appellent « points d'ancrage »[5],[6]. Hypothèses de rendements d'échelle croissant et décroissantLes hypothèses des rendements d'échelle croissant et décroissant sont une particularisation de l'hypothèse de rendements d'échelle variables. L'hypothèse de rendements d'échelles croissants (en anglais, on l'appelle increasing return to scale - IRS ou bien non-decreasing return to scale - NDRS) suppose que pour tout couple input/output, il y a toujours moyen de produire plus d'output avec le même rapport input/output. Inversement, l'hypothèse de rendement d'échelle de décroissant (decraesing return to scale - DRS ou non-increasing return to scale) stipule qu'il y a toujours moyen de produire moins d'output avec le même rapport input/output. En termes mathématiques, l'hypothèse des rendements d'échelle croissant se traduit par le fait que pour tout couple input/output de l'ensemble des technologies, le couple est un point valide du technology set. De même, l'hypothèse des rendements d'échelle décroissant se traduit par le fait que pour tout couple input/output de l'ensemble des technologies, le couple est un point valide de l'ensemble des technologies. Ces deux hypothèses résultent en des technology set convexes.
Hypothèse de rendement d'échelle constantL'hypothèse de rendement d'échelle constant consiste à supposer que pour tout couple d'input output , n'importe quel multiple de ce cette production est réalisable . En termes mathématiques, pour tout couple input/output dans le technology set, tout multiple (avec ) est dans le technology set. Cette hypothèse est donc une généralisation des hypothèses de rendements d'échelle croissant et décroissants et crée donc un technology set convexe. Exemple comparatif des différentes hypothèsesSupposons que nous voulions comparer 5 entreprises qui produisent chacune un output en utilisant un input . Les couples d'inputs utilisés et output produits sont donnés par la table suivante
Selon les hypothèses que l'on choisit pour estimer le technology set, la frontière d'efficience va différer.
Si nous souhaitons analyse comparative orientée « input » (l'on souhaite donc regarder de combien les inputs peuvent être réduits afin d'être efficient), la DEA consiste juste à calculer le facteur par lequel l'input de chaque DMU doit être multiplié afin que la DMU se retrouve sur la frontière d'efficience. Par exemple, dans le cas FDH (qui signifie qu'on ne suppose que la libre disponibilité) ci-dessus, les DMU 1,2,3 et 5 sont déjà sur la frontière d'efficience. Leur efficience vaut 1. Quant à la DMU 4, son input doit être multiplié par afin que le point sois sur la frontière d'efficience (et, dans ce cas précis, superposé à la DMU 2). Dans le cas VRS (qui signifie qu'on suppose la libre disponibilité ainsi que la convexité), les DMU 1,3 et 5 se trouvent sur la frontière ; leur efficience vaut donc 1. La DMU doit avoir son input multiplié par afin d'être sur la frontière, au point . L'efficience de la DMU 2 est donc . Celle de la DMU 4 vaut . Les efficiences dépendent donc du modèle d'estimation du technology set et donc, de facto, de la façon dont est tracée la frontière. Le tableau ci-dessous donne les efficiences calculées pour les 5 DMU de l'exemple pour les différents modèles.
Domaines d'applicationLa méthode d'analyse de la DEA, consistant à calculer des efficiences relatives de manières non-paramétrique, a été appliqué dans de nombreux domaines, dans des études scientifiques[1]. En effet, un des avantages de la DEA est de pouvoir comparer des entités produisant des biens mais aussi des services (pour lesquels une évaluation purement monétaire de rendement est impossible). Ainsi, dans le domaine de l'éducation, la DEA a été utilisée pour comparer l’efficacité de l'éducation entre les pays nordiques et les autres pays de l'OCDE[7] ou encore mesurer les performances entre universités[8],[9] ou bien entre départements universitaires d'économie[10]. . Le secteur médical et hospitalier peut aussi être soumis a l'analyse DEA[11],[12],[13]. Dans le domaine des entreprises, la satisfaction dans le domaine bancaire[14] ou encore la gestion de la chaine logistique[15],[16] peuvent être analysée à l'aide de la DEA. Plus folklorique, les résultats olympiques ont été comparés grâce à la DEA[17]. Différences avec la régression linéaireÀ première vue, la régression linéaire et l'analyse par enveloppement des données semblent similaires. En effet, ces deux techniques sont des modèles permettant d'analyser des couples input-output et leur relation avec d'autres entreprises ou DMU. Cependant, les différences entre ces deux modèles sont nombreuses[1]. Le tableau suivant recense les principales divergences
Notes et références
|