La linea verde identifica la funzione di ripartizione di una variabile casuale normale . La linea blu è la funzione di ripartizione empirica calcolata a partire dal campione normale indicato in grigio sull'asse X
In statistica e teoria della probabilità , la funzione di ripartizione empirica (o funzione cumulativa empirica o ECDF ) è una funzione di variabile reale che rappresenta la funzione di ripartizione della misura empirica di un campione .
La funzione di ripartizione empirica è una stima della vera funzione di ripartizione che ha generato il campione e grazie al teorema di Glivenko-Cantelli è possibile affermare che essa converge per
n
→
∞
{\displaystyle n\to \infty }
con probabilità 1 alla distribuzione del campione[ 1] .
Definizione
Siano
X
1
,
X
2
,
.
.
.
,
X
n
{\displaystyle X_{1},X_{2},...,X_{n}}
n
{\displaystyle n}
variabili indipendenti e identicamente distribuite con la stessa funzione di ripartizione
F
(
x
)
{\displaystyle F(x)}
. Allora, la funzione di ripartizione empirica può essere scritta come[ 2] [ 3] :
F
n
(
x
)
=
1
n
∑
i
=
1
n
I
[
−
∞
,
x
]
(
X
i
)
{\displaystyle F_{n}(x)={1 \over n}\sum _{i=1}^{n}I_{[-\infty ,x]}(X_{i})}
dove
I
[
−
∞
,
x
]
(
X
i
)
{\displaystyle I_{[-\infty ,x]}(X_{i})}
è la funzione indicatrice , uguale a 1 se
X
i
≤
x
{\displaystyle X_{i}\leq x}
e uguale a 0 altrimenti. È possibile equivalentemente scriverla nella sua forma estesa come[ 4] :
F
n
(
x
)
=
{
0
x
<
X
(
1
)
k
n
X
(
k
)
<
x
<
X
(
k
+
1
)
∀
k
=
1
,
2
,
.
.
.
,
n
−
1
1
x
>
X
(
n
)
{\displaystyle F_{n}(x)={\begin{cases}0&x<X_{(1)}\\{\frac {k}{n}}&X_{(k)}<x<X_{(k+1)}\quad \forall k=1,2,...,n-1\\1&x>X_{(n)}\end{cases}}}
Da cui segue che
n
F
n
(
x
)
∼
Bin
(
n
,
F
(
x
)
)
.
{\displaystyle nF_{n}(x)\sim {\text{Bin}}(n,F(x)).}
Proprietà
La funzione di ripartizione empirica è uno stimatore corretto e consistente della funzione di ripartizione.
Note
^ (EN ) Azeem M. Shaikh, The Glivenko-Cantelli Theorem (PDF ), su home.uchicago.edu , Università di Chicago.
^ Federico M. Stefanini, Frequenze relative e distribuzioni empiriche , su local.disia.unifi.it , Università di Firenze. URL consultato il 19 febbraio 2018 (archiviato dall'url originale il 18 marzo 2018) .
^ (EN ) van der Vaart, Asymptotic statistics , Cambridge University Press, 1998, p. 265 , ISBN 0-521-78450-6 .
^ Diego Zappa e Silvia Facchinetti, Appunti di statistica , 2013, p. 176, ISBN 9788867800506 .
Altri progetti