Il bootstrap è una tecnica statistica di ricampionamento con reimmissione per approssimare la distribuzione campionaria di una statistica. Permette di approssimare media e varianza di uno stimatore, costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.
Nel caso di campionamento casuale semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità
, diciamo
. Da
si ricampionano
altri campioni di numerosità costante
, diciamo
. Se
è la funzione di ripartizione del fenomeno aleatorio dal quale è stato campionato
, allora la funzione di ripartizione empirica
è un'approssimazione di
; per cui un ricampionamento da essa approssima un ricampionamento dal modello originale. Per costruzione
è la funzione di ripartizione di una variabile aleatoria uniforme su
, dunque di fatto ogni ricampionamento
, con
, è ottenuto scegliendo in modo uniforme con ripetizione
valori da
.
Sia
lo stimatore di
che ci interessa studiare, diciamo
. Si calcola tale quantità per ogni campione bootstrap,
. In questo modo si hanno a disposizione
stime di
, dalle quali è possibile calcolare la media bootstrap, la varianza bootstrap, i percentili bootstrap, ecc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di
.
Algoritmo bootstrap (per campione semplice)
Dato il campione
:
- Si simulano
campioni
, di numerosità
da
.
- Si calcolano le
replicazioni corrispondenti ai campioni simulati:
, dove 
- Si stima la varianza campionaria come:

- Si stima la distorsione come:

Partendo quindi da queste quantità stimate è possibile, anche lavorando in ambito non parametrico, calcolare intervalli di confidenza, saggiare ipotesi, ecc.
Bibliografia
Voci correlate
Collegamenti esterni