Valore pIn statistica inferenziale, in particolare nei test di verifica d'ipotesi, il valore p, o p-dei-dati[1] (dall'inglese p-value),[2] o anche livello di significatività osservato,[3] è la probabilità, per una ipotesi supposta vera (detta ipotesi nulla), di ottenere risultati ugualmente o meno compatibili di quelli osservati durante il test, con la suddetta ipotesi.[4][5] In altri termini, il valore p aiuta a capire se la differenza tra il risultato osservato e quello ipotizzato è dovuta alla casualità introdotta dal campionamento, oppure se tale differenza è statisticamente significativa, cioè difficilmente spiegabile mediante la casualità dovuta al campionamento. L'utilizzo del valore p nei test di ipotesi è comune in molti campi di ricerca[6] come fisica, economia, finanza, scienze politiche, medicina, psicologia,[7] biologia, criminologia e sociologia.[8] Livello di significativitàQuando si effettua un test d'ipotesi si fissa un'ipotesi nulla e un valore soglia α (per convenzione di solito 0,05) che indica il livello di significatività del test. Calcolato il p-value relativo ai dati osservati è possibile comportarsi come segue:
Tuttavia se valore p ≈ α, cioè è vicino al valore soglia, è necessaria attenzione. Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività. Per questo le analisi statistiche devono sempre riportare il valore del p-value osservato permettendo ai lettori di trarre le proprie conclusioni. Per condurre un test statistico è importante fissare il livello di significatività (indicato di solito con la lettera greca α, alfa) prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per quel livello di significatività conducono ad accettare o rigettare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato. DefinizioneSia l'ipotesi che il valore dei dati osservati sia estratto da una certa variabile aleatoria nota. Il p-value è definito come la probabilità, supposta l'ipotesi , di ottenere un risultato (dai dati osservati) uguale o "più estremo" di quello effettivamente osservato. Cosa si intende con "più estremo" precisamente, dipende dal tipo di test che si intende effettuare. Se il test è bilaterale allora i risultati più estremi sono i valori di per cui oppure . Se il test è unilaterale destro allora i risultati più estremi sono i valori di per cui . Se il test è unilaterale sinistro allora i risultati più estremi sono i valori di per cui . Quindi il p-value è dato da:
Più il valore del p-value è piccolo, più è grande la significatività poiché il risultato ci dice che l'ipotesi considerata non spiega adeguatamente i dati osservati, cioè è poco credibile che il valore osservato sia stato effettivamente estratto dalla variabile aleatoria . EsempioSia, ad esempio, 0,03 il valore p di un test. Il test condotto con un livello di significatività di 0,05 induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore di 0,02 induce a non rifiutare l'ipotesi nulla. La conclusione "il valore p è 0,03" contiene più informazioni delle sole "ipotesi rifiutata con significatività 0,05" o "non rifiutata con significatività 0,02". Errori comuniCi sono diversi errori comuni riguardanti l'uso del p-value.
Note
Bibliografia
Voci correlateAltri progetti
Collegamenti esterni
|
Portal di Ensiklopedia Dunia