Quantil
Quantis são pontos estabelecidos em intervalos regulares a partir da função distribuição acumulada (FDA), de uma variável aleatória. Os quantis dividem os dados ordenados em q subconjuntos de dados de dimensão essencialmente igual. Dessa forma dão origem a q-Quantis; os quantis são estabelecidos a partir de pontos de corte que determinam as fronteiras entre os subconjuntos consecutivos. Visto de outra forma, o k-ésimo q-quantil é o valor x tal que a probabilidade de um evento da variável aleatória ser inferior a x é no máximo k/q e a probabilidade de a variável aleatória ser superior ou igual a x é pelo menos (q-k)/q. Há q - 1 quantis, sendo k um inteiro satisfazendo 0<k<q. Quantis específicosAlguns quantis têm nomes especiais:
De um modo mais geral, pode-se considerar a função quantil para qualquer distribuição. Esta é definida por variáveis reais, entre zero e um, e, matematicamente, é a inversa da função distribuição acumulada. Quantis de uma populaçãoPara uma população de valores discretos ou para uma densidade populacional contínua o k-ésimo q-quantil é o valor onde a função distribuição acumulada cruza k/q. Isto é, x é o k-ésimo q-quantil de uma variável X se
e
Para uma população finita de N valores indexados de 1 ,..., a N de menor para maior, o k-ésimo q-quantil desta população pode ser computado através do valor de . Se não for um inteiro, em seguida, arredonda-se para o próximo inteiro para obter o índice apropriado; o valor correspondente é o k-ésimo q-quantil. Por outro lado, se é um número inteiro, então qualquer valor correspondente a esse índice até o valor correspondente ao próximo pode ser tomado como o quantil, de maneira convencional (embora arbitrária) se considera a média dos dois valores (ver #estimativa dos Quantis). Se, em vez de usar inteiros k e q, o "p-quantil" é baseado em um número real p com 0 <p<1, então, p substitui k/q nas fórmulas acima. Alguns programas como algumas folhas de cálculo consideram o mínimo e o máximo como o 0º e 100º percentil, respectivamente; no entanto, essa terminologia é uma extensão além das tradicionais definições estatísticas . Quantis de uma amostraA abordagem é diferente para uma amostra finita selecionada aleatoriamente a partir da população. o k-ésimo q-quantil de uma amostra pode ser estimado através do valor de . Se for um inteiro, então é o índice do valor a ser considrado o k-ésimo q-quantil da amostra. Por outro lado, se não é um inteiro, mas está entre 1 e N, então, normalmente é usada uma média (ponderada) dos valores observados para os índices inteiros adjacentes. Quando é menor que 1 ou maior que N o k-ésimo q-quantil da amostra não é normalmente definido. Se, em vez de usar inteiros k e q, o "p-quantil" é baseado em um número real p com 0 <p<1 e, então, p substitui k/q nas fórmulas acima. Esta abordagem de estimativa está intimamente relacionado com o resultado de estatísticas de ordem. Especificamente, o -ésimo menor de N valores escolhidos independentemente da distribuição uniforme entre [0,1] é uma variável aleatória com média . ExemplosConsidere uma população de 10 dados {3, 6, 7, 8, 8, 10, 13, 15, 16, 20}.
A motivação para este método é que o primeiro quartil deve dividir os dados entre o quarto inferior e os tres quartos superiores. Idealmente, isso significaria 2.5 da amostra estão abaixo do primeiro quartil e 7.5 são superiores, neste caso significa que um terço da amostra de dados está "dividida em duas", tornando a terceira parte da amostra com o primeiro e segundo quartos. Agora considere uma amostra dos mesmos 10 valores {3, 6, 7, 8, 8, 10, 13, 15, 16, 20}, que são retirados aleatoriamente de alguma população desconhecida.
Se tivesse tido também um valor 9 entre os valores 8 e 10, fazendo um total de 11 valores, os quartis teriam indices de ou 3, 6 e 9, respectivamente. Assim, as estimativas quartis seriam os valores 7, 9 e 15, respectivamente. Note-se que estes valores particionam os restantes oito valores ordenados em quatro grupos de igual tamanho {3,6}, {8,8}, {10,13} e {16,20}. Ver tambémReferências
|