Distribuição de Weibull
Em probabilidade e estatística a distribuição de Weibull é uma distribuição de probabilidade contínua. É nomeada devido a Waloddi Weibull que em 1951 lançou um artigo descrevendo a distribuição em detalhes e propondo diversas aplicações[1]. O campo de aplicações da distribuição de Weibull é vasto e abrange praticamente todas as áreas da ciência. Usando essa distribuição, realizou-se a modelagem bem sucedida de dados provenientes de grandes áreas de ciências física, biológica, social, saúde, ambiental e métodos baseados nesta distribuição são ferramentas indispensáveis para profissionais da engenharia de confiabilidade. Em geral, suas aplicações visam a determinação do tempo de vida médio e da taxa de falhas em função do tempo da população analisada. É também de grande interesse para estatísticos devido a suas diversas características específicas. O sucesso da distribuição se justifica não só pela sua eficácia, mas também ao fato de existirem recursos gráficos que facilitam sua interpretação e por ser capaz de fazer previsões de acurácia razoável mesmo quando a quantidade de dados disponível é baixa. DefiniçãoUma variável aleatória x segue a distribuição de Weibull se sua função densidade de probabilidade é dada por[2] O parâmetro λ está definido de 0 a + e é medido na mesma unidade que x. Se x tem unidade de tempo λ é denominado tempo característico pois a função de distribuição acumulada de qualquer distribuição de Weibull com parâmetros λ idênticos e k livre terá o valor de 0.6321 no ponto x=λ. Isso significa que a chance de sobrevivência de x por λ unidades de tempo é aproximadamente 63.21% independentemente do valor de k. Do ponto de vista estatístico λ é determinado parâmetro de escala pois variações no seu valor enquanto k é mantido constante causam a compressão ou expansão do gráfico. O parâmetro k está definido de 0 a + e é adimensional. É chamado de declividade de Weibull pois determina a declividade da função de distribuição acumulada plotada em um papel de probabilidade Weibull. Do ponto de vista estatístico k é o parâmetro de forma. Variações no valor de k alteram drasticamente o comportamento da distribuição. Para k<1, o fator exponencial da distribuição é predominante e a curva fica em um formato de J e para k=1 a distribuição se reduz a uma distribuição exponencial. Para k>1 o fator polinomial da distribuição é predominante. Essa é distribuição de Weibull com 2 parâmetros. Existem outras definições com mais ou menos parâmetros dependendo da finalidade, veja relação com outras distribuições para outras formas. PropriedadesFunção densidadeA forma da função densidade da distribuição de Weibull muda drasticamente com o valor de k. Para 0 < k < 1, a função densidade tende a quando x se aproxima de zero por cima e é estritamente decrescente. Para k = 1, a função densidade tende a 1/λ quando x se aproxima de zero por cima, aumenta até seu modo e diminui depois disso. É interessante notar que a função densidade tem uma declividade infinitamente negativa em x = 0 se 0 < k < 1, declividade infinitamente positiva em x = 0 se 1 < k < 2 e declividade nula em x = 0 se k > 2. Para k = 2 a função densidade tem uma declividade finita e positiva em x = 0. Quando k tende ao infinito, a distribuição de Weibull converge para uma distribuição delta de Dirac centrada em x = λ. Além disso, a obliquidade e o coeficiente de variação dependem apenas do parâmetro de forma. Função de distribuiçãoA função distribuição acumulada da distribuição de Weibull é para x ≥ 0, e F(x; k; λ) = 0 para x < 0. O quantil da distribuição de Weibull é para 0 ≤ p < 1. A função hazard h (taxa de falhas) é dada por No contexto em que x é interpretado como o "tempo transcorrido até falha" a distribuição de Weibull fornece a distribuição de probabilidades de um dispositivo ou material falhar em um dado intervalo de tempo. Como pode ser visto na definição da função hazard h, existe uma dependência exponencial com o parâmetro k o que determina 3 comportamentos bem diferentes para:
MomentosA função geradora de momentos do logaritmo de uma variável aleatória que se distribui conforme uma distribuição de Weibull é dada por[3] onde Γ é a função gama. Similarmente, a função característica[desambiguação necessária] de log X é dada por Em particular, o enésimo momento de X é dado por A média e a variância de uma variável aleatória seguindo a distribuição de Weibull podem ser expressas como e A obliquidade é dada por onde a média é denotada por μ e o desvio padrão por σ. A curtose em excesso é dada por onde . O excesso de curtose pode ser expresso por: Função geradora de momentosUma variedade de expressões estão disponíveis para a função geradora de momentos de X. Como uma série de potências, dado que os momentos já são conhecidos, se tem Alternativamente, pode-se tentar resolver diretamente a integral Para um parâmetro k pertencente aos números racionais, expresso como k = p/q onde p e q são inteiros, então essa integral pode ser resolvida analiticamente. Veja[4] para caso em que k é um inteiro, e [5] para o caso racional. Substituindo t por -t, se tem onde G é a função Meijer G. A função característica também pode ser obtida por [6]. Entropia de informaçãoA entropia da informação é dada por onde é a constante de Euler-Mascheroni. Estimação de parâmetrosMétodos gráficosMétodos gráficos comumente aplicados apara o julgamento de qualidade de ajuste de dados a distribuição de Weibull são: papel de probabilidade de Weibull (descrito em detalhes na sessão abaixo), plots do tipo percentil-percentil e quantil-quantil. Métodos gráficos servem 2 propósitos:
Papel de probabilidade WeibullO papel de probabilidade é uma técnica gráfica utilizada para verificar a adequação de um determinado modelo estatístico aos dados. Se uma amostragem segue a distribuição de Weibull, seu papel de probabilidade Weibull se distribuirá conforme uma reta numa espécie de gráfico quantil-quantil. O papel de probabilidade Weibull utiliza a função distribuição acumulada dos dados pois ela pode ser linearizada. Os eixos do papel de probabilidade Weibull são e . Um procedimento de regressão então é utilizado para a determinação dos parâmetros da reta m e c da reta y=mx+c a partir dos quais se determina os valores para o parâmetro de forma 'k' e de escala 'lambda' da distribuição ajustada. Existem diversas técnicas diferentes para a determinação e ordenação dos dados da função de distribuição acumulada e softwares de estatística oferecem algoritmos que facilitam o procedimento. Métodos numéricosUma grande variedade de métodos numéricos são aplicados para análise de distribuição Weibull:
SoftwareAlém de softwares de uso comum para fins estatísticos como Minitab, SPSS, SAS, MATLAB, Excel, etc possuírem funções para análise de Weibull, existem diversos softwares especializados em análise de Weibull. Segue abaixo uma lista de softwares dedicados:
AplicaçõesO campo de aplicações da distribuição de Weibull é vasto e abrange praticamente todas as áreas da ciência. Usando essa distribuição, realizou-se a modelagem bem sucedida de dados provenientes de grandes áreas de ciências física, biológica, social, saúde e ambiental. Engenharia de confiabilidadeDevido a necessidade de empresas da área de engenharia e tecnologia de assegurarem a confiabilidade e caracterizarem a vida útil de seus produtos originou-se o mercado da engenharia de confiabilidade no qual a análise de Weibull aparece como uma importante e poderosa ferramenta. Segue abaixo uma compilação de artigos com aplicações da distribuição de Weibull na área de confiabilidade de materiais e produtos:
Outras áreasCompilação de artigos com aplicações da distribuição de Weibull em diversas áreas:
Relação com outras distribuições
para e f(x; k, λ, θ) = 0 parax < θ, onde é o parâmetro de forma, é o parâmetro de escala e o parâmetro de localidade da distribuição. Quando θ=0, temos o caso da distribuição de Weibull com apenas 2 parâmetros apresentado na definição. O parâmetro pertence aos reais e está definido de a e tem a mesma unidade que a variável x. Quando x tem unidade de tempo é denominado vida mínima. Em um contexto geral, é a origem da distribuição pois x está definido apenas para x> (a equação atinge valores negativos se x< saindo do escopo de definição de uma função densidade de probabilidade). Sendo assim, alterações no valor de resultam em uma translação da origem do gráfico da distribuição, no jargão estatístico é chamado de parâmetro de localidade. Em diversos contextos o tempo de origem não tem significado algum a não ser indicar o início do gráfico e por isso é igualado a 0 por conveniência e omitido, deixando a distribuição com apenas 2 parâmetros, k e .
é a distribuição exponencial padrão com intensidade 1.[3] Referências
Ligações externas |
Portal di Ensiklopedia Dunia