Propagação de erros

Em estatística, propagação de incerteza ou propagação de erro (ambas diferem na forma de apresentar seus valores) é uma forma de verificar a confiabilidade dos dados de uma certa amostra ou medida, quando esta é submetida a diferentes operações matemáticas. Ela define como as incertezas ou erros das variáveis estão relacionadas e fornece a melhor estimativa para aquele conjunto de dados.

Incerteza é uma quantidade (dimensional ou adimensional) que expressa a confiabilidade de um conjunto de dados, dada a sua dispersão, independentemente do valor verdadeiro. A entidade máxima para os padrões de medidas de incerteza é o Escritório Internacional de Pesos e Medidas (BIPM).

Erro é a diferença entre o valor de uma certa medida e o seu valor verdadeiro.

Motivação

Na realização de um experimento científico, ou qualquer outro experimento que haja coleta de dados, é raro o caso em que a análise do resultado dependa somente dos dados brutos encontrados. Os dados normalmente são coletados a fim de comparar os resultados com outros experimentos, ou para testar uma teoria, ou mesmo obter informações mais aprofundadas sobre determinado fenômeno. Nessas análises os dados são usados para se comparar pelo menos duas grandezas (considerando casos em que se pretende estudar algo), mas nem sempre é possível medir essas grandezas diretamente, sendo necessária a medida de outras grandezas que definam as que se quer comparar, ou tirando uma amostra de um conjunto de dados. Um exemplo disso é a velocidade. Não há como medir a velocidade propriamente dita, mas podemos medir distâncias e tempos, obtendo assim a velocidade média.

Como qualquer medida experimental, essa contém erros, que vêm da exatidão ou precisão do instrumento, ou até mesmo da flutuação estatística dos dados (dada pelo desvio padrão) – esta última é o caso de um decaimento radiativo. Quando se faz medições a fim de chegar indiretamente a outras grandezas, essas incertezas precisam ser levadas em conta, e há uma forma de se calcular a incerteza final da grandeza encontrada indiretamente.

Fórmulas de propagação de incertezas

Uma função f de uma ou mais variáveis envolvidas, as quais possuem uma incerteza associada, e nesta função são submetidas a operações matemáticas, existem diferentes formas de se determinar a propagação de incerteza e estas irão depender do tipo da função f a qual estamos lidando e do quanto deseja aproximá-la em nossos modelos.

Combinações lineares

Neste caso, analisa-se um modelo geral para uma função linear a qual pode possuir variáveis com ou sem correlação. Neste modelo, não são aplicadas aproximações. Vamos supor ser um grupo de m funções as quais são combinações lineares de variáveis com a combinação de coeficientes dada por . Então:

ou

e seja a matriz de variância-covariância em x denotada por : .

Assim, a variância-covariância da matriz de f é dada por

.
.

Esta é a expressão mais geral para a propagação de incerteza. Quando as incertezas entre as variáveis não são correlacionadas então a expressão se reduz à

Em geral a expressão para uma simples função,f, são simplificadas para:

Cada termo , pode ser expresso pela correlação dos coeficientes(Coeficiente de correlação de Pearson) por, assim a expressão alternativa para a variância de f é:

No caso em que as variáveis x não são correlacionadas:

Combinações Não-Lineares

Aqui, os modelos descritos implicam em aproximações para gerar uma forma mais simplificada, sendo estas com uma precisão que vai depender de tais aproximações. Quando f é um grupo de combinações não-lineares da variável x, por exemplo quando f(a,b) = ab ,ela pode ser linearizada por uma aproximação de primeira ordem pela expansão da Série de Taylor .[1] Assim a expansão para uma função qualquer:


em que denota a derivada parcial de fk com respeito a i-n variável. Ou na notação matricial

no qual J é a matriz jacobiana. Desde que f0k seja uma constante, isso não contribuirá para o erro em f. Então, a propagação de incertezas segue o caso linear acima, mas substituindo os coeficientes lineares Aik e Ajk pelas derivadas parciais, e . Na notação matricial: [2]

.

Este é o Jacobiano da função e é usada para transformar linhas e colunas da covariância dos argumentos.

No entanto, a formula mais comum entre os engenheiros e cientistas experimentais, que calculam a propagação de incertezas para variáveis independentes. Segundo um padrão estipulado pelo Escritório Internacional de Pesos e Medidas (BIPM)

em que representa o desvio padrão da função , representa o desvio padrão de , representa o desvio padrão de , e assim por diante.

É importante notar que esta formula é baseada nas características lineares dos gradientes de e então esta é uma boa estimativa para o desvio padrão de ao longo de são pequenos comparados com as derivadas parciais.[3]

Exemplo

Qualquer função não linear, f(a,b), de duas variáveis, a and b, podem ser expandidas como

Então:

Para o particular caso que , , . Então

ou

Avisos e Ressalvas

Estimativas de erro para funções não-lineares são baseadas em uma aproximação que depende do truncamento
da série de Taylor, a extensão desta depende da natureza da função. Por exemplo, a propensão do erro calculado
para log x aumenta enquanto x aumenta, e esta é uma boa aproximação para 1+x desde que  x seja pequeno.

No caso especial do inverso de sendo que , a distribuição é uma distribuição de Cauchy e não há uma variância definida. Para tanto a taxa de distribuição, pode ser definida pelas probabilidades dos intervalos os quais são definidos pela simulação de Monte Carlo, ou, em alguns casos, usando a transformação de Geary-Hinkley .[4]

Para funções “muito não-lineares’’, existem cinco categorias de aproximações probabilísticas as quais se aplica a propagação de incertezas .[5]

Exemplo de fórmulas

Esta tabela mostra as variâncias de funções simples para variáveis reais , com seus desvios padrões , coeficiente de correlação e constantes reais .

Função Variância
[6]
[7]
[8]
[8]
[9]

Para variáveis não correlacionadas a covariância dos termos é zero. Expressões mais complicadas podem ser obtidas a parir de tais simples funções. Por exemplo, repetindo a multiplicação e assumindo que não há correlação entre os dados

Para o caso obtemos a expressão de Goodman para calcular sua exata variância a calculate E então nós teríamos

Derivadas parciais

Dado

Erro Absoluto Variância
[10]

Inverso da função tangente

Nós podemos calcular a propagação de incertezas para o inverso da função tangente como um exemplo do uso das derivadas parcias para propagar a incerteza. Definindo

onde é a incerteza absoluta nas nossas medidas de x. Assim, a derivada parcial de com respeito a é

Então, nossa propagação de incertezas fica

no qual é incerteza absoluta propagada.

Valor médio de múltiplos e independentes dados

Suponhamos que gravamos diferentes dados, onde cada um deles é representado por , onde a soma dos dados é dado por

E a média destes dados é dada por

Neste caso, como se trata de um conjunto de dados independentes, aplicando a fórmula de propagação de incertezas


Combinação de medidas independentes com valores de incertezas diferentes

Neste caso, queremos relacionar como diferentes incertezas de uma mesma quantidade se relacionam. Para isso é atribuído um fator de peso para cada incerteza onde a função resultante é minimizada. Busca-se o "melhor valor". Por fim, temos:

Exemplos com Aplicações

Combinação linear - Soma de contagens em medidas de fontes radiativas

Para uma fonte radiativa o número de contagens da mesma foi 1071 enquanto que foi medido um fundo de 521, qual é o número de contagens pertencente apenas a fonte? Este é um exemplo de combinação linear. Para uma fonte radiativa, sabe-se que seu desvio padrão é .

Como

é o número de contagens da fonte
é o número total de contagens
é o numero de contagens do fundo

Então:

Logo, o numero de contagens que pertence apenas a fonte é

Combinações Não-Lineares - Trigonometria

A área de um triângulo é igual a metade do produto da base vezes a altura

Se a base e a altura tem valores de e , e a incerteza dada por e , a área é e a incerteza da área é dada por:

Combinação de medidas independentes com valores de incerteza diferentes - Medida com diferentes equipamentos

Foi medido o comprimento de uma mesa utilizando dois equipamentos de medidas diferentes, onde para um a medida da mesa foi de enquanto que para o outro a medida foi . Qual é incerteza da melhor estimativa para o valor do comprimento da régua?

Com relação ao desvio

Logo a incerteza do melhor valor para o comprimento da régua estimado pelos 2 equipamentos é

Medidas da resistência

Uma aplicação experimental é o caso no qual medidas da corrente elétrica ,I, e tensão elétrica V, em um resistor com objetivo de determinar a resistência R, usando a lei de Ohm,

Dada a medida das variáveis com incerteza I±σI e V±σV, a incerteza associada a medida da resistência, σR é

Notas

  1. Goodman, Leo (1960). «On the Exact Variance of Products». Journal of the American Statistical Association. 55 (292): 708–713. JSTOR 2281592. doi:10.2307/2281592 
  2. Ochoa1,Benjamin; Belongie, Serge "Covariance Propagation for Guided Matching"
  3. Clifford, A. A. (1973). Multivariate error analysis: a handbook of error propagation and calculation in many-parameter systems. [S.l.]: John Wiley & Sons. ISBN 0470160551 [falta página]
  4. Hayya, Jack; Armstrong, Donald; Gressis, Nicolas (1975). «A Note on the Ratio of Two Normally Distributed Variables». Management Science. 21 (11): 1338–1341. JSTOR 2629897. doi:10.1287/mnsc.21.11.1338 
  5. S. H. Lee and W. Chen, A comparative study of uncertainty propagation methods for black-box-type problems, Structural and Multidisciplinary Optimization Volume 37, Number 3 (2009), 239-253, DOI: 10.1007/s00158-008-0234-7
  6. «Strategies for Variance Estimation» (PDF). p. 37. Consultado em 18 de janeiro de 2013 
  7. Fornasini, Paolo (2008), The uncertainty in physical measurements: an introduction to data analysis in the physics laboratory, ISBN 0-387-78649-X, Springer, p. 161 
  8. a b Harris, Daniel C. (2003), Quantitative chemical analysis, ISBN 0-7167-4464-3 6th ed. , Macmillan, p. 56 
  9. «Error Propagation tutorial» (PDF). Foothill College. 9 de outubro de 2009. Consultado em 1 de março de 2012 
  10. Lindberg, Vern (5 de outubro de 2009). «Uncertainties and Error Propagation». Uncertainties, Graphing, and the Vernier Caliper (em inglês). Rochester Institute of Technology. 1 páginas. Consultado em 20 de abril de 2007. Arquivado do original em 12 de maio de 2008. The guiding principle in all cases is to consider the most pessimistic situation. 

Bibliografia

  • Bevington, Philip R.; Robinson, D. Keith (2002), Data Reduction and Error Analysis for the Physical Sciences, ISBN 0-07-119926-8 3rd ed. , McGraw-Hill 
  • Meyer, Stuart L. (1975), Data Analysis for Scientists and Engineers, ISBN 0-471-59995-6, Wiley 
  • W. Feller, An Introduction to probability Theory an its Aplications, 2nd ed.,Eiley,New York,1957.
  • Knoll,Glenn F., Radiation Detection and Measurement,3nd
  • Wallace, M.J,Experimental Measurements:Precision,Error and Truth,1nd,wesley,London,1967
  • (en) (fr) M. Rouaud, Probability, Statistics and Estimation Propagation of Uncertainties in Experimental Measurement, 252p, 2013.

Ligações externas