ESTATÍSTICA Aplicada à METROLOGIAdf.ffclrp.usp.br/cidra/wp-content/uploads/2016/07/Slides... ·...
Transcript of ESTATÍSTICA Aplicada à METROLOGIAdf.ffclrp.usp.br/cidra/wp-content/uploads/2016/07/Slides... ·...
ESTATÍSTICA Aplicada à METROLOGIA
José Carlos BORGES
Supervisor de Radioproteção da Fundação Hemocentro de Ribeirão Preto - FUNDHERP
Diretor de P&D do Centro de Ensaios e Pesquisa em Metrologia - METROBRAS
Professor aposentado do Depto. de Engenharia Nuclear da COPPE - UFRJ
Áreas de atuação : Radioproteção - Metrologia das Radiações
Estatística
• A necessidade de se estudar estatística decorre da
natureza ALEATÓRIA do FENÔMENO e da MEDIÇÃO .
Isto requer que os dados obtidos sejam objeto de :
• Análise dos dados ,
• interpretação do resultado da medição
que darão respaldo à :
• tomada de decisão.
Quando medimos algum
mensurando ( PROPRIEDADE de um fenômeno ),
temos em mente realizar alguma coisa com o resultado da
medida, ainda que seja tão somente comunicar o resultado.
Ocorre que os resultados da medição ( CONJUNTO de medidas )
estão quase sempre afetados por erros , que podemos chamar
de equívoco, distração ou fraude mas, também,
erros intrínsecos, que não podem ser eliminados,
por mais que nos esforcemos, mas que podem ser reduzidos .
Para tanto , precisam ser : estudados e compreendidos.
EXEMPLO
Medir a espessura de placas de aço ( controlar sua qualidade durante a fabricação ) parece, a priori, uma
operação que, se feita com cuidado e com um bom instrumento, levará a um resultado que
não poderá ser posto em dúvida.
Entretanto , como é impossível determinarmos o valor real da espessura da placa , o melhor que podemos
fazer é medirmos a espessura com uma qualidadeexcelente , tão grande que qualquer esforço para melhora-la seja desnecessário ou inadequado ,
tendo em vista o que se pretende fazer coma placa.
Como não podemos evitar completamente os erros de medição , devemos aprender a conviver com eles.
Por que sempre haverá erros ?
Entre outras razões , porque
a espessura pode depender de :
Temperatura - pressão - umidade do ambiente ;
local medido na placa ( espessura não uniforme ) ;
características limitadoras do instrumento utilizado
( estabilidade , resolução , etc. )
Outro problema é a disponibilidade dos objetos medidos.
Nem sempre temos acesso a todos os elementos que compõem
o que chamamos de população - objeto de estudo.
GERALMENTE , PODEMOS / TEMOS QUE
estudar - medir apenas uma porção da população ,
chamada amostra
Exemplo : pesquisa eleitoral para prefeito
População : todos os eleitores da cidade ( 50.000 )
Amostra : 2.000 eleitores da cidade
RAZÕES - NECESSIDADES para se realizar medições :
→ controlar a qualidade de um produto ,
→ planejar atividades,
→ determinar causas e efeitos,
→ aprimorar processos, para conhecer o comportamento de sistemas.
Para que os resultados da medição sejam corretos / adequados
permitindo que tomemos decisões acertadas / otimizadas,
necessitamos de ferramentas estatísticas padronizadas
que transformem dados qualitativos ou quantitativos em
resultados válidos suficientemente exatos e com incertezas aceitáveis .
ESTATÍSTICA
Conjunto de ferramentas ( instruções) padronizadas para
Escolher amostras - Planejar medidas
Processar e apresentar dados na forma de
tabelas, gráficos, etc. ( estatística descritiva )
Cujos resultados nos forneçam as características da amostra,
que nos permitam deduzir
as propriedade da população ( inferência estatística )
TIPOS DE DADOS ESTATÍSTICOS
As ferramentas estatísticas aplicam-se não somente a dados
quantitativos ( valores numéricos ), mas também a :
dados qualitativos
dados semi-quantitativos
Exemplo :
verificar a natureza dos dados ( variáveis ),
estabelecer uma classificação para cada tipo e
nomear suas características.
Um laboratório de calibração de dectetores tem alguns
equipamentos na prateleira, prontos para serem retirados por
seus usuários.
05 detetores tipo Geiger,
04 câmaras de ionização,
06 contadores proporcionais e
03 detectores de cintilação de estado sólido.
Alguns desses aparelhos já passaram por calibração anteriormente :
03 estão sendo calibrados pela primeira vez,
09 já foram calibrados 1 vez antes e
07 já foram calibrados 3 vezes.
Os equipamentos estão em sete faixas de preço:
02 na categoria A , 06 na B , 01 na C , 03 na categoria D , 03 na E , 03 na F e 01 na categoria G
sendo A os mais baratos e G os mais caros.
Na forma de tabela, esses dados ficam mais fáceis de serem analisados :
Tabela 1 - Tipo de aparelho Tabela 2 - No. De calibrações
Tabela 3 - Faixa de preço
Tipo de aparelhoNo. de detect.
No. de calibrações
No. de aparelhos
Faixa de preço
No. de aparelhos
Detector geiger 5 1 3 A 2
Câmara ionização 4 2 9 B 6
Contadorproporcional
7 3 7 C 1
Detector cintilação 3 D 3
E 3
F 3
G 1
Que tipos de dados estatísticos ( variáveis estatísticas )
estão sendo apresentados nessas tabelas ?
Vamos começar com a 2a tabela
Os números da segunda coluna são as
frequências de cada categoria da 1a coluna:
Dados da tabela 2
Variável: número de calibrações
Valores da variável : 1 , 2 e 3
Freqüências de cada valor : 3 , 9 e 7.
Na 1ª tabela, o dado estatístico é ‘tipo de detector’
na 2ª é ‘ número de calibrações ’ e
na 3ª é ‘ faixa de preço ’.
Os números que aparecem na frente
de cada tipo de detector da tabela 1
são as freqüências de cada tipo.
Examinando a 1a tabela.
Dados da tabela 1 :
Variável : tipo de detector.
Valores da variável : detector Geiger ,
câmara de ionização , contador proporcional ,
cintilador.
Frequências de cada valor : 5 , 4 , 7 e 3 .
No caso da tabela 2 , os valores da variável são números.
No caso da tabela 1 , os valores são palavras.
Isso faz diferença? Sim !
Os dados qualitativos da tabela 1 são chamados
‘ dados nominais ’
e os dados quantitativos da tabela 2 são chamados
‘ dados intervalares ’
e o tratamento que se pode/deve dar a cada tipo é diferente.
Dados da tabela 3
Variável : faixa de preço.
Valores da variável : A, B, C, D, E, F e G
Freqüências de cada valor: 2, 6, 1, 3, 3, 3 e 1
Examinando a Tabela 3
Neste caso, as variáveis são letras
MAS a ordem dos valores é pré-definida.
Cada letra corresponde a uma faixa de preço
maior que a da letra precedente.
A esse tipo de variáveis damos o nome de
“ dados ordinais “
0
1
2
3
4
5
6
7
8
1 2 3 4
Histograma de Frequência : Tipo de Detector
1. Geiger Muller 2 Câmara de Ionização 3 Contador Proporcional 4 . Detector de Cintilação
Exemplos de tipos de dados estatísticos
Tipo de dados Exemplos de variáveis Valores possíveis
Dados nominais sexo feminino; masculino; Indefinido
estado civil solteiro; casado; divorciado
tipo sanguíneo A ; B ; AB ; O
tipo de emissão radioativa Alfa, gama, raio X, nêutron, pósitron
Dados ordinais classe social A; B; C; D; E etc.
escolaridade 1o; 2o; 3o
classe de radiotoxicidadeda Tabela V (3.01)
I; II; III; IV; V
Dados intervalares peso 1,5 ; 7,38 ; 40 ; 50 ; 250 ( qualquer número )
altura 1,57 ; 1,75 ; 7,2 ; 8500 ( qualquer número )
energia da radiação 5,7 ; 370 ; 660 ; 1,17 ( qualquer número )
tensão de operação 600 ; 800 ; 400 ; 550 ( qualquer número )
Exemplo
Resultado de um ensaio de espectrometria gama:
O número de fótons de cada energia ( eixo x ) que é contado pelo detector ( eixo y ).
VARIÁVEL
FREQÜÊNCIA
Figura 1 – Espectro gama do Cobalto-57.
DETERMINAÇÃO DE ERROS EXPERIMENTAIS
Quando um cientista/analista/operador faz uma medição, em geral,
assume que exista um ‘valor verdadeiro’ daquilo que está medindo.
Quando relata o resultado, em geral, o que faz é especificar uma
faixa de valores
dentro da qual espera que o valor verdadeiro esteja.
A forma usual de especificar esta faixa de valores é:
Valor Medido = melhor estimativa do valor ± incerteza
Avaliar esta incerteza é o objetivo da determinação de erros experimentais.
Devemos ter conhecimento das fontes de erros na medição
e de quanto eles afetam o resultado. Isto implica:
Identificar as fontes de erro
Eliminar os erros que puderem ser evitados
Quantificar os erros inevitáveis
Padronizar os efeitos desses erros por meio do
registro da incerteza nos resultados da medição
Os erros que podem e devem ser controlados são chamados
de erros sistemáticos . Os erros que não podem ser
controlados são chamados de erros aleatórios
ERROS SISTEMÁTICOS
Os erros sistemáticos estão relacionados com
o uso de equipamentos descalibrados ,
aplicação de procedimentos inadequados ou
emprego dos modelos, subjacentes ao processo de medição,
conceitualmente errados.
A ) Falta de calibração
O elemento mais crítico de qualquer processo de medição é a
relação entre uma medida e o padrão da unidade de medida ,
ou seja, a calibração do instrumento.
A calibração é a comparação entre a indicação do
instrumento e o valor do padrão mantido por um laboratório
de referência para as unidades das respectivas grandezas.
Tabela 5 - Exemplo de grandezas e suas unidades de medida
grandeza unidade do SI outros sistemas
comprimento metro polegada , milha
massa quilograma arroba , onça
atividade becquerel curie
exposiçãocoulomb por quilograma
röentgen
FONTE
DE
RADIA
ÇÃO
FONTE
DE
RADIA
ÇÃO
DETETO
R
CALIBR
ADO
DETETOR
DESCALIB
RADO
Erro ou falta de calibração do instrumento de medida.
Tanto a régua quanto o detetor indicarão , sistematicamente,
valores diferentes dos verdadeiros .
A régua mostrada na figura sempre vai
subestimar o comprimento verdadeiro.
O detetor vai sempre superestimar a intensidade da radiação.
B ) Equívoco / Engano
Falhas nos procedimentos de medição são as fontes de erro
mais sujeitas ao controle do experimentador ( quem faz a medida ).
PADRÃO DE COMPRIMENTO
OBJETO
RÉGUA CALIBRADA, PORÉM MAL
USADA101 105
1 105
Erros do operador
FONTE DE
RADIAÇÃ
O
FONTE DE
RADIAÇÃ
O
DETETOR
CALIBRADO
DETETOR
CALIBRADO EM
POSIÇÃO ERRADA
C ) Erro conceitual
O modelo conceitual equivocado é uma fonte de erro sistemático
que , frequentemente , passa desapercebida.
Exemplo de erro sistemático , importante na área radiológica :
utilizar um instrumento inadequado para medir diferentes tipos de radiação.
ERROS ALEATÓRIOS
São causados por variações incontroláveis nos instrumentos de medida,
acarretando a não repetição dos valores
observados em medidas consecutivas
Mesmo instrumentos muito BONS exibem pequenas variações aleatórias.
Essas variações são descritas por dois termos : precisão e repetibilidade
que podem ser usados como sinônimos de estabilidade.
Tabela 6 - Valores das contagens dos fótons provenientes de uma fonte que foram detectados por um detector Geiger
Medida 1a 2 a 3 a 4 a 5 a 6 a 7 a 8 a 9 a 10 a
Resultado 21 26 35 30 24 28 31 30 29 38
EXATIDÃO E PRECISÃO
Os dois tipos de erros descritos são distinguidos e expressos pelas
exatidão e precisão das medidas.
TIROS PRECISOS
E INEXATOS
TIROS PRECISOS
E EXATOS
TIROS IMPRECISOS
E EXATOS
TIROS IMPRECISOS
E INEXATOS
Exemplo
Observe o gráfico abaixo .
No eixo x , estão os valores obtidos em uma série de medidas de um mesmo objeto.
No eixo y , estão as freqüências dos ( quantas vezes cada valor foi obtido ).
As medições foram feitas com quatro instrumentos diferentes.
Figura 6 - Representação gráfica de exatidão e precisão.
VALOR OBSERVADO
FR
EQ
ÜÊ
NC
IA
VALOR VERDADEIRO
A
B
C
D
QUALIDADE DOS INSTRUMENTOS
A – EXATO E PRECISO
B – EXATO E IMPRECISO
C – INEXATO E PRECISO
D – INEXATO E IMPRECISO
A curva A contém os resultados de um instrumento exato, pois os valores
obtidos estão próximos do valor verdadeiro, e preciso, pois os valores estão
pouco dispersos.
A curva B contém os resultados de um instrumento exato, pois os valores
estão próximos do valor verdadeiro, e impreciso, pois os valores estão mais
dispersos.
A curva C contém os resultados de um instrumento inexato, pois os valores
se concentram em torno de um valor distante do valor verdadeiro, porém
preciso, já que os resultados estão bem agrupados.
A curva D contém os resultados de um instrumento inexato, pois os valores
estão distantes do valor verdadeiro, e impreciso, pois os resultados estão
mais dispersos.
ALGARISMOS SIGNIFICATIVOS
Algarismo significativo é aquele ao qual está
associado um significado físico e
deve dar uma informação correta
do valor real de uma grandeza.
AVALIAÇÃO DE INCERTEZAS
Uma única medida
A incerteza em um resultado , a partir de uma única
medida, depende muito de inúmeras condições do
processo de medição mas , em geral , pode ser
estimada como sendo
metade da menor divisão da escala do instrumento.
medida de X = 4,70 cm - o 7 exato e o 0 incerto
Estimativa de X = 4,7 cm - o 7 é incerto
Exemplo de medidas com diferentes precisões
Várias medições : A incerteza de uma média de uma série de
medidas do mesmo objeto é o desvio padrão ( s ) das medidas.
s é a medida mais comum da dispersão estatística.
Ele mostra o quanto de variação ou "dispersão" existe
em relação à média ( ou valor esperado ).
Um desvio padrão pequeno indica que
os dados tendem a estar próximos da média .
Um desvio padrão alto indica que os dados estão
bastante espalhados em relação à média.
O desvio padrão é definido como a raiz quadrada positiva da variância.
É definido de maneira a dar-nos uma medida de dispersão que :
Seja um número não-negativo;
Use a mesma unidade de medida dos dados fornecidos inicialmente.
Fórmula da Variância Fórmula do Desvio Padrão
O Coeficiente de Variação é obtido pela
razão entre o desvio-padrão e a média
Indica se a dispersão é grande em relação à média.
ERRO DE / POR ARREDONDAMENTO
Arredondamento é a operação que
Elimina algarismos do número
e , portanto ,
diminuindo o número de algarismos significativos ,
aumenta o erro ( ? )
PROPAGAÇÃO DE ERROS EXPERIMENTAIS
Muitas vezes , a grandeza que se quer avaliar
não pode ser medida diretamente com um instrumento.
Para determiná-la ,
medimos outras grandezas relacionadas.
Se uma grandeza z é função de outras grandezas
x e y : z = f ( x , y )
a expressão que nos dará a incerteza s ( z ) será :
2
y
2
2
x
2
sy
zs
x
z)z(s
A expressão
x
z
significa a derivada parcial de z em relação à variável x
Exemplo : incerteza na determinação da distância percorrida por um objeto
a partir da medida da velocidade e do tempo:
Seja v = 10,1 ± 0,5 e t = 6,3 ± 0,1.
Qual a distância percorrida e a incerteza no resultado ?
D = v . t = 10,1 . 6,3 = 63,63
Arredondando para a quantidade correta
de algarismos significativos
a resposta é 64
Para estimarmos a incerteza no resultado , utilizamos a
expressão para s ( z ) e as funções derivadas :
tv
D
v
t
D
sv = 0,5 st = 0,1
33079,31,01,105,03,6svsts 22222
t
22
v
2
D