Quimiometria

61
CURSO: QUÍMICA QUIMIOMETRIA BÁSICA 3º ANO - DIURNO NOME: Nº: TURMA: Prof. Alcides Eduardo Jacomassi 2011u Centro Universitário Fundação Santo André Faculdade de Filosofia, Ciências e Letras

description

Apostilha Quimiometria

Transcript of Quimiometria

Page 1: Quimiometria

CURSO: QUÍMICA

QUIMIOMETRIA BÁSICA

3º ANO - DIURNO

NOME:

Nº: TURMA:

Prof. Alcides Eduardo Jacomassi 2011u

Centro Universitário Fundação Santo André Faculdade de Filosofia, Ciências e Letras

Page 2: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 2

Conteúdo

Introdução - Arredondamento de dados - Notação científica - Algarismos significativos - Operações com algarismos significativos

Estatística Descritiva

- Precisão e Exatidão - Medidas de posição e dispersão - Distribuição de freqüência - Função de distribuição de probabilidade

Estatística Indutiva - Estimação de parâmetros por intervalo - Tamanho de amostras - Comparação de resultados - Teste de hipóteses

Planejamento e análise de experimentos - Experimentos fatoriais - Métodos e planejamentos - Planejamento fatorial fracionário

Page 3: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 3

Arredondamento de dados

O resultado do arredondamento de um número como 72,8 para o inteiro mais próximo é 73, posto que 72,8 está mais próximo do 73 que do 72. Semelhantemente, 72,8146 arredondado para o centésimo mais próximo (ou com duas decimais) é 72,81.

Ao arredondar 72,465 para o centésimo mais próximo deparamo-nos com um dilema, pois 72,465 dista igualmente de 72,46 e 72,47. Nestes casos devemos adotar alguma referência quanto a regra de arredondamento. Uma das opções é a Norma ASTM E-29 que determina que nestes casos o número deve ser arredondado para o número par mais próximo, que precede o algarismo 5. Assim, 72,465 deve ser arredondado para 72,46.

Outros exemplos:

183,575 (para o centésimo mais próximo) � 183,58 1165 (para a dezena mais próxima) � 1160

Esta prática é especialmente valiosa para reduzir ao mínimo os erros acumulados por arredondamentos.

Resumindo, se o algarismo após o último a ser mantido for: Menor que 5 � o algarismo a ser mantido permanece o mesmo Maior que 5 � o algarismo a ser mantido aumenta uma unidade Igual a 5 � o algarismo a ser mantido permanece o mesmo ou aumenta

uma unidade de forma que seja sempre par.

Notação científica

Ao escrever números, especialmente aqueles que comportem muitos zeros, (antes ou após a decimal) é sempre conveniente empregar a notação científica que utiliza as potências de dez.

Vale relembrar algumas regras de operações com potências:

Multiplicação: 10P x 10Q = 10P+Q Divisão: 10P / 10Q = 10P-Q

Algarismos significativos

Se a altura de um aluno foi determinada com precisão como sendo 1,66 metro, isto significa que seu valor verdadeiro está compreendido entre 1,655 e 1,665 metro. Os algarismos corretos, separados dos zeros necessários para a localização da vírgula, chamam-se algarismos significativos, e o algarismo mais à direita não nulo (para números sem vírgula) chama-se algarismo duvidoso (atentar que o algarismo duvidoso é um algarismo significativo).

Page 4: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 4

Exemplos:

1,65 tem 3 algarismos significativos e o 5 (cinco) é o algarismo duvidoso 0,0018 tem 2 algarismos significativos e o 8 (oito) é o algarismo duvidoso

0,00180 tem 3 algarismos significativos e o 0 (zero) é o algarismo duvidoso Os números resultantes de enumerações ou de contagens (discretos), ao contrário daqueles obtidos em medições (contínuos), são naturalmente exatos e, assim, têm uma quantidade ilimitada de algarismos significativos. Em alguns casos pode ser difícil saber quantos são os algarismos significativos. Por exemplo, o número 12 500 pode ter 3, 4 ou 5 algarismos significativos. Nestes casos é bastante importante registrar o número em notação científica, pois se o número fosse escrito como 1,250 x 104 poderíamos afirmar sem dúvidas que o número possui 4 algarismos significativos.

Operações com algarismos significativos

Na multiplicação e na divisão, o resultado final não pode ter mais algarismos significativos do que o que tem menor quantidade deles.

Na soma e na subtração, o resultado final não pode ter mais algarismos

significativos depois da vírgula do que aquele que tiver menor quantidade deles nessa condição. Caso os números não possuam vírgulas, o resultado não poderá ter algarismos significativos mais à direita que aquele que tem menor precisão.

Definições Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. Esta ciência se preocupa com a organização, descrição, análise e interpretação de dados experimentais. Ela é aplicada ao estudo de variáveis aleatórias e, principalmente, quando tais variações têm grande efeito sobre o fenômeno estudado. A Estatística pode ser dividida em duas partes:

• Descritiva: que se preocupa com a organização e descrição dos dados experimentais;

• Indutiva: que cuida da análise e interpretação, permitindo a realização de

inferências e projeção de populações.

Page 5: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 5

Quimiometria é uma disciplina voltada à aplicação de métodos estatísticos e matemáticos no planejamento e otimização de procedimentos e na obtenção de informações químicas nas análises de resultados relevantes. É reconhecida atualmente como um ramo da química analítica. O emprego dos computadores em laboratório impulsionou o desenvolvimento da quimiometria Alguns campos de aplicação da quimiometria:

• Otimização de experimentos • Curvas de calibração • Modelagem de fenômenos • Detecção e resolução • Comparação de métodos • Redes neurais • Procura bibliográfica

O método estatístico aplicado na avaliação de um processo se divide em quatro fases basicamente: Coleta de dados: pode ser efetuada de dois modos

• Direto: todo o universo dos dados é utilizado para análise; • Indireto: somente uma parte do universo é utilizada para análise – a

amostra;

Em um determinado processo estatístico esta importante etapa deve atender os seguintes requisitos:

• Definir claramente os objetivos; • Definir a técnica a ser utilizada; • Comprometer o coletor com o processo; • Planejar a coleta; • Definir os pontos mais adequados; • Treinar o coletor; • Utilizar instrumentos adequados.

Dados Análisee

Conhecimento e informação

Descritiva Indutiva

Page 6: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 6

Apuração dos dados : após a coleta dos dados efetua-se a tabulação de acordo com critérios pré-estabelecidos. Por exemplo: faixa de concentração, método utilizado, etc. A apresentação dos dados : os dados podem ser apresentados em tabelas (ou quadros) e em gráficos. Análise e interpretação : baseados na análise dos dados deverão ser tomadas medidas para resolução de problemas observados ou melhoria dos processos. O emprego da quimiometria e de ferramentas estatísticas tem colaborado com o químico nas suas diversas áreas de atuação, levando-lhe a melhor interpretação de dados experimentais obtidos e a grande economia de tempo e materiais. Dois conceitos fundamentais devem ser considerados em quimiometria:

•••• Nenhuma operação matemática melhora a medida do processo! •••• O domínio e o conhecimento acerca do problema ainda são

imprescindíveis. Noções de Amostragem População ou universo estatístico: é um conjunto da totalidade dos elementos objeto da nossa análise. Pode ser finita ou infinita; Amostra é uma parte significativa da população, selecionada com critérios científicos, que nos permite tirar conclusões a respeito da população. O esquema a seguir associa o conceito de população e amostra com a estatística descritiva e indutiva. É preciso garantir que a amostra usada seja obtida por processos adequados para seja representativa da população. Isso significa que, em maior ou menor grau, no processo de amostragem a amostra deve possuir as mesmas características básicas da população.

Amostra

Amostra

População existente

População futura Estatística

Indutiva

Estatística Descritiva

Page 7: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 7

De acordo com o interesse ou propósito do trabalho a ser conduzido, a amostragem de uma determinada população pode ser assim classificada: - Amostragem casual simples - Todos os elementos da população têm igual probabilidade de pertencer à amostra; - Amostragem sistemática - Quando os elementos da população se apresentam ordenados e a retirada da amostra é feita em espaço e tempo definidos; - Amostragem por meio de conglomerados - Quando a população apresenta uma subdivisão em pequenos grupos, chamados conglomerados, é possível se realizar uma amostragem casual destes subconjuntos; - Amostragem estratificada - Muitas vezes a população se divide em sub-populações ou estratos, sendo razoável supor que, de estrato para estrato, a variável de interesse apresente um comportamento substancialmente diverso. A amostragem estratificada consiste em especificar os estratos e a porção da amostra retirada em cada um dele.

Precisão e Exatidão Erros ou desvios são conseqüências naturais do processo de medida de uma determinada grandeza. Os erros podem ter como origem as seguintes fontes: - Erro de julgamento: oriundo de uma medida subjetiva. - Erro de leitura: oriundo de leituras errôneas. - Erro de instrumento: oriundo de defeitos ou da precisão limitada de

instrumento. - Erro de fontes externas: devido a fatores que influem diretamente na medida. - Erro de representação: devido às medidas não poderem ser representadas

numa escala correta. Os erros descritos acima nos levam a uma classificação genérica de dois tipos de erros, a saber:

•••• Erro Sistemático : apresenta tendência e relaciona-se com a média. Ex:

utilizar uma balança não calibrada para pesagem. Para eliminá-lo necessitamos descobrir a fonte e caso não seja possível devemos utilizar tabelas ou fórmulas para sua correção.

- É unidirecional

- Tem causa assinalável - Está associada à exatidão

•••• Erro Aleatório : não apresenta tendência e relaciona-se com o desvio

padrão. Ex: leituras sucessivas em um equipamento com diferentes valores. Não são passíveis de eliminação, porém podem ser tratados estatisticamente.

- É bidirecional - Não tem causa assinalável - Está associado à precisão

Page 8: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 8

•••• Exatidão: É a concordância entre uma medida e valor verdadeiro ou mais provável da grandeza. É também referida como acurácia .

•••• Precisão: É a concordância entre uma série de medidas da mesma

grandeza. Expressa a reprodutibilidade da medida.

O grau de exatidão e precisão na tomada de uma determinada medida é determinado por um conjunto de propriedades estatísticas que relacionam posição e dispersão a um valor da população

Medidas de Posição e Dispersão Medidas podem ser tomadas em função da amostra ou da população. A notação destas medidas encontra-se na tabela a seguir: Notações de principais estatísticas para população e amostra.

População Amostra

No de elementos N n

Média µ x

Variância σ2 S2

Desvio padrão σ S

As medidas de posição servem para localizar a distribuição de freqüência sobre o eixo da variável em questão. Três tipos importantes de medidas de posição: média, mediana e moda.

Precisão: Erros Aleatórios Exatidão: Erros Sistemáticos

Page 9: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 9

• Média aritmética: sendo xi (i = 1,2,3, ..., n,), definimos com média aritmética ou simplesmente média:

N

xn

ii∑

== 1µ ou n

xx

n

ii∑

== 1

• Média Ponderada: consiste na média dos valores ordenados por classes

considerando o peso de cada classe no conjunto.

N

fxn

i

ii∑== 1

.

µ ou n

fxx

n

i

ii∑== 1

.

•••• Mediana ( x~ ): A mediana é o valor médio ou a média aritmética dos dois valores centrais de um conjunto de números, ordenados em ordem de grandeza, isto é, em um rol.

•••• Moda ( x̂ ): é o valor que ocorre com maior freqüência, isto é, é o valor

mais comum. A moda pode não existir e, mesmo que exista, pode não ser única.Uma distribuição que tem apenas uma única moda é denominada unimodal.

Exemplo Encontrar média, mediana e moda do seguinte conjunto: 11 12 14 15 15 16 16 18

6,148

1816161515141211 =+++++++=x

mediana = 152

1515)º5:º4( =+=x

moda = 15 e 16 (universo bimodal) As medidas de dispersão complementam as informações das medidas de posição, indicando o grau de variação existente num conjunto de dados. As principais medidas de dispersão são: amplitude, variância, desvio padrão e o coeficiente de variabilidade.

•••• Amplitude: É a diferença entre o maior e o menor valor da série de dados.

mínmáx xxR −=

Page 10: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 10

•••• Variância: Por definição é a média dos quadrados dos valores em relação à média. Podemos defini-la como:

N

xn

i

i∑=

−= 1

2

2

)( µσ ou

1

)(1

2

2

−=∑

=

n

xxS

n

i

i

NN

x

xn

i

n

i

i

i∑∑

=

=

−= 1

2

12

2σ ou 1

1

2

12

2

−=∑

=

=

nn

x

xS

n

i

n

i

i

i

As variações das outras fórmulas ocorrem de forma análoga às variações acima. As propriedades matemáticas da variância: - Multiplicando-se todos os valores de um conjunto por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante; - Somando-se ou subtraindo–se uma constante a todos os valores de um conjunto, a variância não se altera.

•••• Desvio Padrão: É definido como sendo a raiz quadrada da variância. Sua vantagem em relação à variância é que se encontra na mesma unidade dos dados amostrais.

2SS =

Exemplo Conjunto de dados apresentados na determinação de Pb (mg/L) de 4 laboratórios: 48,4 50,2 50,8 51,0

1,50=x mg/L

xxi − 2)( xxi −

48,4 – 50,1 = -1,7 2,89 50,2 – 50,1 = 0,1 0,01 50,8 – 50,1 = 0,7 0,49 51,0 – 50,1 = 0,9 0,81 Σ 0 4,2

4,114

2,42 =−

=S (mg/L)2 2,14,1 ==S mg/L

Page 11: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 11

•••• Coeficiente de variação (ou variabilidade): É definido como o quociente percentual entre o desvio padrão e a média. Sua vantagem é caracterizar a dispersão dos dados em termos relativos a seu valor médio.

100×=x

SCV

Exemplo Um químico, desejando avaliar um novo método para determinação de cobre, conduziu uma investigação preliminar usando uma solução de concentração conhecida. Esta solução de 60 mg/L de cobre foi analisada 6 vezes, tomando para cada determinação alíquotas de 10 mL. Encontrar a média, mediana, moda, amplitude, variância, desvio-padrão e o coeficiente de variação dos resultados encontrados. 58,2 61,0 56,6 53,8 56,9 58,3

5,576

3,589,568,536,560,612,58 =+++++=x mg/L

6,57)2,58:9,56( == xmd mg/L

2,78,530,61 =−=R mg/L

65,5)16(

)5,573,58(...)5,570,61()5,572,58( 2222 =

−−++−+−=S (mg/L)2

38,265,5 ==S mg/L

%1,41005,57

38,2 =×=CV

conjunto amodal (sem moda) Exemplo Foram realizadas análises de cloretos em meio aquoso por 4 técnicos em uma mesma amostra padrão de 10,0 mg/L, encontrando-se os seguintes resultados: técnico A 9,0 9,0 9,2 9,1 9,3 técnico B 9,9 9,9 10,3 10,3 10,3 técnico C 8,0 9,0 9,5 8,5 9,8 técnico D 9,0 10,5 11,0 9,5 10,0 Em relação aos resultados encontrados, classifique-os quanto à precisão e exatidão, e diga qual o tipo de erro (sistemático ou aleatório) há em cada um dos casos.

Page 12: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 12

Para estimarmos a exatidão vamos considerar a estatística x , e para a precisão o coeficiente de variação. x S CV (%) classe erro técnico A 9,12 0,13 1,4 inexato e preciso sistemático

técnico B 10,14 0,22 2,2 exato e preciso aleatório

técnico C 8,96 0,73 8,1 inexato e impreciso sistemático aleatório

técnico D 10,00 0,79 7,9 exato e impreciso aleatório

Distribuição de freqüência É uma séria estatística específica, onde os dados encontram-se dispostos em classes ou categorias juntamente com as freqüências correspondentes. Pode ser dividida em dois tipos:

• Distribuição Simples : Assume valores inteiros (pontuais) normalmente oriundos de contagem. Ex.: números de técnicos que participam de um plano de correlação laboratorial (dados discretos).

• Distribuição acumulada : Assume valores contínuos, normalmente

oriundos de medidas. Ex.: resultados de análises de enxofre realizadas em amostras de gasolina.

Exemplo de uma distribuição contínua: temperaturas observadas em determinado processo: 22 46 9 40 57 22 22 13 50 42 35 2 15 41 34 52 32 75 69 44 26 42 60 56 30 3 17 79 45 37 0 12 62 50 45 41 59 11 66 39 43 33 70 50 47 20 36 40 67 29

Page 13: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 13

A distribuição de freqüência será expressa na seguinte ordem: Temperaturas nº observações

0 ├ 10 4

10 ├ 20 5

20 ├ 30 6

30 ├ 40 8

40 ├ 50 12

50 ├ 60 7

60 ├ 70 5

70 ├ 80 3 Para discutir os dados dispostos na tabela de distribuição devemos notar algumas definições:

• Dados Brutos : São os dados não organizados. • Rol : Arranjo de dados em ordem decrescente ou decrescente.

• Classe (i): Cada um dos intervalos. No exemplo temos 8 classes.

• Limite de classe : São os extremos de cada classe (inferior e superior).

No exemplo a terceira classe tem limite inferior igual a 20 e limite superior igual a 30.

• Intervalo de classe ou amplitude: É a diferença entre o limite superior e

o limite inferior de cada classe. No exemplo é 10.

•••• Amplitude total : É a diferença entre a maior e a menor observação. No exemplo a amplitude total é 79.

•••• Ponto médio de classe (x i): É a média aritmética entre o limite superior e

inferior de cada classe. No exemplo, xi da quinta classe é 45.

•••• Número de classes: Pode ser encontrado pela regra de Sturges: K = 1 + 3,3 logN (N = número de elementos)

Também pode ser encontrado por outras fórmulas, como regra de Kelly e etc. No entanto, é utilizado um número conveniente. No exemplo optamos por 8 classes.

•••• Freqüência absoluta simples (fi): Número de observações em cada classe.

Page 14: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 14

•••• Freqüência relativa simples (fir): É o quociente entre a frequência absoluta simples da classe (fi) e o número total de observações (N).

•••• Freqüência absolta acumulada (Fi): Corresponde a soma das

freqüências de determinada classe com todas as anteriores. •••• Freqüência relativa acumulada (Fir): Corresponde à soma das

freqüências relativas simples (fir) de determinada classe com todas as anteriores.

Exemplo Os valores abaixo se referem a uma série de resultados analíticos de determinado produto, já ordenados de forma crescente. 95 96 96 97 97 97 97 98 98 98 98 98

98 99 99 99 99 99 99 99 99 99 99 99

99 100 100 100 100 100 100 100 100 100 100 100

100 100 100 100 100 100 100 101 101 101 101 101

101 101 101 101 101 101 102 102 102 102 102 102

102 103 103 103 103 104 104 105

Em relação aos dados acima, organize uma tabela de distribuição de freqüência por intervalos e responda as seguintes questões: a) % de resultados iguais ou superiores a 99; b) % de resultados entre 98 (inclusive) e 102 (exclusive); c) Número de resultados menores que 103.

Temperatura (ºC) xi fi fir Fi Fir

95 ├ 96 95,5 1 0,015 1 0,015

96 ├ 97 96,5 2 0,029 3 0,044

97 ├ 98 97,5 4 0,059 7 0,103

98 ├ 99 98,5 6 0,088 13 0,191

99 ├ 100 99,5 12 0,176 25 0,368

100 ├ 101 100,5 18 0,265 43 0,632

101 ├ 102 101,5 11 0,162 54 0,794

102 ├ 103 102,5 7 0,103 61 0,897

103 ├ 104 103,5 4 0,059 65 0,956

104 ├ 105 104,5 2 0,029 67 0,985

105 ├ 106 105,5 1 0,015 68 1,000

Page 15: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 15

a) % resultados ≥ 99 (freqüência acumulada relativa até quarta classe): 1-0,191 = 0,809 (80,9 %) . b) % resultados ≥ 98, < 102 (soma das freqüências relativa entre quarta e sétima classe): 0,088 + 0,176 + 0,265 + 0,162 = 0,691 (69,1 %) . c) resultados < 103 (freqüência acumulada até a oitava classe): 61

Histogramas São representações gráficas em forma de colunas justapostas, onde a base colocada no eixo das abscissas corresponde aos intervalos das classes, e a altura é dada pela freqüência absoluta das classes. O processo de obtenção do histograma é análogo ao utilizado para obtenção da distribuição de freqüência. As seguintes figuras apresentam as classificações de histogramas que podem ser obtidas.

Tipo Geral

02468

10121416

Tipo Pente

02468

1012141618

Tipo Platô

02468

101214

Tipo Assimétrico

02468

1012141618

A figura a seguir demonstra o histograma construído a partir de dados do exercício anterior, de classificação assimétrica.

0

2

4

6

8

10

12

14

0├ 10 10├ 20 20├ 30 30├ 40 40├ 50 50├ 60 60├ 70 70├ 80

f i

Page 16: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 16

Função de distribuições de probabilidade Vamos considerar o seguinte exemplo: determinado lote de produtos fabricados com especificação A e B, respectivamente, foram classificados em uma escala própria de cor, de 1 a 2, conforme a seguinte tabela: Escala cor

Especificação 1 2 Total

A 503 120 623

B 250 5 255

Total 753 125 878

Em um processo de escolha aleatória, qual a probabilidade de sorteamos: a) Produto com especificação A b) Produto com cor 2 c) Produto com especificação B e cor 1 d) Produto com especificação A ou cor 1 Quando conhecemos a distribuição dos dados sob determinados critérios podemos estabelecer facilmente a probabilidade de encontrarmos um resultado aleatório dentro de um intervalo.

A distribuição de probabilidade é determinada pela curva de densidade. No caso do histograma anterior podemos delimitar a curva de densidade da distribuição de probabilidade dos dados.

ºC

fi

0

2

4

6

8

10

12

14

16

18

20

94 95 96 97 98 99 100 101 102 103 104 105 106

Quando não conhecemos a distribuição dos dados, podemos admitir sob critérios rigorosos que a população pode seguir um padrão de distribuição determinado.

Page 17: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 17

Distribuição Normal Um dos mais importantes exemplos de uma distribuição continua de probabilidade é a distribuição normal, ou a distribuição de Gauss. A função de distribuição normal é definida pela equação:

22

)(

2

1 σµ

πσ

−−=

x

eY

A distribuição normal é a distribuição mais comumente utilizada quando se estuda variáveis. Podemos assim descrever as características de uma distribuição normal:

•••• Apresenta simetria ao redor da média;

•••• Tem um ponto de máximo para x = µ ;

•••• É duplamente assintótica;

•••• Tem dois pontos de inflexão;

•••• A área sob é igual à unidade. A probabilidade sob a curva de densidade da distribuição normal tem valores definidos em termos de σ.

Page 18: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 18

Como exemplo, vamos ilustrar a aplicação de cálculo pela probabilidade normal no caso de uma análise química de cobre por método eletrogravimétrico, supondo que o resultado esperado para o teor de cobre seja de 20 % e que a determinação analítica resultou em média x = 20 e desvio padrão σ = 0,5. P (19 ≤ µ ≤ 21) = P (18,5 ≤ µ ≤ 21,5) = P (19 ≤ µ ≤ 21,5) = Distribuição Normal Reduzida Para facilitar o cálculo de áreas de probabilidades, converte-se a escala dos eixos de x (variável aleatória) para escala de unidades de desvio padrão. Assim, temos que:

σµ)( −= x

z

onde o valor z representa o quanto um determinado valor dista da média em termos de desvio-padrão. A tabela disposta no Apêndice deve ser empregada para determinar a probabilidade de um resultado ocorrer em uma distribuição normal

99,7 %

95,4 %

68,3 %

σ -σ

- 2σ 2σ

3σ - 3σ

Page 19: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 19

Exemplo Um certo material foi analisado em laboratório. A média das determinações foi de 3,40 e o desvio padrão de 0,14. A especificação deste material fornecida pelo produtor é de 3,36 ± 0,05. Qual a probabilidade de encontrar valores fora de especificação? µ = 3,40 σ = 0,14 Limites da especificação: x1 = 3,36 – 0,05 = 3,31 x2 = 3,36 + 0,05 = 3,41

642,014,0

)40,331,3(1 −=−=z

071,014,0

)40,341,3(2 =−=z

P (x < 3,31) = P (z < -0,642) = 0,5 - 0,2389 = 0,261 P (x > 3,41) = P (z > 0,071) = 0,5 - 0,0279 = 0,472 P (x < 3,31) + P (x > 3,41) = 0,733 ou 73,3 %

Estatística Indutiva O objetivo da estatística indutiva é tirar conclusões sobre as populações com base nos resultados observados nas amostras extraídas dessas populações. Os problemas de estatística indutiva se concentram em dois grupos: - Estimação de Parâmetros por Intervalos de Confian ça - Avaliação por Testes de Hipóteses

Estimação dos parâmetros da população Através de uma amostra representativa da população, procura-se estimar os parâmetros da população (média, mediana, moda, amplitude, desvio padrão, variância, coeficiente de correlação, etc.). A estimação amostral pode ser por ponto ou por intervalo de confiança. A estimação pontual é a estimativa do parâmetro através de um único valor resultante de observações sobre os valores da amostra. Em estatística, entende-se por população o conjunto de elementos que tem em comum determinada característica. Todo subconjunto de elementos retirado dessa população é uma amostra. As medidas obtidas com base na população são chamadas parâmetros, indicados por letras gregas. Assim, por exemplo, a média de uma população é indicada por µ, e o desvio padrão por σ.

Page 20: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 20

As medidas obtidas com base em amostras são denominadas estatísticas, que são obtidas a partir de amostras como estimativas dos parâmetros. Na estimação de parâmetros por ponto, x serve para estimar µ, assim como S serve para estimarσ .

Estimação por intervalo de confiança Estimar o parâmetro por intervalo consiste na determinação de valores obtidos de observações da amostra no qual se espera que o mesmo contenha o valor do parâmetro. O intervalo estabelecido com uma determinada probabilidade é conhecido como intervalo de confiança. O nível ou grau de confiança, designado por 1-α, é a probabilidade citada. Assim, α será a probabilidade de erro na estimação por intervalo. Admitiremos simetria na probabilidade que os intervalos de confiança contenham os valores dos parâmetros estimados e, dessa forma, a probabilidade de que o parâmetro fique fora do intervalo, à direita e à esquerda do mesmo, será igual a α/2. O intervalo de confiança pode ser determinado para uma série de condições. Vamos considerar estas condições específicas como casos de estudo. Caso 1. Intervalo de Confiança para µ com σσσσ conhecido . O intervalo de confiança será expresso como 0ex ± , sendo os limites do

intervalo de confiança simétrico 0ex + e 0ex − . O problema resume-se em

determinar o 0e , fixando-se a probabilidade de erro na estimação, e fazendo uso do conceito da distribuição normal padronizada. Admitindo-se: µ = média da população x = média da amostra x = valor da variável estudada σ = desvio padrão da população n = tamanho da amostra

0e = semi-amplitude do intervalo de confiança

e σ

µ−= xz 0ex += µ

Em se tratando do estudo de amostras, o desvio padrão em z passa a ser indicado por n/σ . Substituindo as respectivas simbologias, temos que:

n

ez σ

µµ −−= )( 0

Page 21: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 21

nze

σ=0

Portanto, a expressão do intervalo de confiança, 0ex ± , resultará em:

nzx

σ±

e a interpretação desse intervalo será indicada por:

ασµσ −=

+≤≤− 1n

zxn

zxP

o valor de z é obtido na tabela da área sob a curva normal . Exemplo Consideremos uma amostra de 49 elementos extraída de uma população com distribuição normal, com média amostral x = 25 e σ = 1. Estabelecer um intervalo de 95 % de probabilidade com confiança para a média dessa população. Através da tabela da curva normal: z = z2,5% = 1,96 (valor obtido para 1-α = 1-0,05 = 0,95).

28,049

1.96,10 ==e

o intervalo de confiança será dado por:

28,000,250 ±=± ex com indicação dada por: P (24,72 < µ < 25,28) = 0,95. Caso 2. Intervalo de Confiança para µ com σσσσ desconhecido . Quando os parâmetros da população são desconhecidos, podemos, com base em uma amostra, obter a média da amostra, o desvio padrão e o erro padrão da média. A probabilidade neste caso deve ser considerada conforme a distribuição t de Student que é adequada para amostras com menor número de elementos, em geral < 30. A curva de densidade da distribuição t de Student se assemelha com a curva normal à medida que n tende a valores maiores.

Page 22: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 22

A probabilidade sob a curva densidade da estatística t pode ser encontrada por meio de dados tabelados (Apêndice). Usando a distribuição de t de Student podemos estabelecer um intervalo de confiança para a média, calculando os limites xtSx ± , onde nSSx = . Assim a

expressão para o intervalo de confiança para µ para com σ desconhecido fica:

nStx n 2/,1α−±

onde t é obtido por meio de tabela com n-1 graus de liberdade. A interpretação para o intervalo de confiança é dada por:

αµ αα −=

+≤≤− −− 1.. 2/,12/,1n

Stx

n

StxP nn

Exemplo Uma amostra de 10 elementos com média x = 16 e desvio padrão S = 2 é extraída de uma população de distribuição normal. Construir um intervalo de confiança de 90% para a média dessa população. Da tabela de distribuição t temos: tn-1= t9,90% = 1,833

eo = 1,833 . 10

2 = 1,159

o intervalo de confiança será:

159,100,160 ±=± ex com indicação:

Page 23: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 23

P(14,841 < µ< 17,159) = 0,90 Caso 3. Intervalo de confiança para a variância pop ulacional. A estimação do parâmetro variância pode ser realizada através de intervalos, de forma análoga à determinação de µ. Para tal, devemos empregar a distribuição 2χ (qui quadrado). A distribuição 2χ estabelece a dependência da variância com o número de graus de liberdade.

Seja:

1

)(1

2

2

−=∑

=

n

xxS

n

i

i

22

2

1

2 1

1

1S

n

n

nxxn

i

i

σσχ −=

−−×

−=∑=

2

22 )1(

χσ Sn−=

O intervalo de confiança para a variância populacional é definido por:

P

−≤≤−−

21,

2

22

2,

2

2 )1()1(αναν χ

σχ

SnSn= 1-α

Para o desvio padrão, o intervalo é definido por:

Page 24: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 24

P

−≤≤−−

21,

2

2

2,

2

2 )1()1(αναν χ

σχ

SnSn= 1-α

Onde os valores de

2,

2 ανχ e 2

1,2 ανχ − podem ser encontrados em Tabela

(Apêndice). Exemplo Uma amostra de 11 elementos extraída de uma população com distribuição normal forneceu S2 = 7,08. Construir o intervalo com 90 % de confiança para σ2 da população.

2,

2 ανχ = %5,102χ =18,307

21,

2 ανχ − = %95,102χ =3,94

limites do intervalo: LI = 87,3307,18

08,710 =×

LS = 0,1894,3

08,710 =×

P(3,87 ≤ σ2 ≤ 18,0) = 0,90 P(1,97 ≤ σ ≤ 4,24) = 0,90 Caso 4. Intervalo de confiança para a proporção pop ulacional Uma variável é uma função que confere um número real a cada resultado no espaço amostral de um experimento aleatório. As variáveis podem ser classificadas de duas formas:

•••• Variáveis discretas – possuem uma faixa finita e contável. Exemplo: número de lotes fabricados, número de analisadores em linha, número de certificados emitidos no mês, etc..

•••• Variáveis contínuas – possuem um intervalo de números reais para a

sua faixa. Exemplo: temperatura, massa, tempo, concentração, etc.. O tratamento estatístico dado às variáveis discretas refere-se à proporção dos eventos contáveis que ocorrem em uma determinada população. Baseados na distribuição binomial, podemos estabelecer o intervalo de confiança para uma determinada proporção populacional. Seja: n = número de elementos da amostra; f = freqüência observada do evento; p = proporção populacional (parâmetro); p’= estimador do parâmetro (amostral);

Page 25: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 25

n

fp ='

Quando np ≥ 5 e n(1-p) ≥ 5

n

pp )'1('2 −=σ

se n

zeσ=0

para a proporção populacional: n

ppze

)'1('0

−=

O intervalo de confiança para p pode ser definido por:

P

−+≤≤−−n

ppzpp

n

ppzp

)'1(''

)'1('' =1-α

Exemplo Retirada uma amostra de 1000 peças da produção de uma máquina, verificou-se que 35 eram defeituosas. Qual o IC ao nível de 95 % para a produção de defeitos da máquina? n = 1000 f = 35

035,01000

35' ==p

z 95 % = 1,96

0114,01000

)035,01(035,096,10 =−=e

P(0,035-0,0114 ≤ p ≤ 0,035+0,0114) = 1-α P(0,0236 ≤ p ≤ 0,0464) = 0,95

Page 26: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 26

Tamanho das amostras A amplitude do intervalo de confiança é inversamente proporcional ao nível de confiança, isto é, quanto maior o intervalo menor será a precisão na estimação. A determinação do tamanho de amostras necessárias para casos de estimação da média fica:

•••• Com σσσσ conhecido na estimação da média populacional

2

0

=

e

zn

σ

•••• Com σσσσ desconhecido na estimação da média populacional

2

0

)2/,1(

= −

e

Stn n α

Nesta situação, dependemos de uma amostra piloto n’ para podermos considerar o valor de 2/,1α−nt na expressão acima para o cálculo de n. Enquanto o

valor de n obtido for maior que o valor de n’ utilizada como amostra piloto, devemos escolher novo n’ e conseqüentemente teremos a tabela t de Student o valor correspondente com n’-1 graus de liberdade. Repetimos este procedimento até se obter n < n’.

•••• Para a proporção populacional

)'1('2

0

ppe

zn −

=

Exemplo O supervisor dos analistas do laboratório setorial deseja estimar o valor médio para a determinação de selênio em amostras de ração animal, para checar se o método que ele está utilizando atende ao erro de 0,2 mg/L, com 90 % de confiança. Baseado em dados do laboratório central, a estimativa para o desvio padrão do teor esperado é de σ = 0,50 mg/L. Qual o número mínimo de determinações que ele precisa efetuar? Para 90 % de confiança (1-α ): z = 1,65.

172,0

50,065,12

=

×=n

Page 27: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 27

Exemplo Para verificar se determinado material está fora de especificação, ou seja, maior que 0,05 mg/L de Pb, o supervisor encaminhou ao analista 7 amostras, obtendo os seguintes resultados. 0,052 0,048 0,050 0,055 0,054 0,043 0,060 Ao nível de 10 % de significância, este número de amostras é suficiente para se afirmar que a amostra está fora de especificação? Considerar que não há mais informações a respeito do problema. x = 0,05171 S = 0,005438 n’ = 7 > t 6;0,90 = 1 ,943

00171,005,005171,00 =−=−= µxe

3800171,0

005438,0943,12

=

×=n

como n > n’ (38>7), devemos fazer novas determinações e procedermos aos cálculos para a nova média x e a nova estimativa para desvio padrão, utilizando a estatística “t” correspondente, ao nível de 5 %, e obtermos o novo número n; e assim por diante, até chegarmos em n menor ou igual a n’ . O n final vai nos indicar o número mínimo de amostras necessário para dizermos sobre a concordância a respeito da especificação. Exemplo Qual o tamanho da amostra suficiente para estimar a proporção de produtos com defeitos fornecidos por uma máquina, com precisão de 0,02 e 90 % de confiança, sabendo que seguramente esta proporção não é superior a 0,20.

1089)2,01(2,002,0

65,12

=−×

=n

Rejeição de valores dispersos Antes de se efetuar a avaliação e interpretação de uma série de resultados, é necessário verificar a existência de valores que eventualmente possam ser considerados como dispersos, ou seja, valores que muito provavelmente não pertençam ao mesmo conjunto de resultados (população). Em geral, são feitas considerações dentro do critério de rejeição de valores :

Page 28: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 28

•••• Se proporção de valores dispersos < 10 % , estes devem ser rejeitados e o restante do conjunto pode ser tratado normalmente;

•••• Se 10% < proporção de valores dispersos < 15% , o responsável pela

avaliação dos resultados deve usar o bem senso acerca da preservação do conjunto de dados para estudo;

•••• Se proporção de valores dispersos > 15 % , a amostra deve ser

totalmente rejeitada. Existem métodos de verificar se um ou mais valores podem ser considerados dispersos. Vamos aqui nos concentrar no estudo dos procedimentos mais comumente empregados e recomendados.

Teste de Dixon Dada uma série de dados, este teste é utilizado para se eliminar aqueles resultados considerados discrepantes. A estatística utilizada é dada através da Tabela de Dixon, constante do final desta apostila. Nesta tabela pode ser encontrado o valor crítico, que é então comparado ao valor calculado a partir dos dados da amostra, obedecendo ao seguinte procedimento:

a) ordenar os dados amostrais em ordem crescente; b) calcular o valor de Qc conforme fórmula constante da tabela (atentar

sempre para o número de dados; a fórmula varia em função do tamanho da amostra);

c) obter o valor de Q tabelado; d) comparar os valores de Q calculado e Q tabelado.

Exemplo Usando o teste de Dixon, verifique se existe algum dado que deve ser descartado na análise de determinado produto. Os resultados obtidos foram os seguintes:

20,1 - 19,9 - 20,2 - 19,9 - 21,1 - 20,0

Teste de Cochran Este teste é utilizado quando se deseja comparar variâncias , ou seja, verificar se a variância dos resultados obtidos por um laboratório é excessiva em relação à dos demais laboratórios. É um teste unilateral, isto é, só verifica o maior valor.

Page 29: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 29

Para um conjunto de p laboratórios, com desvios padrão Si (i=1,2,...,p), todos computados com o mesmo número de repetições n, o teste de Cochran é dado por:

∑=

= p

ii

máxc

S

SC

1

2

2

onde: S2 = estimativa da variância S2 máx = maior valor encontrado como estimativa da variância, no conjunto p = número de laboratórios Os valores críticos para o teste de Cochran são tabelados (Apênice). Se Cc < Ct 5 % → Valor aceito Se Ct 1 % > Cc > Ct 5 % → Valor suspeito Se Cc > Ct 1 % → Valor disperso Exemplo Aplicar o Teste de Cochran no conjunto de dados abaixo para encontrar valores dispersos.

Laboratório n S S2 1 3 0,005 0,000025 2 3 0,010 0,000100 3 3 0,021 0,000441 4 3 0,010 .0,000100 5 3 0,019 0,000361 6 3 0,006 0,000036 7 3 0,012 0,000144 8 3 0,025 0,000625

Calcular a soma das variâncias

001832,02 =∑ iS

Relacionar a maior variância encontrada, com a soma.

341,0001832,0

000625,0

1

2

2

===

∑=

p

ii

máxc

S

SC

Comparar o valor calculado Cc, com o valor tabelado (Ct 1 % e Ct 5 %) Na tabela, para p = 8 e n = 3, temos: Ct 5 % = 0,516 Ct 1 % = 0,615

Page 30: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 30

Conclusão: Como Cc < Ct 5 %, então o valor da maior variância, Laboratório 8, é aceito.

Teste de Grubbs O teste é primeiramente realizado verificando a existência de um valor disperso em cada extremidade do conjunto. Se nesta primeira análise, um dos dois valores for considerado disperso, ele é rejeitado, retirado do conjunto e novo teste, verificando a existência de um valor disperso em cada extremidade do conjunto, é realizado e assim sucessivamente. Caso contrário, se nesta primeira análise, ambos os valores forem aceitos como não dispersos, o teste é então realizado verificando-se a existência de dois valores dispersos em cada extremidade do conjunto. Se nesta segunda análise os dois resultados de uma das extremidades forem considerados como dispersos, eles devem ser rejeitados, retirados do conjunto e novo teste verificando a existência de dois valores dispersos em cada extremidade do conjunto é realizado e assim sucessivamente. Os valores críticos para o teste de Grubbs são tabelados (Apêndice). Teste de Grubbs para 1 valor disperso : dado um conjunto de resultados gi, para i=1, 2, ..., p, dispostos em ordem crescente, então para determinar se um determinado valor é um disperso, usando o teste de Grubbs, devemos calcular as seguintes estatísticas: para testar o maior valor, utilizar

S

ggG p

p

)( −=

para testar o menor valor, utilizar

S

ggG

)( 11

−=

Os valores críticos para o teste de Grubbs são tabelados. Se Gc < Gt 5 % → Valor aceito Se Gt 1 % > Gc > Gt 5 % → Valor suspeito Se Gc > Gt 1 % → Valor disperso Teste de Grubbs para 2 valores dispersos : dado um conjunto de resultados gi, para i=1,2,...,p, dispostos em ordem crescente, então para determinar se dois (maiores ou menores) valores são considerados como dispersos, devemos calcular as seguintes estatísticas: Para testar se dois maiores valores podem ser considerados como dispersos, calcular a relação entre as diferenças quadráticas (G):

Page 31: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 31

20

2,1

,1 S

SG pp

pp−

− =

onde:

∑=

−=p

ii ggS

1

220 )( - é a diferença quadrática no conjunto com todos os valores

∑−

=−− −=

2

1

2,1

2,1 )(

p

ippipp ggS - é a diferença quadrática no conjunto sem os dois

maiores valores

∑−

=− −

=2

1,1 )2(

p

i

ipp p

gg - é a média do conjunto, sem os dois maiores valores

Alternativamente, para os dois menores valores

20

22,1

2,1S

SG =

∑=

−=p

ii ggS

1

220 )( - é a diferença quadrática no conjunto com todos os valores

∑=

−=p

ii ggS

3

22,1

22,1 )( - é a diferença quadrática no conjunto, sem os dois menores

valores

∑= −

=p

i

i

p

gg

32,1 )2(

- é a média do conjunto, sem os dois menores valores

Se Gc > Gt 5 % → Valor aceito Se Gt 1 % < Gc < Gt 5 % → Valor suspeito Se Gc < Gt 1 % → Valor disperso Exemplo Verificar se há dados dispersos no conjunto de dados abaixo:

Laboratório n x 1 3 0,708 2 3 0,680 3 3 0,667 4 3 0,660 5 3 0,690 6 3 0,733 7 3 0,703 8 3 0,677

Ordenando dados de forma crescente: g(1) g(2) g(3) g(4) g(5) g(6) g(p-1) g(p) 0,660 0,667 0,677 0,680 0,690 0,703 0,708 0,733

Page 32: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 32

Verificar dados tabelados para os níveis de significância dados. Valores tabelados Gt 1% ou Gt 5%. Para 8 laboratórios, testando um valor, temos: Gt 5% = 2,126 e Gt 1% = 2,274. Selecionar o menor e o maior valor. Verificar se 0,660 é disperso. Verificar se 0,733 é disperso. Calcular a média e o desvio padrão do conjunto de dados

68975,0==∑ p

gg i

024022,01

)(1

2

=−

−=∑

=

p

ggS

p

ii

Calcular a estatística. Para o menor valor:

238,10240,0

)660,068975,0(1 =−=G

Conclusão: como o valor calculado é menor do que os valores tabelados, tanto a 1 % como a 5 %, ele não é considerado nem disperso, nem suspeito, respectivamente. Para o maior valor:

800,10240,0

)68975,0733,0( =−=pG

Conclusão: como o valor calculado é menor do que os valores tabelados, tanto a 1 % como a 5 %, ele não é considerado nem disperso, nem suspeito, respectivamente. Obs. Tanto o menor valor como o maior valor foram aceitos, seguimos com o teste de Grubbs, agora com dois valores em cada extremidade. Para 8 laboratórios, testando um valor, temos: Gt 5% = 0,110 e Gt 1% = 0,056. Selecionar os dois menores valores e os dois maiores valores. Verificar se 0,660 e 0,667 são dispersos. Verificar se 0,708 e 0,733 são dispersos. Calcular a média do conjunto de dados, sem os dois menores valores a serem testados. Portanto, sem os dois menores valores teremos:

Page 33: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 33

6985,0)2(3

2,1 =−

=∑=

p

i

i

p

gg

Calcular a soma das diferenças quadráticas, dos dois conjuntos, ou seja, um conjunto com todos os valores e o outro conjunto sem os dois valores a serem testados. Conjunto com todos os valores

∑=

=−=p

ii ggS

1

220 00404,0)(

Laboratório ig )( ggi − 2)( ggi −

4 0,66 -0,02975 0,0008851 3 0,667 -0,02275 0,0005176 8 0,677 -0,01275 0,0001626 2 0,68 -0,00975 0,0000951 5 0,69 0,00025 0,0000001 7 0,703 0,01325 0,0001756 1 0,708 0,01825 0,0003331 6 0,733 0,04325 0,0018706 Σ 0,00404

conjunto sem os dois valores

∑=

=−=p

ii ggS

3

22,1

22,1 002178,0)(

Laboratório ig )( 2,1ggi − 2

2,1 )( ggi −

4 0,66 3 0,667 8 0,677 -0,0215 0,0004622 2 0,68 -0,0185 0,0003422 5 0,69 -0,0085 0,0000723 7 0,703 0,0045 0,0000202 1 0,708 0,0095 0,0000902 6 0,733 0,0345 0,0011903 Σ 0,002178

Calcular o valor de Grubbs

539,000404,0

00218,020

22,1

2,1 ===S

SG

Conclusão: como o valor calculado é maior do que os valores tabelados a 1 % e 5 %, os dois valores testados não são nem dispersos, nem suspeitos. Calcular a média do conjunto de dados, sem os dois valores maiores a serem testados.

Page 34: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 34

Portanto, sem os dois maiores valores teremos:

6795,0)2(

2

1,1 =

−=∑

=−

p

i

ipp p

gg

Calcular a soma das diferenças quadráticas, dos dois conjuntos, ou seja, um conjunto com todos os valores e o outro conjunto sem os dois valores a serem testados. Conjunto com todos os valores:

∑=

=−=p

ii ggS

1

220 00404,0)(

Conjunto sem os dois valores:

001206,0)(2

1

2,1

2,1 =−=∑

=−−

p

ippipp ggS

Laboratório ig )( ,1 ppi gg −− 2,1 )( ppi gg −−

4 0,66 -0,0195 0,0003802 3 0,667 -0,0125 0,0001562 8 0,677 -0,0025 0,0000062 2 0,68 0,0005 0,0000003 5 0,69 0,0105 0,0001102 7 0,703 0,0235 0,0005522 1 0,708 6 0,733 Σ 0,001206

Calcular o valor de Grubbs

299,000404,0

00121,020

2,1

,1 === −− S

SG pp

pp

Conclusão: Como o valor calculado é maior do que os valores tabelados a 1 % e 5 %, os dois valores testados não são nem dispersos, nem suspeitos. Testes de Hipótese O objetivo dos testes de hipótese é comparar um valor suposto de um parâmetro de população com um valor encontrado numa amostra aleatória. Ao contrário do que ocorria nos problemas de estimação, vamos agora supor que exista uma hipótese, a qual será considerada válida até prova em contrário, acerca de um dado parâmetro da população. Essa hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada.

Page 35: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 35

Representaremos por H0 a hipótese existente, a ser testada, a qual chamaremos de hipótese nula. Consideraremos H1 a hipótese alternativa e estaremos decidindo sobre a afirmação dada por H0 através de testes sobre a hipótese alternativa H1 .O teste irá levar à aceitação ou rejeição da hipótese H0 , o que corresponde respectivamente à negação ou afirmação de H1. Enfim, enunciaremos o resultado final sempre em termos da hipótese H0, ou seja, aceitar ou rejeitar H0. Os erros que estão os sujeitos a cometer são:

•••• Rejeitar uma hipótese quando deveria ser aceita (e rro tipo I)

•••• Aceitar uma hipótese quando deveria ser rejeitada (erro tipo II) O nível de significância do teste é a máxima probabilidade com que estaríamos incorrendo num risco de erro tipo I, geralmente denotada por α. Assim, sendo H0 verdadeira, aceitaremos H0 com probabilidade (1-α) e rejeitaremos H0 com probabilidade α (erro tipo I), e sendo H0 falsa, aceitaremos H0 com probabilidade β e rejeitaremos H0 com probabilidade (1-β) (erro tipo II). Os testes de hipóteses podem ser unilaterais e bilaterais, conhecidos também como monocaudais e bicaudais, respectivamente, ou seja, correspondendo ao nosso interesse em verificar se os desvios do valor real ao parâmetro estão unicamente para mais ou unicamente para menos, ou para mais e para menos, em relação ao valor testado. Procedimento para o teste de hipótese

•••• Definir o problema em estudo: - caracterizar os objetivos. - definir os parâmetros populacionais envolvidos.

•••• Formular as hipóteses que traduzam os objetivos: - H0 é sempre neutra. - H1 é sempre a negativa de H0 . - H0 e H1 são definidas pelos parâmetros populacionais envolvidos no problema.

•••• Definir o nível de significância (α ) do teste. •••• Definir o tamanho da amostra (n).

•••• Obter dados amostrais (informações) através da amostra considerada.

•••• Determinar a região crítica (região de rejeição de H0)

- a região crítica é definida pela H1 - pela distribuição de probabilidade envolvida e nível de significância (α) do teste - a região crítica é sempre limitada por um valor crítico.

•••• Tomar a decisão: - Rejeitar Ho se o valor de encontra na região crítica. - Não rejeitar Ho se o valor não se encontra na região crítica.

Page 36: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 36

Os testes de Hipótese básicos envolvem 1 ou 2 populações e podem ser testes de média ou variância. Testes para 1 amostra

•••• Caso 1. Para µ com σσσσ conhecido: Hipóteses Rejeita-se H0 se: H0: µ = µ0 H1: µ < µ0

zc < -zt(α) H0: µ = µ0 H1: µ > µ0

zc > zt(α)

H0: µ = µ0 H1: µ ≠ µ0

|zc| > zt(α/2)

Exemplo A distribuição dos valores obtidos para a determinação de P numa produção de fertilizante fosfatado segue uma distribuição normal. No laboratório químico, o técnico analisou 4 amostras da produção do dia, e o resultado forneceu média de 5 % de P. Sabendo que o desvio padrão do processo de fabricação é de 0,2 %, podemos dizer, ao nível de 5 % de significância, que o valor médio de P produzido é menor que 5,2 % ? H0: µ = 5,2 %

H1: µ < 5,2 %

O problema é testar se zc < - zt; se houver confirmação, rejeita-se a hipótese nula.

2

4

2,02,55 −=−=cz

zt = z0,05 = 1,645 Conclusão: Como zc < -zt, rejeita-se a hipótese nula H0. Portanto, podemos afirmar que ao nível de 5% de significância, o valor médio de P, naquele dia, é menor que 5,2 %.

•••• Caso 2. Para µ com σσσσ desconhecido: Hipóteses Rejeita-se H0 se: H0: µ = µ0 H1: µ < µ0

tc < -tt(n-1,α) H0: µ = µ0 tc > t t(n-1,α)

Page 37: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 37

H1: µ > µ0 H0: µ = µ0 H1: µ ≠ µ0

|tc| > t t(n-1,α/2)

Exemplo A determinação de Ti em uma amostra de mineral forneceu os seguintes resultados: 3,22 3,45 3,33 3,40 3,60 Considerando que o valor acordado é de 3,50 , posso concluir com 1 % de significância que o material apresenta teor de Ti adequado? H0: µ = 3,5 H1: µ ≠ 3,5 x = 3,4 S = 0,14 tt = t4;0,005 = 4,604

n

Sx

tc

µ−=

6,1

5

14,05,34,3 −=−=ct

Conclusão: Como |tc| < tt, aceita-se H0. O teor de Ti é igual ao especificado ao nível de 1 % de significância. Testes para 2 amostras A teoria dos testes de hipóteses aplica-se a casos em que temos duas amostras, em princípio, provenientes de populações diferentes. Comparam-se parâmetros equivalentes das populações envolvidas, testando hipóteses referentes ao valor real da diferença entre as duas médias populacionais.

•••• Caso 1. Dados emparelhados A situação é caracterizada quando os dados de duas amostras estão relacionados dois a dois segundo, algum critério pré-estabelecido. Como exemplo, podemos citar a comparação de resultados analíticos obtidos com dois métodos analíticos diferentes na determinação de um elemento.

Page 38: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 38

Se os dados das duas amostras estão emparelhados, tem sentido calcularmos as diferenças d correspondentes a cada par de valores, resumindo-se os dados a uma única amostra de n diferenças. Por outro lado, testar a hipótese de que a diferença entre as médias de duas populações emparelhadas seja igual a um certo valor µd equivale a testar a hipótese de que a média de todas as diferenças (referentes às populações) seja igual a µd. Ou seja, vamos testar simplesmente a hipótese, H0: µd = 0 (caso bilateral) H1: µd ≠ 0 ou H0: µd = 0 (caso unilateral) H1: µd > 0 ou H0: µd = 0 (caso unilateral) H1: µd < 0 Através da comparação do t de Student experimental com o valor crítico obtido em função do nível de significância (α) estabelecido para o teste com n-1 graus de liberdade. A estatística t é calculada conforme equação:

n

S

ddt

d

0−=

d é a média da amostra das diferenças;

0d é o valor testado da média das diferenças nas populações, em geral, igual a 0; Sd é o desvio padrão das diferenças; A decisão de aceitar ou rejeitar a hipótese nula H0 segue o critério estabelecido, ao nível de α % de significância e n-1 graus de liberdade: Hipóteses Rejeita-se H0 se: H0: µd = 0 H1: µd < 0 tc < -tt(n-1,α) H0: µd = 0 H1: µd > 0

tc > t t(n-1,α)

H0: µd = 0 H1: µd ≠ 0 |tc| > t t(n-1,α/2)

Exemplo

Page 39: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 39

Deseja-se comparar se as médias obtidas para 5 amostras, utilizando 2 diferentes métodos analíticos para determinação de Sn podem ser consideradas iguais, ao nível de 5 % de significância? Os resultados analíticos são:

Método A Método B A - B (d) 33,0 33,0 0 50,4 50,0 0,4 11,9 11,3 0,6 1,24 1,36 -0,12 1,69 1,75 -0,06 d = 0,164 Sd = 0,3176

o teste de hipótese pode ser resumido desta forma: H0 : as médias são iguais (µd = 0) H1 : as médias não são iguais (µd ≠ 0) Para resolver este problema, devemos calcular a estatística t e compará-la com o valor tabelado a 5 % de significância.

155,1

5

3176,0164,0 ==ct

tt = tn-1;α/2 = t 4; 0,025 = 2,776 Conclusão: Como tc < tt, aceita-se H0. Podemos afirmar que não existe diferença significativa entre os dois métodos empregados.

•••• Caso 2. Dados não emparelhados O caso de dados não emparelhados será subdividido em 3 situações:

•••• quando os desvios padrão das populações são conhecidos;

•••• quando os desvios padrão das populações são desconhecidos mas supostos iguais;

•••• quando os desvios padrão das populações são desconhecidos e não

podem ser supostos iguais. Dados não emparelhados com desvios padrão das popul ações conhecidas: Com σ1 e σ2 das populações conhecidas, utilizamo-nos de

Page 40: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 40

2

22

1

21

21

nn

xxzc

σσ +

−=

A decisão do teste será conforme o critério indicado a seguir: Hipóteses Rejeita-se H0 se: H0: µ1 - µ2 = 0 H1: µ1 - µ2 < 0 zc < -zt(α) H0: µ1 - µ2 = 0 H1: µ1 - µ2 > 0

zc > zt(α)

H0: µ1 - µ2 = 0 H1: µ1 - µ2 ≠ 0

|zc| > zt(α/2)

Exemplo O controle do teor de impurezas de Cd em soluções extratoras na fabricação de um produto tem revelado que os resultados seguem uma distribuição normal com desvio padrão de 0,05 mg/L. Em dois turnos consecutivos de trabalho foram recolhidas amostras de 10 e 15 peças, respectivamente, com teores médios de 0,40 mg/L e 0,45 mg/L de Cd. Qual a conclusão, ao nível de 5 % e 1 % de significância, de que o processo de fabricação de ficou fora de controle? H0 : µ1 – µ2 = 0 H1 : µ1 – µ2 ≠ 0 σ1 = σ2

448,2000417,0

05,0

15

05,0

10

05,0

45,040,022

=−=

+

−=cz

z0,025 = 1,960 z0,005 = 2,578 Conclusão: ao nível de 5 %, pode-se afirmar que o processo ficou fora de controle; porém, ao nível de 1 % , aceita-se a hipótese nula. Dados não emparelhados com desvios padrão das popul ações desconhecidos, mas supostos iguais: Para este caso, aplica-se a seguinte expressão:

Page 41: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 41

21

21

11nn

S

xxt

p

c

+

−=

onde o estimador combinado Sp (pooled stimator) é definido por:

2

)1()1(

21

22

21

−+−+−=

nn

SnSnSp

A decisão do teste será conforme o critério indicado abaixo: Hipóteses Rejeita-se H0 se: H0: µ1 - µ2 = 0 H1: µ1 - µ2 < 0 tc < -tt(n1+n2.α) H0: µ1 - µ2 = 0 H1: µ1 - µ2 > 0

tc > tt(n1+n2,α)

H0: µ1 - µ2 = 0 H1: µ1 - µ2 ≠ 0

|tc| > tt(n1+n2, α/2)

Exemplo Dois fornecedores de reagentes químicos para a determinação de P pelo método colorimétrico foram testados por nosso laboratório. Foram analisadas 7 amostras de 2 lotes diferentes. Ao nível de 5 % de significância, pode-se afirmar que os resultados obtidos com os reagentes químicos do fornecedor A são mais baixos que os obtidos com reagentes do fornecedor B? Não se conhecem os parâmetros desta distribuição.

Fornecedor A Fornecedor B 0,0149 0,0158 0,0160 0,0158 0,0156 0,0155 0,0170 0,0170 0,0150 0,0160 0,0250 0,0240 0,0147 0,0153 x = 0,016886 x = 0,017057 S = 0,003664 S = 0,003109

H0 : µ1 – µ2 = 0 H1 : µ1 – µ2 < 0

Page 42: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 42

0033979,0277

003109,0)17(003664,0)17( 22

=−+

−+−=pS

09415,0

7

1

7

10033979,0

017057,0016886,0 −=+

−=ct

tn1+n2-2;α = t12;0,05 = 1,782 tc > - tt Conclusão: Aceita-se a hipótese nula, ou seja, posso aceitar que os resultados obtidos com os reagentes de ambos os fornecedores são iguais ao nível de 5 % de significância. Dados não emparelhados com desvios padrão das popul ações desconhecidos e nem supostos iguais: Hipóteses Rejeita-se H0 se: H0: µ1 - µ2 = 0 H1: µ1 - µ2 < 0 tc < -tt(ν,α) H0: µ1 - µ2 = 0 H1: µ1 - µ2 > 0

tc > tt(ν,α)

H0: µ1 - µ2 = 0 H1: µ1 - µ2 ≠ 0

|tc| > tt(ν,α/2)

Os valores críticos de t para ν graus de liberdade são obtidos da tabela, cujo cálculo é dado por:

2

22

1

21

21

n

S

n

S

xxtc

+

−=

2

11 2

2

2

22

1

2

1

21

2

2

22

1

21

+

++

+

=

n

n

S

n

n

S

n

S

n

S

ν

Page 43: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 43

Exemplo Deseja-se verificar se o nível de Pb em efluente industrial de determinada unidade de tratamento é diferente no inverno e no verão. Testar a nível de 10% de significância para: a) Concentrações iguais em ambas estações; b) Concentração maior no verão;

Verão Inverno 13,01 12,99 13,00 13,06 12,95 12,98 12,97 13,14 13,01 13,14 12,93 12,94 12,96 12,97 12,94 x = 12,968 x = 13,062 S = 0,02974 S = 0,0776 n = 10 n = 5

Questão a H0 : µ1 – µ2 = 0 H1 : µ1 – µ2 ≠ 0

613,2

5

0776,0

10

02974,0

062,13968,1222

−=+

−=ct

59,42

15

5

0776,0

110

10

02974,0

5

0776,0

10

02974,0

2222

222

≈=−

+

++

+

t 5;0,05 = 2,571 Conclusão: como |tc| > tt, rejeita-se H0 e não podemos afirmar que os níveis de Pb em estações diferentes são iguais. Questão b Resposta: tt = 1,638 . Aceita-se H0.

Page 44: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 44

•••• Caso 3. Comparação de variâncias

Duas variâncias populacionais podem ser comparadas estatisticamente. Para tal, a relação entre as duas variâncias deve ser comparada por meio da distribuição F. Assim como a distribuição 2χ , a distribuição F é assimétrica e depende do número de graus de liberdade entre o numerador e o denominador.

O cálculo da estatística F é dado por:

22

21

2,1 S

SF =νν

sendo que 22

21 SS >

Os critérios para aceitação ou rejeição da hipótese nula seguem abaixo, utilizando as tabelas de F-Snedecor, com n1-1 e n2-1 graus de liberdade. (Apêndice): Hipóteses Rejeita-se H0 se: H0: σ1=σ2 H1: σ1 <σ2

Fc < Fn1-1,n2-1(1-α) H0: σ1 =σ2 H1: σ1 >σ2

Fc > Fn1-1,n2-1(α)

H0: σ1=σ2 H1: σ1 ≠ σ2

Fc > Fn1-1,n2-1(α/2)

Exemplo

Page 45: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 45

De duas populações de distribuições normais foram extraídas amostras de 5 e 10 elementos que forneceram variâncias iguais a 3,5 e 8 respectivamente, Ao nível de 1 % de significância podemos concluir que as populações têm diferentes graus de dispersão? H0: σ1 =σ2

H1: σ1 ≠ σ2

286,25,3

8 ==cF

Ft = F 9;4;0,005 = 21,14 Conclusão: Como Fc < Ft, não rejeitamos a hipótese nula e podemos dizer que as populações não têm diferentes graus de dispersão. Regressão Linear e Coeficiente de Correlação É comum avaliar a relação entre duas medidas quantitativas. Em laboratório, por exemplo, utilizamos em curvas de calibração, avaliação de dependência de variáveis, relação entre medidas do processo, etc. Vamos trabalhar com um exemplo prático: temperatura de uma reação e o rendimento obtido. Temperatura (o.C) 450 454 460 466 471 475 480 487 493 500

Rendimento (%) 65 66 69 71 72 74 75 77 78 80 Podemos utilizar este avaliação para verificar se os valores estão associados, para predizer o valor de uma variável a partir de um valor conhecido da outra ou para descrever a relação entre variáveis. Para definirmos a equação da reta, consideramos:

∑∑

−−−

=2)(

))((

xx

yyxxa xayb −=

A associação linear entre duas variáveis é avaliada usando correlação. Para predizer o valor de uma variável contínua a partir de uma outra variável e para descrever a relação entre duas variáveis utiliza-se regressão. Para obter uma medida do grau de associação da relação linear entre duas variáveis, usamos o coeficiente de correlação, definido por:

∑ ∑∑

−−

−−=

22 )()(

))((

yyxx

yyxxr

Page 46: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 46

O valor de r está sempre entre -1 e +1, com r = 0 correspondendo à não associação. Usamos o termo correlação positiva quando r > 0, e nesse caso à medida que x cresce também cresce y, e correlação negativa quando r < 0, e nesse caso à medida que x cresce, y decresce. Quanto maior o valor de r (positivo ou negativo), mais forte a associação. No extremo, se r = 1 ou r = -1 então todos os pontos no gráfico de dispersão caem exatamente numa linha reta. No outro extremo, se r = 0, não existe nenhuma associação linear. O quadro a seguir fornece uma referência de como podemos descrever uma correlação em palavras, dado o valor numérico. As interpretações dependem de cada contexto em particular.

Valor de r Interpretação 0,00 a 0,19 correlação muito fraca 0,20 a 0,39 correlação fraca 0,40 a 0,69 correlação moderada 0,70 a 0,89 correlação forte 0,90 a 1,00 correlação muito forte

Somente relações lineares são detectadas pelo coeficiente de correlação que acabamos de descrever (também chamado Coeficiente de Correlação de Pearson). O quadrado do coeficiente de correlação de Pearson é chamado de coeficiente de determinação ou simplesmente R2. É uma medida da proporção da variabilidade em uma variável que é explicada pela variabilidade da outra. É pouco comum que tenhamos uma correlação perfeita (R2 = 1) na prática, porque existem muitos fatores que determinam as relações entre variáveis na vida real. Exemplo a) construir um gráfico dos valores acima b) definir a equação da reta c) calcular o valor do coeficiente de correlação de Pearson d) calcular R2 e) avaliar a correlação f) qual será o rendimento esperado se ajustarmos o valor da temperatura para 520 °C? a)

Page 47: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 47

Exemplo - Correlação

60

65

70

75

80

85

440 450 460 470 480 490 500 510

temperatura

rend

imen

to

iX X XX i − iY Y YYi − )( XX i − )( YYi − 2)( XX i − 2)( YYi −

450 473,6 -23,6 65 72,7 -7,7 181,7 557,0 59,29 454 473,6 -19,6 66 72,7 -6,7 131,3 384,2 44,89 460 473,6 -13,6 69 72,7 -3,7 50,3 185,0 13,69 466 473,6 -7,6 71 72,7 -1,7 12,9 57,8 2,89 471 473,6 -2,6 72 72,7 -0,7 1,8 6,8 0,49 475 473,6 1,4 74 72,7 1,3 1,8 2,0 1,69 480 473,6 6,4 75 72,7 2,3 14,7 41,0 5,29 487 473,6 13,4 77 72,7 4,3 57,6 179,6 18,49 493 473,6 19,4 78 72,7 5,3 102,8 376,4 28,09 500 473,6 26,4 80 72,7 7,3 192,7 697,0 53,29

SOMA 747,8 2486,4 228,1

b) y = 0,30 x – 69,4 c) R = 0,9929 d) R2 = 0,986 e) Correlação muito forte f) 86,3%

Exercício: Idem para os dados abaixo (no item (f), considerar: para um teor máximo de 0,28% massa de enxofre, qual deve ser a temperatura ajustada?): Temperatura (oC) 360,2 361,1 362,4 363,5 364,9 366,1 369,2 Teor de enxofre (% massa)

0,18 0,21 0,22 0,24 0,25 0,27 0,30

Page 48: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 48

Tabela 1. Função de Distribuição Normal Reduzida

Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 0,00000 0,00400 0,00800 0,01200 0,01600 0,01990 0,02390 0,02790 0,03190 0,03590

0,1 0,03980 0,04380 0,04780 0,05170 0,05570 0,05960 0,06360 0,06750 0,07140 0,07530

0,2 0,07930 0,08320 0,08710 0,09100 0,09480 0,09870 0,10260 0,10640 0,11030 0,11410

0,3 0,11790 0,12170 0,12550 0,12930 0,13310 0,13680 0,14060 0,14430 0,14800 0,15170

0,4 0,15540 0,15910 0,16280 0,16640 0,17000 0,17360 0,17720 0,18080 0,18440 0,18790

0,5 0,19150 0,19500 0,19850 0,20190 0,20540 0,20880 0,21230 0,21570 0,21900 0,22240

0,6 0,22570 0,22910 0,23240 0,23570 0,23890 0,24220 0,24540 0,24860 0,25170 0,25490

0,7 0,25800 0,26110 0,26420 0,26730 0,27040 0,27340 0,27640 0,27940 0,28230 0,28520

0,8 0,28810 0,29100 0,29390 0,29670 0,29950 0,30230 0,30510 0,30780 0,31060 0,31330

0,9 0,31590 0,31860 0,32120 0,32380 0,32640 0,32890 0,33150 0,33400 0,33650 0,33890

1 0,34130 0,34380 0,34610 0,34850 0,35080 0,35310 0,35540 0,35770 0,35990 0,36210

1,1 0,36430 0,36650 0,36860 0,37080 0,37290 0,37490 0,37700 0,37900 0,38100 0,38300

1,2 0,38490 0,38690 0,38880 0,39070 0,39250 0,39440 0,39620 0,39800 0,39970 0,40150

1,3 0,40320 0,40490 0,40660 0,40820 0,40990 0,41150 0,41310 0,41470 0,41620 0,41770

1,4 0,41920 0,42070 0,42220 0,42360 0,42510 0,42650 0,42790 0,42920 0,43060 0,43190

1,5 0,43320 0,43450 0,43570 0,43700 0,43820 0,43940 0,44060 0,44180 0,44290 0,44410

1,6 0,44520 0,44630 0,44740 0,44840 0,44950 0,45050 0,45150 0,45250 0,45350 0,45450

1,7 0,45540 0,45640 0,45730 0,45820 0,45910 0,45990 0,46080 0,46160 0,46250 0,46330

1,8 0,46410 0,46490 0,46560 0,46640 0,46710 0,46780 0,46860 0,46930 0,46990 0,47060

1,9 0,47130 0,47190 0,47260 0,47320 0,47380 0,47440 0,47500 0,47560 0,47610 0,47670

2 0,47720 0,47780 0,47830 0,47880 0,47930 0,47980 0,48030 0,48080 0,48120 0,48170

2,1 0,48210 0,48260 0,48300 0,48340 0,48380 0,48420 0,48460 0,48500 0,48540 0,48570

2,2 0,48610 0,48640 0,48680 0,48710 0,48750 0,48780 0,48810 0,48840 0,48870 0,48900

2,3 0,48930 0,48960 0,48980 0,49010 0,49040 0,49060 0,49090 0,49110 0,49130 0,49160

2,4 0,49180 0,49200 0,49220 0,49250 0,49270 0,49290 0,49310 0,49320 0,49340 0,49360

2,5 0,49380 0,49400 0,49410 0,49430 0,49450 0,49460 0,49480 0,49490 0,49510 0,49520

2,6 0,49530 0,49550 0,49560 0,49570 0,49590 0,49600 0,49610 0,49620 0,49630 0,49640

2,7 0,49650 0,49660 0,49670 0,49680 0,49690 0,49700 0,49710 0,49720 0,49730 0,49740

2,8 0,49740 0,49750 0,49760 0,49770 0,49770 0,49780 0,49790 0,49790 0,49800 0,49810

2,9 0,49810 0,49820 0,49820 0,49830 0,49840 0,49840 0,49850 0,49850 0,49860 0,49860

3 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49897 0,49900

3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929

3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950

3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965

3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976

3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49982 0,49982 0,49983 0,49984

3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989

3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49993

3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995

3,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997

4 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998

Page 49: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 49

Tabela 2. Função de Distribuição (t) de Student

Área de Probabilidade (p) νννν 0,2 0,4 0,6 0,8 0,90 0,95 0,98 0,99 0,998 0,999

1 0,325 0,727 1,376 3,078 6,314 12,706 31,821 63,656 318,289 636,578

2 0,289 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,328 31,600

3 0,277 0,584 0,978 1,638 2,353 3,182 4,541 5,841 10,214 12,924

4 0,271 0,569 0,941 1,533 2,132 2,776 3,747 4,604 7,173 8,610

5 0,267 0,559 0,920 1,476 2,015 2,571 3,365 4,032 5,894 6,869

6 0,265 0,553 0,906 1,440 1,943 2,447 3,143 3,707 5,208 5,959

7 0,263 0,549 0,896 1,415 1,895 2,365 2,998 3,499 4,785 5,408

8 0,262 0,546 0,889 1,397 1,860 2,306 2,896 3,355 4,501 5,041

9 0,261 0,543 0,883 1,383 1,833 2,262 2,821 3,250 4,297 4,781

10 0,260 0,542 0,879 1,372 1,812 2,228 2,764 3,169 4,144 4,587

11 0,260 0,540 0,876 1,363 1,796 2,201 2,718 3,106 4,025 4,437

12 0,259 0,539 0,873 1,356 1,782 2,179 2,681 3,055 3,930 4,318

13 0,259 0,538 0,870 1,350 1,771 2,160 2,650 3,012 3,852 4,221

14 0,258 0,537 0,868 1,345 1,761 2,145 2,624 2,977 3,787 4,140

15 0,258 0,536 0,866 1,341 1,753 2,131 2,602 2,947 3,733 4,073

16 0,258 0,535 0,865 1,337 1,746 2,120 2,583 2,921 3,686 4,015

17 0,257 0,534 0,863 1,333 1,740 2,110 2,567 2,898 3,646 3,965

18 0,257 0,534 0,862 1,330 1,734 2,101 2,552 2,878 3,610 3,922

19 0,257 0,533 0,861 1,328 1,729 2,093 2,539 2,861 3,579 3,883

20 0,257 0,533 0,860 1,325 1,725 2,086 2,528 2,845 3,552 3,850

21 0,257 0,532 0,859 1,323 1,721 2,080 2,518 2,831 3,527 3,819

22 0,256 0,532 0,858 1,321 1,717 2,074 2,508 2,819 3,505 3,792

23 0,256 0,532 0,858 1,319 1,714 2,069 2,500 2,807 3,485 3,768

24 0,256 0,531 0,857 1,318 1,711 2,064 2,492 2,797 3,467 3,745

25 0,256 0,531 0,856 1,316 1,708 2,060 2,485 2,787 3,450 3,725

26 0,256 0,531 0,856 1,315 1,706 2,056 2,479 2,779 3,435 3,707

27 0,256 0,531 0,855 1,314 1,703 2,052 2,473 2,771 3,421 3,689

28 0,256 0,530 0,855 1,313 1,701 2,048 2,467 2,763 3,408 3,674

29 0,256 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,660

30 0,256 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646

40 0,255 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551

50 0,255 0,528 0,849 1,299 1,676 2,009 2,403 2,678 3,261 3,496

60 0,254 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460

70 0,254 0,527 0,847 1,294 1,667 1,994 2,381 2,648 3,211 3,435

80 0,254 0,526 0,846 1,292 1,664 1,990 2,374 2,639 3,195 3,416

90 0,254 0,526 0,846 1,291 1,662 1,987 2,368 2,632 3,183 3,402

100 0,254 0,526 0,845 1,290 1,660 1,984 2,364 2,626 3,174 3,390

120 0,254 0,526 0,845 1,289 1,658 1,980 2,358 2,617 3,160 3,373

150 0,254 0,526 0,844 1,287 1,655 1,976 2,351 2,609 3,145 3,357

∞∞∞∞ 0,253 0,524 0,842 1,282 1,645 1,960 2,327 2,576 3,091 3,291

Page 50: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 50

Tabela 3. Valores críticos para o teste de Cochran n=2 n=3 n=4 n=5 p 1% 5% 1% 5% 1% 5% 1% 5% 2 - - 0,995 0,975 0,979 0,939 0,959 0,906

3 0,993 0,967 0,942 0,871 0,883 0,798 0,834 0,746

4 0,968 0,906 0,864 0,768 0,781 0,684 0,721 0,629

5 0,928 0,841 0,768 0,684 0,696 0,598 0,633 0,544

6 0,683 0,781 0,722 0,616 0,626 0,532 0,584 0,000

7 0,838 0,727 0,684 0,561 0,568 0,048 0,508 0,431

8 0,794 0,068 0,615 0,516 0,521 0,438 0,463 0,391

9 0,754 0,638 0,573 0,478 0,481 0,403 0,425 0,358

10 0,718 0,602 0,538 0,445 0,447 0,373 0,393 0,331

11 0,684 0,570 0,504 0,417 0,418 0,348 0,386 0,308

12 0,653 0,541 0,475 0,392 0,392 0,326 0,343 0,288

13 0,624 0,515 0,450 0,371 0,389 0,307 0,322 0,271

14 0,599 0,492 0,427 0,352 0,349 0,291 0,304 0,255

15 0,575 0,471 0,407 0,335 0,332 0,276 0,288 0,242

16 0,553 0,452 0,388 0,319 0,316 0,262 0,274 0,230

17 0,532 0,434 0,372 0,305 0,301 0,250 0,261 0,219

18 0,514 0,418 0,356 0,293 0,288 0,240 0,249 0,209

19 0,496 0,403 0,343 0,281 0,276 0,230 0,238 0,200

20 0,480 0,389 0,330 0,270 0,265 0,220 0,229 0,192

21 0,465 0,377 0,318 0,261 0,255 0,212 0,220 0,185

22 0,045 0,385 0,307 0,252 0,246 0,204 0,212 0,178

23 0,437 0,354 0,297 0,243 0,238 0,197 0,204 0,172

24 0,425 0,343 0,287 0,235 0,230 0,191 0,197 0,166

25 0,413 0,334 0,278 0,228 0,222 0,185 0,190 0,160

26 0,402 0,325 0,270 0,221 0,215 0,179 0,184 0,155

27 0,391 0,316 0,262 0,215 0,209 0,173 0,179 0,150

28 0,382 0,308 0,255 0,209 0,202 0,168 0,173 0,146

29 0,372 0,300 0,248 0,203 0,196 0,164 0,168 0,142

30 0,363 0,293 0,241 0,198 0,191 0,259 0,164 0,138

Page 51: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 51

Valores críticos Tabela de valores críticos para o teste de Dixon H 5% 1%

3 0,970 0,994 4 0,829 0,926 5 0,710 0,821 6 0,628 0,740

Q = (z(2) – z(1)) / (z(H) – z(1)) ou Q = (z(H) – z(H -1)) / (z(H) – z(1)) 7 0,569 0,680

8 0,608 0,717 9 0,564 0,672

10 0,530 0,635 11 0,502 0,605

Q = (z(2) – z(1)) / (z(H - 1) – z(1)) ou Q = (z(H) – z(H - 1)) / (z(H) – z(2)) 12 0,479 0,579

13 0,611 0,697 14 0,586 0,670 15 0,565 0,647 16 0,546 0,627 17 0,529 0,610 18 0,514 0,594 19 0,501 0,580 20 0,489 0,567 21 0,478 0,555 22 0,468 0,544 23 0,459 0,535 24 0,451 0,526 25 0,443 0,517 26 0,436 0,510 27 0,429 0,502 28 0,423 0,495 29 0,417 0,489 30 0,412 0,483 31 0,407 0,477 32 0,402 0,472 33 0,397 0,467 34 0,393 0,462 35 0,388 0,458 36 0,384 0,454 37 0,381 0,450 38 0,377 0,446 39 0,374 0,442

Q = (z(3) – z(1)) / (z(H - 2) – z(1)) ou Q = (z(H) – z(H – 2)) / ((z(H) – z(3))

40 0,371 0,438

Page 52: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 52

Exercícios

1. Arredonde cada um dos números abaixo, conforme a precisão solicitada:

a) 48,6 para a unidade mais próxima b) 136,5 para a unidade mais próxima c) 2,484 para o centésimo mais próximo d) 0,0435 para o milésimo mais próximo e) 4,50001 para a unidade mais próxima f) 143,95 para o décimo mais próximo g) 24 448 para o milhar mais próximo h) 5,56500 para o centésimo mais próximo i) 5,56501 para o centésimo mais próximo

2. Expresse cada um dos seguintes números utilizando notação científica (para fins didáticos, considere que

os zeros à direita são não significativos):

a) 48 230 000 b) 0,0000084 c) 0,000380 d) 186 000 e) 30 000 000 000 f) 0,000000700

3. Quantos algarismos significativos há em cada um dos seguintes números?

a) 149,8 cm b) 149,80 cm c) 0,028 m d) 0,00280 mm e) 1,00280 cm f) 9 g g) 9 analistas de laboratório h) 4,0 libras i) 7,584 000 kg j) 1 080 estudantes k) 0,0243 cm l) 1832,70 L m) 0,00030 g n) 0,0012300 g o) 1,0001 L p) 1,2340 m q) 2573 km r) 27800 kPa s) 100 °C

4. Resolva as equações abaixo (os números são resultados de medições):

a) 0,0002 x 1,3328 b) 3,213 / 0,2 c) 108,3 x 2,12 d) 108,3 / 2,12 e) 2,891 x 0,1 f) 3,213 / 0,2 (considere que o 0,2 é exato, ou seja, dado discreto) g) 108,3 x 2,12 (considere que o 2,12 é exato, ou seja, dado discreto) h) 108 x 0,1 (considere que o 0,1 é exato, ou seja, dado discreto) i) 123 000 000 + 27 820 000 + 1 769 853 741 j) 5,00 + 11,234 + 0,1067 k) 23,1 – 22,235

Page 53: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 53

5. A determinação da viscosidade cinemática é obtida multiplicando-se o tempo de escoamento pelo fator do tubo viscosimétrico. Um certo procedimento determina que seja usado um cronômetro para medição do tempo com precisão mínima de 0,1 s e que o tempo nunca deve ser inferior a 200 s, nem superior a 800 s. Mais adiante, neste mesmo procedimento, há uma orientação para que o resultado seja sempre expresso com quatro algarismos significativos. Por que quatro algarismos significativos?

6. Calcule os seguintes resultados de viscosidade (se houver dúvida na expressão do resultado, utilizar notação científica):

Fator do tubo Tempo Resultado da Viscosidade 30,71 340,1 9,985 239,0 0,02052 232,1 0,3040 672,3 2,997 382,5 0,9915 618,3 30,00 520,0

7. Três amostras foram enviadas ao laboratório para análise. O técnico realizou 5 determinações em cada uma delas, e encontrou os seguintes resultados :

A : 6,1 6,3 6,2 6,5 5,9 B: 36,5 37,3 36,9 38,4 35,4 C: 241,5 244,7 237,5 252,9 242,9 a) Calcule a média, a amplitude, o desvio-padrão e o coeficiente de variação para cada amostra; b) Comente o uso do desvio-padrão, amplitude e coeficiente de variação como unidade de precisão de um

método analítico. 8. Calcule a amplitude, a variância, o desvio-padrão e o coeficiente de variação em cada caso: a) 12 6 7 3 15 10 18 5 b) 9 3 8 8 9 8 9 18 c) 75 75 76 77 76 75 76 77 75 76 75 9. Uma amostra artificial, padronizada, de soro de sangue humano contém 50,0 gramas de albumina por litro.

Cinco laboratórios (A-E), realizaram seis determinações da concentração de albumina, com os seguintes resultados:

A 50,5 49,6 50,1 49,9 49,1 50,2 B 47,8 51,6 50,1 48,1 51,9 49,9 C 51,5 50,8 51,8 51,1 50,7 51,3 D 43,0 51,0 45,1 48,5 45,8 49,2 E 50,2 49,6 50,0 49,8 50,6 47,0 Comente sobre a precisão e exatidão de cada laboratório.

Page 54: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 54

10. Em um determinado processo foram observadas as seguintes medidas de temperatura, com um termômetro:

Data ºC Data ºC Data ºC Data ºC Data ºC 1/11 22 1/12 35 31/12 26 30/1 0 1/3 43 4/11 46 4/12 2 3/1 42 2/2 12 4/3 33 7/11 9 7/12 15 6/1 60 5/2 62 7/3 70 10/11 40 10/12 41 9/1 56 8/2 50 10/3 50

13/11 57 13/12 34 12/1 30 11/2 45 13/3 47 16/11 22 16/12 52 15/1 3 14/2 41 16/3 20 19/11 22 19/12 32 18/1 17 17/2 59 19/3 36 22/11 13 22/12 75 21/1 79 20/2 11 22/3 40 25/11 50 25/12 69 24/1 45 23/2 66 25/3 67 28/11 42 28/12 44 27/1 37 26/2 39 28/3 29

Determine:

a) % de observações ≥ 70 ºC. b) número de observações ≥ 70 ºC. c) número de observações < 60 ºC e ≥ 20 ºC. d) % de observações < 40 ºC.

11. Construa o histograma referente ao exercício anterior. 12. A média obtida pelo laboratório para o teor de Fe em uma amostra de minério é de 12,5 % e o desvio

padrão 1,2%. A especificação do cliente é de 12,6 ± 1,5 %. a) Qual a probabilidade dos resultados obtidos encontrarem-se dentro desta especificação? b) Qual a probabilidade de encontrar valores maiores que 11,1 %.

13. Para X : N (20,4), ou seja, dada uma distribuição com µ = 20 e σ 2= 4, encontrar os valores reduzidos

correspondentes a: x1 = 14 x2 = 16 x3 = 18 x4 = 20

x5 = 22 x6 = 24 x7 = 26 14. Seja X : N (100,25), calcule: a) P (100 ≤ x ≤ 106) b) P (89 ≤ x ≤ 107) c) P (112 ≤ x ≤ 116) d) P (x ≥ 108) e) P (x ≥ 95) 15. Os resultados das análises de óleo em água das amostras de um efluente final apresentam valores de

média 1,60 ppm e desvio-padrão 0,30 ppm. Supondo que os resultados estejam normalmente distribuídos, encontre a probabilidade de uma amostra de efluente final se apresentar: a) Entre de 1,50 e 1,80 ppm. b) Mais de 1,75 ppm. c) Menos de 1,48 ppm. d) Qual deve ser valor mínimo para escolhermos os 10 % dos resultados que apresentaram valores mais

altos. 16. O teste da concentração de K no sangue não é totalmente preciso. Além disso, a concentração pode variar

significativamente de um dia para outro. Suponha que medidas repetidas tomadas em dias diferentes do mesmo paciente variem normalmente, com σ = 0,2. a) 1 amostra retirada de um determinado paciente apresentou resultado x = 3,4. Dê o intervalo com 90 %

de confiança para seu nível médio de K; b) Suponha agora que 3 amostras fossem tomadas e fornecessem média x =3,4. Qual seria agora o

intervalo com 90 % de confiança para a média? 17. Uma fábrica produz pilhas com σ = 1 h em termos de vida-útil. Em uma amostra de 36 pilhas, a média de

vida-útil foi de 7,5 h. Supondo que a distribuição tenha comportamento normal, estimar o intervalo que contém µ com 95 % de confiança.

Page 55: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 55

18. Encontrar os valores de t na tabela bilateral para :

a) n = 20 95 % de confiança t = b) n = 30 95 % de confiança t = c) n = 10 99 % de confiança t = d) n = 5 90 % de confiança t =

19. Qual o número de amostras para:

a) 95 % de confiança t = 2,145 n = b) 99 % de confiança t = 2,704 n = c) 90 % de confiança t = 1,746 n =

20. O nível de confiança para :

a) t = 1,325 n = 21 confiança = b) t = 2,878 gl = 18 confiança =

21. Uma amostra de minério para análise de ferro. Obtivemos os seguintes resultados:

12,5 11,8 13,2 12,7 12,0 12,0 Construir um intervalo para a média, considerando 90 % de confiança. 22. Construir o intervalo de confiança (95 %) para a concentração de enxofre em amostra de carvão mineral. Os

resultados obtidos em laboratório foram:

3,22 3,45 3,33 3,40 3,60 23. A especificação de um produto garante o teor de cálcio igual a 1,5 %. Foram feitas 12 determinações de

cálcio em um lote, sendo a média dos valores obtidos igual a 1,7 % e o desvio padrão igual a 0,22 %. Verificar se o lote é aceito quando se aceita um risco de 5 % de erro (95% de confiança).

24. Quatro técnicos analisaram uma solução de amônia de concentração de 20,1%, encontrando-se os

seguintes resultados. Técnico Determinações x S

A 20,2 19,9 20,1 20,4 20,2 20,4 20,2 0,190

B 19,9 20,2 19,5 20,4 20,6 19,4 20,0 0,486

C 20,6 20,5 20,7 20,6 20,8 21,0 20,7 0,179

D 20,1 19,9 20,2 19,9 21,1 20,0 20,2 0,456

Baseado nos dados acima, verifique com um nível de significância de 5 % se algum técnico apresenta um erro sistemático. 25. A vazão de um determinado produto em um processo contínuo é medida por um instrumento. São feitas as

seguintes leituras em um intervalo definido de tempo.

3,20 3,18 3,22 3,57 3,61 3,72 com 90 % de confiança, estabeleça a variação máxima que poderá ser alcançada por este sistema. 26. Em uma pesquisa com os 150 alunos do último ano de graduação de uma faculdade, 57 afirmaram que

farão pós-graduação. Sendo a população de alunos formandos de 2000 em todas as faculdades da região, calcule o número mínimo de alunos que com 95 % de certeza farão pós-graduação.

27. Medições de pH em uma solução tampão forneceram os seguintes resultados:

Page 56: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 56

5,12 5,20 5,15 5,17 5,16 5,19 5,15.

Calcule os limites de confiança 95 % e 99 % para o valor verdadeiro de pH. 28. A cronometragem de certa operação forneceu os seguintes valores para diversas determinações (em

segundos):

108 119 110 102 115 121 109 105 111 112 113 108 120 114 113 109 117 112

Construa o intervalo de confiança com 90 e 99% para o tempo médio e a variância do conjunto. 29. Um universo é unimodal. Uma amostra de 120 elementos tirada deste universo forneceu as seguintes

estimativas para a sua média e desvio-padrão, respectivamente: x = 30,1 e s = 3,5 É possível estimar com 95% de confiança, um limite mínimo para a média real do universo? Em caso afirmativo, calcule o limite.

30. Em um determinado lote produzido foi tomada uma amostra de 400 peças na qual 15 apresentaram-se

abaixo dos requisitos de qualidade extra estabelecida pela própria empresa. Para cerca de 4000 amostras distribuídas, qual o número mínimo de peças que apresentarão a mesma condição com 95% de confiança?

31. Uma amostra extraída de uma população normal forneceu os seguintes valores: 3,0 3,2 3,4 2,8 3,1 2,9 3,0 3,2

Construa: - IC de 95% para a variância da população - IC de 99% para a variância da população - IC de 95% para a média da população - IC de 99% para a média da população - Se a variância da população é 0,01, como ficarão o IC de 95 % e 99 % para a média? 32. Em 2004, o reator esteve parado com problemas em 5 dias. Para 2003, qual o número de dias esperado,

com 90% de confiança, em que haverá perda de produção diária no mesmo equipamento?

33. Foram feitas 20 medidas do tempo real gasto para a precipitação de um sal, em segundos, numa dada experiência:

13 15 12 14 17 15 16 15 14 16 17 14 16 15 15 13 14 15 16 15

Esses dados são suficientes para estimar o tempo médio gasto na precipitação com precisão de meio segundo e 95 % de confiança? Em caso negativo, qual o tamanho da amostra necessária? 34. Uma amostra de 10 peças forneceu os seguintes valores de certa dimensão (em mm):

80,1 80,0 80,1 79,8 80,0 80,3 79,7 80,0 80,2 80,4 Deseja-se estimar a dimensão média com erro máximo de 5/100 mm e 98 % de confiança, bem como a proporção de peças com dimensão acima de 80 mm, com precisão de 90 % de confiança. Dimensione a amostra total que se deverá tomar. 35. Deseja-se estimar a resistência média de certo tipo de peças com precisão de 2 kgf e 95% de confiança.

Desconhecendo-se a variabilidade da resistência, romperam-se 5 peças, obtendo-se para elas os seguintes valores para as suas resistências (em kg): 50, 58, 52, 49, 55. Com base nos resultados obtidos, determinou-se que deveriam ser testadas mais 14 peças, a fim de se conseguir o resultado desejado. Qual a sua opinião a respeito da conclusão?

Page 57: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 57

36. Quantas amostras serão necessárias para estimar o desvio com α = 5% e α = 0,1%, de um determinado técnico ao realizar uma análise, sabendo que é admitido um erro de = 0,1% (σ = 0,179)

37. Verificar se existe algum valor discrepante nos resultados de análises de 4 técnicos conforme dados abaixo:

técnico A 6 determinações s2 = 0,036 técnico B 6 determinações s2 = 0,236 técnico C 6 determinações s2 = 0,032 técnico D 6 determinações s2 = 0,015

38. Usando o teste de Dixon, verificar se existe algum resultado discrepante nas determinações a seguir:

20,1 19,9 20,2 19,9 20,1 20,0 49,4 49,8 50,8 49,3 51,3 50,0 50,8 51,8

39. A especificação de um certo material é estabelecida em 3,36 ± 0,04 mg/L. Considerar σ = 0,04. O Técnico

analisou uma amostra deste material e encontrou o valor médio para 3 repetições de 3,29. Pode-se aceitar o material como especificado com 5 % de significância?

40. Supomos que a distribuição populacional de resultados para uma solução de amônia tem como média

20,0 % de NH3 e desvio padrão 0,171, para o laboratório. Queremos avaliar a precisão de um analista recém admitido, nesta determinação, através dos dez resultados para a solução padrão de 20,0 % de NH3 por ele obtido:

20,5 19,9 20,1 20,3 19,9 19,7 20,2 19,6 19,7 20,1

Pode-se admitir que a precisão obtida pelo analista é igual à precisão do laboratório ao nível de 5 % de significância? 41. Dois catalisadores podem ser usados em um processo químico por batelada. Doze bateladas foram

preparadas usando o catalisador 1, resultando em um rendimento médio de 86 e um desvio padrão da amostra igual a 3. Quinze bateladas foram preparadas empregando o catalisador 2, resultando um rendimento médio de 89, com um desvio padrão de 2. Considere que as medidas dos rendimentos sejam distribuídas aproximadamente de forma normal, com o mesmo desvio padrão. Há evidência que confirme a afirmação que o catalisador 2 produz um rendimento maior que o catalisador 1? Use α = 0,01.

42. O diâmetro de bastões de aço, fabricados em 2 máquinas extrusoras diferentes está sendo investigado.

Duas amostras aleatórias de tamanho n1 = 15 e n2 = 17 são selecionadas e as médias e as variâncias das amostras são x 1 = 8,73, S2 = 0,35, e x 2 = 8,68, S2 = 0,40, respectivamente. Suponha que σ1 = σ2 e que os dados sejam retirados de uma população normal. Há evidência que confirme a afirmação que as duas máquinas produzem bastões de diferentes diâmetros? Use α=0,05 para chegar a esta conclusão.

43. Os pontos de fusão de duas ligas usadas na formulação de solda foram investigados através da fusão de 21

amostras de cada material. A média e o desvio padrão para a amostra 1 foram x 1 = 420 ºF e S1 = 4 ºF, enquanto que para a liga 2 foram x 2 = 426 ºF e S2 = 3 ºF. Os dados amostrais confirmam a afirmação de que ambas as ligas tem o mesmo ponto de fusão? Use α = 0,05 e considere que ambas as populações sejam normalmente distribuídas e tem o mesmo σ.

Page 58: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 58

44. Dois diferentes testes analíticos podem ser usados para determinar o nível de impurezas em uma liga de aço. Oito espécimes são testados usando ambos os procedimentos, sendo os resultados demonstrados na tabela a seguir. Há evidência suficiente para concluir que ambos os testes fornecem o mesmo nível médio de impureza? Use α=0,01.

Espécime Teste 1 Teste 2 1 1,2 1,4 2 1,3 1,7 3 1,5 1,5 4 1,4 1,3 5 1,7 2,0 6 1,8 2,1 7 1,4 1,7 8 1,3 1,6

45. Um cientista de computação está investigando a utilidade de duas diferentes linguagens de programação na

melhoria das tarefas computacionais. Doze programadores experientes, familiarizados com ambas as linguagens, codificaram uma função padrão nas duas linguagens. O tempo em minutos foi registrado, sendo os dados mostrados a seguir:

Programador Linguagem 1 Linguagem 2 1 17 18 2 16 14 3 21 19 4 14 11 5 18 23 6 24 21 7 16 10 8 14 13 9 21 19 10 23 24 11 13 15 12 18 20

Ao nível de α=0,05, há alguma indicação que uma linguagem de programação seja preferível? 46. Está sendo investigada a temperatura em que ocorre uma deflexão, devida à carga, em dois diferentes

tubos de plástico. Duas amostras aleatórias foram testadas e as temperaturas (em ºF) observadas em que ocorre a deflexão são reportadas a seguir:

Tipo 1 Tipo 2 206 193 192 177 176 198 188 207 210 197 185 188 205 185 194 206 200 189 187 189 178 201 197 203 194 213 205 180 192 192 Os dados confirmam a afirmação de que a temperatura em que ocorre a deflexão , devido à carga, no tipo 2 excede àquela do tipo 1? Use α=0,05. 47. Duas companhias químicas podem fornecer uma matéria-prima, cuja concentração de um determinado

elemento é importante. A concentração média para ambos os fornecedores é a mesma, porém, suspeitamos que a variabilidade na concentração pode diferir entre as duas companhias. O desvio padrão da concentração de uma amostra aleatória de n1 = 10 bateladas produzidas pela companhia é S1 = 4,7 g/L, enquanto para a companhia 2, uma amostra aleatória de n2 = 16 bateladas resulta em S2 = 5,8 g/L. Há evidência suficiente para concluir que a as variâncias das duas populações difiram? Use α = 0,05.

48. Considere os dados apresentados no Problema 3.18. Os dados da amostra confirmam a afirmação que ambas as ligas tem a mesma variância de ponto de fusão? Use α=0,05 para tirar a conclusão.

Page 59: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 59

49. Com o intuito de controlar a homogeneidade da produção de certas partes no tempo, amostras semanais

são retiradas da produção corrente. Uma primeira amostra de dez elementos, forneceu x 1 = 284,55 e S1 = 0,320, ao passo que uma segunda amostra forneceu os seguintes valores:

284,6 283,9 284,8 285,2 284,3 283,7 284,0 Ao nível de 5% de significância, podemos afirmar que a homogeneidade da produção tenha variado no decorrer das duas semanas investigadas?

Lista de Exercícios 1

Page 60: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 60

1. Considere uma distribuição normal com média 10 e desvio padrão 3. Qual é a proporção da área sob a curva entre 7 e 13?

2. Usinas nucleares que utilizam água para refrigeração de seus condensadores algumas vezes liberam água

quente em rios, lagos ou oceanos. Sabe-se que a água quente acima de certa temperatura tem um efeito indesejado sobre plantas e animais que vivem nesses ambientes. Suponha que a alta temperatura liberada por uma certa usina nuclear tem uma distribuição Normal com média 5C e um desvio padrão de 0,5C. Qual o percentual de dias nos quais o aumento da temperatura é maior do que 5,5C?

3. Em uma amostra de indivíduos adultos de sexo masculino, cuja estatura média é 168 cm e desvio padrão é

8 cm, qual é o intervalo de alturas em que 95% da população está compreendida? 4. Sabe-se que a variável X tem distribuição normal, com os seguintes parâmetros: média = 30 e variância =

16. Qual é a probabilidade de encontrarmos X > 40? 5. Sabe-se que a variável X tem distribuição normal, com os seguintes parâmetros: média = 60 e variância = V.

Se P (X > 70) = 0,0475, qual é o valor de V? 6. Sabe-se que a variável X tem distribuição normal, com os seguintes parâmetros: média = M e variância = 9.

Se P ( X > 28 ) = 0,1587; qual é o valor de M? 7. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média µ e

desvio um padrão 10g. Em quanto deve ser regulado o peso médio para que apenas 10% dos pacotes tenham menos de 500g?

8. Uma máquina destinada a produção de arruelas, produz peças com um diâmetro interno médio de 0,500 cm

e um desvio-padrão de 0,005 cm. Essas peças irão ser utilizadas com parafusos cuja espessura oscila entre 0,494 e 0,506 cm. Assim, caso as arruelas ultrapassem essas dimensões são consideradas defeituosas. a) Assumindo que os diâmetros das arruelas se distribuem normalmente, determine a percentagem de arruelas defeituosas produzidas pela máquina. b) Uma maneira de reduzir o número de arruelas defeituosas consiste em ajustar a máquina de forma a reduzir a dispersão dos diâmetros das arruelas produzidas. Para quanto se deverá reduzir esse desvio-padrão para que mais de 90% das arruelas possam ser aproveitadas de imediato?

9. Sabe-se que a duração (em horas) de funcionamento de duas marcas distintas (M1 e M2) de um dispositivo

electrónico é uma variável aleatória com distribuição normal. Para a marca M1 a duração tem distribuição X: N(40,36) e para M2 a duração tem distribuição Y: N(42,9). Qual das duas marcas terá maior probabilidade de funcionar durante um período superior a 48 horas?

10. Estudos meteorológicos indicam que a precipitação pluviométrica mensal em períodos de seca numa certa

região pode ser considerada como seguindo a distribuição Normal de média 30 mm e desvio padrão 4mm. Qual a probabilidade de que a precipitação pluviométrica mensal no período da seca esteja entre 24 e 38 mm?

Lista de Exercícios 2

Page 61: Quimiometria

Qumiometria Básica Alcides Eduardo Jacomassi 61

1. Foram retiradas 25 peças da produção diária de uma máquina, encontrando-se para uma certa medida uma média de 5,2 mm. Sabendo-se que as medidas têm distribuição normal com desvio padrão de 1,2 mm, construir intervalos de confiança para a média aos níveis de 90 e 95%.

2. De uma distribuição normal com variância = 1,96, obteve-se a seguinte amostra: 25,2 – 26,0 – 26,4 – 27,1 –

28,2 – 28,4. Determine o intervalo de confiança para a média da população com 90% e 95%.

3. Suponha que as alturas dos alunos de nossa faculdade tenham distribuição normal com σ = 15 cm. Foi retirada uma amostra aleatória de 100 alunos obtendo-se média de 1,75 m. Construir, ao nível de 95% de confiança o intervalo para a verdadeira altura média dos alunos.

4. Dados n = 10, média = 110 e S = 10, determinar intervalos de confiança para 90%, 95% e 99%.

5. Uma amostra é composta pelos seguintes elementos:

7 - 7 - 8 - 9 - 9 - 9 - 10 - 11 - 11 - 11 - 12 - 13 - 13 - 14 - 15 - 15 Construir intervalos de confiança para 80% e 90%.

6. Colheu-se de supermercados, 30 amostras de um produto que apresentaram os seguintes pesos: 250 - 265 - 267 - 269 - 271 - 275 - 277 - 281 - 283 - 284 287 - 289 - 291 - 293 - 293 - 298 - 301 - 303 - 306 - 307 307 - 309 - 311 - 315 - 319 - 322 - 324 - 328 - 335 - 339

Por meio de intervalo de confiança, responda se essa amostra atende ou não a especificação contida na embalagem de peso de 300 g. Considere erro máximo admissível de 5%.

7. Em uma fábrica, colhida uma amostra de certa peça, obtiveram-se os seguintes valores para o diâmetro: 10 - 11 - 11 - 11 - 12 - 12 - 12 - 12 - 13 - 13 13 - 13 - 13 - 13 - 13 - 13 - 13 - 13 - 13 - 13 14 - 14 - 14 - 14 - 14 - 15 - 15 - 15 - 16 - 16

Considerando que a utilização desta peça deve atender as especificação de diâmetro igual a 13,8 mm, o lote deve ser aceito? Considere 95% de confiança.

8. Em quatro testes experimentais de um novo comercial, o locutor que deveria apresentá-lo gastou uma média de 28,9 s, com uma variância de 1,0 s. Sabendo que o comercial é de 30 s, comente o desempenho do locutor.

9. Sendo σ = 0,5 determine o número de elementos necessários para construir um intervalo de 95% de

confiança para a média admitindo-se que nossa estimativa tenha um erro de 10%. 10. Sabe-se que a especificação para o ponto de fulgor de determinado produto é 38,0 oC, no mínimo. Com a

chegada de um navio trazendo produto, retirou-se uma amostra e fez-se 5 determinações. Os valores encontrados foram:

39,0 - 38,5 - 39,0 - 39,0 - 39,5 Admitindo um erro de 5%, devo recusar ou aceitar o lote?