Estatística Teste de Hipóteses Prof. Walter Sousa · 2018-08-24 · Tipos de erros . Dois tipos...

36
Estatística Teste de Hipóteses Prof. Walter Sousa

Transcript of Estatística Teste de Hipóteses Prof. Walter Sousa · 2018-08-24 · Tipos de erros . Dois tipos...

Estatística

Teste de Hipóteses

Prof. Walter Sousa

TESTE DE HIPÓTESES São regras de decisão utilizadas para aceitar ou rejeitar uma hipótese estatística, com base em elementos amostrais. O objetivo é avaliar afirmações sobre os valores de parâmetros populacionais.

Teremos sempre duas hipóteses: 𝐻𝐻0:𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 - Afirmação que diz que o parâmetro

populacional é tal como especificado (afirmação verdadeira). 𝐻𝐻1:𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 𝑛𝑛𝑛𝑛𝐻𝐻𝐻𝐻𝑎𝑎𝑛𝑛𝑛𝑛𝐻𝐻𝐻𝐻𝑎𝑎𝑛𝑛- Afirmação que oferece alternativa

à alegação (isto é, o parâmetro é diferente, maior ou menor que o valor alegado).

A hipótese nula é sempre a hipótese a ser examinada. Se a aceitarmos, implicitamente estaremos rejeitando H1 e se rejeitarmos H0, então não podemos rejeitar H1, devendo esta ser aceita.

Tipos de erros Dois tipos de erros podem ser cometidos num Teste de Hipóteses: Erro Tipo I (α): A hipótese nula é verdadeira e o pesquisador a rejeita. Erro Tipo II (β) A hipótese nula é falsa e o pesquisador a aceita.

o Erro Tipo I é o mais grave e deverá ser minimizada a probabilidade deste tipo de erro ser cometido. Essa probabilidade chama-se Nível de Significância do Teste, dado por α.

1) Bicaudal ou Bilateral H0: μ = μ0 H1: μ ≠ μ0 Onde: μ é a média populacional e μ0 é o valor suposto para a média populacional.

RA: região de aceitação (da hipótese nula H0) RC: região crítica (região de rejeição de H0) A fronteira entre essas regiões será dada por um valor tabelado, 𝑍𝑍𝑡𝑡𝑡𝑡𝑡𝑡 (Tabela da Distribuição Normal) ou 𝐻𝐻𝑡𝑡𝑡𝑡𝑡𝑡 (Tabela da Distribuição t-Student) como veremos mais adiante.

2) Teste Unicaudal ou Unilateral à direita H0: μ ≤ μ0 H1: μ > μ0

3) Teste Unicaudal ou Unilateral à esquerda H0: μ ≥ μ0 H1: μ < μ0

Distribuição Z ou t-student A distribuição que devemos utilizar para arbitrar os escores Z (da distribuição normal) ou t (da distribuição t-student), do intervalo, seguem as seguintes regras básicas: A variável é normal e Se o parâmetro da variância populacional for conhecido (consequentemente o desvio padrão), para qualquer tamanho de amostra, devemos utilizar a distribuição Z (normal padrão). Se o parâmetro da variância for desconhecido, devemos utilizar a distribuição t-student, com n – 1 graus de liberdade. Se a amostra for grande, acima de 30 elementos, pode-se utilizar a tabela Z (teorema do limite central), pois para grandes amostras a diferença dos scores é não significativa.

ESTATÍSTICA CALCULADA Para procedermos ao teste, além de conhecer o valor tabelado ZTAB OU tTAB devemos encontrar o valor calculado(estatística teste – calculada) (ZCALC ou tCALC), 𝑍𝑍𝐶𝐶𝑡𝑡𝐶𝐶𝐶𝐶 = 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑡𝑡 𝑡𝑡𝑎𝑎𝑎𝑎𝑎𝑎𝑡𝑡𝑎𝑎𝑡𝑡𝐶𝐶−𝑎𝑎𝑀𝑀𝑀𝑀𝑀𝑡𝑡 𝑡𝑡𝐶𝐶𝑎𝑎𝑎𝑎𝑡𝑡𝑀𝑀𝑡𝑡

𝑀𝑀𝑎𝑎𝑎𝑎𝑑𝑑𝑀𝑀𝑎𝑎 𝑝𝑝𝑡𝑡𝑀𝑀𝑎𝑎𝑝𝑎𝑎 𝑀𝑀𝑡𝑡𝑎𝑎 𝑀𝑀𝑀𝑀𝑎𝑎𝑡𝑡𝑎𝑎𝑀𝑀𝑡𝑡𝑑𝑑𝑀𝑀𝑑𝑑𝑎𝑎𝑎𝑎 𝑡𝑡𝑎𝑎𝑎𝑎𝑎𝑎𝑡𝑡𝑎𝑎𝑡𝑡𝑀𝑀𝑎𝑎

𝒁𝒁𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄 = 𝑿𝑿�−𝝁𝝁𝟎𝟎𝝈𝝈/ 𝒏𝒏

𝒕𝒕𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄 = 𝑿𝑿�−𝝁𝝁𝟎𝟎𝝈𝝈/ 𝒏𝒏

𝑋𝑋� = a média amostral 𝜇𝜇0: a média alegada (parâmentro da H0, “média do fabricante”. n = tamanho da amostra,

PASSO A PASSO a) Estabelecer a hipótese nula e a alternativa b)Identificar uma distribuição amostral adequada – normal ou t – student. (Para teste de proporções sempre Z) c) Particionar a região amostral em regiões de aceitação e de rejeição. d) Calcular a estatística teste. e) Comparar a estatística amostral com o valor crítico e decidir pela aceitação ou não de H0.

EXEMPLO Um atributo X tem distribuição normal com média μ e variância 100.

A partir de uma amostra aleatória de tamanho 36 da população definida por X, deseja-se testar a hipótese H0 : μ=22 contra a alternativa a Ha : μ ≠ 22 ao nível de significância 5%. Para esse fim calcula-se a média amostral igual a 25.

• H0 : μ=22 • Ha : μ ≠ 22 • significância (α) 5%.

1) Para o teste bilateral: Se −𝑍𝑍𝑡𝑡𝑡𝑡𝑡𝑡< 𝑍𝑍𝐶𝐶𝑡𝑡𝐶𝐶𝐶𝐶 < 𝑍𝑍𝑡𝑡𝑡𝑡𝑡𝑡 aceitaremos H0. 2) Para o teste unilateral à direita: Se 𝑍𝑍𝐶𝐶𝑡𝑡𝐶𝐶𝐶𝐶 < 𝑍𝑍𝑡𝑡𝑡𝑡𝑡𝑡 , aceitamos H0. 3) Para o teste unilateral à esquerda: Se −𝑍𝑍𝑡𝑡𝑡𝑡𝑡𝑡< 𝑍𝑍𝐶𝐶𝑡𝑡𝐶𝐶𝐶𝐶 aceitamos H0.

Nível Descritivo (P-valor)

Definição: O P-valor de um teste de hipótese, também chamado nível descritivo ou probabilidade de significância é a área na normal, tal que P(Z > 𝑍𝑍𝐶𝐶𝑡𝑡𝐶𝐶𝐶𝐶),no teste unilateral é Se 𝛼𝛼 < p-valor, aceita-se H0 Se 𝛼𝛼 > p-valor, rejeita-se H0

O poder do teste

O poder do teste é o complementar de 𝛽𝛽 (𝐻𝐻𝑎𝑎𝑎𝑎𝑒𝑒 𝑑𝑑𝑒𝑒 𝐻𝐻𝐻𝐻𝐻𝐻𝑒𝑒 𝐼𝐼𝐼𝐼),𝑑𝑑𝑛𝑛𝑑𝑑𝑒𝑒 𝐻𝐻𝑒𝑒𝑎𝑎 1 − 𝛽𝛽 e indica a probabilidade de o pesquisador rejeitar H0 quando ela é de fato falsa.

TESTE DE HIPÓTESES PARA PROPORÇÕES

Definição: Assim como no Teste de Hipóteses para a Média, é uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com base em elementos amostrais.

TESTE DE HIPÓTESES PARA PROPORÇÕES

DIFERENÇAS PRINCIPAIS No Teste para Médias os dados amostrais se apresentam

através de medidas. No Teste para Proporções os dados se apresentarão na forma de porcentagem (ou proporção) de elementos com uma determinada característica, que será testada em relação à porcentagem alegada para a população.

TESTE DE HIPÓTESES PARA PROPORÇÕES DIFERENÇAS PRINCIPAIS

No Teste de Hipóteses para a Média precisávamos nos preocupar com o tamanho da amostra e se era conhecida ou não a variância populacional para decidir se usávamos a Tabela Normal ou a Tabela t-Student. Já no Teste de Hipóteses para Proporções não precisamos nos preocupar com isso, pois para encontrar o valor tabulado a ser comparado com o valor calculado (estatística teste) usaremos sempre a TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO.

TESTE DE HIPÓTESES PARA PROPORÇÕES

O cálculo da estatística teste para proporções será: amostradatamanhon

alegadaproporçãoPamostralnaproporçãop

npp

ppZcalc

:::

)1(

0

00

0

−⋅−

=

Estatística

Testes de Hipóteses Exercícios

Prof. Walter Sousa

Questão 01 (Cespe/BACEN) Um psicólogo deseja estudar o tempo(em minutos) que os empregados de uma companhia levam para realizar certa tarefa. Postula-se que os tempos na população considerada seguem uma distribuição normal com média μ e variância σ2, ambas desconhecidas. O psicólogo obteve uma amostra de n = 100 empregados e registrou o tempo que cada um deles precisou para realizar a tarefa. Para os 100 tempos registrados, obtiveram-se o valor médio x igual a 6,25 minutos e o desvio-padrão S = 1 minuto.

Valores selecionados da tabela normal Se X tem distribuição normal padrão, as entradas representam a probabilidade Pr(X<z). Nessa situação e utilizando, caso seja necessário, os valores selecionados da tabela normal fornecidos acima, julgue os itens a seguir.

z 1,282 1,645 1,960 2,576 Pr(X<z) 0,900 0,950 0,975 0,995

(1) Ao testar a hipótese nula H0: µ = 6,50 contra a alternativa Ha: µ ≠ 6,50, o nível de significância α representa a probabilidade de se aceitar a hipótese nula quando ela for falsa.

(2) Para um nível de significância α = 0,01 (1%), a hipótese nula H0: µ = 6,50

é rejeitada em favor da alternativa Ha: µ ≠ 6,50.

z 1,282 1,645 1,960 2,576 Pr(X<z) 0,900 0,950 0,975 0,995

Questão 2 (Cespe) Determinada empresa de transporte rodoviário de passageiros oferecerá uma nova linha de ônibus. Sabe-se que o tempo de duração — T — de uma viagem entre a origem e o destino final dessa linha é uma variável aleatória normal com desvio padrão populacional σ = 20 minutos. O valor médio populacional μ da variável T é desconhecido. Uma amostra aleatória simples de 16 tempos de duração de viagens, nessa mesma linha, produziu um tempo médio amostral T = 250 minutos. Deseja-se testar as hipóteses H0: μ = 240 versus H1: μ ≠ 240, em que H0 e H1 são as hipóteses nula e alternativa, respectivamente.

Questão 2 Com base nessas informações e considerando ф(1,96) = 0,975 e ф(2,58) = 0,995, em que ф representa a função de distribuição acumulada da distribuição normal padrão, julgue os itens a seguir. (1) O teste de hipóteses em questão é monocaudal à esquerda. (2) Se o nível de significância for de 5%, a conclusão do teste será aceitar a

hipótese nula.

Questão 3 (ESAF/AFPS) Um atributo X tem distribuição aproximadamente normal com média 𝜇𝜇 e variância 𝜎𝜎2. A partir de uma amostra aleatória de tamanho 16 da população definida por X, deseja-se testar a hipótese H0: 𝜇𝜇=22 contra a alternativa a Ha: 𝜇𝜇 ≠ 22. Para esse fim calcula-se a média amostral �̅�𝑥 = 30 e a variância amostral S2 = 100. Assinale a opção que corresponde à probabilidade de significância (p-valor) do teste. Gab. A)

(FCC) Questão 4 Gab. C)

Questão 5 (FCC) Uma amostra aleatória de 9 valores de salários extraída de uma população, considerada normal e de tamanho infinito, apresentou uma média igual a R$ 800,00 com um desvio padrão igual a R$ 120,00. Os registros históricos indicam que a média dos salários da população é igual a R$ 740,00. Deseja-se testar a hipótese, ao nível de significância α, se o valor da média verificada na amostra difere do valor de R$ 740,00. Seja H0 a hipótese nula do teste ( μ - 740), H1 a hipótese a alternativa ( μ ≠ 740 ) e tα/2 > 0 o quantil da distribuição “t” de Student, no nível de significância α para testes bicaudais com 8 graus de liberdade. Sabendo-se que H0 foi rejeitada, tem-se que

Questão 5 Gab.: D)

Questão 6 (FCC) Seja uma amostra aleatória de 25 peças fabricadas por uma indústria em que a soma das medidas dos diâmetros da peça apresentou o valor de 125 cm e a soma dos quadrados das medidas dos diâmetros apresentou o valor de 649 (cm)2. Considere que as medidas dos diâmetros são normalmente distribuídas com uma variância populacional desconhecida e com uma população de tamanho infinito. Deseja-se testar a hipótese de que a média (μ) da população destas medidas é igual a 5,5 cm, sendo formuladas as hipóteses H0: μ = 5,5 cm (hipótese nula) contra H1: μ ≠ 5,5 cm (hipótese alternativa). Utilizando o teste t de Student, obtém-se que o valor da estatística t (t calculado) a ser comparado com o t tabelado, com 24 graus de liberdade, é (A) 2,50. (B) 2,25. (C) −2,00. (D) −2,25. (E) −2,50. Gab. E)

Questão 7 (FCC) Um fabricante afirma que pelo menos 95% dos equipamentos que fornece à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens escolhidos ao acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde ao valor probabilístico (p-valor) do teste de H :θ ≥ 0,95 contra A: θ<0,95, sendo θ a proporção populacional de itens dentro de especificação. a) 0,500 b) 0,050 c) 0,025 d) 0,010 e) 0,100 Gab. A)

Questão 8 (ESAF/GESTOR) Lança-se uma moeda 20 vezes e observa-se a ocorrência de 7 caras. Seja 𝜃𝜃 a probabilidade de cara. Assinale a opção que dá o valor da estatística teste correspondente ao teste da hipótese H :𝜃𝜃 ≥ 0,5 contra A: 𝜃𝜃 < 0,5.

a) −0,3 20

b)−0,2 20

c) 0,3 20

d) 0,2 20

e) 0,5 20 Gab. A)