UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI … · também é a mediana e a moda da...

12
Estatística I 01.11.2018 Profa. Renata Gonçalves Aguiar 1 Estatística I UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Prof. a Renata Gonçalves Aguiar Estatística I - UNIR Valor Esperado 2 Consideramos a média como o valor esperado no sentido de que é o valor médio que esperaríamos se as tentativas pudessem continuar indefinidamente. np x E ) ( Estatística I - UNIR Variância e Desvio Padrão 3 Usamos a variância e o desvio padrão para sintetizar a variabilidade nos valores da variável aleatória. ) 1 ( ) ( 2 p np x Var 2 Estatística I - UNIR Situação-problema 24 4 Com base nos dados da atividade 23, faça o que se pede: a. Calcule a média, o desvio padrão e comente os resultados. Estatística I - UNIR Situação-problema 24 5 b. Agora suponha que sejam realizadas 1000 análises. Encontre novamente a média e o desvio padrão. c. Ao comparar os resultados obtidos nas letras a e b, o que podemos concluir? Estatística I - UNIR Distribuição Normal

Transcript of UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI … · também é a mediana e a moda da...

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 1

1

Estatística I

UNIVERSIDADE FEDERAL DE RONDÔNIACAMPUS DE JI-PARANÁ

DEPARTAMENTO DE ENGENHARIA AMBIENTAL

Prof.a Renata Gonçalves Aguiar

Esta

tíst

ica

I -

UN

IR

Valor Esperado

2

Consideramos a média como o valor esperado no

sentido de que é o valor médio que esperaríamos se

as tentativas pudessem continuar indefinidamente.

npxE )(

Esta

tíst

ica

I -

UN

IR

Variância e Desvio Padrão

3

Usamos a variância e o desvio padrão para

sintetizar a variabilidade nos valores da variável

aleatória.

)1()( 2 pnpxVar

2

Esta

tíst

ica

I -

UN

IR

Situação-problema 24

4

Com base nos dados da atividade 23, faça o que se

pede:

a. Calcule a média, o desvio padrão e comente os

resultados.

Esta

tíst

ica

I -

UN

IR

Situação-problema 24

5

b. Agora suponha que sejam realizadas 1000

análises. Encontre novamente a média e o desvio

padrão.

c. Ao comparar os resultados obtidos nas letras a e

b, o que podemos concluir?

6

Esta

tíst

ica

I -

UN

IREs

tatí

stic

a I

-U

NIR

Distribuição Normal

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 2

Esta

tíst

ica

I -

UN

IR

Distribuição Normal

7

É um clássico da Estatística

Esta

tíst

ica

I -

UN

IR

Distribuição Normal

8

Qual o tipo de distribuição de probabilidade dos dados?

Quais os parâmetros?

Esta

tíst

ica

I -

UN

IR

Distribuição Normal

9

Esta é a mais importante distribuição de

probabilidade para descrever uma variável

aleatória contínua.

Esta

tíst

ica

I -

UN

IR

Distribuição Normal

10

A curva normal tem dois parâmetros,

e , N ( , ). Eles determinam

a posição e a forma da distribuição.

11

Figura 1 - Idade de uma populção.Fonte: researchgate.net

Esta

tíst

ica

I -

UN

IR

12

Suponha que sejam realizadas quatro coletas sobre

o CO2 absorvido e liberado por uma área de floresta

(t C ha-1 a-1) e os resultados se apresentem de

acordo com a Figura 2.

Quais conclusões podemos chegar?

Situação-problema 25

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 3

Fonte : leg.ufpr.br

Figura 2 - Dióxido de carbono absorvido e liberado em uma floresta.

Situ

ação

-pro

ble

ma

25

Esta

tíst

ica

I -

UN

IR

Função de Densidade Normal de Probabilidade

14

14159,3

71828,2e

2

2

2

)(

2

1)(

x

exf

Esta

tíst

ica

I -

UN

IR

Características Gerais

15

1. A variável aleatória pode assumir qualquer

valor real.

2. O gráfico da distribuição normal é uma curva

em forma de sino, simétrica em torno da média.

Esta

tíst

ica

I -

UN

IR

Características Gerais

16

3. A área total sob a curva é 1.

4. Como a curva é simétrica em torno da média,

os valores maiores e menores que a média

ocorrem com igual probabilidade.

Esta

tíst

ica

I -

UN

IR

Características Gerais

17

5. O ponto mais alto na curva está na média, que

também é a mediana e a moda da distribuição.

6. O desvio padrão determina a largura da

curva.

Esta

tíst

ica

I -

UN

IR

Características Gerais

18

7. As probabilidades para a variável

aleatória normal são dadas por áreas sob

a curva.

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 4

19

Figura 3 -Distribuição normal do quociente de inteligência.

Fonte: lookfordiagnosis.com

99,72%

95,44%

20Fonte: Costa et al. (2005).

Curva Normal

Figura 4 - Altura média dos brasileiros.Fonte: revistaepoca.globo.com

21Fonte: Costa et al. (2005).

Curva Normal

Figura 5 - Altura média dos brasileiros e de outros países.Fonte: institutoparacleto.org

Esta

tíst

ica

I -

UN

IR

Situação-problema 26

22

A concentração de carbono orgânico total (COT) na

água apresenta valor alerta de 10% (valor acima do

qual representa possibilidade de causar prejuízos ao

ambiente na área de disposição), de acordo com a

Resolução Conama n. 344, de 25 de março de 2004.

Esta

tíst

ica

I -

UN

IR

Situação-problema 26

23

Suponha que o rio Madeira tenha distribuição

N (8; 1,5). Qual a chance, de que em um dado dia, a

concentração de COT exceda o valor de alerta?

Esta

tíst

ica

I -

UN

IR

Situação-problema 26

24

2

2

2

)(

2

1)(

x

exf

Aplicando a equação…

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 5

25

Esta

tíst

ica

I -U

NIR

Esta

tíst

ica

I -U

NIR

Distribuição Normal-Padrãode Probabilidade

Esta

tíst

ica

I -

UN

IR

Distribuição Normal-Padrão

26

Denomina-se distribuição normal-padrão a

distribuição normal de média zero e desvio padrão 1.

27Fonte : leg.ufpr.br

Figura 6 - Curva normal padrão.

Dis

trib

uiç

ãon

orm

al-p

adrã

o

Esta

tíst

ica

I -

UN

IR

Cálculo das Probabilidades

28

Fórmulas usadas para converter qualquer variável

aleatória normal para a distribuição normal:

x

zs

xxz

Esta

tíst

ica

I -

UN

IR

Cálculo das Probabilidades

29

Converte qualquer variável aleatória normal para a

distribuição normal.

Esta

tíst

ica

I -

UN

IR

Retomando a S-P 26

30

Suponha que o rio Madeira tenha distribuição

N (8; 1,5). Qual a chance, de que em um dado dia, a

concentração de COT exceda o valor de alerta?

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 6

Esta

tíst

ica

I -

UN

IR

Situação-Problema 27

31

Suponha que as notas de um vestibular tenham

distribuição normal com média 60 e desvio padrão

de 15 pontos.

a. Se você prestou esse vestibular e obteve 80

pontos, qual é a sua posição relativa, em unidades

de desvio padrão, com relação à média de notas?

Esta

tíst

ica

I -

UN

IR

Situação-Problema 27

32

b. Qual a probabilidade de um candidato ter obtido

nota acima de 55 pontos?

c. Se foram considerados aprovados os candidatos

que obtiveram nota mínima correspondente a um

desvio padrão acima da média, qual é a nota

mínima de aprovação na escala original dos

dados?

Esta

tíst

ica

I -

UN

IR

Situação-Problema 28

33

Dado que z é uma variável aleatória normal-padrão, calcule as seguintes probabilidades.

a. P(0 ≤ z ≤ 1).

b. P(-1 ≤ z ≤ 1).

c. de ocorrer valor menor do que .50,0z

34

Esta

tíst

ica

I -

UN

IR

Despertando a Arte e a Cultura

Despertando

35

Ji-Paraná - 05 a 10 de novembro

Sexto Plantio na UNIR de Ji-Paraná no dia 14.11.2018

Conversem com o Professor

Convite de Suma Importância

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 7

Esta

tíst

ica

I -

UN

IR

Lista 4

37

Disponível para o

deleite de todos.

Fon

te:

odo

ntos

hop

buta

nta

38

Ativar a Análise

de DadosTrazer os dados do trabalho

Trazer notebook

Publicarei o arquivo da aula

prática no dia 04.11 até às 16 h

Instalar o BioEstat 5.0www.mamiraua.org.br

Aula no Laboratório de Estatística 1

Dias 05 e 19.11.2018

39

Esta

tíst

ica

I -U

NIR

Esta

tíst

ica

I -U

NIR

Correlação e Regressão

Esta

tíst

ica

I -

UN

IR

Correlação Linear

40

Para se medir o grau de correlação entre duas

variáveis usa-se o coeficiente de correlação (r),

que varia de -1 a +1.

Importante construir um diagrama de dispersão.

41

Figura 7 - Correlação linear entre as médias em estatura da população da

cidade de Florianópolis e os anos pesquisados.

Fonte: Pinheiro, Neiderauer e Vargas (2014). 42

�� = (0,778 ± 0,008)x + (25,187 ± 1,965)

r2 = 0,88

Figura 8 – Correlação linear entre a mortalidade em menores de cinco anos

(MC5) e a cobertura por sistemas de esgotamento sanitário (ICE).

Fonte: Teixeira e Pungirum (2005).

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 8

Esta

tíst

ica

I -

UN

IR

Correlação Linear

43

Coeficiente de correlação

de Pearson

Esta

tíst

ica

I -

UN

IR

Correlação Linear

44

Coeficiente de correlação

O coeficiente de correlação é dado por:

n

yy

n

xx

n

yxxy

r2

22

2

n é o números de pares (x, y)

45

Figura 7 - Correlação linear entre as médias em estatura da população da

cidade de Florianópolis e os anos pesquisados.

Fonte: Pinheiro, Neiderauer e Vargas (2014).

r = 0,95

46

�� = (0,778 ± 0,008)x + (25,187 ± 1,965)

r2 = 0,88

Figura 8 – Correlação linear entre a mortalidade em menores de cinco anos

(MC5) e a cobertura por sistemas de esgotamento sanitário (ICE).

Fonte: Teixeira e Pungirum (2005).

r = 0,70

Esta

tíst

ica

I -

UN

IR

Correlação Linear

47

Tabela 1 – Avaliação qualitativa de r quanto à intensidade

│r│ A correlação é dita 0 Nula

0,1 ├ 0,3 Fraca 0,3 ├ 0,6 Regular 0,6 ├ 0,9 Forte 0,9 ├ 1,0 Muito forte

1,0 Plena ou perfeita

Esta

tíst

ica

I -

UN

IR

Correlação Linear

48

Cuidado: causa-e-efeito.

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 9

Esta

tíst

ica

I -

UN

IR

Situação-Problema 29

49

O departamento de saúde de uma grande cidade do

Sudeste desenvolveu um índice de poluição do ar que

mede o nível de vários poluentes do ar que causam

doenças respiratórias nos seres humanos. A Tabela 2

fornece o índice de poluição (em uma escala de 1 a 10,

onde 10 corresponde ao nível mais elevado de

Esta

tíst

ica

I -

UN

IR

Situação-Problema 29

50

poluentes) correspondente a dez dias do mês de

agosto, selecionados aleatoriamente, bem como o

número de pacientes com problema respiratório

agudo que deram entrada na sala de emergência

dos hospitais da cidade.

Esta

tíst

ica

I -

UN

IR

Situação-Problema 29

51

Construa um diagrama de dispersão e encontre o

coeficiente de correlação.

Tabela 2 – Índice de poluição do ar e o número de pacientes que deram entrada na emergência com problema respiratório agudo

Poluição do ar 4,5 6,7 8,2 5,0 4,6 6,1 7,7 8,1 5,8 3,0 Atendimentos 53 82 102 60 39 66 90 94 62 27

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

52

O estudo da regressão aplica-se àquelas situações

em que há razões para supor uma relação de

causa-efeito entre duas variáveis quantitativas e se

deseja expressar matematicamente essa relação.

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

53

Causa

Efeito

Expressar por fórmula

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

54

Geralmente denomina-se a variável dependente

(ou variável resposta) de y e a independente (fator)

de x.

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 10

Fator

Figura 8 - Variabilidade da precipitação e da umidade relativa do arno ano de 2004 em uma área de pastagem a 15 km de Ouro Preto.Fonte: Programa LBA

RespostaRegressão Linear Simples

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

56

As expressões a seguir têm todas basicamente o mesmo significado:

a) y depende de x (linguagem coloquial);

b) y é função de x (linguagem matemática);

c) existe regressão de y sobre x (linguagem estatística).

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

57

Equação da reta

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

58

Equação da reta

A equação da reta é dada por

Y = A + Bx.

Assim, a reta estimada de regressão é:

bxay ˆ

Esta

tíst

ica

I -

UN

IR

Regressão Linear Simples

59

Equação da reta

n

xx

n

yxxy

b2

2

xbya

n é o números de pares (x, y)

Esta

tíst

ica

I -

UN

IR

Utilidades da Reta de Regressão

60

1. Permite representar a dependência de uma

variável quantitativa em relação à outra por

meio de uma equação simples.

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 11

Esta

tíst

ica

I -U

NIR

Utilidades da Reta de Regressão

61

2. Permite prever valores para a variável

dependente de acordo com valores determinados

(inclusive não-observados) da variável

independente.

Cuidado com a extrapolação!

Esta

tíst

ica

I -

UN

IR

Coeficiente de Determinação

62

Informa que fração da variabilidade de uma

característica é explicada estatisticamente pela

outra variável.

É expresso pelo quadrado do coeficiente de

correlação, r2.

63

Figura 9 - Regressão linear simples entre as médias em estatura da população

da cidade de Florianópolis e os anos pesquisados.

Fonte: Pinheiro, Neiderauer e Vargas (2014).

Regressão Linear Simples

64

�� = (0,778 ± 0,008)x + (25,187 ± 1,965)

r2 = 0,88

Figura 10 – Regressão linear simples entre a mortalidade em menores de cinco

anos (MC5) e a cobertura por sistemas de esgotamento sanitário (ICE).

Fonte: Teixeira e Pungirum (2005).

Regressão Linear Simples

Esta

tíst

ica

I -

UN

IR

Situação-Problema 30

65

Com base nos dados da atividade 29, faça o que se

pede.

a. Desenvolva uma equação de regressão estimada

para esses dados.

b. Encontre o coeficiente de determinação.

Esta

tíst

ica

I -

UN

IR

Situação-Problema 30

66

c. Ache a melhor predição para o número de

pacientes a dar entrada no hospital com problema

respiratório agudo quando o índice de poluição do ar

for 9.

Estatística I 01.11.2018

Profa. Renata Gonçalves Aguiar 12

Esta

tíst

ica

I -

UN

IR

Situação-Problema 30

67

d. Qual é a vantagem de ser capaz de determinar o

número de pacientes a dar entrada no hospital com

problema respiratório agudo a partir do índice de

poluição do ar?

Esta

tíst

ica

I -

UN

IR

Importantíssimo

68

Para realizar uma correlação e/ou uma regressão

precisam ser atendidos alguns pressupostos que

serão estudados em Estatística II.

Esta

tíst

ica

I -

UN

IR

Referências

69

AGUIAR, R. G. Balanço de Energia em Ecossistema Amazônico por Modelo de Regressão Robusta com Bootstrap e Validação Cruzada. 85 f. Tese (Doutorado em Física Ambiental) – Instituto de Física, Universidade Federal de Mato Grosso, Cuiabá, 2013.

ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à Administração e Economia. 2. ed. São Paulo: Pioneira Thomson Learning, 2003.

BARBETTA, P. A. Estatística aplicada às Ciências Sociais. 5. ed. Florianópolis: Ed. da UFSC, 2002.

Esta

tíst

ica

I -

UN

IR

Referências

70

BUSSAB, W. O.; MORRETIN, P. A. Estatística Básica. 5. ed. São Paulo: Saraiva, 2003.

COSTA, S. F. Introdução ilustrada à Estatística. 4. ed. São Paulo: Harbra, 2005.

CRESPO, A. A. Estatística fácil. 17. ed. São Paulo: Saraiva, 1999.

FREUND, J. E.; SIMON, G. A. Estatística aplicada: Economia, Administração e Contabilidade. 9. ed. Porto Alegre: Bookman, 2000.

Esta

tíst

ica

I -

UN

IR

Referências

MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 4. ed. Rio de Janeiro: LTC, 2009.

PINHEIRO, A. C. C.; J. M. N.; VARGAS, D. M. Tendência secular de crescimento em estatura no município de Florianópolis (SC), Brasil, e sua associação com o índice de desenvolvimento humano (IDH). Ciência & Saúde Coletiva, v. 19, n. 1, p. 227-233, 2014.

Programa de Grande Escala da Biosfera-Atmosfera na Amazônia – LBA.

71

Esta

tíst

ica

I -

UN

IR

Referências

SPIEGEL, M. R. Estatística: resumo da teoria, 975 problemas resolvidos, 619 problemas propostos. São Paulo: McGraw-Hill do Brasil, 1975.

TEIXEIRA, J. C.; PUNGIRUM, M. E. M. C. Análise da associação entre saneamento e saúde nos países da América Latina e do Caribe, empregando dados secundários do banco de dados da Organização Pan-Americana de Saúde – OPAS. Revista Brasileira de Epidemiologia, v. 8, n. 4, p. 365-376, 2005.

TRIOLA, M. F. Introdução à Estatística. 10. ed. Rio de Janeiro: LTC, 2008.

72