UNIP - Campus Paraiso - Curso Ciência da Computação e Sistemas de Informação Disciplina:...

114
UNIP - Campus Paraiso - Curso Ciência da Computação e Sistemas de Informação Disciplina: Estatística&Probabilidade Prof. Celso Guidugli

Transcript of UNIP - Campus Paraiso - Curso Ciência da Computação e Sistemas de Informação Disciplina:...

UNIP - Campus Paraiso -

Curso Ciência da Computação e Sistemas de Informação

Disciplina: Estatística&Probabilidade

Prof. Celso Guidugli

Introdução

Nova Era (Informação X conhecimento)

União entre as três grandes áreas - Humanas - Biológicas - Exatas.

Exatas

Medo de exatas

Medo da Matemática

Estudar ≠ aprender.

Definição

Estatística ensina como: - coletar/organizar/analisar - interpretar (Dados / Informações) Para Tomadas de Decisões.

Estatística Descritiva<> coleta, organiza e tabela os dados brutos e efetua os primeiros cálculos dos dados.

Estatística Indutiva<>analisa,infere, testa e valida dados e informações

Estatísticas no cotidiano

Empresas de pesquisa em geral:Ibope, Folha SP, Estadão, infográficos dos periódicos etc.

Vacinação em massa: dengue, tétano, gripe.

Esportes: futebol, vôlei, basquete. Mercado de capitais/Bolsa de Valores. Acidentes em geral. Evolução da economia: preços, salários,

nível da renda, emprego, PIB. Produção de bens e serviços. Eleição etc.

Amostras

População é o todo

Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza

das análises.

Amostras

População é o todo

Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza

das análises.

Conceitos

População é o todo

Amostra é a parte ou subconjuntos

Parâmetros são medidas com base na população

Estimativas são medidas com base em amostras.

Dados

Dados são informações coletadas de medições, pesquisas, contagens, levantamentos em geral, que serão tratados estatisticamente para dai serem analisados e interpretados. Como

Daí a coleta dos dados se pautar por algumas características do grupo a ser estudado.

Dados são valores da variável em estudo Cada uma destas características ou

unidades de estudo denomina-se Variável.

Amostras

População é o todo

Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza

das análises.

Técnicas de amostragens

Casual simples ou aleatória(Todos tem a mesma chance; sorteios)

Amostra estratificada(Separar em classes)

Amostra sistemática(seguir uma ordem preestabelecida)

Variáveis e sua Classificação

São dados que caracterizam o conjunto de elementos de interesse no estudo de um determinado grupo .

Variável Qualitativa Nominal: os dados/ valores são expressos por atributos e não por números. EX.:cor dos olhos, da pele, religião, curso, nacionalidade , vc pratica qual esporte?...

Variável Qualitativa Ordinal:não podendo ser medida, a variável segue uma ordem. Ex.:escolaridade, função, cargo, critério, avaliação – ótimo-bom-regular-péssimo, com qual intensidade vc pratica esporte?

Variáveis e sua Classificação

Variável Quantitativa Discreta > números / valores inteiros.

Variável Quantitativa Contínua > números/valores fracionários dentro de certos limites.

Instrumentos para Levantamento de Dados

Tipos de levantamento: Contínuo: Sempre realizado quando

determinados eventos acontecem. Basta um novo caso ocorrer. Ex.:registro de meningite em Minas ou da dengue em Campinasetc.

Periódico: Ocorre de forma cíclica, como o caso do recenseamento no Br a cada dez anos; ou pesquisa de eleição.

Ocasional: Ocorre sem preocupação de continuidade ou periodicidade

Interatividade

Um aluno estava fazendo o seu TCC (trabalho de conclusão de curso) e resolveu fazer uma pesquisa de campo. O tema do seu trabalho era “A UTILIZAÇÃO DA CAMINHADA NO CONTROLE GLICÊMICO DO DIABETES TIPO-II”. Para isso, ele pesquisou a população e verificou que uma amostra de 40 indivíduos era suficiente. Com base no texto podemos afirmar:

a) A população são todos os diabéticos da região sul do país

b) A população deve ser composta por cinco mil diabéticos

c) A amostra é igual a populaçãod) A amostra é composta por 40 indivíduose) Num trabalho científico deve sempre utilizar a

população para análise.

Coleta de Dados

As três técnicas mais conhecidas de coleta de dados são:

Questionário

Formulário

Entrevista.

Questionário

É uma das técnicas mais usadas

Perguntas de forma clara, objetivas e logicamente estruturadas

Perguntas abertas ou fechadas

Pode ser enviada por e-mail, correio ou entregue ao respondente

Tem suas limitações, pois não abrange (analfabetos; deficientes visuais)

Deve possuir um cabeçalho contendo OBJETIVO E JUSTIFICATIVA

Deve possuir também orientações de preenchimento.

Formulário

Mais informal

Resultante de observações ou interrogações

Preenchimento feito pelo próprio investigador

Uniformidade na interpretação dos dados

Exemplo: Anamnese.

Entrevista

Não é simples conversa Planejamento / Organização Dados mais qualificados (expressões e

comportamentos) Mais demorada e cara Equipe qualificada

Não manipular a pergunta

Exemplo: Você gosta muito da aula de bioestatística?

Organização e Apresentação de dados

Apuração é a organização dos dados coletados

Três técnicas: -Listas ou Rol -Tabelas -Gráficos

Lista = Peso de cinco pacientes em Kg (73, 81, 55, 71, 105)

Rol = (55, 71, 73, 81, 105)

Tabelas

Nível de ensino N. alunos

Ensino Fundamental 19.286

Ensino Médio 1.681

Ensino Superior 234

TOTAL 21.201

MATRÍCULAS NAS ESCOLAS DO MUNICÍPIO DE MIRASOL 2002

Fonte:IBGE

Nota: os dados do ensino superior são de origem da Capes.

Título

Cabeçalho

Coluna indicadora

Corpo

Processo Estatístico

Passos:1. Definir o objeto do estudo, as

populações e as amostras envolvidas.2. Coletar os dados amostrais. (brutos)3. Tabular e representar os dados colhidos

na forma de tabelas e gráficos.4. Calcular os parâmetros estatísticos.

Esses passos correspondem à estatística descritiva.

5. Indução de parâmetros amostrais em parâmetros populacionais ou vice-versa.Esses passos correspondem à estatística indutiva.

Coletar os dados amostrais

Atividade de campo Dados brutos: exatamente como

foram colhidos.

Organização dos dados: sequência de procedimentos que organizam e resumem os dados.

Tabela 1.1 – Dados brutos de uma amostra de alunos de uma universidade

Ordem Nome do aluno

Estado Civil

Curso matriculado

Qualidade atribuída à instituição

Sexo Idade em anos

Renda Familiar

Nº de DPs

1 Daiane solteiro Jornalismo Ótima F 19 R$ 3.220,00 2

2 Alberto solteiroAdministra-ção Boa M 20 R$ 4.050,00 0

3 Rui casado Direito Regular M 25 R$ 1.950,00 44 Carolina casado Engenharia Ruim F 21 R$ 1.682,00 6

Dados não agrupados

Tabela de frequências ou distribuição de frequências para dados não agrupados.Variáveis qualitativas e variáveis quantitativas discretas.

Dados Agrupados em Classes

Tabela de frequências ou distribuição de frequências para dados agrupados. Variáveis quantitativas contínuas.

Número de classes.

Limites de classes.

Intervalos de classes.

Elementos de uma Distribuição de Frequência - #1

Classe> representada por i descreve cada intervalo ou linha de uma tabela de frequência. O total das classes de uma tabela é representado por k.

Para se determinar o k (número de classes) usa-se a fórmula:

k=√n, onde n é o Ʃf somatório das frequências. No exemplo anterior k=√42= 6,48,

arredondando=k=7classes.

Dados Agrupados em Classes

Tipos de Frequência – f - #1

Frequência simples: f -número de vezes que um mesmo valor se repete na distribuição estudada.

Há 11 alunos casados na tabela, logo, a frequência simples de casados é 11.

Frequência total: ∑f - somatório de todas as frequências simples. No caso 42

Frequência relativa: fr - frequência simples dividida pela ∑f .

Como existem 11 alunos casados num total de 42, a frequência relativa é

11.100÷42= 26,2%.

Tipos de Frequência - #2

Frequência Acumulada –Fi - é a soma das frequências simples desde o valor inicial até a classe indicada.

Frequência Relativa Acumulada – Fr – descreve a soma das frequências simples desde seu valor inicial, representados porcentualmente.(%) ou

Fr = Fi.100 ÷ Ʃfi = ____% . Ex.: Tabela 3 – Fr da 2ª. Classe=13+11=24 Fr=24.100 ÷ 42 = 57,14% .

Elementos de uma Distribuição de Frequência - #2 Limites de Classes> são representados

por I e L e descrevem os extremos de cada classe. Ver no exemplo

Amplitude de Classe> representada por h, descreve a medida do intervalo de classe, calculada: h = L – l = limite superior (L) menos o l (limite inferior).

Numa distribuição com intervalos de classe, a amplitude é a mesma para todas as classes. No ex.:Ls-Ii=1.373.

Amplitude Amostral> representada por AA, é a diferença entre o valor máximo e o mínimo da amostra. Para isso o ROL é necessário. AA do ex.:10.567–956 =9.611.

Dados Agrupados em Classes

Interatividade: Mapa de casos de Dengue em Monte Azul

Os porcentuais : fr e Facr de dez/2012 respectivamente são:a) 20,7 %e 33,8%.;

b) 29,8% e49,0%;

c) 9,2% e 33,3%;

d) 12,3% e 44,8%e) 38,7 % e 87,7%.

MÊS f fr(%) Fac Facr

Novem/2011 110 9,2% 110 9,2%

Dezem/2011 170 ?% 280 ?%

Janeiro/2012 220 38,7% 500 87,7%

Fever/2012 70 12,3% 570 100,%

∑f 570 100,% -.- -.-

Apresentação dos Gráficos Estatísticos

A apresentação de tabulações dos dados coletados permite uma rápida e mais dinâmica visão e leitura para interpretação do que se pretende analisar.

A figura geométrica utilizada enseja uma percepção representativa, coerente do que se quer expor. Há que respeitar, contudo:

Simplicidade > facil entendimento. Clareza > correta interpretação. Veracidade > valores verdadeiros.

Gráficos

Os mais comuns são:

Lineares

Colunas ou Barras

Setores ou Pizza

Pictogramas

Lineares

Colunas

Barras

Cartograma: Evolução da População Brasileira

Polar

Setores ou Pizza

Pictogramas ou gráficos pictóricos

Interatividade

O gráfico de linhas é um gráfico muito utilizado na área da saúde, economia e nas eleições. Este gráfico é mais indicado para:

a) Verificar partes referentes a um todo

b) Fazer comparaçõesc) Verificar a evolução de um

fenômeno no tempod) Simbolizar o fenômeno e ser mais

atrativoe) mostrar tópicos

Resposta

a) Verificar partes referentes a um todob) Fazer comparaçõesc) Verificar a evolução de um fenômeno no

tempod) Simbolizar o fenômeno e ser mais

atrativoe) mostrar tópicos

InteratividadeA partir do gráfico abaixo, podemos afirmar que a porcentagem dos trabalhadores na área de produção dessa empresa é de:a)24%.b)9%. c)6%.d)33%.e)16%.

Medidas de tendência central

A análise sobre o estudo da frequência mostra ser possível interpretar os grupos dos dados/valores que uma variável pode assumir.

Dentro de uma determinada distribuição de valores, é possível saber como seus grupos de valores se distribuem.

Tais grupos podem estar localizados no início, no meio ou no fim ou se existe uma distribuição homogênea dos valores.

Como traduzir essas tendências.

Medidas de Tendência Central

São as medidas que se aproximam ao centro. As mais utilizadas:

Media aritmética Media ponderada Mediana Moda

Medidas de Variabilidade ou Dispersão> Amplitude Total Variância Desvio Padrão Coeficiente de Variação

Medidas de Assimetria e Curtose

Média Aritmética

É a soma de todos os elementos dividida pela quantidade de elementos.

Exemplo: A lista abaixo representa o tempo (em

minutos) de 10 consultas realizadas em um pronto-socorro no período da manhã.

(16, 9, 11, 16, 20, 18, 7, 9, 16, 14)

µ = 136/10= 13,6

Média Aritmética Simples e Ponderada

Média: valor equidistante (intermediário) entre os valores de todos os elementos da amostra. Imagine uma gangorra: é o ponto de equilíbrio dos valores dos dados de uma amostra.

Média simples: quando a frequência de todos os elementos é igual a 1.

Média ponderada: quando o peso de cada elemento (ou a frequência) da amostra possue mais de um elemento.

Média Ponderada

É a soma de todos os elementos, multiplicados pelos seus respectivos pesos e dividida pela soma dos pesos.

Exemplo: Imagine uma avaliação onde conste

trabalho e prova. A prova tem peso 1 e o trabalho peso 2. Caso o indivíduo tire 4 na prova e 10 no trabalho. Qual é a média?

µp= 4x1+10x2=24/3=8

Média Aritmética Simples - Mas

Cálculo: Somatório dos valores de todos os elementos dividida pelo número de elementos.Exemplo: qual é a média da amostra abaixo?S = {8;2; 10; 6 e 4} ROL=2;4;6;8;10.Mas= ∑xi ÷ n onde xi são os valores dos dados da série e n o número (qtd) dos dados.

65

305

108642

XXX

Desvio em Relação à Média

É a diferença entre cada elemento de um conjunto de valores e a média aritmética.

Exemplo: A idade das crianças atendidas diariamente num posto de vacinação: 6,9,11,7,5 e 4 > Rol> 4,5,6,7,9,11.

Média=4+5+6+7+9+11÷6= 42÷6= Média=7. Desvio Médio:d1= x1-m= 4-7=-3d2= x2-m= 5-7=-2d3= x3-m= 6-7=-1d4= x4-m= 7-7= 0d5= x5-m= 9-7= 2d6= x6-m=11-7= 4.Soma dos desvios = 0.

Propriedades da Média

1ª – A soma algébrica dos desvios tomados em relação à média é nula. Veja o exemplo.

2ª- Somando-se ou subtraindo-se uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada ou diminuida dessa constante.

3ª - Caso multiplique-se ou divida-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante.

Média para Dados Agrupados Semintervalo de Classe peso/frequênciaCálculo: Somatório da multiplicação de cada dado pela respectiva frequência de dividida pelo somatório das frequência.Mp =Ʃxi.fi ÷ Ʃfi. Exercício: Qual a Média:

VALOR=xi

FREQUÊNCIA SIMPLES=fi

xi.fi

2 20 40

4 25 100

6 18 108

8

10 80

10 5 50

T OTALƩfi=78 Ʃxi.fi=378

5

966292,478

378

X

XX

Média para Dados Com Intervalo de Classe

Todos os valores incluidos em um determinado intervalo de classe, tendem a coincidir com seu ponto médio da classe (pmi), e a partir daí é que se calcula a média aritmética ponderada.

Fórmula para o cálculo da média para dados com intervalo de classe:

M= Ʃxi.fi ÷ Ʃfi onde xi é o ponto médio (pmi) de cada intervalo.

Média para Dados Com Intervalo de Classe

Exemplo: calcular a média da distribuição:A B   C D E=(C+D)/2 F=D x E

ClasseLimites de classe Frequência 

simples

Ponto médio de classe

Frequência x ponto médio

li   ls fi pmi fi x pmi1 0 |---- 10 25 5 1252 10 |---- 20 32 15 4803 20 |---- 30 40 25 10004 30 |---- 40 19 35 6655 40 |---| 50 7 45 315

                               ∑fi                                         123

       ∑f1.pmi           2585

Média para Dados Agrupados Com Intervalo de Classe

21

01626,211232585

X

X

Interatividade

Em uma prova de estatística, três alunos obtiveram a nota 8,2; outros três obtiveram a nota 9,0; cinco obtiveram a nota 8,6; um obteve a nota 7,0 e um a nota 8,9. Calculando-se a média, esta será:a)Uma média aritmética com valor 8,0.b)Uma média aritmética com valor 8,5.c)Uma média aritmética simples com valor 7,0.d)Uma média ponderada com valor 8,0.e)Uma média aritmética simples com valor 8,3.

Mediana - Md

É o valor que divide um conjunto de valores ordenados exatamente em duas metades. Exemplo:1.Calcular a mediana do conjunto abaixo:

S = {2;4;6;8;10}

Md = 62.Calcular a mediana do conjunto abaixo:

S = {2;4;6;8;10;12} Md = 7

5,32

162

1

EmdNEmd

32

152

1

mdE

NEmd

Mediana (dados agrupados)

O valor da mediana, portanto, é: Me = 366,1

ClasseLimites de classe Frequência 

simplesFrequência acumulada

li   ls fi fac

1 250 |---- 300 8 8

2 300 |---- 350 10 18

3 350 |---- 400 14 32

4 400 |---- 450 8 40

5 450 |---| 500 4 44

hffEliMe

Me

acantmeMe

50

14185,22350

Me

Mediana (dados não agrupados)

3. Calcular a mediana da distribuição.A classe da mediana é:

Valor Frequência simples

Frequência acumulada

xi fi fac

2 26 26

4 24 50

6 18 68

8 12 80

10 9 89

4452

902

1

MdNEmd

Emprego da Mediana

Na obtenção de um ponto referencial que divide a distribuição em duas partes iguais.

A média pode estar afetada por valores extremos que , até certo ponto mascaram a própria média.

Geralmente a variável em estudo é salário.

Moda - Mo

É o valor que mais vezes se repete na amostra; o valor de maior frequência. Exercício: S = {2;2;3;3;3;4;5;5;6} Mo = 3S = {2;2;2;3;3;3;4;5;6} Mo = 2 e 3 > BimodalS = {2;3;5;6;7;9;10;11} Mo não existe > Amodal.

Mo = 2

Valor Frequência simples

xi Fi2 264 246 188 1210 9

Moda

A tabela ao lado representa uma pesquisa com 100 meninas, entre 18 a 25 anos de um determinado bairro, na cidade de São Paulo.Elas foram questionadas do que ela gostariam de ganhar no dia dos namorados.Qual a moda?

Ganhar %FloresChocolatePerfumeJóiasCarroApartamentoM.R.

1135101565

Moda (dados agrupados)

A classe modal é a 3ª. (maior frequência).

ClasseLimites de classe Frequência simples

li   ls fi

1 1000 |---- 1500 8

2 1500 |---- 2000 10

3 2000 |---- 2500 14

4 2500 |---- 3000 8

5 3000 |---| 3500 4

2,2222500810

82000

MoMo

hff

fliMo

postant

postMo

Posição Relativa da Média

Simétrica > é a posição de uma distribuição em que as 3 medidas:Média, Moda e Mediana coincidem.

Assimetria > acontece quando não há coincidência numa distribuição de em nenhuma das três medidas

Numa distribuição em forma de sino:M=Md=Mo <> curva simétricaMo<Md<M <> curva assimétrica positivaM<Md<Mo <> curva assimétrica negativa

Separatrizes

Mediana<> Trata-se de uma medida de tendência central que define exatamente dois grupos com os mesmos números de valores.

Quartis (Q)<> São valores de uma série que a dividem em 4 partes iguais:

Primeiro Quartil (Q1) é a parte (25%) menor.Segundo Quartil (Q2=Md) é justamente a

parte que coincide com a Mediana Terceiro Quartil (Q3) é o valor (25%) da

distribuição situado na parte superior.Percentis<> são os 99 valores que separam

a distribuição em 100 partes iguais.

Interatividade

Em uma prova de estatística, três alunos obtiveram a nota 8,2; outros três obtiveram a nota 9,0; cinco obtiveram a nota 8,6; um obteve a nota 7,0 e uma nota 8,9. Calculando-se a média, esta será:

a) Uma média aritmética com valor 8,0;b) Uma média aritmética com valor 8,5;c) Uma média aritmética simples com

valor 7,0;d) Uma média ponderada com valor 8,0;e) Uma média aritmética simples com

valor 8,3.

Medidas de variabilidade

As medidas de variabilidade verificam se esses elementos são iguais ou não.

As mais utilizadas são:

Amplitude Variância Desvio padrão Coeficiente de variação

Interatividade

Calcular a média, a moda e a mediana da distribuição (rol é importante):

32,9,9,13,17,12, 10,15,23. Média—Moda—Medianaa) 15,5 9 13b) 13,8 13 9c) 18,3 17 17d) 17,7 9 14 e) 15,5 13 14

Estatística Indutiva ou Inferência Estatística

Estatística indutiva é a parte da estatística que obtém conclusões e previsões da população através de amostras.

Exemplo: Pesquisa política

Medidas de dispersão ou de variabilidade

Medidas de dispersão absolutas: Amplitude Total = diferença entre os

extremos dos valores coletados; a diferença entre o limite superior e o inferior dos elementos da amostra.

Desvio Médio = é o somatório das diferenças entre o valor de cada dado e a média apurada, dividida pelo número de elementos.

Variância = S² Desvio-padrão = √variância = S

Medidas de dispersão relativas: Coeficiente de Variação.

Amplitude

É a diferença entre o maior e o menor elemento.

Exemplo:Numa maternidade, em um determinado dia, nasceram de parto cesariana 4 crianças, com os respectivos pesos ao lado:Qual a amplitude?

A = 5,310 – 2,550A= 2,760

Peso kg3,1012,5502,6405,310

Desvios (revisão)

Conceito de desvio: a diferença (positiva ou negativa) entre o valor de um determinado elemento e a medida de posição da amostra, no caso da média.

Por exemplo: você tirou nota 7,5 numa prova em que a nota média dos alunos foi 4,5. Significa que você tem um desvio positivo, em relação à amostra, de 3 pontos:

Medidas de dispersão são tratamentos estatísticos dados a todos os desvios da amostra.

0,35,45,7 iiii ddXxd

Desvio-padrão

É a mais importante das medidas de dispersão.

É a raiz quadrada da soma de todos os desvios ao quadrado dividida pelo número de elementos menos um.

Exemplo: calcular o desvio-padrão de: S = {2;4;6;8;10}, cuja média é 6.Desvios: di = {-4;-2;0;2;4}Desvios ao quadrado: di2 = {16;4;0;4;16} =Soma dos desvios = 40 ÷ amostra = 5 – 1,

portanto:

2,31015

40

SSS

Desvio-padrão (dados não agrupados)

Exemplo: calcular o desvio-padrão.

Valor Frequência simples

Valor x frequência Desvios Desvios ao 

quadrado

Desvios ao quadrado x frequência

xi fi xi x fi di di2 fi x di2

1 20 20 -3,3 10,6 213,03 30 90 -1,3 1,6 47,95 20 100 0,7 0,5 10,97 15 105 2,7 7,5 112,49 10 90 4,7 22,4 224,4

Somas 95 405     608,4Média: 4,3 Desvio-padrão 2,5

5,21954,608

1

SSN

fdS ii

Desvio-padrão (dados agrupados)

Exemplo: calcular o desvio-padrão.

ClasseLimites de classe

Frequência 

simples

Ponto médio de 

classe

Valor x frequência

Desvios

Desvios ao 

quadrado

Desvios ao quadrado x frequência

li   ls fi xi xi x fi di di2 fi x di2

1 10 |---- 20 10 15 150 -16,8 281,1 2810,62 20 |---- 30 20 25 500 -6,8 45,8 915,23 30 |---- 40 25 35 875 3,2 10,5 261,74 40 |---- 50 8 45 360 13,2 175,2 1401,45 50 |---| 60 5 55 275 23,2 539,9 2699,4

Som 68 2160     8088,2 Média: 31,8 Desvio-padrão 11,0

0,111682,8088

1

SSN

fdS ii

Variância

Variância (S²): é o quadrado do desvio-padrão; mesmo cálculo, interrompido antes

de se extrair a raiz quadrada. Assim sendo:

se a variância de uma amostra for 625, o desvio-padrão é √625 = 25;

se o desvio-padrão de uma amostra for 13, a variância é 13² = 169.

Variância (S2)

É a soma da diferença de cada elementopela sua média elevado ao quadrado

dividida pelo número de elementos menos 1

1

)(1

2

2

n

XXs

n

ii

Exemplo:Uma paciente diabética mede sua glicemia 4 vezes por dia, conforme os dados abaixo: 70, 120, 230, 120) Calcule a Variância ?

Variância

Resolução:1º calcula-se a média.A média é 1352º (X-média)2

(70 - 135)2 =4225 (120-135)2 =225 (230-135)2 =9025 (120-135)2 =2253º ∑ =137004º 13700/n-1 13700/4-1 13700/3 = 4566,66Então a variância é 4566,66.

Variância

Exemplo:Uma paciente diabética mede sua glicemia 4 vezes por dia, conforme os dados abaixo: (70, 120, 230, 120) Calcule a Variância ?

1

)(1

2

2

n

XXs

n

ii

Desvio Padrão

Exemplo:Uma paciente diabética mede sua glicemia 4

vezes por dia, conforme os dados abaixo:

(70, 120, 230, 120) mg/dl Variância = 4566,66 mg/dl

Desvio Padrão = 67,57 mg/dl

Coeficiente de Variação (Cv%)

O coeficiente de variação é a razão entre desvio padrão e a média, multiplicado por 100.

XSCV

Coeficiente de variação

Exemplo: Uma paciente diabética mede sua

glicemia 4 vezes por dia, conforme os dados abaixo:

(70, 120, 230, 120) mg/dl Variância = 4566,66 mg/dl

Desvio Padrão = 67,57 mg/dl

Cv= 67,57/135= 0,50 x 100 = 50%

Interatividade

Imagine a seguinte situação.Duas pacientes diabéticas:

Paciente A Paciente B

Média 120mg/dl 120mg/dl

Desvio 30mg/dl 50mg/dl

Com base nos dados assinale a alternativa correta:

a) A paciente A e B possuem a mesma variabilidade

b) A paciente A esta com a glicemia mais equilibrada que B

c) A paciente B esta com a glicemia mais equilibrada que A

d) As duas pacientes não possuem variabilidade em relação a glicemia

e) A paciente B é a que varia menos em relação a glicemia

Correlação Linear simples

É o grau de associação entre duas variáveis. Não significa dependência.

Exemplos:

Existe relação entre mortes por doenças respiratórias e níveis de poluição?

O diabetes está relacionado com a obesidade?

Existe relação entre obesidade infantil e tempo despendido na frente da televisão?

Fórmula do Coeficiente de correlação

A fórmula para r é:

xy (x) . ( y)

x2 _ (x)2 y2 _ (y)2

r =n.

n. n.

-

.

Classificação

Propriedade: -1 r 1

Casos particulares:

r = 1 correlação linear positiva e perfeitar = -1 correlação linear negativa e perfeitar = 0 inexistência de correlação linear

Diagrama de dispersão

Exemplo de cálculo do coeficiente de correlação

x y x2 y2 x.y 1 1 2 2 3 4 4 5 5 8 X= número de casos de obesidadeY= número de casos de diabetes

Exemplo de cálculo do coeficiente de correlação (continuação)

x y x2 y2 x.y 1 1 1 1 1 2 2 4 4 4 3 4 9 16 12 4 5 16 25 20 5 8 25 64 40 15 20 55 110 77 Σx= Σy= Σx.y=Σx2= Σy2=

Exemplo de cálculo do coeficiente de correlação (continuação)

77 ( 15 ) . ( 20 )

55 _ (15)2 110 _ (20)2

r =5.

5. 5.

-

.

xy (x) . ( y)

x2 _ (x)2 y2 _ (y)2

r =n.

n. n.

-

.

Σy= Σx.y=Σx2= Σy2=Σx= 15 20 55 110 77

= 0,98

Regressão Linear

Regressão não é adivinhação. Ela apenas representa uma tendência

Serve para fazer previsões

A partir dos valores de x se obtém y

Exemplo

Imagine uma situação em um determinado hospital:Se considerarmos o número de casos de obesidade(X) e o número de casos de diabetes (Y), calculando a equação de regressão teríamos:

Casos de obesidade

Casos de diabetes

2 4

3 6

4 8

5 10

Y =2x

Interatividade

Com base na figura, assinale a alternativa incorreta:a) o gráfico apresenta uma correlação perfeita com coeficiente igual a r = 1b) o gráfico apresenta correlaçãoc) a correlação é positivad) o coeficiente pode variar entre -1 e 1e) quanto mais próximos estes pontos se aproximarem da reta mais forte a correlação vai ser.

comprimento (cm) x peso (kg)

10,012,014,016,018,020,022,024,026,028,030,0

90 95 100 105 110

comprimento

peso

Resposta

a) o gráfico apresenta uma correlação perfeita com coeficiente igual a r = 1

b) o gráfico apresenta correlaçãoc) a correlação é positivad) o coeficiente pode variar entre -1 e 1e) quanto mais próximos estes pontos se

aproximarem da reta mais forte a correlação vai ser.

Probabilidade

P = Є/S P = nº de casos favoráveis / nº de casos

possíveis

Exemplo:Acertar um exercício teste:a)b)c)d)e) P= 1/5 ou seja 20%

Probabilidade

Teorema da soma ou regra do “ou”

Exemplo:Chance de ter uma criança menina ou

menino.

P = ½ + ½ = 2/2 = 1 ou seja 100%

Teorema do produto ou regra do “e”

Exemplo:Chance do primeiro filho ser menino e o

segundo também ser menino.

P= ½ x ½ = ¼ = 25%

Curva de Gauss ou curva Normal

padrãodesviomédiaxz

Exemplo

Um professor de anatomia queria verificar como seus alunos foram na prova. Ele verificou que a prova seguiu uma normalidade. Então calculou a média que é 7, com desvio padrão igual a 2. Sabendo que essa classe tem 100 alunos, determine:

a) Quantidade de alunos que tiraram entre 7 e 9

b) Quantidade de alunos que tiraram abaixo de 9

c) E aqueles que tiraram acima de 9.

Resolução

Usando a fórmula temos:Z = 9-7 = 2/2 = 1Área entre 0 e 1 é 34,13%, ou seja, 34 alunos tiraram entre 7 e 9.Abaixo de 9, (34% +50%) =84% ,ou seja, 84 alunosE 16 alunos acima de 9.

Interatividade

De uma classe com 30 alunos, dos quais 14 são meninos, um aluno é escolhido ao acaso. Qual a probabilidade de o aluno escolhido ser uma menina?

a) 14/30b) 1c) 16/30d) 1/30e) 1/14

Resposta

a) 14/30b) 1c) 16/30d) 1/30e) 1/14

Teste de Hipótese

Hipótese é uma resposta provisória para uma questão

Exemplos: A dieta de carboidratos é melhor do que

proteínas

O risco de doenças é maior em mulheres fumantes do que em homens fumantes

O baixo peso ao nascer é maior quando a mãe faz uso continuado de drogas ilícitas durantes a gestação.

Teste de hipótese

As hipóteses podem ser falsas ou verdadeiras

Proceder levantamento de dados e aplicar um teste de hipótese

Existem duas hipóteses:

Hipótese Nula (H0) afirma que não há diferenças

Hipótese Alternativa (Ha) afirma que existe diferença e não é por causa do erro amostral

Teste de hipótese

Nível de significância representa a probabilidade com que a hipótese nula pode ser rejeitada com segurança

O mais usual é o nível de 0,05 (5%), ou seja, queremos ter 95% de certeza de que não houve erro na amostra

Teste de hipótese

Erro Tipo I é quando rejeitamos a hipótese nula sendo que esta deveria ser aceita

Erro do tipo II é quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada

Teste de hipótese

Os testes podem ser divididos em:

- Paramétricos – exigem uma série de pré-requisitos para sua aplicação

Exemplo: teste t e ANOVA

- Não Paramétricos – exigem menos, por isso tem menor poder de decisão

Exemplo: Teste qui-quadrado e Mann- Whitney.

Passos para realizar um Teste de Hipóteses:

Passo 1 : Definição da Hipótese O primeiro passo é o estabelecimento das

hipóteses: hipótese nula e hipótese alternativa

Hipótese Nula (Ho): É um valor suposto para um parâmetro.Se os resultados da amostra não forem muito diferentes de Ho, ela não poderá ser rejeitada.

Hipótese Alternativa(Ha) : É uma hipótese que contraria a hipótese nula. Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho.

Passos para realizar um Teste de Hipótese

Passo 2: Calcular a estatística do Teste

É o valor calculado a partir da amostra, que será usado na tomada de decisão. Para tomar uma decisão é necessário comparar o valor tabelado com a estatística do teste.

Para o caso de testes de médias, a estatística do teste é a variável padronizada Z:

)n()X(Zcal

Passos para realizar um Teste de Hipótese

Passo 3. Regra de Decisão: Se o valor da estatística do teste cair na região crítica, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.

Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho.

Exemplo

Um Diretor de um hospital desconfia que o tempo médio de espera para atendimento de seus pacientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20

pessoas e questionou quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:

min20 :min20 :

1

HHo min 8,21X min40,1S

75,520/40,1208,21

/

nSXt o

o

729,1 75,5 19,05,00 tt

Rejeita-se Ho

Interatividade

Uma nutricionista quer comparar o efeito de duas dietas alimentares para perda de peso.

Para isso, ela criou duas hipóteses: H0= as perdas de peso são as mesmas Há= as dietas determinam perdas de peso

diferentes

Quando acontece o erro do tipo I ?

a) É quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada

b) É quando rejeitamos a hipótese nula sendo que esta deveria ser aceita

c) É quando não identificamos o nível de significância

d) É quando não usamos critérios definidose) É quando utilizamos o teste errado

Resposta

a) É quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada

b) É quando rejeitamos a hipótese nula sendo que esta deveria ser aceita

c) É quando não identificamos o nível de significância

d) É quando não usamos critérios definidose) È quando utilizamos o teste errado