Material de apoio estatística 2017 1

44
Prof Ma Re Ch Est A C C P P Tur fessores: aciel Souza ebeca Maciel harlles Borges tatístic Administração Ciências Contábeis/ Econô Comércio Exterior Psicologia Publicidade e Propaganda rma: ____________ 1 ca ômicas a

Transcript of Material de apoio estatística 2017 1

Page 1: Material de apoio estatística 2017 1

Professores:� Maciel Souza� Rebeca Maciel� Charlles Borges

Estatística

� Administração� Ciências Contábeis� Comércio Exterior� Psicologia� Publicidade e PropagandaTurma: ____________

Professores: Maciel Souza Rebeca Maciel Charlles Borges

Estatística

Administração Ciências Contábeis / EconômicasComércio Exterior Psicologia Publicidade e Propaganda

Turma: ____________

1

Estatística

Econômicas

Publicidade e Propaganda

Page 2: Material de apoio estatística 2017 1

2

1. INTRODUÇÃO À ESTATÍSTICA 1.1. Introdução

A palavra estatística lembra, à maioria das pessoas, recenseamentos. Os censos existem há milhares de anos e constituem um esforço imenso e caro feito pelos governos com o objetivo de conhecer seus habitantes, sua condição sócio-econômica, sua cultura, religião, etc. Portanto, associar-se estatística a censo é perfeitamente correto do ponto de vista histórico, sendo interessante salientar que as palavras, estatística e estado têm a mesma origem latina: status.

A estatística é também comumente associada às pesquisas de opinião pública, aos vários índices governamentais, aos gráficos e médias publicadas diariamente na imprensa. Na realidade, entretanto, a estatística engloba muitos outros aspectos, sendo fundamental na análise de dados provenientes de quaisquer processos onde exista variabilidade.

1.2. Importância da Estatística O mundo está repleto de problemas. Para resolvermos a maioria deles necessitamos de informações. Mas, que tipo de

informações? Quantas? E após obtê-las, que fazer com essas informações? A Estatística lida com essas informações, associando os dados ao problema, descobrindo como e o que coletar e obter conclusões a partir de todas essas informações de tal forma que possam ser entendidas por outras pessoas.

A estatística é uma metodologia utilizada para agrupar dados de um fenômeno, analisá-los, interpretá-los e, a partir daí, tomar decisões.

Esse importante ramo da Matemática tem aplicações nos mais variados campos de atuação. O sociólogo necessita conhecer as populações, sua distribuição por sexo, idade, profissão, etc. A meteorologia usa a Estatística para fazer previsões do tempo. Ao agricultor, ela serve para orientá-lo com maior

segurança sobre safras, valores de produção, etc. Na Biologia, então, a Estatística tem inúmeras aplicações. Por exemplo, nos trabalhos efetuados por Johann Gregor

Mendel (1822 - 1884) que são as bases das leis da herança. O geógrafo utiliza a Estatística para obter informações relacionadas às densidades de população, aos climas, às

correntes marítimas, etc. Na indústria, a Estatística é usada para comparar produções, volume de vendas, estudar situações de mercado e suas

tendências. Atualmente, um grande número de empresas utiliza o controle estatístico no processo de produção. Trata-se de uma

importante ferramenta de trabalho, que garante informações seguras e possibilita inúmeros benefícios, como a redução de desperdícios e a identificação de problemas, por exemplo.

1.3. Estatística A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Podemos dizer que a Estatística se divide em dois grupos, são eles:

� Estatística Descritiva – esta tem por objetivo a coleta, a organização e a descrição dos dados. � Estatística Indutiva ou Inferencial – esta destina-se à análise e à interpretação dos dados.

1.4. Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:

• para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino; • para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números

naturais: 0, 1, 2, 3,..., n; • para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de

valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos acima nos dizem que uma variável pode ser:

Page 3: Material de apoio estatística 2017 1

3

a. qualitativa – quando seus valores são expressos por atributos: sexo (masculino - feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.; Nominal: Quando não permitem comparações. Ex: Sexo, cor de pele; Ordinal: Quando permitem comparações. Ex: Classe social, grau de instrução;

b. quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N (números

naturais), mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Logo, é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um dos alunos tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg etc., dependendo esse valor da precisão da medida.

De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas.

1.5. População e Amostra Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística

ou universo estatístico. Exemplo: Conjunto formado pelos eleitores de uma cidade. Se todos podem ser pesquisados, realizamos o que chamamos de CENSO. Se a população é um conjunto formado por muitos elementos, torna-se inviável analisá-la por inteiro, quer seja

fator tempo ou pelo custo. Nesse caso, devemos trabalhar com uma parte da população, denominada amostra. Por exemplo, para conhecer algumas características do nosso sangue, não é preciso tirar todo o sangue do corpo,

mas apenas uma amostra. É fundamental que as amostras sejam representativas, pois as conclusões dessas amostras serão também da

população (Inferência Estatística). Para a seleção, coleta de uma amostra há técnicas denominadas amostragem. Mediante uma destas técnicas é possível garantir o acaso na escolha e assegurar à amostra a representatividade da

população. EXERCÍCIOS

1. Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas): a) Universo: alunos de uma escola.

Variável: cor dos cabelos - _________________________________________ b) Universo: casais residentes em uma cidade.

Variável: número de filhos - ________________________________________ c) Universo: as jogadas de um dado.

Variável: o ponto obtido em cada jogada - _____________________________ d) Universo: peças produzidas por certa máquina.

Variável: número de peças produzidas por hora - ________________________ e) Universo: peças produzidas por certa máquina.

Variável: diâmetro externo - ________________________________________ f) População: alunos de uma cidade.

Variável: cor dos olhos - __________________________ g) População: casais residentes em uma cidade.

Variável: sexo dos filhos - __________________________

Page 4: Material de apoio estatística 2017 1

4

2. Diga quais das variáveis quantitativas abaixo são discretas e quais são contínuas: a) População: estação meteorológica de uma cidade.

Variável: precipitação pluviométrica, durante um ano - ___________________ b) População: Bolsa de Valores de São Paulo.

Variável: número de ações negociadas - __________________________ c) População: pregos produzidos por uma máquina.

Variável: comprimento - __________________________ d) População: propriedades agrícolas do Brasil.

Variável: produção de algodão - __________________________ e) População: segmentos de reta.

Variável: comprimento - __________________________ f) População: bibliotecas da cidade de São Paulo.

Variável: número de volumes - __________________________ g) População: aparelhos produzidos em uma linha de montagem.

Variável: número de defeitos por unidade - __________________________

1.6. Etapas da Análise Estatística

1.7. Subdivisões da Estatística ♦ AMOSTRAGEM: técnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a população. ♦ ANÁLISE EXPLORATÓRIA DE DADOS: técnicas para resumir, organizar e interpretar os dados, de uma amostra ou da população, para obter informações. ♦ PROBABILIDADE: técnicas que permitem calcular a confiabilidade das conclusões de Inferência Estatística. ♦ INFERÊNCIA ESTATÍSTICA: técnicas para generalizar estatisticamente os resultados de uma amostra para a população.

1.8. Amostragem

Quando o tamanho da amostra é grande em relação ao tamanho da população, ou quando se exige o resultado exato, ou quando já se dispõe dos dados da população, é recomendado realizar um censo, que considera todos os elementos da população, ou seja, dispensa-se o uso da amostragem.

Para realizar um estudo por amostragem, a amostra deve ser representativa da população estudada. Para isso, existem técnicas adequadas para cada tipo de situação.

Veremos a seguir as principais técnicas de amostragem, divididas em probabilísticas e não probabilísticas: 1.8.1. Técnicas Probabilísticas (aleatórias) As técnicas probabilísticas garantem a possibilidade de realizar afirmações sobre a população com base nas

amostras. Normalmente, todos os elementos da população possuem a mesma probabilidade de serem selecionados. Assim, considerando N como o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Estas técnicas garantem o acaso na escolha.

Page 5: Material de apoio estatística 2017 1

5

São técnicas probabilísticas: 1.8.1.1. Amostragem: Aleatória Simples -AAS (ou Casual) É o processo mais elementar e frequentemente utilizado. Pode ser realizado numerando-se os elementos da

população de 1 a n e sorteando-se, por meio de um dispositivo aleatório qualquer, X números dessa sequencia, que corresponderão aos elementos pertencente à amostra.

Exemplo: Obter uma amostra representativa, de 10%, de uma população de 200 alunos de uma escola. Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem

selecionados: 1/N, onde N é o número de elementos da população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de

facilitá-lo, foi elaborada uma tabela - Tabela de Números Aleatórios (TNA) -, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas (Anexo), neste caso, também podemos utilizar a função ALEATÓRIO do Excel.

Exercício: Resolver o exemplo anterior usando a TNA, considerando à partir da 5ª linha, da esquerda para a direita, de cima para baixo, tomando números de três algarismos, evidentemente, os números maiores que 200 e os que já tenham aparecido, serão desprezados.

1.8.1.2. Amostragem Estratificada (ou Proporcional Estratificada)

Quando a população possui características que permitem a criação de subconjuntos, as amostras extraídas por amostragem simples são menos representativas. Nesse caso, é utilizada a amostragem estratificada.

Como a população se divide em subconjuntos, convém que o sorteio dos elementos leve em consideração tais divisões, para que os elementos da amostra sejam proporcionais ao número de elementos desses subconjuntos. Observe a figura abaixo:

Exemplo: Em uma população de 200 alunos, há 120 meninos e 80 meninas. Extraia uma amostra representativa, de 10%, dessa população. Nesse exemplo, há uma variável que permite identificar 2 subconjuntos, a variável sexo. Considerando essa

divisão, vamos extrair a amostra da população.

SEXO POPULAÇÃO AMOSTRA (10%)

Masculino 120

Feminino 80

Total

Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que correspondem a 10% da população.

Para selecionar os elementos da população para formar a amostra, podemos executar os seguintes passos: 1º) numerar os alunos de 1 a 200, sendo os meninos numerados de 1 a 120 e as meninas, de 121 a 200; 2º) escrever os números de 1 a 120 em pedaços de papel e colocá-los em uma urna A; 3º) escrever os números de 121 a 200 em pedaços de papel e colocá-los em uma urna B; 4º) retirar 12 pedaços de papel, um a um, da urna A, e 8 da urna B, formando a amostra da população.

1º) Numerar os alunos de 1 a 200; 2º) Escrever os números de 1 a 200 em pedaços de papel e colocá-los em uma urna; 3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da população.

Page 6: Material de apoio estatística 2017 1

6

Exercício: Obter uma amostra proporcional estratificada, utilizando a TNA à partir da 8ª linha da esquerda para a direita e de cima para baixo.

São exemplos desta técnica de amostragem as pesquisas eleitorais por região, cidades pequenas e grandes, área

urbana e área rural, sexo, faixa etária, faixa de renda, etc.

1.8.1.3. Amostragem Sistemática Esta técnica de amostragem em populações que possuem os elementos ordenados, em que não há necessidade de

construir um sistema de referência. Nesta técnica, a seleção dos elementos que comporão a amostra pode ser feita por um sistema criado pelo pesquisador, ou seja, escolhe-se cada elemento de ordem k.

Exemplo: Obter uma amostra de 80 casas em uma rua que contém 2000 casas. Nesta técnica de amostragem, podemos realizar o seguinte procedimento: 1º) Como 2000 dividido por 80 é igual a 25, escolhemos, por um método aleatório qualquer, um número de 1 e

25, que indica o primeiro elemento selecionado para a amostra. 2º) Consideramos os demais elementos, periodicamente, de 25 em 25, até o fim da rua. Se o número sorteado entre 1 e 25 for o número 8, a amostra será formada pelas casas: 8ª, 33ª, 58ª, 83ª, 108ª, etc. 1.8.2. Técnicas Não-Probabilísticas (não aleatórias) São técnicas em que há uma escolha deliberada dos elementos da população, que não permite generalizar os

resultados das pesquisas para a população, pois as amostras não garantem a representatividade desta. São técnicas não-probabilísticas:

1.8.2.1. Amostragem de Conveniência Os elementos são escolhidos por conveniência ou por facilidade. Um exemplo deste tipo de amostragem é o caso

em que os espectadores de um determinado programa são convidados a responder a um questionário. As amostras obtidas desta forma não são representativas da população.

1.8.2.2. Amostragem Acidental Trata-se da formação de amostras por aqueles elementos que vão aparecendo. Este método é utilizado,

geralmente, em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Exemplo: Pesquisas de opinião em praças públicas e ruas movimentadas de grandes cidades.

1.8.2.3. Amostragem Intencional De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que comporão a

amostra. O pesquisador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Exemplos: - Em uma pesquisa sobre preferência por determinado cosmético, o pesquisador entrevista as frequentadoras de

um grande salão de beleza. - Escolha de localidades "representativas" em tempo de eleições.

Ei você é a favor da pena de morte?

Page 7: Material de apoio estatística 2017 1

7

EXERCÍCIOS 1. Considere um grupo de trabalho, formado por vinte acadêmicos da disciplina de Estatística, da Alfa, formado

pelos alunos (1) Adilson, (2) Adriana, (3) Alexandre, (4) Alisson, (5) Edenilson, (6) Éder, (7) Edson, (8) Flávio, (9) Francieli, (10) Gisele, (11) José, (12) Juliano, (13) Maria, (14) Marisa, (15) Patrícia, (16) Pedro, (17) Raquel, (18) Renata, (19) Silvano e (20) Wagner. Obtenha uma amostra de 25% da população, utilizando:

a) amostragem aleatória simples (utilizar a TNA, iniciar na 2ª linha da esquerda para a direita). b) amostragem estratificada (sexo).

2. Em um Centro Universitário existem 250 alunos em determinado curso superior, sendo:

50 alunos no 1º período 32 alunos no 2º período 30 alunos no 3º período 28 alunos no 4º período

35 alunos no 5º período 27 alunos no 6º período 26 alunos no 7º período 22 alunos no 8º período

Obtenha uma amostra de 40 alunos, preencha o quadro seguinte.

PERÍODOS POPULAÇÃO CÁLCULO PROPORCIONAL AMOSTRA

1º 50 50.40

250=

2 º

3 º

4 º

28

5 º

6

6 º

7 º

8 º

TOTAL 250 - 40

3. Dada uma população de 4 pessoas, Antônio (A), Carlos (C), Luís (L) e Pedro (P), quantas amostras aleatórias simples de tamanho 2 podem ser obtidas? Quais são essas amostras?

4. Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente,

n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem proporcional estratificada, nove elementos da amostra foram retirados do 3o estrato, determine o número de elementos de cada estrato que comporá a amostra e o número total de elementos da amostra.

ESTRATOS TAMANHO PERCENTUAL CÁLCULO

PROPORCIONAL AMOSTRA

Page 8: Material de apoio estatística 2017 1

8

5. Uma cidade X apresenta o seguinte quadro relativo às suas escolas de ensino fundamental.

Obtenha uma amostra proporcional estratificada total de 121 estudantes do total geral 1831.

6. Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos:

DEP. Nº DE EMP. CÁLCULO

PROPORCIONAL AMOSTRA

Administração 914

Transporte 348

Produção 1401

Outros 751

Total 3414

Deseja-se extrair uma amostra entre os empregados para verificar o grau de satisfação em relação à qualidade

da comida servida no refeitório. Diga como a amostragem seria realizada considerando uma amostra de 20 % da população.

7. Para cada uma das seguintes situações diga qual o tipo de amostragem utilizada. a) Em uma IES, o Conselho Universitário deseja conhecer a opinião dos alunos e professores sobre uma

resolução a ser votada, que estabelece horários fixos para o atendimento de alunos pelos professores. Para compor a amostra foram sorteados aleatoriamente 10% dos alunos matriculados e 10% dos professores. Amostragem _______________________.

b) Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o primeiro grupo ele seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo grupo. Amostragem __________________________.

c) Uma lista numerada contém 1000 nomes, numerados consecutivamente a partir de 1. Iniciando-se do 15º nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 25, 35, 45, 55 e assim sucessivamente até que fossem escolhidos 100 nomes. Amostragem __________________________.

ESCOLAS

Nº DE ESTUDANTES

MASC. CÁLCULO

PROPORCIONAL AMOSTRA FEM.

CÁLCULO PROPORCIONAL

AMOSTRA

A 80 95

B 102 120

C 110 92

D 134 228

E 150 130

F 300 290

TOTAL 876 --------------- 955 -------------------

Page 9: Material de apoio estatística 2017 1

9

8. Complete: a) Na amostragem _______________ cada elemento da população tem a mesma chance de ser incluído na

amostra. b) Na amostragem ___________________a seleção dos itens da população que farão parte da amostra são

escolhidos seguindo uma sequencia fixa, isto é, são escolhidos os itens r, r + k, r + 2k, r + 3k, e assim por diante.

c) A amostragem __________________pressupõe a divisão da população em subgrupos de itens similares, procedendo-se então a amostragem em cada subgrupo.

9. Um grupo industrial deseja determinar a reação do público à rotulagem dos produtos. Numa parte da cidade, há 40 quarteirões, com 10 casas por quarteirão. Suponha que se queira selecionar aleatoriamente 10 casas. Como proceder?

10. Os empregados de uma firma têm etiquetas de identificação numeradas consecutivamente de 101 a 873. Deve-

se escolher um comitê de segurança de 10 pessoas, selecionadas aleatoriamente. Como fazer a seleção do comitê, utilizando:

a) amostragem aleatória simples (utilizar à partir da 10ª coluna da TNA de cima para baixo); b) amostragem sistemática.

2. DISTRIBUIÇÃO DE FREQUÊNCIAS Ao estudar grandes conjuntos de dados, é conveniente resumi-los numa tabela, através do agrupamento dos dados em classes, com suas respectivas frequências. Denominamos frequência o número que fica relacionado a um determinado valor da variável.

Quando os dados são discretos com valores repetidos, a simples identificação dos mesmos com as respectivas frequências, pode ser um procedimento adequado, ao que damos o nome de distribuição de frequências sem intervalos de classes.

Quando os dados são contínuos, pode acontecer que poucos, ou até nenhum deles, apresente frequência. Nestes casos, o procedimento começa pela definição de classes.

Classes de frequência, ou simplesmente, classes são intervalos de variação da variável. Uma distribuição de frequências é uma tabela na qual os possíveis valores de uma variável se encontram agrupados em classes, registrando-se o número de valores observados em cada classe. Os dados organizados em uma distribuição de frequência são chamados de dados agrupados.

2.1. Conceitos Essenciais

Para cada classe, em uma distribuição de frequência, os limites de classe inferior e superior indicam os valores compreendidos pela classe. As classes são representadas simbologicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes da distribuição). Há diversos métodos para determinar o número de classes, os quais veremos mais adiante. Limites de classes são os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior número, o limite superior da classe (L i). Classe ou Intervalo de classe → li (incluir) |––– Li (excluir) Ex: 0 |––– 2 Amplitude de um intervalo de classe, ou simplesmente, intervalo de classe (hi) é a medida do intervalo que define a classe: hi = Li – li, amplitude da i-ésima classe. Ex: 4-2 = 2

Classes if

0 2 2 4

4 5

Classes if

1 2

4 5

Page 10: Material de apoio estatística 2017 1

10

Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT = Lmáx – lmín. Ex: 4-0 = 4 Amplitude amostral (A.A.) é a diferença entre o valor máximo e o valor mínimo da amostra: A.A. = xmáx – xmín. Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas

partes iguais. O ponto médio da i-ésima classe é obtido da seguinte maneira: 2

iii

Llx

+= . Ex: (4+2)/2 = 3

Regras básicas 1. Efetua-se um rol (ordenação crescente ou decrescente de grandeza) nos dados brutos (aqueles ainda não

organizados numericamente – tabela primitiva ). 2. Determina-se a amplitude amostral (A.A.) da distribuição.

3. Escolhe-se convenientemente o número de classes k (nº. inteiro), 5 ≤ k ≤ 15 onde podemos tomar nk ≅ ou a regra de Sturges nk log3,31 ⋅+≅ , n ≥ 25 (total de observações). Se possível determina-se, ou seja,

constrói-se classes de mesma amplitude, tomando k

AAh ≅ .

4. Efetua-se o agrupamento em classes e, a seguir, toma-se às frequências das classes, elaborando-se, portanto, a tabela de distribuição de frequências.

2.2. Tipos de Frequências

a) Frequências simples ou absolutas ou, simplesmente, frequências de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. A frequência simples é simbolizada por fi (lemos: f índice i ou frequência da classe i).

Obs.: nff i

k

ii ==∑∑

=1

(número total de observações).

b) Frequências relativas (fri) são valores das razões entre as frequências simples e a frequência total:

n

ffr i

i = .

Obs.: ∑ =1ifr ou 100%.

c) Frequência acumulada (Fi) (do tipo “abaixo de”) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de classe:

kk fffF +++= ...21 ou ∑=

=k

iik fF

1

.

d) Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição:

∑=

i

ii f

FFr .

2.3. Distribuição de Frequência sem Intervalos de Classe Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, ela é chamada distribuição sem intervalos de classe, tomando a seguinte forma:

xi fi

x1 f1

x2 f2

M M

xn fn

∑ = nf i

Page 11: Material de apoio estatística 2017 1

11

2.4. Representação Gráfica de uma Distribuição de Frequência Outra maneira de apresentar uma distribuição de frequência é por meio de gráficos.

Obs.: não é necessário que seja a mesma escala para os dois eixos.

2.4.1. Histograma O histograma é um gráfico formado por retângulos justapostos, tendo como base o intervalo de classe, sendo a

área de cada retângulo proporcional à frequência da classe correspondente. Esse gráfico foi idealizado pelo geneticista e estatístico Karl Pearson (1857 - 1936).

Exemplo: A distribuição das notas dos trinta alunos de Estatística de uma escola está representada abaixo:

Classes (notas) if

0 2 2 4 4 6 6 8

8 10

4 5 12 8 1

Representando as classes da distribuição no eixo das abscissas e as frequências no eixo das ordenadas, temos o

seguinte histograma:

O histograma é a região colorida.

2.4.2. Polígono de Frequência Ao ligar os pontos médios da parte superior de cada retângulo do histograma, obtemos um polígono

denominado polígono de frequência. Devemos completar a figura (polígono), ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Obs.: No caso de termos uma variável essencialmente positiva, cuja distribuição se inicie no valor zero, devemos considerar um intervalo anterior localizado no semi-eixo negativo. Porém, consideraremos apenas a parte positiva do segmento que liga o ponto médio desse intervalo com a frequência do intervalo 0 ... .

Page 12: Material de apoio estatística 2017 1

12

Retornando ao histograma do exemplo anterior, temos:

2.4.3. PPooll ííggoonnoo ddee ff rr eeqquuêênncciiaa aaccuummuullaaddaa É traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos

pontos correspondentes aos limites superiores dos intervalos de classes. Exemplo: Sejam os seguintes dados: Estaturas de 50 crianças

30 35 35 39 41 41 42 45 47 48

51 52 53 54 55 55 57 59 60 60

62 64 65 65 65 66 66 66 67 68

69 71 73 73 74 74 76 77 77 78

80 81 84 85 85 88 89 91 94 97

Preencha a distribuição de frequências abaixo:

i Classes ix if iF

1 30 | 40

2 40 | 50

3 50 | 60

4 60 | 70

5 70 | 80

6 80 | 90

7 90 |100

-------- ------- Σ = --------

Construa o Histograma, o Polígono de Frequência e o Polígono de Frequência Acumulada da distribuição acima. Respostas:

Histograma

4

8

12

30 40 50 60 70 80 90 100

f i

Classes

Page 13: Material de apoio estatística 2017 1

13

Polígono de Frequência Polígono de Frequência Acumulada Exemplos

1. Os valores abaixo representam as estaturas, em cm, de 75 alunos regularmente matriculados em um determinado curso universitário. (Utilize duas casas decimais para as frequências relativas).

172 180 174 182 176 167 160 162 162 164 167 174 169 155 155

180 176 171 179 167 173 180 172 163 168 165 183 189 178 164

170 168 169 180 174 175 191 172 176 172 174 173 165 165 163

150 166 178 178 168 181 184 166 177 167 166 173 160 180 186

156 163 169 155 172 164 154 165 181 156 180 168 185 169 179

Pede-se:

a) O rol;

f i

35 45 55 65 75

4

8

1

2

30 40 50 60 70 80 90 100

10

18

31

40

47

50

4

Classes

Fi

xi

Page 14: Material de apoio estatística 2017 1

14

b) A amplitude amostral; AA=______________ c) O número de classes; i=______ d) A amplitude das classes; h=_________ e) A amplitude total; AT=_____________

f) Preencher a distribuição de frequências; nk ≅

i Estaturas(cm) ix if ifr (%) iF iFr (%)

1

2

3

4

5

6

7

8

9

--- -------- ----- Σ = Σ = ----- ------

g) A frequência da quinta classe; f5=________ h) Qual o limite superior da segunda classe? L2=______ i) Qual o limite inferior da terceira classe? l3=_____ j) Qual o ponto médio da quarta classe? x4=_____ k) Qual a porcentagem dos alunos que possui estatura inferior a 175 cm?______ l) Qual a porcentagem dos alunos cuja estatura não atinge 185 cm?_________ m) Qual a porcentagem dos alunos cuja estatura seja maior ou igual 170 cm?_________ n) O histograma; o) O polígono de frequência; p) O polígono de frequência acumulada. 2. Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:

Observando a tabela acima, responda: a) A amplitude total; b) Preencher a distribuição de frequências, acima; c) A frequência da quinta variável; d) Qual a porcentagem de famílias que possui casa com o número de cômodos inferior a 4? e) Qual a porcentagem de famílias que possui casa com o número de cômodos superior a 6? f) Qual a porcentagem de famílias que possui casa cujo número de cômodos não atinge 5? g) Qual o número de famílias que possui casa que não contém 4 cômodos?

i ix if ifr (%) iF iFr (%)

1 2 4

2 3 7

3 4 5

4 5 2

5 6 1

6 7 1

---- ------ 20=∑ 100=∑ % ------- ------

Obs.: xi é o ponto médio da classe

Page 15: Material de apoio estatística 2017 1

15

EXERCÍCIOS

1. Os resultados do lançamento de um dado 50 vezes foram os seguintes: Rol

6 5 2 6 4 3 6 2 6 5

1 6 3 3 5 1 3 6 3 4

5 4 3 1 3 5 4 4 2 6

2 2 5 2 5 1 3 6 5 1

5 6 2 4 6 1 5 2 4 3

Fazer o rol dos 50 lançamentos, preencher a tabela com os vários tipos de frequências (sem intervalos de

classe) e responder as seguintes perguntas:

i Nº da face (dado) if ifr (%) iF iFr (%)

1

2

3

4

5

6

50=∑ 100=∑ %

a) Quantas vezes o número 4 foi obtido no dado? b) Quantas vezes o número obtido no dado foi maior que 3? c) Quantas vezes saíram os números inferiores a 4? d) Qual é a porcentagem de ocorrência do número 2? e) Qual é a porcentagem de ocorrência dos números menores ou iguais a 4? 2. Montar uma distribuição de frequências com dados agrupados com classes utilizando os dados abaixo,

tomando o limite inferior da primeira classe o número 10 e a amplitude das classes igual a 15, construa o histograma, o polígono de frequência e o polígono de frequência acumulada da distribuição (Utilize uma casa decimal para as frequências relativas).

48 - 34 - 78 - 36 - 65 - 48 - 54 - 42 - 24 - 96 30 - 60 - 90 - 66 - 72 - 60 - 20 - 24 - 85 - 52 84 - 54 - 36 - 42 - 84 - 10 - 18 - 12 - 22 - 25 34 - 60 - 55 - 21 - 47 - 65 - 77 - 34 - 51 - 80

i Classes ix if ifr (%) iF iFr (%)

1

2

3

4

5

6

∑= ∑=

Page 16: Material de apoio estatística 2017 1

16

3. Complete a de distribuição de frequências.

i Classes if (%)ifr iF (%)iFr

1 6 |--- 10 1

2 10 |--- 14 25

3 14 |--- 18 8 14

4 18 |--- 22 90

5 22 |--- 26 2 20

4. Complete a distribuição de frequências com intervalos (iguais) de classes.

i Classes ix if (%)ifr iF (%)iFr

1 6 |--- 10 8 4 20

2 35 11

3 14 |--- 18 16 5 80

4 2 18 90

5 24 5

6 1 5 20

5. Complete a distribuição de frequência:

Determine: a) A amplitude das classes;

b) A frequência da 3ª classe;

c) A frequência relativa da 1ª classe;

d) A frequência acumulada da 4ª classe;

e) O percentual e o número de ocorrências superiores ou iguais a 600;

f) A frequência acumulada relativa da 7ª classe.

i Classes if ifr (%) iF iFr (%)

1 100 |-- 72

2 |--

3 |-- 14

4 |-- 44 68

5 600 |--

6 |-- 52 360

7 |--

8 |-- 8

TOTAL ∑= 400 ∑= 100%

Page 17: Material de apoio estatística 2017 1

17

6. Em uma fábrica foram testadas 400 luminárias. A duração delas aparece na seguinte distribuição de frequência (Utilize três casas decimais para as frequências relativas e não multiplicá-las por 100):

i Duração (horas) N° de luminárias if ifr iF iFr

1 300 |-- 400 14

2 400 |-- 500 46

3 500 |-- 600 58

4 600 |-- 700 76

5 700 |-- 800 68

6 800 |-- 900 62

7 900 |-- 1000 48

8 1000 |-- 1100 22

9 1100 |-- 1200 6

-- -------- ΣΣΣΣ = 400 ---- ------- Observando a distribuição, responda:

a) Qual a amplitude de cada classe? b) Qual a amplitude total da distribuição? c) Complete a tabela de distribuição por frequência. d) Qual a frequência relativa da sétima classe? e) Qual o percentual de luminárias com durabilidade inferior a 600 horas? f) Qual o percentual de luminárias com durabilidade maior ou igual a 800 horas? g) Qual a durabilidade média das luminárias inclusas na classe de maior frequência simples? h) Qual o percentual de luminárias com durabilidade maior ou igual a 700 e menor que 1000? i) Qual a classe da 155ª luminária? j) Até que classe está incluída 65% das luminárias?

7. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus

(Utilize duas casas decimais para as frequências relativas):

i Nº de acidentes (ix ) if ifr (%) iF iFr (%)

1 0 20

2 1 10

3 2 16

4 3 9

5 4 6

6 5 5

7 6 3

8 7 1

ΣΣΣΣ = ΣΣΣΣ =100%

Determine:

a) O número de motoristas que não sofreram nenhum acidente; b) O número de motoristas que sofreram pelo menos 4 acidentes; c) O número de motoristas que sofreram menos de 3 acidentes; d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; e) A porcentagem de motoristas que sofreram no máximo 2 acidentes.

Obs.: fi é o número de motoristas

Page 18: Material de apoio estatística 2017 1

18

8. Complete a distribuição de frequências referente as notas de 50 alunos na disciplina de Estatística:

i Notas if ifr (%) iF iFr (%)

1 20 |----- 30 2

2 30 |----- 40 4

3 40 |----- 50 6

4 50 |----- 60 8

5 60 |----- 70 12

6 70 |----- 80 10

7 80 |----- 90 6

8 90 |----- 100 2

ΣΣΣΣ = ΣΣΣΣ =100%

Conforme a distribuição, responda: a) A amplitude total da distribuição; _______________________________________ b) O limite inferior da terceira classe; _______________________________________ c) A amplitude do intervalo da quinta classe; _________________________________ d) A frequência da primeira classe; _________________________________________ e) A frequência acumulada da quarta classe; __________________________________ f) O número de alunos que não atingiram nota 70; _____________________________ g) O número de alunos que atinge e ultrapassa nota 50; _________________________ h) A porcentagem dos alunos cuja nota é de 40, no mínimo, mas inferior a 80; _______ i) Até que classe estão incluídos 70% dos alunos; ______________________________ j) A porcentagem dos alunos cuja nota não atinge 50. _________________________ 9. Pesquisadas as idades de quarenta pessoas, obtiveram-se os seguintes resultados:

4 21 13 16 14 22 12 18 13 11 10 14 20 6 15 17 8 10 17 8 10 22 18 15 23 23 9 6 13 17 6 10 21 12 14 12 5 15 18 4

Conforme os dados apresentados resolvam os itens abaixo: a) Faça o rol dos dados acima; b) Preencha a distribuição de frequência, utilizando as classes (Utilize uma casa decimal para as frequências

relativas): 4 9, 9 14, 14 19 e 19 24

i Classes ix if ifr (%) iF iFr (%)

1

2

3

4

ΣΣΣΣ = ΣΣΣΣ =

c) Quantas pessoas pertencem à classe 14 19? d) Qual é a porcentagem de pessoas que têm menos de 14 anos? e) Construa o histograma, o polígono de frequência e o polígono de frequência acumulada da distribuição acima.

Page 19: Material de apoio estatística 2017 1

19

3. MEDIDAS DE POSIÇÃO

O estudo feito sobre distribuições de frequências, até agora, permite-nos descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Dessa forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.

Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem através de números, que nos permitam traduzir essas tendências.

Estudaremos, agora, as medidas de posição – estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal (eixo das abscissas).

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos:

a) A média aritmética; b) A mediana; c) A moda. As outras medidas de posição são as separatrizes, que englobam: a) A própria mediana; b) Os quartis; c) Os percentis.

3.1. Dados não-agrupados

3.1.1. Média Aritmética )(x

Em um conjunto de dados, podemos definir vários tipos de médias. Porém em nossos estudos iremos nos limitar a mais importante: a média aritmética.

Definição: A média aritmética, ou simplesmente, média de um conjunto de dados é a soma das entradas de

dados dividida pelo número de entradas. Para encontrar a média use a fórmula a seguir: n

xx i∑

= , sendo:

x a média aritmética;

xi os valores da variável; n o número de valores.

Exemplo: A tabela seguinte mostra o número de gols feitos em cada uma das quatro rodadas de um campeonato de futebol.

1ª rodada 2ª rodada 3ª rodada 4ª rodada

26 gols 23 gols 20 gols 21 gols

A média de gols por rodada é dada por:_____________

Definição: Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de

valores e a média aritmética. Notação: xxd ii −= .

Page 20: Material de apoio estatística 2017 1

20

3.1.2. Moda (Mo) Definição: Denominamos moda o valor que ocorre com maior frequência em uma série de valores. Para encontrarmos a moda, de acordo com a definição, basta procurar o valor que mais se repete, entretanto,

podemos encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros (amodal). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais (bimodal ou plurimodal ).

3.1.3. Mediana (Md) Definição: A mediana é outra medida de posição definida como o número que se encontra no centro de uma

série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

Se a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.

Assim, a série de valores: 2, 4, 7, 8, 10, 12, 12, 14

tem para mediana a média aritmética entre ______ e _______.

Logo: 92

108 =+=Md .

Exemplo Para os dados não agrupados, 1, 3, 3, 3, 4, 5, 6, 6, determinar: a) A média b) Os desvios em relação à média c) A moda d) A mediana.

EXERCÍCIOS I. Considerando os conjuntos de dados: Calcule: a média, a mediana e a moda. b) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 c) 20, 9, 7, 2, 12, 7, 20, 15, 7 d) 51,6; 48,7; 50,3; 49,5; 48,9 e) 15, 18, 20, 13, 10, 16, 14 1. Dê um exemplo, de um conjunto de 5 (cinco) dados, no qual a mediana e a moda sejam iguais. 2. Dê um exemplo, de um conjunto com 7 (sete) dados, no qual a amplitude total seja 10 e a mediana seja 6. 3. Os salários-hora de cinco funcionários de uma companhia são:

R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine:

a) A média dos salários-hora; b) O salário-hora mediano. 4. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) A nota média; b) A nota mediana; c) A nota modal.

Page 21: Material de apoio estatística 2017 1

21

5. A média das idades de três pessoas reunidas em uma sala é 25 anos. Se uma criança de 5 anos entrar na sala, a nova média das idades será:

a) 15 anos b) 18 anos

c) 20 anos d) 22 anos

e) 24 anos

6. A nota média dos meninos de uma classe foi 6,0 e das meninas, 7,0. Se a classe é composta de dezoito meninos e

doze meninas, então a nota média da classe foi: a) 6,5 b) 7,2 c) 4,8 d) 6,4 e) 7,0

7. A média de um conjunto de valores iguais a uma constante é: a) igual à unidade b) zero

c) o valor da constante d) igual à soma das constantes

8. A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos funcionários se aposentou com

60 anos, saindo da empresa. A média de idade dos 10 funcionários restantes passou a ser: a) 40 anos b) 39,8 anos

c) 38,9 anos d) 38 anos

e) 37,8 anos

9. Em um edifício residencial com 54 apartamentos, 36 condôminos pagam taxa de condomínio de R$ 380,00; para

os demais, essa taxa é de R$ 440,00. Qual é o valor da taxa média de condomínio nesse edifício?

3.2. Dados agrupados

3.2.1. Média Aritmética )(x

3.2.1.1. Sem Intervalos de Classes Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos

do sexo masculino: Nº de meninos ( ix ) if ii fx

0 2

1 6

2 10

3 12

4 4

34=∑ if ______=∑ ii fx

TABELA 1. Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas

funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética, dada pela fórmula: i

ii

f

fxx

∑=

Logo, a média dos dados da tabela anterior é:________________

3.2.1.2. Com Intervalos de Classes Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem

com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

i

ii

f

fxx

∑=

onde xi é o ponto médio da classe.

Page 22: Material de apoio estatística 2017 1

22

Considerando a distribuição:

i Estaturas (cm) if ix ii fx

1 150 |---- 154 4

2 154 |---- 158 9

3 158 |---- 162 11

4 162 |---- 166 8

5 166 |---- 170 5

6 170 |---- 174 3

______=∑ if ______=∑ ii fx

TABELA 2. Calcule a média:____________

3.2.2. Moda (Mo) 3.2.2.1. Sem Intervalos de Classes

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Na distribuição da Tabela 1, à frequência máxima _______ corresponde o valor ______ da variável. Logo: Mo = __________.

3.2.2.2. Com Intervalos de Classes A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a

moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta .

Temos, então: 2

** LlMo

+= , onde: l* é o limite inferior da classe modal; L* é o limite superior da classe modal.

Assim, para a distribuição da Tabela 2, temos que a classe modal é i = _____, l* = _______ e L* = ________.

Logo, 2

** LlMo

+= =_______=_______

3.2.3. Mediana (Md)

3.2.3.1. Sem Intervalos de Classes Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das

frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Tomemos a distribuição relativa à Tabela 1, completando-a com a coluna correspondente à frequência

acumulada:

Sendo: 2

if∑ = _______a menor frequência acumulada que supera esse

valor é _____, que corresponde ao valor ______ da variável, sendo este o valor mediano. Logo: Md = _________. Nota: No caso de existir uma frequência acumulada (Fi), tal que:

2i

i

fF

∑= , a mediana será dada por:

21++

= ii xxMd , isto é, mediana

será a média aritmética entre o valor da variável correspondente a essa frequência acumulada e a seguinte.

Nº de meninos (xi) if iF

0 2

1 6

2 10

3 12

4 4

34=∑ if

Page 23: Material de apoio estatística 2017 1

23

Exemplo

Temos:2

if∑ =

Logo: Md = _________

3.2.3.2. Com Intervalos de Classes Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, executamos os seguintes passos:

1º) Determinamos as frequências acumuladas.

2º) Calculamos 2

if∑.

3º) Marcamos a classe correspondente a frequência acumulada imediatamente superior à 2

if∑ – classe mediana –

e, em seguida, empregamos a fórmula:

*

*.

* 2f

hFf

lMdant

i ×

−∑

+=

na qual: *l é o limite inferior da classe mediana; .antF é a frequência acumulada da classe anterior à classe mediana;

*f é a frequência simples da classe mediana;

*h é a amplitude do intervalo da classe mediana.

Assim, considerando a distribuição da Tabela 2, temos:

i Estaturas (cm) if iF

1 150 |---- 154 4

2 154 |---- 158 9

3 158 |---- 162 11

4 162 |---- 166 8

5 166 |---- 170 5

6 170 |---- 174 3

______=∑ if

Como: 2

if∑ =

Logo, a classe mediana é a de ordem ____. Então: *l = _____, .antF = ______, *f = _____ e *h = ______.

Substituindo esses valores na fórmula, obtemos: Md =

Nota: No caso de existir uma frequência acumulada exatamente igual a 2

if∑, a mediana será o limite

superior da classe correspondente.

ix if iF

12 1

14 2

15 1

16 2

17 1

20 1

8=∑ if

Page 24: Material de apoio estatística 2017 1

24

Exemplos

Temos: 2

if∑=

Logo: Md =

3.3. As Separatrizes Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se baseiam em sua posição na série. Essas medidas – os quartis, os percentis e os decis – são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes.

3.3.1. Os Quartis Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis:

a) O primeiro quartil (Q 1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.

b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md). c) O terceiro quartil (Q 3) – valor situado de tal modo que as três quartas partes (75%) dos termos são

menores que ele e a uma quarta parte restante (25%) é maior. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana,

bastando substituir, na fórmula da mediana, 2

ifΣ por:

4ifkΣ

, sendo k o número de ordem do quartil.

Assim, temos: *

*.

*1

4f

hFf

lQant

i ×

−∑

+= e *

*.

*3

4

3

f

hFf

lQant

i ×

−∑

+= .

3.3.2. Os Percentis

Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos: 993221 ...,,...,,, PPPP .

É evidente que: 12550 , QPMdP == e 375 QP = .

O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula 2

ifΣ será

substituída por 100

ifkΣ, sendo k o número de ordem do percentil.

i Classes if iF

1 0 |---- 10 1

2 10 |---- 20 3

3 20 |---- 30 9

4 30 |---- 40 7

5 40 |---- 50 4

6 50 |---- 60 2

______=∑ if

Page 25: Material de apoio estatística 2017 1

25

EXERCÍCIOS 1. Determine a média aritmética de:

a)

b)

2. Considerando a distribuição abaixo:

Calcule: a) a média; b) a mediana; c) a moda.

3. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:

Calcule: a) a nota média; b) a nota mediana; c) a nota modal.

i Valores ( ix ) Quantidades ( if ) ii fx

1 50 8

2 60 5

3 80 4

4 90 3

______=∑ if ______=∑ ii fx

i ix if ii fx

1 50 20

2 58 50

3 66 30

______=∑ if ______=∑ ii fx

ix if ii fx

4 20

5 40

6 30

7 10

100=∑ if ______=∑ ii fx

i ix if ii fx iF

1 3 4

2 4 8

3 5 11

4 6 10

5 7 8

6 8 3

______=∑ if ______=∑ ii fx

i Notas ( ix ) Nº de alunos ( if ) ii fx iF

1 2 1

2 3 3

3 4 6

4 5 10

5 6 13

6 7 8

7 8 5

8 9 3

9 10 1

______=∑ if ______=∑ ii fx

c)

Page 26: Material de apoio estatística 2017 1

26

4. Calcule a média aritmética, mediana e moda de cada uma das distribuições abaixo: a)

i Notas if ix ii fx iF

1 0 |---- 2 5

2 2 |---- 4 8

3 4 |---- 6 14

4 6 |---- 8 10

5 8 |---- 10 7

______=∑ if ______=∑ ii fx

b)

i Estaturas (cm) if ix ii fx iF

1 150 |---- 158 5

2 158 |---- 166 12

3 166 |---- 174 18

4 174 |---- 182 27

5 182 |---- 190 8

______=∑ if ______=∑ ii fx

c)

i Salários (R$) if ix ii fx iF

1 500 |---- 700 18

2 700 |---- 900 31

3 900 |---- 1100 15

4 1100 |---- 1300 3

5 1300 |---- 1500 1

6 1500 |---- 1700 1

7 1700 |---- 1900 1

______=∑ if ______=∑ ii fx

5. Calcule o primeiro e o terceiro quartis das distribuições do exercício anterior. 6. Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentis das distribuições do exercício 4.

7. Determine se as seguintes afirmações são verdadeiras ou falsas. Se for falsa, reescreva-a em sua forma

verdadeira. a) ( ) O ponto médio de uma classe é a soma de seus limites inferior e superior. b) ( ) A frequência relativa de uma classe é a frequência da classe dividida pelo tamanho da amostra. c) ( ) O somatório das frequências relativas, obrigatoriamente, tem que ser igual a 1. d) ( ) A mediana é a medida de tendência central mais provável de ser afetada por um dado estranho (aquele

que está muito afastado dos outros dados do conjunto). e) ( ) Nem todo conjunto de dados possui uma moda. f) ( ) Alguns conjuntos de dados quantitativos não têm uma mediana. g) ( ) O segundo quartil é a mediana de um conjunto ordenado de dados.

Page 27: Material de apoio estatística 2017 1

27

RESPOSTAS: 1. a) 50,64=x e b) 80,58=x

2. a) 43,5=x , b) 5=Md e c) 5=Mo 3. a) 27,5=x , 29,5=Md e 5=Mo

b) cm40,172=x , cm174=Md e cm178=Mo

c) 842,86R$=x , 809,68R$=Md e 800,00R$=Mo

4. a) 92,5=x , b) 6=Md e c) 6=Mo

5. a) 20,7 e 50,3 31 == QQ

b) cm 19,179 e cm 22,166 31 == QQ

c) 946,67 R$ e 694,44 R$ 31 == QQ

6. a) 8,74e40,2;28,3;18,0 ;76,1 901523110 ===== PPPPP

b) cm183ecm67,161;cm40,165;cm12,151 ;cm33,159 901523110 ===== PPPPP

c) 1.086,67R$e616,67R$;678,89R$;507,78R$ ;577,78R$ 901523110 ===== PPPPP

4. MEDIDAS DE DISPERSÃO 4.1. Dispersão ou Variabilidade

As medidas de dispersão são utilizadas para avaliar o grau de variabilidade dos dados. Não se justifica calcular uma média de um conjunto de dados onde não haja variação, todavia se a variabilidade desses dados for muito grande, a representatividade da média será muito pequena. Assim, é importante caracterizar a dispersão dos dados, uma vez que diferentes amostras com médias semelhantes, podem apresentar diferentes variabilidades.

Por exemplo, mesmo sabendo que a temperatura média de duas cidades é a mesma, e igual a 24ºC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24ºC. A outra poderá ter uma variação pequena de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável.

Vemos, então, que a média – ainda que considerada como um número que tem a faculdade de representar uma série de valores – não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto.

Por exemplo, consideremos os seguintes conjuntos de valores das variáveis x, y e z:

X: 70, 70, 70, 70, 70.

Y: 68, 69, 70, 71, 72.

Z: 5, 15, 50, 120, 160.

Verifiquemos que a média dos três conjuntos são iguais.

Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.

Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.

4.2. Amplitude Total Amplitude total é a diferença entre o maior e o menor dos valores da série de dados, ou seja, é o maior desvio da amostra. A sua utilização, além de mostrar o máximo desvio, serve para uma avaliação preliminar dos dados, verificando-se a possibilidade de possíveis erros nas coletas dos dados ou das digitações, já que as variáveis podem apresentar extremos conhecidos.

.. mínmáx xxAT −=

Page 28: Material de apoio estatística 2017 1

28

No caso dos dados serem agrupados com intervalos de classe, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:

.. mínmáx lLAT −=

A amplitude é, na verdade, uma medida fraca de dispersão, porque ela considera somente os valores extremos e não diz nada sobre a distribuição dos valores intermediários.

4.3. Variância e Desvio Padrão Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso.

A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.

A variância é baseada nas diferenças entre cada valor do conjunto de dados e a média do grupo (desvios). A variância é dada pela soma dos quadrados dos desvios ( )xxi − de cada observação em relação à média, dividida pelo

número de elementos da amostra, ou seja, ela é a média aritmética dos quadrados dos n desvios.

Para uma população, a variância é representada pela letra grega minúscula 2σ (ler “sigma dois” ou “sigma ao quadrado”) e a variância de uma amostra é representada por s2.

Para uma amostra de n valores nxxx ...,,, 21 de uma variável X, a variância é dada por: n

xxs

n

ii∑

=

−= 1

2

2

)(.

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio

padrão, definida como a raiz quadrada da variância e representada por s: 2ss = .

Assim: ( )

n

xxs i∑ −

=2

. (I)

=

d1

d2 d3

d4

d5 d6 d7

77

)( 27

26

25

24

23

22

21

7

1

2

2 dddddddxx

s ii ++++++=

−=∑

=

Page 29: Material de apoio estatística 2017 1

29

Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média aritmética ( )x é um número fracionário, o que

torna pouco prático o cálculo das quantidades ( )2xxi − .

Podemos simplificar os cálculos fazendo uso de uma equivalente de (I), escrevendo-a da seguinte maneira:

22

−= ∑∑

n

x

n

xs ii

. (II)

Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo o resultado do cálculo ser menos exato do que quando a fórmula (II) é usada.

O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha papel relevante em toda a Estatística. Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a média é em R$ (real), o desvio padrão também se exprime em real. A variância, por outro lado, se exprime em quadrados de unidades (Ex.: real2, metros2), como já vimos anteriormente.

Intuitivamente, o desvio padrão representa uma média dos desvios (absolutos) que todos os valores amostrais possuem ao redor da média. Valores da série próximos uns dos outros originam um desvio padrão menor, enquanto valores muito afastados uns dos outros dão um desvio padrão maior. Em outras palavras, a série de dados que apresentar desvio padrão maior, terá uma distribuição de frequências mais aberta que a série com desvio padrão menor.

Obs.: Quando os dados estão agrupados, o desvio padrão é obtido pela seguinte fórmula: 22

−=∑∑

∑∑

f

xf

f

xfs iiii

,

onde ix é o valor da variável (sem intervalos de classes) e o ponto médio (com intervalos de classe).

4.4. Coeficiente de Variação

Considere, a título de ilustração, as vendas diárias de dois restaurantes.

Restaurante Dallas

Restaurante Fogão à Lenha

50 470

70 490

60 460

80 480 x = 65 x = 475

s = 11,18 s = 11,18

Obviamente, trata-se de restaurantes com poder de vendas diferentes. Apesar de possuírem o mesmo desvio

padrão, é evidente que diferenças nas vendas da ordem de 10 kg, por exemplo, possuem um peso relativo muito maior para o restaurante Dallas comparado ao Fogão à Lenha. Assim, é razoável afirmar que as variabilidades das vendas diárias em kg para o restaurante Dallas é bem superior, tornando-se necessária a elaboração de uma medida apropriada nessas situações onde se deseja comparar conjuntos de dados com médias bem discrepantes.

Necessitamos de uma medida que reúne essas características, que não seja útil apenas na comparação entre conjuntos de dados de mesma unidade, mas que permita ainda a comparação da variabilidade entre conjuntos de dados referentes a diferentes características. O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média

Page 30: Material de apoio estatística 2017 1

30

for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV):

100×=x

sCV .

O Coeficiente de Variação indica o percentual de variação média dos dados em torno da sua média. Voltando ao exemplo considerado no início, temos:

Restaurante Dallas: CV = 17,20% - A variação média das vendas foi de 17,20% em torno da sua média. Restaurante Fogão à Lenha: CV = 2,35% - A variação média das vendas foi de 2,35% em torno da sua média. Desta forma pode-se afirmar que as vendas diárias do restaurante Dallas em kg apresentam uma variabilidade

bem superior comparada ao restaurante Fogão à Lenha. Exemplos:

1. Seja o conjunto de dados (não-agrupados): 40, 45, 48, 52, 54, 62 e 70.

Calcule a amplitude total e o desvio padrão. R: AT = 30 e s = 9,49.

2. Suponha que você esteja gerenciando uma pizzaria e que mantém um controle das vendas dos diversos tipos de pizza. Suponha ainda que tenha observado os seguintes valores de vendas diárias de pizzas do tipo calabresa durante um período de 9 dias: 40, 56, 38, 38, 63, 59, 52, 49, 46. Calcule, nesses 9 dias:

a) A média b) A mediana c) A moda d) O desvio padrão (Via calculadora) R: 49, 49, 38pizzas e 8,73

3. Seja a distribuição de frequências com dados agrupados sem intervalos de classe:

ix if ii xf 2ii xf

0 2

1 6

2 12

3 7

4 3

∑= ∑= ∑=

Calcule a amplitude total e o desvio padrão. R: AT = 4 e s = 1,04.

ix 2ix

40

45

48

52

54

62

70

∑= ∑=

Page 31: Material de apoio estatística 2017 1

4. Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

x s

Estaturas (cm) 175 5,0

Pesos (kg) 68 2,0

Temos: CVE = CVP =

Logo, nesse grupo de indivíduos, os pesos apresentam _________ (maior, menor) grau de dispersão que as estaturas.

5. Considere a seguinte distribuição de frequências com dados agrupados com intervalos de classe:

i Estaturas (cm) if ix ii xf 2ii xf

1 150 |---- 154 4

2 154 |---- 158 9

3 158 |---- 162 11

4 162 |---- 166 8

5 166 |---- 170 5

6 170 |---- 174 3

∑= ∑= ∑=

Calcule a amplitude total e o desvio padrão. R: AT = 24 cm e s = 5,57 cm. EXERCÍCIOS

1. Durante um determinado mês, os oito vendedores de uma concessionária venderam os seguintes números de unidades de veículos: 8, 11, 5, 14, 8, 11, 16, 11. Considerando este mês como uma população estatística de interesse, o número médio de unidades vendidas é de:_____? Calcule a amplitude total e o desvio padrão. R: x = 10,50, AT = 11 e s = 3,28.

ix if ii xf 2ii xf

∑= ∑= ∑=

Page 32: Material de apoio estatística 2017 1

2. Uma amostra de 17 operários de uma companhia apresentou os seguintes salários (R$) recebidos durante certa semana: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 240. Calcule a amplitude total e o desvio padrão. R: AT = R$ 100,00 e s = R$ 27,60.

ix if ii xf 2ii xf

∑= ∑= ∑=

3. Um especialista em padrões de trabalho observa, em um escritório, a quantidade de tempo requerida

para a digitação de uma amostra de 10 cartas, com os seguintes resultados enumerados em ordem crescente: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18. Calcule a amplitude total e o desvio padrão. R: AT = 13 min e s = 4,93 min.

ix if ii xf 2ii xf

∑= ∑= ∑=

4. Seja a distribuição de frequências com dados agrupados sem intervalos de classe:

ix if ii xf 2ii xf

2 1

3 3

4 5

5 8

6 5

7 4

8 2

∑= ∑= ∑=

Calcule a amplitude total e o desvio padrão. R: AT = 6 e s = 1,51.

Page 33: Material de apoio estatística 2017 1

5. Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente, considere a variável “número de caras obtidas”:

ix if ii xf 2ii xf

0 4

1 14

2 34

3 29

4 16

5 3

∑= ∑= ∑=

Calcule a amplitude total e o desvio padrão. R: AT = 5 e s = 1,13. 6. A tabela abaixo se refere às taxas mensais de aluguéis de apartamentos na cidade de Porto Alegre.

Calcule a amplitude total e o desvio padrão. R: AT = R$ 300,00 e s = R$ 61,99.

Aluguel (R$) Nº de apartamentos (if ) ix ii xf 2

ii xf

150 |---- 180 3

180 |---- 210 8

210 |---- 240 10

240 |---- 270 13

270 |---- 300 33

300 |---- 330 40

330 |---- 360 35

360 |---- 390 30

390 |---- 420 16

420 |---- 450 12

∑= ∑= ∑=

7. Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário

para realizar a auditoria de 50 balanços contábeis, tal como indicado na seguinte tabela. Calcule a amplitude total e o desvio padrão para o tempo de auditoria necessário para esta amostra de registros. R: AT = 50 min. e s = 12,28 min..

Tempo de auditoria (min)

Nº de balanços ( if ) ix ii xf 2

ii xf

10 |---- 20 3

20 |---- 30 5

30 |---- 40 10

40 |---- 50 12

50 |---- 60 20

∑= ∑= ∑=

Page 34: Material de apoio estatística 2017 1

8. Na distribuição de frequências a seguir estão reproduzidos os números médios de acidentes por 1.000 horas/homem em 50 indústrias mecânicas. Determinar a amplitude total e o desvio padrão.

Nº médio de acidentes

Nº de acidentes (if ) ix ii xf 2

ii xf

1,5 |---- 1,8 3

1,8 |---- 2,1 12

2,1 |---- 2,4 14

2,4 |---- 2,7 9

2,7 |---- 3,0 7

3,0 |---- 3,3 5

∑= ∑= ∑=

R: AT = 1,8 acidentes e s = 0,42 acidente. 9. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,

respectivamente, 18,3 e 1,47, calcule o coeficiente de variação. R: CV = 8,03%. 10. Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio

padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? R: Estatística (10,41%).

11. Medidas as estaturas de 1.017 indivíduos, obtivemos média igual a 162,2 cm e desvio padrão de 8,01

cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? R: Estatura (4,94 %).

12. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 6,05 cm.

Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? R: O de 125 moças.

13. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação

de 3,3%. Qual o desvio padrão desse grupo? R: s = 5,41 cm.

14. Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição. R: .72,51=x

Page 35: Material de apoio estatística 2017 1

5. CORRELAÇÃO E REGRESSÃO5.1. Introdução

Muitas vezes, na prática, necessitamos estudar o relacionamento de duas variáveis, coletadas como pares de valores, para resolver questões, como por exemplo:

O sucesso de um emprego pode ser predito com base no resultado Quanto maior for a produção, maior será o custo total; Quanto maior for a idade de um automóvel, menor será seu preço de venda.

Problemas como esses podem ser estudados através podemos determinar a “força” do relacionamento entre estas duas variáveis estudadas. As variáveis estudadas serão: variável dependente. Se o relacionamento entre x e y

um valor de x, através de uma fórmula matemática adequada, podemos aplicar a chamada

simples.

5.2 Diagrama de Dispersão É um gráfico no qual cada ponto plotado representa um par observado de valores para as vaestudadas (x, y), num sistema de eixos cartesianos. Através do diagrama de dispersão podemos ter uma idéia do tipo de relação entre as variáveis estudadas. A seguir temos alguns exemplos de diagramas de dispersão.

CORRELAÇÃO E REGRESSÃO

Muitas vezes, na prática, necessitamos estudar o relacionamento de duas variáveis, coletadas como pares de valores, para resolver questões, como por exemplo:

O sucesso de um emprego pode ser predito com base no resultado de testes;Quanto maior for a produção, maior será o custo total; Quanto maior for a idade de um automóvel, menor será seu preço de venda.

Problemas como esses podem ser estudados através de uma análise de correlação simplesorça” do relacionamento entre estas duas variáveis estudadas.

As variáveis estudadas serão: x, denominada de variável independente

y for consistente e necessitamos fazer uma predição para o valor de

, através de uma fórmula matemática adequada, podemos aplicar a chamada

É um gráfico no qual cada ponto plotado representa um par observado de valores para as va

), num sistema de eixos cartesianos. Através do diagrama de dispersão podemos ter uma idéia do tipo de relação entre as variáveis

A seguir temos alguns exemplos de diagramas de dispersão.

Muitas vezes, na prática, necessitamos estudar o relacionamento de duas variáveis, coletadas como

de testes;

Quanto maior for a idade de um automóvel, menor será seu preço de venda. análise de correlação simples, onde

orça” do relacionamento entre estas duas variáveis estudadas. variável independente, e y, denominada de

para o valor de y, conhecido

, através de uma fórmula matemática adequada, podemos aplicar a chamada análise de regressão

É um gráfico no qual cada ponto plotado representa um par observado de valores para as variáveis

Através do diagrama de dispersão podemos ter uma idéia do tipo de relação entre as variáveis

Page 36: Material de apoio estatística 2017 1

5.3 Coeficiente de Correlação Linear Medida do grau de associação (relacionamento) entre duas variáveis estudadas a partir de uma série de observações. Esta medida é também chamada de coeficiente de correlação de Pearson, em homenagem ao seu criador e é dada por:

( )( )( )[ ] ( )[ ]2222 ∑∑∑∑

∑ ∑∑

−−

−=

iiii

iiii

yynxxn

yxyxnr

Onde n é o número de pares de valores (x, y) observados e r varia no intervalo 11 ≤≤− r , para o

mesmo, temos que: • Valores de r próximos de (+1) indicam uma forte correlação positiva entre x e y; • Valores de r próximos de (– 1) indicam uma forte correlação negativa entre x e y; • Valores de r próximos de 0 indicam uma fraca correlação positiva ou negativa entre x e y.

A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis estudadas, conforme a seguinte tabela:

Obs.: Usar a equação de regressão somente quando r indicar correlação linear significativa.

5.4 Alguns Conceitos

Outliers – pontos muito afastados dos demais. Predição – as equações de regressão podem ser úteis para predizer (estimar) o valor de uma variável, dado um valor determinado da outra variável. Coeficiente Angular (a) – medida da variação que ocorre em uma característica quando outra característica se modifica de uma unidade. Intercepto – coeficiente linear (b) – ponto de intersecção da reta com o eixo das ordenadas (eixo y). Equivale ao valor de y quando x = 0. Equação das Retas de Regressão – funções resultantes do ajuste de uma função linear entre 2 variáveis y e x, define a linha reta que descreve a associação entre duas características e permite estimar o valor de uma medida pela outra. Para obter a reta de regressão é necessário calcular o Coeficiente angular “a” e o Coeficiente linear da reta com o eixo das ordenadas “b”.

Parâmetros da reta y = ax + b (Regressão): ( )( )

( )22 ∑∑∑ ∑∑

−=

ii

iiii

xxn

yxyxna e xayb −= .

Onde: n

xx iΣ= e

n

yy iΣ= .

Valor de r Correlação 0,0 nula

0,0 ----| 0,5 fraca 0,5 ----| 0,8 média 0,8 ---- 1,0 forte

1,0 perfeita

Page 37: Material de apoio estatística 2017 1

Exemplo. Consideremos as duas variáveis, Pesos e Comprimentos de Ursos (População), cujos dados coletados estão abaixo.

x Comprimento (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0

y Peso (lb) 80 344 416 348 262 360 332 34

Obs.: in. – polegada e lb – libras.

A relação entre as variáveis é evidenciada pela formação de um padrão no Diagrama de Dispersão.

Segue abaixo o Diagrama de Dispersão dos dados do problema.

Observando a tabela e o diagrama anteriores desenvolva os itens abaixo.

a) Preencha a tabela abaixo.

Comprimento ( ix ) Peso ( iy ) ii yx 2ix 2

iy

=∑ ________ =∑ _________ =∑ ______ =∑ ______ =∑ ______

b) Calcule o coeficiente de correlação de Pearson. r = 0,90 c) Tire conclusões: ________________ (há ou não há) evidência suficiente para apoiar a existência de

uma correlação linear significativa entre as duas variáveis. d) Encontre a equação da reta ajustada. y = 9,66 x – 351,65 e) Se um urso tem comprimento de 71,0 in., prediga seu peso. y = 334,21

Page 38: Material de apoio estatística 2017 1

EXERCÍCIOS

1. Sejam os seguintes diagramas de dispersão. Determine se há uma correlação linear positiva, uma

correlação linear negativa ou se não há correlação entre as variáveis.

2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:

Peso real ( ix ) Peso aparente ( iy ) ii yx

2ix 2

iy

18 10

30 23

42 33

62 60

73 91

97 98

120 159 =∑ ________ =∑ _________ =∑ ______ =∑

______

=∑

______

Com a tabela preenchida, calcule o índice de correlação.

3. Uma amostra de residências selecionadas aleatoriamente, num bairro, foi observada quanto à idade do imóvel (x), em anos, e ao preço de venda (y), em mil reais, resultando:

ix iy ii yx 2ix 2

iy

1 100

2 80

3 90

4 15

5 50

6 20 =∑ _______ =∑ _______ =∑ _______ =∑ _______ =∑ _______

Com os dados da tabela, responda os itens abaixo.

a) Estime a reta de regressão. b) Calcule o coeficiente de correlação x e y.

Page 39: Material de apoio estatística 2017 1

4. Considere os resultados de dois testes, x e y, obtidos por um grupo de alunos da escola A:

ix iy ii yx 2ix 2

iy

11 13

14 14

19 18

19 15

22 22

28 17

30 24

31 22

34 24

37 25 =∑ _______ =∑ _______ =∑ _______ =∑

_______

=∑ _______

Com os dados da tabela, calcule o coeficiente de correlação.

5. Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” (xi) e “volume de

produção nas empresas industriais” (yi), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores:

.13,22,96,84,16,12,72,20,34,11 22 =∑=∑=∑=∑=∑ iiiiii yxyxyx

Determine: a) O cálculo do coeficiente de correlação; b) A equação de regressão de y para x; 6. A variação do valor da UPC (Unidade Padrão de Capital), relativamente a alguns meses de 2009,

deu origem à tabela:

Meses ix Valores (R$) ( iy ) ii yx 2ix 2

iy

Maio 21,75

Junho 21,75

Julho 21,78

Agosto 21,78

Setembro 21,78

Outubro 21,81

Novembro 21,81

=∑

_____

=∑

_____________

=∑

________

=∑

________

=∑

________

Preencha a tabela e responda os itens abaixo. a) Calcule o grau de correlação. b) Estabeleça a equação de regressão de y sobre x. c) Estime o valor da UPC para o mês de dezembro. Sugestão: Substitua os meses, respectivamente, por 5, 6, ..., 11.

Page 40: Material de apoio estatística 2017 1

7. A partir da tabela:

ix iy ii yx 2ix 2

iy

1 70

2 50

3 40

4 30

5 20

6 10 =∑ ___________ =∑ _____________ =∑ ________ =∑ _______ =∑ _______

a) Calcule o grau de correlação; b) Determine a reta ajustada; c) Estime o valor de y para x = 0. 8. Usando uma amostra de 18 elementos casuais um agente estimou o coeficiente de correlação entre x

e y em 0,32. O que isso te comunica sobre essas duas variáveis nessa população? 9. Em certa população o coeficiente de correlação entre x e y é – 0,8. O que isso significa? 10. Quando você investiga a relação entre duas variáveis aleatórias contínuas, por que é importante fazer

um gráfico de dispersão dos dados? Respostas:

1. Correlação linear negativa, correlação linear positiva, não há correlação;

2. Índice de correlação r = 0,98

3. a) y = – 16,14 x + 115,66 b) r = – 0,83

4. r = 0,89

5. a) r = 0,54 b) y = 1,81 x + 0,01

6. a) r = 0,94 b) y = 0,34 x + 8,58 c) R$ 12,66

7. a) r = – 0,99 b) y = – 11,43 x + 76,68 c) y = 76,68

Page 41: Material de apoio estatística 2017 1

11. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (x) e a massa muscular (y).

Idade (xi) Massa muscular (yi) ii yx 2ix 2

iy

71 82

64 91

43 100

67 68

56 87

73 73

68 78

56 80

76 65

65 84

45 116

58 76

45 97

53 100

49 105

78 77

73 73

68 78 =∑ ________ =∑ _________ =∑ ________ =∑ _________ =∑ _________

Com os dados da tabela, responda os itens abaixo. a) O diagrama de dispersão está construído abaixo, interprete-o.

b) Calcule o coeficiente de correlação linear entre x e y. O que se pode concluir sobre a correlação de

posse do valor de r?

c) Ajuste uma reta de regressão para a relação entre as variáveis y: massa muscular (dependente) e x: idade (independente).

d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos.

Page 42: Material de apoio estatística 2017 1

12. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias.

Renda Familiar (xi) Gasto com

Alimentação (yi) ii yx

2ix 2

iy

3 1,5

5 2,0

10 6,0

10 7,0

20 10,0

20 12,0

20 15,0

30 8,0

40 10,0

50 20,0

60 20,0

70 25,0

70 30,0

80 25,0

100 40,0

100 35,0

100 40,0

120 30,0

120 40,0

140 40,0

150 50,0

180 40,0

180 50,0

200 60,0

200 50,0 =∑ _________ =∑ _________ =∑ _________ =∑ _________ =∑ _________

Faça o que se pede com o auxílio do Excel.

a) Faça o diagrama de dispersão e interprete-o. b) Calcular o coeficiente de correlação entre essas variáveis. O que se pode concluir sobre a correlação

de posse do valor de r. r = 0,95

c) Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. R: y = 0,26 x + 5,05

Page 43: Material de apoio estatística 2017 1

ANEXO

TABELA DE NÚMEROS ALEATÓRIOS (T.N.A.)

L/C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

1 5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1

2 2 8 8 0 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7

3 9 2 5 9 1 8 5 2 8 7 3 0 4 8 8 6 9 7 4 8 3 5 2 5 1

4 9 0 3 8 1 2 9 1 7 4 3 0 1 9 7 5 8 9 0 7 5 0 6 4 1

5 8 0 9 1 1 6 9 4 6 7 5 8 6 0 8 2 0 6 6 6 9 0 4 7 5

6 2 2 0 1 7 0 3 1 3 2 9 6 9 1 9 2 7 5 4 0 1 6 5 4 2

7 5 6 2 4 1 0 0 4 3 0 2 0 4 6 2 9 9 0 5 3 5 3 1 1 0

8 7 9 4 4 9 2 6 2 0 2 9 6 8 6 6 4 3 0 0 0 9 4 5 6 6

9 5 3 9 9 6 6 4 5 0 8 8 9 7 8 5 0 7 7 5 3 3 7 2 5 7

10 1 8 9 2 8 7 3 5 8 8 5 5 0 5 2 1 3 6 5 1 3 9 2 8 5

11 5 3 0 8 5 8 9 6 6 3 0 5 6 1 2 5 7 0 2 2 5 0 4 1 2

12 0 3 5 8 8 0 2 9 2 8 7 6 8 9 5 1 1 8 2 4 8 8 8 9 4

13 2 7 0 7 8 1 8 8 6 5 6 9 4 9 9 8 0 0 2 8 0 4 7 0 5

14 0 5 2 1 0 8 5 9 0 1 0 6 2 2 2 4 9 8 9 1 8 1 1 7 5

15 4 0 3 6 1 3 2 7 8 4 3 0 8 2 3 3 3 6 3 9 6 9 4 2 0

16 5 4 6 0 2 5 2 8 8 5 8 8 2 0 0 0 1 0 5 9 6 1 0 5 3

17 7 1 5 1 6 3 4 0 7 6 7 1 1 1 7 3 7 3 5 2 3 7 3 1 6

18 6 1 0 2 0 1 8 1 7 3 9 2 6 0 6 6 7 3 5 8 5 3 3 4 4

19 8 2 5 5 9 3 1 3 4 6 3 0 9 5 2 6 5 5 0 6 9 6 1 7 6

20 8 9 9 8 5 4 1 4 2 1 7 4 1 3 5 7 6 8 1 9 8 6 2 8 6

21 0 0 9 9 8 4 8 4 1 4 6 7 9 5 1 3 7 7 5 8 9 0 1 4 5

22 6 2 4 1 5 0 7 8 2 0 4 8 0 5 8 8 4 3 5 2 9 8 0 3 1

23 9 4 2 7 9 0 6 9 2 4 6 8 0 9 9 2 1 1 8 6 0 7 6 3 8

24 4 4 8 9 2 9 2 8 8 4 3 6 2 8 2 5 1 5 8 2 8 7 7 4 1

25 9 7 3 0 7 6 9 5 3 3 2 1 1 0 5 4 2 6 9 5 6 6 6 5 5

26 3 9 1 6 5 8 0 4 4 4 8 0 1 5 5 9 5 9 8 3 9 0 9 5 5

27 6 0 7 8 1 1 0 3 2 6 6 7 5 0 3 4 0 9 6 1 3 1 3 0 2

28 0 3 1 9 2 3 4 7 6 2 8 9 5 7 7 7 9 1 3 3 8 8 4 7 6

29 4 1 2 8 5 2 6 7 5 6 2 5 3 9 5 9 9 6 6 5 5 1 3 6 9

30 7 7 5 4 9 8 5 0 3 9 2 5 3 7 4 2 5 2 9 7 1 0 0 3 5

31 2 8 6 3 4 1 6 1 9 1 6 4 2 4 8 3 8 1 3 7 3 4 4 8 8

32 7 4 2 4 4 8 8 5 4 0 1 2 3 3 5 9 6 7 5 0 1 4 9 8 1

33 0 0 2 4 0 3 3 7 9 6 4 6 6 8 7 5 0 5 3 2 4 2 1 6 6

34 0 5 4 1 4 7 6 9 6 9 4 5 3 6 1 6 7 1 1 8 9 5 5 1 9

35 6 2 6 9 8 4 9 7 9 7 4 7 2 3 6 6 5 1 5 6 1 3 0 8 6

Page 44: Material de apoio estatística 2017 1

REFERÊNCIA BIBLIOGRÁFICA

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 4ª ed. São Paulo: Atual, 1987. CRESPO, Antônio Arnot. Estatística Fácil. 18ª ed. São Paulo: Saraiva, 2002. DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1999. FONSECA, Jairo Simon da; MARTINS, Gilberto Andrade. Curso de Estatística. 6ª ed. São Paulo: Atlas, 1996. FREUND, John E.; SIMON, Gary. Estatística Aplicada: Economia, Administração e Contabilidade. 9ª ed. Porto Alegre: Bookman, 2000. HOEL, Paul G. Estatística Elementar. São Paulo: Atlas, 1980. McCLAVE, James T. Estatística para administração e economia. 10ª ed. São Paulo: Pearson Prentice Hall, 2009. MONTEIRO FILHO, Gercino. Estatística Prática para Administração e Contábeis. 1ª ed. Goiânia: Gráfica e Editora Vieira Ltda, 1999. LARSON, Ron. Estatística aplicada. 4ª ed. São Paulo: Pearson Prentice Hall, 2010. SILVA, Ermes Medeiros da. Et al. Estatística para os curso de Economia, Administração e Ciências Contábeis. 3ª ed. São Paulo: Atlas, v. I, 1999. SPIEGEL, Murray R. Estatística. 3ª ed. São Paulo: Makron Books, 1996. SPIEGEL, Murray R. Probabilidade e Estatística. Coleção Schaum. 3ª ed. São Paulo: Pearson Education do Brasil, 2004. STEVENSON, Willian. Estatística Aplicada à Administração. São Paulo: Harpes & Row, 1981. TRIOLA, Mário F. Introdução à Estatística. 7ª ed. Rio de Janeiro: LTC, 1999.