Post on 06-Jul-2018
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
1/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 1
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
2/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 2
A P R E S E N T A Ç Ã O :
Prof.: EWERTON SANCHES MORAES
Graduação em Estatística pela Faculdade e Ciência e Tecnologia / UNESP
Curso : Introdução à Probabilidade e Estatística
Departamento Responsável : Laboratório de Engenharia de Produção / LEPROD
Carga Horária: 68 horas/aula e Créditos: 4
Sistema de Avaliação: (P1 + P2)/2= N (Nota). Se N
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
3/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 3
BIBLIOGRAFIA
1. BUSSAB.W.O. ,Estatística Básica serie de Métodos Quantitativos V. 3. Atual
Editora. São Paulo, 1997.
2. MORETIN P. A. ,A Introdução a Estatística para Ciência Exata. Atual Editora.
3. LAPPONI J.C. ,Estatística usando Excel. Lapponi Editora, 2000.
4. MEYER P.L. ,Probabilidade Aplicações a Estatística. Editora LTC.
5. SPIEGEL M. R. ,Probabilidade e Estatística. Makron Books.
6. LIPZCHUTZ S. ,Probabilidade. Makron Books.
7. Montgomery, D.C. ; Runger, G.C., John Willey and Sons, “Applied Statistics And
Probability for Engineers”, New York, 1994
8. Pedro Luiz de Oliveira Costa Neto , Estatística.
9. Bhattacharyya – Johnson, “Statistics: Principles and Methods”,.
10. Bethe – Duran – Bullion, “Statistical Methods for engineers and scientists”,
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
4/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 4
A palavra estatística é do latim e significa “estado”. Este termo provém do
primeiro uso da estatística e tinha como função o registro de dados (nº de habitantesda população, nº de casamentos...) e a elaboração de tabelas e gráficos paradescrever resumidamente um determinado país em números.
Passado muito tempo a estatística evoluiu, tornando-se uma ampla e
complexa ciência, tirando conclusões sobre o conjunto todo a partir de amostrasrepresentativas.
A arte de torturar os números
até que eles confessem!
Uma boa definição de estatística é a de ser um conjunto de métodosespecialmente apropriados à coleta, à apresentação (organização, resumo edescrição), à análise e à interpretação de dados de observação, tendo como objetivo
a compreensão de uma realidade específica para a tomada da decisão.
Definição ESTATÍSTICA
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
5/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 5
Mais precisamente a estatística se preocupa com:
1. A coleta, a organização, a sintetização e a apresentação de dados;
2. A medição da variação nos dados;
3. A estimativa dos parâmetros da população e a determinação da precisão dasestimativas;
4. A aplicação dos testes de hipótese em relação aos parâmetros;
5. A análise da relação entre duas ou mais variáveis.
A estatística trabalha com dois conjuntos de dados: o
universo e a
amostra. Apesarde a estatística se preocupar em obter informações sobre a população,dificilmente ela estuda todos os componentes da mesma (censo).
Definição ESTATÍSTICA
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
6/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 6
Estatística experimental: é a parte que fornece os métodos de análise einterpretação dos resultados dos experimentos.
Obs. Experimento é uma pesquisa de forma ordenadae controlada que visa gerar informações, obtendo
novos dados ou confirmações para hipóteses jáexistentes.
Definição ESTATÍSTICA
A estatística pode ser dividida em duas:
Estatística descritiva: é a parte que procura os melhores métodos para coletar,ordenar e sumarizar os dados dos experimentos.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
7/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 7
Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.
Grandes áreas da Estatística
Para fins de apresentação, é usual se dividir a estatística em três
grandes áreas, embora não se trate de ramos isolados:
• Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam
coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma
população, ou amostra;
• Estatística Inferencial – Processo de se obter informações sobre uma população
a partir de resultados observados na amostra;
• Probabilidade - Modelos matemáticos que explicam os fenômenos estudados
pela Estatística em condições normais de experimentação.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
8/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 8
Em estatística, utilizamos extensamente os termos: população, amostra,
censo, parâmetros, estatística, dados discretos, dados contínuos, dados
quantitativos e dados qualitativos; que estaremos definindo abaixo para maior
compreensão.
• População: é uma coleção completa de todos os elementos a serem estudados.
• Amostra: é uma subcoleção de elementos extraídos de uma população.
• Censo: é uma coleção de dados relativos a todos os elementos de uma
população.
• Parâmetros: é uma medida numérica que descreve uma característica de uma
população.
• Estatística: é uma medida numérica que descreve uma característica de uma
amostra.
Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
9/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 9
• Dados qualitativos: podem ser separados em diferentes categorias que se
distinguem por alguma característica não-numérica.
Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.
• Dados contínuos: resultam de um número infinito de valores possíveis que podem
ser associados a pontos em uma escala contínua de tal maneira que não haja
lacunas.
• Dados discretos: resultam de um conjunto finito de valores possíveis, ou de um
conjunto enumerável de valores.
• Dados quantitativos: consistem em números que representam contagens ou
medidas.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
10/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 10
Variáveis de dados qualitativos
Variáveis Qualitativas - Nominais e Ordinais
São aquelas que se baseiam em qualidades e não podem ser mensuradasnumericamente. Uma variável é qualitativa quando seus possíveis valores sãocategorias.
Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo,a classe social (A,B,C,D, ou E).
Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou
ordenadas,não tem nenhuma ordem de variações, como a cor dos olhos, o local denascimento, sexo, carreira, região onde mora.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
11/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 11
Variáveis de dados qualitativos
Iniciaremos essa apresentação com os dados de natureza qualitativa, que são osmais fáceis de tratar do ponto de vista da análise descritiva.
Exemplo: Experimento de observação de Ursos numa determinada região dos EUA
No exemplo dos ursos, uma das duas variáveis qualitativas presentes é o sexo dos
animais.
Para organizar os dados provenientes de uma variável qualitativa, é usual fazer umatabela de frequências, como a Tabela 1, onde estão apresentadas as freqüenciascom que ocorrem cada um dos sexos no total dos 97 ursos observados.
Cada categoria da variável sexo (feminino, masculino) é representada numa linha databela.
http://leg.ufpr.br/~silvia/CE055/node10.htmlhttp://leg.ufpr.br/~silvia/CE055/node10.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
12/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 12
Variáveis de dados qualitativos
Há uma coluna com as contagens de ursos em cada categoria (frequência absoluta)
e outra com os percentuais que essas contagens representam no total de ursos(frequência relativa).
Esse tipo de tabela representa a distribuição de frequências dos ursos segundo avariável sexo.
Como a variável sexo é qualitativa nominal, isto é, não há uma ordem natural emsuas categorias, a ordem das linhas da tabela pode ser qualquer uma.
Tabela 1: Distribuição de freqüências dos ursos segundo sexo.
SexoFrequência
Absoluta
Frequência
Relativa (%)Feminino 35 36,1
Masculino 62 63,9
Total 97 100,0
Quando a variáveltabelada for dotipo qualitativaordinal, as linhas da
tabela defrequências devemser dispostas naordem existentepara as categorias.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
13/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 13
Variáveis de dados qualitativos
A Tabela 2 mostra a distribuição de frequências dos ursos segundo o mês deobservação, que é uma variável qualitativa ordinal.
Nesse caso, podemos acrescentar mais duas colunas com as frequênciasacumuladas (absoluta e relativa), que mostram, para cada mês, a frequência de
ursos observados até aquele mês.
Por exemplo, até o mês de julho, foram observados 31 ursos, o que representa32% do total de cursos estudados.
http://leg.ufpr.br/~silvia/CE055/node10.htmlhttp://leg.ufpr.br/~silvia/CE055/node10.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
14/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 14
Variáveis de dados qualitativos
Tabela 2: Distribuição de frequências dos ursos segundo mês de observação.
Mês de
Observação
Frequências Simples Frequências Acumuladas
Frequência
Absoluta
Frequência
Relativa (%)
Frequência
Absoluta
Acumulada
Frequência
Relativa
Acumulada
Abril 8 8,3 8 8,3
Maio 6 6,2 14 14,5
Junho 6 6,2 20 20,7
Julho 11 11,3 31 32,0
Agosto 23 23,7 54 55,7
Setembro 20 20,6 74 76,3Outubro 14 14,4 88 90,7
Novembro 9 9,3 97 100,0
Total 97 100,0 --- ---
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
15/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 15
Variáveis Quantitativas
São aquelas que são numericamente mensuráveis, ou seja, que seus possíveisvalores podem ser numéricos ou de contagem.
Variáveis de dados quantitativos:discretas e contínuas.
Variável Quantitativa Discreta: o conjunto de resultados possíveis podem serfinito ou enumerável. Exemplo: número de filhos, alunos numa escola e etc.
Estas ainda se subdividem em:
Variável Quantitativa Contínua: os valores formam um intervalo ou união denúmeros reais. Exemplo: peso, altura, pressão sistólica, nível de açúcar nosangue.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
16/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 16
Tabela 3: Distribuição de frequências do número de filhos por
família em uma localidade (25 lares).
Número defilhos
FrequênciaAbsoluta
FrequênciaRelativa (%)
Freq. RelativaAcumulada (%)
0 1 4,0 4,0
1 4 16,0 20,0
2 10 40,0 60,0
3 6 24,0 84,0
4 2 8,0 92,0
5 2 8,0 100,0
Total 25 100 ---
A Tabela 3 apresenta a distribuição de frequências do número de
filhos por família em uma localidade, que, nesse caso, assumiu apenas seisvalores distintos.
Analisando aTabela 3, podemosperceber que asfamílias mais
frequentes são as dedois filhos (40%),seguida pelasfamílias de trêsfilhos. Apenas 16%
das famílias têm maisde três filhos, massão ainda maiscomuns do quefamílias sem filhos.
Variáveis de dados quantitativos: discretas
http://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
17/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 17
A Figura 1 mostra a representação gráfica da Tabela 3 no gráfico à esquerda e a distribuição defrequências do número de filhos por família na localidade B no gráfico à direita.
Como o número de famílias estudadas em cada localidade é diferente, a frequência utilizadaem ambos os gráficos foi a relativa (em porcentagem), tornando os dois gráficos comparáveis.
Comparando os dois gráficos, notamos que a localidade B tende a ter famílias menosnumerosas do que a localidade A. A maior parte das famílias da localidade B (cerca de 70%)têm um ou nenhum filho.
Figura 1: Distribuição de frequências do número de filhos por família na localidade A (25 lares) e B (36 lares).
Variáveis de dados quantitativos: discretas
http://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
18/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 18
Quando a variável em estudo é do tipo contínua, que assume muitos valoresdistintos, o agrupamento dos dados em classes será sempre necessário naconstrução das tabelas de frequências.
A Tabela 4 apresenta a distribuição de frequências para o peso dos ursos machos.
A construção das classes da tabela de frequências é feita de modo a facilitar ainterpretação da distribuição de frequências, como discutido anteriormente.Geralmente, usamos tamanhos e limites de classe múltiplos de 5 ou 10.
Isso ocorre porque estamos acostumados a pensar no nosso sistema numérico,
que é o decimal. Porém, nada nos impede de construirmos classes de outrostamanhos (inteiros ou fracionários) desde que isso facilite nossa visualização einterpretação da distribuição de frequências da variável em estudo.
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
19/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 19
Tabela 4: Distribuição de frequências dos ursos machos segundo peso
Peso (kg) FrequênciaAbsoluta
FrequênciaRelativa (%)
Freq. Abs.Acumulada
Freq. Rel.Acumulada (%)
0 - 2 5 3 4,8 3 4,8
26 - 50 11 17,7 14 22,6
51 - 75 15 24,2 29 46,8
76 - 100 11 17,7 40 64,5
101 - 125 3 4,8 43 69,4
126 - 150 4 6,5 47 75,8
151 - 175 8 12,9 55 88,7
176 - 200 5 8,1 60 96,8
201 - 225 1 1,6 61 98,4
226 - 250 1 1,6 62 100,0
Total 62 100,0 - -
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
20/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 20
A representação gráfica da distribuição de frequências de uma variável contínua é
feita através de um gráfico chamado histograma, mostrado na Figura 2.
O histograma nada mais é do que o gráfico de barras verticais, porém construídocom as barras unidas, devido ao caráter contínuo dos valores da variável.
Figura 2: Histograma para a distribuição de frequências (absolutas e relativas) de pesos de ursos machos
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
21/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 21
Os histogramas da Figura 2 têm a mesma forma, apesar de serem construídosusando as frequências absolutas e relativas, respectivamente.
O objetivo dessas figuras é mostrar que a escolha do tipo de frequência a ser usada nãomuda a forma da distribuição. Entretanto, o uso da frequência relativa torna o histogramacomparável a outros histogramas, mesmo que os conjuntos de dados tenham tamanhos
diferentes (desde a mesma escala seja usada!)
Analisando o histograma para o peso dos ursos machos, podemos perceber que há doisgrupos de ursos: os mais leves, com pesos em torno de 50 a 75 Kg, e os mais pesados, compesos em torno de 150 a 175 Kg.
Essa divisão pode ser devida a uma outra característica dos ursos, como idades ou hábitosalimentares diferentes, por exemplo.
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
22/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 22
A Tabela 5 apresenta a distribuição de frequências para o peso dos ursos fêmeas,representada graficamente pelo histograma à esquerda na Figura 3.
Apesar de não haver, neste conjunto de dados, fêmeas com peso maior de que175 Kg, as três últimas classes foram mantidas para que pudéssemos compararmachos e fêmeas quanto ao peso.
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
23/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 23
Tabela 5: Distribuição de frequências dos ursos fêmeas segundo peso.
Peso (kg)Frequência
Absoluta
Frequência
Relativa (%)
Freq. Abs.
Acumulada
Freq. Rel.
Acumulada (%)
0 - 25 3 8,6 3 8,6
26 - 50 5 14,3 8 22,9
51 - 75 18 51,4 26 74,376 - 100 5 14,3 31 88,6
101 - 125 2 5,7 33 94,3
126 - 150 1 2,9 34 97,1
151 - 175 1 2,9 35 100,0
175 - 200 0 0 35 100,0
201 - 225 0 0 35 100,0
226 - 250 0 0 35 100,0
Total 35 100,0 - -
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
24/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 24
A Figura 3 também mostra o histograma para o peso dos ursos machos (à direita).
Note que ele tem a mesma forma dos histogramas da Figura 2, porém com asbarras mais achatadas, devido à mudança de escala no eixo vertical para torná-locomparável ao histograma das fêmeas.
Comparando as distribuições dos pesos dos ursos machos e fêmeas, podemosconcluir que as fêmeas são, em geral, menos pesadas do que os machos,distribuindo-se quase simetricamente em torno da classe de 50 a 75 Kg . O pesodas fêmeas é mais homogêneo (valores mais próximos entre si) do que o peso dosursos machos.
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
25/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 25
Figura 3: Histograma para a distribuição de frequências de pesos de ursos fêmeas (esquerda) e machos (direita)
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
26/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 26
Muitas vezes, a análise da distribuição de frequências acumuladas é mais
interessante do que a de frequências simples, representada pelo histograma.
O gráfico usado na representação gráfica da distribuição de frequências acumuladasde uma variável contínua é a ogiva, apresentada na Figura 4.
Para a construção da ogiva, são usadas as frequências acumuladas (absolutas ourelativas) no eixo vertical e os limites superiores de classe no eixo horizontal.
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
27/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 27
Figura 4: Ogivas para a distribuição de frequências de
pesos de ursos machos e fêmeas
O primeiro ponto da ogiva éformado pelo limite inferior daprimeira classe e o valor zero,indicando que abaixo do limiteinferior da primeira classe nãoexistem observações. Daí pordiante, são usados os limites
superiores das classes e suasrespectivas frequênciasacumuladas, até a última classe,que acumula todas asobservações. Assim, uma ogiva
deve começar no valor zero e, sefor construída com asfrequências relativasacumuladas, terminar com ovalor 100.
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
28/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 28
A ogiva permite que sejam respondidas perguntas do tipo:
a) Qual o percentual de ursos têm peso de até 125 Kg?Na Figura 5(a), traçamos uma linha vertical partindo do ponto 120 kg
até cruzar com cada ogiva (fêmeas e machos). A partir deste ponto decruzamento, traçamos uma linha horizontal até o eixo das frequênciasacumuladas, encontrando o valor de 70% para os machos e 95% para as
fêmeas. Assim, 95% das fêmeas têm até 125 kg, enquanto 70% dos machostêm até 125 kg. É o mesmo que dizer que apenas 5% das fêmeas pesam maisque 125 kg, enquanto 30% dos machos pesam mais que 125 kg.
b) Qual o valor do peso que deixa abaixo (e acima) dele 50% dos ursos?
Na Figura 5(b), traçamos uma linha horizontal partindo da frequênciaacumulada de 50% até encontrar as duas ogivas. A partir destes pontos deencontro, traçamos uma linha vertical até o eixo do valores de peso,encontrando o valor de 80 kg para os machos e 65 kg para as fêmeas.
Variáveis de dados quantitativos: contínuas
http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
29/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 29
Figura 5: Ogivas para a distribuição de frequências de pesos de ursos machos e fêmeas
Assim, metade dos machos pesam até 80 kg (e metade pesam mais que80 kg), enquanto metade das fêmeas pesam até 65 kg.
Variáveis de dados quantitativos: contínuas
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
30/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 30
CONSTRUINDO TABELAS DE FREQUÊNCIAS E GRÁFICOS
Uma das formas de organizar e resumir a informação contida emdados observados é por meio de tabela de frequências e gráficos.
Tabela de frequência: relaciona categorias (ou classes) de valores, juntamente com contagem (ou frequências) do número devalores que se enquadram em cada categoria ou classe.
1. Variáveis qualitativas: Podemos construir tabela de frequênciaque os quantificam por categoria de classificação e suarepresentação gráfica é mediante a construção de histograma,gráfico de barras, gráfico setorial ou em forma de pizza.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
31/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 31
Uma tabela quemostra classes ouintervalos de dados
com uma contagemdo número deentradas em cadaclasse
A frequência, f, deuma classe é onúmero de entradasde dados na classe
Classe Frequência, f
1 – 5 5
6 – 10 8
11 – 15 6
16 – 20 8
21 – 25 526 – 30 4
Limite inferior daclasse
Limite superior daclasse
Tamanho daclasse 6 – 1 = 5
DISTRIBUIÇÃO DE FREQUÊNCIA
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
32/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 32
Exemplo: construindo uma distribuição de frequência
A amostra seguinte lista o número de minutos que 50usuários da internet passaram conectados durante asessão mais recente. Construa uma distribuição de
frequência para as sete classes.50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 8641 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20
18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44
1. Número de classes = 7 (dados)2. Encontre o tamanho da classe
max min 86 711.29
#classes 7
Arredondando paracima: 12
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
33/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 33
Escolha o número de classes (k)Não existe uma regra universal para a escolha do número de
classes em um histograma. A sugestão é que seja usada a
seguinte tabela:
DICA
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
34/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 34
Limitemínimo
Limitemáximo
7Tamanhoda classe =
12
3. Use 7 (valor mínimo)como o primeiro limitemínimo. Adicione otamanho da classe, 12,
para definir o limitemínimo da próximaclasse.
7 + 12 = 19
19
31
43
55
6779
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
35/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 35
O limite máximo daprimeira classe é 18 (um amenos que o limitemínimo da segunda
classe).Some o tamanho daclasse, 12, para definir olimite máximo da próxima
classe.18 + 12 = 30
Limitemínimo
Limitemáximo
7
1931
43
55
67
79
Tamanho daclasse = 12
30
42
54
66
78
90
18
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
36/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 36
4. Faça um registro para cada entrada de dado na fileira da
classe apropriada.5. Conte os registros para encontrar a frequência total f para
cada classe.
Classe Registro Frequência, f
7 – 18 IIII I 6
19 – 30 IIII IIII 10
31 – 42 IIII IIII III 13
43 – 54 IIII III 8
55 – 66 IIII 5
67 – 78 IIII I 6
79 – 90 II 2
Σ f = 50
Tabela de freqüência
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
37/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 37
Ponto médio de uma classe
Classe Ponto médio Frequência, f
7 – 18 6
19 – 30 10
31 – 42 13
7 1812.5
2
19 3024.5
2
31 4236.5
2
Tamanho da classe = 12
(Limite mínimo da classe) + (Limite máximo da classe)
2
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
38/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 38
Frequência relativa de uma classePorção da porcentagem dos dados que se encaixaem um classe em particular
Classe Frequência, f Frequência relativa
7 – 18 6
19 – 30 10
31 – 42 13
60.12
50
100.20
50
130.26
50
Frequência relativa =
Frequência da classe
Tamanho da amostragem n f
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
39/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 39
Frequência acumulada de uma classeA soma das frequências daquela classe e de
todas as classes anteriores.
Classe Frequência, f Frequência acumulada
7 – 18 6
19 – 30 10
31 – 42 13
+
+
6
16
29
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
40/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 40
Classe Frequência, f
Ponto
médio
Frequência
relativa
Frequência
acumulada
7 – 18 6 12.5 0.12 6
19 – 30 10 24.5 0.20 16
31 –
42 13 36.5 0.26 2943 – 54 8 48.5 0.16 37
55 – 66 5 60.5 0.10 42
67 – 78 6 72.5 0.12 48
79 – 90 2 84.5 0.04 50
Σ f = 50
Tabela de freqüência
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
41/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 41
Diagrama de barras para a variável
grau de instrução
33,33%
50,00%
16,70%
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
1o Grau 2o Grau Superior
Representação gráfica de variáveis qualitativas
• Gráfico de Barras
• Diagrama circular, de setores ou em forma de “pizza”
Diagrama circular para a variável grau de
instrução
1o Grau
33%
2o Grau
50%
Superior
17%
33%
50%
17%
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
42/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 42
André Michel Guerry nasceu em 1802 na França, era um advogado eestudioso da estatística.
Os Histogramas foram apresentados pela primeira vez por A. M.GUERRY, em 1833, para descrever sua análise estatísticas sobre crimescontra a população em Paris. Faleceu em 1866.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
43/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 43
Histograma de frequência Um gráfico de barras que representa a distribuição da frequência
O eixo horizontal é quantitativo e mede os valores dos dados
O eixo vertical mede as frequências das classes
Barras consecutivas precisam se tocar
Valores dos dados
F r e q u ê n
c i a
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
44/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 44
Na estatística um histograma é uma representaçãográfica da distribuição de frequências de uma massa demedições, normalmente um gráfico de barras verticais.
Método gráfico para representar dispersão (variação) deum conjunto de dados.
É aconselhável que o número de dados (n) seja superior a30 para que tenhamos um histograma representativo.
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
45/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 45
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
46/59
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
47/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 47
ClasseFronteiras de
classesFrequência,
f
7 – 18 6.5 – 18.5 6
19 – 30 18.5 – 30.5 10
31 – 42 30.5 – 42.5 13
43 – 54 42.5 – 54.5 8
55 – 66 54.5 – 66.5 5
67 –
78 66.5 – 78.5 679 – 90 78.5 – 90.5 2
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
48/59
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
49/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 49
Solução: histograma de frequência
(usando pontos médios)Uso de Internet
F r e q u ê n c i a
Tempo on-line (em minutos)
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
50/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 50
6.5 18.5 30.5 42.5 54.5 66.5 78.5 90.5
É visível que mais da metade dos assinantes passaram entre 19 e 54minutos na Internet em sua sessão mais recente.
Uso de Internet
F r e q u ê n c i a
Tempo on-line (em minutos)
Solução: histograma de
frequência (usando fronteiras de classes)
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
51/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 51
Histograma de frequência relativaTem o mesmo formato e eixo horizontal que ohistograma de frequência correspondente
O eixo vertical mede as frequências relativas e nãoas frequências
Valores dos dados
F r e q u ê n
c i a
r e l a t i v
a
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
52/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 52
Construa um histograma de frequência relativa paraa distribuição da frequência do uso de Internet.
Classe
Fronteiras de
classes
Frequência,
f
Frequênci
a relativa
7 – 18 6.5 – 18.5 6 0.12
19 – 30 18.5 – 30.5 10 0.20
31 – 42 30.5 – 42.5 13 0.26
43 – 54 42.5 – 54.5 8 0.16
55 – 66 54.5 – 66.5 5 0.10
67 – 78 66.5 – 78.5 6 0.12
79 – 90 78.5 – 90.5 2 0.04
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
53/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 53
6.5 18.5 30.5 42.5 54.5 66.5 78.5 90.5
A partir do gráfico, pode-se perceber que 20% dos assinantes
de Internet passaram entre 18,5 minutos e 30,5 minutos
conectados.
Uso de Internet
F r e q
u ê n c i a
Tempo on-line (em minutos)
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
54/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 54
Histograma
Bases iguais
Construir um retângulo para cada classe, com base igual aotamanho da classe e altura proporcional à frequência da classe(f).
Agrupar os dados em intervalos de classes(distribuição de frequências)
Bases diferentes
Construir um retângulo para cada classe, com base igual ao tamanhoda classe e área do retângulo igual a frequência relativa da classe(fr).A altura será dada por
h = fr/base (densidade de frequência).
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
55/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 55
Classe de altura f fr
60,25 ⊢ 61,75
61,75 ⊢ 63,25
63,25 ⊢ 64,7564,75 ⊢ 66,25
66,25 ⊢ 67,75
67,75 ⊢ 69,25
69,25 ⊢ 70,75
70,75 ⊢ 72,2572,25 ⊢ 73,75
73,75 ⊢ 75,25
Total
1
10
213
7
20
7
159
8
92
0,011
0,109
0,0220,141
0,076
0,217
0,076
0,1630,098
0,087
1
Bases iguais
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
56/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 56
Bases diferentes (Classes diferentes)
Classes (meses) f fr h
0 |- 3 140 0,28 0,093
3 |- 12 100 0,20 0,022
12 |-24 80 0,16 0,013
24 |-60 180 0,36 0,010
Total 500 1,00
Distribuição das idades (em meses) de uma amostra de 500 criançasvacinadas
0 3 12 24 60
h0,10
0,02
0,04
0,06
0,08
=
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
57/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 57
Um polígono de frequência é um gráfico que se realiza
através da união dos pontos mais altos das colunas num
histograma de frequência (que utiliza colunas verticais para
mostrar as frequências).
Polígono de Frequência
Os polígonos de frequência para dados agrupados,
por sua vez, constroem-se a partir da marca de classe que
coincide com o ponto médio de cada coluna do histograma.
Quando são representadas as frequências acumuladas deuma tabela de dados agrupados, obtém-se um histograma de
frequências acumuladas, que permite dispor em diagrama o
seu polígono correspondente.
http://conceito.de/poligono-de-frequenciahttp://conceito.de/poligono-de-frequencia
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
58/59
28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 58
Geralmente, os polígonos de frequência sãousados quando se pretende mostrar mais de uma distribuição
ou a classificação cruzada de uma variável quantitativa
contínua com uma qualitativa ou quantitativa discreta num
mesmo gráfico.
O ponto que tiver mais altura num polígono de
frequência representa a maior frequência, ao passo que a
área abaixo da curva inclui a totalidade dos dados existentes.
Convém lembrar que a frequência é a repetição menor oumaior de uma ocorrência, ou a quantidade de vezes que um
processo periódico se repete por unidade de tempo.
http://conceito.de/poligono-de-frequenciahttp://conceito.de/poligono-de-frequencia
8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf
59/59