Prof. Nilson Costa
São Luis 2011
Prof. Nilson Costa
São Luis 2012
DISCIPLINA: PROBABILIDADE E ESTATÍSTICA
2
PROBABILIDADE E ESTATÍSTICA
DESAFIO DE EINSTEIN
3
INTRODUÇÃO
Nas pesquisas dentro de quaisquer áreas das
engenharias, sempre o engenheiro obtém um conjunto
de informações, à partir das quais procurará elucidar
dúvidas, trazer luz sobre o fenômeno em questão ou
mesmo tomar decisões.
Cada vez mais, o engenheiro tem se deparado com
banco de dados ou conjunto de informações preciosas,
que devem ser lidas e analisadas..
4
CONCEITOS BÁSICOS
1. Introdução O termo Estatística provém da palavra
Estado e foi utilizado originalmente para denominar
levantamentos de dados, cuja finalidade era orientar o
Estado em suas decisões.
Neste sentido foi utilizado em épocas remotas para
determinar o valor dos impostos cobrados dos
cidadãos, para determinar a estratégia de uma nova
batalha em guerras que se caracterizavam por uma
sucessão de batalhas. Atualmente, a estatística é
definida da seguinte forma:
5
CONCEITOS BÁSICOS
Estatística é um conjunto de métodos e processos
quantitativos que serve para estudar e medir os
fenômenos coletivos.
6
CONCEITOS BÁSICOS
POR QUE ESTATÍSTICA É IMPORTANTE ?
Porque nos permite entender e lidar com a noção de
variabilidade. Um exemplo típico é:
Produção de parafusos. Uma fábrica produz
parafusos, que devem ter seu diâmetro dentro de certas
especificações. Ao medirmos o diâmetro de 100
parafusos produzidos ao acaso existirão variações
individuais. Estas variações são importantes ? Até que
ponto as variações observadas são aceitáveis ?
Em geral um número em Estatística não é apenas um
número! A ele associamos uma medida de incerteza ou
variabilidade.
7
CONCEITOS BÁSICOS
População-
Coleção de todos os elementos cujas características
desejamos conhecer. Os elementos (ou "indivíduos")
na população não são necessariamente pessoas !
Amostra-
Subconjunto da população cujas características serão
medidas . A amostra será usada para descobrir
características da população.
Uma característica numérica estabelecida para toda
uma população(censo) é denominada parâmetro.
Uma característica numérica estabelecida para uma
amostra é denominada estimador(estatística).
8
EXEMPLOS
1) População = eleitores na cidade do Rio de Janeiro
Amostra = 650 eleitores escolhidos aleatoriamente
Característica de interesse : percentual de eleitores
que planejam votar num candidato X nas próximas
eleições.
2) População = automóveis Uno Mille produzidos em
1995
Amostra = todos os automóveis produzidos em agosto
de 1995
Característica de interesse = nº de defeitos
apresentados nos primeiros 3 meses de uso,
quilometragem média , e uma possível relação entre
estas duas variáveis.
9
EXEMPLOS
3) População = todos os domicílios com TV na cidade
do Rio de Janeiro.
Amostra = 1000 domicílios com TV escolhidos ao
acaso.
Característica de interesse = percentual de audiência
de cada emissora de TV a cada dia da semana no
horário de 18 às 22 horas.
4) População = população acima de 15 anos na cidade
do Rio de Janeiro
Amostra = 200 pessoas com mais de 15 anos
10
EXEMPLOS
Características de interesse =
1- percentual de bebedores de cerveja
2- dentre os bebedores de cerveja, quantos são
homens ?
3- dentre os bebedores de cerveja, quantos preferem
Brahma ?
4- dentre os bebedores de Brahma, quantas cervejas
eles tomam por semana e a que classe social eles
pertencem ? Existe alguma relação entre estas 2
variáveis (consumo e classe social) ?
11
CONCEITOS BÁSICOS
Em resumo :
A partir de uma amostra coletamos informações que
nos permitirão aprender alguma coisa interessante
sobre a população.
12
PROCESSOS ESTATÍSTICOS DE ABORDAGEM
Quando solicitados a estudar um fenômeno coletivo
podemos optar entre os seguintes processos
estatísticos:
a) Censo: é uma avaliação direta de um parâmetro,
utilizando-se todos os componentes da população.
b) Estimação: é uma avaliação indireta de um
parâmetro, com base em um estimador através do
cálculo de probabilidades.
13
PROCESSOS ESTATÍSTICOS DE ABORDAGEM
Propriedades Principais do Censo:
• Admite erro processual zero e tem confiabilidade
100%.
• É caro.
• É lento.
• É quase sempre desatualizado.
• Nem sempre é viável.
14
PROCESSOS ESTATÍSTICOS DE ABORDAGEM
Propriedades Principais da Estimação:
• Admite erro processual positivo e tem
confiabilidade menor que 100%.
• É barata.
• É rápida.
• É atualizada.
• É sempre viável.
15
DADOS ESTATÍSTICOS
Suponha agora que você obteve uma amostra e, dentro
desta amostra você coletou dados numéricos (por
exemplo, a porcentagem de audiência da TV Globo
nos domingos à noite).
O que fazer com isso ? Existem 2 possibilidades
Você pode simplesmente descrever estes dados
numéricos através de gráficos e tabelas.
Isto é chamado de estatística descritiva. A maioria das
pesquisas de mercado faz só isso, que é sem dúvida,
muito importante.
16
DADOS ESTATÍSTICOS
você pode tentar tirar conclusões sobre as
características da população a partir dos dados
observados na amostra. Isto se chama estatística
inferencial, Estatística Indutiva (ou simplesmente
estatística !), e será a nossa grande preocupação neste
curso.
Para que a gente consiga fazer isso, é necessário ter
uma noção bastante abrangente de Probabilidades, e
isto irá ocupar grande parte do nosso curso.
17
ESTATÍSTICA DESCRITIVA
A Estatística Descritiva, na sua função de descrição
dos dados, tem as seguintes atribuições:
a) A obtenção dos dados estatísticos.
b) A organização dos dados.
c) A redução dos dados.
d) A representação dos dados.
e) A obtenção de algumas informações que auxiliam a
descrição do fenômeno observado.
18
ESTATÍSTICA DESCRITIVA
a) A obtenção ou coleta de dados
é normalmente feita através de um questionário ou de
observação direta de uma população ou amostra.
b) A organização dos dados
consiste na ordenação e crítica quanto a correção dos
valores observados, falhas humanas, omissões,
abandono de dados duvidosos etc.
c) Redução dos dados
O entendimento e compreensão de grande quantidade
de dados através da simples leitura de seus valores
individuais é uma tarefa extremamente árdua e difícil
mesmo para o mais experimentado pesquisador.
19
ESTATÍSTICA DESCRITIVA
c) A representação dos dados - Os dados estatísticos
podem ser mais facilmente compreendidos quando
apresentados através de uma representação gráfica, o
que permite uma visualização instantânea de todos os
dados.
20
ESTATÍSTICA DESCRITIVA
Dados Brutos
Quando fazemos n observações diretas em um
fenômeno coletivo ou observamos as respostas a uma
pergunta em uma coleção de n questionários, obtemos
uma sequência de n valores numéricos. Tal sequência
é denominada dados brutos.
Dados brutos é uma sequência de valores numéricos
não organizados, obtidos diretamente da
observação de um fenômeno coletivo.
21
ESTATÍSTICA DESCRITIVA
Exemplo: No final do ano letivo, um aluno obteve as
seguintes notas bimestrais em Matemática:
4; 8; 7,5; 6,5.
Neste exemplo, X representa nota bimestral e pode ser
apresentada na forma: X:4; 8; 7,5; 6,5. (Dados Brutos)
Rol - Quando ordenamos na forma crescente ou
decrescente, os Dados Brutos passam a se chamar Rol.
Portanto:
Rol é uma sequência ordenada dos Dados Brutos.
X: 4; 6,5; 7,5; 8. (Rol)
22
Exercícios Propostos
23
Exercícios Propostos
Construa o rol para sequência de dados brutos:
a)X: 2, 4, 12, 7, 8, 15, 21, 20 =>
X: 2, 4, 7, 8, 12, 15, 20, 21
b)Y: 3, 5, 8, 5, 12, 14, 13, 12, 18 =>
Y: 3, 5, 5, 8, 12, 12, 13, 14, 18
c)Z: 12, 2; 13, 9; 14, 7; 21, 8; 12, 2; 14, 7 =>
Z: 12, 2; 12, 2; 13, 9; 14, 7; 14, 7; 21, 8
d)W: 8, 7, 8, 7, 8, 7, 9 =>
W: 7, 7, 7, 8, 8, 8, 9
24
SÉRIES ESTATISTICAS
A Estatística descritiva apresenta duas formas básicas
para a redução do número de dados com os quais
devemos trabalhar, chamadas variável discreta e
variável contínua.
EXEMPLO: Suponha que observamos as notas de 30
alunos em uma prova e obtivemos os seguintes
valores:
25
SÉRIES ESTATISTICAS
Se entendermos como frequência simples de um
elemento o número de vezes que este elemento figura
no conjunto de dados, podemos reduzir
significativamente o número de elementos com os
quais devemos trabalhar.
Para isto organiza-se o conjunto de dados na forma de
uma série estatística chamada variável discreta.
26
DISTRIBUIÇÃO DE FREQUÊNCIA
VARIÁVEL DISCRETA
É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna em
ordem crescente apenas os valores distintos da série e
na segunda coluna colocamos os valores das
frequências simples correspondentes.
Muito
Fácil
27
Se usarmos f para representar frequência simples, a
sequência (1) pode ser representada pela tabela:
DISTRIBUIÇÃO DE FREQUÊNCIA
28
OBSERVAÇOES:
(1) Note que conseguimos reduzir de 30 elementos
que constituíam a série original para apenas 12
elementos.
(2) Note também que a variável discreta só é uma
forma eficiente de redução dos dados, quando o
número de elementos distintos da série for pequeno.
DISTRIBUIÇÃO DE FREQUÊNCIA
29
Construção da Variável Discreta
Basta observar quais são os elementos distintos da
sequência, ordená-los, e colocá-los na primeira coluna
da tabela.
Em seguida computar a frequência simples de cada
elemento distinto e colocá-la na segunda coluna da
tabela.
Exemplo de construção de uma variável discreta:
A sequência abaixo representa a observação do
numero de acidentes por dia, em uma rodovia, durante
20 dias.
DISTRIBUIÇÃO DE FREQUÊNCIA
30
DISTRIBUIÇÃO DE FREQUÊNCIA
31
VARIÁVEL CONTÍNUA
Suponha que a observação das notas de 30 alunos em
uma prova nos conduzisse aos seguintes valores:
Observando estes valores notamos grande número de
elementos distintos, o que significa que neste caso a
variável discreta não é aconselhável a redução de
dados.
DISTRIBUIÇÃO DE FREQUÊNCIA
32
Nesta situação é conveniente agrupar os dados por
faixas de valores, ficando a série com a seguinte
apresentação:
Esta apresentação da série de valores é denominada
variável contínua.
DISTRIBUIÇÃO DE FREQUÊNCIA
33
Construção da Variável Contínua - A construção da
variável contínua requer o conhecimento de alguns
conceitos que vamos estabelecer aproveitando a tabela
abaixo como exemplificação:
DISTRIBUIÇÃO DE FREQUÊNCIA
34
1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA
É a diferença entre o maior e o menor elemento de
uma sequência.
Representando a amplitude total por A, o maior
elemento da sequência X por XmAx , e o menor
elemento por Xmín, a amplitude total é denotada por:
DISTRIBUIÇÃO DE FREQUÊNCIA
35
No exemplo da sequência que deu origem a tabela (2),
Xmáx = 9,5 e Xmín = 2, portanto:
A amplitude total representa o comprimento total da
sequência e é dada na mesma unidade de medida dos
dados da sequência.
DISTRIBUIÇÃO DE FREQUÊNCIA
36
2. INTERVALO DE CLASSE - é qualquer
subdivisão da amplitude total de uma série estatística.
No exemplo da tabela (2) subdividimos a amplitude
total em quatro classes, obtendo os intervalos de classe
OBS Note que na realidade não trabalhamos com a
At = 7,5 e sim com a amplitude total ajustada para 8
como justificaremos adiante.
DISTRIBUIÇÃO DE FREQUÊNCIA
37
3. LIMITE DE CLASSE: cada intervalo de classe
fica caracterizado por dois números reais.
O menor valor é chamado limite inferior da classe e
será indicado por I.
O maior valor é chamado limite superior da classe e
será indicado por L.
Por exemplo, na Classe
4. AMPLITUDE DO INTERVALO DE CLASSE é
a diferença entre o limite superior e o limite inferior da
classe. Se usarmos h para representar a amplitude do
intervalo de classe podemos estabelecer:
DISTRIBUIÇÃO DE FREQUÊNCIA
38
OBSERVAÇÃO:
(1) Na realidade, as classes não precisam
necessariamente ter a mesma amplitude como no
exemplo acima.
Porém, sempre que possível, devemos trabalhar com
classes de mesma amplitude. Isto facilita os cálculos
posteriores.
(2) Note que usamos para representar as classes,
intervalos reais semiabertos a direita. Isto significa que
o intervalo contém o limite inferior, mas não contém o
limite superior.
DISTRIBUIÇÃO DE FREQUÊNCIA
39
Desta forma, o último intervalo da série que é 8 ├ 10
não contém o valor 10.
É por isso que não utilizamos a amplitude 7,5, pois se
isto fosse feito, o limite superior da última classe seria
9,5 e como o limite superior não deve pertencer a
classe, o elemento 9,5 da sequência estatística original
ficaria sem classificação.
Como vamos utilizar este critério, precisaremos ajustar
sempre o valor máximo da série ao definir a amplitude
total. Outros critérios poderiam ser adotados como o
intervalo real semiaberto a esquerda..
DISTRIBUIÇÃO DE FREQUÊNCIA
40
5. NÚMERO DE CLASSES: o número de classes a
ser utilizado depende muito da experiência do
pesquisador e das questões que ele pretende responder
com a variável contínua.
Isto pode ser verificado facilmente pelo próprio
interessado ao longo desta exposição.
Para efeito de nossos exemplos, utilizaremos o critério
da raiz para a determinação do número de classes.
O CRITÉRIO DA RAIZ Se a sequência estatística
contém n elementos e se indicarmos por K número de
classes a ser utilizado, então pelo critério da raiz:
DISTRIBUIÇÃO DE FREQUÊNCIA
41
Como o número K de classes deve ser
necessariamente um número inteiro e como
dificilmente 𝑛 , é um número inteiro, deixaremos
como opção para o valor de K o valor inteiro mais
próximo de 𝑛, uma unidade a menos ou mais que
este valor.
No exemplo da tabela (2), n = 30 e consequentemente
k = 30=5,477= 5 ou 6, as opções para K então são: 4
ou 5 ou 6.
DISTRIBUIÇÃO DE FREQUÊNCIA
42
COMENTÁRIO: Existem outros critérios para a
determinação do número de classes, como por
exemplo a fórmula de STURGES. Segundo
STURGES, O número K de classes é dado por:
Para valores de n muito grandes, esta fórmula
apresenta mais vantagens, embora apresente o mesmo
problema de aproximação do valor de K.
DISTRIBUIÇÃO DE FREQUÊNCIA
43
A amplitude do intervalo de classe que designamos
por h é determinada da seguinte forma
observe que a opção por quatro classes, foi feita em
função de um valor de h mais fácil de se operar.
Se tivéssemos optado por cinco classes, o valor de h
seria 8/5 = 1,6; se tivéssemos optado por seis classes,
o valor de h seria 8/6 = 1,3333 ...
DISTRIBUIÇÃO DE FREQUÊNCIA
44
6. FREQUÊNCIA SIMPLES DE UMA CLASSE fi
chama-se frequência simples de uma classe ao número
de elementos da sequência que são maiores ou iguais
ao limite inferior desta classe e menores que o limite
superior desta classe.
No exemplo 2, a frequência simples da primeira classe
é o número de elementos da sequência que são
maiores ou iguais a 2 e menores que 4.
Note que os valores da sequência nestas condições são
os valores 3; 2,5; 2; 3,5.
DISTRIBUIÇÃO DE FREQUÊNCIA
45
Portanto, a frequência simples da primeira classe é 4.
Da mesma forma determinamos as frequências
simples das demais classes, completando o quadro
representativo da variável contínua.
DISTRIBUIÇÃO DE FREQUÊNCIA
46
EXEMPLO: CONSTRUÇÃO DE UMA
VARIÁVEL CONTÍNUA
Um teste para aferir o Quociente de Inteligência em
determinada classe de alunos de uma Faculdade de
São Luis deu origem a sequência de valores.
DISTRIBUIÇÃO DE FREQUÊNCIA
47
Para a construção da variável contínua, devemos
determinar o número de elementos da sequência.
Verificamos que a sequência possui n = 70 elementos.
Pelo critério da raiz K = 𝒏. No caso, K = 𝟕𝟎= 8,37.
O valor inteiro mais próximo é 8. Portanto, temos
opção para construir a variável contínua com 7 ou 8 ou
9 classes.
O maior valor da sequência é Xmáx=139 e o menor
valor da sequência é Xmím = 61.
Amplitude total da sequência é At = 139 - 61 = 78.
DISTRIBUIÇÃO DE FREQUÊNCIA
48
No entanto, sabemos que pelo fato de o critério
adotado do intervalo de classe ser semiaberto a direita,
devemos ajustar o valor Xmáx.
Se ajustássemos Xmáx para 140, a amplitude ajustada
passaria a ser At = 140 - 61 = 79.
Este valor não é divisível de forma inteira nem por 7
nem por 8 e nem por 9, que são nossas opções de
classes.
Nesta situação devemos ajustar Xmáx para 141 obtendo
a At= 141 – 31 = 80 que é divisível exatamente por 8,
obtendo-se uma amplitude do intervalo de classe h
dada por:
DISTRIBUIÇÃO DE FREQUÊNCIA
49
Observe que o ajuste do valor Xmáx foi de duas
unidades, passando de 139 para 141.
A experiência do pesquisador, nesta situação, o levaria
a distribuir este erro de duas unidades, iniciando a
representação da série em 60 e terminando em 140.
A amplitude total ajustada para a série é:
At = 140 - 60 = 80.
O comprimento do intervalo de classe é h = 10 é o
número de classes K=8 .
DISTRIBUIÇÃO DE FREQUÊNCIA
50
Computando as frequências simples de cada classe,
construímos a variável contínua representativa desta
série.
DISTRIBUIÇÃO DE FREQUÊNCIA
51
A variável contínua é conceituada como uma
representação tabular em que colocamos na primeira
coluna os intervalos de classe e na segunda coluna os
valores das frequências simples correspondentes.
A coluna "classe" tem a finalidade apenas de facilitar a
referência as classes, não fazendo parte da variável
contínua.
O quadro final tanto da variável discreta como da
variável contínua recebe o nome de distribuição de
frequência.
DISTRIBUIÇÃO DE FREQUÊNCIA
52
1. Uma pesquisa sobre a idade, em anos de uma classe
de calouros de uma faculdade, revelou os seguintes
valores:
18, 17, 18, 20, 21, 19, 20, 18, 17, 19, 20, 18, 19, 18,
19, 21, 18, 19, 18, 18, 19, 19, 21, 20, 17, 19, 19, 18,
18, 19, 18, 21, 18, 19, 19, 20, 19, 18, 19, 20, 18, 19,
19, 18, 20, 20, 18, 19, 18, 18
Agrupe, por frequência, estes dados.
Solução:
EXERCÍCIOS PROPOSTOS
53
2. Uma auditoria em uma grande empresa observou o
valor de 50 notas fiscais emitidas durante um mês.
Esta amostra apresentou os seguintes valores em
dólares: Agrupe, por frequência, estes dados.
EXERCÍCIOS PROPOSTOS
54
2. sol: Uma solução com uma margem de erro mínima
é:
EXERCÍCIOS PROPOSTOS
55
At = Xmax – Xmin = 42320,00 – 6551,00 = 35769,00
𝐾 = √𝑁 = √50 = 7,07
EXERCÍCIOS PROPOSTOS
56
3. Uma empresa automobilística selecionou ao acaso,
uma amostra de 40 revendedores autorizados em todo
o Brasil e anotou em determinado mês o número de
unidades adquiridas por estes revendedores. Obteve os
seguintes dados:
10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26
24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28
30 16 12 20
Agrupe, por frequência, estes dados.
EXERCÍCIOS PROPOSTOS
57
3. Uma solução com uma margem de erro mínima é:
At= 39 – 6 = 33 e At ajustada = 40 - 6 = 34,
o que não é exatamente divisível por 6, nem por 7,
nem por 8.
Ajustamos a amplitude para At = 40 - 5 = 35 para
distribuir o erro.
Podemos optar por 5 ou por 7 classes. Obviamente, a
melhor opção é por sete classes.
EXERCÍCIOS PROPOSTOS
58
EXERCÍCIOS PROPOSTOS
59
4. Uma indústria embala peças em caixas com 100
unidades. O controle de qualidade selecionou 48
caixas na linha de produção e anotou em cada caixa o
número de peças defeituosas. Obteve os seguintes
dados:
Agrupe, por frequência, estes dados.
EXERCÍCIOS PROPOSTOS
60
4. solução:
EXERCÍCIOS PROPOSTOS
61
5. Um banco selecionou ao acaso 25 contas de pessoas
físicas em uma agência, em determinado dia, obtendo
os seguintes saldos em dólares:
Agrupe, por frequência, estes dados.
EXERCÍCIOS PROPOSTOS
62
5. Solução:
At ajustada = 52.501 - 3.250 = 49.251, que não é
divisível por forma inteira nem por 4, nem por 5 e nem
por 6.
Neste caso, consideramos a
At ajustada 52.501 - 3.249= 49252
EXERCÍCIOS PROPOSTOS
63
EXERCÍCIOS PROPOSTOS
64
Derivadas
AGORA É A SUA
VEZ BONS
ESTUDOS
Obrigado pela Oportunidade
65
BUSSAR, Wilton de O. MORETTIN, Pedro A. Estatística
básica. São Paulo: Saraiva,2004.
LEVINE, D. M. et al. Estatística: teoria e aplicações. Rio de
Janeiro: LTC, 2000.
OLIVEIRA, F. E. M. Estatística e Probabilidade. São Paulo:
Atlas, 1999.
MEDEIROS, E.;MEDEIROS, E; GONÇALVES, V.;
Estatística. São Paulo: Atlas, 1999.
MEYER, P. L. Probabilidade – aplicações à Estatística. Rio
de Janeiro: LTC, 1995.
Referências Bibliográficas
Top Related