60662445
-
Upload
jailton-nogueira-medeiros -
Category
Documents
-
view
46 -
download
3
Transcript of 60662445
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
1
Unidade 01: Conhecendo a Estatística
Aula 01: O que é Estatística
OBJETIVO DA AULA
Nesta aula você aprenderá como surgiu a Estatística, alguns aspectos históricos de seu desenvolvimento e qual a utilidade no seu dia a dia. Você entenderá porque o estudo dos conceitos estatísticos é imprescindível para a sua profissão. Compreenderá que a Estatística contribui para o desenvolvimento do bem-estar social, sendo decisória nos processos políticos governamentais, configurando-se como um conhecimento obrigatório a fim de minimizar a exclusão social.
DESENVOLVIMENTO
O conhecimento humano
O que diferencia o homem do restante dos animais é a sua capacidade de raciocínio, de criação
e de transformação da realidade externa em idéias no seu cérebro.
O conhecimento humano resulta do processo de transformação da
realidade material em conceitos, isto é, o conhecimento humano é
construído pelo homem quando consegue elaborar conceitos que
expliquem a realidade.
A ciência que estuda o processo de transformação da realidade
exterior em idéias é a Filosofia. As idéias humanas explicam a
realidade. A realidade movimenta as idéias e a Filosofia estuda a
transformação da realidade em idéias e das idéias em realidade.
O surgimento das Estatísticas
A necessidade de organização fez com que as sociedades primitivas desenvolvessem técnicas
estatísticas para conhecer as quantidades disponíveis de recursos humanos e materiais. Os
documentos históricos indicam que as civilizações antigas utilizavam a coleta e tabulação de
dados estatísticos para conhecer desde a quantidade de homens disponíveis para servirem aos
governos, até a quantidade de bens pertencentes à população.
Os levantamentos históricos apontam que, aproximadamente, há três mil anos antes de Cristo as
estatísticas já eram praticadas por governantes. Os egípcios realizavam pesquisas para
computar a quantidade de homens e a riqueza do povo a fim de construírem as pirâmides. Um
imperador chinês, por volta de 2.200 antes de Cristo, utilizou estatísticas com finalidades
industriais e comerciais.
A Bíblia traz uma das passagens mais conhecidas pela humanidade: o nascimento de Jesus
Cristo. O livro sagrado descreve que Jesus nasceu, durante uma viagem de seus pais, a
caminho da cidade onde seria realizado um censo. Realidade ou ficção, não vem ao caso, o que
importa neste contexto, é que o levantamento de dados estatísticos já existia naquela época.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
2
O fato é que o homem, desde que sentiu a necessidade de
conhecer numericamente o que existia a sua volta, planejou,
elaborou e praticou técnicas estatísticas.
A origem da palavra Estatística
Por muitos séculos, as técnicas estatísticas foram desenvolvidas
e praticadas sem o uso da palavra Estatística. Como as
estratégias de mensuração eram utilizadas por governantes, a
palavra Estatística deriva do neolatim statisticum collegium
(conselho de Estado) e do Italiano statista (estadista ou
político).
A palavra Estatística nasceu no século XVIII, na Alemanha, por
Gottfried Achenwall (1719 – 1772) que usou o termo Statistik
para nomear a análise de dados sobre o Estado. Com essa
configuração, a Estatística era conhecida como a Ciência do
Estado ou Aritmética Política. Nesse contexto, inicialmente, a
palavra Estatística era ligada à análise de dados. Com o passar do tempo, passou a simbolizar,
também, a coleta e a classificação dos dados. Até hoje o fornecimento de dados sobre os
governos e organizações, de modo geral, é necessário para o estabelecimento das estratégias
de gestão. Os órgãos estatísticos nacionais e internacionais são encarregados pela coleta de
dados sobre os Estados. Os censos demográficos são exemplos de estatísticas sobre as
populações que interessam aos governos.
Mesmo antes do uso do termo Estatística, matemáticos de grande porte como Fermat (1601-
1665), Pascal (1623-1662) e Huygens (1629-1695) impulsionaram, por meio do cálculo das
probabilidades, uma grande mudança no desenvolvimento das estatísticas: a generalização de
resultados amostrais ou a Inferência Estatística. A Estatística passa a compreender a coleta, a
classificação, a análise e a inferência dos resultados.
No século XIX Ronald Fisher (1890-1962) e Karl Pearson (1857-1936) proporcionaram mais
avanços aos estudos estatísticos. A Estatística deixa de configurar como ciência independente
para tornar-se dependente de vários saberes. Não se limita aos estudos demográficos e
econômicos. Ela necessita dos saberes de outras áreas como a Biologia, Medicina, Física,
Psicologia, Indústria, Comércio, Meteorologia, Educação e Linguagem entre outros, para realizar
as análises de dados referentes a cada campo de atuação.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
3
Definindo a Estatística
A Estatística é uma ciência que possui um método próprio
que auxilia na produção do conhecimento, utilizando os
saberes das outras ciências. É a Estatística que oferece um
método único de investigação capaz de ser utilizado por
todas as outras ciências.
A ciência Estatística é responsável por coletar, organizar,
analisar e interpretar dados de qualquer espécie a fim de
tomar decisões sobre o assunto.
Há muito tempo a Estatística não se limita apenas a coletar,
tabular e interpretar dados. A Estatística generaliza os
resultados obtidos auxiliando na tomada de decisões sobre o
conteúdo pesquisado.
A Estatística e as profissões
Existe uma relação de cumplicidade entre a Estatística e as outras áreas do conhecimento. Um
economista recorrerá aos conhecimentos estatísticos para entender as informações sobre o PIB
(produto interno bruto), um agrônomo recorrerá às estatísticas para saber qual a quantidade
adequada de adubo para um determinado tipo de plantação, um psicólogo precisará de
conhecimento estatístico para entender o QI (quociente de inteligência), possibilidades.
A troca de informações entre os profissionais da área de
Estatística e os profissionais das outras áreas faz-se necessária,
pois os profissionais das outras áreas não conhecem a Estatística,
a ponto de desenvolverem pesquisas e, por outro lado, o
estatístico não conhece as particularidades das outras áreas,
portanto, a relação de cooperação é fundamental para o sucesso
das pesquisas estatísticas. A Estatística
pressupõe uma relação de
interdisciplinaridade entre as áreas do saber.
O aluno do curso de Bacharel em Ciências
Contábeis estudará os conceitos estatísticos como o aluno de qualquer
outro curso, mas precisará relacioná-los à sua área de atuação para
aproveitar de modo mais satisfatório os conhecimentos estatísticos.
A Estatística e a inserção social
No mundo globalizado, cada vez mais, as pessoas necessitam de saberes que nem sempre foram trabalhados durante a vida escolar. Os gráficos e tabelas são instrumentos utilizados em grande escala pelos veículos de comunicação (jornais, revistas, televisão, internet etc.) A
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
4
leitura e interpretação de gráficos e tabelas são habilidades importantes para a compreensão do que está acontecendo em nosso dia a dia. É comum encontrarmos pessoas que não conseguem explicar o que os gráficos e as tabelas revelam sobre o assunto abordado. O estudo das estatísticas ajuda a desenvolver o nível de alfabetismo funcional. O Instituto Paulo Montenegro e a ONG Ação Educativa criaram o INAF (indicador de alfabetismo funcional). O INAF é baseado em pesquisas estatísticas, realizadas desde 2001, para mensurar o nível de alfabetismo da população adulta brasileira. Definem-se quatro tipos de alfabetismo:
1. Analfabetismo: pessoas que não conseguem realizar tarefas simples que envolvem a leitura de palavras e frases, ainda que uma parcela destas consiga ler números familiares (números telefônicos, preços etc.).
2. Alfabetismo nível rudimentar: pessoas que apresentam problemas para localizar uma informação explícita em textos curtos e familiares (cartas, anúncios etc.), manusear dinheiro para fazer pagamentos ou realizar medidas de comprimento usando a fita métrica, por exemplo.
3. Alfabetismo nível básico: pessoas consideradas funcionalmente alfabetizadas, pois conseguem ler e compreender textos médios, localizar informações, mesmo que seja preciso realizar inferências, mas apresentam limitações quando as operações envolvem mais elementos, etapas ou relações.
4. Alfabetismo nível pleno: distinguem fatos de opiniões, realizam inferências e sínteses, resolvem problemas que exigem mapeamento e controle, lêem e compreendem textos longos.
A pesquisa do INAF é importante, pois revela a quantidade de pessoas que mesmo sabendo ler e escrever apresenta grande dificuldade de interpretação, não tem as habilidades de leitura, de escrita e de cálculo necessárias para viabilizar o desenvolvimento pessoal e profissional. Este é um enorme problema no Brasil, conforme mostram os resultados das pesquisas realizadas entre 2001 e 2007, envolvendo a faixa etária entre 15 e 64 anos, dos mais diversos locais representativos das cidades brasileiras. A pesquisa engloba os conhecimentos de português (leitura e escrita) e matemática. Os resultados mostram o problema que existe na compreensão dos conteúdos e, a tabela abaixo, relata essa deficiência.
Fonte: www.acaoeducativa.org.br/portal/images/.../inafresultados2007.pdf
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
5
Observando a tabela, verificamos que a quantidade de analfabetos funcionais diminuiu
significativamente. A melhoria do desempenho é resultado das políticas educacionais dos últimos
anos, entretanto, ainda há muito por fazer.
Os resultados indicam que 32% da população brasileira entre 15 e 64 anos (7% de analfabetos e
25% de alfabetizados rudimentares) não estão preparados para o mercado de trabalho.
Juntando-se aos 40% da população que são alfabetizados básicos, totalizam-se 72% da
população brasileira que não apresentam preparo suficiente para as necessidades do mercado
de trabalho.
O Tratamento da Informação (estudo estatístico das informações) integra os currículos escolares
dos últimos anos: é a Estatística a serviço do bem-estar social, proporcionando condições para a
inserção do indivíduo na sociedade.
Referências Bibliográficas – Aula 01 – Módulo 01 -
1. COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher Ltda, 2002. 2. LARSON, FARBER. Estatística Aplicada. São Paulo: Prentice Hall, 2ª Edição, 2004. 3. SCHNEIDERMAN, Boris; MUSETTI, Ana Villares; ARA, Amilton Braio. Introdução à
Estatística. 2ª ed. São Paulo: Edgard Blücher Ltda, 2003.
EXERCÍCIO DE FIXAÇÃO
Dica de estudo: Após estudar o conteúdo da aula, leia atentamente as questões e responda. Cada questão apresenta somente uma alternativa correta.
1- De acordo com a tabela do INAF, escolha qual gráfico representa, adequadamente, os
resultados apresentados:
( a )
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
6
( b )
( c )
( d )
2- O sr. Achoquesei não entendeu porque foi reprovado durante uma entrevista para a vaga de impressor. Conversando com a amiga Seiquesei contou sobre a entrevista: “Tive que olhar uma tabela e dizer qual a quantidade de brasileiros que podem ser considerados analfabetos funcionais”. De acordo com a tabela do INAF, escolha qual não foi a resposta do sr. Achoquesei:
a) 7%, pois são analfabetos de verdade. b) 25%, pois são rudimentares. c) 32%, pois temos que somar os 7% de analfabetos com os 25% de rudimentares. d) 72%, pois temos que somar os 7% de analfabetos, os 25% de rudimentares e os
40% de básicos.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
7
3- Leia o texto a seguir e, depois, realize o que for solicitado:
Por Que Obama Venceu?
Por Jann S. Wenner
A histórica eleição do novo presidente dos Estados Unidos, que assume o cargo neste mês, pode ser o prenúncio de
uma "Nova Nação"
Dias após a histórica eleição de Barack Obama, ocorrida em 4 de novembro de 2008, debatemos com os especialistas em política Peter D. Hart e David Gergen sobre os novos rumos para os Estados Unidos e as causas que levaram à vitória do primeiro presidente negro na história do país. Em Nova York, estamos diante desses dois estudiosos: Hart é conhecido por sua cobertura apartidária das eleições para a NBC News e para o The Wall Street Journal e conduziu uma pesquisa de opinião sobre 30 governadores e 40 senadores norte-americanos; Gergen é diretor do Centro de Liderança Pública da Kennedy School, em Harvard, e trabalhou na Casa Branca como consultor sênior dos presidentes [Richard] Nixon, [Gerald] Ford, [Ronald] Reagan e [Bill] Clinton. Qual foi a chave mestra na vitória de Obama? Peter D. Hart: Os núcleos que ele estimulou dentro do eleitorado - afroa-mericanos, latinos, eleitores jovens, eleitores iniciantes. Ele teve mais de 2/3 desse eleitorado e 95% de afro-americanos. Tomou o que era um eleitorado restrito e o mudou. E, ao fazer isso, colocou no jogo os estados em que os Democratas achavam que nunca poderiam vencer: Colorado, Novo México, Nevada, Indiana e Carolina do Norte, além de Ohio e Flórida. David Gergen: Desde cedo Obama forjou uma tática vitoriosa, montou uma equipe ao redor dessa estratégia, e executou a mais brilhante e bem organizada campanha que vimos na política norte-americana desde John Kennedy, em 1960. E essencial para essa estratégia foi a construção de uma nova coalizão - o que vemos agora é o florescimento de uma possível maioria, que pode trazer a predominância do Partido Democrático durante os anos vindouros. Obama construiu o que se pode chamar de coalizão Obama. Peter é absolutamente correto em identificar a geração do milênio, ou a comunidade afro-americana e latina, como a força motriz por trás dessa nova aliança. E ela também inclui mulheres, o eleitorado dos subúrbios e outros que eram parte tradicional do bloco votante democrata. Para mim, esses são os novos condutores. Vamos falar sobre dois grupos desses eleitores. O voto jovem - qual foi seu papel? Foi grande o suficiente para fazer a diferença? Hart: Fez uma diferença gigantesca. Lembre-se: quando falamos sobre eleitor jovem, estamos falando de todos os 50 estados. Não é como o voto evangélico ou um grupo étnico localizado em área específica. O eleitorado jovem voltou-se para Obama em números simplesmente difíceis de compreender. Foi uma conexão que era tanto psicológica quanto induzida pelos assuntos de seu programa. É alguém falando o idioma deles, que compreende sua época e indicou a direção que todos queriam que a nação seguisse. [Al] Gore influenciou os jovens eleitores por dois pontos. [John] Kerry, por quase nove pontos. Obama chegou aos 34 pontos. Gergen: Essa geração emergente do milênio, como força da política norteamericana, será uma das grandes histórias do país nos próximos 20 anos ou algo assim. Sabemos historicamente que quando os jovens votam em um partido duas vezes tendem a votar nele durante a vida adulta em número desproporcional. A última vez que vimos isso foi com Reagan, que atraiu um número
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
8
incomum de gente jovem. Mas essa crescente geração do milênio é muito maior do que as que a precederam. E 40% dessa geração são de minorias que vêem muito além de raça e gênero. E o uso da tecnologia na campanha de Obama foi vital para mobilizá- los. Se você olhar historicamente, cada um dos maiores realinhamentos em nossa política é sempre a união de uma nova geração e de tecnologias emergentes. Obama foi o pioneiro em juntar o poder da internet com os princípios da organização comunitária. Usou-a para criar um movimento. Foi de enorme importância para espalhar a mensagem, levantar dinheiro e mobilizar eleitores. São essas as três coisas que a equipe de Obama percebeu e executou brilhantemente. Fonte: http://www.rollingstone.com.br/edicoes/28/textos/3591/ acessado em 30/08/09 às 22h58min
Após ler a reportagem, ligue os retângulos de palavras até as frases de modo correto.
a) Obama foi o pioneiro em juntar o poder da internet com os princípios da organização comunitária. b) [Al] Gore influenciou os jovens eleitores por dois pontos. [John] Kerry, por quase nove pontos. Obama chegou aos 34 pontos.
c) Sabemos historicamente que quando os jovens votam em um partido duas vezes tendem a votar nele durante a vida adulta em número desproporcional. d) Ele teve mais de 2/3 desse eleitorado e 95% de afro-americanos. Tomou o que era um eleitorado restrito e o mudou.
RECAPITULANDO
Nesta aula você aprendeu alguns aspectos históricos sobre a Estatística.
Ficou sabendo que a Estatística mudou muito ao longo dos anos, deixando
de ser apenas um método para a coleta e tabulação dos dados, para
realizar as generalizações sobre os resultados obtidos. Descobriu a
importância do estudo da Estatística para a sua profissão. Leu sobre o
índice de alfabetismo funcional (INAF), sua importância e a situação da população brasileira
frente ao mercado de trabalho. Pôde constatar que os estudos estatísticos sempre foram
decisórios nos processos políticos governamentais e, ainda, promovem a inserção dos indivíduos
na sociedade.
Estratégia política Estatísticas a serviço
dos governantes
Dados estatísticos
Inferência estatística
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
9
Unidade 01: Conhecendo a Estatística
Aula 02: A média aritmética e as medidas de variabilidade
OBJETIVO DA AULA 02
Nesta aula você aprenderá o que é Média Aritmética e o que significa. Entenderá o que é uma Medida de Tendência Central. Conhecerá e aplicará as Medidas de Variabilidade em torno da média. Fará simulações e completará planilhas de cálculo, para comparar conjuntos de dados que apresentem a mesma média aritmética.
DESENVOLVIMENTO
Você, certamente, já enfrentou alguma situação onde precisou tomar decisões. Essas decisões
surgiram após você analisar uma ou várias situações.
Então, prepare-se para um estudo investigativo. Durante as aventuras dessa aula, você construirá
as definições estatísticas para a média aritmética e suas variações.
Vamos começar?
Imagine que você faça parte de um júri, que decidirá qual equipe receberá o premio para o
primeiro colocado em uma olimpíada de conhecimento.
Desenvolvimento da atividade durante a aula.
Continuação após a atividade prática
Você teve a oportunidade de pensar sobre o significado da média aritmética e as variações em
torno dela.
As duas equipes da atividade prática terminaram a competição com a mesma média de acertos.
Casos assim são comuns no dia a dia. A questão é saber para quê serve a média aritmética?
Qual é o seu verdadeiro significado?
Definição Matemática
A média aritmética, de um conjunto de dados, é o valor que pode substituir os valores dos
elementos do conjunto, sem mudar a soma dos valores do conjunto.
Dado um conjunto com n elementos, a média aritmética é o resultado da soma dos valores de
todos eles, dividida pelo total n.
Observe a tabela abaixo, que poderia representar os resultados de uma das Equipes
competidoras estudadas anteriormente:
Etapas
(ni)
Resultados
(xi)
1 10
2 12
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
10
3 5
4 8
5 7
6 10
7 9
8 11
Total=8 72
n representa o total da amostra (8 etapas)
i é um índice que representa a ordem em que aparece o item na amostra estudada. (n2 = amostra
da etapa 2)
xi representa o resultado alcançado na etapa i
x = símbolo da média aritmética
sigma, letra grega maiúscula, indica a soma de valores
x =
n
i n
xi
1 lê-se a somatória de todos os valores dos elementos x (variando de 1 até n) do
conjunto, dividida pela quantidade total de elementos n do conjunto.
Verifique que a média aritmética é 9 e se você substituir todos os resultados da tabela (xi) por 9, a
soma total continuará sendo 72.
Agora, lembre-se da linha da média da atividade desenvolvida (10ª OBCES). Ao verificarmos a
quantidade de tijolos, para cada equipe, as quantidades acima e abaixo da média são iguais para
a mesma equipe. Na tabela preenchida, a soma das diferenças, entre cada resultado e a média,
resultou zero. Então, podemos concluir que a soma dos desvios em torno da média é zero.
A média aritmética representa o ponto de equilíbrio dos dados
A média aritmética é uma das Medidas de Tendência Central.
É uma medida que representa uma entrada central de um conjunto
de dados.
Observe que a balança não está em equilíbrio. Quando estiver
equilibrada, significará que os valores em cada prato estarão na
média.
Para estudarmos as características de um conjunto de dados, precisamos além da média
aritmética, das variações em torno da média. Como vimos, nos exemplos das duas equipes, são
as variações em torno da média que diferenciam conjuntos com a média aritmética idêntica.
A Variância é a média dos quadrados dos desvios entre os valores dos dados e a média
O que será que é o desvio em torno
da média?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
11
EXERCÍCIO DE FIXAÇÃO
Dica de estudo: Após estudar o conteúdo da aula, leia atentamente as questões e responda. Cada questão apresenta somente uma alternativa correta.
1. A soma dos desvios entre cada valor e a média é: a) ( ) positiva b) ( ) negativa c) ( ) diferente de zero d) ( ) zero 2. A média aritmética é a razão entre: a) ( ) o número de valores e a somatória deles b) ( ) a somatória dos valores e o número deles c) ( ) os valores extremos d) ( ) os dois valores centrais 3.O cálculo da variância supõe o conhecimento da: a) ( ) média b) ( ) mediana c) ( ) ponto médio d) ( ) moda
4. Para você saber mais e resoIver!
Na Teoria dos Erros (parte da Matemática que estuda técnicas de aproximação em cálculo
numérico), quando definimos erro médio absoluto utilizamos o conceito de módulo.
Quando queremos, por exemplo, medir uma determinada grandeza, os resultados obtidos em
várias medições geralmente não são iguais: a medida verdadeira, é dada por um intervalo no qual
ela deve estar.
Define-se erro de uma medida como sendo a diferença entre o valor medido e o valor correto da
grandeza.
Como o valor correto da grandeza nunca é conhecido com certeza absoluta, fazemos várias
medições e calculamos a média aritmética de um número conveniente de medidas.
Por exemplo, na medição da espessura de uma chapa de aço foram obtidos em seis tentativas os
valores: 1,96 mm; 2,00 mm; 1,98 mm; 2,01 mm; 1,97 mm e 2,03 mm.
Temos:
1,96 mm
2,00 mm
+1,98 mm
2,01 mm média aritmética = 11,95 ≈ 1,99 mm
1,97 mm 6
2,03 mm
11,95 mm
As diferenças em valor relativo (valor com sinal) entre a média aritmética e os valores obtidos nas
medições são chamadas de discrepâncias.
Define-se como erro médio absoluto, ou simplesmente erro médio, a média aritmética dos
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
12
módulos das discrepâncias.
No exemplo dado, temos:
Discrepâncias
d1 = 1,99 – 1,96 = 0,03
d2 = 1,99 – 2,00 = - 0,01
d3 = 1,99 – 1,98 = 0,01
d4 = 1,99 – 2,01 = - 0,02
d5 = 1,99 – 1,97 = 0,02
d6 = 1,99 – 2,03 = - 0,04
E = ld1l + ld2l + ld3l + ld4l + ld5l + ld6l
6
E = 0,03 + 0,01 + 0,01 + 0,02 + 0,02 + 0,04
6
E = 0,02
A medida verdadeira é dada pelo intervalo 1,99 ± 0,02.
Vejamos, agora, se você é capaz de calcular o erro médio absoluto e a medida verdadeira com os
dados obtidos em oito pesagens de uma mesma amostra: 4,7 g; 4,5 g; 4,9g; 5,0 g; 5,1 g; 4,8 g;
4,6 e 4,8 g. Escolha resposta correta.
a) ( ) 4,6 ± 0,15 b) ( ) 4,8 ± 0,15 c) ( ) 4,6 ± 0,12 d) ( ) 4,8 ± 0,12
5. A classificação final de um determinado curso é a média ponderada das classificações obtidas em três áreas: A, B e C. Um candidato obteve as seguintes classificações parciais: Área A = 17 pontos Área B = 24 pontos Área C = 20 pontos Sabendo que os pesos são 5 para a área A, 2 para a área B e 3 para a área C, determine a classificação desse candidato.
a) ( ) 19 pontos b) ( ) 18,3 pontos c) ( ) 193 pontos d) ( ) 19,3 pontos
Para calcularmos a Média Ponderada devemos multiplicar cada valor
do elemento do conjunto pela quantidade do peso correspondente,
somarmos todos os valores multiplicados e dividirmos pela soma dos
pesos.
O que é módulo mesmo?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
13
RECAPITULANDO
Nesta aula você aprendeu o significado da média aritmética e a importância do estudo das
variações em torno da média. Descobriu que a média aritmética sozinha, não revela as
características de um conjunto de dados. Aprendeu a comparar conjuntos que tenham a mesma
média aritmética. Ficou sabendo que as medidas de variabilidade, em torno da média, são de
grande utilidade para o controle da qualidade dos produtos.
Unidade 01: Conhecendo a Estatística
Aula 03: As Medidas de Tendência Central e Variabilidade
OBJETIVO DA AULA 03
Nesta aula você aprenderá quais são as Medidas de Tendência Central, Medidas de Variabilidade, seus significados e utilização. Descobrirá que estar na moda em estatística, significa ser o mais frequente, consistindo em informação muito importante para o planejamento das ações empresariais. E, ainda, que as estatísticas estudam as oscilações de qualquer fenômeno, inclusive, as oscilações da qualidade dos produtos, sendo essencial para a sustentabilidade das empresas no mercado.
DESENVOLVIMENTO
Na aula anterior, você teve a oportunidade de participar de uma escolha entre dois conjuntos de
dados que apresentem a mesma média aritmética. Para escolher o conjunto de desempenho
mais homogêneo, em relação à média, precisou estudar a variação dos valores em torno da
média. Calculou em primeiro lugar a Média, em seguida os Desvios, a Variância, o Desvio Padrão
e, finalmente, o Coeficiente de Variação.
Reveja a notação utilizada no curso e algumas definições:
n representa o total de elementos de um conjunto
i é um índice que representa a ordem em que aparece o elemento no conjunto. (n2
= elemento 2)
xi representa o resultado alcançado pelo elemento na etapa i (x2 é o resultado do
elemento 2)
x = símbolo da média aritmética (lê-se x barra)
A média aritmética representa o ponto de equilíbrio dos dados. A média aritmética, de um
conjunto de dados, é o valor que pode substituir os valores dos elementos do conjunto, sem
mudar a soma dos valores do conjunto.
sigma, letra grega maiúscula, indica a soma de valores
x =
n
i n
xi
1 lê-se a somatória de todos os valores dos elementos x (variando de 1 até n) do
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
14
conjunto, dividida pela quantidade total de elementos n do conjunto.
Discrepâncias ou Desvios são as diferenças em valor relativo (valor com sinal) entre a média
aritmética e os valores obtidos nas medições.
d = ( xi - x )
Erro médio ou erro médio absoluto é o resultado da média aritmética dos módulos das
discrepâncias ou desvios.
Exemplo de cálculo do erro para um conjunto de 6 elementos:
E = ld1l + ld2l + ld3l + ld4l + ld5l + ld6l ou E =
n
i
i
n
d
1
6
A Variância é a média dos quadrados dos desvios entre os valores dos dados e a média
aritmética. A unidade de medida da variância é sempre algo ao quadrado e, geralmente, não faz
sentido no contexto dos dados analisados.
sigma, letra grega minúscula
2 =
n
i
i
n
xx
1
2)(
O Desvio padrão é a raiz quadrada variância. Por que precisamos dele?
Quando extraímos a raiz quadrada, encontramos a medida em seu estado original.
= 2
Observe que o desvio padrão é positivo e negativo, pois representa as variações à direita e a
esquerda da média aritmética. Quanto maior a variância, maior a heterogeneidade entre os
elementos de um conjunto e maior é o desvio padrão.
O Coeficiente de Variação é o resultado da divisão entre o desvio padrão e a média aritmética.
É a razão entre o desvio padrão e a média aritmética multiplicada por 100 para resultar uma
medida em porcentagem. Karl Pearson, matemático inglês (1857-1936), foi quem contribuiu com
a criação dessa medida. Produtos que possuem coeficientes de variação grande em relação à
média apresentam problemas que são estudados pelo controle de qualidade. O tamanho
aceitável de variação, em torno da média, depende do produto fabricado. Na indústria de Papel,
por exemplo, o peso do papel pode variar, no máximo, 5% em relação ao peso estipulado pela
empresa.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
15
CV = média
ãoDesvioPadr. 100 = …. %
A Estatística Descritiva trabalha com as Medidas de Tendência Central e as Medidas de
Variabilidade.
As Medidas de Variabilidade compõem o conjunto das estatísticas que medem as oscilações de
uma variável (elemento que está sendo estudado). Você já vivenciou essas medidas na aula 02:
os desvios ou discrepâncias em relação à média; o erro médio; a variância; o desvio padrão e o
coeficiente de variação. Faltou a amplitude que é a diferença entre o maior e o menor valor de um
conjunto de dados.
Dispersão é sinônimo de variabilidade. Então, também, podemos falar em medidas de dispersão.
Responda rápido: Como você consegue manter o saldo bancário
sempre equilibrado?
“É simples! Sempre sem dinheiro, a variância é zero!...”
Se os fenômenos naturais fossem sempre estáveis, se as mesmas
causas produzissem sempre os mesmos efeitos, talvez o homem nunca
tivesse desenvolvido a noção de variação. Mas, todos nós sabemos que
a verdade é outra: o tempo não pára e as coisas estão sempre em oscilação, isto é, mudando.
Você leu na aula 01 que o homem sempre se preocupou com “medir as coisas” (extensão
das propriedades, tamanho dos rebanhos, quantidade de dinheiro etc.). As medidas mostraram
muita oscilação e o homem preocupou-se com a criação de métodos matemáticos que servissem
para medir as variações.
Importância, Utilidade, Vantagens e Desvantagens das principais Medidas de Variabilidade
1. Amplitude
a) É facilmente calculável;
b) Não depende de cada valor dos dados;
c) Seu uso é restrito;
d) Serve para análise comparativa e para a determinação de limites de uma distribuição
2. Variância
a) É facilmente calculável;
b) Seu valor depende de cada valor dos dados;
O que estuda a Estatística Descritiva? Já
esqueci… Terei que procurar na aula 01.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
16
c) Pode ser calculado em relação à média aritmética e à mediana;
d) Supera o fato da soma nula dos desvios, utilizando valores quadráticos;
e) Serve para análise comparativa.
3. Desvio Padrão
a) Seu significado não é de fácil compreensão;
b) Seu valor depende de cada valor dos dados;
c) De todas as medidas de variabilidade é a que oferece maiores vantagens em cálculos
posteriores, tais como probabilidade e equações de regressão;
d) Não sofre influências das flutuações das amostras;
e) Todos os valores de um conjunto de dados, cabem dentro do intervalo entre a média e 3
desvios padrões. Veja abaixo:
x -3 x -2 x -1 x x +1 x +2 x +3
Então, quer dizer que, no máximo, todos os elementos de um conjunto de dados, cabem dentro
do intervalo [ x - 3 ; x + 3 ]
Exemplo: Seja a média igual a 12 e o desvio padrão = 2, então todos os dados do conjunto
cabem entre [12-6; 12+6], isto é, [6; 18]. Nenhum valor do conjunto será menor do que 6 ou maior
do que 18.
6 8 10 12 14 16 18
As Medidas de Tendência Central são estatísticas, cujos valores estão próximos do centro de
um conjunto de dados.
Medir uma magnitude (grandeza) significa associar a essa magnitude um número real. Quando
medimos uma grandeza, estamos fazendo o seguinte processo:
definindo o que está sendo medindo;
definindo um critério para a medição (uma escala);
fazendo a leitura;
fazendo a interpretação.
Até agora só falaram em medida,
medida, mas o que é uma
medida?
Intervalo das variações em
torno da média
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
17
Medida é uma relação entre magnitude e critério.
São medidas de tendência central:
1. Média aritmética: valor obtido pela soma dos dados, dividida pelo total de dados. É o valor
que pode substituir todos os valores da variável, isto é, é o valor que a variável teria se
fosse, em vez de variável, constante.
A média pode ser um número diferente de todos os valores que ela representa. Por exemplo,
para os valores 2, 4, 6 e 8 a média é 5. Repare que o número 5 não pertence ao conjunto de
dados.
Quando os valores do conjunto apresentam pesos diferentes, dizemos que a média é
ponderada.
Exemplo: Osmar trabalha na gráfica Faztudo S/A. No mês de janeiro, realizou 4 trabalhos de
pontuações diferentes. O sistema de pontuação diferencia a importância do trabalho e, ao final do
mês, o salário é pago de acordo com a média dos trabalhos realizados. A tabela, abaixo, mostra a
produção do Osmar.
Pontuação Quantidade
de impressos
1 50.000
2 10.000
3 30.000
4 40.000
Média final = (1 x 50.000) + (2 x 10.000) + (3 x 30.000) + (4 x 40.000)
1 + 2 + 3 + 4
Média final = 32.000 impressões
2. Mediana: valor que ocupa a posição central dos dados ordenados. É o valor (do próprio
conjunto ou teórico) que tem antes e depois de si, igual quantidade de dados. Como o próprio
Consigo formular um exemplo?
Variável? Constante?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
18
nome sugere, o valor da mediana deve estar em algum ponto entre o valor da média e o valor
da moda. É o número que se encontra no centro de uma série de números, estando estes
dispostos segundo uma ordem. Uma melhor definição para mediana é a que ela representa um
valor situado de tal forma que separe o conjunto em 2 subconjuntos do mesmo número de
elementos.
Exemplo:
a) 2, 5, 10, 15, 18 mediana = 10
b) Se o conjunto possuir número par de elementos, utiliza-se a fórmula do ponto médio:
2, 6, 7, 10, 12, 13, 18, 21
mediana = 11
c) O Sr. Pesquisatudo fez cinco orçamentos em escritórios diferentes, e obteve os
valores R$140, R$120, R$150, R$145, R$160. Primeiro precisamos colocar os valores em ordem
crescente e depois determinamos qual será a mediana.
R$120, R$140, R$145, R$150, R$160
A mediana é R$145, isto significa que 50% dos valores dos orçamentos são menores ou iguais a
R$145 e 50% dos valores dos orçamentos são maiores ou iguais a R$145. Repare que a
mediana não traduz se R$145 seja o valor do serviço de mais qualidade, apenas separa,
exatamente, em duas metades iguais, o valor dos orçamentos.
3- Moda é o valor que aparece com maior freqüência em uma série de valores. Um conjunto
de dados pode ser Modal quando apresenta uma moda; Amodal quando não apresenta a
moda; Bimodal quando apresenta duas modas.
Exemplo:
Qual é a moda dos salários do pessoal do tratamento de imagem?
Grupo Ingênuo: {R$ 800, R$ 1.200, R$ 1.500, R$ 1.200, R$ 1.000}
Moda = R$ 1.200, este grupo é modal
Grupo Milagroso: {R$ 1.100, R$ 900, R$ 1.000, R$ 1.400 }
A moda não existe: este grupo é amodal
Grupo Criativo: {R$ 1.200, R$ 1.500, R$ 1.500, R$ 1.200}
Grupo bimodal: R$ 1.200 e R$ 1.500
Imagine a seguinte situação: Uma máquina impressora rotográfica apresenta vários tipos
de paradas. Após um estudo estatístico, observou-se que a parada que ocorre com maior
freqüência (moda) é quando o operador do porta-bobina esquece de fazer a troca da bobina.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
19
Nesse caso, para solucionar o problema será preciso “lembrar” o operador que deve realizar a
troca da bobina.
Importância, utilidade, vantagens e desvantagens das Medidas Centrais
1. Média Aritmética
a) é rigorosamente definida e exata;
b) é descritiva de todos os dados de um conjunto de valores numéricos, após coletados, e de
fácil compreensão;
c) é facilmente calculável;
d) depende de cada valor do conjunto de valores e qualquer alteração de um deles altera o seu
valor;
e) apresenta-se com aproximação de valores, quando calculada em várias amostras de um
fenômeno;
f) serve para cálculos posteriores, entre outros, do desvio padrão e probabilidade;
g) não pode ser empregada em dados qualitativos;
h) é influenciada por valores extremos, podendo, em alguns casos, não representar o conjunto
de valores numéricos que foi coletado;
i) representa o conjunto dos valores que estão ou se aproximam de uma progressão aritmética;
j) é das medidas de tendência central a de maior emprego.
2. Mediana
a) é uma medida separatriz;
b) é uma medida definida e exata;
c) não depende de cada valor do conjunto de valores, a não ser em casos cuja alteração do
valor, o torne maior ou menor do que o da mediana já calculada;
d) não se apresenta com valores aproximados em várias amostras representativas de um
fenômeno;
Não sei o que é isso‼‼‼!
Não lembro o que é uma
progressão aritmética‼‼!
É fácil: basta descontar do salário dele
todos os esquecimentos. Xiiiiiii………
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
20
e) a mediana pode dar melhor idéia da tendência central dos dados quando existem valores
discrepantes;
f) serve para análise comparativa.
3. Moda
a) é medida de posição;
b) é de fácil compreensão;
c) pode não existir em um conjunto de valores ou apresentar-se mais do que uma vez em outras;
d) seu cálculo pode depender de alguns valores do conjunto de valores e seu valor só é alterado
nos casos em que a variação de um deles se torne maior do que a moda já calculada;
e) não serve para cálculos posteriores;
f) é uma das medidas de tendência central de maior importância.
LEMBRETE: A média é um valor em torno do qual os dados se
distribuem.
1. A média é mais representativa quando a variabilidade é menor.
2. Desvio igual a zero significa que não houve variabilidade.
3. Quanto maior é o desvio, maior é a variabilidade e maior é a
variância.
4. Conjuntos diferentes de dados podem ter a mesma amplitude.
5. A unidade de medida da variância é igual ao quadrado da unidade
de medida dos dados (porque os valores são elevados ao
quadrado).
6. Conjuntos com médias iguais podem ter variabilidade diferente. Por isso não basta olhar a
média: é preciso olhar também a variância ou desvio padrão ou o coeficiente de variação.
EXERCÍCIO DE FIXAÇÃO
Dica de estudo: Após estudar o conteúdo da aula, leia atentamente as questões e responda. Cada questão apresenta somente uma alternativa correta.
1. Na série 60, 90, 80, 60, 50 a moda será:
a) ( ) 50 b) ( ) 60 c) ( ) 66 d) ( ) 90
Será que vão explicar o porquê de
tanta importância?
Espero entender isto um dia…
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
21
2. A medida que apresenta o mesmo número de valores abaixo e acima dela é: a) ( ) a moda b) ( ) a média
c) ( ) a mediana d) ( ) o lugar mediano
3- Quando queremos verificar a questão de urna prova que apresentou maior
número de erros, utilizamos: a) ( ) moda b) ( ) média.
c) ( ) mediana d) ( ) qualquer uma das antenores
4-Dado o histograma abaixo no interior de cujos retângulos foram anotadas as freqüências absolutas, então a mediana é:
a) ( ) 6.5 b) ( ) 8.0 c) ( ) 7.5 d) ( ) 7.0
5- O coeficiente de variação é uma medida que expressa a razão entre:
a) ( ) desvio padrão e média
b) ( ) média e desvio padrão
c) ( ) amplitude semi-interquartélica e mediana
d) ( ) desvio padrão e moda
6. Numa distribuição de valores iguais, o desvio padrão é:
a) ( ) negativo b) ( ) positivo
c) ( ) a unidade d) ( ) zero
7. O desvio padrão de um conjunto de dados é 9. A variância será:
a) ( ) 3 b) ( ) 18 c) ( ) 36 d) ( ) 81
8. 50% dos dados da distribuição situam-se:
a) ( ) abaixo da média b) ( ) acima da mediana
c) ( ) abaixo da moda d) ( ) acima da média
9. O valor dominante de uma distribuição de frequência chama-se:
a) ( ) mediana b) ( ) média
c) ( ) moda d) ( ) 1º quartil
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
22
10. A empresa Perguntatudo foi contratada para saber a média salarial dos 8 melhores clientes
de uma editora de revistas sobre Lazer. A média salarial é aproximadamente:
(milhares
de reais)
0 ------- 6 6------- 12 12 ------- 18
clientes 1 2 5
Dica: Calcule a média de cada faixa salarial e multiplique pela quantidade de clientes da faixa.
Ex: A média entre 0 e 6 é 3; entre 6 e 12 é 9 e assim por diante.
a) ( )12 mil reais
b) ( ) 8,5 mil reais
c) ( ) 10,83 mil reais
d) ( ) 11.4 mil reais
11. Relacione a medida estatística que você utilizaria para analisar os dados de uma folha de
pagamentos.
a) Descobrir o salário mais frequente.
b) Descobrir o salário que divide os pagamentos em partes iguais.
c) Descobrir a dispersão absoluta em tomo da média.
d) Descobrir o grau de dispersão relativo.
12- Leia o texto e depois responda às questões.
Quartis, decis e percentis
Se um conjunto de valores é ordenado em ordem crescente ou decrescente, o valor médio
que divide o conjunto em duas partes iguais é a mediana. Por extensão desse conceito, pode-se
pensar nos valores que dividem o conjunto em quatro partes iguais. Esses valores, representados
por Q1 , Q2 e Q3 denominam-se primeiro, segundo e terceiro quartis, respectivamente, sendo o
valor Q2 igual á mediana.
Do mesmo modo, os valores que dividem os dados em dez partes iguais denominam-se
decis e são representados por D1 , D2 .........D9 enquanto que os valores que dividem os dados em
100 partes iguais chamam-se percentis e são representados por P1 , P2 ,..........P99. O quinto decil
e o quinquagésimo percentil correspondem á mediana. O 25º e o 75º percentis correspondem ao
1º e 3º quartis, respectivamente.
A tabela abaixo representa uma distribuição de freqüência das notas de um exame final de
mediana moda discrepância Desvio padrão
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
23
álgebra.
Notas NÚMERO DE
ESTUDANTES
90--100 9
80--89 32
70--79 43
60--69 21
50--59 11
40--49 3
30--39 1
TOTAL 120
Relacione a resposta correta em cada item.
a)O grau mais baixo obtido pelos 25% melhores alunos da turma
b) O grau mais alto obtido pelos 20% piores alunos da turma
RECAPITULANDO
Nesta aula você aprendeu quais são as medidas de tendência central e variabilidade. Descobriu
que estar na moda em estatística, significa ser o mais frequente. Informação muito importante
para a indústria: conhecer qual a moda das vendas de certo tipo de tinta; a moda dos pedidos de
orçamentos; a moda salarial entre uma determinada classe de funcionários. Conheceu medidas
como quartis, decis e percentis que servem para classificar, por exemplo, quais os 25% melhores
clientes de uma empresa. E, ainda, que as estatísticas estudam as oscilações dos fenômenos,
inclusive, oscilações da qualidade dos produtos.
Unidade 01: Conhecendo a Estatística
Aula 04: Análise Gráfica
OBJETIVO DA AULA 04
Nesta aula você aprenderá quais os tipos de gráficos mais adequados para a visualização das informações pesquisadas. Construirá gráficos de acordo com os dados coletados. Utilizará software gráfico para a construção de gráficos e fará análises gráficas. Aprenderá a construir intervalos de frequência.
DESENVOLVIMENTO
Antes de estudarmos os tipos de gráficos, vamos rever o que significa medir.
Medir uma magnitude (grandeza) significa associar a essa magnitude um número real. Quando
medimos uma grandeza, estamos fazendo o seguinte processo:
definindo o que está sendo medindo;
75
64 85
89
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
24
definindo um critério para a medição (uma escala);
fazendo a leitura;
fazendo a interpretação.
Medida é uma relação entre magnitude e critério.
Exemplificando, quando afirmamos que uma pessoa mede 1,80 m estamos utilizando o número
real 1,80; uma escala que é a unidade de medida: o metro; e a grandeza medida é a altura.
Forma de medidas: quantitativas e qualitativas
Uma característica de um conjunto de dados é uma Variável estatística que pode ser
representada por um número ou por um atributo.
Variáveis quantitativas são aquelas que podemos quantificar. Exemplo: peso do papel, litros de
leite, mensalidade da faculdade etc.
Variáveis qualitativas são aquelas que identificam atributos. Exemplo: sexo, religião, cor dos
olhos, faixa etária etc.
Representando as Variáveis
Podemos criar uma representação tabular, isto é, em tabelas que pode ser facilitada usando-se a
noção de intervalos.
altura em metros frequência
1,40 1,50 10
1,50 1,60 20
1,60 1,70 40
1,70 1,80 30
total 100
A tabela acima apresenta os dados referentes à variável qualitativa altura, em metros, de 100
pessoas. A frequência significa quantas pessoas medem a altura correspondente ao intervalo. Na
2ª linha da tabela, encontramos o intervalo que começa em 1,40m e termina próximo a 1,50m,
mas não alcança 1,50m. Repare que na próxima linha, o intervalo começa em 1,50m e, portanto,
a linha anterior não pode conter um intervalo que termine em 1,50m. Caso isso acontecesse,
poderíamos ter duas pessoas medindo 1,50m e em qual linha da tabela as colocaríamos?
Como surgem os intervalos de freqüência?
Dois corpos não ocupam o mesmo lugar
no espaço. Não é mesmo?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
25
Imagine a lista de resposta de cem pessoas entrevistadas. Teríamos uma tabela de, no mínimo,
100 linhas. Para diminuirmos o tempo para a tabulação e melhorarmos a visualização, criamos os
intervalos de freqüência.
Logo mais, nos exercícios de fixação, você terá a oportunidade de aprender a elaborar tabelas de
freqüência.
Continuando, podemos representar os dados coletados em formato de tabelas ou gráficos.
Os gráficos são desenhos que sintetizam, de maneira clara, o comportamento de uma ou mais
variáveis. Podem ser:
1. diagramas de colunas
2. diagramas de barras
3. histograma
4. polígono de frequência
5. estereograma (gráfico em terceira dimensão)
6. pictóricos (gráficos que utilizam figuras)
7. setores
A escolha do gráfico
A escolha do tipo de gráfico depende da variável que está em estudo. Geralmente, as variáveis
qualitativas são representadas em gráficos de se setores (formato de pizza). Obrigatoriamente,
quando tivermos dados divididos em classes contínuas de frequência, como no exemplo da
tabela anterior, a representação gráfica é em histograma. Um histograma é um gráfico de colunas
que estão unidas, isto é, não existe separação entre as colunas.
Exemplo: (PUC) O histograma abaixo apresenta a distribuição de frequência das faixas salariais numa pequena empresa
Ah! Eu sempre soube que o objetivo da
Matemática é economizar e
generalizar‼‼‼
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
26
Uma tabela representativa desse gráfico seria:
Intervalo (salários em reais) Frequência (nº de funcionários)
0 -----------500 14
500--------1000 4
1000------1500 2
1500------2000 2
2000------2500 2
Total 24
EXERCÍCIO DE FIXAÇÃO
Dica de estudo: Após estudar o conteúdo da aula, leia atentamente os enunciados das questões. Encontrará algumas dicas na bibliografia indicada.
1- O histograma abaixo apresenta a distribuição de frequência das faixas salariais numa pequena empresa.
Com os dados disponíveis, pode-se concluir que a média desses salários é, aproximadamente: a) R$ 420,00 b) R$ 536,00 c) R$ 640,00 d) R$ 708,00
2- Observe o gráfico abaixo. Por que a média anual aparece representada dessa maneira no gráfico?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
27
a) A média anual aparece como segmento de reta somente para facilitar o entendimento do leitor.
b) A média anual aparece representada por seguimentos de reta por ser o ponto de equilíbrio dos dados.
c) A média anual aparece representada por um traço vermelho somente para diferenciar das outras informações.
d) A representação da média foi feita desse modo para evidenciar a sua importância.
3- Analise o gráfico acima. Após ter estudado o conteúdo da aula, escolha uma região
onde você, com certeza, ganharia muito bem.
a) Certamente, eu ganharia muito bem na região sudeste.
b) Certamente, eu ganharia muito bem na região sul.
c) Somente pelo gráfico não é possível afirmar em qual região eu ganharia muito bem.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
28
d) Poderia ser a região sul ou a sudeste.
4- A eficiência do fogão de cozinha pode ser analisada em relação ao tipo de energia que ele utiliza. O gráfico abaixo mostra a eficiência de diferentes tipos de fogão.
Eficiência do fogão (%)
0
10
20
30
40
50
60
70
fogões a
lenha
fogões a
carvão
fogões a
querosene
fogões a gás fogões
elétricos
Pode-se verificar que a eficiência dos fogões aumenta: a) à medida que diminui o custo dos combustíveis. b) à medida que passam a empregar combustíveis renováveis. c) cerca de duas vezes, quando se substitui fogão a lenha por fogão a gás. d) cerca de duas vezes, quando se substitui fogão a gás por fogão elétrico.
5- Se você encontrar à margem de um rio um cartaz como este:
Você deve atravessá-lo a pé? Por quê?
a) De jeito nenhum! Posso ter uma dor no joelho e morrer afogado.
b) Tranquilamente. É só ir caminhando até chegar ao outro lado.
c) Até poderia atravessar o rio, mas correria o risco de morrer afogado. Não conheço a taxa de
variação em torno da média.
d) Só não atravessarei porque não quero.
RECAPITULANDO
Nesta aula você aprendeu que o tipo de gráfico utilizado depende da variável estatística
apresentada. Precisou pesquisar e estudar a montagem de gráficos utilizando um software.
Aprendeu a analisar dados gráficos. Construiu tabelas com intervalos de frequência.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
29
Unidade 02: Trabalhando com dados Estatísticos
Aula 01: PROBABILIDADE
Recordando
Na Unidade 1 você aprendeu o que é Estatística e a sua importância. Soube que o homem criou
estratégias, medidas estatísticas, para quantificar e gerir os seus bens. Leu que as estatísticas
estudam as oscilações dos fenômenos, inclusive, oscilações da qualidade dos produtos.
Conheceu as medidas de tendência central e variabilidade. Enfrentou desafios. Construiu e
analisou os gráficos e as tabelas. Vivenciou situações que lhe mostraram o grande objetivo da
Matemática e, consequentemente, da Estatística: Generalizar e Economizar.
OBJETIVO DA AULA 01
Nesta aula você aprenderá que a probabilidade é um número que indica a chance, isto é, a possibilidade de determinada situação acontecer. A probabilidade provém da nossa incerteza diante de fatos relacionados ao acaso. Aprenderá métodos probabilísticos para inferir ou generalizar uma situação. Vivenciará situações que lhe comprovem que a probabilidade não tem memória e, portanto, não é bom confiar somente em seu tempo de experiência no mercado trabalho. Será apresentado à Inferência Estatística.
DESENVOLVIMENTO
Até agora você vivenciou situações que envolvem a Estatística Descritiva. Nessa aula, conhecerá
um pouco da Estatística Inferencial.
1- Estatística Descritiva
Parte da Estatística que descreve, organiza e resume os aspectos
importantes de um conjunto de características observadas, para
proporcionar discernimento entre o comportamento de uma
população e o comportamento de uma amostra.
2- Estatística Inferencial
Parte da Estatística que usa uma amostra para fazer generalizações
a respeito de aspectos importantes de uma população. A palavra
inferência em Estatística é utilizada com dois significados:
Conclusões tiradas a partir de valores ou de evidências.
Processo utilizado para se chegar a essas conclusões.
Eu já estudei sobre isso no dicionário!
Por acaso alguém já explicou o que é uma
população e uma amostra? Acho que
pensam que sou adivinho!
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
30
3- População Consiste na totalidade de unidades de observação (usualmente pessoas, objetos ou eventos) a partir das quais se deseja tomar uma decisão. A população pode ser finita ou infinita.
Exemplo de uma unidade observação: em uma população de leitores de uma revista, uma unidade de observação poderá ser os leitores que são assinantes da revista. Esta unidade de observação apresenta muitas características, entre as quais a faixa etária e a faixa salarial.
Finita: o número de unidades de observação pode ser contado e é limitado. No exemplo acima, a quantidade de leitores constitui uma população finita.
Infinita: a quantidade de unidades de observação é ilimitada, ou sua composição é tal que as unidades da população não podem ser contadas.
Exemplo: conjunto de medidas de determinado comprimento, porque não há limite para o número de vezes em que se pode medir este comprimento.
4- Amostra Conjunto de unidades selecionadas de uma população.
Exemplo: Os assinantes da revista Veja constituem uma amostra dos leitores da revista. 5- Probabilidade Ao aplicarmos um questionário para estudarmos algumas características dos assinantes de uma revista, geralmente, escolhemos uma parte da população de assinantes que será entrevistada. Como as informações provêm de um conjunto menor que a população de assinantes da revista não estaremos totalmente certos quando fizermos uma inferência sobre os assinantes da revista. Esses erros são quantificados pela probabilidade, a qual além de lidar com situações influenciadas por fatores não-controlados pelo analista proporciona um modelo racional para lidar com a variabilidade inerente à natureza, bem como com situações relacionadas ao acaso.
Segundo o Dicionário Houaiss, acessado em
http://houaiss.uol.com.br/busca.jhtm?verbete=acaso, às 12h37min de
20/09/09, acaso é:
advérbio = possivelmente, quiçá, talvez, porventura.
Ex.: Acaso lembra-se da figura da mãe?
substantivo masculino (1562) = ocorrência, acontecimento casual,
incerto ou imprevisível; casualidade, eventualidade.
Ex.: O acaso permitiu que se encontrassem no meio da multidão.
substantivo masculino = caso fortuito; acidente.
Ex.: A prisão do seqüestrador não foi um acaso.
substantivo masculino = desfecho, favorável ou não, de um acontecimento; sucessão de fatos
resultantes de causas independentes da vontade; sorte, destino, fortuna.
Acaso? Tô dizendo. Pensam que sou
adivinho!
Locuções
ao a.
sem ponderação, sem reflexão; a
esmo, inadvertidamente,
irrefletidamente
Ex.: escalou o time ao a.
por a.
de modo casual, inesperado;
fortuitamente, imprevistamente
Ex.: por a. achou a peça que
procurava
por a.
de modo casual, inesperado;
fortuitamente, imprevistamente
Ex.: por a. achou a peça que
procurava
Etimologia
lat. a casu 'por acidente, por acaso',
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
31
Ex.: O acaso que nos espera.
Rubrica: filosofia = No pensamento contemporâneo, imprevisibilidade dos eventos em decorrência
da própria constituição do mundo objetivo, cujas recorrências e leis não dispensam oscilações
probabilísticas, isto é, um grau relativo e freq. mensurável de incerteza e
indeterminação; aleatoriedade.
Locuções
ao acaso
sem ponderação, sem reflexão; a esmo, inadvertidamente, irrefletidamente
Ex.: Escalou o time ao acaso.
por acaso
de modo casual, inesperado; fortuitamente, imprevistamente
Ex.: Por acaso achou a peça que procurava.
Sinônimos ver sinonímia de destino
Um pouco de História
A teoria do Cálculo das Probabilidades teve origem quando dois grandes
matemáticos Blaise Pascal (1623 -1662) e Pierre Fermat (1601-1665) trocavam
idéias para resolverem um problema formulado por um jogador compulsivo. No
século XVII os jogos de azar motivaram os estudos dos modelos matemáticos.
Até hoje, quando queremos estudar probabilidade, encontramos na maioria dos
livros, exemplos relativos aos jogos de azar: retirada de bolas de uma urna, jogadas de moedas
ao ar (questionando quantas são honestas, existem moedas desonestas?), lançamento de dados,
aparecimento de determinada carta de um baralho etc. Atualmente, este tipo de visão em relação
aos cálculos probabilísticos não é mais aceitável, pois a variedade de aplicações dos cálculos é
muito ampla na vida diária das pessoas.
O resultado de uma experiência, geralmente, se dá ao acaso. O matemático observa e verifica
que aquele resultado se repete muitas vezes e, então, elabora um modelo probabilístico que
serve para tomar decisões referentes àquele processo experimental. O modelo matemático que
um estatístico seleciona é capaz de prever o que acontecerá quando determinada experiência for
repetida. Em uma fábrica, por exemplo, podemos prever a porcentagem de produtos não-
conformes esperados no processo de fabricação.
O enfoque dado ao estudo das probabilidades depende da área em que será aplicado. Em nosso
caso, pensaremos em probabilidade como a proporção de vezes que determinada situação
ocorrerá se uma experiência for repetida muitas vezes. Situações como a contagem de peças
não-conformes ou a leitura diária de temperaturas, são exemplos de experiências simples, pois
podem ser repetidas várias vezes. Situações como o teste de um novo medicamento em
pacientes, não são tão simples, pois só deve ocorrer uma única vez com o mesmo paciente,
entretanto, também podem ser consideradas como repetitivas. Como? Imaginando que a
experiência é a primeira de uma série ilimitada de experiências.
Está complicando‼‼ Não devo repetir a experiência,
mas posso considerar como se tivesse repetido
várias vezes???? Preciso estudar…
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
32
As pessoas já conhecem, intuitivamente, o conceito de probabilidade, isto é, a chance de alguma
coisa acontecer.
Se você pensa assim, isto quer dizer que o seu sentimento em relação ao seu entendimento foi
quantificado. Nesse caso, todas as possibilidades são relacionadas com um número que fica num
intervalo entre 0 e 1. Quanto mais próximo de 1, maior a chance de acontecer o
que se espera. No seu caso, a probabilidade de você entender o conteúdo é 0,8.
Digamos que ainda pode melhorar. Depende do quê?
Definições
Lei de Laplace: P(A) = número de casos favoráveis
número de casos possíveis
Quando podemos aplicar a Lei de Laplace?
Quando os eventos são equiprováveis, isto é, que apresentam as mesmas chances de serem
provados ou comprovados. Exemplo: Numa prova com 5 questões, qual a probabilidade de você
acertar a questão número 3?
A = conjunto de acertos das questões da prova
P(A) = número de casos favoráveis = acertar a questão 3 = 5
1= 0,2
número de casos possíveis acertar todas as questões Repare que você tem uma chance para acertar a questão número 3, assim como, tem uma
chance para acertar qualquer uma das 5 questões. O que é favorável, nesse caso, é acertar a
questão número 3. O que é possível, nesse caso, é acertar todas as questões.
A lei de Laplace foi a primeira definição clássica de probabilidade. Agora, imagine que você
precisa conhecer a probabilidade uma pessoa morrer entre 50 e 60 anos de idade (ah! você é
analista de uma companhia de seguros?). Como aplicar a Lei de Laplace? Sabemos o número
correto de casos possíveis? Claro que não!
Nesses casos, precisamos recorrer às tabelas de freqüência do número de mortes entre 50 e 60
anos de idade. O resultado de uma observação futura, não pode, portanto, ser previsto
exatamente. A prática mostra que os resultados de uma sequência longa de repetições, do
mesmo fenômeno, apresentam regularidade no sentido de que a freqüência relativa com que
A chance de eu entender este negócio é quase 80%
Então favorável, é aquilo que preciso que aconteça e
possível, é tudo aquilo que pode acontecer. Entendi!
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
33
determinado resultado aparece na sequência, tende a se manter constante. Os fenômenos que
apresentam esta regularidade estatística são chamados fenômenos aleatórios.
Então chegamos em outra definição:
Probabilidade de uma situação é a frequência relativa dessa situação após n observações.
Tanto a Lei de Laplace quanto a Lei das freqüências relativas são chamadas de probabilidade a
priori, isto é, probabilidade que se elabora atendendo a considerações de simetria ou regularidade
de resultados simples.
Um matemático francês Jacques Bernouilli (1654 – 1705) estudou outro tipo de probabilidade,
chamada de probabilidade a posteriori. Quando não conseguimos estimar a quantidade vezes
possíveis que um evento ocorre, podemos recorrer à previsão dessa quantidade, observando a
regularidade com que a frequência dos resultados acontece. À medida que o número de
repetições de um experimento aleatório cresce maior tende a ser o valor absoluto da diferença
entre a frequência absoluta experimental de um sucesso e a freqüência teórica (a esperada).
Em estatística, chamamos de experimento aleatório qualquer processo de observação que pode
ser repetido à vontade em condições análogas, com a condição de que o resultado não possa ser
previsto antes de cada uma das realizações.
Não podemos esquecer que a natureza não obedece aos modelos matemáticos. Se
perguntassem para você qual a probabilidade de uma pessoa retirar uma folha de papel de cor
azul de um pacote contendo 500 folhas de papel de cor azul, você, muito provavelmente,
responderia ser igual a 1 (Que pergunta idiota! Se no pacote só tem folha azul…). E se a pessoa
morrer instantes antes de retirar a folha? Percebeu? Os modelos probabilísticos não forçam a
natureza a se comportar de acordo com os modelos matemáticos.
O objetivo do cálculo das probabilidades é obter um valor numérico de
possibilidades de ocorrência de determinado acontecimento para que seja
Ah! Então precisamos das estatísticas descritivas?
Vamos usar os resultados que já foram pesquisados?
Como é que é? Eu tenho que ter esperança que
aconteça alguma coisa? Isso é matemática?
Acho que pensam que eu sou autodidata.
Se a natureza não obedece aos modelos probabilísticos, por que preciso deles?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
34
facilitada a tomada de uma decisão relacionada a ele.
Exemplo: Sejam dois alunos do primeiro e do segundo semestre das Faculdades Senai.
Dentre eles será escolhido um representante que tenha média 9 ou 10 para participar de uma
olimpíada de conhecimento. a) Qual a probabilidade de que ele seja do primeiro semestre? b) E
do segundo semestre? c) Qual a probabilidade de que seja um aluno com média 9? d) E com
média 10? e) E com média 10 e aluno do 2º semestre?
Alunos do primeiro e segundo semestre da Faculdade Senai
Média 1º Sem 2º Sem Total
9 172 220 392
10 28 80 108
Total 200 300 500
Solução: As letras a,b,c,d são exemplos de eventos simples, portanto, o cálculo da
probabilidade:
a) P(S1)= 500
200= 0,4
b) P(S2)= 500
300= 0,6
c) P(9)= 500
392= 0,78
d) P(10)= 500
108= 0,22
A letra e, é um exemplo de probabilidade conjunta, então:
e) P(10; S2)= 500
80= 0,16
Probabilidade condicional é calculada levando-se em consideração a ocorrência de um evento
mediante a ocorrência anterior de outro evento.
Exemplo: De uma urna com 25 bolas vermelhas e 15 azuis desejamos retirar 2 bolas. a) Qual
a probabilidade de que a primeira seja azul e b) a segunda seja vermelha, sem reposição?
Solução:
a) P(A)= 40
15= 0,38
Para calcularmos a letra b, precisamos levar em consideração que já retiramos uma bola
azul do total de 40 e, portanto, restam 39 bolas.
b) P(V/A)= 39
25= 0,64
probabilidade de ocorrer bola vermelha considerando que já ocorreu bola azul
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
35
Ainda, se quiséssemos retirar duas bolas azuis:
P(A)= 40
15= 0,38 e P(A/A)=
39
14= 0,36 então: P(AA)= 0,38 . 0,36 = 0,14
Probabilidade de eventos dependentes
Por outro lado, se recolocássemos a bola na urna, o que mudaria?
EXERCÍCIO DE FIXAÇÃO
Dica de estudo: Após estudar o conteúdo da aula, leia atentamente os enunciados das questões. 6- O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50
deputados presentes em uma reunião.
Homem Mulher
Casado 10 8
Solteiro 5 3
Desquitado 7 5
Divorciado 8 4
Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos: 7- Ser um homem;
8- Ser uma mulher; 9- Ser uma pessoa casada; 10- Ser uma pessoa solteira; 11- Ser uma pessoa desquitada; 12- Ser uma pessoa divorciada.
Relacione a resposta adequada até a letra correspondente.
2. Uma caixa contém 15 peças defeituosas em um total de 40 peças. Qual é a probabilidade de se selecionar ao acaso uma peça não defeituosa desta caixa?
Essa eu não entendi. Terei que procurar
na bibliografia. Detesto isto!
0,24 0,16 0,36 0,4 0,6 0,24
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
36
a) 0.650 b) 0.635 c) 0.625 d) 0.630
3. Os funcionários de uma empresa, presentes em uma reunião, foram classificados por sexo e
por opção da área de formação segundo o quadro abaixo:
Masculino Feminino
Artes gráficas 10 8
Mecatrônica 6 5
Vestuário 8 4
Calcular as probabilidades de que:
a) Mulheres optem por Artes Gráficas;
b) Funcionário opte por Vestuário;
c) Seja funcionário sabendo-se que optou por Mecatrônica;
d) Funcionário opte por Mecatrônica.
Relacione as respostas de forma adequada.
alternativa resposta
0.33
0.25
0.47
0.54
4. No primeiro ano da faculdade, 25% dos estudantes são reprovados em Matemática, 15% são
reprovados em Estatística e 10% são reprovados em ambas. Um estudante é selecionado ao
acaso, nesta faculdade. Calcule a probabilidade de que:
e) Ele seja reprovado em Matemática, sabendo-se que foi reprovado em Estatística.
f) Ele não seja reprovado em Estatística, sabendo-se que foi reprovado em Matemática.
Escolha as respostas adequadas e arraste-as ao local correto.
5. A experiência com testes psicotécnicos para habilitação de motoristas indica que 90% dos
candidatos à habilitação aprovados no primeiro teste tornam-se excelentes motoristas. 70% dos
candidatos reprovados no primeiro teste tornam-se péssimo motoristas. Admitindo-se a
classificação dos motoristas apenas em excelentes ou péssimos, responda:
g) Um candidato acaba de ser reprovado em seu primeiro teste psicotécnico. Qual é a
probabilidade de que se torne um excelente motorista?
h) Um candidato acaba de ser aprovado em seu primeiro teste psicotécnico. Qual é a
0,6 0,24 0,66 0,2
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
37
probabilidade de que se torne um péssimo motorista?
i) Um indivíduo acaba de fazer um teste psicotécnico. Se 80% dos candidatos são aprovados
nesse teste, qual é a probabilidade de que se torne um excelente motorista?
Relacione as respostas de forma adequada. Atenção! Sobrará uma resposta sem alternativa.
alternativa resposta
0.33
0.10
0.78
0.30
6- Para sortear uma vaga em uma reunião de condomínio, da qual participaram 12 pessoas,
foram colocados 12 pedaços de papel idênticos, todos em branco, exceto um, no qual foi
escrita a palavra “vaga”. Cada pessoa retira, na sua vez, um papel da urna. O que é melhor:
ser o primeiro ou o último a sortear seu papel?
7- Em um grupo de 4 pessoas, qual é a probabilidade de: a) haver alguma coincidência de signos zodiacais? b) haver exatamente três pessoas com um mesmo signo e uma pessoa com outro signo? c) as quatro pessoas terem o mesmo signo? d) haver duas pessoas com um mesmo signo e duas outras pessoas com outro signo?
8- Em um torneio há 16 jogadores de habilidades diferentes. Eles são sorteados em grupos de 2, que jogam entre si. Os perdedores são eliminados e os vencedores jogam entre si, novamente divididos em grupos de 2, sem novo sorteio, até restar só um jogador, que é declarado campeão. Suponha que não haja “zebras” (ou seja, o jogador de habilidade superior sempre vence)
a) Qual é a probabilidade de o segundo melhor jogador ser vice-campeão do torneio? b) Qual é a probabilidade de o quarto melhor jogador ser vice-campeão do torneio? c) Qual é o número máximo de partidas que o décimo melhor jogador consegue disputar? d) Qual é a probabilidade de ele disputar esse número máximo de partidas?
9- 24 times são divididos em dois grupos de 12 times cada. Qual é a probabilidade de dois desses times ficarem no mesmo grupo?
RECAPITULANDO
Nesta aula você aprendeu o que é probabilidade. Ficou sabendo que a natureza não,
necessariamente, obedece aos modelos matemáticos. Aprendeu a calcular as probabilidades de
ocorrência de eventos que são previsíveis e que também não são previsíveis. Aprendeu a
calcular a probabilidade de acontecer eventos que são dependentes entre si.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
38
Módulo 02: Trabalhando com dados Estatísticos
Aula 02: Amostragem e tipos de Dados
Recordando
Na aula 01 você aprendeu o que é probabilidade. Ficou sabendo que a natureza não,
necessariamente, obedece aos modelos matemáticos. Aprendeu a calcular as probabilidades de
ocorrência de eventos que são previsíveis e que também não são previsíveis. Aprendeu a
calcular a probabilidade de acontecer eventos que são dependentes entre si.
OBJETIVO DA AULA 02
Nesta aula você aprenderá o que é amostragem e os tipos de dados envolvidos nos processos estatísticos. Aprenderá um método de cálculo para o tamanho de uma amostra. Lerá sobre a aplicação da amostragem nas pesquisas de mercado.
DESENVOLVIMENTO
Na Unidade 1 já tivemos a oportunidade de estudar sobre alguns conceitos que conheceremos
mais a fundo nesta aula.
POPULAÇÃO ou UNIVERSO é qualquer conjunto de
informações que tenham, entre si, uma característica comum.
AMOSTRA é uma redução da população a dimensões menores,
mas sem a perda das características essenciais. Uma amostra,
para ser boa, tem de ser representativa, ou seja, deve conter em
proporção tudo o que a população possui qualitativa e
quantitativamente. Também deve ser imparcial, isto é, todos os
elementos da população devem ter igual oportunidade de fazer
parte da amostra.
Para garantir a representatividade devemos fazer uma análise da população para ver se os
seus elementos distribuem-se homogeneamente ou se formam grupos com características
peculiares. Se for esse o caso, temos de respeitar as proporções com que esses grupos integram
a população.
Para garantir a imparcialidade devemos fazer um sorteio (mediante uma máquina geradora
de números aleatórios ou tábua de números aleatórios) dos elementos que farão parte da
amostra.
Agora veremos o que é amostragem, muitas vezes, confundida com a amostra.
10- Amostragem
Processo pelo qual uma amostra de unidade da população é observada. A amostragem pode ser
com reposição ou sem reposição.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
39
Sem reposição: Em uma pesquisa eleitoral, para que se conheça a intenção de voto, as pessoas
devem ser ouvidas apenas uma vez, porque o voto é individual.
Com reposição: Quando se deseja saber quanto tempo uma pessoa fica em fila de banco, a
mesma pessoa pode ser observada duas ou mais vezes, a cada vez que retorna ao banco.
Utilização de amostragem
Nem sempre é conveniente obter informações de todas as pessoas, objetos ou coisas de uma
população. Em alguns casos, a restrição de consultar toda a população é econômica, como é o
caso da determinação da vida útil das lâmpadas que obrigaria a testar todas as lâmpadas
produzidas, não restando nenhuma para a venda.
Uma amostragem não oferecerá exatidão nos resultados. Porém os erros possíveis de serem
cometidos podem ser evitados ou corrigidos aplicando técnicas adequadas estabelecendo com
estimativa de erro, por exemplo, intervalo de confiança. Entre os vários tipos de amostragens
destacam-se três: sistemática, aleatória simples e estratificada.
Aleatória simples: exige uma simulação de sorteio, o que é feito pelo uso de uma tabela de dígitos
pseudo-aleatórios.
Sistemática: quando a retirada das unidades de observação é feita periodicamente, sendo o
intervalo de seleção calculado, para uma população finita, por meio da divisão do tamanho da
população, pelo tamanho da amostra a ser selecionada.
Estratificada: Ás vezes a população é heterogênea e a amostragem aleatória simples não reflete
a heterogeneidade. Nesses casos, utiliza-se uma amostragem denominada estratificada, obtida
pela separação das unidades da população em grupos distintos (chamados estratos); em seguida
seleciona-se uma amostra aleatória simples a partir de cada estrato. A amostra completa
compõe-se da agregação das amostras de cada estrato e, geralmente, a proporcionalidade do
tamanho de cada estrato na população é mantida na amostra. Por exemplo, ao estudar uma
sociedade, pode-se estratificar a população por escolaridade, faixa etária ou por renda mensal,
devendo escolher estratos homogêneos com respeito à característica que se está observando.
Técnicas Amostrais
As técnicas amostrais se subdividem em dois grandes grupos:
i. amostragem probabilística;
ii. amostragem não-probabilística.
Amostragem probabilística
Nesta técnica todos os elementos, integrantes da população a ser pesquisada, têm igual
probabilidade (diferente de zero) de serem selecionados para compor a amostra. Existem 4 tipos
básicos de amostragem probabilística:
a) Amostragem probabilística simples: Os elementos que farão parte da amostra serão
escolhidos aleatoriamente.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
40
Ex.: para se obter uma amostra de pessoas moradoras de um bairro, que habitualmente tomem
refrigerantes, calculamos a amostra independentemente de outros fatores. Bastará que a pessoa
more no bairro pesquisado e tome habitualmente refrigerante.
b) Amostragem probabilística estratificada: É aplicada quando há necessidade de subdividir a
população em extratos homogêneos, (sexo, idade, estado civil, faixa de renda, etc.)
c) Amostragem probabilística sistemática ou por intervalo de classes: Onde os elementos da
amostra (n) serão selecionados aleatoriamente e será estabelecido um intervalo entre esses
elementos, chamado intervalo de classes.
Esse intervalo é obtido pela divisão do número do universo (N), pelo número da amostra (n),
como segue:
I = n
N
I = Intervalo de classe
N = Universo
n = amostra
Ex.: escolhemos uma rua com residências, na qual faremos pesquisas domiciliares sobre a
preferência de sabor de pizza (consome pizza salgada, doce ou não consome pizza). Imaginemos
que essa rua contenha 500 residências e que queiramos pesquisar 50 residências dentre elas.
Assim:
N = 500
n = 50
I = 500 = 10
50
Ou seja, temos 10 intervalos com 50 residências cada um. Portanto, em cada grupo de 50
residências, pesquisaremos, por exemplo, a 1ª e a 10ª residência.
Após isso pesquisaremos a 1a e 10a do segundo grupo de 50 residências, e assim
sucessivamente, totalizando as 50 residências pesquisadas.
A justificativa para esse critério apóia-se no fato de que os vizinhos se influenciam.
Utilizando esta técnica reduz-se o risco de possíveis distorções provenientes dessa influência.
d) Amostragem probabilística estratificada: É aplicada quando há necessidade de subdividir a
população em extratos homogêneos, (sexo, idade, estado civil, faixa de renda, etc.)
e) Amostragem probabilística sistemática ou por intervalo de classes: Onde os elementos da
amostra (n) serão selecionados aleatoriamente e será estabelecido um intervalo entre esses
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
41
elementos, chamado intervalo de classes.
Esse intervalo é obtido pela divisão do número do universo (N), pelo número da amostra (n),
como segue:
I = n
N
I = Intervalo de classe
N = Universo
n = amostra
Amostragem não-probabilística
A amostragem não-probabilística não é obtida a partir de conceitos estatísticos.
As amostras são selecionadas por critérios subjetivos do pesquisador, conforme sua experiência
e principalmente com os objetivos do estudo.
Esta técnica pode ser subdivida em:
a) Por conveniência: Neste caso, os elementos da amostra são selecionados de acordo com a
conveniência do pesquisador, envolvendo pessoas que estão ao seu alcance e dispostas a
responder a pesquisa.
Ex.: pessoas que passam pela rua são abordadas para responder uma determinada pesquisa.
b) Por critérios: Nesta técnica o pesquisador utiliza algum critério de julgamento, tendo como
base o elemento selecionado para pesquisa possa fornecer ao estudo.
Ex.: o elemento selecionado trata-se de uma determinada marca de um produto e queremos
saber quem usa e quem não usa este produto. Basta encontrarmos usuários e não-usuários
deste produto.
c) Por cota: O pesquisador procura por uma amostra que se identifique em alguns aspectos com
o universo. Essa identificação pode estar relacionada com perfis diversos como sexo, idade,
estado civil, cores dos olhos ou raças.
Ex.: realizemos uma pesquisa de opinião sobre uma determinada revista semanal e, apesar da
escolha destas pessoas serem aleatórias, para que seja realizada esta entrevista o pesquisado
deverá passar por um filtro, deve ter entre 20 e 30 anos e pertencer às classes A e B.
11- Variável
Variável é uma atribuição de um número a cada característica da unidade de observação, ou
seja, é uma função matemática definida na população. Exemplos: sexo, idade, altura etc.
12- Variável discreta
É uma variável quantitativa que pode assumir apenas determinados valores e resulta de uma
contagem.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
42
Exemplos: quantidade de valores de notas de uma moeda: 1, 2, 5, 10, 20, 50, 100 (reais)
13- Variável contínua
É uma variável quantitativa em que o conjunto de valores possíveis é um intervalo de números
reais, resultado de uma medição em qualquer grau de precisão.
Exemplo: Valor do patrimônio do cidadão brasileiro: R$15.000,00; R$4.675.778,95
14- Variável qualitativa
É uma variável não-numérica. Exemplos: sexo, religião, naturalidade, cor dos olhos, idade.
Uma variável qualitativa é expressa em categorias. Exemplos:
a) em sexo: masculino e feminino
b) em religião: católica, judaica e protestante
c) em naturalidade: carioca, paulista, gaúcho e mineiro
d) em faixa etária: até 25 anos, de 26 a 49 anos e acima de 50 anos
15- Variável quantitativa
Uma variável é quantitativa quando pode ser expressa numericamente. Elas podem ser discretas
ou contínuas.
Exemplos: quantidades de valores de notas de uma moeda; quantidade de sabores de refresco;
valor do patrimônio do cidadão brasileiro; duração de uma bateria de telefone celular.
OBS: O fato de uma variável ser expressa em número não significa que ela seja necessariamente
quantitativa, porque a classificação da variável depende de como foi medida e não da maneira
como se manifesta.
Exemplo: O peso de um lutador de boxe pode ser uma variável quantitativa ou qualitativa se o
seu peso for classificá-lo em alguma categoria.
16- Escala
Linha graduada, dividida em partes iguais, que indica a relação das dimensões ou distâncias
marcadas sobre um plano com as dimensões ou distâncias reais.
17- Escala ordinal
As características das unidades de observação são ordenadas (de maneira crescente ou
decrescente) em situações para as quais a posição associada é importante.
Exemplo: Ao se verificar o desempenho de uma pessoa ou de uma atividade, para o qual há
cinco categorias, para facilidade de codificação associa-se um número a cada desempenho: (5)
ótimo; (4) bom; (3) regular; (2) ruim; (1) péssimo.
18- Escala nominal
As características das unidades de observação classificam-se em várias categorias, nas quais um
valor numérico associado com a característica não tem significado real.
Exemplo: A variável sexo apresenta as categorias masculino e feminino, as quais podem ser
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
43
classificadas numericamente pela atribuição do número 1 para o sexo feminino e 2 para o
masculino.
Tabela de códigos da declaração de bens e direitos de imóveis: 11- apartamento; 12 – casas; 13
– terrenos...
19- Escala intervalar
As características das unidades de observação têm atribuído a elas valores que permitem
comparar não só a ordem como também a variação numérica entre as características.
Exemplo: Em um intervalo de duas horas foram anotadas cinco leituras de temperatura: 205, 207,
210, 215 e 220. Além de haver uma ordenação, a variação entre 205 e 215 é a mesma do que a
entre 210 e 220. Embora esses valores referentes à temperatura possam ser colocados em
ordem (crescente ou decrescente), a comparação entre eles só é possível se estiverem na
mesma escala: por exemplo, se as escalas forem Celsius e Fahrenheit, a comparação não é
possível porque os zeros das escalas são diferentes.
20- Escala proporcional
As características das unidades de observação são ordenadas e a variação entre elas pode ser
comparada, havendo um zero natural para a escala de medição.
Exemplo: Considere uma situação na qual se obtiveram as seguintes massas, em quilogramas:
5,0; 5,1; 5,3 e 5,4. A variação de 5,0 kg para 5,1 kg é de 0,1 kg, a mesma variação de 2,3 kg para
2,4 kg e existe um zero natural para a escala, o 0 kg.
21- Amplitude
Diferença entre o maior e menor valor de um conjunto de números da amostra.
13- Informações
Dados que passaram por algum tipo de análise de modo que se tornassem úteis.
22- Rol da amostra
Conjunto dos valores da amostra, dispostos em ordem crescente ou decrescente.
15- Frequência absoluta
Freqüência absoluta de uma categoria ou de um valor é a quantidade de vezes em que uma
categoria ou um valor aparece em um conjunto de dados; também denominada freqüência.
16- Tabela de freqüência
É a reorganização dos valores em ordem crescente ou decrescente de grandeza, tal que uma
característica da população é subdividida em classes ou categorias, indicando-se a quantidade de
ocorrências em cada classe, relacionando cada valor (ou classe de valores) com a freqüência de
seu aparecimento.
17- Tamanho da Amostra
Obs.: um passo importante antes de iniciar o cálculo do tamanho da amostra é definir qual o erro
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
44
amostral tolerável para o estudo que será realizado. Observe as fórmulas:
Exemplo: Em uma empresa que contém 2000 colaboradores, deseja-se fazer uma pesquisa de
satisfação. Quantos colaboradores devem ser entrevistados para tal estudo?
Resolução: N = 2000 Definindo o erro amostral tolerável em 2%
E0 = 0,02 n0 = 1 / (E0)2 n0 = 1 / (0,02)2 n0 = 2500
n = (N . n0) / (N + n0) n = (2000 . 2500) / (2000 + 2500) n = 1111 colaboradores
Considerando o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para
a pesquisa.
Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%.
N = 2000 ; E0 = 0,04 ; n0 = 1 / (E0)2 n0 = 1 / (0,04)2 n0 = 625
n = (N . n0) / (N + n0) n = (2000 . 625) / (2000 + 625) n = 476 colaboradores
Através deste segundo cálculo, é possível observar que, quando aumentamos a margem de erro,
o tamanho da amostra reduz.
E se houvesse 300.000 colaboradores na empresa?
N = 300.000; E0 = 0,04; n0 = 1/(E0)2 n0 = 1/(0,04)2 n0 = 625
n = (N. n0) / (N + n0) n = (300.000 . 625) / (300.000 + 625) n = 623 colaboradores
Observe que a diferença entre n e n0, neste último cálculo, é muito pequena.
Portanto: se o número de elementos da população (N) é muito grande, a primeira aproximação
do tamanho da amostra já é suficiente. Observe ainda:
N = 2000; E0 = 0,04; n = 476 colaboradores = 23,8% da população
N = 300.000; E0 = 0,04 n = 623 colaboradores = 0,2% da população
onde:
n0 é a primeira aproximação do tamanho
da amostra
E0 é o erro amostral tolerável (Ex.: 2% =
0,02 )
onde:
N é o número de elementos da população
n é o tamanho da amostra
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
45
EXERCÍCIO DE FIXAÇÃO
Leia com atenção a entrevista abaixo (Triola, Mario F. Introdução à
Estatística. Rio de Janeiro: Editora LTC, 1999, p.203).
ENTREVISTADO: Jay Dean: vice-presidente Sênior da San Francisco
Office of Young &Rubicam Advertising.
Trabalhou para muitas empresas conhecidas, entre elas AT&T,
Chevron, Clorox, Gillette, Ford Motor Co., General Foods, entre outras.
1- Até que ponto utiliza-se a estatística na Young&Rubicam?
Utilizamos a estatística diariamente. Fazemos um grande volume de pesquisas de consumo, bem
como muitas pesquisas sobre atitudes e hábitos do consumidor. Para alguns clientes fazemos
testes de produtos, testes de gosto, estudo de estratégia – qualquer coisa que necessitem. Estou
agora trabalhando em um planejamento típico, um teste de propaganda para os molhos de salada
Take Heart, uma das marcas com que trabalhamos para a Clorox Company. Dois comerciais
foram apresentados a amostras independentes de consumidores. Formulamos questões sobre o
que cada comercial transmitia, percepções de marca, gostos e aversões, etc. Faremos testes de
significância para comparar os resultados e escolher o melhor comercial.
2- Poderia citar um caso em que o uso da estatística foi fundamental para definir uma
estratégia bem sucedida?
Recentemente fizemos uma pesquisa para a Pine-Sol, outra marca do grupo Clorox. Produziram-
se cerca de meia dúzia de esboços de comerciais, que foram apresentados a amostras
independentes de consumidores. A estatística ajudou a identificar o melhor comercial para a
campanha do Pine-Sol. Os primeiros resultados são muito encorajadores. Na Y&R acreditamos
que a pesquisa ajude a planejar a propaganda mais eficiente. A estatística contribui para a
tomada de decisões, com base nos resultados de pesquisa.
3- Como se costuma coletar dados para a análise estatística?
Há muitas maneiras de coletar dados, mas, em geral, ou se faz uma amostragem telefônica
aleatória para trabalhos de pesquisa, ou, se queremos mostrar às pessoas algo como um
comercial, utilizamos o sistema de entrevista em um local central. Por exemplo, as pessoas são
abordadas num shopping por um entrevistador, sondadas quanto à aceitação, convidadas a ir a
um local onde lhe é apresentado um comercial etc.
4- Acha difícil obter amostras representativas e não-tendenciosas?
Sim. A indústria da pesquisa de mercado está agora muito preocupada com a crescente taxa de
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
46
recusa do público em geral. Isto é devido, em parte, ao fato de que certos elementos disfarçam
uma tentativa de venda sob a capa de uma pesquisa de mercado. As pesquisas pelo correio
estão sujeitas a uma grande tendenciosidade devido à auto-seleção, e as taxas de respostas são
em geral bem baixas. As entrevistas nos shoppings têm outros problemas. Nem todo mundo vai
aos shoppings, e há certo grau de tendenciosidade por parte do entrevistador ao abordar as
pessoas.
5- Qual é o seu tamanho típico de amostra?
Para uma pesquisa de âmbito nacional, a regra empírica indica cerca de mil pessoas, embora, em
alguns casos, 600 sejam suficientes. Para um teste de propaganda, uma amostra da ordem de
200 seria um tamanho bastante satisfatório, mas ás vezes utiliza-se apenas cem.
6- Em seu campo de trabalho, acha que os candidatos a emprego são favorecidos se tiverem
estudado alguma estatística?
Sim, certamente. Todos têm de utilizar a estatística em algum nível. É muito importante para as
pessoas admitidas conhecer bem a estatística, porque vão realizar grande parte do nosso
trabalho de pesquisa. No início, cabe-lhes a tarefa de destrinchar e analisar dados.
7- Tem algum conselho para o estudante de hoje?
Se eu pudesse voltar à escola, certamente estudaria mais matemática, estatística e ciência da
computação. Estudei muito essas matérias, mas gostaria de ter estudado ainda mais. Há uma
grande explosão de dados nos negócios hoje em dias atuais. Todos os ramos de negócio estão
se tornando mais quantitativos do que jamais o foram no passado. Hoje há maior quantidade de
informações do que podemos manejar, e devemos dispor dos instrumentos analíticos e do
conhecimento para lidar com essas informações, se queremos ser bem-sucedidos.
Após a leitura atenciosa da entrevista acima, responda às questões 1 e 2
1- Escolha a opção adequada de acordo com a opinião do entrevistado sobre as coletas de
amostras:
a) As pesquisas via correio são tendenciosas;
b) As pesquisas mais adequadas são aquelas realizadas em shoppings;
c) A indústria da pesquisa de mercado não se preocupa com a opinião do público;
d) O entrevistador nunca é tendencioso quando aborda o entrevistado
2- Complete com V (verdade) ou F (falso):
( ) Os candidatos a emprego são favorecidos se tiverem estudado alguma estatística;
( ) Todos os funcionários têm de utilizar a estatística em algum nível;
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
47
( ) É muito importante para as pessoas admitidas conhecer bem a estatística;
( ) Se o entrevistado pudesse voltar à escola, certamente estudaria mais matemática,
estatística e ciência da computação;
( ) Hoje há maior quantidade de informações do que podemos manejar, e devemos dispor
dos instrumentos analíticos e do conhecimento para lidar com essas informações, se queremos
ser bem-sucedidos.
3- Você quer aplicar um teste de auditoria em empresas contábeis. Para garantir a
representatividade da população contábil você pode estipular intervalos uniformes, entre os itens
a serem selecionados, como um método de seleção de amostras denominado:
a) números aleatórios.
b) amostragem de atributos.
c) amostragem sistêmica.
d) amostragem por bloco.
4- Em estatística, população ou universo é:
a. Um conjunto de pessoas;
b. Um conjunto de elementos quaisquer
c. Um conjunto de pessoas com uma característica comum;
d. Um conjunto de elementos com pelo menos uma característica em comum.
5- A parte da estatística que se preocupa somente com a descrição de algumas
características de um grupo, sem tirar conclusões sobre a população denomina-se:
a. Estatística de População;
b. Estatística Descritiva;
c. Estatística de Amostra;
d. Estatística Inferencial
6- O estudo de situação de um fenômeno determina as características que interessam à pesquisa, por meio de um cuidadoso planejamento, que defina o quê pesquisar, o quê fazer e como fazer. (__) A coleta de dados é a fase operacional do método estatístico. (__) Uma coleta bem planejada e uma fonte real para sua obtenção são fatores fundamentais para o conhecimento do fenômeno. (__)
Revendo o seu julgamento, marque a opção que defina a seqüência correta.
A) V V V B) V V F C) F V V D) V F V E) F F V
7- A sumarização do fenômeno é apresentada pelo pesquisador, por meio de dados simples,
porém claros e objetivos (__). O pesquisador utilizará da Estatística Descritiva para apresentar o
fenômeno, (__) quando usará as tabelas para expor as informações (__) e os gráficos para
ilustrar a os fatos. (__)
Revendo o seu julgamento, marque a opção que defina a seqüência correta.
A) V V V F B) V V F F C) F V F V D)V V V V E) F F V V
8- A descrição numérica do fenômeno se dá depois que o fenômeno estiver bem
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
48
caracterizado (__) e todas as variáveis avaliadas quanto a sua importância para a pesquisa. ( ) Todos os cálculos são importantes, porém o pesquisador fará somente aqueles cálculos necessários à sua pesquisa. (__) Revendo o seu julgamento, marque a opção que defina a seqüência correta. A) F F F B) F V F C) V V V D) V F V E) F F V
9- A conclusão e a previsão definem a última etapa do método estatístico. (__) Tais etapas são fatores importantes para uma tomada de decisão, (__) mas a conclusão e a previsão envolvem toda a filosofia da estatística descritiva. (__)
Marque a opção que defina a seqüência correta.
A) V V V B) V V F C) F V V D) V F V E) F F V
10- Uma sala de aula há 60 pessoas, entre as quais 36 são homens e 24 mulheres. Leia as
afirmativas abaixo e marque a que julgar falsa.
A) Uma amostra aleatória estratificada proporcional com 10 pessoas terá 6 homens e 4 mulheres.
B) Uma amostra aleatória estratificada proporcional com 15 pessoas terá 9 homens e 6 mulheres.
C) Uma amostra aleatória estratificada proporcional com 20 pessoas terá 12 homens e 8
mulheres.
D) Uma amostra aleatória estratificada proporcional com 30 pessoas terá 20 homens e 10
mulheres.
E) Uma amostra aleatória estratificada proporcional com 40 pessoas terá 24 homens e 16
mulheres.
11- Leia as afirmativas abaixo e em cada espaço, marque V ou F, conforme entendimento.
I - A estatística descritiva fundamenta-se em métodos tabulares, gráficos e numéricos que são
usados para sintetizar, apresentar e expor as informações de um fenômeno. (__)
II - A inferência estatística é o processo de utilizar dados obtidos a partir de uma amostra, (__)
visando estimativas ou testando hipóteses sobre as características de uma população. (__)
III - A estatística é a arte e a ciência de coletar, apresentar, analisar e interpretar os dados,
definindo conclusões e tendências sobre o perfil das informações coletadas. (__)
IV - População é o conjunto de objetos, pessoas, coisas ou itens que apresentam certa
característica. (__). É o conjunto de todos os elementos de interesse em um determinado estudo.
(__)
V - Uma grande vantagem da estatística é que os dados de uma amostra podem ser usados para
fazerem estimativas e para testar hipóteses sobre a respectiva população com certa
probabilidade. (__)
Revendo o seu julgamento, marque a opção que defina a opção verdadeira.
a) Todas as afirmativas de cada item são verdadeiras.
b) As afirmativas dos itens I, II e IV são verdadeiras e as afirmativas dos demais são falsas.
c) As afirmativas dos itens II, III e IV são verdadeiras e as afirmativas dos demais são falsas.
d) As afirmativas dos itens III, IV e V são verdadeiras e as afirmativas dos demais são falsas.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
49
e) As afirmativas dos itens III, IV e V são falsas e as afirmativas dos demais são verdadeiras.
12-Numa Faculdade há 800 alunos, entre os quais 360 fazem Administração, 160 fazem
Contábeis, 200 fazem Turismo e 80 alunos fazem Computação. Nesta Faculdade, uma amostra
aleatória estratificada proporcional, com 60 alunos terá:
a) 27 alunos da Administração, 15 de Contábeis, 12 alunos de Turismo e 6 alunos de
Computação.
b) 27 alunos da Administração, 12 de Contábeis, 15 alunos de Turismo e 6 alunos de
Computação.
c) 17 alunos da Administração, 22 de Contábeis, 15 alunos de Turismo e 6 alunos de
Computação.
d) 12 alunos da Administração, 27 de Contábeis, 15 alunos de Turismo e 6 alunos de
Computação.
e) 27 alunos da Administração, 12 de Contábeis, 25 alunos de Turismo e 6 alunos de
Computação.
13- Em uma turma com 56 alunos, extraiu-se uma amostra aleatória sistemática com 8 alunos,
dentro das condições indicadas em cada item.
I) Se o primeiro número sorteado for o número cinco, os demais números sorteados que vão compor esta amostra aleatória sistemática serão 12, 19, 26, 33, 40, 47 e 54.
II) Se o primeiro número sorteado for o número quatro, os demais números sorteados que vão compor esta amostra aleatória sistemática serão 11, 18, 25, 32, 39, 46 e 53. lll) Se o primeiro número sorteado for o número três, os demais números sorteados que vão compor esta amostra aleatória sistemática serão 10, 17, 24, 31, 38, 45 e 52. lV) Se o primeiro número sorteado for o número dois, os demais números sorteados que vão compor esta amostra aleatória sistemática serão 10, 18, 26, 34, 42, 50 e 56. Após a leitura dos itens acima, marque a opção verdadeira. A) Todos os itens são verdadeiros; B) Os itens l, II e lll são verdadeiros e o item IV é falso. C) Os itens lll e lV são verdadeiros e os demais falsos. D) Os itens ll e lll são verdadeiros e os demais falsos.
14- A produção diária de carros define uma variável contínua (__), mas o peso dos
funcionários de uma empresa define uma variável discreta (__) e o tempo de serviço dos
funcionários define uma variável contínua (__).
Após a sua leitura, a seqüência verdadeira é
A)VVF B) VVF C) FVV D) VVV E) FFV
15- Em uma turma há 50 alunos, entre os quais 30 são homens e 20 são mulheres. Os alunos
foram enumerados de 1 a 50. Nos itens abaixo e nos espaços, marque V ou F, conforme o seu
entendimento, quanto a uma amostra aleatória e indique a opção que defina a seqüência correta.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
50
A) Uma amostra estratificada proporcional com 10 pessoas terá 6 homens e 4 mulheres. ( )
B) Uma amostra estratificada proporcional com 15 pessoas terá 9 homens e 6 mulheres. ( )
C) Uma amostra estratificada proporcional com 20 pessoas terá 12 homens e 8 mulheres. ( )
D) Uma amostra estratificada proporcional com 25 pessoas terá 15 homens e 10 mulheres. ( )
E) Uma amostra estratificada proporcional com 40 pessoas terá 24 homens e 16 mulheres. ( )
A) VFVFF B)VVVVV C) VFVFV D) FFFVV E)VVVVFF
16- Em uma faculdade há 1.000 alunos, entre os quais 380 fazem Administração, 260 fazem
Contábeis, 200 fazem Turismo e 160 fazem Computação.
I- Uma amostra aleatória estratificada proporcional com 200 alunos terá 76 alunos da
Administração, 52 de Contábeis, 40 de Turismo e 32 alunos de Computação.
II - Uma amostra aleatória estratificada proporcional com 150 alunos terá 57 alunos da
Administração, 39 de Contábeis, 30 de Turismo e 24 alunos de Computação.
lll - Uma amostra aleatória estratificada proporcional com 50 alunos terá 19 alunos de
Administração, 13 de Contábeis, 10 alunos de Turismo e 8 alunos de Computação.
Após os seus cálculos, marque a afirmativa correta.
A) Todos os itens são verdadeiros.
B) Os itens l e lll são verdadeiros e o item ll é falso.
C) Os itens ll e lll são verdadeiros e o item l é falso.
D) Os itens l e ll são verdadeiros e o item lll é falso.
E) O item I é verdadeiro e os itens II e III são falsos.
17- Marque nos espaços abaixo V ou F, conforme o seu entendimento.
A altura dos alunos universidade define uma variável contínua (__), e os salários de uma empresa definem uma variável discreta (__), mas uma variável, se discreta ou contínua, apresentada por uma distribuição de freqüências, será considerada como contínua. ( ) Marque a seqüência verdadeira. A) V V V
B) V F F
C) F V V
D) F V F
E) V V F
18- Leia as afirmativas abaixo e em cada espaço, marque V ou F, conforme julgamento.
Estatística descritiva é a parte da Estatística que visa descrever, apresentar e analisar os dados
sem a preocupação de fazer generalizações (__) ou tirar conclusões para o conjunto de onde
foram retiradas tais informações. (__) Mas a indutiva visa estudar amostras ( ) e tirar conclusões
para as respectivas populações. ( ) Revendo o seu julgamento, marque a opção que defina a
seqüência correta.
A)V V V V B) V F V F C) F V F V D)F F F F E) V V F F
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
51
Módulo 02: Trabalhando com dados Estatísticos
Aula 03: Tabulação dos Dados
Recordando
Na aula 02 você aprendeu o que é amostragem e os tipos de dados envolvidos nos processos
estatísticos. Aprendeu um método de cálculo para o tamanho de uma amostra. Leu sobre a
aplicação da amostragem nas pesquisas de mercado.
OBJETIVO DA AULA 03
Nesta aula você aprenderá como tabular os dados pesquisados. Aprenderá a construir tabelas de freqüência para valores inteiros e decimais. Conhecerá os gráficos mais utilizados pelas indústrias, de modo geral: histograma, setores, Pareto e Controle.
DESENVOLVIMENTO
Construindo tabelas de frequência
Observe os dados da tabela abaixo:
50 60 66 70 72 79 85 96
54 60 67 70 72 79 85 96
55 61 67 70 74 80 88 100
55 63 67 70 74 80 90 103
57 63 68 70 74 80 90 105
57 64 68 70 74 80 90 111
58 64 70 70 75 81 90 129
58 65 70 71 75 82 90 90
58 65 70 72 75 85 92 59
65 70 72 77 85
Estes resultados representam as respostas de 77 pessoas que foram perguntadas sobre o seu
peso. Para estudarmos mais rapidamente estes dados podemos elaborar uma tabela de
frequência. Você já viu, nas aulas anteriores, como proceder, mas vamos relembrar:
1- Vamos calcular a amplitude dos dados amostrais
Amplitude = 129 – 50 = 79
2- Vamos calcular a amplitude de cada classe de freqüência
79 : 8= 9.87
Podemos utilizar 8 classes de amplitude igual a 10 quilos.
3- Vamos elaborar a tabela de classes:
Finalmente! Perceberam que eu preciso
relembrar algumas coisas. Nem eu acredito…
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
52
classes frequência
50-------60 10
60-------70 16
70-------80 26
80-------90 11
90------100 9
100----110 3
110----120 2
120----130 1
Agora veja como ficou mais fácil entender os dados coletados: temos 10 pessoas que pesam
entre 50k e 60k. Lembre-se de que na primeira classe da tabela, as pessoas que pesam 60k não
estão presentes. Quando montamos um intervalo desse modo, quer dizer que o intervalo é
fechado no início e aberto no final. As pessoas que pesam 60k só poderiam ficar na 2ª classe de
freqüência.
Poderíamos ter utilizado intervalos fechados nos dois lados? Claro que sim!
Observe, novamente, os dados. Não aparecem valores decimais, isto é, números com vírgulas.
Poderíamos elaborar classes assim, por exemplo:
classes frequência
50-------59 10
60-------69 16
70-------79 26
80-------89 11
90------ 99 9
100----109 3
110----119 2
120----129 1
O que mudamos nessa tabela? A amplitude de cada classe. Diminuímos para 9k ao invés de 10k,
pois cada classe inclui todos os seus valores.
Transformando as tabelas em gráficos
Agora não podemos discutir muito. Na 1ª tabela que construímos o único gráfico indicado é o
histograma. Por quê? Porque os intervalos são abertos e, portanto, não sabemos exatamente,
onde termina um intervalo e começa o outro.
Mãos à obra!
Essa eu entendi: dois corpos não ocupam
o mesmo lugar no espaço, não é?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
53
classes frequência Média da classe
50-------60 10 55
60-------70 16 65
70-------80 26 75
80-------90 11 85
90------100 9 95
100----110 3 105
110----120 2 115
120----130 1 125
Média da classe = (50 + 60) / 2 = 55
Calculamos a média da classe para podermos construir o gráfico de modo mais estético. Perceba
que agora lemos que na 1ª classe temos 10 pessoas que pesam em média 55k cada uma.
A nova tabela:
Média da classe frequência
55 10
65 16
75 26
85 11
95 9
105 3
115 2
125 1
Agora vamos ao gráfico:
Observe o gráfico. As paredes das colunas não apresentam espaçamento. Nele entendemos que
10 pessoas pesam menos que 55k.
Veja a diferença do gráfico da 2ª tabela:
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
54
Percebeu? Neste segundo gráfico sabemos que 10 pessoas declararam pesar
55k.
E se escolhêssemos um gráfico de setores?
Reparem que fica difícil entender o significado do gráfico. Ao escolhermos um
tipo de gráfico, necessitamos privilegiar a clareza da mensagem visual.
Já vimos os histogramas, os gráficos de colunas, os gráficos de setores e
agora conheceremos o Gráfico de Pareto.
Definição: Forma especial do gráfico de barras verticais, que dispõe os itens analisados desde o
mais freqüente, até o menos frequente.
Estava demorando para confundir tudo‼‼
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
55
Objetivo: Estabelecer prioridades na tomada de decisão, a partir de uma abordagem estatística.
Princípio de Pareto: Analisando a distribuição da renda entre os cidadãos, o economista italiano
V. Pareto concluiu que a maior parte da riqueza pertencia a poucas pessoas. Essa mesma
conclusão foi depois constatada em outras situações, sendo estabelecida a relação que ficou
conhecida como Princípio de Pareto ou relação 20-80. Segundo esse princípio, 20 por cento das
causas são responsáveis por 80 por cento dos efeitos.
Quando usar: O gráfico de Pareto é usado sempre que for preciso ressaltar a importância
relativa entre problemas ou condições, no sentido de: escolher ponto de partida para a solução de
problemas; avaliar o progresso de um processo; identificar a causa básica de um problema.
Como fazer
1. Defina o objeto da análise.
2. Estratifique o objeto a analisar.
3. Colete os dados, utilizando uma Folha de verificação.
4. Classifique cada item em decrescente e anote sua posição na coluna classificação.
5. Calcule a porcentagem individual e anote na coluna % individual.
6. Reorganize os dados em ordem decrescente, numa nova.
7. Calcule a porcentagem acumulada e anote na coluna % acumulada..
8. Construa o gráfico, após determinar as escalas do eixo horizontal e vertical.
9. Construa a curva da % acumulada. Ela oferece uma visão mais clara da relação entre as
contribuições individuais de cada um dos fatores.
Modelo de Lista de verificação:
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
56
Fonte: http://www.lugli.org/2008/02/grafico-de-pareto/ acesso em 20/09/09 às 23h30min.
Olhe o gráfico. Este tipo de gráfico é muito utilizado nas indústrias de modo geral. Observando as
variáveis envolvidas no gráfico, outros estudos serão desenvolvidos pelo setor de controle de
qualidade da empresa.
Outro tipo de gráfico muito utilizado é o gráfico de Controle.
Definição: É um gráfico de linhas que consiste em uma linha central, limites de controle e pontos
que representam o estado de um processo. Os limites de controle são calculados
estatisticamente e representados por linhas traçadas acima e abaixo da linha central. Foi
originalmente proposto em 1924, por W. A. Shewhart, com a intenção de eliminar variações
anormais pela diferenciação entre variações devidas a causas comuns e aquelas devidas a
causas aleatórias.
Objetivo: Permitir o acompanhamento do processo ao longo o tempo, distinguindo as variações
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
57
especiais das variações comuns.
Tipos de variação
Variações comuns (aleatórias). São aquelas naturais ao processo. Determinam a existência de
uma distribuição característica ou padrão normal de comportamento. Ex.: desgaste de uma
ferramenta, variação de temperatura etc.
Variações especiais (causais). São aquelas estranhas ao processo normal. Determinam
alterações na distribuição característica. São, de certa forma, imprevisíveis. Quando detectadas
devem ser analisadas rapidamente. Ex.: material fora do especificado, quebra de ferramenta etc.
Quando usar: O gráfico de controle é usado para os seguintes propósitos:
a) Diagnóstico: Avaliar a estabilidade do processo.
b) Controle: Determinar quando um processo necessita ser ajustado.
c) Confirmação: Confirmar a melhoria de um processo.
Tipos de gráfico de controle
Gráfico de variáveis - Variável é qualquer característica da qualidade que pode ser mensurada
(medida). Por exemplo: comprimento, diâmetro, viscosidade, resistência elétrica, etc. Os gráficos
de controle de variáveis são aplicados para características que podem ser medidas.
Gráfico de atributos - Atributos são dados qualitativos que podem apenas ser contados, para
registro ou análise a partir da comparação com um padrão. Os gráficos de controle de atributos
da qualidade baseiam-se na verificação da presença ou ausência de um atributo, como por
exemplo: cor, presença/ausência de um rótulo, número de peças defeituosas, quantidade de
defeitos, aceitação ou não do diâmetro de um eixo quando se usa um calibrador do tipo passa
não passa.
Como fazer:
1. Coletar os dados e preencher o gráfico de controle, conforme procedimentos previamente
estabelecidos.
2. Examinar o gráfico para identificar pontos fora dos limites de controle e padrões que
identifiquem a presença de causas especiais.
3. Decidir sobre as ações a tomar.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
58
Fonte: http://www.lugli.org/2008/02/grafico-de-controle/ acesso em 20/09/09 às 23h30min.
Novamente, ao olharmos o gráfico já percebemos que se trata de uma ferramenta estatística de
grande poder para a indústria.
Os modelos de gráficos e tabelas são bem diferenciados e você deverá escolher sempre de
acordo com o seu objetivo, tipo de necessidade e clientela que irá visualizar o gráfico.
Lembre-se da regra máxima: Uma tabela ou um gráfico devem sempre facilitar o
trabalho do pesquisador. A escolha dos modelos deve levar em consideração o público-alvo e o
objetivo da visualização. Muitas vezes, uma tabela bem feita já resolve a situação. Outras vezes,
somente um gráfico pode esclarecer uma situação estudada. A escolha é sua!
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
59
EXERCÍCIO DE FIXAÇÃO
Observe os seis gráficos elaborados por alunos de um curso de estatística para representar os resultados de uma pesquisa realizada com moradores de um determinado bairro. A - Gênero
B – Faixa etária
C – Escolaridade
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
60
D - Frequência
E– Reinvindidcações dos moradores
F – Posição no mercado de trabalho
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
61
1- Escolha a alternativa mais adequada:
a) Todos os gráficos foram muito bem elaborados.
b) Os gráficos D e F apresentam problemas quanto à falta de informação.
c) A maioria dos entrevistados possui nível superior.
d) A maioria dos entrevistados possui entre 30 e 40 anos.
2- Ainda sobre os gráficos anteriores, podemos afirmar que:
a) Uma parte está empregada e outra parte está desempregada;
b) Como a maioria é mulher, o pagode ficou em último plano para reinvindicações;
c) A maioria da população é do sexo feminino, necessita de água encanada e creche,
não estudou nem o nível ginasial e tem menos de 50 anos;
d) Se a maioria fosse masculina, campo de futebol seria a maior reinvindicação.
3-. Leia atentamente o enunciado e complete a coluna dos resultados com a letra
correspondente à resposta correta ao que se pede.
(a) gráfico que ajuda a visualização dos problemas e projetos prioritários, categorizando-os em poucos vitais
e muitos triviais. É um gráfico de barras ordenadas, de acordo com a freqüência, para dados qualitativos.
( ) gráfico de
setores
(b) Um processo é considerado estatisticamente estável se apresenta apenas uma variável natural, sem
quaisquer padrões, ou ciclos, ou pontos estranhos. Podemos visualizar o estado do processo através do
................
( ) histogramas
(c) Em um experimento, aplicamos um determinado tratamento e passamos então a observar seus efeitos
sobre os elementos a serem pesquisados. Podemos construir um .............................para visualizar esta
situação.
( ) gráfico de
Pareto
(d) Em um estudo observacional, verificamos e medimos características específicas, mas não tentamos
manipular ou modificar os elementos a serem estudados. Poderíamos elaborar um.....................para
visualizar as porcentagens de características específicas envolvidas no estudo em relação à população
estudada.
( ) gráfico de
controle
( ) gráfico de
causa e efeito
( ) gráfico de
barras.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
62
Módulo 03: Distribuições Estatísticas
Aula 01: Distribuição Normal de Probabilidade
Recordando
Nas Unidades 1 e 2 você aprendeu o que é Estatística e a sua importância. Conheceu as
medidas de tendência central e variabilidade. Aprendeu que as estatísticas estudam as
oscilações dos fenômenos, inclusive, oscilações da qualidade dos produtos. Aprendeu como
tabular os dados pesquisados. Construiu tabelas de freqüência para valores inteiros e decimais.
Conheceu os gráficos mais utilizados pelas indústrias. Aprendeu o que é probabilidade e algumas
aplicações.
OBJETIVO DA AULA 01
Nesta aula você aprenderá que existem fenômenos normais, comuns e ideais. Conhecerá e
aplicará a Distribuição Normal de Probabilidade que é muito utilizada pelas Ferramentas de
Qualidade.
DESENVOLVIMENTO
Começamos esta aula perguntando: Você sabe o que é um fenômeno normal, ideal ou comum? São iguais? Reflita um pouco…
Um fenômeno é considerado Normal, em Estatística, se apresentar um comportamento controlável. A produção de qualquer produto é um fenômeno normal, afinal se a produção não puder ser controlada, não vale a pena produzi-la. A espessura de placas de ferro, o peso de um de terminado tipo de papel e o diâmetro da cabeça de parafusos são exemplos de fenômenos considerados normais. Por outro lado, a altura das pessoas, o peso e a cor dos olhos também são fenômenos considerados normais, pois essas variáveis são, geneticamente, controladas. Toda vez que existir uma tendência em agrupar a maioria dos casos estudados ao redor da média desses casos, afirmamos que o caso estudado caracteriza um fenômeno normal.
Então uma queda de chuva, por exemplo, não pode ser considerada como um fenômeno normal. As precipitações de água, não podem ser controladas. Pelo menos, ainda não! Os terremotos, pelo mesmo motivo, também não são fenômenos normais.
A distribuição normal tem como características fundamentais a média aritmética ( x ou ) e o
desvio padrão ( ). Você usará muito esse tipo de Distribuição de Probabilidades em Ferramentas da qualidade, pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos obedecem esta distribuição. Já vimos o que é considerado Normal, mas o que é considerado Comum?
Já começou… Eu sei que sou normal. Posso não ser o
ideal, mas sou normal. Comum eu não sou‼‼ Eu sou
mais eu e pronto‼‼
Estão vendo? Eu sou normal…
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
63
Pois bem, Comum em Estatística é tudo aquilo que permanece concentrado ao redor de sua média aritmética. O que for a maioria, é comum. Será que você é comum? Exemplos de fenômenos comuns são aqueles que são Normais e, ainda, permanecem concentrados ao redor da média aritmética. Matematicamente falando, todos os dados amostrais que ficarem dentro do intervalo entre a média aritmética mais um desvio padrão e a média aritmética menos um desvio padrão, são chamados Comuns. Então o que é Ideal? Bem, o fenômeno Ideal é aquele que almejamos, mas que não existe. O ideal mora em nosso cérebro. É o 100% de aproveitamento sem nenhum erro cometido. Na vida real, o ideal não existe. É o que perseguimos. Vamos deixar de conversinha e passemos às definições teóricas. Uma Distribuição Normal é uma Distribuição de Probabilidade, isto é, uma função densidade de probabilidade ou resultados de equações matemáticas (um modelo matemático). Percebam que não podemos afirmar que todos os fenômenos são Normais. São considerados Normais aqueles que se enquadram no modelo matemático. Os matemáticos Abraham de Moivre (francês, 1667-1754), Pierre Simon Laplace (francês, 1749-
1827) e Carl Friedrich Gauss (alemão, 1777-1855) são conhecidos como os mentores dos
estudos dessa função densidade de probabilidade: Distribuição Normal de Probabilidade.
N ( x , ) – Para amostras de tamanho n > = 30
A fórmula é:
Onde os parâmetros são:
= variável estudada
= média aritmética da população (caso o tamanho da amostra seja maior ou igual 30, podemos
considerar a média populacional igual à média aritmética da amostra, isto é, =
)
desvio padrão da população (no caso de amostras fazemos uma correção e consideramos o
desvio padrão como ( -1))
Olhando assim, parece ser muito difícil, mas na verdade, o que interessa a você é que, quando
esboçamos o gráfico dessa distribuição, temos como resultado uma curva simétrica em relação à
média aritmética. Muita gente diz que a curva parece um sino. Na verdade, use a imaginação e
pense em um sino de cabeça para baixo, pronto: é o formato da curva Normal de Probabilidade
ou curva de Moivre-Laplace-Gauss.
Até parece! Pensando bem, eu sei que sou Ideal. Sou,
simplesmente, o máximo‼‼ Até agüento este curso…
F(x) =
2
1e 2
2
2
)(
x
para
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
64
Veja o gráfico abaixo:
Fonte:http://pt.wikipedia.org/wiki/Distribui
%C3%A7%C3%A3o_normal#Fun.C3.A7.
C3.A3o_de_densidade_de_probabilidade
acesso em 27/09/09 ás 23:26h
Repare no formato das quatro curvas. Elas são simétricas em relação à média aritmética, ou seja,
se passarmos uma linha exatamente pelo centro da curva teremos duas metades, sendo que
cada uma delas é a imagem refletida da outra.
Observe que as extremidades da curva se estendem de forma indefinida ao longo de sua base (o
eixo das abscissas). Como em qualquer outra função de densidade de probabilidade, a área sob
a curva normal é 1, sendo a freqüência total sob a curva igual a 100%. Assim, se pegarmos
quaisquer dois valores podemos determinar a proporção de área sob a curva entre esses dois
valores. A área é o valor da freqüência da característica que ela determina. É muito importante
entender como a curva é afetada pelos valores numéricos da média e do desvio-padrão.
Dependendo do tamanho do desvio padrão, a curva é mais achatada ou mais alongada. O desvio
padrão é uma medida que indica a variação em torno da média, portanto, quanto maior o desvio
padrão, mais achatada será a curva (veja a curva azul, o desvio é maior do que 2). Quanto menor
o desvio padrão, mais alongada será a curva (veja a curva vermelha, o desvio é menor do que
0,2). Além desse formato, conhecemos resultados comprovados matematicamente: os dados
pesquisados cabem dentro do intervalo ( =
) 3 . Podemos representar como segue:
- 3
- 2
- 1
+ 1
+ 2
+ 3
Quer dizer que todos os dados coletados cabem dentro da curva que apresenta a extensão entre
a média mais ou menos três desvios padrão.
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
65
Os dados que ficam entre a média mais um desvio e a média menos um desvio totalizam 68,26%
dos dados e são chamados de Comuns.
No intervalo entre a média mais dois desvios e a média menos dois desvios, temos 95% dos
dados pesquisados.
A tabela abaixo mostra os valores correspondentes aos intervalos:
Local da curva Área sob a curva Probabilidade de
densidade
( =
) 1
68,26% 0,6826
( =
) 2
95% 0,95
( =
) 3
100% 1
Relembrando: a probabilidade é um valor que varia entre 0 e 1. A probabilidade de encontrarmos
os dados distribuídos sob toda a curva vale 1 que corresponde a 100% da área sob a curva.
Façamos um exemplo: Um teste de inteligência aplicado a um grupo de 50 funcionários de uma
fábrica teve distribuição aproximadamente normal, obtendo média 87 e desvio-padrão 9. Quantos
devem ter sido os funcionários que obtiveram resultados superiores a 69?
Primeiro façamos uma representação do eixo horizontal de distribuição:
60 69 78
= 87 96 105 114
Queremos a quantidade de funcionários que obtiveram resultados superiores a 69 pontos no teste
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
66
de inteligência.
60 69 78
= 87 96 105 114
A área sob a curva Normal que corresponde a resultados superiores a 69 vale 97,5%, isto é,
97,5% dos funcionários da empresa obtiveram resultados superiores a 69 pontos.
Queremos a quantidade de funcionários: 0.975 x 50 = 48.75, ou seja, aproximadamente 49
funcionários obtiveram mais de 69 pontos no teste.
Mas, e se quiséssemos saber a quantidade de funcionários que obtiveram resultados superiores
a 78 pontos e inferiores á média?
60 69 78
= 87 96 105 114
Sabemos que entre a média mais ou menos dois desvios temos 68.26% dos dados pesquisados,
portanto, 34.13% para cada lado da curva. Então basta calcularmos 34.13% de 50 funcionários,
isto é, aproximadamente 17 funcionários obtiveram resultados superiores a 78 pontos e inferiores
a 87 pontos.
Agora vamos mudar um pouquinho: Quantos funcionários obtiveram resultados inferiores a 90
pontos?
Estamos com um probleminha: não sabemos os resultados referentes aos valores que estão fora
das quantidades que já vimos tabeladas.
Para resolvermos este problema vamos utilizar uma padronização. Matematicamente falando,
vamos transladar os valores do eixo horizontal. O que é isso? Vamos fazer de conta que a média
aritmética valerá zero e o desvio padrão valerá 1.
Observe, nos eixos, a correspondência entre os valores:
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Estava pensando até agora por que 97,5%. Acho que
entendi: A média mais ou menos 2 desvios compreende
95% dos dados, então sobram 5% para os pedaços das
beiradas. Cada pedaço da beirada corresponde a 2,5%
dos dados. Eu sou um gênio‼‼
Desde quando 60 é igual a -3?
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
67
Claro que não é só fazer de conta que 87 é igual a zero. Na verdade fizemos uma translação e
devemos calcular os novos valores. Repare que o eixo horizontal agora passa a representar uma
variável chamada ao invés de X.
Vamos calcular, direitinho, os valores para :
=
Voltando ao que foi pedido: Quantos funcionários obtiveram resultados inferiores a 90 pontos?
Calcularemos o valor de Z quando o X é 90:
Z = 9
8790 = 0.33…
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Z=0.33
Agora está mais fácil, sabemos que precisamos encontrar o valor da distribuição de probabilidade
correspondente aos valores amostrais inferiores a 0.33
-3 -2 -1
= 0 1 2 3
Z=0.33
Ainda não sabemos quanto valerá a probabilidade e não queremos resolver aquela fórmula
complicada (lá do início da aula) então o que faremos?
Os matemáticos são seres que procuram facilitar a vida das pessoas e, portanto, pensaram em
tudo isso.
Distribuição Normal Padrão - N(0,1) para n > = 30
Fizemos a translação do eixo horizontal e mudamos a variável para Z, somente para podermos
utilizar uma tabela chamada Padrão. Nessa tabela, os resultados da função densidade foram
calculados para a média aritmética valendo zero e o desvio padrão valendo 1.
A tabela abaixo apresenta os resultados da função densidade para os valores positivos de z, por
simetria podemos calcular os valores negativos.
Quem acredita nisso??????
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
68
Para encontrarmos Z=0.33 devemos encontrar na primeira coluna 0.3 e procurarmos a coluna
que corresponde à segunda casa decimal 3
Tabela da Distribuição Normal Padrão P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Verifique na tabela: para Z=0.33 temos como resultado 0.6293. Isto quer dizer que 62.93% dos
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
69
funcionários obtiveram resultados inferiores a 90 pontos, portanto, aproximadamente, 31
funcionários.
Em que o cálculo da variável Z facilita a nossa vida? Utilizando a variável padrão, isto é, a média
aritmética sempre valendo zero e o desvio padrão sempre valendo 1, podemos verificar o
resultados da probabilidade diretamente na tabela.
Agora pode parecer que não ajudou em nada, mas você verá que ajuda e muito.
Calculemos a quantidade de funcionários que obtiveram resultados superiores a 92.
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Z=0,55
Calculando Z:
Z= 9
8792 = 0,555…..
Procure na tabela Z= 0,55.
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
O resultado encontrado é 0.7088. Observe na figura abaixo:
-3 -2 -1
= 0 1 2 3
Z=0,55
Então 70.88% dos funcionários obtiveram resultados inferiores a 92 pontos, mas lembre-se de
que queremos quantos funcionários obtiveram resultados superiores a 92 pontos.
Na verdade, a quantidade que queremos é o que falta para completar 100% ou probabilidade
igual a 1.
Logo: 1 - 0.7088 = 0.2912 e, portanto, aproximadamente, 15 funcionários obtiveram resultados
superiores a 92 pontos no teste de inteligência.
Só mais uma perguntinha para verificar se você está por dentro.
Quantos funcionários obtiveram resultados inferiores a 75 pontos?
Então nessa tabela o que encontramos são os valores
anteriores ao Z. Eu sou um gênio! Entendo tudo‼‼
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
70
Vejamos:
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Z=?
Calculando Z:
Z= 9
8775 = - 1.3333…..
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Z= - 1.33
E agora? Nossa tabela não apresenta valores negativos para o Z. Como a curva é simétrica,
vamos procurar Z= 1,33 e depois faremos a conversão.
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
……..
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
Z=1,33 corresponde a 0,9082. Observe o desenho abaixo:
60 69 78
= 87 96 105 114
-3 -2 -1
= 0 1 2 3
Z=1.33
Repare que, por simetria, podemos calcular o que estamos querendo. O pedaço que queremos
corresponde à parte que completa os 100% e já conhecemos 90.82%. Logo: 1 – 0.90.82 = 0.0918
e, portanto, temos aproximadamente 5 funcionários que obtiveram menos de 75 pontos no teste
de inteligência.
Agora é com você: estude e treine bastante!
UNIABC – Curso de Bacharel em Ciências Contábeis – Disciplina: Estatística – Turma: 3NA profa. Mestra Maria Cecília Arena Lopes Barto - [email protected]
71
EXERCÍCIO DE FIXAÇÃO
1. Um texto de instrução programada é aplicado a uma amostra de 500 alunos da UFRJ. Tem por
objetivo estimar os parâmetros relativos à população de alunos do mesmo colégio, no que se
refere ao tempo gasto para concluírem o estudo do fato. Após os trabalhos estatísticos foram
obtidas as seguintes estimativas: média= 374 minutos e desvio-padrão= 86 minutos
Sabendo-se que a população se distribui normalmente, responda aos itens abaixo:
a) Se o texto fosse aplicado a 4720 alunos, quantos alunos concluiriam o texto em tempo superior
a 400 minutos?
A) Aproximadamente, 2916 alunos
B) Aproximadamente, 1803 alunos
C) Aproximadamente, 2900 alunos
D) Aproximadamente, 1800 alunos
b) Da mesma forma do item anterior, qual a probabilidade de um aluno terminar o texto em tempo
superior a 220 minutos e inferior à média?
A) Aproximadamente, 2180 alunos
B) Aproximadamente, 2533 alunos
C) Aproximadamente, 2187 alunos
D) Aproximadamente, 2285 alunos
2. Aplicado um teste de memória auditiva a 200 alunos de um educandário, descobriu-se que os
resultados do mesmo se ajustaram a uma distribuição normal. Determine o número de alunos que
obtiveram até 55 pontos no teste, uma vez que sabemos que a média foi de 48 pontos e que o
desvio-padrão de 9 pontos.
A) Aproximadamente, 150 alunos
B) Aproximadamente, 44 alunos
C) Aproximadamente, 50 alunos
D) Aproximadamente, 156 alunos
3- Suponha que o peso de açúcar, em pacotes, seja anunciado como 2kg. Tem-se que o peso (X)
segue uma distribuição normal com média e desvio padrão em gramas dado por N(2003; 2). Qual
a probabilidade que um pacote tenha peso abaixo do anunciado?
a) 0,0668 b) 0,668 c) 0,0768 d) 0,9332
4- A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8;1.5).
Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de
10 ppm?
A) 0,4373
B) 0,5517
C) 0,0918
D) 0,4517