Apostila estatistica

download Apostila estatistica

of 102

Transcript of Apostila estatistica

Universidade do Estado do Rio de Janeiro - UERJ Faculdade de Formao de Professores - FFP Departamento de Matemtica

Material de apoio ao aprendizado das disciplinas de Estatstica e Bioestatstica

Professora: Viviane Ctia Khler

So Gonalo-RJ

1

IntroduoA Estatstica encontra-se presente em todas as reas do conhecimento humano: cincias sociais, cincias humanas, cincias exatas, etc. Isso ocorre porque cresce cada vez mais a utilizao de suas ferramentas com a finalidade de encontrar respostas a perguntas do tipo: Qual o consumo mdio mensal de combustvel de uma determinada regio do Estado? Qual o ndice de preos ao consumidor do ms de dezembro? Qual a proporo de peas defeituosas da linha de produo de uma empresa X? Ser que o ndice de reprovao foi reduzido com a introduo de novas tcnicas de ensino? Que porcentagem de determinado elemento qumico est presente numa amostra de dejetos da empresa X? Qual dever ser o possvel valor mdio de retorno financeiro de um determinado evento? Qual a preferncia do eleitorado em relao aos candidatos Presidncia da Repblica?

O que Estatstica?De acordo com o dicionrio Aurlio, Estatstica pode ser definida como: parte da matemtica em que se investigam os processos de obteno, organizao e anlise de dados sobre uma populao ou sobre uma coleo de seres quaisquer, e os mtodos de tirar concluses ou predies com base nesses dados. O termo estatsticas, no plural, tem o significado de dados numricos representativos de uma varivel analisada, enquanto estatstica, no singular, o mtodo utilizado na manipulao de dados, isto , o mtodo de coleta, de elaborao, de anlise e de interpretao dos dados numricos. Apesar de sua simplicidade, essas definies nos permitem enxergar os vastos campos de ao da Estatstica. Podemos dizer que no h praticamente nenhum ramo do conhecimento humano em que ela no tenha utilizao. Estatstica uma ferramenta que nos ensina procedimentos lgicos de observao e de anlise, necessrios para aproveitar ao mximo os conhecimentos de outras cincias. Com base nos conceitos de Estatstica apresentados anteriormente, daremos, a seguir, a definio que ser adotada como base para o seu aprendizado. A Estatstica consiste em um conjunto de mtodos e processos quantitativos que nos auxiliam a coletar, analisar e interpretar dados de acontecimentos coletivos e tirar concluses em situaes em que a variao e a incerteza esto presentes.

2

DadosUm trabalho estatstico envolve um levantamento e uma anlise de dados. O que so dados? Dados so informaes obtidas atravs de observaes, contagens ou respostas fornecidas por pessoas. Exemplos: 25% dos eleitores da cidade do Rio de Janeiro votaro no candidato do partido XY. Isso significa que, atravs de uma pergunta feita a eleitores da cidade do Rio de Janeiro, obteve-se a resposta de que 25% do total votaria no candidato do partido XY. Apenas 11% dos consumidores preferem consumir um produto de marca ou empresa que possui propaganda mais chamativa e envolvente. (Fonte: Instituto EM Data, julho de 2004) Pode-se dizer que, a partir de um levantamento da opinio dos consumidores que foram entrevistados pelo Instituto EM Data, apenas 11% preferem adquirir um produto de marca ou empresa que possui propaganda mais chamativa. Depois que os dados so coletados, devem passar por algum tratamento. Esse tratamento permite orden-los, por exemplo, em ordem crescente, tornando-os mais fceis de serem trabalhados. Os dados que no sofrem qualquer tratamento so denominados dados brutos. Dados brutos so informaes obtidas atravs de observaes, contagens ou respostas fornecidas por pessoas, mas que no sofreram nenhum tratamento estatstico. Exemplos: Ser realizada uma pesquisa eleitoral com 2.400 eleitores da cidade de So Gonalo. Os dados brutos so as respostas da preferncia dos eleitores sem nenhum tratamento estatstico, ou seja, os dados de respostas no esto em ordem crescente nem organizados de acordo com as respostas dadas pelos entrevistados. Isto , o que se tem so apenas as respostas dos eleitores entrevistados, mas no h nenhuma informao tratada sobre eles. No se sabe quantos votaro no candidato X ou no candidatoY. Foi realizado um levantamento das idades de 1.000 estudantes do ensino mdio em Niteri. No foi determinado o nmero de alunos em cada idade. Tem-se apenas um nmero de alunos e valores referentes s idades, porm sem nenhum tratamento estatstico mais detalhado, ou seja, somente o resultado de uma contagem.

Etapas da EstatsticaO estudo da Estatstica pode ser conduzido dividindo-se todo o contedo em 4 etapas: determinao do objetivo, coleta de dados, anlise dos dados e concluses e inferncias.

Determinao do objetivoA determinao do objetivo a etapa inicial de um trabalho estatstico. Pode-se dizer que 3

uma das etapas mais importantes da Estatstica, pois nela est concentrado todo o formato que a pesquisa dever tomar. Se o objetivo da pesquisa estatstica no estiver bem definido, de forma bem clara e detalhada, os dados coletados podero no indicar as verdadeiras caractersticas daquilo que ser analisado. Nesse caso, a coleta de dados estar comprometida, assim como o processo de anlise de dados e, conseqentemente, as concluses que sero utilizadas para se fazer inferncias. A coleta de dados, etapa seguinte no processo estatstico, pode demandar muito tempo e, conseqentemente, alto custo, caso o objetivo no tenha sido pr-definido. Essa coleta pode no ser til ou ser insuficiente, por exemplo quando a determinao dos objetivos leva definio de outros dados que devem ser coletados. O ideal que se faa um levantamento de todos os fatores que podero influenciar o trabalho de pesquisa para que este possa ser executado rapidamente e com o menor custo possvel. Os principais objetivos so, em geral, voltados para o desenvolvimento de novos produtos, investigao de problemas que porventura estejam atrapalhando o processo de produo de uma empresa, inspeo para a garantia da qualidade de um produto, avaliao do relacionamento existente entre alguns itens e melhoria dos resultados de um processo. Exemplos: Objetivos de uma pesquisa eleitoral - determinar a regio em que o candidato tem maior aceitao, a faixa de renda dos eleitores, bem como idade, nvel de escolaridade, etc. Aps a determinao dos objetivos, poderemos fazer o levantamento de dados referentes a nvel de escolaridade, taxa de renda, idade, etc. Objetivos de uma pesquisa de aceitao de um produto no mercado - determinar a faixa de renda do consumidor, regio onde mora, ponto de venda do produto, o que o consumidor mais gosta e o que menos gosta no produto etc. Aps a definio dos objetivos, ficam mais fceis a elaborao do questionrio e a definio de quem sero os entrevistados. Ganha-se tempo para a coleta de informaes. Depois de definirmos os objetivos, passamos etapa seguinte, que a de coleta de dados.

Coleta de dadosAps a determinao do objetivo da pesquisa estatstica, devem-se coletar os dados ou informaes que sero necessrias para a anlise. Para que os dados possam realmente representar o objetivo especificado, deve-se escolher o mtodo de apresentao mais adequado, de forma que as concluses obtidas possam apresentar um alto grau de confiabilidade. O levantamento de dados pode ser realizado com todo o material coletado ou apenas com uma parte representativa dele. O conjunto de todos os dados chamado de populao e a parte que o representa chamada de amostra. Populao o conjunto de todos os dados sobre os quais desejamos obter informaes. o conjunto de todos os itens produzidos, todas as pessoas de uma localidade, todas as peas analisadas, enfim, de tudo o que objeto de uma pesquisa estatstica. Pode tambm ser definida como o conjunto de elementos com determinadas caractersticas em comum. Observe que populao no necessariamente formada por moradores de uma cidade e que a populao em um problema depende da informao que queremos obter.

4

Se o objetivo de uma pesquisa conhecer o nvel social de cada um dos moradores de uma cidade do interior de Minas Gerais, ento a coleta de dados ser o levantamento dos rendimentos de todos os moradores da cidade. Essa coleta pode ser realizada atravs de questionrios entregues populao, por telefone (o que tornaria o custo da pesquisa muito alto) ou atravs de pesquisadores que entrevistariam todos os moradores de casa em casa. A populao de dados dessa pesquisa seria a renda de todos os moradores, isto , o conjunto de todos os dados da pesquisa. Se o objetivo de uma pesquisa determinar quantas peas produzidas por uma pequena empresa, em um dia, apresentaram defeito, a populao ser toda a produo de peas daquele dia. Por exemplo, se a empresa produz 5.000 peas, por dia, ento a populao de 5.000 peas. Se o objetivo de uma pesquisa determinar quantos automveis a cidade X possui circulando em suas vias, a populao constituda de todos os automveis da cidade X que esto em circulao. Censo a contagem de todos os elementos de uma populao. O censo no se refere somente ao Censo realizado pelo IBGE, mas tambm a qualquer levantamento de todas as informaes de uma populao de dados. Por isso, o censo proporciona informaes mais detalhadas sobre a populao, mas, na maioria das vezes, caro e difcil de ser realizado. A populao pode ser considerada finita e infinita. Vamos ver a diferena. Populao finita: quando todos os itens de uma populao so conhecidos e fixos, isto , permanecem inalterados.

O Censo da populao brasileira realizado periodicamente pelo IBGE Instituto Brasileiro de Geografia e Estatstica. Os censos produzem informaes imprescindveis para a definio de polticas pblicas estaduais e municipais e para a tomada de decises de investimento, sejam eles provenientes da iniciativa privada ou de qualquer rgo do governo. Exemplos: O nmero de peas de plstico de um automvel da marca X. Uma sala de aula com 50 alunos. Um hotel da rede XYZ, que apresenta 100 unidades habitacionais. Exemplos: As bolas de uma urna utilizada para sorteios. Se elas so retiradas e repostas repetitivamente aps cada sorteio, ento as bolas podem ser retiradas infinitas vezes. Todas as peas possveis de serem manufaturadas. Nesse caso, tem-se uma populao de peas que sero manufaturadas, mas impossvel obter 5

a lista de todas elas, pois a produo no tem fim. Todas as visitas possveis de clientes a uma loja. impossvel contabilizar a populao de clientes, pois no se sabe quantos iro visitar tal loja. EXERCCIO: Elaborar um exemplo de pesquisa em que se descreve seu objetivo e se indique quais seriam os dados coletados.

AmostraNa maior parte das situaes, a populao, mesmo finita, grande demais para que seja prtico levantar todos os dados. Por isso, utilizamos uma parte que represente a populao. Essa parte chamada de amostra. Amostra: uma parte representativa da populao. Pode tambm ser definida como um subconjunto de uma populao por meio do qual se estabelecem ou se estimam as propriedades e caractersticas dessa populao. A amostra utilizada quando necessitamos de uma resposta mais rpida sobre a populao ou quando a realizao do levantamento de dados de uma populao muito dispendiosa. Por exemplo, prefervel pesquisar as respostas de uma parte representativa dos eleitores de uma cidade a ter que fazer o levantamento das respostas de todos os seus eleitores. Com isso, ganha-se tempo nos resultados obtidos e consegue-se um custo de pesquisa muito inferior ao que seria gasto com toda a populao. Exemplos: Uma fbrica possui 1.000.000 de peas em estoque. Se estamos interessados em analisar a espessura das peas, podemos, por exemplo, tomar uma amostra de apenas 500 peas. A opo pela escolha da anlise de uma amostra melhor neste caso, pois ganha-se em tempo e em custo da pesquisa. Uma amostra da opinio de 2.000 moradores de uma cidade sobre a economia do pas. Observe a expresso parte representativa da populao na definio de amostra. O que quer dizer? Quer dizer que, se tomarmos uma parte muito pequena da populao, o levantamento de dados pode ser muito diferente da populao como um todo. Por exemplo, fazer uma pesquisa eleitoral com apenas 10 eleitores em uma cidade com 1.000.000 de eleitores no representativo. Mas qual nmero ou percentual da populao total representativo? Essa uma questo um pouco mais complexa. Uma anlise detalhada no consta dos objetivos desta disciplina. Os mtodos e tcnicas utilizados para se realizar uma amostragem sero analisados com maiores detalhes em Tcnicas de Amostragem. A opo por trabalhar com toda a populao ocorre em virtude de se desejar obter informaes sobre todo o universo objeto de pesquisa, que o caso do censo demogrfico, ou 6

quando a populao pequena (a populao pode ser considerada pequena quando os custos e o tempo de anlise das informaes no so empecilho para tal realizao). EXERCCIO 1) Definir amostra. 2) Dar exemplos de amostra. 3) Em que situaes prefervel trabalhar com uma amostra ao invs de com a populao? 4) Determinar uma amostra para cada uma das populaes mencionadas a seguir: a) 25.000 o total de peas produzidas pela empresa X; b) duas toneladas da substncia XYZ esto infectando o solo de um lixo; c) todos os consumidores de cereais do pas; d) os salrios de todos os 1.000 funcionrios de uma empresa. 5) Dadas as sentenas abaixo, indicar falso (F) ou verdadeiro (V). ( ) A amostra um subconjunto da populao. ( ) A populao uma parte representativa da amostra. ( ) A amostra a melhor opo quando a anlise de todos os dados da populao toma muito tempo e considerada de alto custo. ( ) A anlise de todas as peas produzidas por uma pessoa, durante um dia, pode ser considerada uma amostra.

Anlise dos DadosAps determinar o mtodo de levantamento de dados mais adequado, necessrio fazer uma anlise dos dados, colhendo informaes relativas ao objetivo especificado. Para uma melhor anlise dos dados, usual organiz-los sob a forma de tabelas e grficos e, ento, sintetiz-los atravs de medidas. Essa organizao e resumo das informaes em medidas chamada Estatstica Descritiva. Estatstica Descritiva: a parte da Estatstica que utiliza mtodos grficos e numricos para organizar, resumir e simplificar as informaes para que possam ser interpretadas e utilizadas com maior facilidade. Estudaremos, nas prximas aulas, algumas ferramentas utilizadas pela Estatstica Descritiva, tais como: Representaes grficas e tabulares da Distribuio de Freqncia; Medidas de Posio; Medidas de Disperso; Medidas de Assimetria. Exemplos: A mdia de idade dos alunos que esto matriculados na disciplina de Estatstica de 34 anos. A mdia uma das medidas de posio mais utilizadas para representao dos dados. 7

30% dos estados brasileiros esto sem verbas para educao e sade. A representao percentual uma forma bastante utilizada para descrever os dados estatsticos. O desvio padro das aplicaes financeiras analisadas muito alto. O desvio padro uma medida de disperso muito utilizada para descrever a variao dos dados estatsticos. O coeficiente de assimetria para a distribuio de freqncia dos pesos de uma pea muito pequeno. O coeficiente de assimetria uma medida que nos informa sobre o formato, simtrico ou no, das curvas representativas de uma distribuio de freqncias.

Concluses e InfernciasEssa a parte final do processamento estatstico, em que os resultados obtidos nas anlises so dispostos e avaliados com relao ao objetivo proposto no incio da pesquisa. Essa parte da Estatstica chamada Estatstica Indutiva ou Inferencial. Estatstica Indutiva ou Inferencial: a parte da Estatstica que interpreta os dados amostrais e faz generalizaes sobre um experimento em estudo. Ela vai determinar, tambm, a preciso e a confiabilidade dos resultados obtidos. Os resultados de uma estatstica inferencial so indues ou estimativas sobre as variveis obtidas da amostra. Elas podem ser conclusivas e podem levar o pesquisador a uma tomada de deciso sobre toda a populao. Por exemplo, com base em uma amostra de 2.000 eleitores, o instituto de pesquisa pode generalizar o resultado obtido para todos os eleitores, isto , se um candidato obteve 32% de escolha entre os 2.000 eleitores, pode-se dizer que 32% de todos os eleitores da cidade pesquisada votariam nesse candidato. Mas, como o resultado baseado em uma amostra, a estimativa do resultado vem acompanhada de uma margem de erro. A margem de erro ocorre porque a pesquisa no foi realizada com todos os eleitores. O clculo exato da margem de erro um assunto matematicamente complexo e foge dos objetivos deste curso. A ferramenta bsica no estudo da Estatstica Inferencial a probabilidade, pois lida com a incerteza.

Variveis QuantitativasOs principais tipos de variveis e as sries estatsticas utilizadas na representao de dados estatsticos. As variveis so classificadas em quantitativas e qualitativas, e as sries estatsticas so representaes grficas de acordo com o tipo de varivel utilizada. Variveis Quantitativas: como a prpria palavra diz, so variveis que indicam uma quantidade. So o resultado de uma contagem de itens, dados ou informaes sobre o objeto em questo.

8

As variveis quantitativas se dividem em dois subgrupos: discretas e contnuas. Variveis Quantitativas Discretas: quando seus valores so, em geral, uma contagem do nmero de itens de uma determinada caracterstica, isto , assumem valores inteiros. Exemplos: 25 funcionrios trabalham no setor de compras de uma empresa. A inspeo da produo acusou que apenas 10 peas apresentaram algum defeito. 40 alunos fizeram matrcula em Geografia no semestre passado. 1.200 pessoas fizeram inscrio para o concurso pblico. Em todos os exemplos apresentados tem-se apenas o resultado de uma contagem, ou seja, valores inteiros. Variveis Quantitativas Contnuas: quando seus valores podem assumir qualquer valor real dentro de um intervalo contnuo. Isto , assumem todos os valores intermedirios entre dois valores reais ou entre dois limites. As variveis contnuas esto associadas a: altura, peso, comprimento, espessura, temperatura, presso sangunea, velocidade, tempo, etc. As variveis contnuas tambm podem ser consideradas como aquelas cujo valor somente poder pertencer a um intervalo. Exemplos: A temperatura prevista para a cidade de Belo Horizonte, durante um certo dia, variou de 25 C a 28 C. O paciente pesava entre 120 e 140 quilos. As peas inspecionadas na reviso tm espessuras que variam de 2 a 5 milmetros. A velocidade do automvel utilizado na viagem de Belo Horizonte ao Rio de Janeiro variou de 10 a 110 quilmetros por hora. As pessoas presentes em um seminrio tm alturas que variam de 1,60 metros a 1,92 metros A idade das pessoas presentes em um evento variou entre 40 e 45 anos. A diferena entre variveis quantitativas discretas e as contnuas que numa varivel discreta, todo valor exato, enquanto a varivel contnua assume um valor dentro de um intervalo contnuo, isto , todo valor aproximado. Exemplos da diferena entre varivel contnua e discreta:

9

1) Discreta: 10 pessoas com 25 anos. Contnua: o peso das 10 pessoas. 2) Discreta: 100 peas na cor preta. Contnua: as espessuras de 100 peas variam de 1,5 a 3,0 milmetros. 3) Discreta: 25 moradores de uma localidade. Contnua: cor de pele dos moradores. 4) Discreta: 200 tubulaes de PVC. Contnua: os dimetros das tubulaes compradas pela empresa X variam de 1,5 a 10 polegadas.

Variveis QualitativasVimos que variveis quantitativas expressam quantidades. No entanto, muitas vezes precisamos expressar atributos ou qualidades. Variveis Qualitativas: variveis que indicam uma classificao, consistindo em atributos ou registros no-numricos. As variveis qualitativas se dividem em dois subgrupos: ordinais e nominais. Variveis Qualitativas Ordinais: variveis que esto classificadas por uma ordem. Exemplos: Os filmes listados a seguir esto classificados por ordem de preferncia do pblico. 1 Van Helsing 2 Tria 3 Dirio de uma motocicleta A varivel a ordem de preferncia. A equipe X terminou o campeonato em 4 lugar. O 1 colocado do concurso. A varivel a ordem de chegada. Os cinco primeiros colocados no campeonato de futebol estaro classificados para a prxima fase. A colocao a varivel. Os exemplos ilustram bem a ordem em que as variveis analisadas esto dispostas. Fica bem claro que a varivel ordinal tem a principal caracterstica de indicar uma ordem ou seqncia. Variveis Qualitativas Nominais: variveis que indicam uma classificao. Os dados podem ser classificados em categorias, grupos ou marcas.

10

Exemplos: Cores dos automveis de certo modelo. Marcas de refrigerante: Coca-Cola, Sprite, Fanta, Mate-Couro, etc. Partidos polticos: PMDB, PSDB, PT, PV, PSTU, etc. Classificao dos itens de um estoque: A, B, C, D, etc. Estes exemplos mostram que os dados podem ser classificados sem a necessidade de um nmero, ou seja, podem simplesmente ser mencionados de acordo com uma classe ou categoria a que pertencem. Atividades 1) Dados os exemplos a seguir, determinar a classificao de cada um deles de acordo com o tipo de varivel quantitativa (discreta ou contnua) ou qualitativa (nominal ou ordinal). a) Consumo dos refrigerantes da marca Coca-Cola e Pepsi; b) 1500 eleitores; c) Camisas tamanho P; d) Descrio das classificaes dos tenistas pelo ranking da ATP: 1 - Rogerio Federer 2 - Guilhermo Gaudio 3 - Andre Agassi e) Temperatura em So Gonalo para hoje: mnima de 28 C e mxima de 35 C; f) 2.000 pessoas inscritas para as provas do concurso. 2) Elaborar alguns exemplos de variveis quantitativas discretas e contnuas. 3) Elaborar alguns exemplos de variveis qualitativas nominais e ordinais.

Planejamento de um estudo EstatsticoPara o planejamento de um estudo estatstico, de extrema importncia considerar os seguintes itens: 1 - OBJETIVO de grande importncia a definio clara do objetivo para um levantamento estatstico, pois facilitar a anlise dos resultados obtidos. 2 - POPULAO o todo para efeito de anlise; o universo de dados que ser analisado. A populao dever ser especificada claramente pelo pesquisador. Quanto maior a quantidade de informaes conhecidas sobre a populao, mais fcil ser o processo de amostragem.

11

3 - A COLETA DOS DADOS Deve-se evitar a incluso de dados desnecessrios no processo de amostragem. Essa incluso poder atrapalhar a anlise dos dados, o tempo gasto ser maior e o resultado obtido no ter finalidade. Os dados ou informaes coletadas fazem parte do que chamado banco de dados, que composto por caractersticas numricas as variveis. Um banco de dados de um levantamento estatstico ter, em geral, vrias tabelas com mltiplas variveis. Banco de dados uma coleo organizada e inter-relacionada de dados persistentes. o registro de conceitos e informaes organizado.Programas de computador so utilizados para gerenciar um banco de dados.

4 - GRAU DE PRECISO Ao iniciar o processo de amostragem, deve-se especificar o grau de preciso desejado nos resultados. Deve-se considerar que elevar a preciso da pesquisa implica aumentar o tamanho da amostra, o que aumenta tambm o tempo e o custo. Quanto maior a amostra, maior a preciso do resultado, isto , menor a margem de erro. Por exemplo, uma pesquisa realizada com 10.000 eleitores para determinar a preferncia eleitoral em uma cidade apresenta resultado mais preciso do que outra realizada com apenas 1.000 eleitores. 5 - ANLISE DOS DADOS A anlise dos dados realizada atravs de medidas estatsticas que descrevem o comportamento dos dados. usual organiz-los, primeiramente, em grficos e tabelas. 6 - CONCLUSO A concluso a fase final do processo estatstico, em que os resultados so dispostos e avaliados com relao ao objetivo proposto. Os resultados so interpretados de acordo com o objetivo da pesquisa, e decises so tomadas acerca das populaes, utilizando-se a inferncia estatstica.

Tcnicas de amostragemO grande problema encontrado para a escolha dos elementos da amostra dentro da populao est em determinar qual tcnica de amostragem dever ser utilizada. Isto , qual tcnica ou mtodo ser utilizado para se escolher quais elementos dentro da populao sero selecionados para a amostra. Existem dois mtodos para a seleo da amostra: mtodos probabilsticos ou aleatrios e mtodos no-probabilsticos. Os mtodos probabilsticos so aqueles nos quais todos os itens da populao tm a mesma probabilidade de ser includos na amostra, independentemente da pessoa que realiza a pesquisa. 12

J os mtodos no-probabilsticos so aqueles em que todos os itens da populao tm uma oportunidade conhecida de ser includos na amostragem. Esses mtodos so muito utilizados quer pela sua simplicidade, quer pela impossibilidade de se usar os mtodos probabilsticos. So tambm conhecidos como amostragem subjetiva ou amostragem por julgamento. Se o tamanho da amostra bem pequeno, com menos de 10 itens, por exemplo, a amostragem probabilstica pode no dar resultados representativos da populao, ao passo que uma pessoa com conhecimento mais profundo da populao pode especificar os elementos que melhor representariam a populao. Exemplo: O proprietrio de uma rede de 10 postos de gasolina deseja implementar um novo servio de pagamento, com carto fidelidade para a sua rede de postos. Problemas de custo podem fazer com que essa implementao seja experimentada em apenas 3 postos, talvez por apresentarem maior nmero de consumidores, melhor localizao e maior faturamento. Em vez de utilizarmos uma tcnica estatstica para a escolha dos postos usados como teste para a implementao do servio de pagamento, melhor confiar no julgamento e conhecimento do proprietrio para fazer a escolha. Diante de situaes como essa, a nfase ser dada aos tipos de amostragens probabilsticas, pois tem-se o conhecimento da probabilidade de todas as combinaes possveis e possvel fazer uma estimativa do erro da amostra. Os mtodos probabilsticos podem ser com reposio ou sem reposio. Amostragem com reposio: cada elemento da populao pode ser escolhido mais de uma vez na amostra. Exemplos: - Amostragem dos eleitores de uma cidade. - Amostragem dos consumidores de um determinado produto. - Amostragem dos moradores de um bairro. Em todos esses exemplos de amostragem, as pessoas podero ser entrevistadas novamente, ou seja, todos tm a mesma probabilidade de ser escolhidos novamente. Amostragem sem reposio: cada elemento da populao pode ser escolhido apenas uma vez na amostra. Exemplos: - Testes de balstica. um teste muito utilizado pela polcia. um teste destrutivo. - Testes de resistncia de um equipamento eletrnico. - Verificao da resistncia de um copo de vidro. - Verificao da qualidade de um pra-brisa blindado. Os itens destrutveis podem ser escolhidos apenas uma vez, pois torna-se impossvel a sua reposio. importante destacar que, em estudos estatsticos, em que o processo de amostragem apresenta um custo elevado, aconselhvel evitar o exame repetido dos elementos.

13

Quatro tcnicas de amostragem probabilstica sero abordadas: a) amostragem aleatria simples; b) amostragem estratificada; c) amostragem por conglomerado; d) amostragem sistemtica. Essas tcnicas se diferenciam pela maneira como a amostra escolhida dentro da populao.

Amostragem Aleatria SimplesEsta a tcnica mais comumente utilizada para a seleo de amostras. Os processos de amostragem aleatria podem ser realizados pela utilizao de Tabelas de Nmeros Aleatrios ou por sorteio. Tabela de Nmeros Aleatrios uma tabela que contm todos os algarismos de 0 a 9 dispostos isoladamente ou em grupos; podem ser lidos de cima para baixo, na mesma coluna, ou da esquerda para a direita. A principal caracterstica da tabela que os algarismos esto dispostos aleatoriamente, isto , no tm uma ordem ou seqncia de apario. Para a obteno de amostras aleatrias utilizando as Tabelas de Nmeros Aleatrios (TNA)2 adota-se a seguinte seqncia: a) Enumeram-se os itens da populao de 1 a N. b) Seleciona-se aleatoriamente um ponto onde iniciar a linha e a coluna da tabela de nmeros aleatrios com o mesmo nmero de algarismos quantos forem os de N. c) Escolhe-se uma direo, por exemplo, na mesma coluna, de cima para baixo, ou na mesma linha, da esquerda para a direita, e anotam-se os nmeros obtidos, descontando os nmeros maiores do que N. Prossegue-se na direo escolhida at que se complete a amostra. d) Se a amostragem for com reposio, registram-se as repeties; se for sem reposio, abandonam-se as repeties. O exemplo a seguir ilustra a seleo de uma amostra utilizando uma tabela de nmeros aleatrios. Exemplo: H 500 pessoas participando de um seminrio sobre Administrao de Negcios. Uma amostra de 20 participantes dever ser selecionada para responder a algumas questes. Soluo: - De acordo com a seqncia acima, devem-se enumerar todos os participantes do seminrio de 1 a 500, o que pode ser feito atravs da distribuio de senhas para cada um. - Deve-se, agora, escolher aleatoriamente um ponto na Tabela de Nmeros Aleatrios onde iniciar a contagem dos 20 nmeros que faro parte da amostra. - O prximo passo anotar os nmeros de trs algarismos (porque o maior nmero de 14

participantes 500, isto , apresenta trs algarismos) que forem menores do que 500. A leitura dos nmeros deve ser realizada de cima para baixo, da esquerda para a direita. - A amostragem no ser com reposio, pois a mesma pessoa no poder responder ao mesmo questionrio mais de uma vez. Portanto, os nmeros que forem repetidos devero ser descartados, assim como os nmeros maiores do que 500. Suponha que o lugar escolhido aleatoriamente na tabela tenha sido a linha 3, coluna 1. O nmero obtido foi o 582. Como no existe uma pessoa com a senha 582, esse nmero , ento, descartado e passa-se ao prximo, na linha imediatamente abaixo. O nmero 642 tambm no existe, nem 573 .... O primeiro nmero escolhido o 347, o segundo o 196. O processo dever continuar at que todos os 20 participantes sejam selecionados. Acompanhe a escolha dos 20 nmeros na tabela de Nmeros Aleatrios abaixo: 893 940 582 642 573 962 347 196 914 429 244 048 034 904 780 871 046 588 347 966 680 316 818 073 768 964 983 029 788 839 321 094 543 858 358 491 558 050 115 267 887 890 025 359 278 033 822 143 926 504 947 628 022 787 569 451 672 307 766 059 061 743 200 097 433 982 074 444 725 274 223 520 839 758 733 369 998 132 347 413 807 434 103 581 011 181 360 713 965 206 521 929 041 317 615 664 177 906 366 678 482 504 059 197 053 903 526 980 106 836 615 179 238 315 038 239 895 776 149 596 596 873 067 355 531 587 083 193 306 345 573 648 243 386 405 372 586 039 753 568 209 174 785 796 414 469 567 276 831 024 856 295 876 466 018 305 484 496 300 516 524 270 562 150 380 122 405 704 838 727 770 801 648 059 653 599 538 829 051 757 269 880 958 587 152 884 682 510 385 210 247 899 693 208 128 976 336 676 087 489 617 421 600 514 998 102 950 835 490 484 762 234 134 593 111 780 497 233 545 406 981 665 961 227 120 15

455 137 488 095 656 252 317 125 597 181 010 002 273 786 786

231 955 342 481 094 554 347 609 039 938 541 605 587 587 879

232 235 017 572 681 383 250 094 980 680 515 333 952 952 421

136 659 718 088 647 520 597 627 114 761 694 155 261 261 623

542 752 957 631 161 287 127 370 989 416 281 824 273 273 217

723 864 968 562 050 621 523 228 907 722 873 486 470 470 108

954 986 651 909 113 948 458 578 456 336 936 541 276 276 073

290 774 743 456 977 327 717 600 550 348 621 393 026 026 414

929 530 791 436 797 992 425 762 767 694 911 356 489 489 707

Tem-se uma amostra de 20 participantes com os seguintes nmeros: 347; 196; 429; 244; 048; 034; 046; 316; 073; 455; 137; 488; 095; 252; 317; 125; 181; 010; 002 e 273. Repare que o nmero 347 aparece duas vezes e, na segunda vez, descartado, pois j havia sido escolhido, e o processo de escolha no permite que o entrevistado responda ao mesmo questionrio mais de uma vez. EXERCCIO 1) Uma empresa possui 250 funcionrios. Escolher uma amostra aleatria simples composta de 30 pessoas para fazer um levantamento e descrever os passos que sero adotados. 2) Descrever os passos para a escolha aleatria simples de 20 estudantes dentro de uma faculdade com 1.000 alunos.

Amostragem Aleatria por sorteioOutra maneira de realizar uma amostragem simples por sorteio. Exemplo: Deseja-se fazer uma pesquisa de opinio com os eleitores de Salvador. Eles sero submetidos a um questionrio sobre as propostas dos novos candidatos ao governo. Torna-se impraticvel entrevistar todos os eleitores de um bairro de Salvador sobre as propostas dos novos candidatos ao governo, pois a anlise tomaria muito tempo e o custo dessa pesquisa seria altssimo. Ento, utiliza-se uma amostragem aleatria. Sero escolhidos, aleatoriamente, 500 eleitores para a pesquisa. Se o nmero de moradores do bairro conhecido e todos podem ser listados, ento, a escolha desses eleitores pode ser realizada por sorteio.

16

A amostragem aleatria por sorteio mais simples. Todos os elementos da populao devero estar enumerados ou listados. Pode-se utilizar uma urna que contenha todos os nmeros dos elementos e, ento, iniciar o sorteio. Esse sorteio realizado de forma semelhante forma como so sorteados os nmeros de jogos da Loteria Federal. Da mesma forma que o exemplo anterior, os moradores que j foram entrevistados no devero participar novamente da pesquisa. Assim, diz-se que o processo foi realizado sem reposio, ou seja, todos os itens j escolhidos numa primeira amostragem sero descartados quando aparecerem pela segunda vez. Essa bastante simples, no mesmo?

Amostragem EstratificadaEsta tcnica de amostragem utilizada quando necessrio que haja um representante de cada segmento da populao includo na amostra. Por exemplo, para coletar uma amostra dos moradores de uma cidade, podem-se dividir as residncias por nveis socioeconmicos e depois escolher, aleatoriamente, uma amostra dos moradores. importante que uma caracterstica comum seja escolhida para a coleta das informaes amostrais. No caso do exemplo, a caracterstica o nvel socioeconmico. Dependendo do objetivo da pesquisa, os elementos da populao podem ser divididos em subgrupos maiores com caractersticas similares, como idade, peso, nvel social, localizao geogrfica, raa, etc. Portanto, uma amostragem estratificada obtida separando-se a populao em subgrupos com caractersticas homogneas ou similares e selecionando-se, independentemente, uma amostra aleatria simples em cada um desses subgrupos. Existem dois tipos de amostragem estratificada: a) as que tm o mesmo tamanho; b) as proporcionais. Na amostragem estratificada de mesmo tamanho sorteia-se um nmero igual de elementos em cada subgrupo. Esse processo utilizado quando o nmero de elementos por subgrupo for igual ou aproximadamente o mesmo. Quando cada subgrupo apresenta nmeros diferentes de elementos utiliza-se, ento, a amostragem estratificada proporcional, em que o nmero de elementos que devem ser escolhidos em cada grupo proporcional ao nmero de elementos do grupo. O processo de amostragem realizado da seguinte maneira: S - o nmero de subgrupos; Ni - o nmero de elementos de amostragem no subgrupo i; N - o nmero de elementos da populao; n - o nmero de elementos da amostra.

17

Cada subgrupo possui caractersticas similares. Com isso, tm: N = N1 + N2 + N3 + ... + NS Determina-se a frao de amostragem f dada por: f =n N

Frao de amostragem a razo entre o nmero de elementos da amostra e o nmero total de elementos da populao. O nmero de elementos sorteados em cada subgrupo definido pelo produto deste fator f e do nmero de elementos de amostragem em cada subgrupo: N1.f, N2.f, ... NS.f Exemplo: Deseja-se obter uma amostra de 20 participantes de um seminrio, para aplicao de um questionrio sobre o tema abordado nas palestras da srie Violncia nas Grandes Cidades. Sabese que a informao que as pessoas prestam est relacionada regio onde moram. O seminrio possui participantes de 4 Estados brasileiros, sendo assim compostos: 50 do Rio de Janeiro; 100 de So Paulo; 30 de Minas Gerais e 20 da Bahia. Como dever ser realizada a amostragem para se escolher os participantes do seminrio? Soluo: Deve-se utilizar a tcnica de amostragem estratificada, pois importante que se tenham representantes de todos os 4 Estados em nmero proporcional ao nmero de representantes de cada Estado. O primeiro passo separar os participantes em subgrupos de Estados. Depois, deve-se fazer a amostragem dentro de cada subgrupo. A populao do seminrio em questo de 200 participantes. 18

Os subgrupos sero: Rio de Janeiro: So Paulo: Minas Gerais: Bahia: O tamanho da populao : N = N1 + N2 + N3 + N4 N = 50 + 100 + 30 + 20 = 200 participantes A frao de amostragem ser: f = n 20 = =0,10 N 200 N1 N2 N3 N4 50 participantes 100 participantes 30 participantes 20 participantes.

O nmero de elementos sorteados em cada subgrupo ser definido pelo produto desse fator de amostragem f pelo nmero de elementos de amostragem em cada subgrupo. N1 . f = 50 . 0,10 = 5 participantes escolhidos aleatoriamente no subgrupo 1. N2 . f = 100 . 0,10 = 10 participantes escolhidos aleatoriamente no subgrupo 2. N3 . f = 30 . 0,10 = 3 participantes escolhidos aleatoriamente no subgrupo 3. N4 . f = 20 . 0,10 = 2 participantes escolhidos aleatoriamente no subgrupo 4. O total de participantes escolhidos por amostragem estratificada foi de 20, sendo 5 do Rio de Janeiro, 10 de So Paulo, 3 de Minas Gerais e 2 da Bahia. Exemplos: Deseja-se realizar uma amostra de 1.000 moradores de uma certa cidade para a aplicao de um questionrio sobre consumo. necessrio que sejam entrevistadas pessoas com rendas baixa, mdia e alta. A cidade possui 2 milhes de habitantes divididos da seguinte maneira: Renda baixa: Renda mdia: Renda alta: 100.000 habitantes 1.400.00 500.000 habitantes habitantes

Como dever ser o plano de amostragem para esta pesquisa? Soluo: Deve-se utilizar a tcnica de amostragem estratificada, pois importante que se obtenham respostas dos trs nveis de renda. Como o nmero de pessoas em cada nvel de renda diferente, utiliza-se a amostragem estratificada proporcional. O primeiro passo separar as pessoas em subgrupos de nvel de renda e, ento, fazer a amostragem dentro de cada subgrupo. A populao do cidade de 2.000.000 de pessoas. O subgrupos so divididos da seguinte forma: Renda baixa: N1 = 1.400.000 pessoas Renda mdia: N2 = 500.000 pessoas Renda alta: N3 = 100.000 pessoas

19

O tamanho da populao: N = N1 + N2 + N3 N = 1.400.000 + 500.000 + 100.000 = 2.000.000 pessoas A frao de amostragem ser: f = n 1.000 = =0,0005 N 2.000.000

O nmero de elementos sorteados em cada subgrupo ser definido pelo produto do fator de amostragem f pelo nmero de elementos de amostragem em cada subgrupo. Tem-se: N1 . f = 1.400.000 . 0,0005 = 700 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de baixa renda. N2 . f = 500.000 . 0,0005 = 250 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de renda mdia. N3 . f = 100.000 . 0,0005 = 50 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de renda alta. O total de pessoas escolhidas nesta amostragem estratificada de 1.000, sendo 700 de baixa renda, 250 de renda mdia e apenas 50 de renda alta. Viu que no difcil entender essa histria de amostragem estratificada proporcional? Agora s usar sempre que voc precisar.

Amostragem por conglomeradoA amostragem por conglomerado uma amostra aleatria simples em que cada unidade de amostragem um subgrupo com caractersticas heterogneas, ou um conglomerado de elementos representativos da populao. So minipopulaes. Geralmente so grupos que se acham ligados por um pequeno contato fsico. Ex.: casas, quarteires, bairros, etc. Primeiramente, devem-se especificar adequadamente os conglomerados. O nmero de elementos num conglomerado dever ser pequeno em relao ao tamanho da populao, e o nmero de conglomerados dever ser razoavelmente grande. Neste tipo de amostragem, a populao dividida em subgrupos com caractersticas heterogneas, e so selecionadas amostras aleatrias simples de subgrupos. Com isso, todos os elementos dos subgrupos (conglomerados) selecionados faro parte da amostra. A amostragem por conglomerado pode ser utilizada quando no se tem uma lista com todos os elementos da populao ou quando a obteno dessa listagem uma tarefa muito longa e cara. Exemplo 1: Deseja-se fazer uma pesquisa com os moradores de um bairro da cidade. O objetivo saber a opinio deles sobre a construo de um grande centro de compras. Como o bairro grande e no se tem a listagem completa de todos os moradores e sua obteno tornaria a pesquisa muito cara e demorada, utiliza-se uma amostragem por conglomerados. Para a realizao da amostragem por conglomerados, deve-se separar o bairro em subgrupos de caractersticas heterogneas, como, por exemplo, quarteires. Nos quarteires tem-se uma representao da populao de moradores do bairro. O quarteiro pode ser considerado uma mini populao, pois os moradores de cada quarteiro tm as mesmas caractersticas dos moradores do bairro.

20

rea do bairro

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

Essa imagem mostra a rea do bairro, composta por 15 quarteires. Para a escolha dos quarteires, utiliza-se uma amostragem aleatria, e todos os moradores selecionados so entrevistados. Uma amostragem de 4 quarteires pode ser realizada por sorteio. Colocam-se todos os nmeros correspondentes a cada quarteiro dentro de uma urna, de onde sero tirados apenas 4. Suponha que tenham sido escolhidos os quarteires 3, 7, 9 e 15. A todos os moradores desses quarteires sero aplicados os questionrios sobre a construo do centro de compras. Exemplo 2: O prefeito de uma cidade deseja realizar uma pesquisa sobre as despesas familiares de seus habitantes. Uma forma de extrair uma amostra nesta situao consiste em dividir a rea total da cidade em diversas reas menores, como quarteires ou bairros. Selecionam-se, ento, aleatoriamente, alguns desses quarteires, com a amostra final constituda de todas as famlias residentes em alguns deles. Nesse tipo de amostragem, torna-se muito menos dispendioso, em termos de custo e tempo, trabalhar com uma amostra em que as famlias esto mais prximas, em conglomerados, do que com famlias selecionadas aleatoriamente sobre toda a rea de uma cidade. Se a amostra aleatria fosse realizada em toda a cidade, o custo e o tempo de anlise das respostas seriam muito maiores, pois os pesquisadores teriam que rodar distncias mais longas para realizar as entrevistas com as famlias. Diante dos conceitos e caractersticas apresentados sobre amostragem por conglomerados, a sua vez de colocar em prtica o que aprendeu. EXERCCIO 1) Suponha que uma pesquisa seja realizada na cidade de Petrpolis-RJ. O objetivo determinar as principais marcas de preferncia de consumo de determinado produto pelos moradores de cada bairro. Elaborar um plano de amostragem dos moradores dos bairros por conglomerados.

21

Amostragem sistemticaA amostragem sistemtica consiste em escolher os elementos da populao de forma peridica, isto , os elementos da populao sero escolhidos em intervalos regulares. Esses intervalos sero determinados pela frmula que definiremos a seguir. utilizado um sistema de seleo semelhante ao da amostragem aleatria simples. A diferena entre a amostragem aleatria simples e a amostragem sistemtica que esta ltima utiliza um fator peridico para a escolha dos elementos, enquanto a aleatria simples no utiliza critrio algum. No aconselhvel a utilizao deste mtodo nos casos em que os itens esto agrupados ou listados em carter peridico, pois a amostra poder apresentar caractersticas tendenciosas, contendo apenas elementos com caractersticas semelhantes. Para obter uma amostragem sistemtica necessrio: 1) obter uma lista da populao e numer-la de 1 a N; N , onde N o tamanho da populao e n o tamanho da amostra. O k n chamado de passo da escolha; 2) calcular k = 3) dividir a populao em grupos de k elementos; 4) escolher aleatoriamente um nmero na TNA para determinar onde comear. Os elementos seguintes sero escolhidos somando-se ou subtraindo-se k ao nmero anterior. Exemplo 1: A tabela a seguir apresenta os lucros lquidos, em reais, obtidos por uma empresa de eventos na realizao de 30 apresentaes de uma mesma banda. Queremos obter uma amostra sistemtica de 5 valores de lucros lquidos, em reais. 01 02 03 04 05 06 07 08 09 10

20.000 17.500 12.000 10.000 8.000 12.500 11.000 14.000 18.000 15.200 11 12 13 14 15 16 17 18 19 20

16.200 15.000 11.000 19.000 28.000 16.800 17.000 11.200 19.600 14.800 21 Soluo: A lista de todos os lucros obtidos na realizao dos 30 eventos j est na tabela exibida. Deve-se escolher o passo que ser utilizado para a escolha dos valores de lucro. O fator passo ser: k= N 30 = =6 n 5 22 23 24 25 26 27 28 29 30

10.000 15.000 14.000 10.000 9.000 11.500 14.000 13.000 15.000 19.200

Ento, devem ser escolhidos os lucros com passos de 6 em 6. Escolher, na TNA, um nmero aleatrio de apenas um algarismo. Suponha que o nmero escolhido tenha sido o 3; ento, o primeiro elemento da amostra de lucro 22

lquido o 3. Somando-se k = 6 a esse nmero obtido na tabela, tem-se uma amostra de 5 itens. 3 + 6 = 9 + 6 = 15 + 6 = 21 + 6 = 27 01 02 03 04 05 06 07 08 09 10

20.000 17.500 12.000 10.000 8.000 12.500 11.000 14.000 18.000 15.200 11 12 13 14 15 16 17 18 19 20

16.200 15.000 11.000 19.000 28.000 16.800 17.000 11.200 19.600 14.800 21 22 23 24 25 26 27 28 29 30

10.000 15.000 14.000 10.000 9.000 11.500 14.000 13.000 15.000 19.200 Ento, os valores de lucro escolhidos pela amostragem sistemtica so: 12.000; 18.000; 28.000; 10.000 e 14.000 EXERCCIO: Deseja-se selecionar uma amostra sistemtica de 10 aparelhos, de um total de 200, que esto guardados no estoque. Qual seria o plano de amostragem adotado?

Casos em que uma Amostragem no se justificaExistem trs ocasies em que prefervel analisar todos os itens de uma populao. 1 - Quando a populao muito pequena. Uma populao pode ser considerada pequena quando o custo e o tempo de anlise dos dados so pouco maiores do que seriam para a realizao de uma amostra. Exemplo: A anlise dos dados dos 10 funcionrios de uma empresa. Neste caso, como a populao pequena, torna-se desnecessria a aplicao de uma tcnica de amostragem. A anlise dos dados obtidos de 10 funcionrios toma muito pouco tempo e tem baixo custo. 2 - Quando h uma grande variao entre as respostas obtidas. A amostra dever ser muito grande para ser representativa da populao; uma amostragem pequena pode levar a erros de interpretao dos resultados. Exemplo: Se as respostas dadas a um questionrio aplicado a 2.000 moradores de um bairro forem muito diferentes umas das outras, essencial que se trabalhe com uma amostragem muito alta. Essa amostragem pode estar prxima do tamanho da populao. Nesse caso, opta-se por trabalhar com toda a populao, pois obtm-se um resultado mais confivel. 3 - Quando necessria uma preciso muito alta. Nesse caso, a anlise da populao a opo mais adequada. Exemplo: Censo demogrfico

23

EXERCCIO 1) Dar exemplos de amostragem aleatria simples e de amostragem sistemtica. 2) Quais so as diferenas que voc pode notar entre as amostragens aleatria simples e a sistemtica? 3) Em que situaes prefervel adotar o levantamento e a anlise de toda a populao, ao invs de utilizar uma tcnica de amostragem? 4) Uma empresa possui 400 funcionrios. Determinar um plano de amostragem aleatria para a escolha de 40 funcionrios. 5) Voc responsvel por determinar a opinio dos profissionais graduados em Administrao de Empresas e que atuam no mercado de trabalho de uma determinada cidade, sobre a produo industrial. Identificar a tcnica de amostragem que dever ser utilizada para cada uma das amostras representadas nos itens a, b e c, a seguir. a) Selecionar aleatoriamente uma empresa e aplicar o questionrio aos administradores que nela trabalham. b) Dividir a populao de administradores em relao ao ramo de atividade da empresa, realizar uma amostra aleatria dos profissionais e fazer perguntas a alguns administradores de cada ramo. c) Listar o nome de todos os profissionais e escolher, aleatoriamente, um certo nmero deles. Os administradores escolhidos sero entrevistados no que diz respeito produo industrial.

Sries EstatsticasNo conveniente apresentar os dados para uma anlise exatamente da forma como so coletados. Um dos objetivos da Estatstica resumir os dados de forma clara para se ter uma viso global das caractersticas das variveis. O principal objetivo desta nossa aula mostrar as formas de apresentao de dados mais utilizadas, de acordo com a varivel de interesse. Aps a coleta dos dados, torna-se necessria a disposio deles em tabelas ou grficos, para que haja um melhor entendimento. Na maioria das vezes, eles se encontram na forma bruta, isto , sem qualquer ordenao ou classificao. Portanto, necessrio coloc-los em ordem crescente ou decrescente, ou at mesmo classific-los de acordo com as variveis que os representam. Exemplo: Uma amostra da altura de 122 pessoas presentes em um evento. Os valores referentes s alturas podem ser colocados em ordem crescente e estar associados a um grupo de pessoas que apresentam a mesma altura. Isto , os valores de alturas estaro posicionados em ordem crescente, como apresentado na tabela abaixo. Alturas, em centmetros N de pessoas 150 160 5 160 170 25 170 180 48 180 190 32 190 200 10 200 210 2 Total 122 24

A forma como essa tabela construda ser estudada com maiores detalhes em Distribuio de Freqncia. A disposio dos dados em tabelas evita uma anlise errnea, principalmente se os dados e informaes coletados forem muito extensos.

Com a utilizao de tabelas e grficos, possvel fornecer informaes rpidas sobre as variveis em estudo. A tabela uma apresentao numrica de dados coletados e ordenados de forma bem clara; o grfico uma apresentao geomtrica mais rpida e mais clara de ser visualizada. Veja o exemplo de representao grfica da tabela das alturas, mostrada anteriormente. Observe que toda representao tabular usa um dos 3 fatores seguintes: Fator cronolgico ou temporal - determina a poca ou o perodo do tempo em que ocorre. Fator espacial ou geogrfico - determina o local onde ocorre. Fator Especificativo ou a espcie do fato - tem somente a espcie do fato ou a categoria. De maneira geral, as representaes tabulares so chamadas Sries Estatsticas. A Srie Estatstica um agrupamento dos dados referentes a uma mesma ordem de classificao. Assim, as sries estatsticas podem ser classificadas em: - Srie Temporal - Srie Geogrfica - Srie Especfica Vamos aos exemplos de cada um desses 3 tipos de srie. 1. Srie Temporal Apresenta somente o fator cronolgico ou temporal como varivel de anlise.

25

Exemplo: Produo Brasileira de Motos 1996-1998 Ano Produo (unidades) 1996 288.073 1997 426.547 1998 476.655 Fonte: Revista ISTO no1546

Apresentao do tempo: Toda srie temporal consecutiva deve ser apresentada, em uma tabela, por seus perodos inicial e final ligados por um hfen (-). Exemplos: 1991 1995 apresenta dados numricos para os anos de 1991, 1992, 1993, 1994, 1995; Out 1991 Mar 1992 apresenta dados numricos para os meses de outubro, novembro e dezembro de 1991 e janeiro, fevereiro e maro de 1992. Toda srie temporal no consecutiva deve ser apresentada, em uma tabela, por seus perodos inicial e final ligados por barra (/). Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de apresentar dados numricos para algum (ns) dos anos desta srie. Srie Geogrfica: usada para apresentar dados de diferentes regies geogrficas, em determinado tempo. Exemplo: Vacinao contra a Poliomielite 1993 Regies Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 Fonte: Ministrio da Sade

26

Srie Categrica: usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local. Exemplo: Avicultura Brasileira 1992 Espcies Nmero (1.000 cabeas) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 Fonte: IBGE Sries Mistas ou Conjugadas (tabela de dupla entrada): quando so feitas combinaes de duas ou mais sries. Exemplo: Exportao Brasileira 1985/1995 1985 1990 13,0 13,4 28,2 26,3 33,9 35,2 10,9 17,7 14,0 8,8

Importadores Amrica Latina EUA e Canad Europa sia e Oceania frica e Oriente Mdio Fontes: MIC e SECEX Nota: Valores em percentagem

1995 25,6 22,2 20,7 15,4 5,5

REPRESENTAO GRFICA DAS SRIES ESTATSTICASOs grficos produzem uma viso mais rpida e viva do fenmeno em estudo, ajudando a visualizar as tendncias e a interpretar os valores representativos deste fenmeno. Requisitos Fundamentais na Representao Grfica: O grfico deve ser simples, claro e deve expressar a verdade sobre o fenmeno em estudo; Todo grfico deve ter ttulo e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto; O ttulo do grfico pode ser escrito acima ou abaixo do grfico. O IBGE escreve o ttulo acima do grfico;

27

As variveis devem ser claramente identificadas; A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados so muito altos, deve ser feita uma interrupo no eixo, com indicao clara da posio do zero; O sistema de eixos cartesianos e as linhas auxiliares devem ter traado mais leve do que a parte do grfico que se pretende evidenciar; Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o grfico feito dentro de um retngulo. Principais Tipos de Grficos: Diagramas Cartogramas Pictogramas Cartogramas: So representaes atravs de mapas (cartas geogrficas). Este grfico empregado quando o objetivo o de relacionar os dados estatsticos diretamente com reas geogrficas ou polticas. Pictogramas: a representao grfica atravs de figuras. Por se tratar de uma apresentao atraente, um grfico que desperta muito a ateno do leitor. Diagramas: So grficos geomtricos construdos, em geral, no sistema cartesiano. Principais Diagramas: Grfico em Linha, Grfico em Colunas, Grfico em Barras, Grfico em Colunas ou em Barras Mltiplas e Grfico em Setores. Grfico em Linha: Usado para apresentar as sries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da srie corresponde a um ponto. Estes pontos so unidos por segmentos de reta. Exemplo: Tabela 1PRODUO BRASILEIRA DE CAF 1991-1995 ANOS PRODUO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE

28

PRODUO BRASILEIRA DE CAF 1991-1995

4.000 PRODUO (1.000t) 3.500 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 ANOS 1994 1995

Regras para a elaborao de um grfico em linhas: Fixe a largura (l) do grfico; Determine a altura mxima e a altura mnima de acordo com as normas a seguir: hmn = 60% da largura e hmx = 80% da largura Determine os limites da escala, dividindo o maior valor a representar pela altura mxima e pela altura mnima; Determine a escala, escolhendo um valor, de preferncia inteiro, entre os valores encontrados para limites; Trace um sistema de coordenadas cartesianas; Determine, graficamente, todos os pontos da srie; Ligue esses pontos, dois a dois, por segmentos de reta; Identifique, claramente, as variveis nos dois eixos; Acrescente o Ttulo, a Fonte e a Legenda (quando necessria). Grfico em Colunas: Usado para representar as sries cronolgicas, geogrficas e categricas. Representado por meio de retngulos de mesma base, dispostos verticalmente (em colunas). Exemplo:

29

Tabela 1PRODUO BRASILEIRA DE CAF 1991-1995 ANOS PRODUO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE

PRODUO BRASILEIRA DE CAF 1991-19954.000 3.500 PRODUO (1.000t) 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 ANOS 1994 1995

Grfico em Barras: Usado para representar as sries geogrficas e categricas. Representado por meio de retngulos dispostos horizontalmente (em barras). Exemplo:

30

Tabela 2EXPORTAES BRASILEIRAS MARO 1995 ESTADOS VALOR (US$ milhes) So Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Esprito Santo 285 Paran 250 Santa Catarina 202 FONTE: SECEX

E X P O R T A E S B R A S IL E IR A S M A R O - 1995S a n t a C a t a r in a P a ra n E s p r it o S a n t o R io G r a n d e d o S u l M in a s G e r a is S o P a u lo 0 500 1 .0 0 0 1 .5 0 0

V a lo r ( U S $ m ilh e s )

OBSERVAES: 1) O procedimento para a construo de um grfico em colunas (ou barras) anlogo ao do grfico em linhas, observando que no grfico em barras deve-se fazer a inverso nos eixos cartesianos (o eixo x corresponde a altura e o eixo y corresponde a largura). 2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferncia ao grfico em barras (sries geogrficas e especficas). Grfico em Colunas ou em Barras Mltiplas: Usado para representar as sries conjugadas. Exemplo:

31

Tabela 3 ESPECIFICAES Exportao (FOB) ImportaoBALANA COMERCIAL DO BRASIL 1989 1993 VALOR (US$ 1.000.000)

1989 34.383 18.263

1990 31.414 20.661

1991 31.620 21.041

1992 35.793 20.554

1993 38.783 25.711

FONTE: Ministrio da Fazenda

BALANA COMERCIAL DO BRASIL 1989-199345.000 40.000 Valor (us$ 1.000.000) 35.000 30.000 25.000 20.000 15.000 10.000 5.000 0 1989 Exportao (FOB) 1990 1991 Importao 1992 1993

Grfico em Setores: Construdo com base em um crculo, este grfico usado para comparar propores. Exemplo:

32

Tabela 4REBANHO SUINO DO SUDESTE DO BRASIL 1992 QUANTIDADE (mil cabeas) ESTADOS Minas Gerais 3.363,7 Esprito Santo 430,4 Rio de Janeiro 308,5 So Paulo 2.035,9 Total 6.138,5 FONTE: IBGE

REBANHO SUNO DO SUDESTE DO BRASIL 1992

33% 55%

5% 7%

Minas Gerais

Esprito Santo

Rio de Janeiro

So Paulo

Regras para a elaborao de um grfico em setores: Trace uma circunferncia. A rea do crculo representa o total, isto , 100%, devendo ser dividida em tantos setores quantas sejam as partes. Lembre-se de que uma circunferncia tem 360. Ento, se ao total correspondem 360, a cada parte corresponder um setor cujo ngulo x dado por: x =PARTE 360 TOTAL

Marque os valores dos ngulos calculados na circunferncia e trace os raios, separando os setores. Para facilitar a distino, faa um tracejado diferente em cada setor. Coloque ttulo e legenda no grfico. OBS.: Para clareza dos dados, deve-se usar no mximo sete setores.

33

DISTRIBUIO DE FREQUNCIASFreqentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numricos, que se repetem algumas vezes, dificultando sua anlise e interpretao. Surge ento a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os nmeros de suas repeties, isto , com suas respectivas freqncias. Esta tabela recebe o nome de Distribuio de Freqncias. De acordo com a disposio dos dados tm-se dois tipos de distribuio:

Distribuio de Freqncias Simples (dados no agrupados ou notabulados em classes de valores) uma tabela onde os valores da varivel analisada aparecem individualmente correlacionados com os nmeros de suas repeties (freqncias). Esse tipo de distribuio normalmente usado para representar variveis discretas. Exemplo: Tabela 1Nmero de Acidentes Registrados na ponte Rio-Niteroi em Janeiro de 2009

N de Acidentes0 1 2 3 4 5 TotalFONTE: Dados Hipotticos

N de Dias18 5 2 2 3 1 31

Distribuio de Freqncias por Classes (dados agrupados outabulados em classes de valores) Quando a varivel analisada apresenta um grande nmero de valores torna-se mais vantajoso o agrupamento destes em classes de freqncia, evitando assim grande extenso da tabela e facilitando a visualizao do fenmeno como um todo.

34

A distribuio de freqncias por classes uma tabela onde os valores observados so agrupados em classes, isto , em intervalos de variaes da varivel em questo. Esse tipo de distribuio normalmente usado para representar variveis contnuas. utilizada tambm para representar variveis discretas em um grande nmero de valores observados. Exemplo: Tabela 2 Salrios dos funcionrios da UERJ Salrios (R$) N de funcionrios 1000 1200 2 1200 1400 6 1400 1600 10 1600 1800 5 1800 2000 2 Total 25FONTE: Dados Hipotticos

A seguir so apresentados alguns conceitos fundamentais para a compreenso dessas sries. Dados Brutos a apresentao dos dados observados na seqncia em que foram coletados, isto , sem nenhuma ordenao numrica. Exemplo: O nmero de peas defeituosas obtidas da produo de uma mquina durante vinte dias foi: 24212310510112013 01 2 Rol a organizao dos dados brutos em ordem crescente ou decrescente. Exemplo: O rol do exemplo anterior : 00001111111222223345

35

Amplitude Total (AT) a diferena entre o maior valor e o menor valor da seqncia dos dados observados. AT = valor mximo valor mnimo Exemplo: A amplitude total do rol apresentado : AT = 5 0 = 5

Freqncia Absoluta Simples (ou simplesmente freqncia) Denotada por Fi, a freqncia indica o nmero de ocorrncias de cada valor ou o nmero de valores pertencentes a uma classe. Na Tabela 1: F6 = F(5) = 1 Na Tabela 2: F2 = 6

Regras para a elaborao de uma Distribuio de Freqncias Simplesa) Escreve-se, ordenadamente, os dados observados na coluna indicadora. b) Obtm-se as freqncias absolutas simples dos dados (Fi). Essas freqncias constituem o corpo da tabela. Exemplo: Sejam os dados abaixo representativos de uma pesquisa sobre o nmero de irmos de 20 alunos da Turma Biologia/Geografia. Dados Brutos: 13052110014310122131 Rol: 00001111111122233345 A distribuio de freqncias do rol apresentado :

36

Tabela 3 Nmero de Irmos de 20 alunos da Turma Geo/Bio i Nmero de Irmos (xi) Repeties (Fi) 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 Total Fi = 20 1 Coluna (i) nmero de ordem dos valores distintos da varivel nmero de irmos. 2 Coluna (xi) valores distintos da varivel nmero de irmos. 3 Coluna (Fi) nmero de repeties dos valores distintos da varivel nmero de irmos.k

Nota:i =1

Fi = n , onde n igual ao nmero de dados observados (n = 20)

Observa-se que neste tipo de tabela no h perda de informao, podendo os dados originais serem reconstitudos a partir da distribuio elaborada.

1.6.4 Tipos de FreqnciasPara a interpretao dos resultados de uma pesquisa, conforme os tipos de informaes requeridas utilizam-se diversos tipos de freqncias de dados. A seguir sero apresentados os tipos de freqncias, derivados da distribuio de freqncias absolutas, bastante teis na interpretao de dados.

Freqncia Total a soma de todas as freqncias absolutas simples em uma tabela.k

Fi = ni =1

37

A freqncia total de uma distribuio de freqncias igual ao nmero total de observaes (n). Exemplo: Na Tabela 3, temos:6

Fi = F1 + F2 + F3 + F4 + F5 + F6i =1

=

4 + 8 + 3 + 3 +1+1 =

20

Freqncia Relativa Simples, ou simplesmente, Freqncia RelativaSimbolizada por fi, a freqncia relativa simples fornece a proporo de cada valor ou de casos ocorridos em cada classe, em relao ao nmero total de observaes. Portanto, um nmero relativo. Para calcular a freqncia relativa, basta dividir a freqncia absoluta da ordem em questo pelo nmero de observaes.fi = Fi n

As comparaes expressas atravs de porcentagem so mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja: F f i = i 100 nk

Nota:i =1

f i = 1 ou 100%

Exemplo: Na Tabela 3, temos:f1 = f2 = f3 = F1 4 = = 0,20 100 = 20 % 20 20 F2 8 = = 0,40 100 = 40% 20 20 F3 3 = = 0,15 100 = 15 % 20 20

38

f4 = f5 = f6 =

F4 3 = = 0,15 100 = 15 % 20 20 F5 1 = = 0,05 100 = 5 % 20 20 F6 1 = = 0,05 100 = 5 % 20 20

Freqncia Absoluta AcumuladaDenotada por Faci, a freqncia absoluta acumulada fornece a informao de quantos elementos se situam at determinado valor. A freqncia acumulada do isimo valor ou i-sima classe (freqncia acumulada de ordem i) obtida somando-se a freqncia desse valor ou classe com as freqncias anteriores, ou seja, a soma de todas as freqncias de ordens menores ou igual a da ordem em questo. Exemplo:3

Fac3 =i =1 4

Fi = F1 + F2 + F3

Fac4 =i =1

Fi = F1 + F2 + F3 + F4

Exemplo: Na tabela 3, temos: Fac1 = F1 = 4 Fac2 = F1 + F2 = 4 + 8 = 12 Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20

Freqncia Acumulada RelativaDenotada por faci, fornece a proporo de elementos situados at determinado valor. Consiste na soma da freqncia relativa de cada valor ou classe com as freqncias relativas dos valores ou classes anteriores, ou seja, a soma das freqncias simples relativas de ordens menores ou iguais a da ordem em questo. .39

Exemplo:3

fac3 =i =1

fi = f1 + f2 + f3

Exemplo: Na tabela 3, temos: fac1 = f1 = 0,20 = 20% fac2 = f1 + f2 = 0,20 + 0,40 = 0,60 = 60% fac3 = f1 + f2 + f3 = 0,60 + 0,15 = 0,75 = 75% fac4 = f1 + f2 + f3 + f4 = 0,75 + 0,15 = 0,90 = 90% fac5 = f1 + f2 + f3 + f4 + f5 = 0,90 + 0,05 = 0,95 = 95% fac6 = f1 + f2 + f3 + f4 + f5 + f6 = 0,95 + 0,05 = 1 = 100% A freqncia relativa acumulada de ordem i pode ser tambm calculada atravs do quociente: = Exemplo: fac3 = 15 = 0,75 = 75 % 20

Com relao Tabela 3, utilizando todos os tipos de freqncias definidas anteriormente, podemos construir a seguinte distribuio de freqncias:

Tabela 4i 1 2 3 4 5 6

Nmero de Irmos de 20 alunos da Turma Geo/Bio xi Fi fi fi (%) Faci faci faci(%) 0 4 0,20 20 4 0,20 20 1 8 0,40 40 12 0,40 40 2 3 0,15 15 15 0,75 75 3 3 0,15 15 15 0,90 90 4 1 0,05 5 5 0,95 95 5 1 0,05 5 5 1,00 100 Total 20 1,00 100

FONTE: Dados Fictcios

40

Interpretao: f3 = 0,15; 15% dos alunos responderam que tm 2 irmos. F2 = 8; 8 alunos responderam que tm 1 irmo; fac3 = 0,75; 75% dos alunos responderam que tm entre 0 e 2 irmos.

Representao Grfica de uma Distribuio de Freqncias SimplesA distribuio de Freqncias Simples representada graficamente por um Grfico em Hastes, um diagrama onde as freqncias so representadas por segmentos de retas perpendiculares ao eixo das abcissas. Cada segmento determinado pelos pontos (xi,Fi) e (xi,0). Exemplo: Representao grfica da Tabela 3.Fi 8

4 3 1 0 1 2 3 4 5 xi (numero de irmos)

EXERCCIOS COMPLEMENTARES1. Considere a seguinte distribuio de freqncias correspondente aos diferentes preos de um determinado produto pesquisados em 20 lojas. i 1 2 3 4 5

Preos do Produto A Preo (R$) Nmero de Lojas 50 2 51 5 52 6 53 6 54 1 Total 20

FONTE: Dados Fictcios

41

a) Quantas lojas apresentam preos de R$ 52,00? b) Determine as freqncias relativas simples e as freqncias absolutas acumuladas. c) Quantas lojas apresentaram um preo de at R$ 52,00 (inclusive)? d) Qual a percentagem de lojas com preos de at R$ 53,00 (inclusive)? 2. A distribuio de freqncias a seguir apresenta o nmero de acidentes por dia, durante 40 dias, em determinado cruzamento. i 1 2 3 4 5

Nmero de Acidentes no Cruzamento X Nmero de Dias N de Acidentes por dia (Fi) (xi) 0 30 1 5 2 3 3 1 4 1 Total 40

FONTE: Dados Fictcios

a) Determine as freqncias absolutas acumuladas, as freqncias simples relativas e as freqncias acumuladas relativas. b) Aps ter determinado as freqncias acima, interprete todos os resultados da 3 linha da distribuio de freqncias. 3. Em uma amostra de 30 milheiros de telhas recebidas pela Construtora ABC Ltda, constatou-se os seguintes nmeros de unidades defeituosas por milheiro: 5 20 10 5 40 30 20 5 10 15 10 30 40 10 50 10 30 15 20 40 10 20 20 50 10 40 30 20 0 30 a) b) c) d) e) f) Agrupar estes dados em uma distribuio de freqncias simples. Represent-la atravs de um grfico conveniente. Calcular todos os tipos de freqncias conhecidos. Qual a percentagem de milheiros com mais de 30 telhas defeituosas? Quantos milheiros tiveram menos de 10 telhas defeituosas? Qual a proporo de milheiros com menos de 20 telhas defeituosas?

42

4. Dada a distribuio de freqncias:

Indstria de Equipamentos Eletrnicos IEE Nmero de Falhas em Componentes durante o perodo de garantia Janeiro de 2009 i N de Falhas Nmero de Equipamentos (xi) (Fi) 1 0 148 2 1 52 3 2 34 4 3 26 5 4 13 6 5 7 Total 280FONTE: Dados Fictcios

a) Determinar as freqncias relativas percentuais, as freqncias acumuladas e as freqncias relativas acumuladas percentuais. b) Atravs das freqncias calculadas, responder qual a porcentagem de: b.1) equipamentos que no apresentaram falha em seus componentes; b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes; b.3) equipamentos trocados, sabendo-se que a indstria se compromete a trocar o equipamento que apresente 4 ou mais falhas em seus componentes. 5. Considere os seguintes nmeros. 1 0 8 8 3 1 6 11 5 2 5 6 7 3 4 4 9 4 3 2 2 5 2 1 4 6 1 3 6 7 0 5 8 8 10 7 10 9 15 9 15 9 20 11 20 8 25 25 7 12

a) Construa a distribuio de freqncias simples. b) Represent-la atravs de um grfico conveniente. c) Calcular todos os tipos de freqncias conhecidos.

43

Intervalo de Classe ou ClasseClasses so intervalos de variaes da varivel, ou seja, cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da varivel. Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela (valor do ndice i) O nmero de classes de uma distribuio de freqncias ser denotado por k. A notao indica intervalo fechado esquerda. Assim, na Tabela 2, um funcionrio que apresentou salrio de R$ 1400,00 pertence classe 1400 1600, ou terceira classe (i = 3). Existem diversas maneiras de expressar as classes: a) a b compreende todos os valores entre a e b, incluindo a e b b) a b compreende todos os valores entre a e b, excluindo a c) a b compreende todos os valores entre a e b, excluindo b d) a b compreende todos os valores entre a e b, excluindo a e b Em nosso curso usaremos a forma expressa em c).

Limites de ClasseSo os valores extremos de cada classe. O menor valor denomina-se limite inferior da classe i (li) e o maior, limite superior da classe i (Li). Assim, na quarta classe da Tabela 2 tem-se l4 = 1600 e L4 = 1800.

Amplitude do Intervalo de Classe (h)A amplitude do intervalo de classe o comprimento da classe, sendo definida como a diferena entre o limite superior e o limite inferior da classe. hi = Li li Exemplo: Na Tabela 2, temos: h1 = 1200 1000 = 200 h2 = 1400 1200 = 20044

Em geral h1 = h2 = h3 = ... = h fazendo:

k

= h, e determina-se a amplitude do intervalo h= AT k

Exemplo: Dados: AT = 64 e k = 7. Temos: h =

64 = 9,14 10 7

Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior.

Nmero de Classes (k)No existe uma regra fixa que fornea o nmero de classes. No entanto, como o objetivo da distribuio de freqncias facilitar a compreenso dos dados, importante que a distribuio contenha um nmero adequado de classes. Se este nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder ser extrada da tabela. Se por outro lado forem utilizadas vrias classes, haver algumas com freqncias nulas ou muito pequenas e o resultado ser uma distribuio irregular e prejudicial interpretao do fenmeno como um todo. Na prtica esse nmero no deve ser superior a 20 nem inferior a 5. Se a quantidade de dados for pequena no se justifica a construo de uma tabela, e se for grande, mais de 20 classes dificulta a anlise. Em funo do total de observaes existem vrios mtodos que orientam a escolha de um nmero de classes conveniente. Seguem-se os dois mais utilizados:

a) Regra da Raiz Quadradak=5 para n 25 k = n para n > 25, onde n o nmero de observaes. Exemplo: Para n = 30, o nmero de classes ser 30 = 5,48 5.

b) Regra de Sturgesk = 1 + 3,3 log n, onde: n = nmero de observaes. Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30 6.

45

Para n = 30 os resultados obtidos pelos dois critrios so bastante prximos. O mesmo no acontece para valores grandes de n onde a regra de Sturges tem o inconveniente de prever um nmero relativamente pequeno de classes e o procedimento da raiz quadrada, um nmero relativamente grande. Neste caso deve prevalecer o bom senso do analista.

Ponto Mdio da Classe (xi)Considerando que os valores de uma classe esto distribudos uniformemente, o ponto mdio ou valor mdio de uma classe o valor que melhor a representa para efeito de clculo de certas medidas. O ponto mdio de uma classe i definido por: x i = li + L i 2

Uma outra maneira de obter o ponto mdio adicionar a metade da amplitude ao limite inferior da classe. Na Tabela 2, o ponto mdio da classe 1200 x3 = 1400 :

1200 + 1400 200 = 1300 , ou x 3 = 1200 + = 1300 . 2 2

Regras para a elaborao de uma Distribuio de Freqncias por Classesa) Determinar o rol (opcional). b) Determinar a amplitude total (AT) dos dados: AT = valor mximo valor mnimo c) Determinar o nmero conveniente de classes (k), de acordo com um dos critrios citados anteriormente. d) Determinar a amplitude de cada classe (h) dividindo a amplitude total pelo nmero de classes. AT h= k Muitas vezes ao efetuar esta diviso, pode-se chegar a um resultado no muito conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o

46

valor encontrado seja aproximado para o maior inteiro, caso contrrio algum dado excederia o limite superior da ltima classe prevista. e) Determinar os limites das classes, escolhendo-se, preferencialmente, nmeros inteiros. O limite inferior da primeira classe e o limite superior da ltima, no precisam, necessariamente, pertencer ao conjunto. f) Construir a tabela de freqncias, contando o nmero de ocorrncia de cada classe. Exemplo: Os dados a seguir representam as notas de 50 alunos. 33 50 61 69 80 35 52 64 71 81 35 53 65 73 84 39 54 65 73 85 41 55 65 74 85 41 55 66 74 88 42 57 66 76 89 45 59 66 77 91 47 60 67 77 94 48 60 68 78 97

Vamos agrupar estes elementos em uma distribuio de freqncias por classes a) Amplitude Total: AT = 97 33 = 64

b) Nmero de Classes: k =

50 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 7 A T 64 = = 9,14 10 (aproximar para o maior k 7

c) Amplitude das Classes (h): h = inteiro) d) Limites das Classes30 40 50 60 70 80 90 40 50 60 70 80 90 100

Ponto inicial = 30 (o ponto inicial deve ser sempre menor ou igual ao menor valor observado)

Ponto final = 100 (o ponto final deve ser sempre maior que o maior valor observado)

e) Distribuio de Freqncias por Classes

47

Notas de 50 alunosClasses 1 2 3 4 5 6 7 30 40 50 60 70 80 90 Notas |--40 |--50 |--60 |--70 |--80 |--90 |--- 100 Fi 4 6 8 13 9 7 3 50 fi fi(%) 0,08 8 0,12 12 0,16 16 0,26 26 0,18 18 0,14 14 0,06 6 1,00 100 Faci 4 10 18 31 40 47 50 faci faci(%) 0,08 8 0,20 20 0,36 36 0,62 62 0,80 80 0,94 94 1,00 100 xi 35 45 55 65 75 85 95

TotalFONTE: Dados Hipotticos

Interpretao:F3 = 8 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60. f4 = 26% 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive). Fac6 = 47 47 alunos obtiveram notas inferiores a 90. fac5 = 80% 80% dos alunos obtiveram notas inferiores a 80.

Distribuio de Freqncias com Intervalos de Classes DesiguaisExistem casos em que mais adequado agrupar os dados em classes com larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a categoria a que pertencem. Exemplo:

Tabela 5Categoria de Atletas por Idade Fi Classes Idades 1 2 |--- 13 12 2 13 |--- 15 5 3 15 |--- 18 8 4 18 |--- 30 30 5 30 |--- 40 12 6 40 |--- 60 10 7 60 |--- 90 2 79 Total

48

Grficos de uma Distribuio de Freqncias por ClassesHistograma um tipo de grfico apropriado para representar dados agrupados em classes. Consiste de colunas justapostas cujas bases representam as classes e as alturas correspondem s freqncias das classes.

Polgono de FreqnciasTrata-se da representao de uma distribuio de freqncias por classes, atravs de um polgono. O eixo das abcissas constitui a base do polgono. Os vrtices so os pontos (xi,Fi) onde xi o ponto mdio e Fi a freqncia da classe. O fechamento da poligonal com a base feito unindo o primeiro vrtice ao ponto mdio de uma classe anterior primeira, e o ltimo vrtice ao ponto mdio de uma classe posterior ltima. Esse grfico adequado tambm para a representao de freqncias relativas e percentuais.

Polgono de Freqncias Acumuladas ou Ogiva de GaltonUtilizado para representar as freqncias acumuladas. Os vrtices so os pontos (Li, Faci). Pode ser usado tambm para representar as freqncias acumuladas relativas percentuais. O fechamento feito unindo o primeiro vrtice ao limite inferior da primeira classe. Esse grfico ser til para a determinao das medidas separatrizes que sero tratadas posteriormente. Exemplo: Dada a distribuio de freqncias:30 40 50 60 70 80 90

Notas dos alunos da turma PEST Fac Fi Fi Notas |--40 4 4 0,08 |--50 6 10 0,12 |--60 8 18 0,16 |--70 13 31 0,26 |--80 9 40 0,18 |--90 7 47 0,14 |--- 100 3 50 0,06 Total 50 1,00

xi 35 45 55 65 75 85 95

49

Os grficos representativos dessa distribuio so:HISTOGRAMA E POLGONO DE FREQUNCIASFi 13 Polgono de freqncia

9 8 7 6 4 3

30

40

50

60

70

80

90

100

classe

POLGONO DE FREQUNCIAS ACUMULADASFac 50 47 40 31

18 10 4 30 40 50 60 70 80 90 100 classe

EXERCCIOS COMPLEMENTARES1. Os dados a seguir referem-se s notas de 50 alunos:60 71 80 71 94 85 35 61 55 98 33 81 41 78 66 52 50 91 48 66 65 35 55 69 73 77 64 73 85 42 84 74 59 67 65 65 47 53 39 94 74 54 77 60 88 57 68 45 76 89

50

Pede-se: a) A amplitude total da amostra. b) O nmero de classes. c) A amplitude das classes. d) As classes (valor inicial = 30). e) As freqncias absolutas das classes. f) As freqncias relativas. g) Os pontos mdios das classes. h) As freqncias acumuladas das classes. i) O histograma. j) O polgono de freqncias. k) O polgono de freqncias acumuladas. 2. A tabela abaixo apresenta os salrios de 90 funcionrios da UERJ

Salrios dos Funcionrios da UERJClasses1 2 3 4 5

Salrios Mnimos1 3 5 7 9 |--|--|--|--|--3 5 7 9 11

Fi 40 30 10 5 5 90

Total

a) Determine as freqncias simples relativas, as freqncias absolutas acumuladas e as freqncias relativas acumuladas. b) Quantos funcionrios ganham menos de 3 salrios mnimos? c) Quantos ganham mais de salrios mnimos? d) Qual a percentagem de operrios com salrio entre 5 e 7 salrios mnimos? e) Qual a percentagem de operrios com salrio inferior a 7 salrios mnimos? f) Construa o histograma e o polgono de freqncia. 3. Complete a tabela abaixo:i 1 2 3 4 5 6 7 8 Classes 0 |--2 |--4 |--|--8 |--10 |--|--14 |--2 4 6 10 12 13 16 xi 1 5 7 Fi 4 8 27 15 10 Faci 30 72 83 93 fi 0,04 0,18 0,27 0,10 0,07

Total

51

4. A tabela abaixo apresenta uma distribuio de freqncia das reas de 400 lotes:i 1 2 3 4 5 6 7 8 9 reas (m2) 300 |--400 400 |--500 500 |--600 600 |--700 700 |--800 800 |--900 900 |--- 1000 1000 |--- 1100 1100 |--- 1200 N de Lotes 14 46 58 76 68 62 48 22 6

Com referncia a essa tabela determine: a) A amplitude total. b) O limite superior da 5 classe. c) A freqncia acumulada da 4 classe. d) O nmero de lotes cuja rea no atinge 700 m2. e) O nmero de lotes cuja rea superior ou igual a 800 m2. f) A classe do 72 lote. 5. a) b) c) d) e) f) Responda as seguintes questes: O que freqncia simples absoluta de uma classe? O que freqncia simples relativa de uma classe? O que freqncia acumulada absoluta de uma classe? O que freqncia acumulada relativa de uma classe? O que limite inferior de uma classe? O que ponto mdio de uma classe?

6. Os pesos de 40 alunos esto relacionados a seguir: 69 65 60 67 57 76 81 68 72 60 71 53 54 49 67 53 93 74 63 65 68 59 64 58 72 66 53 80 58 83 73 60 64 70 81 63 62 45 50 53

a) Agrupar estes dados em classes de valores (Dado log 40 = 1,6). b) Determine as freqncias relativas, as freqncias acumuladas e as freqncias relativas acumuladas. c) Determine os pontos mdios das classes. d) Interprete todos os resultados da 3 linha da tabela. e) Construa o histograma, o polgono de freqncias e o polgono de freqncias acumuladas da distribuio.

52

7. Os dados abaixo referem-se ao consumo mensal de energia eltrica em kwh da conta n 001.161157-1 da Ligth Rio, no perodo de 1997 a 1999. 142 178 164 190 146 131 119 131 187 158 168 111 96 118 182 116 188 207 229 180 181 175 205 179 184 227 210 210 213 190 240 215 226 188 190 205 a) Sintetizar esses dados atravs de uma distribuio de freqncias por classes. b) Calcular todos os tipos de freqncias que voc conhece. c) Com base nas freqncias calculadas, apresentar os seguintes percentuais: c.1) de meses com consumo inferior a 150 kwh. c.2) de meses com consumo superior a 200 kwh. d) Representar a distribuio elaborada atravs de um histograma e de um polgono de freqncias. e) Representar a distribuio de freqncias acumuladas atravs de uma Ogiva. 8. Dada a amostra: 28 27 31 23 18 33 33 33 29 15 27 31 30 30 16 30 27 32 24 17 31 31 30 28 17 30 28 33 34 18 33 27 27 39 19 30 29 33 30 19 33 31 31 18 20 29 24 33 17 29

a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5). b) Calcule as freqncias absolutas, as freqncias acumuladas e os pontos mdios das classes. c) Interprete todos os resultados da 4 linha da tabela. d) Construa o histograma, o polgono de freqncias e o polgono de freqncias acumuladas da distribuio. 9. Abaixo temos a distribuio dos aluguis de 65 casas.Aluguel (centenas de $) 1,5 |-- 3,5

3,5 |-- 5,5 18

5,5 |-- 7,5 20

7,5 |-- 9,5 10

9,5 |-- 11,5 5

N de casas

12

Com referncia a essa tabela determine: a) A amplitude total. b) O limite superior da 5 classe. c) A freqncia acumulada da 4 classe. d) O nmero de aluguis cujo valor atinge, no mximo, R$ 550,00.53

e) O nmero de aluguis cujo valor superior ou igual a R$ 750,00. f) A classe do 50 aluguel. 10.A distribuio de freqncia abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos.Consumo por nota (R$) n de notas 0 |------ 50 10 50 |------ 100 28 100 |------ 150 12 150 |------ 200 2 200 |------ 250 1 250 |------ 300 1

a) Interprete todos os resultados da 4 linha da tabela. b) Construa o histograma e o polgono de freqncias.

54

MEDIDAS DE POSIO

As medidas de posio so valores que representam o conjunto de dados observados ou ento promovem uma partio sobre este conjunto. Entre as medidas de posio destacam-se as medidas de tendncia central e as separatrizes.

MEDIDAS DE TENDNCIA CENTRALA maneira mais simples de resumirmos as informaes contidas em um conjunto de dados observados estabelecer um ponto central em torno do qual os dados se distribuem. Tais medidas orientam quanto posio do conjunto no eixo dos nmeros reais e possibilitam comparaes de sries de dados entre si pelo confronto destes nmeros. So chamadas Medidas de Tendncia Central, pois representam os fenmenos pelos seus valores mdios em torno dos quais tendem a se concentrar os dados.

2.1.1 MDIA ARITMTICA ( x )a) Mdia aritmtica para dados no agrupados

Sejam x1, x2, ..., xn, n valores da varivel X. A mdia aritmtica simples, denotada por x , definida por:n

xi x=i =1

n

,

onde n o nmero de valores observados da varivel X. Exemplo: Determinar a mdia aritmtica simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0.5

xi x=i =1

5

=

7,0 + 3,0 + 5,5 + 6,5 + 8,0 = 6,0 5

55

b) Mdia aritmtica para dados agrupados

Neste caso, usamos a mdia aritmtica dos valores x1, x2, ..., xk, ponderada pelas suas respectivas freqncias absolutas F1, F2, F3, ... , Fk. Desta forma, temos:k

x i Fi x=k i =1

n

,

onde n = F1 + F2 + ... + Fk =i =1

Fi

Observao: Quando se tratar de uma distribuio de freqncia por classe, xi l + Li corresponde ao ponto mdio da classe, ou seja, x i = i . 2 Exemplos: 1. Determinar a mdia aritmtica da distribuio a seguir.NMERO DE IRMOS DE ALUNOS DA TURMA BIO/GEO i xi Fi 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 TOTAL 20 Fonte: Dados Hipotticos

Soluo: Para determinar a mdia acrescentaremos a coluna com o clculo de xiFiNMERO DE IRMOS DE 20 ALUNOS DA TURMA BIO/GEO i xi Fi XIFI 1 0 4 0 2 1 8 8 3 2 3 6 4 3 3 9 4 5 4 1 6 5 1 5

56

TOTAL Fonte: Dados Hipotticosk 6

20

32

x i Fi x=i =1

x i Fi =i =1

n

20

=

32 = 1,6 20

2. Dada a distribuio:

Renda Familiar de 40 Famlias i Salrios (R$ Fi 1.000) 1 2 |--- 4 5 2 4 |--- 6 10 3 6 |--- 8 14 4 8 |--- 10 8 5 10 |--- 12 3 TOTAL 40 Fonte: Dados HipotticosDeterminar a renda mdia familiar destas 40 famlias. Soluo: Acrescentamos as colunas com os clculos de xi e xiFi ,

Renda Familiar de 40 Famlias i Salrios Fi xi x i Fi (R$ 1.000) 1 2 |--4 5 3 15 2 4 |--6 10 5 50 3 6 |--8 14 7 98 4 8 |--- 10 8 9 72 5 10 |--- 12 3 11 33 TOTAL 40 268 Fonte: Dados Hipotticose utilizamos a frmula:k 5

x i Fi x=i =1

x i Fi =i =1

n

40

=

268 40

=

6,7

Assim, cada famlia possui, mdia, uma renda de de R$6.700,00. Assim, cada famlia possui, emem mdia, uma renda R$6.700,00.57

MEDIANA (Md)A mediana, denotada por Md, o valor que divide o rol em duas partes contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana o valor que ocupa a posio central de uma srie de dados. 50% Md 50%

a) Mediana para dados no agrupadosi) Se n mpar o rol admite apenas um termo central que ocupa a posio O valor do elemento que ocupa esta posio a mediana. n +1 . 2

Exemplo: Determinar a mediana da srie: 20; 12; 23; 20; 8; 12; 2.Rol: 2; 8; 12; 12; 20; 20; 23. n = 7 (n mpar) O rol admite somente um termo central que ocupa a posio posio. Portanto Md = x4 = 12. 7 +1 , ou seja, a 4 2

Interpretao: 50% dos valores da srie so menores ou iguais a 12 e 50% dos valores so maiores ou iguais a 12. ii) Se n par neste caso o rol admite dois termos centrais que ocupam as n n posies e + 1 . 2 2 Neste caso a mediana definida como a mdia aritmtica destes dois termos centrais.

Exemplo: Determinar a mediana da srie: 7; 21; 13; 15; 10; 8; 9; 13.Rol: 7; 8; 9; 10; 13; 13; 15; 21. n = 8 (n par) A srie admite dois termos centrais que ocupam as posies 4 posio e a 5 posio. Portanto, 8 8 e + 1 , ou seja, a 2 2

58

Md =

x 4 + x 5 10 + 13 = = 11,5 . 2 2

Interpretao: 50% dos valores do rol so menores ou iguais a 11,5 e 50% dos valores so maiores ou iguais a 11,5.

b) Mediana para dados agrupados sem intervalos de classesO procedimento para o clculo da mediana para dados agrupados sem intervalos de classes o mesmo utilizado para dados no agrupados, ou seja: n +1 Se n for mpar, a mediana ser o termo central, isto , o termo de ordem . 2 Se n for par, a mediana ser a mdia aritmtica entre os elementos centrais, isto n n , os elementos de ordem e + 1 . 2 2 Exemplo 1: Determinar a mediana da distribuio abaixo. i 1 2 3 4 5 TOTAL n = 23 (n mpar) A distribuio admite apenas um termo central que ocupa a posio seja, a 12 posio. 23 + 1 , ou 2 xi 2 5 8 10 12 Fi 1 4 10 6 2 23 Faci 1 5 15 21 23

Atravs das freqncias acumuladas podemos observar que: o 1 elemento o 2; o 2, o 3, o 4 e o 5 elementos so iguais a 5; o 6, o 7, ... , o 15 elementos so iguais a 8; e assim sucessivamente. Portanto o 12 elemento o 8. Logo, Md = x12 = 8.

59

Exemplo 2: Determinar a mediana da distribuio i 1 2 3 4 5 TOTAL n = 32 (n par). A srie admite dois termos centrais que ocupam as posies o 16 e o 17 elementos. Observando as freqncias acumuladas, temos: O 1, o 2 e o 3 elementos so iguais a 0; O 4, o 5, o 6, o 7 e o 8 so iguais a 1; O 9, o 10, ... , o 16 so iguais a 2; O 17, o 18, ... , o 26 so iguais a 3; O 27, o 28, ..., o 32 so iguais a 5. Portanto o 16 termo igual a 2 e o 17 termo igual a 3. x + x17 2 + 3 Logo, Md = 16 = = 2,5 2 2 32 32 e + 1 , ou seja, 2 2 xi 0 1 2 3 5 Fi 3 5 8 10 6 32 Faci 3 8 16 26 32

c) Mediana para dados agrupados com intervalos de classes Calcula-se n , independente de n ser par ou mpar; 2 Localiza-se, atravs das freqncias acumuladas, a classe mediana, ou seja, a n classe que contm o termo de ordem ; 2 Aplica-se a frmula: n Facant 2 Md = l Md + h, FMd onde: lMd = limite inferior da classe mediana; Facant = freqncia acumulada da classe anterior classe mediana; h = amplitude da classe mediana; FMd = freqncia absoluta da classe mediana.

60

Exemplo 1 Determinar a mediana da distribuio.i 1 2 3 4 5 6 Altura(cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174 Fi 4 9 11 8 5 3 40 Faci 4 13 24 classe mediana 32 37 40

TOTAL

Calcula-se

n 40 = 20 2 2

Localiza-se a classe mediana (a classe que contm o termo de ordem Classe mediana = 3 classe n Facant 2 h Aplica-se a frmula: Md = l Md + FMd

n ) 2

lMd = 158Facant= 13 h=4 FMd = 11 Md = 158 + 20 13 4 = 160,55 11

Interpretao: 50% das pessoas tm altura inferior a 160,55 cm. Exemplo 2 Consideremos a distribuio de freqncia por classes das notas dos 50 alunos da turma PEST e vamos calcular a sua mediana.

Notas de 50 alunos da turma PESTClasses 1 2 3 4 5 6 7 Notas 30 40 50 60 70 80 90 |--|--|--|--|--|--|--40 50 60 70 80 90 100 Fi Faci 4 4 6 10 8 18 13 31 9 40 7 47 3 50 50 ---Fonte: Dados Hipotticos

classe mediana

Total

61

Calcula-se

n 50 = 25 2 2

Localiza-se a classe mediana (a classe que contm o termo de ordem Classe mediana = 4 classe n Facant 2 Aplica-se a frmula: Md = l Md + h FMd

n ) 2

lMd = 60Facant= 18 h = 10 FMd = 13 Inter