$PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh...
Transcript of $PRVWUDJHP &RQMXQWR GH WRGRV RV HOHPHQWRV VREUH … · b7rgrv rv ydoruhv srvvtyhlv gd surgxomr gh...
2. Noções de Amostragem2. Noções de Amostragem
Disciplina: 221171
2. Noções de Amostragem2. Noções de Amostragem
Prof.a Dr.a Simone Daniela Sartorio de Medeiros
DTAiSeR-Ar
1
População (Mundo Real)Amostra
Amostragem
2
Conjunto de todos os elementos sobre os quais se desejam uma informação
(tem uma característica em comum).
Pode ser: Finitas ou Infinitas
A população deve estar bem definida
É todo subconjunto de elementos retirados de uma população.
Seus elementos devem ser representativos da população.
_Todos os valores possíveis da produção de milho da variedade W, em kg por hectare;
Exemplos de amostra:
_ Os rendimentos de milho da variedade W, em kg/ha, de uma amostra de 5 unidades experimentais (canteiros);
Exemplos de população:
3
_ Todos os pesos ao nascer de suínos da raça X, em gramas.
_ Os pesos ao nascer de uma ninhada de suínos da raça X.
Como obter informações Como obter informações
4
destes conjuntos?destes conjuntos?
RecenseamentoRecenseamento:
Quando são coletados dados sobre TODOS os elementos da população.
O censo é sempre o melhor método para obtermos informações úteis?
CensoCenso
Conjunto de dados obtidos pelo recenseamento.
PopulaçãoPopulação
5
Limitações do Censo
IneficazIneficaz: maior possibilidade de erro dada aquantidade de observações/medições;
ImpossívelImpossível: no diagnóstico e monitoramentode populações extremamente dinâmicas;
ImpraticávelImpraticável:: custo e tempo de execução emgeral são excessivos.Alternativa?
Utilizar amostras
Os dados de uma amostra pode ser obtida por:
AmostraAmostra
6
a) Pesquisa de opinião;b) Observação;c) Realização de um experimento; oud) Realizando uma simulação.
Os dados de uma amostra pode ser obtida por:
a) Pesquisa de opinião a) Pesquisa de opinião É o levantamento das opiniões de uma amostra de pessoas, com a finalidade
de conhecer as opiniões da população em geral (opinião pública) sobre determinado assunto, em particular.
Algumas pessoas não falam com estranhos, ou não respondem perguntas por telefone (por exemplo).
Formam o grupo dos não respondentes.
Na interpretação dos dados, é preciso levar em consideração tanto falta de
resposta como erro de resposta.
Portanto, a população efetivamente amostrada é um pouco diferente da população alvo da pesquisa
7
b) Observaçãob) ObservaçãoÉ a observação direta dos fenômenos em
laboratórios ou na natureza.
8
É aplicado um tratamento (ou mais) a uma parte da população e são observadas as respostas.
A outra parte da população é, em geral, usada como um grupo controle. Esse grupo não recebe tratamento algum ou então recebe o placebo.
Após serem observadas as respostas dos dois (ou mais) grupos, os resultadossão comparados.
c) Realizando um experimentoc) Realizando um experimento
são comparados.
9
d) Fazendo uma simulaçãod) Fazendo uma simulação
É o uso de um modelo matemático ou físico para reproduzir as condições calculadas de um situação
ou de um processo. A coleta de dados frequentemente compreende o uso de computadores.
As simulações permitem estudar situações que seria pouco prático ou
Exemplo: Exemplo:
Fabricantes de automóveis usam simulações com bonecos para estudar os efeitos que as colisões
têm em seres humanos;
As simulações permitem estudar situações que seria pouco prático ou até mesmo perigoso criar na vida real, além de frequentemente poupar
tempo e dinheiro.
10
Porque amostrar?Porque amostrar?
11
Porque amostrar?Porque amostrar?
Porque amostrar?Porque amostrar?
a) Algumas populações são muitograndes que só podem ser estudadaspor meio de amostras.
b) Custo e a demora: obter os dados,Censos Informações obsoletas.
Numa pesquisa eleitoral, a 3dias de uma eleição presidencialnão haveria tempo suficientepara pesquisar a população deeleitores do país, mesmo quehouvesse recurso financeiros emabundância.
12
c) É impossível estudar algumas populações.
Uma empresa de fósforo e deseja-setestar a qualidade do produto quefabrica, não pode acender todos osfósforos que fabricou – mas apenasalguns deles.
d) Estudar cuidadosamente umaamostra tem mais valor científico doque estudar rapidamente toda apopulação
É mais fácil realizar operações de pequena escala
e evitando erros, pois um dos problemas típicos nos
grandes censos é o controle dos entrevistados.
Logo, tudo será realizado por meio de uma (ou mais) amostra(s)!!!
...Mas CUIDADO:...Mas CUIDADO:
13
Característica de fácil mensuraçãoCaracterística de fácil mensuraçãoMesmo que a população não seja tão pequena, mas a variável que se querobservar é de tão fácil mensuração, que não compensa investir numplano de amostragem.
Situações em que o uso da Situações em que o uso da amostragem não é interessanteamostragem não é interessante
População pequenaPopulação pequenaSe a população for pequena (50 elementos ou menos) para se ter uma amostra capaz degerar resultados precisos para os parâmetros da população, será necessário umaamostra relativamente grande (em torno de 80% da população).
plano de amostragem.Exemplo: para verificar a porcentagem de funcionários favoráveis à mudança nohorário de um turno de trabalho, pode-se entrevistar toda a população no própriolocal de trabalho.
Desta forma este parâmetro precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.
Necessidade de alta precisãoNecessidade de alta precisãoA cada 10 anos o IBGE realiza um censo demográfico para estudar diversascaracterísticas da população brasileira. Dentre estas características têm-se o parâmetronúmero de habitantes residentes no país, que é fundamental para o planejamento dopaís.
14
Plano de amostragemPlano de amostragemPlano de amostragemPlano de amostragem
15
Plano de AmostragemPlano de Amostragem
É necessário ter bem definidos:
os objetivos da pesquisa, a população a ser amostrada, bem como os parâmetros que precisam ser estimados para atingir os objetivos da pesquisa.
Nesse plano de amostragem deve constar :
a definição da unidade de amostragem, a forma de seleção dos elementos da população; e o tamanho da amostra.
16
AmostragemAmostragem
17
É o processo da escolha criteriosa da amostra, ou seja, dos elementos a serem submetidos ao estudo.
A solução adequadas para problemas de amostragem exige, em geral, muito bom-senso, conhecimento do
fenômeno biológico e experiência.
Compra-se a caixa de morango com os morangos
mais bonitos por cima.
E os debaixo?
A minha opinião sobre como anda a administração da cidade depende dos
lugares onde vou e das ruas por ande passo.
Será que os lugares e ruas que conheço representam todos os lugares/ruas da cidade?
Tendências da amostragemTendências da amostragem
Tendência natural das pessoas é buscar a
informação do modo mais “conveniente” A minha noção da opinião pública
depende das pessoas com que convivo.
Será que os meus conhecidos e amigos representam a população brasileira?
18
A seleção dos elementos que irão compor a amostra pode ser feita de
várias maneiras e irá depender do conhecimento que se tem da
população e da quantidade de recursos disponíveis.
O sucesso da amostragem vai dependerde um planejamento adequado.
19
Métodos de AmostragemMétodos de Amostragem
1) Amostragem probabilística (ou aleatória)Os resultados podem ser projetáveis para a população total
20
Para a escolha do processo de amostragem, o pesquisador deve levar emconta: o tipo de pesquisa, a acessibilidade aos elementos da população, adisponibilidade ou não de ter os elementos da população, a representatividadedesejada ou necessária, a oportunidade apresentada pela ocorrência de fatos oueventos, a disponibilidade de tempo, recursos financeiros e humanos etc.
2) Amostragem não probabilística (ou não aleatória)Os resultados não podem ser generalizados.
Amostras obtidas através de algum tipo de sorteio;
Permitem a utilização das técnicas clássicas de inferência estatística
1)1) Amostragem ProbabilísticaAmostragem Probabilísticacada elemento da população tem uma chance conhecida e diferente de zero de ser
selecionado para compor a amostra.
As amostragens probabilísticas geram amostras probabilísticas.
Fornecendo maior segurança ao generalizar
resultados da amostra para a população.
O processo aleatório de seleção das unidades elimina qualquer
interferência de escolha humana na escolha dos elementos da amostra.
O “sorteio” pode ser obtido:a) Manualmente;b) Por meio de tabelas de números aleatórios, ouc) Usando o computador (Excel, ou software R). 21
Em uma urna coloca-se 10 bolas de mesmo tamanho, peso, superfície, etc(elementos homogêneos)
contendo os números: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
Antes de cada sorteio, os números são “misturados” na urna.
Ao sortear um número ele pode:
a) Obtendo uma amostra aleatória manualmentea) Obtendo uma amostra aleatória manualmente
2
6
8
9
3
7
1
5
4
Ao sortear um número ele pode:
Retornar à urna Amostragem com reposiçãoAmostragem com reposição
Qualquer elemento tem exatamente a mesma chance de ser obtido.
0
Ficar separado Amostragem sem reposiçãoAmostragem sem reposição
22
b) Tabelas de números aleatóriosb) Tabelas de números aleatórios
23
set.seed(2081) # sementeN = 10 # N = tamanho da populaçãovalores<- factor(1:N); valores # Ordem padrão
r<- runif(N) # gerando uma dist. U[0,1] de tamanho Nsorteio1<- order(r) # sorteio 1
c) Obtendo uma amostra aleatória usando o computadorc) Obtendo uma amostra aleatória usando o computador
No Excel
No software R:
Função: =ALEATORIOENTRE(inferior; superior)
sorteio1<- order(r) # sorteio 1cbind(r,sorteio1) # concatenando os vetores
# Selecionar uma amostra de tamanho n=4amostra1<- sorteio1[1:4]; amostra1
24
c) Obtendo uma amostra aleatória usando o computadorc) Obtendo uma amostra aleatória usando o computador
No Excel
No software R:
Função: =ALEATORIOENTRE(inferior; superior)
Com
repo
siçã
o
set.seed(2081) # sementeN = 10 # N = tamanho da populaçãovalores<- factor(1:N); valores # Ordem padrão[1] 1 2 3 4 5 6 7 8 9 10Levels: 1 2 3 4 5 6 7 8 9 10r<- runif(N) # gerando uma dist. U[0,1] de tamanho N
25
Sem
repo
siçã
o
r<- runif(N) # gerando uma dist. U[0,1] de tamanho Nsorteio1<- order(r) # sorteio 1cbind(r,sorteio1) # concatenando os vetores
r sorteio1[1,] 0.81187589 10[2,] 0.46084606 9[3,] 0.87486624 6[4,] 0.28889513 4[5,] 0.89431621 2[6,] 0.27789351 1[7,] 0.98824797 8[8,] 0.85706378 3[9,] 0.12791121 5[10,] 0.07989472 7# Selecionar uma amostra de tamanho n=4amostra1<- sorteio1[1:4]; amostra1[1] 10 9 6 4
Podem levar a resultados úteis;
Não se prestam à utilização de processos estatísticos inferenciais;
Inacessibilidade a toda a população.
Observa-se as unidade mais acessíveis (“conveniente”) da população.
2) Amostragem Não Probabilística2) Amostragem Não Probabilística
São realizadas pela simplicidade ou por impossibilidade de se obter amostras probabilísticas.
Observa-se as unidade mais acessíveis (“conveniente”) da população.
Amostragem de conveniência é
sempre ENVIESADA, isto é,
possui VIÉS
As unidades “inconvenientes” de serem observadas
jamais serão amostradas.
Não importa quão grande seja a amostra, a
amostragem de conveniência nunca será totalmente
representativa da população.
26
Amostragem probabilísticaAmostragem probabilísticaOs métodos mais comuns são:
a) Amostragem Aleatória Simples (AAS)
b) Amostragem Aleatória Estratificada (AAE)
c) Amostragem Sistemática (AS)
d) Amostragem por Conglomerado (AC)
27
Exemplo 1Exemplo 1
Deseja-se selecionar uma amostra de 5 alunos a partir de uma classe de 50 alunos.
a) Como podemos selecionar esta amostra?
b) Qual amostragem seria mais indicada? Porque?
c) Descreva todo o procedimento.
28
c) Descreva todo o procedimento.
A técnica exige que a população seja HOMOGÊNEA, isto é, seja constituída por unidades similares, sob o ponto de vista da variável em estudo.
É o equivalente a um sorteio lotérico.
TODOS os elementos da população têm igual chance (probabilidade) de
É a mais simples e talvez o mais importante em estatística.
1) Amostragem Aleatória Simples (AAS)1) Amostragem Aleatória Simples (AAS)
TODOS os elementos da população têm igual chance (probabilidade) de pertencer a amostra.
29
Uma amostra de um dado tamanho tem a mesma chance de ser
selecionada que qualquer outra amostra possível de mesmo tamanho.
Amostras de diferentestamanhos podem ter chances
diferentes.
Procedimento para a obtenção de uma amostra aleatória simplesde tamanho n
1) Enumerar os N elementos da população de 1 a N.
2) Sortear, sem preposição, n números compreendidos de 1 a N.
3) Os elementos correspondentes aos números escolhidos formarão a amostra.
30
Exemplo 2:Exemplo 2:O esquema abaixo representa uma pequena área com
laranjeiras de 3 diferentes variedades.Deseja-se estimar o número total de frutos dessa área
observando-se apenas 10 laranjeiras.
Como você realizaria a amostragem?Você recomendaria o uso da amostragem aleatória simples? Por que?
# # # # # # # # # # # #
Legenda Variedade# AX B* C
# # # # # # # # # # # #
# # # # # # # # # # # #
# # # # # # # # # # #
* * * * * X X X X X X X
* * * * * X X X X X X X
* * * * * X X X X X X X
* * * * X X X X X X
OBS: a população é HETEROGÊNEA 31
2) Amostragem Aleatória Estratificada (AAE)2) Amostragem Aleatória Estratificada (AAE)
A população é subdividida em grupos mutuamente exclusivos(subpopulações) chamados estratos que compartilham uma característicasimilar: idade, etnicidade, renda, bairro, sexo, variedade, etc.
Uma AAS é tomada dentro de cada estrato, e as estimativas dos estratos sãocombinadas numa única amostra:
menor variabilidade entre amostras da população; menor variabilidade entre amostras da população;
maior precisão na amostragem.
A variável de interesse apresenta comportamento homogêneo dentro dosestratos e heterogêneo entre os estratos.
Se os estratos forem internamentemais homogêneos que a população
em termos da variável que foi medida
a AAE será mais precisa que a AAS
32
Resolução do exemplo 2Resolução do exemplo 2:
Legenda Variedade Ni# A 35X B 27* C 19N 81
Temos k = 3 estratos.
# # # # # # # # # # # #
# # # # # # # # # # # #
# # # # # # # # # # #
* * * * * X X X X X X X
* * * * * X X X X X X X
* * * * * X X X X X X X
Sabendo que n = 10.
Calcule n1, n2 e n3.
* * * * X X X X X X
33
Procedimento para a obtenção de uma amostra estratificada proporcional de tamanho n
Considerando:
N o número de elementos da população;
k o número de estratos;
Ni o número de elementos do estrato i (OBS: N = N1 + N2 + ... + Nk)
n o tamanho da amostra a ser selecionada.
Calcule a fração da amostragem dada por : f = nN
Calcular o número de elementos a serem sorteados em cada estrato:n1 N1 f n2 N2 f n3 N3 f ... nk Nk f
comn = n1 + n2 + n3 + ... + nk
34
Existem diversas formas de se alocar (partilhar) a amostra nos diversos estratos k. Dentre elas podemos citar:
fNN
nNn hhh
2.1.) Partilha proporcional:
, h = 1, ..., k
2.3.) Partilha ótima(ou alocação de Neyman)
, h = 1, ..., knN
Nn
h
k
hh
hhh
1
2.2.) Partilha igual (ou Partilha uniforme):
, h = 1, ..., kk
nnh
Só é recomendada quando os estratos populacionais forem
uniformes e de mesmo tamanho.
É uma partilha de n unidade para os k estratos que resulta numa média (estimada) com
variância mínima.
h1
35
Exemplo 3Exemplo 3::
Uma loja de materiais de construção deseja conhecer o perfil dos seus compradores. Imagine que esta tem 1000 cadastros arquivados e tem
condições para entrevistar 200 dos mesmos.
ASD BTD CHS DOF EVT FDY GDA HYJ IYF IE JA JSG KDE
KSJ LJE LH LS LZD MN MO NEG NH OM PIS QAG RVA
RP ...
Como você faria a amostragem?
36
3) Amostragem Sistemática (AS)3) Amostragem Sistemática (AS)
Quando os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente.
Para uma amostra sistemática de “1-em-cada-k-unidades”, você primeiro seleciona aleatoriamente uma das k primeiras unidades. A partir da unidade selecionada toma-se sempre a k-ésima unidade.partir da unidade selecionada toma-se sempre a k-ésima unidade.
OBS: Somente a primeira unidade é selecionada aleatoriamente, todas as demais são tomadas
sistematicamente.
37
Procedimento para a obtenção de uma amostra sistemática(1 em cada k elementos)
Definir a porcentagem p de elementos da população que farão parteda amostra. OBS: p = número entre [0,1];
Obter o valor de k, inteiro, dado por:
k 1 p
Sortear um número r inteiro entre 1 e k;
A amostra será composta pelos elementos de ordem
r, r + k, r+2k, r+3k, ...
38
Amostragem não Amostragem não probabilísticaprobabilística
a) Amostragem por conveniência
b) Amostragem por julgamento
c) Amostragem por quotas
39
Amostragem Não ProbabilísticaAmostragem Não ProbabilísticaÉ aquela em que a seleção dos elementos da população para compor a amostra
depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo.
AmostragemAmostragem não probabilísticanão probabilística
Amostra por conveniênciaO pesquisador seleciona membros dapopulação mais acessíveis.
40
população mais acessíveis.
Amostra por julgamento
O pesquisador usa o seu julgamentopara selecionar os membros dapopulação que são boas fontes deinformação precisa.
Amostra por quotaO pesquisador entrevista um númeropredefinido de pessoas em cada umadas várias categorias.
Exemplo 1: Exemplo 1:
Imagine que a população de uma cidade é composta, de acordo com o Censo, por 4/8 de jovens, 3/8 de adultos e 1/8 de idosos, descontadas
as crianças.
Você sai às ruas da cidade com a incumbência de entrevistar 800 pessoas selecionadas segundo a técnica de amostragem por quotas.
Descreva como será composta sua amostra?Descreva como será composta sua amostra?
Para compor sua amostra, deve entrevistar :
_4/8 de jovens, ou seja, 400,
_3/8 de adultos, ou seja, 300, e
_1/8 de idosos, ou seja, 100, à sua escolha.
Você completa assim a sua amostra, composta por quotas de faixas etárias iguais às da população.
41
Solução:
Qual o tamanho da Qual o tamanho da Amostra?Amostra?
42
A amostra demasiadamente pequena, mesmo sendo estudo de caso, são inúteis porque, em geral, não fornecem boas estimativas. Logo, não permite fazer inferências estatísticas.
A amostra deve ter o tamanho usual da área em que a pesquisa se enquadra.
O tamanho da amostraO tamanho da amostra
Por outro lado, desconfie de amostras grandes. Será que opesquisador observou cada unidade amostrada com o devido cuidado?Amostras grandes, porém malfeitas, são piores, porque dão a ilusão deconter uma verdade que não contêm.
Também é preciso verificar se a amostra foi retirada da população usando técnica estatística consagrada e
delineada segundo critérios estatísticos. Se isso não for feito, a amostra pode ser tendenciosa.
43
Como determinar o tamanho da amostra?Como determinar o tamanho da amostra?
Na prática, o tamanho da amostra é determinado mais por considerações reais ou imaginárias a respeito do custo de cada unidade amostrada do
que por técnicas estatísticas.
Temos duas regras:
Veja o que se faz na sua área consultando trabalhos similares (ouseja, consultando a literatura) e verifique o que seu orçamento permiteseja, consultando a literatura) e verifique o que seu orçamento permitefazer. Se seu orçamento for curto, não tente enquadrar nele uma pesquisaambiciosa.
De qualquer forma, o tamanho da amostra pode ser determinadopor critérios estatísticos. As fórmulas de cálculo são bem conhecidas,mas esses cálculos exigem conhecimentos maiores.
44
Portanto, vai ficar para depois!!!
O que iremos fazer com O que iremos fazer com a amostra?a amostra?
45
Aluno Horas de Estudo
1 1
2 3
3 4
4 2
ObserveObserve
Suponhamos que a nossa população seja apenas um grupo de 5 alunos de estatística e a variável de interesse seja o número de horas por semana dedicadas
ao estudo da disciplina.
a) Calcule o tempo médio dedicado à disciplina nesta população (parâmetro);
b) Tomemos uma amostra de tamanho 2 desta população, qual o valor da estatística se:
_ Os alunos 1 e 4 forem selecionados?
_ Os alunos 2 e 3 forem selecionados?
_ Os alunos 1 e 5 forem selecionados?
4 2
5 5
O valor do parâmetro e da estimativa são sempre iguais?
população, qual o valor da estatística se:
Não existe garantia de que a estatística tenha valor igual, ou mesmo próximo, do valor do parâmetro que se pretende
estimar.
No entanto, se a amostra for suficientemente grande e obtida de acordo
com a técnica correta, na maioria das vezes isso ocorrerá. 46
Mundo Real (população) Amostra
EstimativaÉ uma descrição numérica Parâmetro
Amostragem
É uma descrição numérica de uma característica de interesse (variável) em
relação a amostra.
Parâmetro
É a descrição numérica de uma característica de interesse (variável) da
população..
Valor variável e conhecido(depende da amostra obtida)
47
(Valor fixo e desconhecido)
A fórmula para obter esta estimativa (valor) é denominada de estimador.
ObservaçõesObservaçõesObservaçõesObservações
48
Parâmetro, estatística e estimativaParâmetro, estatística e estimativa
“Não é preciso comer todo o boi para saber se a carne está macia”.
Para “ter idéia” do valor do parâmetro, ou seja, para estimá-lo, basta que o pesquisador obtenha uma amostra.
“Não é preciso comer toda sopa para saber se está boa de sal”.
49
Tendência, viés, vício, ou erro amostral é a diferença entre a estimativa que se obteve na amostra e o parâmetro que se quer estimar.
Por exemplo:
Teoricamente:
amostralerro ˆ
Dessa forma, muitos cuidados são necessários, pois erros de amostragem podem ser sérios!!!
Uma amostra tendenciosa não fornece estimativa minimamente razoável do parâmetro que se deseja estimar.
amostralerro
Logo, TODO levantamento por amostragem tem um grau de incerteza (erro
amostral)
O erro amostral pode ser um valor negativo ou positivo, pequeno, nulo ou grande.
A estimativa será precisa se tivermos alto grau de confiança de que o erro amostra associado à
estimativa em questão é pequeno.
50
Logo, para interpretar bem os dados e tirar conclusões adequadas, não basta olhar os números:
é preciso entender como a amostra foi tomada; e
verificar se não incidiram, no processo de amostragem, alguns fatores que poderiam trazer certa tendência aos dados.
A precisão e a confiança são dois conceitos-chaves nesse estudo:A precisão e a confiança são dois conceitos-chaves nesse estudo:
A precisão, pode ser entendida como a diferença máxima entre a estatística e o parâmetro que o pesquisador deseja considerar no
seu estudo.
A confiança, pode ser entendida como a chance que o pesquisador tem de que a diferença máxima desejada não seja superada.
51
PrecisãoPrecisão
Capacidade dos sistemas de amostragem de gerar Estatísticas com pequena variabilidade entre amostras (de mesmo tamanho) tomadas
numa mesma população.
Qual o sistema de amostragem ideal?Qual o sistema de amostragem ideal?
X
Sem viésSem viésSem precisãoSem precisão
Com viésCom precisão
Sem viésCom precisão
XX
X
X XX
X XXXXXXX
XXXX
XXXX
Para um mesmo tamanho de amostra, sistemas diferentes de amostragem podem resultar em precisão diferente.
52