Post on 16-Jan-2016
description
CURSO DE COMUNICAÇÃO SOCIAL PUBLICIDADE E PROPAGANDA
PP029 ESTATÍSTICA APLICADA À COMUNICAÇÃO
Prof. Sérgio Duarte
Conteúdo como cortesia aos estudantes
www.professorsergioduarte.com
Avaliações
• A1: Prova (7,0) e trabalho de APS (3,0).
• A2: Prova (5,0) e trabalho de APS (5,0)
• A3: Prova (10,0)
Origem da Estatística
Mesmo na Bíblia , várias passagens insinuavam o uso da estatística como o pedido feito a Moisés de realizar um mapeamento de quantos homens estariam aptos para a guerra.
Origem da Estatística
Por várias vezes no período Clássico e Medieval , os censos eram fonte para informação para auxiliar a coleta de impostos.
Cabe lembrar que a palavra censo , provém do latim “Censere” que significa “taxar”.
Definição de Estatística
O Termo estatística vem da palavra também latina “Status” , que corresponde a informações e descrições que seriam úteis para o estado. É desde então uma ferramenta administrativa utilizada para várias áreas como : recursos humanos, finanças, logística, produção e marketing
Logo Estatística é a ciência que estuda quantitativamente os fenômenos naturais ou sociais, cuja avaliação está baseada em métodos científicos de coleta, organização, apresentação e análise de dados.
Irwin/McGraw-Hill © The McGraw-Hill Companies, Inc., 1998
Slide
5-1
Table
5.1
Questões sobre mercados
Que tipos de pessoas compram nossos produtos?
A demanda por nossos produtos está aumentando ou diminuindo?
Os canais de distribuição de nossos produtos precisam ser alterados?
Compradores Demanda Canais
Questões sobre o Composto de Marketing
Produto Preço Distribuição Promoção
Que projeto de produto tem maior probabilidade de conseguir sucesso?
Que preço devemos cobrar por nossos novos produtos?
Onde e por quem nossos produtos devem ser vendidos?
Quanto devemos investir em promoção?
Questões sobre desempenho
Como o público percebe nossa organização?
Participação de mercado Satisfação dos clientes Reputação
Os clientes estão satisfeitos com os nossos produtos?
Qual é a nossa
participação no
mercado total?
Estudo da Estatística
Estatística Descritiva, que se preocupa com a organização e descrição dos dados experimentais;
Estatística Indutiva (Estatística Inferencial), que cuida da sua
análise e interpretação, ou seja, tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.
Estatística Probabilística – representa o estudo de planejar
jogadas ou estratégias de jogos de azar , bem como o risco e o acaso em eventos futuros.
Exercício
Leia o texto Estatísticas na Mídia, na Publicidade e em Estudos.
• Responda: Qual é o tipo de estatística que trata o autor ?
Informações de acesso ao texto disponível em www.professorsergioduarte.com
População e Amostra
• População - Conjunto de todos os elementos que possuem pelo menos uma característica em comum.
• Amostra - Subconjunto representativo da população
População
É a coleção completa de todos os elementos (escores, pessoas, medidas e outros) a serem estudados inclui todos os sujeitos a serem estudados
Amostra
Um subconjunto de uma população, com tamanho finito, onde todos os seus elementos serão examinados no estudo estatístico desejado.
População
Amostra
Definições Básicas
Amostragem
O processo de escolha de uma amostra da população
Censo conjunto dos dados obtidos de todos os membros da população
População
Amostra
Definições Básicas
Tamanho da Amostra
O tamanho da amostra é um função da confiabilidade desejada, do custo e do tempo necessário para o levantamento de dados ou experimentos.
Variabilidade
É o fato de que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado sempre.
Definições Básicas
Leia os textos e depois responda
Calçados esportivos devem movimentar cerca de R$12 bilhões em 2013 27/02/2013
Classe B é a que apresenta maior potencial de consumo.
Sudeste deve ser responsável por 52,4% do consumo de calçados esportivos.
Em 2013, o setor de calçados esportivos segue em ritmo de crescimento, com perspectiva de movimentar cerca de R$12,3 bilhões em vendas. De acordo com os dados do Pyxis Consumo, do IBOPE Inteligência, as classes B e C serão responsáveis por 43,5% e 40,6% dos gastos do setor durante o ano.
Segundo a projeção, a região Sudeste deverá liderar o consumo, com gastos em torno dos R$6,4 bilhões, o que equivale a 52,4% do potencial do setor. Em seguida aparecem as regiões Sul (18%), Nordeste (15,6%), Centro-Oeste (8,4%) e Norte (5,3%).
Em 2012, a projeção de gastos para o setor foi de aproximadamente R$11 bilhões, valor que em 2010 era estimado em R$9,7 bilhões.
Fonte: http://www.ibope.com.br
Censo 2010: mulheres são mais instruídas que homens e ampliam nível de ocupação
O Censo 2010 mostrou que, em dez anos, o nível de instrução das mulheres continuou mais elevado que o dos homens e elas ganharam mais espaço no mercado de trabalho.
O nível de ocupação (percentual de pessoas ocupadas na semana de referência no total da população do grupo considerado) das mulheres de 10 anos ou mais de idade passou de 35,4% para 43,9% de 2000 para 2010, enquanto o dos homens foi de 61,1% para 63,3%.
Na faixa etária de 25 anos ou mais, o percentual de homens com pelo menos o nível superior de graduação completo foi de 9,9%, e das mulheres, de 12,5%; percentuais que passavam para 11,5% e 19,2%, respectivamente, entre os ocupados.
E a taxa de abandono escolar precoce (proporção de jovens entre 18 e 24 anos de idade que não haviam completado o ensino médio e não estavam estudando), que caiu de 48,0% para 36,5% de 2000 para 2010, era maior entre os homens (41,1%) que entre as mulheres (31,9%). De uma forma geral, o Censo 2010 constatou que as taxas de escolarização e o nível de instrução cresciam com o aumento do rendimento mensal domiciliar per capita.
Continua
Fonte: www.censo2010.ibge.gov.br
Responda
• Qual a diferença entre os dois tipos de pesquisa ?
• Quais são os tipos de população no primeiro e no segundo texto?
• Defina as características das amostras. No segundon texto há algum tipo de amostra?
Dados Primários
Vantagens
• Atualizados • Diretamente relacionados com a pesquisa
Desvantagens
• Mais Caro • Exige mais tempo para a coleta dos dados
Tipos
• Observação • Levantamento • Experimental
Vantagens
• Mais barato • Método que exige menos tempo
Desvantagens
• Pode estar desatualizado • Os dados podem ser irrelevantes
Tipos
• Interno • Externo
Dados Secundários
Fontes de dados secundários Fontes de dados
Dados primários
Dados secundários
Registros internos
Fontes externas
Internet
Fontes padronizadas de dados de Mkt.
Dados publicados
Eletrônicos
Impressos
Governo Ass. Com. Periódicos
Livros Jornais
etc.
Auditorias, medição de índices de audiência de tv, painéis de consumidores,
serviços de multimídia, warehouse, etc.
Discutir os usos, benefícios e limitações dos dados secundários
• Usos: às vezes são suficientes; fonte de idéias; pré-requisito para coleta de dados primários; benchmark para coleta de dados primários; referência de comparação
• Benefícios: economia; viabilidade; muitas vezes, maior precisão.
• Limitações: dificuldades temporais; dúvidas sobre como foram coletados; defasagem
Benefícios e limitações dos dados secundários
• Benefícios
• baixo custo
• menos esforço
• menos tempo
• maior precisão (às vezes)
• única possibilidade
• etc.
• Limitações
• coletados para outros propósitos
• controle sobre a coleta
• podem não ser muito precisos
• formato
• etc.
Frequências
DADOS BRUTOS
Normalmente, na prática, os dados originais de uma série estatística não se encontram prontos para análise, pois estarem desorganizados. Por essa razão, costuma-se chamá-los de dados brutos.
ROL
É a lista ordenada dos dados de uma série estatística. Essa ordenação pode ser crescente ou decrescente.
Frequências ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜENCIAS X max maior valor observado da variável de freqüências. X min menor valor observado da variável de freqüências AMPLITUDE (A) é a diferença entre o maior e menor valor
observado da variável. A = X - X máx mín
Exercício Uma Pesquisa de Mercado pontuou a nota dada
de 0 a 10 ao desempenho de um determinado prefeito de uma região
0 – 2 – 3 – 7 – 10 – 4 - 8 – 9 - 1 – 8 – 10 –
8 – 9 – 6 – 7 – 8 – 7 - 2 – 9 - 8 – 8 – 10 –
8 - 7 – 10
Elaborar a Tabela de Frequências
Frequências
LIMITES DE CLASSE os limites de uma classe são os valores extremos. O limite mínimo de uma classe é denominado Limite Inferior e o limite máximo de Limite Superior.
INTERVALO DE CLASSE (h) é a diferença entre o limite
superior e o limite inferior da classe. h = A / n (quantidade de classes) PONTO MÉDIO DE CLASSE (Xi) o ponto médio de uma
classe é o valor representativo da classe. Para se obter o ponto médio de uma classe, basta somar os limites superior e inferior da classe e dividir por 2.
Distribuição deFrequências
FREQÜÊNCIA RELATIVA - fri • É obtida pela divisão da freqüência simples da classe pelo número total
dos elementos. • fri = fi / n FREQÜÊNCIA ACUMULADA - Fi : • Resulta da soma da freqüência simples da classe com as freqüências
simples das classes antecedentes. • Fi = f1 + f2+ f3 + ... + fi FREQÜÊNCIA ACUMULADA RELATIVA - Fri: • É obtida pela divisão da freqüência acumulada da classe pelo número total
dos elementos. • Fri = Fi / n
Roteiro para elaboração de Tabela de Frequência
1- Transformar os dados brutos em ROL.
2- Encontrar a amplitude total dos dados.
3 -Determinar o número de classes, de acordo com o total de observações. n = qtd. observações
4 - Dividir a amplitude total da série pelo número de classes escolhido.
5- Determinar os limites das classes, escolhendo-se, preferencialmente, números inteiros
REPRESENTAÇÃO GRÁFICA DE DADOS ESTATÍSTICOS
Os gráficos encontram-se presentes em quase todos os meios de divulgação de informação, como jornais e revistas, nos manuais escolares, nas apresentações públicas e até os nossos relatórios individuais já não passam sem eles.
Tipos de gráficos Gráfico de barras simples (verticais ou horizontais)
Num gráfico de barras, as frequências podem ser indistintamente
representadas no eixo das abscissas ou das ordenadas, ou seja, as barras podem ser horizontais ou verticais.
Gráfico de linhas O gráfico de linhas é indicado para mostrar tendências e evolução de
uma variável contínua por outra variável contínua.
Num gráfico de linhas, ao contrário dos gráficos de barras, as séries podem ser longas. O objetivo nestes gráficos é comparar os declives das curvas de forma a responder as perguntas: em que períodos a variação foi significativa? Quantos foram os pontos de inflexão?
Gráficos de setores Os gráficos de setores exibem as partes do todo como se
fatias de um bolo se tratassem; a isso se deve a denominação inglesa “pie chart” traduzida em português para torta ou pizza.
Histograma
O Histograma é o tipo de gráfico mais amplamente utilizado, é constituído desenhando-se barras, cujas bases são determinadas pelos intervalos de classe e cujas alturas são determinadas pelas correspondentes frequências de classe.
Variáveis
• Qualitativa – quando seus valores são expressos por atributos. Exemplo : Sexo , Cor da Pele.
• Quantitativa – quando seus valores são expressos por números. Exemplo : altura, numero de alunos de um colégio.
Variáveis Qualitativas
• Discretas – variáveis que só podem assumir valores pertencentes a um conjunto enumerável. Exemplo : numero de alunos de uma escola.
• Contínuas – quando uma variável pode assumir qualquer valor entre dois limites. Exemplo : Peso de um adulto pode ser de 70 Kg ou 70,1 Kg ou 79,13 Kg ou 70,134 Kg.
Amostragem Não Probabilística
• Acidental ou de conveniência – indicada para assuntos exploratórios.
• Intencional – Escolhe-se um grupo específico.
• Quotas ou proporcional – É necessário o conhecimento prévio da população.
Amostragem Probabilística
• Aleatória Simples – é utilizada uma tabela de números aleatórios.
• Aleatória Estratificada – Estratifica cada subconjunto através de critérios.
• Conglomerado – Por sorteio é indicado um conjunto.
Exercícios Considere uma faculdade com 2.000 estudantes dos quais
1.200 estudam Administração e 800 estudam Publicidade. Considerando que 40% dos alunos de Administração e 30% dos alunos de Publicidade possuem bolsas de estudo, responda:
a) Quantidade de estudantes de Administração que possuem bolsas de estudo.
b) Quantidade de estudantes de Publicidade que não possuem bolsas de estudo.
c) Dentre os bolsistas, qual o percentual de alunos de Administração ?
d) Dentre os não bolsistas , qual o percentual de alunos de Publicidade?
Amostragem
Zentgraf (2007) aponta que os métodos de amostragem podem apresentar alguns problemas em sua aplicação quando :
• Quando a população foi muito pequena
• Quando os dados da população apresentarem volatilidade alta
• Casos de necessidade de previsão absoluta
• Dados da população já estiverem disponíveis
• Em uma pesquisa, buscamos uma amostra que seja representativa da população analisada. Porém, uma média amostral quase nunca será a mesma de uma média populacional, bem como o desvio-padrão. Esse erro amostral existe independente da forma ou critérios de como uma determinada pesquisa foi elaborada.
Exemplo : Considere que ao analisar 10.000 notas de Estatística do nosso EAD , verificamos uma nota média de 6 , com desvio-padrão de 1,2. Porém ao retirar uma amostra de 50 alunos verificamos uma nota média e desvio-padrão diferentes do que o mensurado pela população.
Se repetirmos essa amostragem por 100 vezes , teremos diferentes médias e desvios-padrões para cada amostra coletada. Podemos chegar desta forma a uma distribuição amostral de médias. A distribuição amostral de médias , de acordo com Levin & Fox (2004) possuem algumas características :
• “A medida que o tamanho das amostras cresce, as médias dessas amostram vão se aproximando a uma distribuição limite que é a distribuição normal.Este é o teorema do Limite Central.
• A média de uma distribuição amostral de médias ( média das médias ) é igual a uma verdadeira média populacional.
• O desvio-padrão de uma distribuição amostral de médias é menor do que a da população.”
• Na prática , uma pesquisa dificilmente é realizada com mais de uma ou duas amostras. Seria difícil, desta forma, chegar a chamada média das médias. O erro padrão da média é calculada pela divisão do desvio-padrão da população pela raiz quadrada do tamanho da amostra.
s x = s / √ n
Vamos utilizar como exemplo um exercício:
O valor médio em dólar das vendas de um determinado produto no último ano é conhecida como seguindo a distribuição normal com média de R$ 3.400,00 por revendedor a varejo com desvio-padrão de R$ 200,00. Se um grande número de revendedores comercializar o produto, determine o erro padrão da média para uma amostra de tamanho n=25
s x = s / √ n = 200 /√ 25 = 200 / 5 = 40
Porém em casos de uma nova amostragem seja feita numa população finita sem reposição, os resultados novamente se distorceriam.
As média e desvio-padrão da população sem a amostra retirada se alteraria. Para isso é necessário que possamos ter um fator de correção para populações finitas , sendo : √ (N – n) / (N – 1)
N = tamanho da população.
n = tamanho da amostra.
• Considere que a média de uma população seja de 50 e o desvio-padrão de 12. Considere também um tamanho da amostra de 36 escolhida de uma população de 100. O valor esperado e o erro padrão da distribuição da amostragem da média é de :
Calculando o Erro Padrão da Distribuição temos :
s x = s / √ n
s x = s / √ n = 12 /√ 36 = 12 / 6 = 2
Calculando o Fator de Correção temos :
√ (N – n) / (N – 1) = √ (100 – 36) / (100 – 1) = 0,80
Após isso multiplicamos o fator de correção pelo erro padrão da distribuição : 2 x 0,8 = 1,60
Sabe-se que a vida útil de uma lâmpada é de 625 horas , com desvio padrão de 25. Determine o valor esperado e o erro da distribuição de amostragem da média, dado tamanho da amostra de 16.
a) 625 e 16
b) 125 e 6,25
c) 125 e 4
d) 625 e 4
e) 625 e 6,25
Medidas de Posição
MÉDIA ARITMÉTICA SIMPLES a média aritmética, ou média, de um conjunto
de N números X1, X2, ...., Xn é definido por: _ X = X1 + X2 + ....... + Xn / n EXEMPLO : {1, 1, 3, 4, 4} X = 1 + 1+ 3 + 4 + 4 = 13 = 2,6
MÉDIA PONDERADA Se os valores X1, X2, ...., Xn
ocorrerem com freqüências f1, f2, ....., fn, então: _ X = X1 f1 + X2 f2 + ..... + Xn fn = Xi fi ----------------------------------------- ---------- f1 + f2 + ..... + fn fi
Medidas de Posição
• MODA Pode-se definir como moda o valor mas freqüente, quando
comparada sua freqüência com a dos valores contíguos de um conjunto ordenado. A moda pode não existir e, mesmo que exista, pode não ser única.
EXEMPLOS : X = 4, 5, 5, 6, 6, 6, 7, 7, 8, 8 moda = 6 – valor mais freqüente – unimodal Y = 2, 3, 4, 5, 6 não tem moda – amodal Z = 2, 4, 4, 4, 6, 7, 8, 8, 8, 9 tem duas modas 4 e 8 – bimodal
MODA FÓRMULA PARA DADOS AGRUPADOS: Mo =( l * + L * ) / 2 Ou Mo = l* + h ( D1 / D1 + D2) Sendo: l* Limite Inferior da Classe Modal. L* Limite Inferior da Classe Modal. h intervalo de classe. D1 Frequencia Simples – Frequencia Anterior. D2 Frequencia Simples – Frequencia Posterior
Mediana FÓRMULA PARA DADOS AGRUPADOS: Md = l* + h ( Xm – F(Ant) / f*) Sendo: l* Limite Inferior da Classe Mediana. f* frequencia simples da classe mediana. h intervalo de classe. Xm Valor Mediano.
Exercícios
1) Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria , numa escala de 0 a 100 : 65, 68, 70, 75, 80, 80 ,82 ,85, 90 ,90, 90, 95, 98, 100, 100.
Calcular :
a) Média Aritmética Simples
b) Moda
c) Mediana
Exercícios
1) Segue abaixo os dados agrupados de uma sondagem eleitoral de avaliação do Prefeito Silva. Calcular média , moda e mediana.