Apost estatistica

31
E.E. "Professor Astor Vianna" APOSTILA DE ESTATÍSTICA

Transcript of Apost estatistica

Page 1: Apost estatistica

E.E. "Professor Astor Vianna"

APOSTILA DE ESTATÍSTICA

Page 2: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

1.1 Conceito, Origem e Desenvolvimento da Estatística.

Vamos estudar o conceito de estatística a partir de três vertentes. Chama-se de estatística:

1. O conjunto de elementos numéricos relativos a um fato.2. O conjunto de técnicas para fazer predições com base em probabilidades.3. O conjunto de técnicas para fazer inferências com base em amostras.

Estatística é a ciência que investiga os processos de obtenção, organização e análise de dados sobre uma população e os métodos para tirar conclusões e fazer predições com base nesses dados.

1.2 Um Pouco de História

No século XI, Guilherme, o conquistador, ordenou que fosse feito um censo das propriedades No princípio a estatística referia-se apenas a informações de interesse do estado (nação) para exercer controle fiscal ou para segurança nacional. Por isso o nome estatística: ciência do estado.

1.3 Porque Utilizar Estatística

A estatística está presente no nosso dia a dia. A todo o momento fazemos estimativas e predições com base em informações que dispomos. Esta ciência é útil para conhecer determinada situação. É uma forma de representar e simplificar determinada realidade, a partir de dados nela coletados com a finalidade de planejar e tomar decisões.

1.4 Estatística nas Empresas

No mundo atual, a empresa é uma das vigas-mestras da economia dos povos.A direção de uma empresa exige de seu(s) administrador(es) a importante tarefa de tomar decisões. O conhecimento e o uso da estatística facilitarão esse trabalho. Por meio de experimentos, sondagens, coleta de dados ou opiniões; podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros; estabelecer metas e objetivos. Fatores muito importantes e muito utilizados por EMPREENDEDORES e pelos GOVERNOS.

Exercícios:

1. Cite exemplos de utilização da estatística.____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

2. Você utiliza ou já utilizou estatística em sua vida acadêmica ou profissional? ___________________________________________________________________________ ___________________________________________________________________________ ___________________________________________________________________________

2

Page 3: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

2. Variáveis

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno e se dividem em QUALITATIVAS E QUANTITATIVAS.

2.1 Variável Qualitativa – quando se refere à qualidade, estará sempre associada a um atributo e podem ser nominais e ordinais.

Variável qualitativa nominal – quando respostas podem ser encaixadas em categorias, independentes uma das outras, sem nenhuma relação com as outras.

Ex: Time de futebol (flamengo, Vasco, fluminense, etc), Causa morte (câncer, tuberculose, etc)

Variável qualitativa ordinal – mantém uma relação de ordem uma com as outras.Ex: Classe social (alta, média, baixa), Conceitos obtidos em uma disciplina (A, B, C, D).

2.2 Variável Quantitativa – Quando se refere à quantidade, seus valores são expressos por números e podem ser discreta ou contínua.

Variável quantitativa discreta – relacionada a contagens ou enumerações, não admite decimais.Ex: Quantidade de alunos, Número de cadeiras, etc.

Variável quantitativa contínua – Relacionada a medições, onde a variável pode assumir qualquer valor dentro de um intervalo.Ex: Altura, idade, etc.

Exercícios

1. Classifique as variáveis:

a) Número de clientes.

b) Produção agrícola de arroz.

c) Sexo.

d) Raça de cães.

e) Grupo sanguíneo.

f) Velocidade de um veículo.

g) Partido político.

h) N° de hemácias por mm

3

Page 4: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

h) Didática de um professor.

i) Temperatura.

j) Salário.

2. Dê exemplos de:

a) Variável qualitativa nominal

b) Variável quantitativa contínua

c) Variável quantitativa discreta

d) Variável qualitativa ordinal

3 - POPULAÇÃO E AMOSTRA

3.1 População Estatística – É o conjunto de indivíduos portadores de pelo menos uma característica comum, onde sempre é possível considerar todos os elementos. O pesquisador é quem define a população estatística principalmente pela atribuição de características a essa população.

3.2 Amostra – É o subconjunto finito de uma população, isto é, uma pequena parte do todo. Mas para que as inferências sejam corretas é necessário que tenhamos uma amostra significativa da população e que as amostras sejam obtidas por processos adequados. Assim, pode-se dizer que trabalhar com amostras é bem mais fácil, mais econômico e mais rápido. A amostra deve representar fidedignamente a população, por isso, exigi-se certas técnicas para a obtenção de amostras não tendenciosas e imparciais, como deve ser todo trabalho estatístico, estas técnicas são obtidas através da amostragem.

4 - PRINCIPAIS TÉCNICAS DE AMOSTRAGEM

4.1 Amostra Casualizada – É quando todos os elementos da população tem a mesma probabilidade de participarem da amostra. Equivalente a um sorteio.Por exemplo, uma clínica com 100 pacientes, onde se deseja uma amostra de 20 elementos. Colocamos todos os nomes em uma urna e aleatoriamente retiramos os 20 nomes 4.2 Amostra Sistemática – É aquela que se adota um sistema intervalar (tempo ou espaço) para a obtenção dos dados, ou seja, quando os elementos da população já se acham ordenados e o pesquisador determina o sistema.Por exemplo, Prontuários médicos, 1 a cada 5; Linhas de produção 1 a cada 100.

4

Page 5: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

4.3 Amostra Estratificada – Ocorre quando dividimos a população em sub populações (estratos), e dentro de cada estrato retiramos uma certa quantidade de elementos. Essa retirada pode ser casualizada ou sistemática.Por exemplo, supondo que dos 100 pacientes do primeiro exemplo utilizado, 60 sejam homens e 40 mulheres são, portanto dois estratos (masculino e feminino). Se queremos uma amostra de 20%, logo: Amostragem masculina = 12 elementos; Amostragem feminina = 8 elementos.

4.4 Amostra por Conglomerado – É aquela onde dividimos a população em conglomerados (seções) e sorteamos uma certa quantidade de conglomerados, trabalhando com todos os elementos das seções sorteadas.Por exemplo, estudo sobre a estatura dos alunos da UCB, dividiríamos a população em seções (cursos) e realizaríamos um sorteio para saber com que cursos iriam trabalhar.

4.5 Amostra por Conveniência – É aquela que se obtém os dados por comodidade.Por exemplo, para realizar uma pesquisa com alunos do curso de Educação Física. Realizaríamos em nossa instituição.

Exercícios

1. A carteira de clientes de uma agência está organizada em um arquivo, por ordem alfabética. Qual o tipo de amostra e a maneira mais simples de amostrar 1/ 3 dos clientes?__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

2. Defina população estatística, exemplifique e atribua TRÊS características a essa população.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

3. Relacione: 1. Amostra sistemática. 2. Amostra por conglomerado. 3. Amostra estratificada. 4. Amostra casualizada. 5. Amostra por conveniência.

( ) Quando divide a população em sub populações.( ) Quando a população já se acha ordenada.( ) Quando se obtém por comodidade.( ) Quando se assemelha a um sorteio.( ) Quando se seleciona apenas parte da população. ( ) Quando dividimos a população em conglomerado

5

Page 6: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

4. Alunos de uma universidade resolveram realizar uma pesquisa de intenção de votos para a eleição de um novo reitor daquela instituição. O trabalho foi realizado no período de 10 a 15 de junho de 2012 com toda a comunidade acadêmica. Foram ouvidos, de forma aleatória, 236 eleitores sendo o mesmo percentual para alunos e funcionários. Responda:a) A população estatística;____________________________________________________________________________________________________________________________________________________________

b) A técnica de amostragem utilizada.__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

5. MÉTODO ESTATÍSTICO

O método estatístico compreende um ciclo que vai da concepção do problema até as conclusões. Realiza-se pela aplicação do método cientifico, pelas fases a seguir:

Definição do __ Coleta de __ Análise de __ Conclusões Problema Dados Dados

Vejamos cada fase.

5.1 Definição do ProblemaEsta fase é a mais importante. Onde é claramente definido o problema e o objetivo a ser alcançado. Hipóteses são levantadas. Essas definições irão conduzir as fases subseqüentes. Para estatística, o produto importante da definição do problema é a delimitação da população. Outro aspecto importante da definição de problema é o levantamento de hipóteses. Fazem-se perguntas ou afirmações sobre a população, originadas em conhecimentos anteriores ou na percepção dos pesquisadores. Definida a população e formuladas as hipóteses precisamos elaborar um instrumento para coleta de dados.

5.2 Coleta de DadosHá várias maneiras de coletar dados. O meio mais comum é o uso de questionários ou formulários, compostos por perguntas.Elaborar um questionário é uma das tarefas mais importantes em um trabalho de pesquisa, é por meio deles que os dados serão obtidos e registrados. Ele precisa ser claro, objetivo e não dar margem a dúvidas ou a má interpretação. O questionário pode ser preenchido pelo entrevistador ou pelo entrevistado. A maior vantagem no uso do questionário é o anonimato do entrevistado o que possibilita respostas muito mais verdadeiras.As partes que compõem um questionário são:

1. Cabeçalho – Serve para identificar quem promove a pesquisa;

2. Textos de instruções e apresentação do entrevistador – Contém orientações e avisos para o entrevistado.

6

Page 7: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

3. Variáveis de identificação da unidade pesquisada ou da entrevista – Localizar a unidade amostral ordenando os questionários.

4. Perguntas - Conjunto de questões.

5. Agradecimento – Agradecer a contribuição do entrevistado para o trabalho.

5.3 Análise de dadosAnalisar dados consiste em aplicar técnicas estatísticas para interpretar os resultados obtidos. Nesta fase procura-se responder às perguntas de pesquisa e confirmar ou refutar as hipóteses, para isso utilizam representações dos dados em tabelas e/ou gráficos.

5.4 ConclusõesFeita a análise dos dados coletados, chega-se á última fase de um trabalho de pesquisa. As conclusões são feitas na forma de afirmações sobre os dados, baseada nas análises. Nessa etapa as hipóteses serão confirmadas ou refutadas. As conclusões baseiam-se nos resultados das análises e de conhecimentos anteriores sobre o tema. Não podem decorrer de interpretações subjetivas.

6. TABELASTem o objetivo de sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da avaliação dessa ou dessas variáveis. Fornecendo rápidas e seguras informações.Uma tabela compõe-se de:

Título – Explica o que o trabalho contém, devendo responder as seguintes perguntas: O que?, Onde? e Quando?

Cabeçalho – especifica o conteúdo das colunas.

Corpo – Formado por linhas e colunas de dados.

Rodapé – Pode apresentar chamadas e notas, além da Fonte que não deve deixar de ser exibida já que Identifica o responsável (is) pelo trabalho.

7

Page 8: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

A tabela deve ser delimitada por traços horizontais, traços verticais somente para separar colunas, nunca para delimitar a tabela. Observe o modelo:

TítuloCabeçalho Cabeçalho

C o r p o

Rodapé

7. GRÁFICOSOs resultados de uma pesquisa podem ser apresentados por meio de gráficos, porém estes devem ser:

simples, bonitos e fáceis de serem interpretados. Caso contrário, a apresentação a apresentação por meio de gráfico não faz sentido. Os gráficos mais comuns são: EM COLUNAS, BARRAS, LINHAS E ÁREA ou PIZZA.

7.1 Normas de Representação Gráfica Não há normas rígidas para a representação gráfica de dados. São indispensáveis apenas título e fonte dos

dados, recomendando-se a adequação ao tipo de variável.

7.2 Construção de gráficos utilizando o programa Microsoft XP

1° Passo – Clicar em INICIAR; PROGRAMAS; EXCEL ou atalho EXCEL na área de trabalho.

2° Passo – Inserir dados.

3° Passo – Selecionar as células utilizadas.

4° Passo – Clicar ASSISTENTE DE GRÁFICO na barra de ferramentas.

5° Passo – Escolher o tipo de gráfico e AVANÇAR.

6° Passo – Verificar se as séries estão em colunas e AVANÇAR.

7° Passo – TÍTULO digitar o título do gráfico e se necessário informações para o eixo de categorias e valores.

8

Page 9: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

8° Passo – EIXOS a opção de apresentação de identificação das categorias e valores.

9° Passo – LINHAS DE GRADE opção de retirar ou inserir linhas para auxílio na leitura de gráficos.

10° Passo – LEGENDA quando houver necessidade de informações quanto as colunas.

11° Passo – RÓTULO DE DADOS para que o valor referente a cada categoria apareça. 12° Passo – TABELA DE DADOS não utilizar.

13° Passo – POSICIONAR COMO PLANILHA OU COMO OBJETO planilha o gráfico a exibição se da em tela inteira e como objeto se da como janela.

14° Passo – CONCLUIR.

* Para trocar a cor de todas as colunas, clicar uma vez sobre uma das colunas em seguida dois cliques sobre qualquer coluna e abrirá um menu de cores. Selecionar a cor e clicar OK.

** Para trocar a cor de cada coluna individualmente, clicar uma vez sobre qualquer coluna em seguida um clicar sobre a coluna que deseja alterar a cor e dois cliques para abrir o menu de cores. Selecionar a cor desejada e clicar OK.

*** Para voltar em OPÇÕES DE GRÁFICO depois de concluído, clicar com o botão direito sobre área do gráfico.

8. ARREDONDAMENTO DE DADOS

Arredondar um número significa reduzir a quantidade de algarismos após a vírgula, deste número. O arredondamento de dados ocorre de duas formas, a saber:a) Quando o algarismo a ser abandonado é 0,1, 2, 3 ou 4.ex: 2,764 para centésimos 2,76

b) Quando o algarismo a ser abandonado é 5,6,7,8 ou 9. ex: 8,957 para centésimos 8,96

Obs: Não devemos realizar arredondamentos sucessivos.ex de arredondamentos sucessivos: 0,2685485 para centésimos 0,26859 0,2686

0,269 0,27

Nesses casos devemos conservar apenas o primeiro algarismo após a unidade que deseja arredondar e desprezar as demais, em seguida aplicar uma das técnicas informadas anteriormente.ex: 0,2685485 para centésimos 0,27

NOSSAS ATIVIDADES DEVERÃO SER ARREDONDADAS PARA DÉCIMOS

9

Page 10: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

Exercício

Aplique o arredondamento:a) 15,2586b) 4.056c) 1,3333333...d) 29,899e) 8,964012f) 9.95

9. DISTRIBUIÇÃO DE FREQÜÊNCIA

Determinamos distribuição de freqüência o número que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de DISTRIBUIÇÃO DE FREQUÊNCIA.

9.1 Métodos Para a Distribuição de Freqüência

Tabela primitiva – É a tabela cujos elementos não foram numericamente organizados.Exemplo: Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011.

166 160 161 150 162 160 163 162 161 168 163 156 170 155 152 190 189 155 190 154 161 156 172 153 181

Rol – É a maneira mais simples de organizar os dados através de uma ordenação CRESCENTE OU DECRESCENTE.Exemplo: Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011.

150 155 160 161 163 172 190 152 155 160 162 166 181 153 156 161 162 168 189 154 156 161 163 170 190

Freqüência de uma classe – O número de valores da variável pertencente à classe. O que passará a se chamar distribuição de freqüência com intervalos de classe.Exemplo: Tabela 1

1

Page 11: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

Estatura, em cm, de participantes do projeto “Micro Escola da UCB” jul / 2011.

Estatura (cm) Freqüência150 158 8

158 166 9

166 174 4

174 182 1182 !--! 190 3Total 25

Nota: Os intervalos devem ser escritos de acordo com a resolução do IBGE, em termos de: DESTA QUANTIDADE ATÉ MENOS AQUELA ( inclusão exclusão).

9.2 Frequencia Absoluta –F(abs)É o número de vezes que cada variável estatística assume, o mesmo que freqüência.

9.3 Frequencia Relativa - F(%)Calculada a partir da divisão de freqüência absoluta pelo N multiplicado por 100, pois o resultado em percentual é mais fácil de ser interpretado.

F(%)= F (abs) . 100 N

Estatura, em cm, de participantes do projeto“Micro Escola da UCB” jul / 2011.

Estatura (cm) F (abs) F (%)150 158 8 32

158 166 9 36

166 174 4 16

174 182 1 4182 !--! 190 3 12

Total 25 100

9.4 Freqüência Acumulada (Fac)

Freqüência Acumulada Crescente (ou Freqüência acumulada ”abaixo de”, ou Freqüência acumulada ”até”) que representaremos por Fac é a soma das freqüências absolutas anteriores de uma determinada classe.

Por exemplo, na tabela acima, a Freqüência acumulada crescente é: 8+9=17; 17+4=21; 21+1=22; 22+3=25

1

Page 12: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

Estatura, em cm, de participantes do projeto“Micro Escola da UCB” jul / 2011.

Estatura (cm) F (abs) F (%) Fac150 158 8 32 8

158 166 9 36 17

166 174 4 16 21

174 182 1 4 22182 !--! 190 3 12 25

Total 25 100 ---

10. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA

10.1 Classes

São intervalos de variação da variável. Representadas por i. Sendo i = 1, 2, 3, ... , k

10.2 Como determinar o número de classes para agrupamento de dados.

Sendo: k – Número de classes; n – Número de dados da variável.

Fórmula para quantidade de classes: Recomenda-se que o número de classes esteja entre 5 e 15.

Exemplo:Utilizando dados do exemplo anterior: n = 25 5 logo k = 5 classes

Se k for maior que 15, use k=15. Caso seja menor que 5 usar k=5.

10.3 Como determinar a amplitude dos limites de classes.

Sendo: Max: Menor dado da série Min: Maior dado da série

Fórmula para limite de classe: lim = (max – min) kExemplo:Aplicando a fórmula utilizando dados da tabela 1: lim = 191 – 150 = 41 / 5 = 8,2

1

Page 13: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

5 Os limites das classes deverão apresentar amplitude de 8 cm

Limite de classe – São os limites de cada classe. Sendo o menor número limite inferior da classe e o maior número limite superior da classe. 10.4 Amplitude

10.4.1 Do intervalo de classe – É a medida do intervalo de cada classe, obtida pela diferença entre os limites, SUPERIOR e INFERIOR da classe representada por h. Assim: h = L – l

10.4.2 Total da distribuição – è a diferença entre o limite superior máximo e o limite inferior mínimo, ou seja, o maior e o menor valor da variável. Representada por AT, pode ser calculada por AT = L(Max) – l(min)

10.4.3 Amplitude amostral (AA) – é a diferença entre o valor máximo e o valor mínimo da amostral AA= x(Max.) – x(min.)

EXERCÍCIOS1. A tabela abaixo apresenta o número de atendimentos na clínica “bela” no mês de maio / 2011:

14 21 11 13 14 13 12 14 13 20 11 12 06 10 09 18 15 19 16 12 11 14 14 13 15 12 14 08 11 14

Construa uma DISTRIBUIÇÃO DE FREQÜÊNCIA com intervalo de classe CINCO

2. A tabela abaixo apresenta a IDADE de alunos da turma 502 da Escola Municipal Pará Cidade do Rio de Janeiro 2010:

14 12 11 13 14 13 12 09 13 20 11 12 17 13 10 18 15 19 16 12 11 14 14 08 15 12 14 08 11 14

Construa uma distribuição de freqüência, calcule os limites de classe, amplitude do intervalo, amplitude total da distribuição, amplitude amostral e uma distribuição de freqüência.

3. Conhecidas as notas em uma avaliação de ESTATÍSTICA: 85, 75, 25, 45, 10, 55, 50, 55, 80, 55, 40, 60, 50, 45, 45, 35, 90, 70, 85, 80, 70, 45, 30,100, 30.

Obtenha uma DISTRIBUIÇÃO DE FREQÜÊNCIA.

4. Crie uma situação problema e construa:a. Uma tabela primitiva;b. Um ROL;

1

Page 14: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

c. Uma distribuição de freqüência.

11. Medidas de Tendência Central Para uma Amostra

Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema em estudo. Mas é conveniente apresentar, além dos dados, medidas que mostrem a informação de maneira resumida. As medidas de tendência central dão valor ao ponto em torno do qual os dados se distribuem. São as medidas de tendência central, MÉDIA ARITMÉTICA, MEDIANA E A MODA.

11.1 Média ( )

A média é uma medida de tendência central que caracteriza, em parte, uma distribuição de dados.

11.1.1 Média Aritmética Simples - É o quociente da divisão da soma dos valores da variável pelo número deles. Representada por

Exemplo:

A = {2, 3, 4, 5, 6} = 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4 5

Fórmula da Média Simples: =

11.1.2 Média Aritmética Ponderada – É o quociente da soma dos produtos desses números pela soma das respectivas freqüências ou pesos.

Exemplo:

xi 0 1 2 3 4 5 fi 2 3 5 4 0 1

= (2 x 0) + (3 x 1) + (5 x 2) + (4 x 3) + (0 x 4) + (1 x 5) = 2 + 3 + 5 + 4 + 0 + 1

= 0 + 3 + 10 + 12 + 0 + 5 = 30 = 215 15

Logo: = 2

Fórmula da média aritmética ponderada:

1

Page 15: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

11.1.3 Desvio em Relação à Média – É a diferença entre cada elemento de um conjunto de valores e a média aritmética desse conjunto.

Desvio =

Lembrando que a soma dos desvios será sempre igual a zero. Exemplo:

C = {2, 3, 4, 5, 6}

= 2 + 3 + 4 + 5 + 6 = 20 / 5 = 4 5

Desvios em relação à média: D1 = 2 – 4 = -2 D2 = 3 – 4 = -1 D3 = 4 – 4 = 0 D4 = 5 – 4 = 1 D5 = 6 – 4 = 2 Soma dos desvios: (-2) + (-1) + (0) + ( 1) + (2) = 0

A média é utilizada quando: a) Desejamos uma medida de posição que possui maior estabilidade; b) Houver necessidade de um tratamento algébrico.

11.2 Mediana

Representada por Md, a mediana é definida como sendo a realização que ocupa a posição central de uma série de observações quando estas estão ordenadas segundo as suas grandezas. Para determinar a mediana temos dois casos:

11.2.1 Quando a variável apresentar uma quantidade ÍMPAR de parcelas devemos identificar o valor que ocupa posição central dessa distribuição.

Fórmula: Md =

Exemplo: {2, 3, 4, 5, 6}

n = 5 Md = ° *

Md = 4

*A aplicação da fórmula indicará a posição da parcela mediana e não o valor.

1

Page 16: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

11.2.2 Quando a variável apresentar uma quantidade PAR de parcelas, não teremos UM valor para representar a mediana e sim DOIS valores. Devemos então, identificar os valores que ocupam a posição central dessa distribuição e calcular a média aritmética desses valores.

Fórmula: Md =

Exemplo: {2, 3, 4, 5, 6, 7}

n = 6 Md =

Md = 3° e 4° **

Md = 4 e 5 4 + 5 = 4,5 2

** A aplicação da fórmula indicará a posição da parcela mediana e não o valor.

Empregamos a mediana quando:a) Desejamos obter o ponto que divide a distribuição em partes iguais;b) Há valores extremos que afetam de uma maneira acentuada a média.

11.3 Moda

Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Representada por Mo Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Representada por Mo Ela pode ser:

Modal, quando apresenta apenas uma moda (freqüência);Exemplo: {2, 1, 7, 6, 9, 2, 3, 2} Mo = modal em 2

Amodal, quando não tem moda (freqüência); Exemplo: {5, 3, 9, 8, 2, 10, 1} Mo = amodal

Bimodal, quando tem duas modas (freqüências); Exemplo: {8, 6, 2, 5, 15, 7, 2, 1, 5} Mo = bimodal em 2 e 5

Multimodal, quando apresenta três ou mais modas. Exemplo:

{8, 6, 2, 5, 15, 7, 2, 1, 5, 3, 8} Mo = Multimodal em 2, 5 e 8

1

Page 17: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

EXERCÍCIOS

1. Sabendo que a freqüência de pacientes em uma determinada semana na clínica “up” foi de 15, 17, 25, 12, 19, 11, 12. Calcule:

a) Média;b) Mediana;c) Modad) Desvio em relação à média.

2. Determinar a moda, média e mediana nos seguintes casos:a) 3, 5, 15, 4, 9, 10, 6.b) 1, 7, 7, 9, 8, 3, 7, 9, 5, 6, 4.c) 28, 11, 65, 48, 100, 51, 78, 24.

3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; 7,2. Sabendo-se que as TRÊS primeiras apresentam peso 2 e as TRÊS últimas peso 3. Determine: a) Nota média; b) Nota mediana; c) Nota modal;

d) Desvio em relação à média.

12. Medida de Dispersão Para uma Amostra

As medidas de dispersão indicam a variação dos dados, demonstrando se os elementos estão próximos entre si ou não. Algumas medidas de dispersão dão uma idéia do quanto à média é adequada para representar um conjunto. Quando um conjunto de dados varia pouco em relação à Média, ela representa bem o conjunto. Ao contrário, se os elementos de um conjunto são muito dispersos a Média não é uma boa representante.

Exemplo:A = {50, 55, 65, 65, 70, 75} Média = 63,3 (Indicado para medida de tendência central)

B = {9, 9, 40, 80, 81, 88, 100} Média = 58,1 (Indicado para medida de dispersão)

A Média 63,3 representa os valores do conjunto A.A Média 58,1 representa os valores do conjunto B. É razoável pensar que esta Média inclui dados como o 9 ou o 100? Não, pois esses números estão distantes da Média.Com isso fica demonstrado que é preciso medir essa dispersão, para dar mais informações sobe o conjunto. Só a Media não basta. Ela deve ser apresentada em conjunto com alguma MEDIDA DE DISPERSÃO, que vai indicar o quanto ela é representativa do conjunto de dados.

1

Page 18: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

Conhecendo as medidas de dispersão em relação à Média aritmética:AmplitudeVariânciaDesvio padrãoCoeficiente de variação

Entendendo melhor as medidas de dispersão:

Nota de quatro alunos em cinco provasNOME NOTAS MÉDIAAntônioJoãoJoséPedro

561010

54510

5555

5450

5600

5555

Todos obtiveram MÉDIA igual a cinco, mas a dispersão das notas em torno da média não é a mesma para todos os alunos.

a) As notas de Antônio não variam (dispersão nula)

b) As notas de João variam menos que as de José (dispersão de João menor que a dispersão de José)

c) As notas de Pedro variam mais do que as notas de todos (maior dispersão)

12.1 AMPLITUDE

Amplitude é a diferença entre o maior e o menor dado observado. Dados da tabela acima:

Exemplo: (a) Amplitude das notas de Antônio a) = 5 – 5 = 0

b) Amplitude das notas de João a = 6 – 4 = 2

c) Amplitude das notas de José a = 10 – 0 = 10

d) Amplitude das notas de Pedro a = 10 - 0 = 10

A Amplitude não mede bem a dispersão, porque seu cálculo usa valores extremos. Mesmo assim é muito usado por ser fácil de calcular e interpretar.

1

Page 19: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

12.2 VARIÂNCIA

Calculados os desvios em relação à Média, variância é a diferença entre cada dado e a Média. Para evitar que a soma dos desvios seja nula, podemos usar o quadrado dos desvios. Lembrando que há desvios positivos e negativos, pois a média fica no centro do conjunto. Se elevarmos os

desvios ao quadrado, eliminaremos todos os sinais negativos. E assim definimos a variância ( )

como a média do quadrado do desvios.

Exemplo: Dados: 0, 4, 6, 8, 7 Média: 5

Desvios: -5, -1, 1, 3, 2

Cálculo da soma de quadrados dos desvios

Dados(X)

Desvios(X - )

Quadrado dos desvios(X - )

04687

-5-1132

251194

=5 )=0

A soma do quadrado dos desvios não é usada como medida de dispersão.

Fórmula para cálculo da variância:

Aplicando a fórmula:

1

Page 20: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

x

04687

016366449

Substituindo:n = 5

Para entender melhor a variância:a) Para as notas de Antônio que não variam,

b) Para as notas de João, que variam menos que as notas de José, , menor que a

variância das notas de José, que é

c) Para as notas de Pedro, que variam mais do que as outras, a variância é , maior

que todas as outras variâncias.

Aluno Notas Média VariânciaAntônio

JoãoJosé

Pedro

561010

54510

5555

5450

5600

5555

01

12,525

12.3 DESVIO PADRÃO

Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Por exemplo, se os dados estão em metros a variância fica em metros ao quadrado. Mas existe uma medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de medida dos dados. É o desvio padrão definido como RAIZ QUADRADA DA VARIÂNCIA, com sinal positivo. O desvio padrão é representado por s.

2

Page 21: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

Fórmula do desvio padrão:

, ou seja,

Para as notas do aluno José, cuja variância já foi calculada, tem-se o DESVIO PADRÃO:

= 3,5412.4 Coeficiente de Variação

O Coeficiente de Variação é a razão entre o desvio padrão e a Média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem.

CV =

Para se entender como se interpreta o coeficiente de variação, imagine dois grupos de pessoas. No primeiro grupo, as pessoas têm idades:

3, 1 e 5

E no segundo grupo as pessoas têm idades:

55, 57 e 53

No primeiro grupo a média é 3 anos, e no segundo grupo média 55 anos. Com a mesma

dispersão, A variância de ambos é . Vejamos os coeficientes de variação:

No primeiro grupo, o Coeficiente de Variação é:

CV = 7%

No segundo grupo, o Coeficiente de Variação é:

CV = %

Um coeficiente de variação igual a 66,67% indica que a dispersão dos dados em relação à média é muito grande. Já um coeficiente de variação 3,64% indica que a dispersão dos dados em relação à média é pequena. Em outras palavras, diferenças de 2 anos são relativamente mais importantes no primeiro grupo, que tem média 3 (coeficiente de variação é 66,67%0 do que no segundo grupo, que tem média 55 (o coeficiente de variação é 3,64%). Então coeficiente de variação mede DISPERSÃO EM RELAÇÃO À MÉDIA.

2

Page 22: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

EXERCÍCIOS

1. Calcule a amplitude total dos conjuntos de dados:

a) 1, 3, 5, 9.

b) 20, 14, 15, 19, 21, 22, 20.

c) –10, -6, 2, 3, 7, 9, 10.

2. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, respectivamente, 18,3 e 1,47, calcular o COEFICIENTE DE VARIAÇÃO.

3. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Calcular o desvio padrão.

4. Dada a distribuição relativa de 100 notas de avaliação realizada por um fisioterapeuta, segundo critérios próprios, para o desempenho de atletas.

Notas (xi) 0 1 2 3 4 5 Freqüência (yi) 4 14 34 29 16 6

Calcule o desvio padrão.

2

Page 23: Apost estatistica

CURSO TÉCNICO EM INFORMÁTICA - PRONATEC ESTATÍSTICA PROF.ª AMANDA CRISTINA

REFERÊNCIAS

VIEIRA, Sonia. Introdução à bioestatística, 3ed, Rio de Janeiro, 2004.

MARIA, Inez M. Estatística Básica. Brasília, MSD, 2005.

RODRIGUES, Pedro C. Bioestatística. Niterói: EDUFF, 1983.

CRESPO, Antonio A. Estatística Fácil. São Paulo, ed Saraiva, 2001

2