(08) entenda - spss

7
Lincoln T. Neves Estatística, Marketing e suas aplicações Entenda SPSS Verifique repetições em uma variável chave

description

https://lincolntneves.wordpress.com Verifique repetições em uma variável chave SPSS

Transcript of (08) entenda - spss

Page 1: (08)   entenda - spss

Lincoln T. NevesEstatística, Marketing e suas aplicações

Entenda SPSSVerifique repetições em uma variável chave

Page 2: (08)   entenda - spss

Muitas vezes vamos utilizar o SPSS para analisar bases muito grandes. Essas bases devem ter uma chave, ou em determinados casos, mais de uma variável que é a chave da base de dados.

A chave será extremamente importante para que você possa unir sua base com outras que possam ter mais variáveis que sejam interessante trabalhar.

Sendo assim vamos ver aqui uma maneira simples de validar a chave de uma base de dados. Ou seja, vamos rapidamente verificar através da syntax do

SPSS se essa chave é realmente única.

Lincoln T. NevesEstatística, Marketing e suas aplicações

Page 3: (08)   entenda - spss

Suponha que sua chave, em uma base de cliente, seja o CPF de cada cliente.

Você está com a base cadastral, e nela cada cliente será identificado pelo seu CPF e junto a essa informação existem outras dezenas de variáveis sobre cada um desses clientes.

Com o simples código ao lado será possível ter certeza de que nessa base não existem números de CPFs repetidos.

Ou seja, vamos validar a base e ter certeza de que cada cliente está realmente aparecendo uma única vez na base de dados.

Lincoln T. NevesEstatística, Marketing e suas aplicações

Nesse código vamos usar vários

comandos!

Page 4: (08)   entenda - spss

Em primeiro lugar é necessário ordenar a base de dados pela variável chave, que nesse caso será o CPF.

Após isso vamos usar o comando TEMPORARY, que fará o procedimento sem modificar nossa base principal.

Na sequência iniciamos o comando AGGREGATE. Nele colocamos um asterisco (*) em OUTFILE, pois indica que a base que deverá ser analisada já está aberta. Ainda no AGGREGATE vamos colocar mais um item: o PRESORTED. Esse indica que a base já está ordenada pela variável que queremos analisar.

E agora o BREAK, que é nossa variável chave. Após o BREAK, o que estamos fazendo é criar a variável REP. E queremos saber nessa variável o número de repetições dos registros do BREAK, que é o CPF.

Após isso colocamos a função FREQUENCIES para fazer uma frequência da variável criada, que chamamos de REP.

Lincoln T. NevesEstatística, Marketing e suas aplicações

Page 5: (08)   entenda - spss

Após executar o comando teremos a saída do SPSS (Output) como a imagem acima.

Lincoln T. NevesEstatística, Marketing e suas aplicações

Aparece apenas 1, indicando nesse casos que existem 1.841.109

CPFs e cada um é único!

Resultado das frequência!

REP

Page 6: (08)   entenda - spss

Surgiu a dúvida? Quer perguntar sobre

outros assuntos?

Não perca tempo. Acesse o blog, vá em contato e mande um email para coluna Entenda sobre o que você precisa. Fica a dica!

Ou envie um email direto para [email protected]

www.lincolntneves.wordpress/contato

Lincoln T. NevesEstatística, Marketing e suas aplicações

Page 7: (08)   entenda - spss

Lincoln T. NevesEstatística, Marketing e suas aplicações