NORMALIZAÇ ÃO Frei Joaquim José Hangalo, OFMCAP Curso de Férias ProjectoOi@ Centro de Formação...

Post on 22-Apr-2015

111 views 2 download

Transcript of NORMALIZAÇ ÃO Frei Joaquim José Hangalo, OFMCAP Curso de Férias ProjectoOi@ Centro de Formação...

NORMALIZAÇÃOFrei Joaquim José Hangalo, OFMCAP

Curso de FériasProjectoOi@Centro de Formação São Domingos

2

Formas NormaisFormas Normais

Projetar as relações (tabelas) de uma base de dados relacional, de modo a obter o

máximo de independência de dados, eliminando redundâncias desnecessárias.

3

Processo de NormalizaçãoProcesso de Normalização

• Permite identificar a existência de problemas potenciais (anomalias de atualização) no projeto de uma BD relacional

• Converte progressivamente uma tabela em tabelas de grau e cardinalidade menores até que pouca ou nenhuma redundância de dados exista

• Consiste em gradativamente retirar das relações do esquema as dependências funcionais indesejáveis. Cada um dos passos do processo coloca a relação numa das formas normais

4

Processo de NormalizaçãoProcesso de Normalização

• Se a normalização é bem sucedida: o espaço de armazenamento dos dados diminui a tabela pode ser actualizada com maior eficiência

5

Processo de NormalizaçãoProcesso de Normalização

• Cada passo do processo considera determinados aspectos

• Uma forma normal é um conjunto de regras que uma tabela deve obedecer e destinam-se a eliminar as redundâncias de dados

6

Formas NormaisFormas Normais

Relações Normalizadas e Não Normalizadas

1FN

2FN3FN

4FN

7

Dependência FuncionalDependência Funcional

Dada uma relação R, dizemos que uma coluna ou conjunto de colunas B de R é dependente

funcional de uma coluna ou conjunto de colunas A de R, denotado por

A B, sse a cada valor VA de A existir nas linhas de R em que aparece VA , um único valor VB. Se VA ocorrer em duas linhas diferentes, o

mesmo VB deve ocorrer em ambas.

FORMAS NORMAISREGRAS DE INFERÊNCIA PARA DFS

1.Reflexiva. Se X Y, então X Y

2.Aumentativa. Se X Y, então XZ YZ

3.Transitiva. Se X Y e Y Z, então X Z

4.Decomposição/projeção. Se X YZ, então X Y e X Z

5.União/aditiva. Se X Y e X Z, então X YZ

6.Pseudotransitiva. Se X Y e WY Z, então WX Z

8

9

Dependência FuncionalDependência Funcional

Exemplo: Código Salário

Código ...... Salário

E1E3 10

E1E2E3E2E1

10

105

510

10

10

Tabela Não-Normalizada (NN)Tabela Não-Normalizada (NN)

• Uma tabela não normalizada (ÑN) contém valores de atributos não atômicos, isto é, contém tabelas embutidas (grupos repetidos)

• PROJ(CODPROJ, TIPOPROJ, DESCR, {NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC})

11

CodProj TipoProj Descr Emp

NoEmp Nome Cat Sal DataInicio TempoAloc

LSC001 Novo Sistema Desenv Stock

2146 João A1 400 01/11/91 24 3145 Silvia A2 400 02/10/91 24 6126 José B1 900 03/10/92 18

1214 Carlos A2 400 04/10/92 18 8191 Mário A1 400 01/15/93 12 4112 João A2 400 04/01/91 24 6126 José B1 900 01/11/92 18

PAG02 Manut. Sistema RH

PROJ(CODPROJ, TIPOPROJ, DESCR, {NOEMP,

NOME, CAT, SAL, DATAINICIO, TEMPOALOC})

Tabela Não-Normalizada (NN)Tabela Não-Normalizada (NN)

8191 Mário A1 400 01/11/92 12

Frei Joaq

uim

José Han

galo

12

Mesmo Esquema visto Noutra perspectiva

13

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

Uma relação está na Primeira Forma Normal se todos os atributos que a

compõem são atômicos e monovalorados., ou seja, se todas as colunas que a

compõem são atômicas.

Atributos multivalorados ou compostos (estruturas de dados) devem ser eliminados, melhor retirados.

FORMAS NORMAISPRIMEIRA FORMA NORMAL

14

FORMAS NORMAISPRIMEIRA FORMA NORMAL

15

Com redundância

FORMAS NORMAISPRIMEIRA FORMA NORMAL

Atributos multivalorados1) Quando a quantidade de valores é pequena e

conhecida a priori;

16

Substitui-se o atributo multivalorado por um conjunto

de atributos de mesmo domínio, cada um representando

a ocorrência de um valor.

FORMAS NORMAISPRIMEIRA FORMA NORMAL

Atributos multivalorados.2) Quando a quantidade de valores é muito

grande, variável ou desconhecida.

17

Retira-se da relação o atributo multivalorado, e cria- se

uma nova relação que tem o mesmo conjunto de

atributos chave, mais o atributo multivalorado como

chave, porém tomado como monovalorado.

FORMAS NORMAISPRIMEIRA FORMA NORMAL

18

19

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

• Passagem à primeira forma normal:

- para cada tabela embutida inclusive a mais externa, é criada uma tabela na 1FN que contém:

• as chaves primárias de cada tabela externa à tabela embutida

• os atributos da própria tabela embutida

- são definidas as chaves primárias das tabelas na 1FN.

20

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

• Primeiro passo: subdivisão em tabelas

– Tabela 1

PROJ (CODPROJ, TIPO PROJ, DESCR)

– Tabela 2

PROJEMP(CODPROJ, NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC)

21

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

• Segundo passo: Identificação de Chaves

– Tabela 1

• a chave primária é a chave da tabela externa na forma ÑN

PROJ(CODPROJ, TIPOPROJ, DESCR)

22

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

• Segundo passo: Identificação de Chaves

– Tabela 2• o atributo NOEMP é a chave da tabela embutida

original, portanto, faz parte da chave primária.• verificar se, no documento, um valor de

NOEMP aparece associado a muitos valores de CODPROJ, se sim, CODPROJ faz parte da chave primária.

PROJEMP(CODPROJ, NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC)

23

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

CodProj Tipo Descr

LSC001 Novo Desenv.

Sistema de Estoque

PAG02 Manutenção Sistema de RH

Proj

24

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

CodProj CodEmp Nome Cat Sal DataIni TempAl

LSC001 2146 Joao A1 400 1/11/91 24

LSC001 3145 Silvio A2 400 2/10/91 24

LSC001 6126 Jose B1 900 3/10/92 18

LSC001 1214 Carlos A2 400 4/10/92 18

LSC001 8191 Mario A1 400 1/11/92 12

PAG02 8191 Mario A1 400 1/05/93 12

PAG02 4112 Joao A2 400 4/01/91 24

PAG02 6126 Jose B1 900 1/11/92 12

ProjEmp

25

Primeira Forma Normal (1FN ou PFN) Primeira Forma Normal (1FN ou PFN)

• Exemplo:– ÑN

(A1, A2, A3, A4, A5 (B1, B2, B3, B4 (C1, C2, C3) (D1, D2))

(E1, E2, E3))

– Subdivisão em tabelas:1 (A1, A2, A3, A4, A5)

2 (A1, A2, B1, B2, B3, B4)

3 (A1, A2, B1, C1, C2, C3)

4 (A1, A2, B1, D1, D2)

5 (A1, A2, E1, E2, E3)

26

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

Uma relação está na Segunda Forma Normal se ela está na 1NF e todo atributo não-chave primária é plenamente dependente de toda a chave primária e não de apenas parte dela.

27

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

• Toda tabela na 1FN que possui uma chave primária composta por um único atributo já se encontra na segunda forma normal

• Assim, ao passar para a 2FN é necessário considerar apenas tabelas que tenham:– chave primária composta– pelo menos um atributo não chave

28

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

• Para passar à 2FN:– Copiar para a 2FN cada tabela que tenha chave

primária simples ou que não tenha atributos não chaves.

29

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

– Para tabelas com chave primária composta e atributos não chaves:

• criar na 2FN uma tabela com as chaves primárias da tabela na 1FN

• para cada atributo não chave fazer a pergunta: “o atributo depende de toda a chave ou de parte dela?”

– caso o atributo dependa de toda a chave, copiar o atributo para a 2FN

– caso o atributo dependa de parte da chave:» criar uma tabela na 2FN que tenha como chave a parte

da chave da qual o atributo depende

» copiar o atributo dependente para a tabela criada.

30

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

• ExemploTabela 1

– PFNPROJ(CODPROJ, TIPOPROJ, DESCR)

– SFNA tabela possui uma chave primária simples, é transcrita para a 2FN

PROJ( CODPROJ, TIPOPROJ, DESCR)

31

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

Tabela 2– 1FN

PROJEMP(CODPROJ, NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC)

– 2FNNome: depende apenas de parte da chave (NOEMP)

Cat: depende apenas de parte da chave (NOEMP)

Sal: depende apenas de parte da chave (NOEMP)

Datainicio depende de toda a chave (inicio do emp no projeto)

tempoaloc depende de toda a chave (tempo do emp no projeto)

PROJEMP(CODPROJ, NOEMP, DATAINICIO, TEMPOALOC)

EMP(NOEMP, NOME, CAT, SAL)

32

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

CodEmp Nome Cat Sal

2146 Joao A1 400

3145 Silvio A2 400

6126 Jose B1 900

1214 Carlos A2 400

8191 Mario A1 400

4112 Joao A2 400

Emp

33

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

CodProj CodEmp DataIni TempAl

LSC001 2146 1/11/91 24

LSC001 3145 2/10/91 24

LSC001 6126 3/10/92 18

LSC001 1214 4/10/92 18

LSC001 8191 1/11/92 12

PAG02 8191 1/05/93 12

PAG02 4112 4/01/91 24

PAG02 6126 1/11/92 12

ProjEmp

34

Segunda Forma Normal (2FN ou SFN) Segunda Forma Normal (2FN ou SFN)

RESUMO

– ÑNPROJ(CODPROJ, TIPOPROJ, DESCR, (NOEMP, NOME, CAT,

SAL, DATAINICIO, TEMPOALOC))

– 1 FNPROJ(CODPROJ, TIPOPROJ, DESCR)

PROJEMP(CODPROJ, NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC)

– 2 FN

PROJ( CODPROJ, TIPOPROJ, DESCR)

PROJEMP(CODPROJ, NOEMP, DATAINICIO, TEMPOALOC)

EMP(NOEMP, NOME, CAT, SAL)

FORMAS NORMAISSEGUNDA FORMA NORMAL

Evita:

• Inconsistências devido a duplicidade de informações

• Perda de dados em operações de remoções / alteração na relação

35

36

Dependência Transitiva Dependência Transitiva

• Dependência Transitiva:Ocorre quando Y depende de X e Z depende de Y.Logo, Z também depende de X.

X Y Z

No-avião Tipo Capacidade Local

37

Terceira Forma Normal (3FN ou TFN) Terceira Forma Normal (3FN ou TFN)

– Toda tabela na 2FN que possui menos que dois atributos não chave encontra-se na 3FN.

– Na passagem à 3FN basta considerar tabelas com dois ou mais atributos não chave.

Uma relação está na Terceira Forma Normal se ela está na 2NF e nenhum

atributo não-chave é transitivamente dependente da chave primária.

38

Terceira Forma Normal (3FN ou TFN)Terceira Forma Normal (3FN ou TFN)

• Para passar à 3FN:1) Copiar para a 3FN cada tabela que tenha menos

que dois atributo não chave

2) Para tabelas com dois ou mais atributos não chaves:

a) criar uma tabela na 3FN com a chave primária da tabela em questão

b) para cada atributo não chave fazer a pergunta: “ o atributo depende de algum outro atributo não chave?” (dependência transitiva)

39

Terceira Forma Normal (3FN ou TFN)Terceira Forma Normal (3FN ou TFN)

Caso o atributo dependa apenas da chave:

- copiar o atributo para a tabela na 3FN

Caso o atributo dependa de um outro atributo:

1. Criar, caso ainda não exista, uma tabela na 3FN que tenha como chave primária o atributo do qual há uma dependência indireta.

2. Copiar o atributo dependente para a tabela criada.

3. O atributo do qual há a dependência deve permanecer também na tabela criada no passo a)

40

Terceira Forma Normal (3FN ou TFN)Terceira Forma Normal (3FN ou TFN)• Exemplo

– o atributo SAL da tabela EMP depende do atributo CAT (categoria funcional)

– As dependências funcionais nesta tabela são:

EMP(NOEMP, NOME, CAT, SAL)

– Na passagem para a 3FN, a tabela EMP é subdividida:

EMP(NOEMP, NOME, CAT)CAT(CAT, SAL)

FORMAS NORMAISTERCEIRA FORMA NORMAL

Evita:

inconsistências devido a duplicidade de informações

perda de dados em operações de remoções / alteração na relação

41

42

Terceira Forma Normal (3FN ou TFN)Terceira Forma Normal (3FN ou TFN)RESUMO– ÑN PROJ(CODPROJ, TIPOPROJ, DESCR, (NOEMP, NOME, CAT,

SAL, DATAINICIO, TEMPOALOC))– PFN PROJ(CODPROJ, TIPOPROJ, DESCR) PROJEMP(CODPROJ,

NOEMP, NOME, CAT, SAL, DATAINICIO, TEMPOALOC)– SFN

PROJ( CODPROJ, TIPOPROJ, DESCR) PROJEMP(CODPROJ, NOEMP, DATAINICIO, TEMPOALOC) EMP(NOEMP, NOME, CAT, SAL)

– TFN PROJ( CODPROJ, TIPOPROJ, DESCR) PROJEMP(CODPROJ, NOEMP, DATAINICIO, TEMPOALOC) EMP(NOEMP, NOME, CAT) CAT(CAT, SAL)

43

Resumo GeralResumo Geral

Eliminar atributos não atômicos

1NF

Eliminar DF não plenas

2NF

Eliminar dependências transitivas

3NF

NORMALIZAÇÃO

Exemplo:

Validar os Atributos das Entidades Conta e Banco:

CONTA BANCO#* número* data de aberturaO localidade

#* número* nome

administrado por

administrador de

Se um atributo não é dependente da chave da Entidade na sua totalidade, ele deve ser movido para outro no qual ele é dependente.

NORMALIZAÇÃO

A localidade de banco não depende da chave da entidade CONTA (O qual é composto pelo número da conta e número do banco), mas sim descreve unicamente o banco. Como não pode depender de apenas parte da chave, o correto é reposicioná-lo, colocando-a dentro de outra entidade mas apropriada (no caso, o BANCO), como segue:

CONTA BANCO#* número* data de abertura

#* número* nome

* localidade

administrado por

administrador de

NORMALIZAÇÃO

Exemplo:

Verificar se todos os atributos da Entidade Pedido são dependentes da chave da Entidade:

PEDIDO#*código* data do pedido* cód-cliente* nome cliente* status do cliente

PEDIDO

#* código

* data do pedido

CLIENTE

#* código

* nome

*status

para

solicitante de

NORMALIZAÇÃO

Se um Atributo depende de um outro Atributo Não-chave, movê-lo para o seu devido lugar, mas se o mesmo não existir, criar uma nova Entidade e Relacionar com a original após ter definida a chave desta nova Entidade.

NORMALIZAÇÃO

Exercício

Normalizar um modelo de Entidade-Relacionamento.

O MER apresentado a seguir não está normalizado. Redesenhe-o, produzindo um novo MER normalizado.

Para isso verifique Entidade por Entidade Se:

1. Não existem grupos repetitivos (1 FN)

2. Todos os atributos dependem da chave por inteiro (2FN)

3. Não tem algum Atributo dependente de outro Atribuo que não é chave ( 3 FN)

MATRÍCULA

ALUNO CURSO

O código do instrutor

O código do curso

#* código

* nome

* sobrenome

#* código* nome*código do instrutor* código do depto* nome do instrutor*nome do depto

para para

atributo de completado com

Normalização

Exercício (cont.)

NORMALIZAÇÃO

Resp.

MATRÍCULA

ALUNO INSTRUTOR

CURSO DEPARTAMENTO

#* id aluno

* nome

* sobrenome

#* código instrutor

*nome

#* código

*nome

#* código

*nome

recebedor de

designado

para

completo com

lecionado por

o professor de

oferecer para

oferecedor de

NORMALIZAÇÃO

RESOLVER RELACIONAMENTO (M:M)

Os atributos poder ser visualizados para serem associados com um Relacionamento M:M

Resolver um Relacionamento de M:M pela adição de uma Entidade Intersecção com aqueles Atributos:

NORMALIZAÇÃO

Exemplo:

Considerar o Relacionamento de M:M entre produto e vendedor.

Qual o preço corrente de um produto especifico a partir de um vendedor especifico?

PRODUTO VENDEDOR

#* id

* nome

*descrição

#* código

* nome

fornecido por

fornecedor de

NORMALIZAÇÃO

Replicar ou resolver um Relacionamento M:M com um nova Entidade Intersecção e adicionar dois Relacionamentos M:1

Exemplo:

O relacionamento M:M entre produto e vendedor pode ser resolvido pela adição de uma Entidade Intersecção ITEM_CATALAGO.

O preço corrente é realmente um Atributo da Entidade Catálago.

CATÁLOGO VENDEDOR

PRODUTO

*preço

*qtde de pacotes

*unidade de medidas

#*código

*nome

#*id

*nome

*descrição

para

fornecedor de

para

fornecidopor

NORMALIZAÇÃO

Uma Entidade Intersecção é freqüentemente identificada pelas Entidades que originam o Relacionamento – note as duas barras.

Os relacionamentos a partir da Entidade Intersecção são sempre obrigatórios.

Entidades Intersecção freqüentemente representam Entidades no sentido real da palavra do negócio.

fornecedor de

NORMALIZAÇÃO

POSICIONAMENTO DAS ENTIDADES INTERSECÇÃO

LAY-OUT RELACIONAMENTOS M:M

NORMALIZAÇÃO

POSICIONAMENTO DAS ENTIDADES INTERSECÇÃO

LAY-OUT ENTIDADE INTERSECÇÃO

ENTIDADE REFERENCIAL

ENTIDADE INTERSECÇÃO

NORMALIZAÇÃO

A chave de uma Entidade Intersecção é geralmente composta pelas chaves duas Entidades Originárias.

Exemplo:Resolver o seguinte Relacionamento M:M para acomodar estas necessidades adicionais

“Tratar a data de matrícula de um estudante no curso, a data de conclusão do curso e também o grau do curso”

ALUNO CURSO#* id

*último nome

*primeiro nome

O telefone

#* código

*nome

O taxa de matrícula

O duração

matriculado em

assistido por

MATRÍCULA

ALUNO CURSO

* data da matrícula

O data da conclusão

O grade

#* id

* último nome

* primeiro nome

* telefone

#* código* nome

O taxa de mensalidade

O duração

para para

matriculado em

assistido por

Normalização

Solução:

NORMALIZAÇÃO

Exercício:

Resolver o Relacionamento M:M para acomodar estas necessidades:

“Tratar de cada empregado, a data de atribuição num projeto e a duração daquela atribuição”

FUNCIONÁRIO PROJETO

#* id

*nome

#* número

*título

designado por

designação para

DESIG DE TRABALHO

FUNCIONÁRIO PROJETO

* data de designação

O duração

#* id

* nome#* código* título

para de

atribuído sujeito de

Modelagem Avançada

Solução:

NORMALIZE O SEGUINTE ESQUEMA

file:teorica_Form

asNorm

ais.ppt

61

EXERCÍCIO – NORMALIZAR ATÉ 3FN

Congresso: DB25 – Advances in Database Systems

GTs promotores: GT3.1 – Database Systems

GT3.3 – Database Conceptual Modeling

Cód. Artigo Título Assunto Cód. Autor Nome autor

1 Integração em BD BDs Hete-rogêneos 2 Wen-Suan Li

2 Segurança Dinâmica BDs Hete-rogêneos 421

Chris ClitN.B. Idris

3 Métodos de agrupamento BDs Espaciais 73212

W.A. GrayR. ChuchRaymond Ng

4 Otimização eDesempenho Otimização 1436

Jiawey HanKurt Brown

5 DB O.O. Orientação a objeto 1 Janet Wiene

Congresso: OO03 – Objected Oriented Modeling

GTs promotores: GT4.6 – Engenharia de Software

Cód. Artigo Título Assunto Cód. Autor Nome autor

1 Aspectos temporais Modelagem temporal 2 Wen-Suan Li

62