Download - Nomenclatura em Banco de Dados

Transcript

UNIVERSIDADE SÃO JUDAS TADEU - USJT

Osvaldo Rodrigues Sérgio

NOMENCLATURA EM BANCO DE DADOS

São Paulo 2010

UNIVERSIDADE SÃO JUDAS TADEU - USJT

Osvaldo Rodrigues Sérgio

NOMENCLATURA EM BANCO DE DADOS

Trabalho de Conclusão de Curso apresentado ao Pós-graduação Latu Sensu da Universidade São Judas Tadeu, como requisito parcial para conclusão do curso de Especialização em Engenharia de Software. ORIENTADOR: Prof. Mst Aluízio Saiter

São Paulo 2010

UNIVERSIDADE SÃO JUDAS TADEU - USJT

Osvaldo Rodrigues Sérgio

NOMENCLATURA EM BANCO DE DADOS

Aprovada em ____________________________

____________________________________ ORIENTADOR: Prof. Mst Aluízio Saiter

À todos que, de alguma forma ajudaram-me a realizar este trabalho.

RESUMO

Este trabalho tem por objetivo contribuir para conscientização de uso de normas de

padronização na nomenclatura utilizada objetos e atributos nos bancos de dados

relacionais (tabelas (entidades), atributos, chaves primárias, chaves estrangeiras,

visões (views), esquemas (schemas), procedimentos (procedures) e funções

(functions)). Tem-se por base a norma ISO/IEC 11.179-5.

Palavras-chave: Banco de dados; padronização; nomenclatura

ABSTRACT

This work has objetive to contribute for awareness about the use of rules of

standardization of nomenclature used by objects e attributes in data base relationals

(tables (entity), attributes, primarys keys, foreign keys, views, schemas, procedures

and functions. The base the norm ISO/IEC 11,179-5.

KeyWords: DataBase; standardization; nomenclature

SUMÁRIO

INTRODUÇÃO ...................................................................................................................................... 8

ANÁLISE DO PROBLEMA ........................................................................................................................ 10

ESTUDO DE CASO .................................................................................................................................. 13

SOLUÇÕES PROPOSTAS ......................................................................................................................... 17

PEQUENA EXPLANAÇÃO SOBRE BANCO DE DADOS ............................................................................. 18

NOMENCLATURAS ................................................................................................................................. 21

1ª SUGESTÃO - PROPOSTA DE NOMENCLATURA.................................................................................. 23

1. Objetos do banco de dados: .................................................................................................... 23

2ª SUGESTÃO – DICIONÁRIO DE DADOS BANCO DE DADOS ................................................................ 28

COMPARAÇÃO ENTRE AS PROPOSTAS .................................................................................................. 31

CONCLUSÃO .......................................................................................................................................... 33

REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................................................. 35

ANEXOS ................................................................................................................................................. 36

1 – Apêndice A................................................................................................................................... 36

INTRODUÇÃO

Muito se fala sobre a importância de documentação e padronização na

confecção de projetos de softwares, de como isto é um facilitador para o trabalho de

codificação e mesmo de manutenção em sistemas de aplicativos.

Porém, pouco se fala sobre como deve ser documentado e padronizado o

banco de dados, especialmente a normatização da nomenclatura utilizada em banco

de dados (entidades, atributos, chave primária, chave estrangeira e outros).

Esta monografia visa aprofundar sobre como esta normatização facilitaria a

documentação e a manutenção do banco de dados e as vantagens que isto

acarretaria em todo o processo de confecção da codificação dos programas que o

acessa.

A resistência dos profissionais da área do uso de padrões vão desde a

aversão à documentação, principalmente no que se refere ao banco de dados, até a

clássica “desculpa” de que o projeto está atrasado e que não dará tempo de fazer as

revisões técnicas do código, sendo portanto desnecessário o uso de padrões.

Talvez esta “cultura” esteja dissiminada devido haver no mercado a

fragmentação do processo de codificação, passando para profissionais do tipo “free-

lancers” a responsabilidade de confeccionar parte do código, informando tão

somente o que esta parte de código deverá realizar.

Outra probabilidade estaria no fato de não haver um modelo aceito

universalmente por todos, apesar de já existir uma norma internacional que foi

imposta.

ANÁLISE DO PROBLEMA

Ao analisarmos código de programas de computadores escritos por

programadores, sejam em versões iniciais ou versões de manutenção, é muito

comum não encontrarmos a documentação deste programa, ainda mais se for uma

versão mais antiga, por volta de 05 anos de uso, nem encontrarmos uma

padronização no programa, seja de nomes de variáveis, de funções, de rotinas ou

de modo de programação. Mais raro ainda é encontrar documentação do dicionário

de dados do banco de dados, onde é descrito todo o banco de dados que este e

outros programas utilizam.

É natural, com o passar dos anos, que haja novos requisitos e que seja

necessário alterar ou adaptar o banco de dados. Relatar estas mudanças no

dicionário de dados é o que não ocorre, seja por simples descaso ou por não existir

o mesmo.

Neste caso, o analista ou programador que for analisar o código, precisará

analisar o programa inteiro para tentar compreender o que está sendo realizado pelo

código.

Com referência ao banco de dados, muitas vezes, os nomes dados a campos

do banco de dados não são nem um pouco sugestivos, tendo nomes como: campo1,

campo2, campo3, etc. Alguns nomes são melhores denominados, como: código,

nome, estado, descrição, valor, etc.

O problema do primeiro tipo de denominação é descobrir o que cada campo

está armazenando. No segundo é mais simples deduzir o que cada campo

armazenará. Nos dois casos, não sabemos de qual tabela pertence estes campos.

No caso dos relacionamentos entre as tabelas, também é uma análise a parte. No

primeiro caso, se uma tabela possui como chave primária o campo campo1, na

tabela em que esta chave é exportada, geralmente vai com nome diferente e com

uma contagem sequencial, ou seja, pode estar com o nome campo20, por exemplo.

E este tipo de denominação de nomes não está restrito à programas de

aplicativos vendidos em lojas, tipo Administração de Condomínios, Estoque e outros,

mas a empresas que desenvolvem aplicativos internos.

Quando uma equipe é contratada para analisar um programa e fazer

aperfeiçoamentos nele, a principal reclamação recai sobre o banco de dados, pois,

geralmente o banco de dados não está normalizado e há muitos dados redundantes,

causados pelo não levantamento de requisitos para sua concepção. E na análise

deste banco, a dificuldade de identificação dos conteúdos armazenados e a que se

refere este conteúdo, provoca atrasos nos prazos estabelecidos pelos gerentes ao

cliente. É bastante comum, devido a estes fatores, haverem na empresa vários

banco de dados para cada sistema implantado na organização, onde o usuário deve

repetir os dados para cada sistema existente. Com uma padronização, este

problema poderia ser, se não eliminado, pelo menos amenizado. E isto não ocorre

somente em pequenas empresas mas também nas médias e grandes empresas.

A necessidade de informações faz com que as organizações preocupem-se

em absorver dados das mais diversas maneiras e fontes. O grande problema é que,

muitas vezes, não existe o gerenciamento destas informações, que permeiam em

uma empresa ou órgão, a partir da criação e manutenção do banco de dados, o que

reflete na incoerência dos dados, podendo, assim, ocasionar significativos

problemas para as futuras análises. As empresas tem as informações, porém, não

tem como recuperá-las, ou recupera-as em parte. Um dos métodos de gerenciar as

informações é ter conhecimento delas, o que é facilitado pela implantação de

padronização.

A implantação de programas de padronização em banco de dados é vista

muitas vezes como mais uma burocracia e “burrice”, mas esquece que há

padronizações em linguagens de programação, como a Linguagem Java, em que

convencionou-se que todas as classes sejam escritas com a primeira letra em caixa

alta e as demais em caixa baixa de cada palavra que a compõe e que os métodos

sejam escritos em caixa baixa a primeira palavra, e em caixa alta a primeira letra das

demais palavras.

A princípio, houve vários argumentos contra este tipo de convenção, mas com

o passar dos anos e com o crescimento da linguagem, notou-se que é facilmente

identificável cada parte do programa. O mesmo espera-se para o banco de dados,

quando houver uma padronização ampla.

O maior dano que a não padronização acarreta é o aumento de custo na

manutenção destes sistemas, em que muitas vezes o retrabalho sai mais caro do

que reescrever todo ou parte do sistema.

ESTUDO DE CASO

Uma empresa de monitoramento de alarmes desenvolveu um sistema para

seu cliente, onde informações enviados de um painel de monitoramento de alarmes,

eram coletadas via porta serial pelo sistema e exibido no monitor o local onde o

alarme ocorreu. Este sistema foi desenvolvido 03 anos antes, sendo bem recente

sua confecção. Esta empresa solicitou uma atualização do sistema para acrescentar

novas funcionalidades e recursos, que fora solicitado pelo seu cliente.

Fazendo a verificação do sistema, constatou-se que não havia nenhuma

documentação sobre o sistema e nenhuma padronização de variáveis ou de rotinas,

sendo que várias rotinas eram repetidas em vários locais. Não havia comentários no

código também. Iremos focar somente a parte de banco de dados, no qual também

não tinha nenhuma documentação, dicionário de dados do banco de dados ou um

padrão na definição dos nomes dos campos.

O banco de dados utilizado neste sistema era o Microsoft Access, com o

nome de Sensor.mdb. Abaixo segue a relação das tabelas e seus respectivos

atributos, com o tipo de campo de cada um.

Tabela: Sensores

Nome do campo: Tipo de Dados

NPonto Número

NPorto Número

NPartição Número

NSensor Número

Descrição Texto

PosiçãoX Número

PosiçãoY Número

SeguirPartição Sim/Não

CorArmDes Número

CorArmAti Número

CorArmRes Número

CorByP Número

CorDes Número

Situação Número

Ponto Número

Condições Texto

Tipo Número

Tabela: TipoSensor

Nome do campo: Tipo de Dados

Tipo Número

Descrição Texto

Tabela: Partição

Nome do campo: Tipo de Dados

Porto Número

Partição Número

Descrição Texto

Tabela: Código

Nome do campo: Tipo de Dados

Código Texto

Descrição Texto

Tabela: 52@52@&

Nome do campo: Tipo de Dados

48@53@& Memorando

56@52@& Memorando

57@52@& Texto

Este sistema também gera, mensalmente, uma novo banco de dados, onde

são armazenados as ocorrências do sistema de alarme do referido mês, em que o

nome do banco de dados é Ano_Mês.mdb (AAAA_MM.mdb). Segue abaixo a

relação da tabela:

Tabela: Ocorrências

Nome do campo: Tipo de Dados

Contador Número

DataM Texto

HoraM Texto

DataP Texto

HoraP Texto

Porto Texto

Partição Texto

Sensor Texto

Ocorrência Texto

Operador Texto

Outros Texto

De posse destes dados, foi realizado uma análise do banco de dados. Porém,

como os nomes da maioria dos atributos não indicavam o que significavam,

levantamos os problemas:

1 – O que significava e o que armazenava cada atributo;

2 – A falta de relacionamentos entre as tabelas;

3 – Tabela e atributos com nomes totalmente estranhos (tabela

52@52&);

4 – Tabela de ocorrências não mantinha os tipos de dados compatíveis

com os das tabelas do sistema.

5 – Nomes de tabelas e atributos com caracteres especiais.

Para solução deste problema, foi proposto os seguintes passos:

1 – Executar o sistema linha a linha para entender como o sistema

trabalhava com os dados do banco de dados;

2 – Estudar o painel de monitoramento, para analisar os dados

enviados pelo mesmo ao sistema;

No trabalho realizado, devido aos problemas apresentados, a atualização do

sistema, que inicialmente tinha uma previsão de 03 meses, teve um atraso de 04

meses, sendo 01 mês referente ao banco de dados, totalizando 07 meses para

execução desta atualização. O sistema foi praticamente reescrito e o banco de

dados foi remodelado para melhor performance, ou seja, o nosso cliente teve um

acréscimo de custos devido a falta de documentação e padronização, custos estes

que poderiam não existir caso houvesse uma preocupação de se documentar, ou

pelo menos colocar comentários no código do sistema.

SOLUÇÕES PROPOSTAS

Nesta monografia há dois tipos de soluções apresentadas para o problema da

denominação dos nomes dos campos do banco de dados.

Na primeira proposta, será utilizado o uso de padronização, com base na

International Organization For Stantardadization / International Electrotechnical

Commission - ISO/IEC 11.759 (Organização Internacional de Padronização /

Comissão Internacional Eletrotécnica) na nomenclatura dos objetos que compõe um

banco de dados, em que apresento uma pequena introdução.

Na minha segunda proposta, será utilizado a implantação e uso do dicionário

de dados do banco de dados completo. Nesta proposta, será feito uma junção de

vários temas sobre o assunto e elementos utilizados por mim, já que a literatura

disponível, apesar de mencionarem sobre o tema, não os aprofunda.

PEQUENA EXPLANAÇÃO SOBRE BANCO DE DADOS

Banco de dados ou base de dados é um conjunto de registros dispostos em

estrutura regular que possibilita a reorganização dos mesmos e produção de

informação. Um banco de dados normalmente agrupa registros utilizáveis para um

mesmo fim. (Wikipédia). Segundo Celso Henrique Poderoso de Oliveira, um banco

de dados é um conjunto coerente e lógico de dados relacionados que possuem

significância intrínseca. Esses dados representam aspectos do mundo real e devem

ser mantidos para atender aos requisitos da empresa. Estes dados estão dispostos

em uma ordem predefinida para atender a determinadas necessidades dos usuários.

Como há mais de um tipo de banco de dados (hierárquico, relacional, rede e

objeto-relacional), nesta monografia, atentaremos para o banco de dados relacional,

mesmo que seja aplicado à outros modelos.

No modelo relacional, temos objetos a qual nomeamos de Esquemas, que é o

banco de dados em si, Entidades, também chamadas de tabelas, tuplas ou registros,

atributos, visões (view), procedimentos (procedures), chave primária (primary key),

chave estrangeira (foreign key) e chave única (unique key).

Entidades, mais conhecidas como tabelas, são os objetos centrais e mais

importantes em um banco de dados relacional. O propósito principal de qualquer

banco de dados é armazenar dados gravados logicamente em tabelas. Um dos

princípios no desenvolvimento do banco de dados relacional é que cada tabela

armazena informações sobre um específico tipo de coisa ou Entidade. (Kriegel, Alex

and Trukhnov, Boris M. SQL Bible, Second Edition, página 83).

Tuplas, comumente chamadas de registros, são linhas horizontais de dados e

cada registro contém dados sobre um item da entidade, por exemplo, um registro de

cliente contém informações sobre um único cliente.

Atributos são campos onde armazenamos um tipo particular de informação

para todos os registros da entidade, por exemplo, um atributo nome contém

informações sobre os nomes dos clientes.

Visões (views) são tabelas lógicas, em que selecionamos somente o que é

relevante para determinado usuário. Isto é feito para preservar a confidencialidade

de alguns atributos. As visões não são tabelas físicas, ou seja, não há dados

armazenados nela, somente comandos SQL (Structure Query Language) que

acessam as tabelas e retornam os dados desejados.

Procedimentos (store procedures) são funções internas aos bancos de dados

que realizam rotinas que o DBA (DataBase Administrator) queira automatizar. Cada

fabricante de banco de dados tem linguagem proprietária sobre os procedimentos.

Chave primária (Primary Key) são atributos que identificam unicamente uma

instância da entidade que representa.

Chave estrangeira (Foreing Key) são as chaves primárias que são exportadas

para outra entidade com a finalidade de realizarmos os relacionamentos do banco

de dados.

Chave única (Unique Key) são os atributos que, não podem ser chave

primária por não atender aos requisitos de chave primária, porém não podem ter

valores repetidos na tabela.

NOMENCLATURAS

Há atualmente a norma ISO/IEC 11.179, que tenta padronizar os nomes

atribuídos aos componentes do banco de dados. Por ser muito genérica e de pouco

conhecimento, ainda não foi absorvida pelos fabricantes de software e pelos

programadores.

Em vários fóruns sobre o tema, há muita discrepância entre os

programadores, sendo a favor ou sendo contra a implementação da padronização.

Muitos usuários acham isto uma completa tolice, que acarretaria em mais

documentação e restrição à programação, já que teriam que “decorar” as regras de

nomenclatura. Outros acham a idéia interessante, porém como cada organização

tem sua própria padronização, isto limita e/ou atrapalha na hora de codificar o

programa.

O que muitos programadores esquecem é que na codificação de um

programa, as idéias e a lógica estão “frescas” na memória e que é fácil lembrar-se

de detalhes. Porém, após algum tempo, estes detalhes são perdidos e torna-se

trabalhoso fazer manutenções no código. Isso quando é o mesmo programador.

Quando um outro programador irá continuar ou modificar o código, será necessário

uma perda de tempo para que o mesmo leia o código e entenda, não a lógica, mas

os termos utilizados pelo antecessor, o que causa um retrabalho desnecessário se

estivesse utilizando um padrão na codificação.

O mesmo ocorre na parte de banco de dados. Ocorrem fatos, dentro de uma

mesma organização, em que há ambiguidade para um mesmo banco de dados. Por

exemplo na tabela cliente, um atributo é chamado de Nome e em uma tabela

funcionario também é chamado de Nome. Na codificação, é muito comum que o

programador referencie um atributo de uma tabela na intenção de referenciar este

atributo a uma outra tabela.

Para evitar estes erros, é necessária a padronização. Como dito antes, muitas

empresas possuem padrões internos, e geralmente estes padrões são diferentes

entre as empresas. Como é comum no mercado a terceirização da codificação, um

programador pode codificar programas de várias empresas, o que torna trabalhoso

para o mesmo lembrar-se do padrão de cada um, o que leva a considerar a

padronização uma bobagem.

Lendo as padronizações de diversas empresas, nota-se que as diferenças

entre elas são pequenas, o que tornaria a implementação de uma padronização

universal mais simples.

1ª SUGESTÃO - PROPOSTA DE NOMENCLATURA

1. Objetos do banco de dados:

Todos os objetos poderão ser identificados com até 30 (trinta) caracteres,

serem em caixa alta e no singular.

Não poderão ser utilizadas palavras reservadas (vide apêndice A) e

caracteres especiais, incluindo parênteses, aspas, pontos de interrogação, dólar ($),

hash (#), barra (/), contra-barra (\) e hífen (-) .

Na tabela abaixo segue objetos, regras, exemplos e motivo das

nomenclaturas propostas.

Objeto Regras Exemplo Motivo

Banco de dados Iniciado por DB_

- Ter um nome relevante ao que armazena, ou; - Conter uma identificação resumida do sistema;

DB_CLIENTE DB_RH

A prefixo DB_ facilita o gerenciamento e o reconhecimento imediato de um objeto banco de dados.

Tabela Iniciado por TB_

- Ter um nome relevante ao que armazena;

TB_CLIENTE TB_FUNCIONARIO

Segue a norma ISO/IEC 11.179-5 e representa a entidade no banco de dados.

Visões (views) Iniciado por VW_

- Ter um nome relevante ao que armazena;

VW_CLIENTE VW_FUNCIONARIO

Idem ao da tabela

Objeto Regras Exemplo Motivo

Visões materializadas Iniciado por VM_

- Ter um nome relevante ao que armazena;

VM_CLIENTE VM_FUNCIONARIO

Idem ao da tabela

Tabelas de sistema Iniciado por TS_

- Ter um nome relevante ao que armazena;

TS_ESTADO TS_ESTADO_CIVIL

Idem ao da tabela.

Tabelas de log de operações Iniciado por TL_

- Ter o nome da tabela em que armazenará o log;

TL_CLIENTE

Idem ao da tabela.

Constraint Check Iniciado por CK_

- Ter o nome do atributo;

CK_CLI_SEXO Informa a tabela e o atributo a que pertence e impede de haver repetições de nome das constraint no banco de dados.

Constraint Primary Key (chave primária) Iniciado por PK_

- Ter o nome do atributo;

PK_CLI_COD Informa a tabela e o atributo a que pertence e o impede de haver repetições de nome das constraint no banco de dados.

Constraint Foreign Key (chave estrangeira) Iniciado por FK_

- Ter o nome do atributo da tabela de origem; - Ter o nome da tabela destino;

FK_CLI_COD_PED Informa a tabela de origem do atributo, o nome do atributo e a tabela que recebe o atributo.

Constraint Unique Key (chave única) Iniciado por UQ_

- Ter o nome do atributo;

UQ_CLI_CPF Informa a tabela e o atributo que é chave única e não chave primária.

Objeto Regras Exemplo Motivo

Index Iniciado por IN_

- Ter o nome da tabela e dos atributos que o compõe;

IN_CLI_NOM_END Informa a tabela e os atributos que o compõe.

Funções Iniciado por FC_

- Ter um nome relevante sobre o que faz;

FC_CALCULA_DV Informa o que a função realiza.

Stored Procedures ( Procedimentos armazenados) Iniciado por SP_

- Ter um nome relevante sobre o que faz; - Ter a tabela que será afetada;

SP_ALTERA_CLI Informa o que o procedimento faz e a tabela que afeta.

Trigger Before / After Insert (Gatilho antes / depois da inserção) Iniciado por TBI_ TBA_

- Ter o nome da tabela; - a tabela deve perder o prefixo TB_, exceto se for tabela de log;

TBI_CLIENTE TAI_CLIENTE TBI_TL_CLIENTE TAI_TL_CLIENTE