Tesi Dados Final

Post on 20-Jun-2015

1.315 views 1 download

Transcript of Tesi Dados Final

PETIC – DADOShttp://tesidados.blogspot.com/

Danilo Melo Rocha

Jéssica Caroso Andrade

Luana Barreto da Silva

Vinícius Almeida T. Barreto

Roteiro

• Introdução• Estudo de Caso – CPD UFS• Trabalhos Relacionados• Conceitos e Tecnologias• Possíveis Soluções• Conclusões• Bibliografia

Introdução

• PDTIC – Plano de Desenvolvimento em Tecnologias de Informação e Comunicação

• Planejamento envolvendo todas as áreas e atividades da empresa, com a intenção de eliminar os problemas existentes, criando soluções inovadoras, dando ênfase ao que a empresa possui de melhor, otimizando seus processos e tornando-a competitiva. 

Estudo de Caso – CPD UFS

• O banco de dados utilizados é o DB2;

• Não se cogita a possibilidade de mudança

para um BD de código aberto;

• Espaço de armazenamento suficiente para

atender demanda;

• Backup manual diário;

Estudo de Caso – CPD UFS

• Espelhamento de dados;

• Ausência de interoperabilidade entre os

sistemas;

• Redundância de Informações (Crítico);

• Validação de dados, criptografia e geração

de relatórios a nível de sistema;

• Modelagem de dados deficiente;

Estudo de Caso – CPD UFS

• Deficiência quanto à documentação;

• Ausência de indicadores de qualidade e

produtividade;

• Ausência de auxílio online dos sistemas;

Trabalhos Relacionados

• PDI – UNIFESP (2000)

• PDI – ANVISA (2007-2009)

• Rede SUAS (2007)

Trabalhos Relacionados

• PDI - UNIFESP

– Banco de Dados Institucional estruturado para armazenar, gerenciar e avaliar as atividades da graduação, pós-graduação, pesquisa e extensão, compreendendo a Matrícula Única dos alunos da universidade;

– Remodelar os dados de tal forma que eles fiquem flexíveis ao ponto de permitirem a interoperabilidade com os sistemas do Ministério de Educação;

Trabalhos Relacionados

• PDI - UNIFESP

– Adoção de um software gerenciador de banco de dados livre como o PostgreSQL;

– Criação de uma Comissão de Alimentação de Dados a fim de realizar as tarefas de migração constantes e validação dos dados para a nova base.

Trabalhos Relacionados

•   ANVISA- Padronização da documentação e

modelagem de sistemas (UML);

- Capacitação técnica para a melhor gerência dos dados da instituição;

- Segurança da informação;

- Metodologia de desenvolvimento de sistemas – RUP;

- Criação de unidades de cadastro – Validação e integridade das informações;

Trabalhos Relacionados

• Rede SUAS – Gestão e Sistema de Informação para o Sistema Único da Assistência Social

– Centralização do fluxo de dados evitando assim uma multiplicidade de canais, os quais geram informações conflituosas;

– Formalização de um Grupo de Trabalho, que recebeu o nome de Comitê Gestor de Tecnologia de Informação CGTI.

Conceitos e Tecnologias

• UML• RATIONAL ROSE• UMBRELLO• DATA WAREHOUSE• ERP• ERP SAP• BD: LIVRE X PROPRIETÁRIO

Conceitos e Tecnologias• UML

– É uma linguagem de modelagem de dados que visa facilitar o trabalho de documentação de sistemas;

– Auxilia na visualização do fluxo de dados à medida que agrupa diagramas da análise de requisitos, associações, generalizações, etc;

Conceitos e Tecnologias• UML

– Surgiu no final dos anos 80 e início dos anos 90;

– É uma linguagem de modelagem de projetos Orientada a Objetos, padrão da OMG;

– É uma notação principalmente gráfica utilizada por métodos para expressar objetos.

• Softwares para UMLComercias:– MagicDraw($1.599,00);– Togheter ($11.500,00);– Poseidon($1.549,00);– Jude($280,00 1 usuario/ano);– Rational Rose($5.995,00);– Enterprise Architect($2.500,00);

Conceitos e Tecnologias

Conceitos e Tecnologias

RATIONAL ROSE

– Ferramenta da IBM que permite a criação, análise, projeto, visualização, modificação e manipulação de componentes;

– Provê dois elementos essenciais da engenharia de software moderna:

• Desenvolvimento baseado em componentes;• Desenvolvimento iterativo controlado.

Conceitos e Tecnologias UMBRELLO

– Ferramenta livre através do uso do padrão da Linguagem de Modelagem Unificada – UML;

– Distribuído junto com o KDE nas distribuições GNU/Linux;

Conceitos e Tecnologias

UMBRELLO

- Plataformas Suportadas: -Gnu / Linux;- FreeBDS;- Solaris.

Conceitos e Tecnologias

UMBRELLO

Do que o Umbrello é capaz?- Desenhar e imprimir diagramas UML;- Gerar declarações de classes Java, PHP, Javascript, ActionScript, SQL, Ada, Python e outras;- Gerar arquivos gráficos;- Engenharia Reversa de classes;- Refatoração.

Conceitos e Tecnologias

UMBRELLO– Diagramas Suportados:

• Diagrama de Casos de Uso;• Diagramas de Classe;• Diagrama de Seqüência;• Diagrama de Colaboração;• Diagrama de Estados;• Diagrama de Atividades;• Diagrama de Componente;• Diagrama de Execução.

Conceitos e Tecnologias

• DATA WAREHOUSE

– Repositório de informações (armazém) que provê dados para processamento analítico e tomada de decisões.

– Conceito multidimensional.

Conceitos e Tecnologias

• DATA WAREHOUSE

Conceitos e Tecnologias

• DATA WAREHOUSE

– Modelos multidimensionais requerem

organização dos dados, métodos de acesso,

e métodos de implementação especiais;

– Por isso, são geralmente implantados em

servidores chamados de Servidores

relacionais OLAP, separados do SGBD’s

comerciais;

Conceitos e Tecnologias

• DATA WAREHOUSE

– O Data Warehouse possui um grande volume de

dados em relação aos Bancos de Dados

Relacionais;– O usuário do Banco de Dados relacional move a

engrenagem institucional. (OLTP)– O usuário do Data Warehouse observa o

movimento da engrenagem. (OLAP)

Conceitos e Tecnologias

• DATA WAREHOUSE

– A idéia básica é:• Extrair os dados da base;• Filtrar os dados desejados;• Integrar dados internos e externos em uma

estrutura única;• Apresentar os dados de maneira amigável e

eficiente.

Conceitos e Tecnologias

• DATA WAREHOUSE

Conceitos e Tecnologias

• DATA WAREHOUSE

– Seus Componentes são:

• Sistemas de Fontes Operacionais (Busca)

• Data Staging Area (Adaptação)

• Data Presentation Area (Apresentação)

• Ferramentas de Acesso

– Operações Comuns

• Limpeza

• Carregamento

• Refresh

Conceitos e Tecnologias

• DATA WAREHOUSE– Objetivos:

• Fornecer uma única imagem da realidade dos negócios para toda empresa;

• Melhorar a qualidade dos dados e o seu tempo de acesso;• Deve ser flexível, pois qualquer negócio está sujeito a

mudanças inevitáveis;• Contém informações preciosas e deve ser visto como as

jóias da coroa do Reitor;• Deve servir de suporte nas decisões da instituição, portanto

não devem haver inconsistências;• A instituição na sua totalidade deve aceitar o DWH, caso

contrário a estratégia de usá-lo estará fadada ao fracasso.

Conceitos e Tecnologias

ERP (Enterprise Resource Planning) ou SIGE

(Sistema Integrado de Gestão Empresarial)

– Sistemas de informação que integram as mais diversas áreas da organização;

– Aborda duas perspectivas:• Funcional;• Sistêmica.

Conceitos e Tecnologias

ERP (Enterprise Resource Planning) ou SIGE

(Sistema Integrado de Gestão Empresarial)

Vantagens:• Otimizar o fluxo e a qualidade da informação;• Otimizar o processo de tomada de decisão;• Reduz as incertezas do lead-time; • Reduzir custos.

Conceitos e Tecnologias

ERP (Enterprise Resource Planning) ou SIGE

(Sistema Integrado de Gestão Empresarial)

Desvantagens:• Altos custos de implantação;• A aquisição do ERP não é sinônimo de integração;• Excesso de controle sobre as pessoas;• Dependência do fornecedor do pacote.

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

Parâmetros de comparação:• Número de Usuários;• Crescimento da base de dados;• Estabilidade;• Robustez;• Desempenho;• Segurança;

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

Como base comparativa foi-se usado os

SGBD’s Oracle e DB2 (proprietários) e

PostgreSQL (Livre);

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

• Funcionalidades Fundamentais

SGBD ACID Integridade Referencial

Transações Unicode

DB2 Yes Yes Yes Yes

Oracle Yes Yes Yes Yes

PostgreSQL Yes Yes Yes Yes

ACID = Atomicidade, Consistência, Isolamento e Durabilidade

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

• Tabelas e Visões

SGBD Tabela Temporária

Visão Materializada

DB2 Yes Yes

Oracle Yes Yes

PostgreSQL Yes No

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

• Índices

Árvores B/B+ são consideradas “básicas”, suportadas por todos os SGBDs.

GiST = unifica diversas árvores de busca populares em uma única estrutura de dados.

SGBD R-/R+ Tree Hash Parcial GiST

DB2 No ? No No

Oracle Only edition Yes Yes No

PostgreSQL Yes Yes Yes Yes

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

• Operadores de Conjunto

SGBD União Inner Joins Outer Joins Merge

DB2 Yes Yes Yes Yes

Oracle Yes Yes Yes Yes

PostgreSQL Yes Yes Yes Yes

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

• Outros objetos nativos

FONTE: Universidade Estadual do Oeste do Paraná

SGBD Domínio de Dados

Cursor Triggers Funções Procedure External routine

DB2 No Yes Yes Yes Yes Yes

Oracle Yes Yes Yes Yes Yes Yes

PostgreSQL Yes Yes Yes Yes Yes Yes

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

Quanto à robustez, desempenho e

estabilidade, todos os SGBD’s apresentam

melhor desempenho no Linux ou em algum

UNIX-like. E todos eles, com exceção do

Microsoft SQL Server, possuem

implementações para o SO citado.

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

Comparando os parâmetros citados acima,

basicamente não houve diferenças

significantes entre os demais.

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

As diferenças surgem quando se pensa em

montar um Data Warehouse, pois o

PostgreSQL ainda é deficiente neste campo.

Porém, o PostgreSQL otimiza operações de

consulta (maioria na instituição), tornando

trabalhos de acesso ao banco mais eficientes

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

Suporte do SGBD Livre:

Comunidades na Internet;

Empresas especializadas em suporte à SGBD’s

Livres. Exemplos:

Dextra Sistemas

dbExperts

Conceitos e Tecnologias

Banco de Dados: Livre X Proprietário

A escolha deve ser feita em cima das

seguintes perguntas: “Qual a real

necessidade da instituição? A quem ela se

dirige?”

Soluções

• BANCO DE DADOS

– A UFS necessita de um banco de dados seguro, estável,

que opere bem as realizações de consulta, que suporte

grande volume de dados.

– Utilizar PostgreSQL

– Vantagens:

– Sem licença;

– SGBD mais leve e possui basicamente todas as

outras funcionalidades do atual (DB2);

– Otimiza a operações de consulta.

Soluções

• REDUNDÂNCIA DE DADOS

– Remodelagem do Banco de Dados;

– Sistema Unificado de Matrícula;

• MODELAGEM E MANUTENÇÃO– Modelagem dos dados utilizando a

ferramenta, UMBRELLO;– Terceirização do serviço de modelagem e

migração dos dados;

Soluções

• PLANEJAMENTO E ANÁLISE

– Observar o desempenho da Instituição

utilizando tecnologias como Data

Warehouse;

– Mudanças na base de dados serão

planejadas e aprovadas por um conselho

interno;

Soluções

• PLANEJAMENTO E ANÁLISE

– O Data Warehouse na Instituição:

• Rastrear atividades que envolvem datas e prazos;

• Documentos requisitados, enviados e recebidos;

• Informações financeiras (o RESUN deu lucro hoje?); =)

• Evitariam as práticas de fraude financeira;

• Estatísticas sobre testes e avaliações de professores;

• Estatísticas sobre cursos;

• Informações estatísticas de outras universidades;

Soluções

• PLANEJAMENTO E ANÁLISE– O Data Warehouse na Instituição:

• Rastrear atividades que envolvem datas e prazos;

• Documentos requisitados, enviados e recebidos;

• Informações financeiras (quanto lucrou o RESUN, hoje?); =)

• Evitariam as práticas de fraude financeira;

• Estatísticas sobre testes e avaliações de professores;

• Estatísticas sobre cursos;

• Informações estatísticas de outras universidades;

– Nesse caso, o uso de um SGBD mais maduro se faz necessário. IBM/DB2 ou

Oracle;

– Desvantagem: Cuidado em alimentar o DWH – tempo e esforço;

Soluções

ERP SAP (System Application & Products)

– SAP é uma empresa é uma empresa multinacional de TIC que desenvolve sistemas que consistem em um conjunto de aplicações rodando sobre uma única base de dados empresarial.

– O software SAP ERP é constituído de quatro soluções individuais:

• SAP ERP Financials;• SAP ERP Human Capital Management;• SAP ERP Operations;• SAP ERP Corporate Services.

Conclusões

• O VALOR DA INFORMAÇÃO

– Quanto vale a informação que

gerenciamos?

– Investimento X Lucro

– Lucro = Ensino de Qualidade

– TIC’s - ferramentas de obtenção de lucros.

Bibliografia

OLIVEIRA, Jamile. Aplicações do JAD no PDI. Paraná: 2002. Disponível em <http://www.pr.gov.br/batebyte/ edicoes/2002/bb117/estagiario.htm> Acesso em 2 jun. 2008.

Plano Diretor de Informática - Unifesp/EPM. Botucatu: 2008. Disponível em <http://www.unifesp.br/reitoria/orgaos /comissoes/informatica/pdi.htm> Acesso em 2 jun. 2008.

TAPAJÓS, Luziele; RODRIGUES, Roberto Wagner. Rede SUAS MDS. Brasília: 2007. Disponível em <http://www. mds.gov.br/sites/conferencias-1/arquivos/rede-suas-mds-atualizado.pdf> Acesso em 28 de mai. de 2008.

Bibliografia

SAID, Dulcelina; SANTOS, Nelci dos; MUSSI, Camilo. Plano Diretor de Tecnologia da Informação: ANVISA. [s.l]: 2007. Disponível em <http://www.anvisa.gov.br/layout_sistema/cd/ pdti _mar2007.pf> Acesso em 28 mai. 2008.

SOWEK, Carlos Alberto. O que é Data Warehouse?. Curitiba: 2003. Disponível em <http://www.pr.gov.br/batebyte/edicoes/ 1997/bb62/warehouse> Acesso em 18 jul. 2008.

ESMIN, Ahmed. Modelando com UML. Disponível em <http:// www.dcc.ufla.br/infocomp/artigos/v1.1/tutorialUML.pdf>. Ji-Paraná: [s.a.]. Acesso em 15 jul. 2008.

Bibliografia

Manual do Umbrello UML Modeller. 2003. Disponível em <http://docs.kde.org/stable/pt_BR/kdesdk/umbrello/> Acesso em 17 jul. 2008.

Rational Rose. [s.l.]: 2008. Disponível em <http://pt.wikipedia. org/wiki/Rational_Rose> Acesso em 17 jul. 2008.

MORAES, Anderson. Trabalho sobre ERP: Enterprise Resource Planning. Curitiba: 2004. Disponível em <http:// pessoal.cefetpr.br/lapeplow/Paginas/ERP0104.pdf> Acesso em 18 jul. 2008.

Bibliografia

ERP. Disponível em <http://pt.wikipedia.org/ERP> [s.l]: 2008. Acesso em 18 jul. 2008.

MySQL X PostgreSQL: Quando usar cada um. Disponível em <http://www.lozano.eti.br/palestras/pgsql-mysql.pdf> Acesso em 22 jul. 2008.

KIMBALL, Ralph. Dimensional Modeling Primer. In:___. The Data Warehouse Toolkit. EUA: Wiley Computer Publishing, 2002. pg 01~27.

KIMBALL, Ralph. Education. In:___. The Data Warehouse Toolkit. EUA: Wiley Computer Publishing, 2002. pg 243~254.

Bibliografia

Dextra Sistemas. Disponível em <http://www.dextra.com.br/postgres/ index.htm> [s.l]: 2008. Acesso em 15 jul. 2008.

dbExperts. Disponível em <http://www.dbexperts.com.br/> Acesso em 15 jul. 2008.

BOSCARIOLI, Clodis. Comparação entre SGBDs. Disponível em <www.inf.unioeste.br/~clodis/BDI/BDI_2007_Modulo7.pdf> Acesso em 15 jul. 2008.

VIERA, Tiago. Banco de Dados Proprietário X Livre. Disponível em <http://www.vivaolinux.com.br/artigos/verArtigo.php?codigo=5222&pagina=3> Acesso em 17 jul. 2008