Capítulo 7: Construindo SAD orientado a dados e documentos
Como os gerentes acessam e usam grandes bancos de dados de fatos históricos e externos?
SAD orientado a dados
Provêem o acesso e a manipulação de dados históricos e, em alguns casos, de dados externos
Sistemas de arquivos simples que oferecem facilidades para recuperação de dados, com funcionalidades diversas
Armazém de dados trazem algumas funcionalidades adicionais
Ferramentas OLAP SIE e GIS
SAD orientado a documento
Análise e recuperação de documento Um conjunto de docs relacionados e pouco
estruturados Máquinas de busca, ferramentas de
indexação e sumarização Gestão de doc e de conhecimento
Comparação entre os dois tipos de SAD Dados estruturados vs. não estruturados Diferentes ferramentas de análise Armazenamento de dados e documentos Recuperação e indexação Atendimento de necessidades do usuário O que deve ser feito e quando???
Armazéns de dados
Orientado a assunto Foco nos aspectos de negócio ou no seu formato
organizacional (clientes, fornecedores, e empregados) Integrado
Os dados são armazenados num formato consistente com uso de padrões, áreas de domínio, atributos físicos e valores
Considera da idade do dado Mantém a integridade do dado
O dado não se altera enquanto estiver no armazém de dados
OLAP - On-Line Analytical Processing Permite a criação de várias visões e
representações dos dados BD multidimensional
Captura e apresenta dados e conjuntos de dados que são dimensionados com a ajuda de atributos relevantes
SIE (Executive Information System) Ênfase em dados gráficos Retira informação do BD corporativo Provê relatórios executivos para a alta
gerência Foram inicialmente desenvolvidos sem
ligação com SAD
SAD espacial
Um sistema de suporte que manipula grandes quantidades de mapas Auxilia as pessoas a acessar, manusear e
analisar dados que possuam conteúdo geográfico Exemplo: análise de áreas com altos índices de
crimes, análise de distribuição geográfica de clientes, análise de zonas eleitorais, etc
SAD orientado a dados vs. BI
BI é um termo guarda chuva usado para sistemas de software que melhoram a tomada de decisão em negócios com o uso de SAD orientado a dados
Gerentes e SAD orientado a dados Gerentes esperam achar suas próprias
respostas para questões de negócios Gerentes NÃO querem esperar por relatórios
financeiros ou de mercado preparados por analistas que manipulam bases de dados
Gerentes são os clientes e defensores dos SAD orientados a dados
Dados de um SAD vs. Dados Operacionais Dados de um SAD – são dados SOBRE
transações e ocorrências Dados operacionais – são registros de dados
específicos sobre uma dada transação de negócio
Estes dois tipos de dados diferem em cinco dimensões: Estrutura do Dado, Validade, Sintetização, Volatilidade, e Dimensão
Dados de um SAD vs. Dados Operacionais Estrutura do Dado
Dados de um SAD Tabelas precisam ser agregadas para que uma
resposta seja obtida a uma query Não inclui detalhes de uma transação Inclui uma síntese da transação Pode ter redundância na estrutura de dados se isto
refletirá em maior velocidade – normalização não é uma necessidade
Dados de um SAD vs. Dados Operacionais Estrutura do Dado
Dados Operacionais Software e hardware são otimizados para suportar
transações sobre as operações rotineiras Armazenados em muitas tabelas Os dados armazenados representam informação sobre
uma transação específica
Dados de um SAD vs. Dados Operacionais Validade
Dados de um SAD É uma visão sobre o dado operacional num dado
momento do tempo Séries históricas do dado operacional Armazena múltiplas visões do dado operacional
Dado Operacional É o estado atual de uma dada transação de negócio
Dados de um SAD vs. Dados Operacionais Sintetização
Dados de um SAD Sintetizado na Base de Dados
Dado Operacional DETALHADO, não é sintetizado na tabela
Dados de um SAD vs. Dados Operacionais Volatilidade
Dados de um SAD Não são voláteis
Dados Operacionais São voláteis, os dados são alterados dependendo se
uma nova transação ocorre
Dados de um SAD vs. Dados Operacionais Dimensão
Dados de um SAD Têm múltiplas dimensões Sempre referente ao ponto de vista de um gerente ou
de um analista Dados Operacionais
Têm uma única dimensão
Metadados
Dados sobre dados Provêem um diretório que apóiam o DB de
um SAD na localização de conteúdo em DW ou repositórios de dados
Guias para localização de dados – mapeando-os do ambiente operacional para o ambiente do armazém de dados
Metadados
Servem como guias para os algoritmos de sintetização de dados detalhados
Informação semântica associada a uma dada variável
Deve incluir definições de negócio associadas ao dado, descrições de tipos de dados, potenciais valores, a fonte original do sistema, formatos de dados, e outras características
Síntese das DiferençasFatores Dados
OperacionaisDados de um SAD
Estrutura Dados normalizado integrado
Validade atual histórico
Síntese nenhuma extensiva em alguns sistemas
Volatilidade volátil não volátil
Dimensão Uma dimensão Múltiplas dimensões
Metadado desejável requerida
Uma arquitetura interconectada Armazenamento de dados
Uma ou mais bases de dados Componentes para extração de dados e
filtros Query e relatórios Interface para análise dados e apresentação
Implementação
Resultados que devem ser alcançados O armazenamento de dados não é estático –
visões temporais são adicionadas Infra-estrutura de suporte a decisão inclui
hardware, software, pessoas e procedimentos A estrutura para armazenamento de dado e a
implementação deve ser examinada no contexto de toda a infra do DSS
Implementação
Aspectos técnicos Deve prover análises requeridas com
desempenho aceitável Deve suportar as análises de dados requeridas
pelos tomadores de decisão Web based, tempo real
Desenvolvimento de SAD orientado a documento Coleta inicial de dados ou diagnóstico Como os doc serão armazenados? Busca, recuperação, síntese e apresentação Como você agrega valor? Recuperar e
apresentar será suficiente? Rastrear o histórico, achar padrões
Alcançando sucesso
Ache um projeto campeão Esteja informado sobre tecnologias Esteja informado acerca dos custos Invista em treinamento Divulgue o SAD
Conclusão
Diferentes tecnologias são necessárias para se construir SAD usando dados estruturados e documentos
SAD orientado a dados surgem de uma simples verificação de fatos para uma análise de dados mais sofisticada envolvendo grandes massas de dados
SAD orientado a documentos representam mais uma inovação
Questões para revisão
O que faz uma empresa demandar o uso de armazéns de dados e OLAP?
Como os gerentes podem aumentar as chances de sucesso de um SAD orientado a dados ou documentos?
O que é um EIS (Executive Information Systems)?
Porque a normalização não é necessária em SAD orientado a dados?
Exercício 01
Excel Pivot Table Exercise The Pivot Table tool in Microsoft Excel has
some similarities to many OLAP tools. Create a small table with 5 columns (time, shoe style, store, price and quantity). Load some data into the table and launch the Pivot Table tool. Place the column dimensions in the Row, Column and Page fields; put the measures price and quantity in the data area.
Exercício 02
Evaluate Data-Driven DSS Vendors. Critique and evaluate a group of DSS vendor Web sites and read their product information. Product categories and vendor groups include OLAP/Multidimensional database vendors, data mining, Executive Information Systems, GDSS, Report and Query tools, Geographic Information Systems. Check Larry Greenberg's "Data Warehousing Information Center" (http://www.dwinfocenter.org) Web site and the DSSResources.COM Vendors (http://dssresources.com/vendorlist/) Web page.
Questions you should try to answers include: what is the product category? what is the product used for? how informative about the vendor's products are the web sites ? which are the best web sites? worst web sites? which products would you want to test or learn more about?
Top Related