OLAP
-
Upload
mira-weeks -
Category
Documents
-
view
66 -
download
0
description
Transcript of OLAP
Agenda
• OLAP x OLTP• Análise multidimensional• Cubo OLAP• Como funciona a mágica?• View-selection• Ferramentas
OLAP x OLTP
• OLTP– Online Transactional Processing– Trabalha com registros individuais ou em pequeno
número– Operações de leitura e escrita
• OLAP– Online Analytical Processing– Trabalha com dados em massa– Operações são geralmente read-only
OLAP x OLTP
• Porque online?– Apesar de lidar com uma enorme quantidade de
dados, o sistema deve responder rápido o suficiente para permitir uma exploração interativa dos dados.
Análise multidimensional
Year 2000 2001 Growth
Product Dollar sales
Unit sales
Dollar sales
Unit sales
Dollar sales
Unit sales
Total $7,073 2,693 $7,636 3,008 8% 12%
— Books $2,753 824 $3,331 966 21% 17%
—— Fiction $1,341 424 $1,202 380 -10% -10%
—— Non-fiction $1,412 400 $2,129 586 51% 47%
— Magazines $2,753 824 $2,426 766 -12% -7%
— Greetings cards $1,567 1,045 $1,879 1,276 20% 22%
Análise multidimensional
• Dimensões (Dimensions)– Formam as colunas e linhas– Ex.: Year e Product– Hierarquia de dimensões (Ex.: Books, Magazines)
• Medidas (Measures)– Formam os valores– Ex.: Dollar sales e Unit sales
Como funciona a mágica?
• Para consultas complexas, cubos OLAP conseguem responder em 0,1% do tempo da mesma consulta em OLTP.
• O mais importante mecanismo em OLAP é a agregação.
Como funciona a mágica?
• Agregações são construídas a partir das tabelas de fatos:– As granularidades de dimensões específicas são
alteradas.– Os valores são agregados sobre essas dimensões.
• A combinação de todas as possíveis agregações contém as respostas pra qualquer consulta, diretamente dos dados.
Como funciona a mágica?
• Assim, um número muito grande de agregações deve ser computado, o que é computacionalmente inviável.
• Normalmente uma parte das agregações são pré-calculadas, outras são calculadas por demanda.
• O problema de decidir quais agregações pré-calcular é conhecido como view-selection.
View-selection
• O objetivo do view-selection é minimizar o tempo médio de resposta das consultas.
• View-selection é NP-completo.• Abordagens já exploradas:– Algoritmos gulosos– Busca aleatória (Randomized search)– Algoritmos genéticos– Busca A*