OLAP

12
OLAP Abmar Barros

description

OLAP. Abmar Barros. Agenda. OLAP x OLTP Análise multidimensional Cubo OLAP Como funciona a mágica? View-selection Ferramentas. OLAP x OLTP. OLTP Online Transactional Processing Trabalha com registros individuais ou em pequeno número Operações de leitura e escrita OLAP - PowerPoint PPT Presentation

Transcript of OLAP

OLAP

Abmar Barros

Agenda

• OLAP x OLTP• Análise multidimensional• Cubo OLAP• Como funciona a mágica?• View-selection• Ferramentas

OLAP x OLTP

• OLTP– Online Transactional Processing– Trabalha com registros individuais ou em pequeno

número– Operações de leitura e escrita

• OLAP– Online Analytical Processing– Trabalha com dados em massa– Operações são geralmente read-only

OLAP x OLTP

• Porque online?– Apesar de lidar com uma enorme quantidade de

dados, o sistema deve responder rápido o suficiente para permitir uma exploração interativa dos dados.

Análise multidimensional

Year 2000 2001 Growth

Product Dollar sales

Unit sales

Dollar sales

Unit sales

Dollar sales

Unit sales

Total $7,073 2,693 $7,636 3,008 8% 12%

— Books $2,753 824 $3,331 966 21% 17%

—— Fiction $1,341 424 $1,202 380 -10% -10%

—— Non-fiction $1,412 400 $2,129 586 51% 47%

— Magazines $2,753 824 $2,426 766 -12% -7%

— Greetings cards $1,567 1,045 $1,879 1,276 20% 22%

Análise multidimensional

• Dimensões (Dimensions)– Formam as colunas e linhas– Ex.: Year e Product– Hierarquia de dimensões (Ex.: Books, Magazines)

• Medidas (Measures)– Formam os valores– Ex.: Dollar sales e Unit sales

Cubo OLAP

Como funciona a mágica?

• Para consultas complexas, cubos OLAP conseguem responder em 0,1% do tempo da mesma consulta em OLTP.

• O mais importante mecanismo em OLAP é a agregação.

Como funciona a mágica?

• Agregações são construídas a partir das tabelas de fatos:– As granularidades de dimensões específicas são

alteradas.– Os valores são agregados sobre essas dimensões.

• A combinação de todas as possíveis agregações contém as respostas pra qualquer consulta, diretamente dos dados.

Como funciona a mágica?

• Assim, um número muito grande de agregações deve ser computado, o que é computacionalmente inviável.

• Normalmente uma parte das agregações são pré-calculadas, outras são calculadas por demanda.

• O problema de decidir quais agregações pré-calcular é conhecido como view-selection.

View-selection

• O objetivo do view-selection é minimizar o tempo médio de resposta das consultas.

• View-selection é NP-completo.• Abordagens já exploradas:– Algoritmos gulosos– Busca aleatória (Randomized search)– Algoritmos genéticos– Busca A*

Ferramentas

• Comerciais– Microsoft Analysis Services– Oracle Essbase– IBM Cognos TM1

• Open-Source– Mondrian OLAP Server– Jedox Palo