Pepe Legal Python e Babalu MongoDB, uma dupla dinâmica

Post on 25-May-2015

1.638 views 0 download

description

Vídeo: https://www.youtube.com/watch?v=iLTm5K2LJvI Introdução ao banco orientado à documentos MongoDB. NoSQL é um novo paradigma para banco de dados semi-estruturados. MongoDB e Python possuem a mesma "melodia" de desenvolvimento: flexibilidade no schema combina bem com tipagem dinâmica, ambas ajudando na produtividade do desenvolvedor. Entenda como esse banco orientado à documentos funciona na prática com um cliente Python.

Transcript of Pepe Legal Python e Babalu MongoDB, uma dupla dinâmica

Pepe Legal Python e Babalu MongoDB

http://about.me/fmasanori

Agenda

• Why this title?

• NoSQL

• Flexible Schema

• Horizontal Scalability

• MongoDB

• Some demos

• BI special case

• References

Why this title?

Desenho fez sucesso no início dos anos 60 Mesma época em que SQL teve início

Palestra para old developer’s (or not so old)

Como comecei com NoSQL

• Na faculdade me ensinaram que tudo deveria ser normalizado

• E que o mundo era SQL

• No entanto:

– Comecei a dar aulas de BI (analytics), e denormalizar era incentivado

– Persistir dados de redes sociais bastante trabalhoso num relacional

Origem

VENDAS

CLIENTE

TEMPO

PRODUTO

LOJAPROMOÇÃO

(Luiz H. N. Lorena, 2011)

Star Schema

(Kimball, 2002)

Denormalizing

(Kimball, 2002)

Denormalizing

Operacional Analítico

Propósito Executar um processo Avaliar um processo

Estilo interação Insert, update, delete, query Query (read-only)

Escopo interação Transação individual Agregação

Padrão query Previsível e estável Imprevisível

Foco temporal Atual Histórico e atual

Otimização Update concorrente Query (agregação)

Projeto ER na 3FN Star Schema ou Cubo

(Adamson, 2010)

Operational x Analytics

JSON persistence

Casdinho

Sentiment Analysis (Twitter)

menina: aaaaaaaaaaaaaa eu NAO GOSTO DELE

amiga: e vc ficará rica , e irá dividir sua riqueza cm sua amg aq *u*

menina: kkkkkk como assim eu fikar rica pq?

amiga: pq ele é inteligente , e vai arranjar um ótimo emprego , e

ganhar mt dinheiro rs

menina: kkkkk ele é inteligente como assim ??

amiga: AQUELE VIADO PASSOU NO CASDINHO, E EU NÃO !

Sentiment Analysis (Twitter)

Obs.: não é o mesmo registro...

Sentiment Analysis (Facebook)

Sabe o que é ter vontade de acordar cedo no domingo para estudar?!?

Bom, eu também não sei explicar, mas é o que estou sentindo no momento .-.

Bora Casdinho!

Sentiment Analysis (Facebook)

Obs.: não é o mesmo registro...

Campos opcionais

https://gist.github.com/4667205

Campo opcional no Facebook

Social Data changes fast

Snowflakes like documents

“Snowflakes represent documents, since every document is beautiful

and unique”.

MongoDB, The Definitive Guide.

Non Relational

Non Relational

JSON DataBase

Dev like data

JSON persistence

• MongoDB

• CouchDB

• RethinkDB

• PostgreSQL (SQL?)

• Como persistir dados sem normalizar, sem um BD relacional?

• Somos “formatados” a pensar no modelo relacional

• “One size fits all”

NoSQL ?

One Size Fits All

“It’s better to think of NoSQL as a

movement rather

than a technology” Martin Fowler

NoSQL

Dynamic Schema

O que as empresas esperam de um NoSQL?

Flexible Schema

O que as empresas esperam de um NoSQL?

Flexible Schema

Flexible Schema

Dev Productivity

Relational DB

Martin Fowler

Relational DB

• The difference between the relational model and the in-memory data structures (Fowler)

• Limitations of relational DB: values only in tuples

• We need a more complex structure than a set of tuples as a data unit

Impedance mismatch

Costumers Orders

Martin Fowler

Aggregate Model

Costumers

Martin Fowler

Aggregate Model

Questions vs Answers

RDBMS MongoDB

Data Storage Data Use

Answers Questions

Botton Up Top Down

Scalability

If I had asked people what they wanted, they would have said faster

horses. Henry Ford.

Scalability

• Escalabilidade para leituras num banco relacional: trabalhoso

• Escalabilidade para escritas num banco relacional: MUITO, MUITO, trabalhoso

• (se conseguir seu BD deixou de ser relacional...)

Escalabilidade vertical

Escalabilidade vertical

Escalabilidade horizontal

Escalabilidade horizontal

“Eventual” pt-br: pode não ocorrer

“Eventual” inglês: irá ocorrer em breve

Eventually Consistent

Eventually Consistent

Offline ATM have Eventually Consistent transactions

Teorema CAP

Partition

Availability

Consistency

NoSQL vale a pena

• Bigtable: A distributed storage system for structured data, 2006

• Dynamo: Amazon’s highly available key-value store, 2007

Dois artigos famosos

Apache Hadoop

Not Only SQL

Specialized Databases No “one size fits for all” DB

• Open Source

• Document (JSON)

• Distributed

• Rich Query Language

• Great Community

• Full Text Search

MongoDB

• Schema Design

• Full Featured Indexes

• Aggregation Framework

• Replication and Sharding

MongoDB

Terminology

RDBMS MongoDB

Database Database

Table Collection

Row Document

Index Index

Join Embedded Doc

Foreign Key Reference

By 10gen

Dynamic and Flexible

MongoDB

Funcionalidade

Perf

orm

ance

memcached

relational

mongodb

MongoDB

By MongoLab

MongoDB

By MongoLab

Easy Taxi Case

Demos

Obs.: link para seguir a oficina completa que dei no FISL

MongoDB for BI

• Analytics are now popular among proprietary vendors

• SAP Sybase columnar In-Memory

• Oracle columnar In-Memory

• Why columnar for analytics?

• There is a advantage?

• Which movie genres generate the most revenue? (Q1)

• How is our revenue evolving over time? (Q2)

• At which time of day do costumers place the most orders? (Q3)

• How effective are the promotions we launch? (Q4)

Queries

0

5000

10000

15000

20000

25000

30000

35000

Q1 Q2 Q3 Q4

LucidDB

MySQL

Average time (ms)

(Timo Elliott, SAP)

Relational DB (row full scan)

(Timo Elliott, SAP)

Columnar DB

MongoDB for BI

• Is possible to MongoDB create indexes in any attribute

• Sharding Fact Table and duplicating Dimensions across replicas

• Perhaps there is no memory for all attribute indexes you need…

https://education.mongodb.com/

Material para aprofundamento

Material para aprofundamento

Bigliografia

Bigliografia

Perguntas? fmasanori@gmail.com

facebook.com/fmasanori

twitter.com/fmasanori