Dados Publicos

95
Extraindo dados públicos “na marra” Pedro Valente @pedrovalente

description

 

Transcript of Dados Publicos

Page 1: Dados Publicos

Extraindo dados públicos “na marra”

Pedro Valente

@pedrovalente

Page 2: Dados Publicos

Por quê?

É um dever do cidadão fiscalizar o poder

Page 3: Dados Publicos

Por quê?

Tem um monte de picaretas se aproveitando do seu dinheiro

Page 4: Dados Publicos

Por quê?

São dados que por lei ou por bom senso deveriam estar disponíveis

Page 5: Dados Publicos

Por quê?

Não adianta tentar esconder,a gente dá um jeito

Page 6: Dados Publicos

Dados públicos?

Page 7: Dados Publicos

Dados do governo

Page 8: Dados Publicos

Dados de interesse público

Page 9: Dados Publicos

Interesse público

Jornalismo

Page 10: Dados Publicos

Jornalismo+

Desenvolvimento de software

Page 11: Dados Publicos

Transparência

http://www.flickr.com/photos/tracy_collins/2237061185/

Page 12: Dados Publicos

Está na moda

Page 13: Dados Publicos

Está na modae ganha Pulitzer

Page 16: Dados Publicos

"Build something or STFU"Matt Waite - Politifact

Page 18: Dados Publicos

Como transformar esse mundo de dados em

algo relevante?

Page 20: Dados Publicos

Crie aplicações interativas em cima

deles

Page 21: Dados Publicos

Crie aplicações interativas em cima

deles

Aplicação

Page 22: Dados Publicos

Crie aplicações interativas em cima

deles

Aplicação

Dados

Page 23: Dados Publicos

Aplicação

Dados

Processador

Fornecedor

Page 24: Dados Publicos

Aplicação

Dados

Processador

Fornecedor

API

Page 25: Dados Publicos

APIApplication Programming Interface

Page 26: Dados Publicos

Cada fornecedor armazena de um jeito

A API serve para padronizar a saída

Page 27: Dados Publicos

API é o balcão da padaria

Você pede 300 gramas de mortadelae a atendente te entrega. Leva também 4 pãezinhos.

Te vira. Quem faz o sanduíche é você.

Page 28: Dados Publicos

Dois papéis

Page 29: Dados Publicos

1. Fornecedor

Dados brutos

Grandes volumes

Exclusividade

Page 31: Dados Publicos

CET-SP

http://www.flickr.com/photos/streetlife/2309136566/

Page 32: Dados Publicos

Dados da CET

Km de congestionamento

Pontos de alagamento

Ocorrências de trânsito

Estrutura de monitoramento exclusiva

Além de monitorar, também precisa RESOLVER o trânsito!

Page 33: Dados Publicos

E aí investem em...

Page 35: Dados Publicos
Page 36: Dados Publicos

Prioridade?

Page 37: Dados Publicos

Pouca grana

Pepinos gigantes

Precisa foco no que ninguém mais tem

Page 38: Dados Publicos

2. Processador

Recombina, reordena, filtra e segmenta

Identifica padrões e revela tendências

Expõe os resultados

Page 39: Dados Publicos

EveryBlock.com

Page 40: Dados Publicos

NYTimes

Text

Page 41: Dados Publicos

NYTimes

Text

http://prototype.nytimes.com/represent/

Page 42: Dados Publicos

EveryBlock.com

Dados de fornecedores diversos

Micro-relevância

É jornalismo? É software? "Who cares?"

Page 43: Dados Publicos

Batia de porta em porta implorando por XML

Page 44: Dados Publicos

Fornecedor Processador

Page 45: Dados Publicos

Fornecedor Processador

Aplicação

Page 46: Dados Publicos

Fornecedor Processador

Dados

Aplicação

Page 47: Dados Publicos

API

Fornecedor Processador

Dados

Aplicação

Page 48: Dados Publicos

API

Fornecedor Processador

Dados

Aplicação

Ei, 300 gramas de mortadela, por

favor

Page 49: Dados Publicos

API

Fornecedor Processador

Dados

Aplicação

Ei, 300 gramas de mortadela, por

favor

Aqui está, senhor, tenha um bom dia

Page 50: Dados Publicos

Fornecedor Processador

Page 51: Dados Publicos

Fornecedor Processador

Aplicação

Page 52: Dados Publicos

Aplicação

Fornecedor Processador

Aplicação

Page 53: Dados Publicos

AplicaçãoAPI

Fornecedor Processador

Aplicação

Page 54: Dados Publicos

AplicaçãoAPI

Fornecedor Processador

Aplicação

Ei, um sanduíche de

mortadela, por favor

Page 55: Dados Publicos

AplicaçãoAPI

Aqui está, senhor, tenha um bom dia

Fornecedor Processador

Aplicação

Ei, um sanduíche de

mortadela, por favor

Page 56: Dados Publicos

Maturidade institucional

www.showusabetterway.co.uk

Page 57: Dados Publicos

NYT APIs

Page 58: Dados Publicos

NYT APIsCongressional Data

The Congress API returns the following types of data:

• Roll-call vote data: Only roll-call votes (not voice votes or division votes) are tracked by official Congressional data sources. Along with basic vote data, the Times API returns additional information that is less readily available, such as party totals. For details, see Responses. For general information about roll-call votes, see the THOMAS site.

• Member data: Along with general biographical information for current and past members of Congress, the API returns data about members' Congressional roles. Role data includes the Congress number and chamber, as well as the member's title, state and party. A single member may have more than one role in a particular Congress (for example, the member may switch parties or move from the House to the Senate). For details, see Responses.

Data Sources

The data returned by the Congress API is compiled from the following sources:

• The official Web site of the Office of the Clerk of the U.S. House of Representatives, for vote data• The official Web site of the United States Senate, for vote data• The Biographical Directory of the United States Congress, for member biographical information• GovTrack.us, for member biographical information• MIT Professor Charles Stewart's collection of Congressional data, for role information• THOMAS (The Library of Congress), for bill data• The C-SPAN Congressional Chronicle, for floor appearances

Certain fields in the API responses (such as party totals) are calculated by The Times, based on these data sources. For details, see Responses.

http://developer.nytimes.com/docs/congress_api

Page 59: Dados Publicos

The Guardian

www.guardian.co.uk/open-platform/

Page 61: Dados Publicos

The Guardianhttp://mps-expenses.guardian.co.uk/

Page 62: Dados Publicos
Page 63: Dados Publicos

Voltando ao Brasil...

Page 64: Dados Publicos

Se o fornecedor não colabora, fazemos justiça com

as próprias mãos

Page 65: Dados Publicos

Se o fornecedor não colabora, fazemos justiça com

as próprias mãos

Page 66: Dados Publicos

Scraping = raspagem

Pegar na marra o que não é liberado por API

Robozinhos, crawlers e dumps

Mudança de mentalidade

Page 67: Dados Publicos

Uma ajudinha: YQL

• Idioma comum para conversar com diversas APIs ou fazer scraping

• Aberto para qualquer um se tornar fornecedor ou processador de dados

• Tem um console muito divertido

• http://developer.yahoo.com/yql/console

Page 68: Dados Publicos

Uma ajudinha: YQL

http://developer.yahoo.com/yql/console

Page 69: Dados Publicos

2 desafios

Datasets&

Consultas online

Page 70: Dados Publicos

Datasets

Page 71: Dados Publicos

Massas de dadosguardadas em algum

banco

Page 72: Dados Publicos

IBGETSE

Anatel

Page 74: Dados Publicos

YQL + CSV

YQL + XML

Page 75: Dados Publicos

CSV to webservice

http://isithackday.com/csv-to-webservice/

Page 76: Dados Publicos

<?php include('csvtoservice.php'); $content = csvtoservice('http://winterolympicsmedals.com/medals.csv'); if($content){

if($content['form']){ echo '<h4>Filters</h4>'; echo $content['form']; }

if($content['table']){ echo '<h4>Results</h4>'; echo $content['table']; }

}?>

Page 77: Dados Publicos

Consultas online

Page 78: Dados Publicos

Infraero

Page 79: Dados Publicos

Infraero

Page 80: Dados Publicos

Infraero

Page 81: Dados Publicos

Infraero

Page 82: Dados Publicos

Infraero

Page 83: Dados Publicos

Infraeropoderia ser assim:

Page 84: Dados Publicos

Infraeropoderia ser assim:

www.infraero.gov.br/voos/status/03101

Page 86: Dados Publicos

Mas veja o que esses filhas da mãefazem pra nos impedir de usar os

dados deles

Page 87: Dados Publicos

http://www.infraero.gov.br/voos/detalhe_voo.aspx?5/Xrn1SlFmeTrR/PL3/MpnK8sgrVY9Ms+9o4x3M9qjM7ysJ8yazx5wXPsRzdou

+5fzqPSZPiXOSpCOxycPzRH6PIN4I4buChasAEzkA4yV8kHAGUAnVR/KczuGvooOuczvdlALYzVh3lcyKh+M3QrsBJBmxehWlokYlZbByajEtfYOOFlC8vGsv0I9JVs

+4MD3i1hIP1FXRc0+EyJhJBL2qiFEy6/fDinPR/mqw675W/cnhwPjcHtQEvr4NpsYdsP0f8JE0VbKeVci8KGgQ4TZJq1DE3SEjUk7lySiMtlWrZwj+pcazY

+95lEvSJOwqXbb5FLXNbv0CnrSZ/9CxURzI84m3tI1929Te6IEuJPcE=

Page 88: Dados Publicos

Empresa estatal. Serviço público.

Dados de interesse público.

Sem problemas de privacidade.

HACKING LIBERADO!!!

Page 89: Dados Publicos
Page 90: Dados Publicos

http://anp.gov.br/preco

Page 92: Dados Publicos

YQL + HTML

YQL Open Tableshttp://datatables.org

Page 94: Dados Publicos

Libertemos dados!!!

Page 95: Dados Publicos

ObrigadoContato: @pedrovalente