Dados Abertos ConectadosArmando BarbosaJudson BandeiraWilliams Alcantara
0,988x10¹² GB
40x10¹² GB
Fonte: http://www.emc.com/leadership/digital-universe/2012iview/executive-summary-a-universe-of.htm
Mas, o que isso significa?Publicação e Compartilhamento de:
Fotos;Vídeos;Áudios;Livros;Textos;Artigos.
Grande quantidade de informações para usuários do mundo inteiro;
Só que existem alguns problemas...
Estado de Alagoas
https://www.google.com.br/maps/@-7.9033028,-43.3830091,6z?hl=pt-BR
É necessário muito esforço computacional para
processar esses dados
E porquê isto ocorre?
Não é legível por máquina
Não é formato aberto
Não é conectado a outras fontes
Dados abertos
Definição
“Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.”
[Dietrich et al. 2009]
Elementos
LegalmenteDomínio público
Restrições mínimas
TecnicamenteFormato eletrônico
Legível por máquinaNão proprietário
[James 2013]
Princípios
Disponibilidade e acesso
Reúso e redistribuição
Participação universal
Visão geral de dados abertos
https://opengovdirective.pbworks.com/w/page/1832552/FrontPage
Exemplo: Wikipédia
https://pt.wikipedia.org/wiki/Macei%C3%B3
Exemplo: DBpedia
http://dbpedia.org/page/Macei%C3%B3
Exemplo: OpenStreetMap
http://www.openstreetmap.org/relation/303815
Publicadores de dados abertos
Consumidores de dados abertos
Questionamentos
PDF é um formato para publicação de dados abertos?
Um dado publicado sem licença é um dado aberto?
Um dado que necessita de software específico é aberto?
Dificuldade: Como conectar?
http://dbpedia.org/page/Macei%C3%B3 http://www.openstreetmap.org/relation/303815
Alguns formatos para dados abertos
Imagens extraídas do Google Images
Resource Description Framework
Por que usar RDF?
Por que usar RDF?Nós identificamos e interpretamos a informação!
As máquinas não!
Por que usar RDF?
Definição
“É um modelo de representação para a interoperabilidade de dados na web.”
[RDF Working Group, 2014]
CaracterísticasCria estrutura comuns/padrão
Integrando e compartilhando para todos reusarem
CaracterísticasDescreve recursos
Qualquer coisa que existe no mundo“Coisas” físicas;Conceitos abstratos;Documentos;Strings;Números.
CaracterísticasTermos
Uniform Resource Identifier - URIURL: http://www.livrariacultura.com.br/p/romeu-e-julieta-687319URN: urn:isbn:0-486-27557-4
Literal“Maceió”^^xsd:string“1”^^xsd:integer“1.5”^^xsd:float
CaracterísticasÉ composto por um conjunto de triplas
Maceió é um lugar.
Sujeito ObjetoPredicado
Maceió Lugar é um
Características
RDF fornece uma estrutura para representação e nós precisamos de semântica.
schema:Place rdf:type
dbr:Maceió
Vocabulários RDF
VocabulárioComponentes de um vocabulário
Indivíduos/InstânciasPropriedadesClasses
● Componentes de um vocabulário
Indivíduos/InstânciasTambém conhecidos como instâncias de classes.
Alagoas
Pernambuco
Recife
Maceió
Rio largo
● Componentes de um vocabulário
Propriedadesrelações binárias entre indivíduos.Há vários tipos e características diferentes.
511 km²área
Maceiópopulação
996733
● Componentes de um vocabulário
Tipos de PropriedadesPropriedades de objetos
conectam um indivíduo a outro indivíduo.Propriedades de dados
Rio Largovizinho
Maceió
● Componentes de um vocabulário
Tipos de PropriedadesPropriedades de objetosPropriedades de dados
conectam um indivíduo a um valor.“996733”^^xsd:integer
populaçãoMaceió
● Componentes de um vocabulário
ClassesSão conjuntos que contêm os indivíduos.As classes podem ser organizadas em hierarquias, também
conhecidas como taxonomias
pertenceMaceió
Alagoas
PernambucoNatal
Cidades Estados
ExemplosMaceió é um lugar com população igual a 996.733 habitantes
PREFIX dbr:<http://dbpedia.org/resource/>PREFIX dbp:<http://dbpedia.org/property/>PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX schema:<http://schema.org/>
schema:Place rdf:type
dbr:Maceiódbp:populationTotal
“996733”^^xsd:integer
Exemplos
Dados conectados
Definição
"Conjunto de boas práticas para publicar e conectar dados estruturados na web [...]."
[Hyland, B., & Wood, D. ,2011]
PrincípiosUse URIs como nome para coisas
Use HTTP URIs para que as pessoas possam navegar por esses nomes
Ao acessar uma URI forneça informações úteis (RDF e SPARQL)
Conecte a outras URIs
VantagensModelo padrão para representação de dados (RDF)
Legível por máquina
Conecta diversas fontes
Dados abertos conectados
Dados Abertos Conectados
Última atualização do diagrama em nuvem sobre Dados Abertos Conectados foi feito em 2011 por Richard Cyganiak e Anja Jentzsch. http://lod-cloud.net/
Dados Abertos Conectados
Fonte: http://5stardata.info/en/
Dados Abertos Conectados
Fonte: http://www.w3.org/2007/Talks/0306Dortmund-KB-IH/Slides.html
Como faço para publicar meus dados?
Preparar Stakeholders;Selecionar um dataset;Modelar os dados;Especificar uma licença apropriada;Utilizar boas URIs para dados conectados;Usar vocabulários padrão;Converter os dados;Prover acesso de máquina aos dados;Anunciar novos datasets;Reconhecer o contrato social;
Best Practices for Publishing Linked Data - W3C
Como faço para publicar meus dados?
Preparar Stakeholders;Selecionar um dataset;Modelar os dados;Especificar uma licença apropriada;Utilizar boas URIs para dados conectados;Usar vocabulários padrão;Converter os dados;Prover acesso de máquina aos dados;Anunciar novos datasets;Reconhecer o contrato social;
Converter os dados
Converter os dados - Ferrovias
1.Baixar os shapefiles para conversão;2.Utilizando o QGIS, salvar em geojson;3.Transformar geojson em .csv;4.Converter utilizando o google refine.
Converter os dados - Baixar shapefiles
Converter os dados - QGIS para .geojson
Converter os dados - .geojson para .csv
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Converter os dados - .csv para .rdf
Consumindo D.A.C.
Step 1 Step 3
Specify concrete use cases
Evaluate relevant data sources and data sets
Check respective licenses
Create consumption patterns
Manage Alignment, caching and updating mechanisms
Create Mash ups, GUI's, services and applications on top
Stablish sustainable new partnership
Step 4 Step 5 Step 6 Step 7Step 2
(Bauer & Kaltenböck, 2011)
Rodovias de Alagoas (Mapa)
1. Conexões entre as rodovias;2. Total de KM de rodovias;3. Maior rodovia;
Conexões entre as rodovias
http://yasgui.org/short/V1JcoEkee
Total de KM de rodovias
http://yasgui.org/short/NyZ46EJgl
Maior rodovia
http://yasgui.org/short/EyXtOSygg
Rodovias do Brasil (Mapa)1. Conexões entre as rodovias;2. Total de rodovias;3. Total de KM de rodovias;4. Maior rodovia;
Conexões entre as rodovias
http://yasgui.org/short/VJZbYrJge
Total de rodovias
http://yasgui.org/short/Ekd_YSkge
Total de KM de rodovias
http://yasgui.org/short/4yuyqHkxg
Maior rodovia
http://yasgui.org/short/NyZEqBkel
ReferênciasDietrich, D., Gray, J., McNamara, T., Poikola, A., Pollock, P., Tait, J., & Zijlstra, T. (2009). Open data handbook. 2013-01-29. http://opendatahandbook.org.Heath, Tom. (2012) “Linked Data-Connect Distributed Data across the Web”.Hyland, B., & Wood, D. (2011). The joy of data-a cookbook for publishing linked government data on the web. In Linking government data (pp. 3-26). Springer New York.James, L. (2013) Defining Open Data. Open Knowledge Blog. Disponível em http://blog.okfn.org/2013/10/03/defining-open-data/. Acessado em 17/09/2015.RDF Working Group. Disponível em http://www.w3.org/RDF/. Publicado em 2014.
Obrigado!
Dúvidas?Armando - [email protected] - [email protected] - [email protected]
Top Related