Resumo Artigo Victor Buzahr
-
Upload
bacharellicenciatura -
Category
Documents
-
view
3 -
download
0
description
Transcript of Resumo Artigo Victor Buzahr
-
Universidade Federal do Mato Grosso
Especializao em Engenharia Web e Governo Eletrnico
Resumo do artigo Tecnologias de
dados abertos para interligar
bibliotecas, arquivos e museus: um
caso Machadiano.
Trabalho da Disciplina Dados Aberto e Big Data do aluno:
Victor Buzahr Nunes Machado
Junho de 2015
-
Tecnologias de dados abertos para interligar bibliotecas, arquivos e museus: um caso
Machadiano.
http://www.scielo.br/pdf/tinf/v25n1/a08v25n1
Arquivos, bibliotecas e museus disponibilizam seus catlogos e/ou colees digitais na
Internet, tornando-os acessveis a qualquer usurio, em qualquer lugar, a qualquer momento.
H, no entanto, grande dificuldade em tornar interoperveis acervos hospedados em
diferentes instituies, uma vez que esses acervos so dependentes de softwares especficos
para publicar seus registros na Web.
O objetivo deste trabalho foi elaborar um caso fictcio que servisse de exemplo para a
interligao de dados provenientes de arquivos, bibliotecas e museus, por meio da
identificao de vocabulrios j existentes para ampliar a semntica dos contedos publicados
e da descrio dos contedos em RDF, mostrando, dessa forma, que a interligao dos dados
possvel e til.
Pela importncia que Machado de Assis ocupa no cenrio da literatura, ele foi escolhido para o
caso fictcio de interligao de dados de arquivos, bibliotecas e museus. O exemplo
desenvolvido um caso restrito e ilustrativo, no exaustivo, constituindo-se como uma
possvel soluo para a disperso de informaes sobre sua obra literria e suas adaptaes,
assim como informaes bibliogrficas que se encontram dispersas na Internet, hospedadas
em servidores de diferentes instituies.
A interoperabilidade utilizada para a juno dessas informaes que esto espalhadas pela
internet.
Os que se preocupam com a questo da interoperabilidade podem contar hoje com os
recursos da chamada Web Semnticos, uma extenso da Web que tem, como projeto, a
implantao de padres, com destaque para o Resource Description Framework (RDF) e
modelos, alm do estabelecimento de uma linguagem comum, visando organizao e
inteligibilidade de contedo por meio dos computadores. Como parte do desenvolvimento da
Web Semntica, surgiu o conceito de dados abertos interligados - linked open data -, definido
como um conjunto de boas prticas para publicar, de forma aberta, e interconectar conjuntos
de dados estruturados na Web, com o intuito de criar uma Web de dados.
Existem quatro princpios bsicos para a publicao de dados abertos estruturados na Web
O primeiro deles a utilizao de Uniform Resource Identifier (URI), [...] como um meio mais
genrico para identificar qualquer entidade que exista no mundo [...] Esse conceito expande o
de Uniform Resource Locator (URL), que funciona como endereo de documentos na Web. Os
URI no so endereos na hierarquia de pastas e arquivos, sujeitos a mudanas dessa
hierarquia, no servidor que abriga o recurso; mas, sim, identificadores persistentes de
recursos.
O segundo princpio de Linked Data especifico o de que os URIS devem utilizar o protocolo
Hypertext Transfer Protocol (HTTP) para facilitar sua localizao. [...] o protocolo HTTP
fornece um mecanismo simples e universal para recuperar recursos que podem ser
serializados como um fluxo de bytes [...], como, por exemplo, a imagem da casa de Machado
-
de Assis, ou descries da recuperao de entidades que no podem elas prprias ser enviadas
atravs da rede dessa forma, tal como a casa em si.
O terceiro princpio estabelece que quando algum consulta uma URI deve obter informao
til por meio dela, e que suas informaes devem ser representadas no formato RDF. Esse
modelo usado para publicao de dados estruturados na Web. Ele usa URI para codificar
informaes em um documento, assegurando que cada conceito est vinculado a uma nica
definio que cada um pode encontrar na Web.
O quarto princpio afirma que a descrio deve incluir links para outras URI, de modo que os
usurios possam localizar mais informaes sobre o tema ou o objeto em questo. So
utilizados hiperlinks para conectar no apenas os documentos da Web, mas qualquer tipo de
recurso em diversos locais.
Na primeira etapa do trabalho, definiram-se as URI principais, que identificam o livro e seu
escritor. Para o autor Machado de Assis, utilizou-se seu registro no Virtual International
Authority File (VIAF), Catlogo Virtual Internacional de Autoridades. J para a obra Dom
Casmurro, recorreu-se aos permalinks (links permanentes ou URI) da Biblioteca do Congresso
dos EUA - Library of Congress (LC). Selecionou-se o endereo, que corresponde ao registro de
uma edio do livro Dom Casmurro.
Outra etapa metodolgica foi a identificao de instituies, acervos e materiais que
pudessem ser associados aos dados principais, nesse caso, Machado de Assis e sua obra
literria Dom Casmurro. Assim, buscaram- -se contedo ou representaes de contedos em
pginas de instituies governamentais, bibliotecas e portais de contedo, entre outras.
Destacaram-se as seguintes:
- Academia Brasileira de Letras: Machado de Assis foi um de seus idealizadores e fundador.
Disponibiliza um portal sobre Machado com contedo diversos.
- Ministrio da Educao e Cultura (MEC): disponibiliza a Coleo Digital Machado de Assis,
criada em 2008, para homenagear os 100 anos de falecimento do escritor.
- Wikipdia: a enciclopdia colaborativa contm verbetes sobre Machado de Assis, sua esposa
Catarina, Dom Casmurro, e sobre a personagem Capitu.
- YouTube: aqui encontram-se vdeos sobre a minissrie Capitu, baseada em Dom Casmurro, e
reportagens sobre Machado de Assis e sua obra.
Para expandir os URI do livro e do escritor, interligando-os aos contedos encontrados nas
pginas citadas, realizou-se uma pesquisa para identificao de vocabulrios que oferecessem
termos para relaes sobre pessoas, autores, obras e contedo dessas obras. Por fim, os dados
hospedados em servidores de diversas instituies foram convertidos para o formato RDF.
O Linked Data aparece como uma possibilidade de facilitar a interligao de dados que, por sua
vez, possam ser ligados a outros dados, criando uma rede de dados estruturados e com
representao semntica legvel por homens e mquinas.
O caso machadiano, aqui apresentado, um exemplo de aplicao do Linked Data,
objetivando a integrao de dados de arquivos, bibliotecas e museus. Essas instituies
possuem seus cdigos prprios e maneiras particulares de representar a informao, tornando
-
esses acervos isolados. Observa-se, entretanto, no decorrer deste trabalho, que possvel a
integrao dos dados utilizando os princpios do Linked Data.