Descrição de recursos em wikis semânticos

Post on 24-May-2015

932 views 5 download

description

Descrição de recursos em wikis semânticos: dados em RDF para Linked Data Jaider Andrade Ferreira Mestrando em Ciência da Informação Orientadora: Plácida L. V. A. da C. Santos

Transcript of Descrição de recursos em wikis semânticos

Descrição de recursos em wikis semânticos

Dados em RDF para Linked Data

Jaider Andrade FerreiraMestrando em Ciência da Informação

Orientadora: Plácida Santos

Conteúdo

O A Ciência da Informação e a atividade de descrição de recursos

O A WebO A Web Semântica

O As tecnologias da Web SemânticaO URI, XML, RDF, OWL...

O Linked Data

O WikisO Wikis semânticos

O Semantic MediaWiki (SMW)

A Ciência da Informação e a atividade de descrição de recursos

O “A representação da informação é necessária em qualquer ambiente para proporcionar uma recuperação mais eficiente” (SANTOS; ALVES, 2009)

O Qualquer ambiente? Sim: analógico e digital

O Nesse sentido, os desenvolvedores da Web tem procurado construir estruturas e tecnologias que possibilitem a atribuição de metadados aos recursos, melhorando, desse modo, a recuperação de informações em ambientes digitais

Metadados

O Metadados são informações estruturadas que descrevem, explicam, proveem a localização ou, de alguma forma, tornam mais fácil a recuperação, a utilização ou o gerenciamento de recursos (NISO, 2004, p. 1).

Da Web para...

O Nesse contexto, há uma tendência a uma maior estruturação das informações disponibilizadas na Web.

O Estruturação essa que diz respeito à representação ou à descrição de recursos (informacionais ou não).

O Da necessidade de estruturar e de descrever semanticamente o conteúdo das páginas ou mesmo de representar e de descrever semanticamente uma entidade não presente no ambiente digital, surge o projeto da Web Semântica.

... a Web Semântica

O Da Web de documentos linkados para a Web de dados linkados, ou Web das coisas

O Da Web legível por humanos para a Web legível por máquinas

O Dos links sem tipos para os links tipados

O Para que isso ocorra, é necessária a criação de uma estrutura comum (modelos conceituais, tecnologias, práticas, etc.) que permita que os dados sejam compartilhados e reutilizados entre aplicações, empresas e comunidades e para eles que possam ser processados automaticamente por distintas ferramentas de software.

Tecnologias da Web Semântica

Principais tecnologias: O URIO XMLO RDFO RDFSO OWLO SPARQL

Tecnologias da Web Semântica

O As tecnologias da Web Semântica podem ser utilizadas em várias áreas de aplicação, por exemplo:

O Na integração de dadosO Na descoberta, na classificação e na busca por

recursosO Na catalogação de recursos e em serviços de

catalogaçãoO Na análise e na representação do conhecimentoO Na construção de agentes de software inteligentes O Na descrição de direitos de propriedade intelectualO Nas rede sociais

(SW-FAQ, 2009)

RDFResource Description

Framework[Estrutura de descrição de recurso]

Como o ser humano descreve os recursos?

O A maneira mais comum de descrever um recurso é utilizando-se da linguagem, ou seja, realizando declarações, sentenças, afirmações.

Como o ser humano descreve os recursos?

O Assim, classificamos os recursos...O Joãozinho é um ser humanoO Ser humano é um mamíferoO Mamífero é um animalO Etc.

(relações hierárquicas do tipo “é um(a)”)

Como o ser humano descreve os recursos?

O ... e atribuímos propriedades a eles:O Joãozinho tem 23 anosO Joãozinho mora em MaríliaO Joãozinho estuda na UnespO Etc.

(relações associativas, não hierárquicas)

Declarações

O De um ponto de vista linguístico, podemos considerar que as declarações são constituídas de três partes:

O SujeitoO PredicadoO Objeto

Declarações e descrições

O De um ponto de vista informacional:

O Recurso (objeto, coisa, entidade a ser descrita)

O Propriedade (atributo, característica, metadado)

O Valor (valor da propriedade)

Intercâmbio de (meta)dados

O O RDF é uma infraestrutura que permite a codificação, o intercâmbio e o reuso de metadados estruturados.

O Essa infraestrutura permite a interoperabilidade de metadados através da concepção de mecanismos que suportam convenções comuns de semântica, de sintaxe e de estrutura.

(MILLER, 1998)

Resource Description Framework

O Um mecanismo para a representação semântica que se baseia em um simples, porém poderoso, modelo de dados.

Grafo

O Um documento RDF está estruturado em forma de um grafo direcionado, isto é, um conjunto de nós que são ligados por arestas direcionadas (setas).

RDF

Recurso

Valor

Valor

Valor

Valor

Propriedade

Propriedade

Propriedade

Propriedade

RDF

Jaider

UNESP

Marília

Fabrício

RDF

estuda na

mora em

conhece o

ensina

Tripla

Recurso ValorPropriedade

Cibercultura Pierre LévyTem como autor

Entidades do mundo real

Identificadores

O Entidades precisam ser identificadas.

O Na Web Semântica os identificadores são os URIs

Identificador X Identificador ZIdentificador Y

URI

O URI (Uniform Resource Identifier) é uma sequência de caracteres que identifica (dá nome a) um recurso físico ou abstrato.

O Obs.: URL (Uniform Resource Locator) é um tipo de URI que, além de identificar, localiza um recurso disponível na Web.

O URI http://dbpedia.org/resource/BrazilO URL http://dbpedia.org/page/Brazil

URIO É o URI que torna o recurso único e não confundível com

outros recursos.

O O RDF pode descrever qualquer objeto que tenha uma clara identidade no contexto de uma dada aplicação: livros, pessoas, locais, editoras, eventos, relacionamentos entre essas coisas, conceitos abstratos... Enfim, qualquer coisa.

O Tais recursos podem, obviamente, não ser recuperados online e, portanto, seus URIs são usados exclusivamente para fins de identificação.

O Tais URIs são feitos para as máquinas referenciarem algum recurso, não para humanos buscarem informações

DeclaraçõesO Em RDF podemos fazer dois tipos de

declarações. Podemos dizer que:

1. Um recurso possui alguma relação com outro recurso:

O URI do recurso | URI da propriedade | URI do valor O Ex: Jaider | conhece | Fabrício

2. Um recurso possui alguma relação com um valor literal:

O URI do recurso | URI da propriedade | Valor literalO Ex: Jaider | tem como idade | 23 anos

Sintaxe para RDFO XML:

<?xml version="1.0" encoding="utf-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:metadado="http://metadado.org/uri#">

 <rdf:Description rdf:about="http://exemplo.org/uri#jaider">

<metadado:nome>Jaider</metadado:nome><metadado:conhece>

<rdf:Description rdf:about="http://exemplo.org/uri#fabricio"><metadado:nome>Fabrício</metadado:nome>

</rdf:Description></metadado:conhece >

</rdf:Description> </rdf:RDF>

Vocabulários

O Adicionalmente, o RDF Schema, uma extensão do RDF, proporciona um meio para a publicação tanto de vocabulários legíveis por humanos quanto de vocabulários legíveis por máquinas.

O Vocabulário, nesse contexto, é definido como um conjunto de propriedades ou termos descritivos, isto é, elementos de metadados, definidos por uma comunidade de descrição de recursos.

Vocabulários

O Exemplos:O DC: http://dublincore.org (descrição geral)O FOAF: http://xmlns.com/foaf/spec (pessoas)O SIOC: http://www.w3.org/Submission/sioc-related

(pessoas)O VoID: http://www.w3.org/TR/void (datasets)O Schema.org: http://schema.org/Book (geral)O vCARD: http://www.w3.org/TR/vcard-rdf (contatos)O Geo: http://www.w3.org/2003/01/geo (localizações)O Bio: http://vocab.org/bio/0.1 (biografia)

Vocabulários

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/creator http://dbpedia.org/resource/Machado_de_Assis

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/date 1900

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/language Português

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/publisher http://pt.dbpedia.org/page/Livraria_Garnier

http://dbpedia.org/resource/Dom_Casmurro http://purl.org/dc/elements/1.1/subject Romance impressionista

De propriedades: ex. Dublin Core

De valores: ex. DBpedia

Linked Data

O Um método de publicação de dados estruturados interligados.

O Esse método utiliza tecnologias da Web Semântica como RDF e URIs.

O Ao invés de esses dados serem utilizados apenas para a visualização por humanos, eles estão dispostos de um modo que possibilita a leitura automática por computadores.

O Isso possibilita que os dados de diferentes fontes sejam interligados e consultados.

Princípios do Linked Data

1. Utilizar URIs para representar coisas2. Utilizar URIs do tipo HTTP para que essas

coisas possam ser referenciadas e lidas por pessoas e máquinas

3. Fornecer informações úteis sobre as coisas quando seus URIs são utilizados, e para essa tarefa, utilizar padrões como RDF e SPARQL

4. Incluir links para outras coisas relacionadas (utilizando URIs) quando publicar dados na Web

(BERNERS-LEE, 2006)

Como publicar dados em RDF?

Utilizando wikis semânticos!

WikiO Um software wikicriaO um site wiki

O Um site wikié composto porO páginas wiki

O Páginas wikisão escritas O de acordo com uma sintaxe wiki

O Páginas wiki são criadas O por uma comunidade wiki

O Uma comunidade wikisegue uma O prática wikique é embasada em umaO Filosofia wiki...

ExemploO Software wiki: MediaWiki

O (mediawiki.org)

O Site wiki: Wikipédia O (pt.wikipedia.org)

O Página wiki: Brasil O (pt.wikipedia.org/wiki/Brasil)

O Sintaxe wiki: '''Brasil'''O (pt.wikipedia.org/wiki/Ajuda:Guia_de_edição)

O Comunidade wiki: Usuários, Editores, Administradores, etc. O (pt.wikipedia.org/wiki/WP:Portal_comunitário)

O Prática wiki: Políticas (para o conteúdo e para a formatação de páginas wiki, para o comportamento dos editores do site wiki, etc.)O (pt.wikipedia.org/wiki/WP:Lista_de_políticas)

O Filosofia wiki: Princípios gerais, princípios que remontam a origem dos wikis (1995)

Wikis semânticos

O Um wiki semântico pode ser definido como

um software wiki que se utiliza de tecnologias da Web Semântica para incorporar conhecimento formalizado,

conteúdo, estruturas e links nas páginas wiki.O conhecimento formalizado é representado utilizando

padrões da Web Semântica e é, portanto, acessível e reutilizável por aplicações Web.

(BUFFA et al., 2007)

Wikis semânticos

O AceWiki (2008)O BOWiki (2008)O COW (2006)O Freebase (2005)O Gnowsis Wiki (2006)O Graphingwiki (2006)O IkeWiki (2006)O Kaukolu (2006)O Kawawiki (2005)O KnowWE (2010)O Makna (2006)O MultiMakna (2006)O MewKISS (2005)O OntoWiki (2006)O OpenRecord (2006)

O Platypus (2004)O Rhizome (2005)O Semantic MediaWiki

(2005)O SemperWiki (2005)O SHAWN (2005)O ShyWiki (2011)O SweetWiki (2006)O SWiki (2005)O Swooki (2008)O TaOPis (2008)O Topincs Wiki (2006)O wikiCalc (2007)O WikSAR (2006)O Ylvi (2006)

Semantic MediaWikiO O Semantic MediaWiki é um software

livre, de código aberto, disponível como uma extensão do software MediaWiki.

O É um sistema wiki melhorado com tecnologias da Web Semântica que possibilita aos usuários anotar semanticamente o conteúdo com informações explícitas legíveis por máquinas.

O O Semantic MediaWiki coleta os dados semânticos por meio das anotações semânticas que os usuários, cientes ou não, adicionam ao texto das páginas wiki.

Semantic MediaWiki

O ... é um wiki semântico para dados estruturadosO ... é implementado como uma extensão do

MediaWikiO ... é um software livre, de código abertoO ... é escrito em PHP e JavaScript e suporta o

MySQL como gerenciador de banco de dados além de gerenciadores de banco de dados RDF (triple stores) como um armazenamento secundário

Semantic MediaWiki

O ... está bem estabelecido e estávelO criado em 2005O é utilizado em centenas de sitesO é bem documentado (em inglês)

O http://semantic-mediawiki.orgO possui um evento que acontece duas vezes ao ano

na Europa e nos Estados Unidos (SMWCon)O é uma das maiores extensões do MediaWiki

O Código, desenvolvedores, usuários, etc.

Semantic MediaWiki

Possibilita:O O armazenamento e o gerenciamento de dadosO A navegação e a visualização de dadosO A busca por páginas baseada nos dados

armazenadosO A formatação de dadosO A exportação de dados

O modelo de dados do Semantic MediaWiki

O Dados: pares de propriedade-valor atribuídas às páginas

O Exemplo (página – propriedade - valor)

O Brasil | tem capital | BrasíliaO Jaider | nasceu em | 1990O Dom Casmurro | tem autor | Machado de Assis

Utilizando o Semantic MediaWiki

O Os dados são registrados na página que representa o que se pretende descrever. Exemplo:

O Página: BrasilO Conteúdo da página: [[tem capital::Brasília]]

Extensões do Semantic MediaWiki

O Semantic FormsO Formulários para o preenchimento dos dados

O Semantic Result FormatsO Vários formatos de saída para a exibição e o

intercâmbio de dadosO Maps e Semantic Maps

O Gerencia e consulta dados sobre locais geográficos O Semantic Drilldown

O Para a navegação facetada dos dadosO Semantic Watchlist

O Para enviar notificações quando os dados são modificados

O ...

Em síntese...O A Ciência da Informação trata da representação e da descrição

de recursosO A Web (principal ambiente digital informacional) está passando

por grandes desenvolvimentos, rumo a Web SemânticaO A Web Semântica é composta por várias tecnologias (URI, XML,

RDF, RDFS, OWL, RIF, etc.) que visam representar e descrever uma realidade de maneira interoperável

O A Web Semântica é projetada para forncecer “um pouco mais” de significado (semântica) para as máquinas

O Linked Data é um conjunto de práticas para a publicação de dados estruturados na Web Semântica

O Linked Data exige a utilização de RDFO Wikis semânticos fornecem meios para a descrição de recursos e

para a publicação de dados estruturados em RDF na Web Semântica.

O O wiki semântico mais utilizado é o Semantic MediaWiki.

ReferênciasO BERNERS-LEE, Tim. Linked Data. 2006. Disponível em:

<http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 20 mar. 2013.

O BUFFA, Michel et al. SweetWiki: A semantic wiki. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, [S.l.], Elsevier, v. 6, n. 1, p. 84-97, 2007. Disponível em: <http://dx.doi.org/10.1016/j.websem.2007.11.003>. Acesso em: 25 jun. 2011.

O KRÖTZSCH. Semantic MediaWiki - An introduction. Oxford: SMWCon, 2012. Disponível em: <http://semantic-mediawiki.org/wiki/File:20121024_SMWCon_Fall_Markus_Kr%C3%B6tzsch_Semantic_MediaWiki_-_An_Introduction.pdf>. Acesso em: 20 mar. 2013.

O MILLER, Eric. An Introduction to the Resource Description Framework. D-Lib Magazine, v. 4, n. 5, May 1998. Disponível em: <http://www.dlib.org/dlib/may98/miller/05miller.html>. Acesso em: 16 set. 2012.

O NISO. Understanding Metadata. Bethesda: NISO Press, 2004. Disponível em: <http://www.niso.org/publications/press/UnderstandingMetadata.pdf>. Acesso em: 23 set. 2012.

O SANTOS, Plácida Leopoldina Ventura Amorim da Costa; ALVES, Rachel Cristina Vesú. Metadados e Web Semântica para estruturação da Web 2.0 e Web 3.0. DataGramaZero, Rio de Janeiro, v. 10, n. 6, dez. 2009. Disponível em: <http://www.dgz.org.br/dez09/Art_04.htm>. Acesso em: 25 jun. 2011.

O SW-FAQ. W3C Semantic Web Frequently Asked Questions. 2009. Disponível em: <http://www.w3.org/2001/sw/SW-FAQ>. Acesso em: 20 mar. 2013.

ObrigadoJaider Andrade Ferreira

jaideraf@gmail.comWikincat.org

Encontro Internacional Dados, Tecnologia e Informação, Marília, 2013