Ontologias e Web Semântica Charles Alberton Herdt Dyson Pereira Junior Maurício Edgar Stivanello.

Post on 16-Apr-2015

119 views 8 download

Transcript of Ontologias e Web Semântica Charles Alberton Herdt Dyson Pereira Junior Maurício Edgar Stivanello.

Ontologias eWeb Semântica

Charles Alberton Herdt

Dyson Pereira Junior

Maurício Edgar Stivanello

Roteiro

Introdução Ontologias Web Semântica

Roteiro

Introdução Ontologias Web Semântica

IntroduçãoCenário Atual

Internet introduz um problema de manipulação de informação: Possui grande volume de informações não

estruturadas ou pouco estruturadas; Alguns dos grandes problemas são:

Consulta: encontrar o que se deseja Integração: integrar informações de várias

fontes Interpretação: extrair significado das

páginas Comunicação: interconectar sistemas

O modelo atual de busca não é preciso, pela falta de semântica;

O grande volume de informações não estruturadas agrava a situação;

Problema de precisão, pois é baseado em links e palavras chave

IntroduçãoCenário Atual - Consultas

IntroduçãoCenário Atual - Consultas

IntroduçãoCenário Atual - Integração

Integração de Informações: O site A tem descrição de produtos de

software; O site B tem preços de material de

computação; Problema:

Combinar produtos e preços; Dificuldade

Como integrar tais informações?

Humanos extraem significado com facilidade;

Para as máquinas não é tão fácil; Como é possível extrair informações

sem conhecer de antemão o formato utilizado na criação das páginas?

IntroduçãoCenário Atual - Interpretação

IntroduçãoCenário Atual - Interpretação

Nome

Foto E-mail

A extração de informações somente é possível para um conjunto de páginas com formato bem conhecido ( através de wrappers ); Ex: Coleta de títulos e preço de vendas

em um site de comércio eletrônico;

IntroduçãoCenário Atual - Interpretação

Como interconectar sistemas que falam da mesma coisa mas com linguagens diferentes?

IntroduçãoCenário Atual - Comunicação

Resumindo: O conteúdo pode ser lido, mas é difícil de

ser processado pela máquina; É difícil automatizar processos;

Solução: A solução seria descrever os dados contidos

na Web e representá-los de forma conveniente...

IntroduçãoCenário Atual

IntroduçãoCenário Atual - Solução...

A IA forneceu alternativas para resolver problemas de manipulação de informação na Internet;

Resurge o paradigma declarativo lógico para a resolução dos problemas surgidos com a Internet;

IntroduçãoCenário Atual - Solução...

Como captar a semântica do conteúdo das páginas da web?

Dotar os sistemas de inteligência e autonomia;

Fazer com que as páginas possuam uma semântica clara e definida.

As ontologias representam um papel fundamental em ambas as soluções.

Roteiro

Introdução Ontologias Web Semântica

OntologiasIntrodução

É possível representar conhecimento através de formalismos orientados a classes e relações:

Frames; Redes Semânticas; Lógicas de restrição;

Estes formalismos fundamentam a representação do conhecimento em ontologias.

OntologiasDefinição

“Uma especificação explícita e formal de uma conceitualização compartilhada”

Por Especificação explícita: definições de conceitos, relações

Por formal: compreensível para agentes e sistemas

Por conceitualização: se trata de um modelo abstrado de uma área de conhecimento

Por compartilhado: conhecimento consensual

OntologiasClassificação das Ontologias

Tipos de Ontologias: de Representação; Gerais; Centrais; de Domínio; de Aplicação.

OntologiasKSE – Knowledge Sharing Effort

Até anos 90, Ontologias estavam isoladas. Percebido então os benefícios da reutilização;

KSE criado para prover meios de reutilização do conhecimento;

Como resultado, encontram-se disponíveis várias ontologias e ferramentas.

OntologiasFerramentas para manuseio

Ferramentas KSE (KQML, KIF, Editor de Frames, OKBC, Chimaera, Servidor, Repositório);

Protégé-2000; Ferramentas KAON e Ontoprise.

OntologiasEngenharia de Ontologias

Princípios de construção de Ontologias: Clareza; Legibilidade; Coerência; Extensibilidade; Mínima codificação; Mínimo compromisso ontológico.

OntologiasCriação ontologia geográfica em 7 passos

Passo 1: Determinar o domínio e o escopo da

ontologia;Domínio: GeografiaAplicação: Planificador de rotas

Perguntas possíveis:-Qual é a distância entre duas cidades?-Que tipo de conexão existe entre duas cidades?-Em que país se encontra uma cidade?-Quantas fronteiras são atravessadas?

OntologiasCriação ontologia geográfica em 7 passos

Passo 2: Reutilizar ontologias existentes;

Verificar se é possível utilizar ou estender alguma das ontologias existentes. Existem várias fontes disponíveis:

- Ontolingua Ontology Library (www.ksl.stanford.edu/software/ontolingua);

- DAML Ontology Library(www.daml.org/ontologies);

OntologiasCriação ontologia geográfica em 7 passos

Passo 3: Levantar termos importantes;

Termos importantes para o problema de planificação de rotas:

Conexão por terra

cidade

capital

fronteira

conexão

estradaEstado

OntologiasCriação ontologia geográfica em 7 passos

Passo 4: Definir classes e sua hierarquia;

Selecionar do passo 3 somente os objetos, definindo sua hierarquia:

TC

CC

CC

CC

CC

C

C

Topo

Conexão

Conexão Aérea

Conexão Terrestre

Conexão Marítima

Cidade

País

Ferroviária

Rodoviária

Capital

Interior

Entidade geográfica

OntologiasCriação ontologia geográfica em 7 passos

Passo 5: Definir propriedades das classes;

Selecionar do passo 3 as propriedades e atribuir às classes:

ElementoGeografico

+descrição+area

País

+moeda

Conexão

+descrição

Cidade

Capital

ponto_inicio

ponto_final

capital

faz_fronteira_com

EstadotemEstados temCidades

capital

capital_de

capital_de

OntologiasCriação ontologia geográfica em 7 passos

Passo 6: Definir restrições das propriedades;

-Tipo de propriedade;-Valores permitidos;-Cardinalidade;-Tipos de relacionamentos.

ElementoGeografico

+descrição: String+area: Float

País

+moeda: string

Conexão

+descrição: String

Cidade

Capital

ponto_inicio

1 *

ponto_final

1 *

capital1

1faz_fronteira_com

*

EstadotemEstados

*1

temCidades

*1

capital

capital_de

1

1

capital_de

1

1

OntologiasCriação ontologia geográfica em 7 passos

InversoSimétrico

País

+moeda: string

faz_fronteira_com*

ElementoGeografico

+descrição: String+area: Float

Conexão

+descriçãoponto_inicio

1 *

ponto_final

1 *

Transitivo

Passo 6: Definir restrições das propriedades;

País

+moeda: string

Capital

capital

11

capital_de

1 1

OntologiasCriação ontologia geográfica em 7 passos

Passo 7: Instanciar as classes, criando a base de

conhecimento.

Roteiro

Introdução Ontologias Web Semântica

Evolução da Web atual; Definição W3C:

É a idéia de se ter dados na web definidos e ligados de maneira tal que possam ser usados por máquinas não só com o objetivo de apresentação, mas para automação, integração e reuso de dados entre aplicações.

Idealizada por Tim Berners-Lee;

Web SemânticaIntrodução

Web SemânticaWeb Atual X Web Semântica

Recurso

Recurso Recurso Recurso Recurso

Recurso

Recurso Recurso Recurso

Link para

Link paraLink para

Link para

Link para Link para

Link paraLink para

Link para

Software

Documento Biblioteca Imagem Biblioteca

Documento

Tópico Tópico Pessoa

As s unto

temManual

requerrequer

baseadoEmparteDe

autorAssunto

Assunto

Web SemânticaCamadas da proposta W3C

Berners Lee, T. et al., The Semantic Web. [2001]

UNICODE Garante o uso padronizado do mesmo

conjunto de caracteres; URI – Identificador Universal de

Recursos Provê uma forma unívoca de identificação

e localização de recursos; Ex:

URL – documentos, imagens, músicas, etc; E-mail – pessoas;

Web SemânticaCamada Unicode - URI

XML – Extensible Markup Language escolhida como a linguagem de

programação para Web Semântica Função:

Auto-descrição das informações (metadados)

Padronizar a publicação e troca de dados entre aplicações Web

Web SemânticaCamada XML + XMLS

Metadados: Auto-descrição das informações

5353123456785353?

Web SemânticaCamada XML + XMLS

Número do cartão de crédito do João da Silva

Web SemânticaCamada XML + XMLS

Metadados

Aparência

HTML

Marcadores de metadados insuficientes; Não possui criação de novos marcadores; Preocupação apenas com apresentação;

Web SemânticaCamada XML + XMLS

XML

Criação de marcadores; Blocos endereçáveis; Organização hierárquica;

Web SemânticaCamada XML + XMLS

XML Schema Permite restrições sobre um documento:

Define os marcadores válidos; Define regras de validade para o conteúdo

de cada bloco: O marcador <reunião> deve conter

Exatamente um marcador <local>; 2 ou mais marcadores <pessoa>;

O marcador <pessoa> deve conter Exatamente um marcador <nome>

Define uma estrutura de dados

Web SemânticaCamada XML + XMLS

HTML XML

XMLS

Temos sintaxe, mas não semântica; Sentido:

O sentido se estabelece através de relações entre as coisas;

Só podemos definir formalmente o sentido de uma palavra com outras palavras;

Web SemânticaCamada RDF – Sentido por conexão

RDF – Resource Description Framework É um modelo de dados para referenciar

objetos e como eles estão relacionados; Representado usando a sintaxe XML; Descreve os recursos através de

declarações;

Web SemânticaCamada RDF

Declarações são triplas(sujeito,predicado,objeto): Recurso tem propriedades que têm

valores;

Web SemânticaCamada RDF

RecursoPropriedade

Valor

Declaração

Declarações RDF podem ser vistas como grafos direcionados e rotulados:

Web SemânticaCamada RDF

autor

http://www.paleo.org/dinos.html

http://www.edissauros.com.brhoracio@paleo.org

editora

Vida dos Dinossauros

título

Descrição RDF:

Web SemânticaCamada RDF

<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc=" http://purl.org/dc/elements/1.1/"><rdf:Description rdf:about="http://www.paleo.org/dinos.html">

<dc:title> Vida dos Dinossauros </dc:title><dc:creator rdf:resource=“mailto:horacio@paleo.org"/><dc:publisher rdf:resource="http://www.edissauros.com.br"/>

</rdf:Description></rdf:RDF>

RDF Schema: Criação de um modelo para recursos de

determinada categoria; Utiliza o conceito de classes da OO;

Web SemânticaCamada RDFS

Web SemânticaCamada RDFS

<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"><rdfs:Class rdf:ID="Livro"></rdfs:Class><rdfs:Property rdf:ID="Titulo">

<rdfs:domain rdf:resource=”#Livro”/><rdfs:range rdf:resource=”http://www.w3.org/2000/01/rdf-schema#Literal”/>

</rdfs:Property><rdfs:Property rdf:ID="Autor">

<rdfs:domain rdf:resource=”#Livro”/><rdfs:range rdf:resource=”http://www.w3.org/2000/01/rdf-schema#Literal”/></rdfs:Property>

</rdf:RDF>

Classe RDFS:

Web SemânticaCamada RDFS

RDFS não fornece detalhes suficientes para descrever recursos: Não possuiu restrições de existência ou

cardinalidade. Não possui propriedades transitivas,

inversas ou simétricas.

Adiciona mais vocabulário para descrever propriedades e classes: Relações entre classes; Cardinalidade; Igualdade; Tipagem mais rica de propriedades; Caracteristicas de propriedades;

Web SemânticaCamada Ontologia

OWL – Web Ontology Language

Web SemânticaCamada Ontologia

Ainda não tomaram corpo: Lógica: especificação de regras que atuam

sobre instâncias e recursos; Prova: executa as regras da camada lógica

(mecanismos de inferência); Validação: avalia se a prova está correta

ou não (verificação de autenticidade e resolução de contradições).

Web SemânticaCamadas Lógica, Prova e Validação

A WS é uma tentativa ambiciosa de construir uma estrutura complexa que permita que os computadores nos auxiliem na manipulação da informação;

Esforço na produção de metadados; Padronização de vocabulários; Massa crítica; Formalismos complexos (demanda para boas

ferramentas);

Web SemânticaConclusão

Freitas, Frederico Luiz Gonçalves: Ontologias e a Web Semântica. Acessado em 20/08/2006. Disponível em http://www.das.ufsc.br/~gb/pg-ia/tu-onto.doc.

Barreau, Guillaume: Ferramentas de Web Semântica aplicadas à gestão de conhecimento ligado ao linux. Acessado em 20/08/2006. Disponível em http://www.uefs.br/erbase2004/documentos/erbase/erbase4_p11_guillaume_barreau.pdf#search=%22%22guillaume%20barreau%22%20web%20sem%C3%A2ntica%22

W3C World Wide Web. Acessado em 20/08/2006. Postal disponível em www.w3c.org.

Web SemânticaReferências