Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva...

Post on 07-Apr-2016

218 views 1 download

Transcript of Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva...

Utilização de Ontologias para Integração de Heterogeneidade

Semântica

Leandro Alves da Silva

email : leandroa@ipt.br

Internet

Redes

Inter-Relacionadas

página

email

arquivos de dados

imagem

vídeo

bancos de dados

som

Recursos

Estudo do significado da palavra, que nos explica a origem e as variações da significação vocabular

Semântica

Monossemia : Representa apenas um conceito. O termo nesta condição é chamado monosema. Esta é a relação ideal entre conceitos, pois reduz a ambigüidade

Semântica

Homonímia : Termos idênticos na forma fonética (homófonos) e ou, na forma gráfica (termos homógrafos) e ou em ambas.

Seção (corte) , Sessão (reunião) Termos homófonosManga (fruta) , Manga (paletó) Termos homófonos e

homógrafos

Sinonímia : Termos diferentes (sinônimos), que representam o mesmo conceito

Carro , Automóvel

Como ontologias podem ajudar a resolver problemas de heterogeneidade semântica ?

Disponibilizar aos usuários da Internet padrões de criação derecursos.

Mudar de HTML para XML, RDF e RDFS

Disseminar o conhecimento sobre : Metadados, Ontologias eTesauro

Metadados

Metadados, também conhecidos como “dados sobre dados”, são utilizados para descrever as características de recursos e seus relacionamentos

Padrões de Metadados

O padrão Dublin Core (W3C)

DescriçãoTitle Título do recursoCreator Pessoa ou organização responsável pela criação do conteúdo intelectual do

recursoContribuitor Pessoa ou Organização que contribui intelectualmente na criação do recurso

(ex.: editor, ilustrador, tradutor, etc)Publisher Identifica a entidade responsável por tornar o recurso disponível.Date Data da criação ou publicação do recursoSource Informação sobre os recursos que contribuíram para a elaboração do recurso

correnteRelation Recursos que possuem relacionamentos com o recurso correnteDescription Descrição do conteúdoSubject Tema do recursoType Forma como o conteúdo é expresso (relatório técnico, dissertação, etc).Format Formato em que o recurso é materializado (postScript, HTML, DOC, PDF,

etc).Identifier Possui um identificador único do recursoLanguage IdiomaCaverage Características Espaciais ou temporaisRights Informações sobre os direitos autorais do recurso

Ontologia

O termo ontologia tem sua origem na Filosofia, onde é definida como “a especificação explícita de uma conceitualização”, isto é, tem como pressuposto a existência de algo.

Ontologia é a descrição explícita e precisa de conceitos e relações que existem em um domínio particular, tal como uma dada organização, um domínio de estudo, uma área de aplicação.

A principal propriedade de uma ontologia é o compartilhamento e filtragem.

Compartilhamento significa que um acordo deve existir entre diferentes agentes, estes baseados no acordo de ontologias comuns, isto é, devem ter o mesmo entendimento sobre um dado conceito.

Ontologia

Ontologia OIL (Ontology Inference Layer)

ontology-containertitle “Meios de Transporte”creator “Leandro Alves da Silva”subject “carro, trem, transportes em geral”description“exemplo de especificação de ontologia descrevendo meios de

transporte no Rio de Janeiro”...language “OIL”language “Português”

Ontologia OIL (Ontology Inference Layer)

ontology-definitionsclass-def transporte /*define hierarquia entre classes */

class-def carrosubclass-of transporte

class-def aviãosubclass-of transporte

class-def ônibussubclass-of transporte

class-def tremsubclass-of transporte

Ontologia OIL (Ontology Inference Layer)

class-def terrestresubclass-of transporteslot-constraint tem_pneus /* define relacionamento entre classes */value-type carro, ônibus /* enumeração de valores */slot-constraint total

has-value (min 4) /* estabelece cardinalidade mínima = 4 */

class-def aéreosubclass-of transporteslot-constraint tem_asasvalue-type avião

Tesauro

Um Tesauro é um índice controlado utilizado tanto na indexação, quanto na recuperação de documentos. A hierarquia dos termos contidos em um Tesauro e seus conceitos, são percebidos na forma como os mesmos são classificados (área do conhecimento).

Um Tesauro é um exemplo prático da aplicação da Ontologia. Pode-se descrevê-lo como uma lista de termos, usados para a representação de conceitos.

Sua maior vantagem é unificar os termos de busca, normalmente diferenciados na linguagem natural.

Geralmente, é desenvolvido por uma equipe, composta por especialistas da informação em conjunto com especialistas da área do conhecimento que se quer abranger.

Segue uma classificação baseada em Taxonomia (i.e., uma classificação de elementos dentro de um domínio. Distribui e estabelece relacionamentos entre os elementos que podem ser objetos ou conceitos)

Tesauro

XML (extensible markup language)

HTML (Hiper Text Markup Language)

A XML supre as deficiências da HTML, permitindo a criação de marcações definidas pelo próprio usuário e, desta forma, proporcionar uma maior descrição dos recursos em termos de metadados.

<pessoa><nome>Leandro</nome><idade>26</idade><e-mail>leandroa@ipt.br</email>

</pessoa>

<livro><titulo idioma=”Ingles”>Data on the web</titulo><preço moeda=”Dolar”>40.25</preço><editora pais=”Brasil”>McGrawHill</editora>

</livro>

XML (extensible markup language)

RDF (Resource Description FrameWork)

O RDF pode especificar o relacionamento entre entidades e prover interoperabilidade estrutural

http://www.ipt.br/leandro/paper.htm Metadados

Mod:título

Mod:Agente Criador

Mod:Nome Mod:e-mail

Leandro Leandroa@ipt.br

RDF (Resource Description FrameWork)

<?xml version=”1.0”?><rdf:RDFxmlns:rdf= xmlns:mod=”http://www.ipt.br/sgdc_w/moddec/definition”>

<rdf: Description about = ”><mod:titulo> Metadados </mod:titulo><mod:Agente_Criador><mod:nome>Leandro</mod:nome><mod:e-mail>leandroa@ipt.br</mod:e-mail></mod:Agente_Criador>

</rdf:Description></rdf:RDF>

RDF (Resource Description FrameWork)

RDFS (Resource Description Framework Schemas)

Fornece mecanismos para declaração de propriedades e definição de relacionamento entre tais propriedades e outros recursos.

O esquema RDF é especificado como um conjunto de classes, propriedades e restrições entre seus relacionamentos, e pode ser usado em conjunto com outros vocabulários específicos.

RDFS (Resource Description Framework Schemas)

<rdf:RDFxmlns: rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”xmlns: rdfs=””>

<rdf:Description ID=”Animal”><rdf:type resource=”Class”/><rdf:subClassOf resource=”Resource”/>

</rdf:description ID=”Animal”>

<rdf:Description ID=”Mamífero”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>

</rdf:description>

<rdf:Description ID=”Ave”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>

</rdf:description>

RDFS (Resource Description Framework Schemas)

<rdfs:Property rdf:ID=”cor”><rdfs:comment>Cor da penugem</rdfs:comment><rdfs:domain rdf:resource=”#Ave”<rdfs:range rdf:resource=””></rdfs:Property>

<rdfs:Property rdf:ID=”habitat><rdfs:comment>Local onde é encontrado</rdfs:comment><rdfs:domain rdf:resource=”#Mamífero”<rdfs:range rdf:resource=””></rdfs:Property>

</rdf:RDF>

Aplicação de ontologias na resolução de problemas de heterogeneidade semântica

Coleção deRecursos P

Integração BaseadaOntologia p Coleção de em Ontologia

Recursos Q

DB p1 Ontologia q Sistema baseado em IAEsquema p1 para integração de

DB q1 de OntologiaDB p2 Esquema q1Esquema p2

Resultado da IntegraçãoBaseado em Similaridade

Esquema de Integração Global Integrador de EsquemaBaseado em Ontologia

Ontologia p

Inquilino

Cidadão Estrangeiro

pago por Salário

Ontologia q

Pessoa ganha Ordenado

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Resultado da Integração de Parte das Ontologias por Conceitos iguais

Inquilinoe Pessoa

Cidadão Estrangeiro

pago por eganha

Salário@p eSalário@q

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Resultado da Integração de Parte das Ontologias por Conceitos iguais

Esquema p1 Esquema q1

Cidadão Estrangeiro Conferencista ProfessorOrdenado Ordenado Salário Salário

PessoaEsquema Global

Salário

Cidadão Estrangeiro Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Criando uma Classe Pessoa em um Esquema Global

Ontologia q

Ontologia p

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Estudante

Estudante nãoGraduado

EstudanteGraduado

Pessoa

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Estabelecimento de Relações de Similaridade, Criando um Novo Conceito

pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Estudante

Estudante nãoGraduado

EstudanteGraduado

Pessoa

Administradorde Pessoal

Professor Assistente

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Estabelecimento de Relações de Similaridade, Criando um Novo Conceito

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Criando uma nova Classe Global em um Esquema Baseado em Ontologia

Esquema p2 Esquema q1

Estudante de Graduação Conferencista

Estudante de Graduação Conferencista

Esquema Global

Professor Assistente

Perguntas

Leandro Alves da Silva

email : leandroa@ipt.br