Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

4

Click here to load reader

description

Artigo curto sobre web semântica.

Transcript of Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

Page 1: Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

Estudo introdutório sobre Web Semântica e suas Tecnologias

Emerson Henrique Soares SilvaASPER ­ Associação Paraibana de Ensino Renovado

João Pessoa, Brasil

[email protected]

RESUMONeste artigo, apresentamos a web em uma forma evoluída, onde o conteúdo possa ser interpretado tanto por homens como por computadores, a Web Semântica. A Web Semântica é hoje equipada com linguagens e ferramentas regidas por padrões que garantem a extensibilidade, portabilidade e interoperabilidade de documentos que contém as informações da web. Essa evolução nas linguagens permite que os documentos tenham suporte a metadados que podem definir vocabulários e significados sobre as informações, e os computadores ganharam o poder de interpretar essas informações e inferir sobre elas de forma discreta e formal, interagindo de mais precisamente e eficazmente com o usuário humano.

Palavras-chavesWeb semântica, ontologias, ferramentas, OWL, modor de inferência.

1. INTRUDOÇÃOA web é um grande repositório de informações que possui ferramentas, nas quais possibilitam o usuário realizar buscas a partir de palavras-chaves. Essas ferramentas são praticmente indispensáveis no cotidiano humano, mas o resultado dessas buscas não são tão relevantes, já que não há semantica nos documentos, o que permite a existêmcia de problems comuns de polissemia e sinonímia, além de que não consideram as informações em seus significados.

Esse artigo tem como objetivo apresentar um estudo teórico-bibliográfico sobre o que envolve esse novo conceito da web, o qual [Berners-Lee et al. 2001] definem como uma evolução natural da web vigente, a “Web Semântica”, que trás significado ao conteúdo da web, facilitando a interação entre computadores e pessoas.

A proposta da web semântica veio através dos autores citados acima com a intenção de tornar possível a interpretação semântica (por significados) do conteúdo da web para máquinas (através de agentes de softwares inteligentes), visto que o conteúdo da web não passava de informações sem significado para os computadores, que por muitas vezes, retornava as consultas dos usuários com resultados ambíguos e pouco precisos [Forte, Souza e Prado 2006].

Nas próximas seções apresentaremos os conceitos e ferramentas que envolvem a web semântica.

2. WEB SEMÂNTICAPara [Berners-Lee et al. 2001] a web semântica é uma extensão da web atual, na qual é dado a infomação um significado bem defindo, permitindo com que computadores e pessoas trabalhem

em coperação. Esses autores construíram essa definição baseada nas diferenças com o estágio mais conhecido da web, “Web Sintática”, onde os computadores são ferramentas de apresentação da informção, deixando a interpretação com contas das pessoas.

O objetivo da WS (Web Semântica) é enriquecer a informação disponível com semântica afim de se obter acesso inteligente a informação heterogênea e distribuída, permitindo que produtos de software (agentes de software inteligentes) possam fazer a intermediação entre as necessidades do usuário e as fontes de informação disponíveis [Breitman 2005]. Dessa forma os resultados obtidos através de buscas nas informações com semântica poderão ser bastante superiores em relevância ao contexto do que as buscas por palavras-chaves, já que essas buscas serão realizadas por softwares capazer de fazer deduções através de motores de inferência, que podem, apartir da semântica das informações, inferir respostas, situações ou novas informações.

Para fazer acontecer a WS, são necessárias a união de várias tecnologias como as apresentadas na Figura 1. Sendo a maior parte da informação contida na web em forma de linguagem natural, para fazer com essa linguagem seja mais compreensível por agentes de software é necessário a combinação dessas informações com metadados, que podem ser compreendidos tanto pessoas como por agentes de softwares. Souza e Alvarenga (2004) explicam que “Meta” é um prefixo de auto referência, de forma que “metadados” quer dizer “dados sobre dados”. Esses autores citados ainda afirmam:“Os metadados em documentos Web têm a função de especificar características dos dados que descrevem, a forma com que serão utilizados, exibidos, ou mesmo seu significado em um contexto.”[Souza e Alvarenga 2004]

Voltando a Figura 1, podemos perceber na base da arquitetura a URI , que é acronomo para Identificador Uniforme de Recursos (Uniform Resource Identifier em inglês) e representa uma linguagem padrão para troca de documentos na web. Sobre esta base estão os XML e RDF, que são tecnologias e ou padrões de documentos criados pelo W3C para troca de informações na web. O RDF, por sua vez, herda estrutura e tecnologias que envolvem o XML, como namespaces e xmlschemas, na verdade é um padrão de metadados para ser embutido na codificação XML., e possui também um RDFS ( RDF Schema) que é a exemplificação da sua implementação, e é incluída na sua especificação padrão. Sobre essa estrutura é onde se encontra a tecnologia mais impotante da WS, a Ontologia. A ontologia é uma específicação conceitual de um domínio do conhecimento, o padrão utilizado atualmente para fazer essa especificação é a OWL (Web Ontology Language), sobre a OWL trataremos com mais detalhes na seção 3.1. Sobre essa estrutura conceitual que é a ontologia, existe uma lógica que é programada para trabalhar com a realidade comprovada do domínio especificado. Sobre toda essa arquiterura existe uma interface de confiança que permite acesso assinado dgitalmente e/

Page 2: Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

ou cruptigrafado por aplicações que fazem a interface com o usuário final.

Nas próximas seções trataremos sobre algumas tecnologias utilizadas na WS, como ontologias, agentes e algumas ferramentas de forma mais detalhada.

3. ONTOLOGIAS

Ontologia é a principal camada da Web Semântica, por ser uma base de conhecimento sob um modelo conceitual de determinado domínio do conhecimento. De acordo com Gruber (1993) uma ontologia é uma especificação formal e explícita de uma conceitualização compartilhada que existem entre agentes ou comunidades de agentes. Souza e Alvarenga (2004) apresentam ontologia como disciplina filosófica que estuda as teorias sobre a natureza da existência, de como as “coisas” existem. Existe, também, uma relação de ontologias com a epistemologia1 que trata do conhecimento e saber.

Normalmente, uma ontologia é denotada em uma hierarquia de conceitos (ou taxonomias) [Freitas et al. 2008]. Isso significa que existem conceitos de generalização e especialização que se relacionam caracterizando heranças e que existem restrições de cardinalidade que definem o real relacionamento entre esses conceitos.

A utilidade das ontologias variam desde de o apoio a processos de desenvolvimento de software até apoio em sistemas de informações, já que o objetivo dessas ontologias, geralmente, é restringir um determinado domínio de aplicação ou de conhecimento. Na web o objetivo dos usuários é recuperar, classificar e extraír informações, e agentes de software utilizam as ontologias como base de conhecimento portável para recuperar as informações e motores de inferência para classificar e extraír o que realmente se deseja saber.

1 Epistemologia ou teoria do conhecimento (do grego πιστήμηἐ [episteme], ciência, conhecimento; λόγος logos], discurso) é um ramo da Filosofia que trata dos problemas filosóficos relacionados à crença e ao conhecimento.

Para fazer uso de ontologias na web, o W3C (World Wide Web Consortium) padronizou algumas linguagens, das quais a evolução atual e recomendada por este consórcio é a OWL (Web Ontology Language), a qual trataremos na seção seguinte.

3.1 OWL (Web Ontology Language)A OWL é a Web Ontology Language, como dito anteriormente, ela tem em sua base XML e RDF com seus respectivos schemas. Essa linguagem foi desenvolvida e padronizada pelo W3C pelo fato de que as ferramentas existentes para manipulação de ontologias eram criadas e utilizadas por usuário e comunidades específicas e muitas vezes não eram compatíveis com a World Wide Web e a Web Semântica. A OWL utiliza as URIs para nomeação de quadros e entidades da Web, como també utiliza o RDF para descrições desses quadros e entidades. Essa união fornece as ontologias capacidades adicionais como distribução entre sitemas, escalabilidade necessária na web, internacionalizaçã, compatibilidade com as normas de acessibilidade na web, transparência e extensibilidade.

Como OWL é utilizada para modelar Ontologias, é possível descrever classe e suas propriedades, os relacionamentos entre classes e cardinalidade desses relacionamentos, igualdade, características e tipagem mais ricas das propriedades, além de numeração de classes. O RDF Shema acrescenta a OWL o vocabulário para essas descrições mais detelhadas.

A OWL possui três sublinguagens bastante expressivas, são as OWL Lite, OWL DL, e a OWL Full. A mais comum dessas sublinguagens é a OWL DL, já que a OWL Lite implementa apenas algumas caraterísticas da OWL, e a OWL Full implementa algumas características a mais que são pouco utilizadas.

A Figura 2 apresenta um exemplo de código simples da OWL, simples mas permite que se perceba a colocação de classes e seus relacionamentos. A tag “<owl:Class rdf:ID='Doenca'/>” representa a definição da classe Doenca. Podemos notar também a presença da tag “<owl:ObjectProperty rdf:ID='tem'>”, essa tag define a existencia de um relacionamento entre o domínio Doenca e a classe Tratamento. Em um código mais completo certamente notaríamos a presentça de tags que definem as propriedades de dados de uma classe, bem como seríam notadas também restrições que são possíveis definir, por exemplo as cardinalidades mínimas e máximas, entre outras coisas que a OWL permite fazer.

Figura 1: Arquitetura da Web Semântica [W3C Semantic Web Activity 2009]

Page 3: Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

3.2 FerramentasExistem na comunidade algumas ferramentas que auxiliam na criação e manipulação de ontologias. Apresentarei algumas como o Protégé, o framework JENA, a SPARQL e o motor de inferência Pellet.

3.2.1 Protégé

O Protégé [Protégé] é editor de ontologias e framework de base de conhecimento. É um projeto gratuito e de código fonte aberto baseado na linguagem Java. Foi desenvolvido por pesquisadores do Stanford Center for Biomedical Informatics Research da Escola de Medicina da Universidade de Stanford.

3.2.2 Jena

O Jena (Java Semantic Web Framework) [Jena] é um framework Java para desenvolvimento de aplicações na WS. Esse framework inclui uma API RDF e OWL, leitura e gravação de arquivos RDF em RDF/XML, persistencia no armazenamento e in-memory, e o motor de consultas SPARQL. O Jena fornece uma interface de acesso em Java à estruturas semânticas (ontologias). O Jena não fornece nenhum poder de inferência, para pbter esse poder é necessário fazer uso de uma máquina ou motor de inferência, um exemplo é o motor de infer ncia Pellet [Pellet] que seráẽ referenciado na seção 3.2.4.

3.2.3 SPARQL

A SPARQL é uma linguagem de consulta para documentos RDF. Uma linguagem semelhante a SQL, porém como o foco a beses de dados RDF. A SPARQL permite tratamentode ordenação das consultas, a criação de variáveis de consultas, termos e álias, entre outras várias características em comum com a SQL.

A SPARQL é usada para consultar fontes de dados que podem ser nativamente RDF ou podem ser vistas com RDF através de middlewares.

3.2.4 Pellet

Pellet é um raciocinador (máquina ou motor de inferência) OWL DL, escrito em Java e possui código fonte aberto sobre licensas bastante liberais. Esse motor possuí uma performance muito boa, middleware extensivo e características únicas.

Pellet permite a realização de serviços em ontologias como: controle de consistência, que garante que uma ontologia não contenha qualquer fato contraditóio; verifica se a classe pode ter instâncias, garantindo a coerência e consistência da ontologia; classificação, que calcula relacionamentos entre classes sobre hierarquias; realização, que considera as classe mais específicas pertencentes a um indivíduo.

4. CONCLUSÃO

A WS trás significado e poder a softwares de “compreender” e inferir sobre as informações encontradas na web. Mas para garantir esse poder essa evolução natural da web sintática, onde os softwares apenas apresentava as informações e o poder de compreenção e inferência fica por conta apenas dos homens, é necessário definir documentos com tecnologias que permitem descrever, de forma mais discreta para computadores, o conteúdo da web impondo significados e vocabulários. Para inserir semântica no conteúdo da web de forma portável, extensível e interoperável foram criados alguns padrões em forma de linguagens. E, para manter o conteúdo semântico coerente são usadas ontologias na modelagem de desenvolvimento do conceito dessa semântica. A OWL permite descrever, através do RSF e RDF Schema, um vocabulário consistente de umdeterminado domínio do conhecimento, permite trasnportar de forma portável e definir tipos de dados interoperáveis através do XML e do XML Schema, e fornece a modelagem ontológica do domínio especificado, foi criada e definida como padrão para a construção de ontologias na WS pelo W3C. Para que computadores interpretem o conteúdo da WS são utilizados raciocinadores ou motores de inferência, que mais do que inferir também proporcionam cálculos sobre as ontologias, verificações de consitência e validações.

Essa evolução permite a organização e compreenção do conteúdo da web em contextos, garantindo maior precisão na busca por informações, evitando polissêmias.

5. REFÊNCIASBERNERS-LEE, T.; HENDLER, J.; LASSILA, O.; The Semantic Web. Scientific American, mai., 2001.

BREITMAN, K.; Web Semântica: a Internet do futuro. Ro de Janeiro, LTC, 2005.

FORTE, M.; SOUZA, W. L. de; PRADO, A. F. do; Utilizando Ontologias e Serviços Web na Computação Ubíqua. In: XX Simpósio Brasileiro de Engenharia de Software. 2006.

Figura 2: Exemplo de Código da Linguagem OWL

Page 4: Estudo Introdutorio Sobre Web Semantia e suas Tecnologias

FREITAS, F.; CABRAL, L.; LIMA, R.; ESPINASSE, B.; PALMEIRA, E.; FOURNIER, S.; BITTENCOURT, G.; Do MASTER-Web ao AGATHE: a evolução de uma arquitetura de manipulação de informações para a web usando ontologias. RECIIS – Revista Eletrônica de Comunicação, Informação e inovação em Saúde. Rio de Janeiro, v.2, n.1, p.74-86,jan.-jun., 2008.

GRUBER, T. R.; Toward principles for the design of ontologies used for knowledge sharing. Intenational Jounal of Human an Computer Studies, v. 43, p.907-928.

Jena. Disponível em: <http://jena.sourceforge.net/>. Acesso em: 2009.

OWL. Disponível em: <http://www.w3.org/2004/OWL/>. Acesso em: 2009.

Pellet. Disponível em: <http://clarkparsia.com/pellet/>. Acesso em: 2009.

Protégé. Disponível em: <http://protege.stanford.edu/>. Acesso em: 2009.

SOUZA, R. R.; ALVARENGA, L.; A Web Semântica e suas contribuições para a ciência da informação. Revista Ciência da Informação. Brasília, v. 33, n. 1, p. 132-141, jan.-abr., 2004.

SPARQL. Disponível em: <http://www.w3.org/TR/rdf-sparql-query/>. Acesso em: 2009.