Computação Semântica em...

20
Computação Semântica em E - Science Sérgio Serra PPGMMC/UFRRJ & PET-SI /UFRRJ [email protected]

Transcript of Computação Semântica em...

Computação Semântica em E-Science

Sérgio SerraPPGMMC/UFRRJ & PET-SI /UFRRJ

[email protected]

Agenda

• Motivação

• Proveniência

• Ciclo de Vida x Semântica

• Ontologias de Proveniência

• E-Science no Agronegócio

Motivação

1. Experimento em larga escala

realizado pelos cientistas A e B

no lab. 1

2. Dados são

pré-analisados

com o programa X

em cluster do lab I

3. Grande quantidade

de dados gerada...

4. ...precisa ser

processada por

programas K, L e M

numa nuvem de

computadores

5. Os resultado são analisados

Pelo programa Z pelo cientista C

no lab. II

6 A pesquisa

é publicada

Recursos

Científicos (DADOS)

+

Proveniência

adaptado de (MATTOSO, CRUZ et al., 2008, CRUZ 2011), Tutorial SBBD.

5

1

2

3

4

6

3

Proveniência• Comum a várias áreas;

• Gerência da proveniência suscita muitas pesquisas em e-Ciência e BD;

• Várias definições (SIMMHAN et al., 2005, SRIVASTAVA, VELEGRAKIS, 2007, FREIRE et al., 2008, CHENEY et al., 2009, CRUZ et al, 2009,CHAPMAN, JAGADISH, 2010);

Proveniência são metadados sistematicamente coletados e

armazenados; auxiliam na determinação da história de um artefato através da evolução de

processos, desde sua origem até seu destino final (BUNEMAN, 2001) 4

Proveniência na E-Ciência

• Reprodutibilidade e interpretação de resultados

• Verificar se um experimento obedece aos protocolos

• Rastreamento, Transparência, Auditoria

• Assegurar a qualidade dos dados e processos

5

Provenance is as (or more) importante as the results(FREIRE & DAVIDSON, SIGMOD, 2008)

6

CAPTURA

ACESSOe REUSO

APOIO SEMÂNTICO

OBJETO

ARMAZENAMENTO

Visão integrada do ciclo de vida

centrado em proveniência 2

3

4

5

1

5Dimensões

Taxonomia de Proveniência

Objeto

Granulosidade

Mecanismo

Etapa

Orientação

AnotaçãoInversão

Grossa

Fina

Execution (Retrospectiva)

Composição (Prospectiva)

ProcessoDado

Ah-hoc

Manual

Automatica

Externa

Interna

Análise (Analítica)

Captura

Nível

Workflow

Atividade

S.O.

TécnicaTracing

Eager

Lazy

Escalabilidade Acoplamento Arquivamento

Semiestruturado

Centralizado Distribuído

Homogêneo

HeterogêneoNenhum

Baixo

Alto

Time-Stamp

Seqs de Delta

Armazenamento

Persistência

Relacional

OWL

XML

Consulta

Acesso

APIQBE

Proveniência

Relacional

Semântica

XML

Apoio

Semântico

Ontologia

Taxonomia

Vocabulário

Domínio

Tarefa

Aplicação

Adaptado de CRUZ et al. (2011, 2012)7

Proveniência e Web Semântica

8Fonte: http://www.w3.org/TR/prov-o/ (2013)

PROV-O

Fonte: http://www.w3.org/TR/prov-o/ (2013)

agent

activity

entity

Ontologia OvO• Open Provenance Ontology (OvO) é ontologia de domínio:

1. Bem fundamentada, ancorada na UFO e PROV2. Modular e flexível adaptar às exigências específicas dos

diferentes domínios de aplicação.3. Contempla granulosidades da proveniência distintas;4. Submetida ao processo de engenharia ontológica;5. Modelada através de uma linguagem ontológica (OLED) ;6. Voltada para a proveniência da área de e-Ciência,

• Não incorpora conceitos específicos sobre os domínios dos experimentos;

Benefícios...– Adota Padrão aberto; fácil de ser manipulado e compreendido por

profissionais de perfis variados;– Clareza, coerência, extensibilidade,– Semântica formal bem definida.– Extensível por outras ontologias específicas do domínio do experimento.

Estratégia

10Fonte: UFO (Guizzrdi, 2005..2015)

Ontologia OvO

• A OvO foi dividida em três sub-ontologias, a saber:

1. Sub-ontologia de experimentos científicos em larga escala;

2. Sub-ontologia de proveniência prospectiva;

3. Sub-ontologia de proveniência retrospectiva;

11Adaptado de CRUZ et al. (2011, 2012)

OvO foi originalmente concebida sobre o Fragmento UFO-A, no momento está sendo reestruturada (UFO-B, UFO-C, ...)

Sub-Ontologia de Experimentos Científicos em Larga Escala

LegendaProspectivo

Retrospectivo

Conceitos de maior granulosidade não contemplados nas demais ontologias de proveniência (ex. experimentos científicos, hipótese, modelos, projeto, agentes, fases) 12

Adaptado de CRUZ et al. (2011, 2012)

Sub-Ontologia de Proveniência Prospectiva

Conceitos de granulosidade grossa correlacionando o workflow e atividades.

Também representa os papéis e relações desempenhados pelos agentes na etapa de composição do experimento;

13Adaptado de CRUZ et al. (2011, 2012)

Sub-Ontologia de Proveniência Retrospectiva

Conceitos de menor granulosidade associados à etapa de execução do experimento.

14Adaptado de CRUZ et al. (2011, 2012)

Cenário de E-Science no Agronegócio

15

Caso 1: Agronegócio (Clima)

adap

tad

o d

e LE

MO

S FI

LHO

et

al.

(20

12

, 20

13

, 20

14

), E

-Sci

ence

BA

RB

OSA

et

al. (

20

14

) IP

AW

16

1

Dezenas de estações (região Sul Fluminense).

Longas séries (>= 20 anos de dados)

Erros e falhas nas séries

Caso 2: Agronegócio (lavoura)

adap

tad

o d

e V

IAN

NA

e C

RU

Z (S

BIA

GR

O e

BR

AC

IS 2

01

3)

NU

NES

et

al.

(20

14

) IP

AW

e N

UN

ES e

t al

(ER

SI 2

10

4)

17

adap

tad

o d

e R

EIC

HE,

CR

UZ,

CA

MP

OS

.(2

01

4)

ISB

BD

Computação Semântica em E-Science

Sérgio SerraOBRIGADO PELA ATENÇÃO

[email protected]

AgradecimentosProfa. Maria Luiza Machado CamposProfa. Maria Claudia Cavalcanti (Yoko)Profa. Marta MattosoProfa. Gizele ViannaProfa. Margarida Goréte do CarmoProfa. Ana Claúdia VieiraProf. Giancarlo GuizzardiProf. Antônio Carlos de S. AbboudProf. Alberto DávilaProf. Ednaldo OliveiraProf. Gustavo Lyra

Msc. Marden MarquesMsc. Fabio CardozoMsc. José Antonio NascimentoTec. Agric. Pedro Vieira CruzAgric. Campo Experimental UFRRJAlunos do PET-SI e do PPGMMC/UFRRJ

PROPAGANDA

• 9º BRESCI (Brazilian e-Science Workshop) da XXXV CSBC

• Deadline: 16 de Abril Enviem seus trabalhos!

http://csbc2015.cin.ufpe.br/19

20

Jogo dos 7 erros da proveniência