Computação Semântica em...
Transcript of Computação Semântica em...
Agenda
• Motivação
• Proveniência
• Ciclo de Vida x Semântica
• Ontologias de Proveniência
• E-Science no Agronegócio
Motivação
1. Experimento em larga escala
realizado pelos cientistas A e B
no lab. 1
2. Dados são
pré-analisados
com o programa X
em cluster do lab I
3. Grande quantidade
de dados gerada...
4. ...precisa ser
processada por
programas K, L e M
numa nuvem de
computadores
5. Os resultado são analisados
Pelo programa Z pelo cientista C
no lab. II
6 A pesquisa
é publicada
Recursos
Científicos (DADOS)
+
Proveniência
adaptado de (MATTOSO, CRUZ et al., 2008, CRUZ 2011), Tutorial SBBD.
5
1
2
3
4
6
3
Proveniência• Comum a várias áreas;
• Gerência da proveniência suscita muitas pesquisas em e-Ciência e BD;
• Várias definições (SIMMHAN et al., 2005, SRIVASTAVA, VELEGRAKIS, 2007, FREIRE et al., 2008, CHENEY et al., 2009, CRUZ et al, 2009,CHAPMAN, JAGADISH, 2010);
Proveniência são metadados sistematicamente coletados e
armazenados; auxiliam na determinação da história de um artefato através da evolução de
processos, desde sua origem até seu destino final (BUNEMAN, 2001) 4
Proveniência na E-Ciência
• Reprodutibilidade e interpretação de resultados
• Verificar se um experimento obedece aos protocolos
• Rastreamento, Transparência, Auditoria
• Assegurar a qualidade dos dados e processos
5
Provenance is as (or more) importante as the results(FREIRE & DAVIDSON, SIGMOD, 2008)
6
CAPTURA
ACESSOe REUSO
APOIO SEMÂNTICO
OBJETO
ARMAZENAMENTO
Visão integrada do ciclo de vida
centrado em proveniência 2
3
4
5
1
5Dimensões
Taxonomia de Proveniência
Objeto
Granulosidade
Mecanismo
Etapa
Orientação
AnotaçãoInversão
Grossa
Fina
Execution (Retrospectiva)
Composição (Prospectiva)
ProcessoDado
Ah-hoc
Manual
Automatica
Externa
Interna
Análise (Analítica)
Captura
Nível
Workflow
Atividade
S.O.
TécnicaTracing
Eager
Lazy
Escalabilidade Acoplamento Arquivamento
Semiestruturado
Centralizado Distribuído
Homogêneo
HeterogêneoNenhum
Baixo
Alto
Time-Stamp
Seqs de Delta
Armazenamento
Persistência
Relacional
OWL
XML
Consulta
Acesso
APIQBE
Proveniência
Relacional
Semântica
XML
Apoio
Semântico
Ontologia
Taxonomia
Vocabulário
Domínio
Tarefa
Aplicação
Adaptado de CRUZ et al. (2011, 2012)7
Proveniência e Web Semântica
8Fonte: http://www.w3.org/TR/prov-o/ (2013)
PROV-O
Fonte: http://www.w3.org/TR/prov-o/ (2013)
agent
activity
entity
Ontologia OvO• Open Provenance Ontology (OvO) é ontologia de domínio:
1. Bem fundamentada, ancorada na UFO e PROV2. Modular e flexível adaptar às exigências específicas dos
diferentes domínios de aplicação.3. Contempla granulosidades da proveniência distintas;4. Submetida ao processo de engenharia ontológica;5. Modelada através de uma linguagem ontológica (OLED) ;6. Voltada para a proveniência da área de e-Ciência,
• Não incorpora conceitos específicos sobre os domínios dos experimentos;
Benefícios...– Adota Padrão aberto; fácil de ser manipulado e compreendido por
profissionais de perfis variados;– Clareza, coerência, extensibilidade,– Semântica formal bem definida.– Extensível por outras ontologias específicas do domínio do experimento.
Estratégia
10Fonte: UFO (Guizzrdi, 2005..2015)
Ontologia OvO
• A OvO foi dividida em três sub-ontologias, a saber:
1. Sub-ontologia de experimentos científicos em larga escala;
2. Sub-ontologia de proveniência prospectiva;
3. Sub-ontologia de proveniência retrospectiva;
11Adaptado de CRUZ et al. (2011, 2012)
OvO foi originalmente concebida sobre o Fragmento UFO-A, no momento está sendo reestruturada (UFO-B, UFO-C, ...)
Sub-Ontologia de Experimentos Científicos em Larga Escala
LegendaProspectivo
Retrospectivo
Conceitos de maior granulosidade não contemplados nas demais ontologias de proveniência (ex. experimentos científicos, hipótese, modelos, projeto, agentes, fases) 12
Adaptado de CRUZ et al. (2011, 2012)
Sub-Ontologia de Proveniência Prospectiva
Conceitos de granulosidade grossa correlacionando o workflow e atividades.
Também representa os papéis e relações desempenhados pelos agentes na etapa de composição do experimento;
13Adaptado de CRUZ et al. (2011, 2012)
Sub-Ontologia de Proveniência Retrospectiva
Conceitos de menor granulosidade associados à etapa de execução do experimento.
14Adaptado de CRUZ et al. (2011, 2012)
Caso 1: Agronegócio (Clima)
adap
tad
o d
e LE
MO
S FI
LHO
et
al.
(20
12
, 20
13
, 20
14
), E
-Sci
ence
BA
RB
OSA
et
al. (
20
14
) IP
AW
16
1
Dezenas de estações (região Sul Fluminense).
Longas séries (>= 20 anos de dados)
Erros e falhas nas séries
Caso 2: Agronegócio (lavoura)
adap
tad
o d
e V
IAN
NA
e C
RU
Z (S
BIA
GR
O e
BR
AC
IS 2
01
3)
NU
NES
et
al.
(20
14
) IP
AW
e N
UN
ES e
t al
(ER
SI 2
10
4)
17
adap
tad
o d
e R
EIC
HE,
CR
UZ,
CA
MP
OS
.(2
01
4)
ISB
BD
Computação Semântica em E-Science
Sérgio SerraOBRIGADO PELA ATENÇÃO
AgradecimentosProfa. Maria Luiza Machado CamposProfa. Maria Claudia Cavalcanti (Yoko)Profa. Marta MattosoProfa. Gizele ViannaProfa. Margarida Goréte do CarmoProfa. Ana Claúdia VieiraProf. Giancarlo GuizzardiProf. Antônio Carlos de S. AbboudProf. Alberto DávilaProf. Ednaldo OliveiraProf. Gustavo Lyra
Msc. Marden MarquesMsc. Fabio CardozoMsc. José Antonio NascimentoTec. Agric. Pedro Vieira CruzAgric. Campo Experimental UFRRJAlunos do PET-SI e do PPGMMC/UFRRJ
PROPAGANDA
• 9º BRESCI (Brazilian e-Science Workshop) da XXXV CSBC
• Deadline: 16 de Abril Enviem seus trabalhos!
http://csbc2015.cin.ufpe.br/19