1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva...
Transcript of 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva...
![Page 1: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/1.jpg)
1
MyGRID: Bio-informática personalizada em uma grade
de informação.
Francisco Silva
![Page 2: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/2.jpg)
2
Objetivo
• Explorar o uso da tecnologia de grades de computadores, com ênfase em grades de informação, para prover um middleware apropriado para as necessidades da bio-informática;
• Estão sendo construídos serviços para a integração de dados e aplicações como serviço de descoberta de recursos, workflow, processamento distribuído de consultas, notificação de mudanças e personalização.
![Page 3: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/3.jpg)
3
Introdução
• Projeto de código aberto que fornece um middleware de suporte a experimentos de biologia in silico personalizados em uma grade de computadores.
![Page 4: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/4.jpg)
4
Diferenciação
• Projetos em andamento focam em:– Compartilhamento de recursos
computacionais– Movimentação e replicação de grande
volumes de dados para simulações– Análise de sequências de alto throughput
![Page 5: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/5.jpg)
5
Diferenciação
• O projeto myGrid busca:– Dar apoio a processos científicos que
possuem requisitos computacionais mais modestos mas com grande complexidade semântica.
![Page 6: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/6.jpg)
6
Abordagem
• Projeto busca criar uma grade de serviços (e não apenas de dados ou computacional)
• O arcabouço foi prototipado com Web Services e migrou para Open Grid Services Architecture (OGSA)
![Page 7: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/7.jpg)
7
Serviços Disponibilizados
• Para realizar experimentos in silico– Organizados em workflows e consultas
distribuídas– Dados e parâmetros são enviados como
entrada para ferramentas de análise ou serviços de banco de dados;
– A saída destes é utilizada como entrada para outras ferramentas ou consultas em bases de dados.
![Page 8: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/8.jpg)
8
Serviços Disponibilizados
• Serviços de Bio-informática– Serviços como recuperação de bancos de
dados e ferramentas de análise são disponibilizados de forma a acomodar sua distribuíção e variedade de formatos de dados
– NCBI BLAST, WU BLAST, EMBOSS suite (mas de 80 ferramentas de análise), MEDLINE, SRS
![Page 9: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/9.jpg)
9
Serviços Disponibilizados
• Workflow– Utiliza WSFL (Web Service Flow
Language) para definir o tipo e realizar chamadas a serviços.
![Page 10: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/10.jpg)
10
Serviços Disponibilizados
• Consultas a bases de dados distribuídas– Consultas são descritas em linguagem de
alto nível (OQL)
![Page 11: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/11.jpg)
11
Serviços para eScience
• Notificação: – um workflow pode ter de ser re-executado quando
novos dados ou softwares de análise tornarem-se disponíveis
• Personalização:– O repositório de informação (mIR) armazena
dados XML gerados pelos experimentos com seus metadadados e termos de suas ontologias
– São permitidas anotações deste conteúdo bem como visões diferentes do mesmo
![Page 12: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/12.jpg)
12
Serviços para eScience
• Provenance:– Biólogos costumam guardar anotações de
experimentos em livros– Os serviços myGrid automaticamente
armazenam no mIR informações a respeito dos dados, serviços e resultados.
![Page 13: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/13.jpg)
13
![Page 14: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/14.jpg)
14
Serviço de Descoberta
• Responsável pela localização de serviços, dispositivos e recursos
• Tradicionalmente necessitam de um conhecimento prévio dos serviços disponíveis
• MyGrid utiliza um arcabouço baseado em ontologias para descoberta de serviços
![Page 15: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/15.jpg)
15
Serviços Semânticos
• Uma descrição semântica oferece um mecanismo para lidar com a heterogeneidade de recursos, provendo um vocabulário comum para integrar e realizar consultas em dados dados e serviços aparentemente dispersos.
![Page 16: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/16.jpg)
16
Serviços Semânticos
• Serviços internos ao myGrid são descritos em DAML-S, com extensões específicas para bio-informática
• Serviços de terceiros podem ser descritos através de padrões UDDI / WSFL (Web Services Flow Language) e WSDL
![Page 17: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/17.jpg)
17
Requisitos do Serviço de Descoberta
• Descrições devem poder serem anexadas a diferentes recursos (serviços e workflows) e publicadas em diferentes componentes (registros de serviço, arquivos locais, banco de dados)
• A publicação de descrições deve poder ser realizada tanto pelos autores do serviço quanto por terceiros
• Classes diferentes de usuários desejam examinar diferentes aspectos dos metadados disponíveis.
![Page 18: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/18.jpg)
18
Requisitos do Serviço de Descoberta
• É necessário haver um controle sobre quem pode adicionar ou alterar anotações
• Uma única, unificada interface deve ser disponibilizada aos usuários.
![Page 19: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/19.jpg)
19
![Page 20: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/20.jpg)
20
Service Registry
• Utilizado para publicar os serviços, descrevendo como podem ser acessados
• Permite a adição de informações adicionais (metadados) para facilitar a descoberta dos mesmos.
![Page 21: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/21.jpg)
21
Personalised View
• Espaço para a adição de metadados de terceiros, permitindo a filtragem de serviços retornados por uma consulta
![Page 22: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/22.jpg)
22
Semantic Find Service
• Composto por vários componentes, mantêm um banco de dados de descrições obtidos através dos recursos publicacados e registros constantes das visões
• Um servidor de ontologias provê acesso a ontologias e gerencia a interação com um reasoner
![Page 23: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/23.jpg)
23
![Page 24: 1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva Fssilva@deinf.ufma.br.](https://reader034.fdocumentos.tips/reader034/viewer/2022042714/552fc143497959413d8dfbef/html5/thumbnails/24.jpg)
24
Bibliografia• myGrid: Personalised Bioinformatics on the
Information Grid, 11th International Conference on Intelligent Systems in Molecular Biology, July 2003, Brisbane, Australia
• Semantic and Personalised Service Discovery, Workshop on Knowledge Grid and Grid Intelligence (KGGI'03), in conjunction with 2003 IEEE/WIC International Conference on Web Intelligence/Intelligent Agent Technology, Halifax, Canada, October 2003