GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A...

50
GESTÃO DE DADOS CIENTÍFICOS questões sobre planeamento, documentação e metadados Pedro Príncipe – 2 novembro de 2012 Novos Paradigmas de Informação e Comunicação em Plataformas Digitais Programa Doutoral em Informação e Comunicação em Plataformas Digitais do Departamento de Comunicação e Arte da Universidade de Aveiro e Faculdade de Letras da Universidade do Porto

Transcript of GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A...

Page 1: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

GESTÃO DE DADOS CIENTÍFICOS

questões sobre planeamento, documentação e metadados Pedro Príncipe – 2 novembro de 2012

Novos Paradigmas de Informação e Comunicação em Plataformas Digitais

Programa Doutoral em Informação e Comunicação em Plataformas Digitais do Departamento de Comunicação e Arte da

Universidade de Aveiro e Faculdade de Letras da Universidade do Porto

Page 2: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

TÓPICOS (ESTRUTURA DE CONTEÚDO)

1. Introdução

2. Dados Científicos

3. Planeamento e gestão

4. Documentação e metadados

5. Projetos e iniciativas

6. Conclusões

Page 3: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

INTRODUÇÃO Enquadramento temático do trabalho

1

Page 4: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

INTRODUÇÃO

A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas de instituições de investigação científica no domínio gestão, acesso e preservação de dados científicos:

Maior relevância do tema junto dos responsáveis das instituições de investigação e financiadores da ciência. necessidade de gerir o acesso aos dados científicos

necessidade de gerir a utilização dos dados produzidos ou recolhidos no âmbito de atividades de investigação

necessidade de garantir a sua preservação.

Cresce a sensibilidade nos investigadores: para os efeitos da explosão na produção de dados mais precoce onde o trabalho de investigação é baseado na

análise de dados recolhidos de forma distribuída.

Page 5: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

ENQUADRAMENTO

• Os principais dinamizadores das iniciativas de gestão de dados

científicos têm sido os organismos de dimensão nacional ou internacional que financiam ciência:

• têm manifestado nestes últimos anos redobrada atenção à

necessidade de assegurar meios para a criação de

instrumentos que facilitem a gestão dos dados científicos. • OCDE – com a “Declaration on Access to Research Data From Public

Funding” em 2004 e a publicação em 2007 dos “OECD Principles and Guidelines for Access to Research Data from Public Funding”

• Comissão Europeia – com varios projetos e iniciativas nos últimos

anos que culminaram em 2012 com a “Communication on a reinforced European Research Area partnership for excellence and growth: Communication Towards better access to scientific information e as Recommendation on access to and preservation of scientific information”.

Page 6: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

ENQUADRAMENTO

• Várias iniciativas e desenvolvimentos de âmbito nacional • Reino Unido

• Conselhos de Investigação do Reino Unido • Em 2011: Common Principles on Data Policy; Summary of UK research

funders expectations for the content of data management and sharing plans (DCC – Digital Curation Center)

• Estados Unidos da América • National Science Foundation (Grant applications)

• Alemanha • RatSWD - German Data Forum on Research Data Centers and Data

Service Centers • Holanda

• SURF Foundation • DANS – promotes access to research data

• Portugal • Projeto RCAAP – Repositório Científico de Acesso Aberto de Portugal

Page 7: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

REFERÊNCIA • DANS – promotes access to research data http://www.dans.knaw.nl • DataCite – provides links to a range of research data http://datacite.org - also of interest: • http://www.datacite.org/repolist • DataCite Blog on: DataCite content service • DataOne (Data Observation Network for Earth) - ensuring preservation and access to multi-scale, multi-

discipline, multi-national science data. http://www,dataone.org • EUDAT – a Europe-wide solution to data management http://www.eudat.eu/ • Digital Curation Centre – a centre of expertise on data curation. Plenty of Briefing papers/resources for

data managers http://www.dcc.ac.uk/ • Dryad - Biosciences data repository. Only accepts data related to peer-reviewed articles

http://datadryad.org/ • PANGAEA - Repository for earth and environmental science http://www.pangaea.de/about/ • Data Asset Framework - UK based project assisting organisations with managing their research assets • http://www.data-audit.eu/ • CODATA (Committee on Data for Science and Technology) - Established by the International Council for

Science and recognises that sharing of data is essential - shares a useful list of data policies http://www.codata.org/resources/databases/data_access/index.html

• …

Page 8: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DADOS CIENTÍFICOS Clarificação de conceitos

Importância da Gestão dos Dados Científicos

2

Page 9: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DADOS CIENTÍFICOS • As questão do acesso e preservação dos dados científicos surgem

enquadradas num movimento mais amplo on de multiplicam iniciativas em:

• Open Source

• Open Access

• Open Data

• Open Science

• De onde se destacam:

• Declaração de Budapeste sobre o Acesso Aberto (BOAD)

• Knowledge-Exchange (2011), "A Surfboard for Riding the Wave Towards a four country action programme on research data"

• Panton Principles for Open Data in Science: http://pantonprinciples.org

Page 10: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DADOS CIENTÍFICOS

• Registos factuais usados como fontes primárias na investigação científica, e que são geralmente aceites na comunidade científica como necessários para validar os resultados de investigação (Definição OCDE).

• Podem assumir várias:

• Formas – texto, números, imagens fixas, imagens em movimento…

• Dimensões – desde registos de observações individuais ou ensaios de pequenos laboratórios que não ultrapassarão algumas centenas de kilobytes, até aos dados produzidos pelo Large Hadron Collider (LHC) do CERN, que pode gerar várias dezenas de petabytes por dia.

Page 11: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DADOS CIENTÍFICOS

• Os dados científicos são produzidos ou utilizados no contexto de investigação científica.

• recolhidos ou criados para efeito de processamento científico, como os dados atmosféricos usados para previsão

meteorológica, ou os dados recolhidos de sensores para monitorizar o estado de um edifício.

• obtidos como resultados do processamento automático de objetos (por exemplo, uma coleção de imagens processada para obter

os respetivos histogramas de cor, que constituem assim novos dados).

• dados que não são produzidos para investigação mas que acabam por ser objeto dela, como as contribuições que os

utilizadores de uma rede social fazem na forma de textos, fotografias ou outros objetos e que acabam por ser utilizados para estudos sociológicos.

Page 12: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DADOS CIENTÍFICOS

• Para se constituírem como verdadeiramente úteis, os dados científicos devem possuir estrutura e organização:

• Os conjuntos de dados (“datasets”) são uma das unidades essenciais.

• são coleções de informações ou factos relacionados entre si e registados num formato comum (por exemplo, os resultados de um estudo de opinião por entrevista numa investigação sociológica constituem um conjunto de dados, composto pelos registos individuais das entrevistas).

Page 13: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

What is the problem with data?

analysed synthesised interpreted

are

become Information

is

published

becomes Knowledge

Publication

… is accessible

… is traceable

… is lost! Data

Page 14: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GESTÃO DE DADOS CIENTÍFICOS Planos de gestão, questões e etapas para o planeamento, importância do planeamento para a qualidade da documentação

3

Page 15: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GDC

• As condições em que os dados recolhidos ou produzidos numa investigação podem, ou não, ser acedidos e reutilizados por outros investigadores, para além do contexto em que foram gerados, são questões importantes.

• A forma como são cuidados (curadoria de dados) e as

condições legais associadas ao seu acesso e partilha constituem os dois elementos determinantes do futuro dos diversos conjuntos de dados científicos.

• É preciso garantir que os dados são registados, mantidos e preservados de forma adequada.

Page 16: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GDC

• Um dos primeiros requisitos é que os conjuntos de dados

sejam acompanhados de informação que descreva a

sua origem (tempo ou espaço, métodos e instrumentos de recolha), âmbito, autoria, propriedade e condições de reutilização, ou seja, de metadados.

• Em paralelo com a interoperabilidade tecnológica, a existência de metadados adequados e normalizados é um requisito essencial para o acesso e reutilização dos dados científicos.

Page 18: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

JISC (Joint Information Systems Committee)

DDI (Data Documentation Initiative)

Page 19: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GDC

• Principais questões no planeamento da gestão de dados científicos (DCC's Checklist for a Data Management Plan, 3TU.Datacentrum

DANS (Data Archiving and Networked Systems):

1. Tipos de dados, formatos, normas e métodos de recolha

2. Questões legais e éticas, de propriedade intelectual

3. Acesso, Partilha e reutilização dos dados

4. Gestão e armazenamento de curto prazo

5. Depósito (arquivo) e preservação a longo prazo

6. Recursos

Page 20: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GDC

• Gestão cuidada dos dados científicos é a chave do sucesso de uma investigação:

• Gerir adequadamente os dados ao longo do ciclo de investigação. • Integridade da investigação

• Aumenta a eficiência do processo

• Assegura que os dados são armazenados com autenticidade

• Menos tempo e recursos

• Promove maior segurança nos dados

• Previne duplicação de trabalhos e promove a reutilização por outros

• Conformidade com práticas da industria

Page 21: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PLANEAMENTO DA GDC

• Estabelecimento de planos para a gestão de dados (que dados criar, formatos, regras do financiador, nomenclaturas…)

• Estabelecimento de checklists para a gestão dos dados (backups, arquivos, instituição, direitos…)

• O plano de gestão é um documento aberto e em atualização.

Page 23: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 24: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DOCUMENTAÇÃO E METADADOS Registos e níveis de documentação, formatos, categorias de metadados, esquemas em uso, citação dos dados, questões de interoperabilidade.

4

Page 25: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DOCUMENTAÇÃO

• Alguns exemplos de registos para documentação: • laboratory notebooks

• Protocolos de experiências

• Questionários

• Codebooks

• software syntax

• output files

• Informação sobre equipamentos

• Calibração de instrumentos

• Esquemas de bases de dados

• Relatórios de metodologia

• Registos de informação sobre a proveniência dos recursos e dados

• …

Page 26: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DOCUMENTAÇÃO

•Níveis de documentação:

• Projeto

• Ficheiro ou base de dados

• Variáveis ou itens

Page 27: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DOCUMENTAÇÃO

• Dados científicos apresentam-se em diferentes formatos: • Texto: Plain text, files MS Word, Portable Document Format (PDF), Rich

Text Format (RTF), Hyper-Text Markup Language (HTML), Extensible Markup Language (XML)

• Numérico: SPSS, Stata, MS Excel, SAS

• Multimédia: JPEG, TIFF, Dicom, MPEG, Quicktime, Bitmap

• Modal: 3D, Statistical, Similitude, Macroeconomic, Causal

• Software: Java, C, Perl, Python, Ruby, PHP

• Disciplina específica: Flexible Image Transport System (FITS) in astronomy, Crystallographic Information File (CIF) in chemistry, GRIdded Binary (GRIB) in meteorology

• Instrumentos especificos: Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format (ZVI)

Page 29: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

• Difícil uniformizar a descrição entre domínios científicos.

• A descrição dos conjuntos de dados ainda se pode considerar muito pouco desenvolvida.

• Ao nível do conjunto têm sido adoptados modelos genéricos como o do Dublin Core, já muito utilizado nos repositórios institucionais.

• A descrição normalizada dificilmente poderá cobrir toda a especificidade de um conjunto de dados, mas muitos dados descritivos a nível de conjunto ganharão em ser normalizados.

• Repositórios de dados (práticas de descrição)

Page 30: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

“data about data”

• Informação estruturada sobre recursos de informação (artefactos ou serviços) - os metadados são informação que resume, enriquece ou complementa os objetos ou serviços referenciados, produzindo assim um potencial incremento de informação.

• O Conjunto de dados estruturados que identificam os dados de um determinado documento e que podem fornecer informação sobre o modo de descrição, administração, requisitos legais de utilização, funcionalidade técnica, uso e preservação. (TAYLOR, 1999 e DEMPSEY, 1998)

Page 31: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS • Metadados descritivos • Descrição bibliográfica e identificação dos recursos, tais como títulos, autores,

informação de indexação ou classificação, resumos, etc. • Metadados administrativos • Informação para administração do recurso, tais como elementos sobre a sua

forma de aquisição, custo, etc. • Preservação dos recursos • Requisitos e condições, técnicas ou formais, para preservação a longo prazo • Descrição estrutural e técnica dos recursos • Requisitos técnicos para manipulação do recurso (equipamento e aplicações),

incluindo informação de autenticação, chaves de codificação ou de descodificação, informação estrutural, etc.

• Acesso, uso e reprodução dos recursos • Estabelece termos e garantias de acesso e uso, registo de acessos • Metadados para gestão administrativa e técnica dos próprios metadados • Informação sobre os próprios metadados do recurso, nomeadamente a sua

data e forma de criação, proveniência, autenticidade, etc.

Page 32: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

• Categorias usadas pelo DCC e outros projetos relevantes: • Descritivos (título, autor, abstract…)

• Administrativos (direitos, formatos, preservação…)

• Estruturais (esquemas de relação, tabelas numa bases de dados…)

Page 34: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

Dublin Core Metadata Initiative (DCMI) – REFERÊNCIA • Creator*

Main researcher(s) involved in producing the data • Contributor

Institution where the data was created or collected. A person or organization responsible for making contributions to the dataset.

• Publisher* Institution which submitted the work

• Title* Name or title by which a resource is known

• Publication year* The year when the data was or will be made publicly available

• Date created Date the resource itself was put together; this could be a data range or a single date

• Description* Concise description of the contents of the dataset. Describe the research objective, type of research, method of data collection and type of data.

• Subject Subject, keyword, classification code, of key phrase describing the resource

• Coverage temporal Indicate the dates to which the data refer. Enter the year, or beginning and end dates

• Coverage spatial Describe the geographic area to which the data refer (e.g. municipality, town/city, region, country) The geographic coordinates of the area may be included, if desired

• Identifier Persistent identifier to a dataset once the entire deposit procedure has been completed. In some cases, a dataset may be known by one or more other (persistent) identifiers

• URL to publication Include the web addresses for any publication, important internal reports or other datasets that are related to your dataset.

Page 35: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

• Casos de estudo:

• DataCite Metadata Scheme

• OCDE

• DDI Schemes (Data Documentation Initiative)

• IDRA weather measurement dataset

• PANGEA

• …

Page 36: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 37: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 38: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 39: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 40: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 41: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

DDI Schemes = Lists of elements of one type Examples • archive

• OrganizationScheme • datacollection

• QuestionScheme • ControlConstructScheme • InterviewerInstructionScheme

• conceptualcomponent • ConceptScheme • UniverseScheme • GeographicStructureScheme • GeographicLocationScheme

• logicalproduct • CategoryScheme • CodeScheme • VariableScheme • NCubeScheme

• physicaldataproduct • PhysicalStructureScheme • RecordLayoutScheme

Page 42: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

• Para finalidades de citação:

• Exemplos OCDE: • Irino, T; Tada, R (2009): Chemical and mineral compositions of sediments

from ODP Site 127‐797. Geological Institute, University of Tokyo.doi:10.1594/PANGAEA.726855. http://dx.doi.org/10.1594/PANGAEA.726855

• Geofon operator (2009): GEFON event gfz2009kciu (NW Balkan Region). GeoForschungsZentrum Potsdam (GFZ). doi:10.1594/GFG.GEOFON.gfz2009kciu. http://dx.doi.org/10.1594/GFZ.GEOFON.gfz2009kciu

• Denhard, Michael (2009): dphase_mpeps: MicroPEPS LAF‐Ensemble run by DWD for the MAP D‐PHASE project. World Data Center for Climate. doi: 10.1594/WDCC/dphase mpeps. http://dx.doi.org/10.1594/WDCC/dphase_mpeps

Page 43: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 44: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

METADADOS

• Referência breve a questões e desafios da interoperabilidade: • Ligação de dados às publicações (PANGEA - Elsevier, Dans: publicações

enriquecidas, OpenAIREplus - interligação dos dados às publicações em repositórios)

• Repositórios de dados mais significativos usam o OAI-PMH (Open Archives Initiative) para permitir a agregação de informação.

• Identificador permanente (handle system, DOI (Digital Object Identifier))

Page 45: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PROJETOS E INICIATIVAS Apresentação sumária e ligações úteis

5

Page 46: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

PROJETOS E INICIATIVAS

Apresentação e referência aos principais projetos e iniciativas estruturantes neste domínio (projetos e iniciativas, repositórios): DANS – promotes access to research data http://www.dans.knaw.nl DataCite – provides links to a range of research data http://datacite.org - also of interest: http://www.datacite.org/repolist DataCite Blog on: DataCite content service DataOne (Data Observation Network for Earth) - ensuring preservation and access to multi-scale, multi-discipline, multi-national science data. http://www,dataone.org EUDAT – a Europe-wide solution to data management http://www.eudat.eu/ Digital Curation Centre – a centre of expertise on data curation. Plenty of Briefing papers/resources for data managers http://www.dcc.ac.uk/ Dryad - Biosciences data repository. Only accepts data related to peer-reviewed articles http://datadryad.org/ PANGAEA - Repository for earth and environmental science http://www.pangaea.de/about/ Data Asset Framework - UK based project assisting organisations with managing their research assets http://www.data-audit.eu/ CODATA (Committee on Data for Science and Technology) - Established by the International Council for Science and recognises that sharing of data is essential - shares a useful list of data policies http://www.codata.org/resources/databases/data_access/index.html Linked Data - a useful resource that sets out standards information and FAQs for linking online data http://linkeddata.org/ RatSWD - German Data Forum on Research Data Centers and Data Service Centers http://www.ratswd.de/eng/dat/fdz.html SURF Foundation - Enhanced publications project looks at six different cross-discipline projects. Interesting video too. http://www.surffoundation.nl/en/themas/openonderzoek/verrijktepublicaties/Pages/default.aspx Open Knowledge Foundation - builds tools and communities to promote open data and access - http://okfn.org/ FigShare - allows researchers to publish and make citeable research results, a sharing data platform - http://figshare.com/faqs …

Page 47: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

CONCLUSÕES 6

Page 48: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

Conclusões • Relevância dos projetos e iniciativas em curso (principalmente alianças).

• Papel mobilizador dos agentes financiadores.

• Emergência de projetos e iniciativas de âmbito transnacional e interdisciplinar.

• Importância do planeamento para a gestão dos dados científicos.

• Impacto significativo do planeamento na documentação e acesso aos dados.

• Criação de mecanismos facilitadores para os investigadores do processo de gestão, publicação e acesso aos dados científicos.

• Relevância do processo de documentação para a descrição e depósito em repositórios.

• Necessidade de convergência de iniciativas no domínio dos metadados e interoperabilidade.

• Urgência das instituições em Portugal trabalharem estas questões.

Page 49: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas
Page 50: GESTÃO DE DADOS CIENTÍFICOSstorage.campus.ua.sapo.pt/files/98ec3686d331ae62... · INTRODUÇÃO A primeira década do Século XXI é marcada por um conjunto de projetos e iniciativas

[email protected]

2 de novembro 2012

facebook.com/pedroprincipe

twitter.com/pedroprincipe

youtube.com/user/pedroprincipe

slideshare.com/pedroprincipe

ratodebiblioteca.blogspot.com