Metadados com XML

15

Click here to load reader

description

Paulo Augusto Loncarovich Gomes - UNESP - Mestrado em Ciência da Informação e Tecnologia, Universidade Estadual Paulista Júlio de Mesquita Filho - Faculdade de Filosofia e Ciências - Campus de Marília - Av. Hygino Muzzi Filho, 737 - Campus Universitário 17525-900 - Marilia, SP - Brasil - Caixa-Postal: 181 e-mail: [email protected] Apresentado em 31 de Agosto de 2009.

Transcript of Metadados com XML

Page 1: Metadados com XML

METADADOS e XML

MetadadosFluxo de Criação de Metadados

Metadados e XML

Paulo Augusto Loncarovich Gomes – Bolsista CAPESUNESP - Mestrado em Ciência da Informação e Tecnologia

Formas de representação: dos catálogos aos repositórios digitais

Page 2: Metadados com XML

Metadados Conceitos

Metadados (DD ou Dicionário de dados), ou Metainformação, são dados sobre outros dados.

Os METADADOS permitem:

- Organizar os dados geográficos;- Manter controle sobre os níveis de atualização dos dados;- Documentar origem, formato, estrutura e sistemas de referência dos dados;- Permitir intercâmbio entre diferentes sistemas;- Definir autoria, armazenamento, disponibilização e utilização dos dados.

Entretanto Metadados são as lentes pelas quais enxergamos a informação.

GOMES. METADADOS e XML, 2009.

Page 3: Metadados com XML

Origem do Metadados

Teve início em 1995, por um grupo (Library of Congress, universidades, empresas de TIC, organizações não governamentais, etc.) liderado pela OCLC reuniu-se na cidade de Dublin, no estado americano de Ohio, para propor uma padronização para estas informações sobre informações dos arquivos digitais. Depois de mais algumas reuniões, o grupo chegou a um conjunto mínimo de elementos para a identificação dos objetos digitais.

O conjunto ficou conhecido como Dublin Core (DC) e é mantido pela Dublin Core Metadata Initiative. Em 2003, o DC tornou-se o uso padrão ISO 15836.

GOMES. METADADOS e XML, 2009.

Page 4: Metadados com XML

Fluxo de criação de MetadadosPodemos considerar que há três formas possíveis de relacionar estruturas de informação e as estruturas descritivas de metadados relacionadas:

GOMES. METADADOS e XML, 2009.

metadados embebidos é aquele que se pode conseguir nos recursos em formato HTML, onde os metadados podem ser embebidos nos cabeçalhos dos documentos (em HTML é possível, através de uma “tag” <META>, a especificação de qualquer elemento de metadados que se pretenda, o que poderá ser ignorado pelas máquinas de processamento de HTML mas pode ser aproveitado por outros sistemas que identifiquem esses elementos).

metadados associados é inerente ao próprio conceito de hipertexto. Tomando como referência a tecnologia XML, será possível definir um recurso como um grupo de ficheiros representando o nó de acesso (documento em XML), a referência ao seu DTD ou espaço de nomes, referências para metadados, e ainda referências para outros ficheiros com outros conteúdos (texto, som, imagens, etc.).

metadados separados é a do modelo da biblioteca tradicional, com bases de dados bibliográficas existentes em sistemas próprios e os recursos, isto é, os livros, existindo nas prateleiras...

Page 5: Metadados com XML

Atributos dos MetadadosIdentificam-se ainda quatro classes de atributos de metadados a levar em consideração:

Origem e modo de criação: processo e agente criador (exemplo: catalogador humano, termos de indexação extraídos por uma aplicação informática, informação fornecida pelo editor, etc.).

Estrutura e semântica: metadados organizados segundo estruturas semânticas normalizadas ou não, registos criados seguindo controlo de autoridades e vocabulários ou não (ex.: Dublin Core, MARC, EAD, utilização das AACR, etc.).

Estatuto: metadados estáticos, dinâmicos, persistentes ou temporários (ex.: elementos estáticos como título ou autor, ou elementos dinâmicos como preço, condições de acesso e uso, etc.).

Nível: nível de descrição (detalhado ou básico), descrição de colecções, objectos ou itens, etc. (ex.: Dublin Core, MARC, RSLP, etc.).

GOMES. METADADOS e XML, 2009.

Page 6: Metadados com XML

Criação de Interface para Metadados

Segundo Gohil, 1999, a criação de Interface para Metadados funcionais pode ser obtidas apenas com o uso de informações de

METADADOS , a completude dessas somente é alcançada através da participação do ambiente da computação, o qual adiciona funcionalidades específicas como a dependência de controles, ajustes na aparência e a adição das regras do ambiente (empresa, biblioteca, e outras).

Para realizar essa tarefa de interface METADADOS, é proposto o uso de cinco fontes de informação para o mecanismo gerador.

- A primeira é o uso dos METADADOS, esses são traduzidos durante a execução do sistema e originam as características principais, consideradas básicas para os elementos da interface gerada, como tipos dos controles na tela, domínios de valores e estruturas essenciais de ligação entre os elementos produzidos.

- A segunda é o uso de heurísticas, que permite a descoberta de propriedades e comportamentos com base em conceitos simples, porém nem sempre utilizados. Como exemplo simplista cita-se a escolha da ordem de apresentação dos campos na interface, o que pode ser feito seguindo a ordem de declaração dos atributos no objeto de negócio, sua obrigatoriedade ou nível de complexidade.

- A terceira é o conhecimento empírico, que permite a reutilização de soluções de sucesso, obtidas através de experiências anteriores. Esse tipo de informação é válido, principalmente no tocante à otimização das interfaces. A escolha do momento em que validadores de conteúdo devem ser aplicados, adição de suporte a operações de arrastar e soltar e a correta relação entre o tipo de dado e o controle de tela que o representa são apenas alguns exemplos.

- A quarta é o uso da inferência, a qual permite obter novas informações a partir de um conjunto inicial de valores. Nesse contexto enquadram-se a construção de mensagens de auxílio para o usuário, nomes para controles de tela e o preenchimento de valores default.

E finalmente, como quinta proposta o artifício para melhoria contínua das interfaces geradas, o uso de retroalimentação. Em outras palavras, um histórico de uso e configuração é continuamente armazenado.

(Moreira e Mrack, 2002) e (Clifton, 2005)

GOMES. METADADOS e XML, 2009. Denomina-se 'heurística' à capacidade de um sistema fazer inovações e desenvolver técnicas de forma imediata e positivas para um determinado fim.

Page 7: Metadados com XML

Classes de Requisitos para Metadados

Requisitos para o desenvolvimento de um modelo para METADADOS.

Metadados descritivos Descrição bibliográfica e identificação dos recursos, tais como títulos, autores, informação de indexação ou classificação, resumos, etc.

Metadados administrativosInformação para administração do recurso, tais como elementos sobre a sua forma de aquisição, custo, etc.

Preservação dos recursos Requisitos e condições, técnicas ou formais, para preservação a longo prazo.

Descrição estrutural e técnica dos recursosRequisitos técnicos para manipulação do recurso (equipamento e aplicações), incluindo informação de autenticação, chaves de codificação ou de descodificação, informação estrutural, etc.

Acesso, uso e reprodução dos recursosEstabelece termos e garantias de acesso e uso, registo de acessos.

Metadados para gestão administrativa e técnica dos próprios metadadosInformação sobre os próprios metadados do recurso, nomeadamente a sua data e forma de criação, proveniência, autenticidade, etc

GOMES. METADADOS e XML, 2009.

Page 8: Metadados com XML

XML para descrição de METADADOS

Extensible Markup Language (XML) é linguagem de marcação de dados (meta-markup language) que provê um formato para descrever dados estruturados.

O uso da linguagem facilita as declarações mais precisas do conteúdo e resultados mais significativos de busca através de múltiplas plataformas. Portanto o XML éutilizado como ferramenta para criação dos METADADOS.

O XML foi criado na década de 90 pelo W3C (World WideWeb Consortium). Foi desenvolvido com o intuito de ser uma METALINGUAGEM flexível, mas formal, permitindo a troca de dados entre instituições, através da internet, devido a adaptabilidade, seu uso é utilizado para trocar informações complexas que não eram adequadamente expressas em HTML.

GOMES. METADADOS e XML, 2009.

Page 9: Metadados com XML

Exemplo XML e METADADOS

GOMES. METADADOS e XML, 2009.

Dublin Core metadata editor

Page 10: Metadados com XML

XML e METADADOS

GOMES. METADADOS e XML, 2009.

A complexidade de um modelo de dados depende da complexidade estrutural da informação que se quer representar. A terminologia utilizada em geral para descrever dados semi-estruturados é baseada na teoria de grafos. Szwarcfiter (1986)

A Teoria dos Grafos é um ramo da matemática que estuda as

relações entre os objetos de um determinado conjunto.

Teoria dos Grafos

Page 11: Metadados com XML

O Controle de qualidade para a criação de metadados

GOMES. METADADOS e XML, 2009.

Um aspecto muito importante para o desenvolvimento de bases de dados de utilização por diversos grupos de usuários, com múltiplos interesses, é a documentação de seu conteúdo. Uma vez encontrados os dados, normalmente é necessário conhecer como foram coletados e que acurácias possuem. As descrições desses dados armazenados são comumente denominadas de METADADOS.

Organizações nos Estados Unidos, no Canadá e na Europa, por exemplo, já estabeleceram padrões uniformes. Esses padrões cobrem conteúdo e semântica dos metadados, incluindo sua documentação detalhada e também sua representação digital. Essesmetadados são atualmente utilizados com níveis variados de detalhes, abordando, numa visão geral, os seguintes tópicos:

- Controle de qualidade: metadados detalhados são essenciais para permitir a garantia de qualidade da informação nas organizações que produzem e mantém grandes bases de dados. Os metadados documentam por completo o ciclo-de-vida dos dados, incluindo suacoleção, pré-processamento e manutenção. Esse tipo de metadados normalmente é muito pormenorizado;

- Intercâmbio de dados: devido ao alto custo na coleta e aquisição de dados geográficos, por meio de levantamentos específicos, o intercâmbio desses dados é encorajado pelas organizações e promovido pelos produtores desses dados, tornando-se uma regra geral noprocessamento da informação geoespacial. Os dados geográficos que faltam ou que são mal interpretados, representam uma das fontes de erros e de incertezas quando se trata do uso de Bancos de Dados externos às organizações. Os detalhes encontrados nosmetadados, relativos a grandes bases de dados, contribuem para evitar esses tipos de problema;

- Diretórios de dados: a necessidade de reuso (reutilização) de conjuntos de dados caros motiva o estabelecimento de diretório de dados. Eles permitem que os usuários conheçam e acessem as descrições de conteúdo de conjuntos de dados, sem ser necessário acesso aos dados propriamente ditos a partir de sua base. Um exemplo típico: usuários estão interessados em conhecer e localizar dados para uma determinada região geográfica. Diretórios devem ser criados pelas organizações contendo descrições do conteúdo dos metadados de bibliotecas digitais a partir de suas fontes. Esses metadados tipicamente requerem um nível baixo de minúcias.

(JACOBSON, 1994)

Page 12: Metadados com XML

Benefícios da linguagem XML

GOMES. METADADOS e XML, 2009.

- Esta característica confere à linguagem XML "habilidades" semânticas, que possibilitam melhorias significativas em processos de recuperação e disseminação da informação.

- As possibilidades e os benefícios reais em processos de recuperação da informação.

- Buscas mais eficientes.

- Desenvolvimento mais flexível para documentos Web.

- Distribuição dos dados via rede de forma mais comprimida e escalável.

- Padrões abertos.

Page 13: Metadados com XML

METADADOS: criação de registros e Ferramentas

GOMES. METADADOS e XML, 2009.

Editor de metadados DC-Dot's Dublin Core http://www.ukoln.ac.uk/metadata/dcdot/

Ferramentas Dublin Corehttp://dublincore.org/tools

Learning Object Metadata Editorshttp://www.cancore.ca/editors.html

Ferramentas de metadados FGDC http://www.nbii.gov/datainfo/metadata/tools/

Ferramentas Específicas OAIhttp://www.openarchives.org/tools/tools.html

Editores e Ferramentas RDFhttp://www.ilrt.bris.ac.uk/discovery/rdf/

Software TEIhttp://www.tei-c.org/Software/index.html

Planilhas personalizadas para ferramentas de busca codificadas em EAD-Encoded Finding Aidshttp://www.cdlib.org/inside/projects/oac/toolkit/templates/

Page 14: Metadados com XML

Considerações Finais

GOMES. METADADOS e XML, 2009.

Dentro do contexto das Formas de representação: dos catálogos aos repositórios digitais a Criação de METADADOS diretamente com aúxílio da linguagem XML apresenta um fluxo de criação, interfaces, controle de qualidade e benefícios considerável e relevância no que diz respeito ao desenvolvimento de mecanismos de buscas e recuperação de informação a partir da representação do conhecimento.

Page 15: Metadados com XML

Bibliografia• AMBLER. User Interface Design: Tips and Techniques. Ambler, Scott W. 1998. Disponível em

http://www.ambysoft.com/userInterfaceDesign.pdf

• CLIFTON. A Dynamically Generated XML Data Editor. Clifton, Marc. Disponível em http://www.codeproject.com/dotnet/xmldataeditor.asp

• JACOBSON, B. M.; JENNINGS, G D. & STALLINGS, C. 1994. Multi-User / Multi-Purpose GIS Databases.Computers in Agriculture.Proceedings of The 5th International Conference. Orlando, ASAE: American Society of Agricultural Engineers.

• LUCCHESI. C. L.. Introdução à Teoria dos Grafos. 12º - Colóquio Brasileiro de Matemática. IMPA (Instituto de Matemática Pura e Aplicada), 1979.

• MARCHAL, B. XML by example. Indianapolis : Que, 2000.

• Microsoft Developer Network Online – Web Workshop – XML Home http://msdn.microsoft.com/en-us/xml/default.aspx

• MOREIRA E MRACK. Sistemas Dinâmicos Baseados em Metamodelos. Moreira, Diego; Mrack, Marcelo. II Workshop de Computação e Gestão da Informação – Univates. 2002.

• Organization for the Advancement of Structured Information Standards – http://www.oasis-open.org/home/index.php

• The XML Industry Portal – XML.ORG http://www.oasis-open.org/home/index.php

GOMES. METADADOS e XML, 2009.