Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de...

18
08/01/2017 1 ESTRATÉGIAS Preservação digital Introdução Ao longo dos últimos anos, foram propostas inúmeras estratégias no sentido de solucionar o problema da preservação digital. É necessário definir se o objeto de preservação deve ser o objeto físico original ou a conservação do conteúdo embutido nesse objeto.

Transcript of Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de...

Page 1: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

1

ESTRATÉGIASPreservação digital

Introdução

� Ao longo dos últimos anos, foram propostas inúmeras estratégias no sentido de solucionar o problema da preservação digital.◦ É necessário definir se o objeto de preservação deve ser o

objeto físico original ou a conservação do conteúdo embutido nesse objeto.

Page 2: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

2

Documento Digital

• Nível Conceitual– Aquilo com que lidamos no mundo real; o

que reconhecemos como uma unidade significativa de informação

– Exemplo: jornal, livro, mapa, fotografia

• Nível Lógico– Codificação da informação – Tarefa realizada pelo software– Trata-se do formato do objecto

• Nível Físico– Sinais inscritos em suporte físico – e.g. disco rígido, CD, Pen-drive

Documento digital

Se um dos níveis se tornar obsoleto o objeto conceitual deixa de estar acessível

Page 3: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

3

Estratégias

• No seu extremo esquerdo as estratégias centradas na preservação do objeto físico/lógico (tecnologia) e no extremo oposto as estratégias centradas na preservação do objeto conceitual.

• No eixo vertical as diversas estratégias são dispostas mediante o seu grau de especificidade, isto é, se são estratégias apenas aplicáveis a uma dada classe de objetos digitais ou se tratam de estratégias genéricas, passíveis de ser administradas a qualquer classe de objetos digitais.

Ap

licab

ilid

ade

Objetivo

Estratégias

� Foco no objeto físico/lógico◦ Preocupação em preservar a informação nos seus

formatos lógicos ou físicos originais;

◦ Utilização da tecnologia originalmente associada a estes objetos para garantir o acesso aos mesmos;

◦ Preservação de tecnologia.

� Foco no objeto conceptual◦ Preocupação em preservar as características essenciais

dos objetos digitais de uma forma independente do hardware e do software;

◦ Preservação de objetos conceituais.

Page 4: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

4

Preservação do objetofísico/lógico

Preservação da Tecnologia

� Uma das primeiras estratégias de preservação◦ conservação do contexto tecnológico utilizado

originalmente na concepção dos objetos digitais que se procura preservar;

� Consiste na conservação e manutenção de todo o hardware e software necessários à correta apresentação dos objetos digitais;

� Trata-se sobretudo da criação de museus de tecnologia;

� Alguns autores consideram a única forma suficientemente eficaz para assegurar que os objetos digitais sejam preservados de forma fidedigna;

Page 5: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

5

Preservação da Tecnologia

� A história da computação demonstra que qualquer plataforma tecnológica, mesmo a mais popular, acaba inevitavelmente se tornando obsoleta e frequentemente desaparecendo;

� Este tipo de estratégias introduz dificuldades na gestão do espaço físico, manutenção e custo de operação, tornando-as inadequadas para aplicação a longo-prazo;

� O acesso à informação ficar restrito a apenas alguns locais físicos.

Refrescamento

� Um objeto digital torna-se persistente no momento em que é inscrito num suporte físico de armazenamento.

� Garantir a integridade do suporte é fundamental para que a informação nele armazenada possa ser corretamente interpretada;

� O suporte físico pode se deteriorar ou se tornar obsoleto a ponto de deixarem de existir periféricos capazes de extrair a informação nele armazenada;

� O refrescamento de suporte consiste na transferência de informação de um determinado suporte físico de armazenamento para outro mais atual antes que o primeiro se deteriore ou se torne irremediavelmente obsoleto.

� A frequente verificação da integridade dos suportes físicos, assim como o seu refrescamento periódico, são consideradas atividades vitais num contexto de preservação digital.

� O refrescamento de suporte não constitui uma estratégia de preservação.

� É pré-requisito para qualquer estratégia de preservação.

Page 6: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

6

Emulação

� Baseiam-se na utilização de um software, chamado “emulador”, capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra;

� Como interpretar no futuro cada bit/byte de um objeto digital?◦ Deve-se ter informações detalhada sobre o objeto digital e

sobre o ambiente de hardware onde ele operava;

� Pressuposto: é tecnicamente viável substituir as plataformas de hardware obsoletas necessárias para executar no futuro os aplicativos originais em máquinas virtuais (emuladores);

Emulação

� Existem essencialmente dois tipos de emuladores: emuladores de sistemas operacionais (1) e de emuladores de hardware(2).1. Reprodução de um sistema operacional completo permitindo a

execução de diversas aplicações no contexto de um único emulador.

2. Imitar o comportamento de uma plataforma de hardware, possibilitando que vários sistemas operacionais e correspondentes aplicações possam ser executados no contexto de um único emulador.

� Existem vários exemplos de emuladores de plataformas consideradas obsoletas◦ ZX Spectrum, Nintendo NES, entre outras.

Page 7: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

7

Emulação

� Rothenberg defende um modelo teórico capaz de emular plataformas atuais em computadores futuros.

◦ Conservação do objeto digital juntamente com todo o software necessário à sua execução/apresentação (incluindo o sistema operacional) e na criação de uma especificação da plataforma de hardware que suporta a execução desse software.

◦ Essa especificação deverá ser escrita numa linguagem independente da plataforma e ser suficientemente rica para que um emulador possa ser construído em qualquer computador do futuro.

� Hendley considera que a emulação apenas deveria ser utilizada em contextos em que a comunidade de interesse valoriza a preservação do ambiente tecnológico original ou ainda em situações em que os objetos digitais não são passíveis de ser convertidos para formatos contemporâneos.

Emulação

� Vantagens◦ Não é necessário preservar o hardware original, pois o

software emulador é criado para ser utilizado em plataformas atuais.

◦ Capacidade de preservar, com um elevado grau de fidelidade, as características e as funcionalidades do objeto digital original.

� Críticas◦ Complexidade técnica de desenvolver emuladores;

� Requer especificação detalhada do hardware e do software.� Alto custo

◦ Os próprios emuladores estão sujeitos a obsolescência;

◦ Os usuários são obrigados a operar sistemas obsoletos;

◦ Preservar um sistema operacional inteiro apenas para visualizar um documento parece uma tarefa exageradamente pesada;

Page 8: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

8

Encapsulamento

� Não é fácil determinar o valor intrínseco de determinados objetos digitais. Poderão passar-se vários anos até que a comunidade revele um interesse particular por uma determinada coleção de objetos.

� Neste tipo de cenário, as estratégias de preservação que carecem de uma diligência contínua poderão ser muito caras;

� As soluções baseadas em encapsulamento procuram resolver esse problema mantendo os objetos digitais inalterados até ao momento em que se tornam efetivamente necessários.

� Preservação do objeto digital original juntamente com informações capazes de garantir a sua futura interpretação;

◦ Criar “containers” ou “embrulhos” contendo o objeto digital e toda a informação (descrição formal) necessária do objeto para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores.

Encapsulamento

� Vantagens

◦ Permite adiar as responsabilidades de preservação;

◦ Orientado a objetos que apenas serão utilizados num futuro longínquo

◦ Desenvolvimento de visualizadores, migradores ou emuladores apenas no futuro;

� Desvantagens

◦ Objetos complexos possuem especificações complexas

◦ Possibilidade de especificações incompletas;

Page 9: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

9

Pedra de Roseta Digital

� Pedra de Roseta◦ Bloco de pedra com estranhos glifos cunhados separados em três partes distintas

com o mesmo texto: a parte superior está na forma hieroglífica do egípcio antigo, o trecho do meio em demótico, e o inferior em grego antigo

◦ Foi crucial para a compreensão moderna dos hieróglifos egípcios. Sua inscrição registra um decreto promulgado em 196 a.C., em nome do rei Ptolomeu V.

◦ Ela foi descoberta em 1799, numa expedição militar do então general Napoleão -mais tarde ela foi capturada pelos ingleses.

� Sua tradução ainda causa conflitos entre nações e, até os dias de hoje, estudiosos debatem sobre quem deveria levar crédito por decifrar o código dos hieróglifos. Até mesmo a atual localização da pedra é assunto para debate. O objeto sempre foi considerado de grande importância histórica e política.

� A realização da tradução em 1822 pertence ao estudante francês Jean-François Champollion, que desta forma iniciou a ciência de estudo de assuntos referentes ao Egito, a Egiptologia.

Pedra de Roseta Digital

� Como estratégia de preservação digital, propõe preservar não as regras que permitam decodificar o objeto, mas amostras representativas desse objeto que permitam sua recuperação;

� Existem também propostas de criação de diretórios centralizados de informação técnica sobre os formatos digitais, com o objetivo de registrar informações sobre os formatos: especificações técnicas, grau de obsolescência, entre outros.◦ Essas informações serão importantes como apoio às

atividades de preservação digital, além de possibilitar o desenvolvimento de ferramentas para identificação do formato de um objeto digital.

Page 10: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

10

Preservação do objeto conceitual

Normalização

� Tem como objetivo simplificar o processo de preservação através da redução do número de formatos distintos que se encontram no repositório de objetos digitais;

� Havendo um número controlado de formatos, uma mesma estratégia de preservação poderá ser aplicada a um maior número de objetos digitais, o que poderá rediz os custos de preservação.

� Exemplo◦ Existem vários formatos para representação de imagens (BMP, GIF,

JPEG, PNG). Se todas as imagens digitais forem convertidas para um único formato, a preservação desse tipo de objeto poderia ser realizadas de forma mais simples e mais econômica.

� A escolha do formato de normalização é um fator determinante no sucesso desta estratégia.◦ Sempre que possível, deverão ser escolhidos formatos conhecidos

pela comunidade de interesse e baseados em normas internacionais abertas.

Page 11: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

11

Normalização

� O formato de normalização deverá ser suficientemente rico para que as características fundamentais dos vários formatos possam ser devidamente incorporadas.

� Ao serem utilizados formatos abertos e independentes da plataforma, diferentes configurações de hardware e software serão capazes de os interpretar.

� A normalização de formatos pode ser implementada de diversas formas.◦ Determinados repositórios procedem à conversão

automática dos objetos recebidos para um formato padrão.◦ Definir políticas de arquivo que limitam os formatos em que

aceitam informação. Assim, cabe aos produtores da informação converter os seus objetos digitais para os formatos estipulados.

Migração

� “(…) transferência periódica de material digital de uma dada configuração de hardware/software para uma outra, ou de uma geração de tecnologia para outra subsequente”.

� Conjunto de atividades que devem ser repetidas periodicamente◦ Copiar, converter ou transferir a informação digital do patamar

tecnológico que a sustenta (mídias, softwares, formatos e hardware) para um outro mais atualizado e de uso corrente;

� Tem como objetivo manter os objetos digitais compatíveis com tecnologias atuais de modo que um usuário comum seja capaz de utilizá-lo sem necessidade de recorrer a artefatos menos convencionais, como por exemplo, emuladores.

Page 12: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

12

Migração

� Migração para suportes analógicos◦ A migração para suportes analógicos consiste na

conversão de objetos para suportes não digitais com o intuito de aumentar a sua longevidade.

◦ Reprodução de um objeto digital em papel, microfilme ou qualquer outro suporte analógico de longa duração e concentrar os esforços de preservação em torno do novo suporte.

◦ Esta estratégia, no entanto, apenas pode ser aplicada a objetos digitais que possuam uma representação aproximada em suportes analógicos, como por exemplo, documentos de texto ou imagens.

◦ Objetos interativos e/ou dinâmicos ficam assim automaticamente excluídos deste tipo de estratégias.

Migração

� Atualização de versões◦ É bastante comum encontrar aplicações de software

capazes de abrir ou importar objetos digitais produzidos por versões anteriores dessa mesma aplicação.

◦ Essas aplicações permitem geralmente gravar os objetos importados no formato mais atual produzido pela mesma.

◦ Esta operação designa-se por atualização da versã o do formato.

◦ É possivelmente a estratégia de preservação mais vulgarmente utilizada pelos generalidade dos utilizadores.

◦ Essencialmente, consiste em atualizar os materiais digitais produzidos por um determinado software a uma versão mais atual do mesmo

Page 13: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

13

Migração

� Conversão para formatos concorrentes◦ O processo e atualização de versões é geralmente

controlado pela empresa que desenvolveu o software. ◦ Independentemente do sucesso económico de um

fabricante ou produto de software, os formatos estão constantemente sujeitos a descontinuidade.◦ Uma forma de garantir que os objetos digitais sobrevivem

a este tipo de rupturas tecnológicas consiste em convertê-los para formatos de uma linha de produtos concorrente.◦ Existem formatos que não são dependentes de qualquer

aplicação de software. Tal, acontece com grande parte dos formatos de imagem (ex: JPEG, TIFF, PNG). Isto possibilita que os objetos sejam convertidos entre formatos semelhantes, independentemente da aplicação utilizada na sua criação.

Migração

� Migração a pedido◦ O sucesso de uma migração depende, fundamentalmente, da

qualidade dos conversores utilizados e da capacidade que o formato de destino possui para acomodar o conjunto de propriedades do formato de partida.

◦ Poder-se assumir que sempre que é efetuada uma migração, os objetos digitais resultantes serão de alguma forma diferentes dos objetos de partida.

◦ Ao fim de algumas iterações, os objetos preservados poderão ser substancialmente diferentes dos objetos originais.

◦ Para combater este fenômeno de degradação surgiu uma estratégia designada por migração a pedido.

◦ Neste tipo de migração, ao invés de as conversões serem aplicadas ao objeto mais atual, estas são sempre aplicadas ao objeto original.

◦ Se em uma conversão resultar um objeto substancialmente diferente do original, numa futura conversão, o problema poderá ser resolvido recorrendo a um conversor de melhor qualidade ou a um formato de destino mais adequado.

Page 14: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

14

Migração

� Migração a pedido

Migração

� Migração a pedido◦ A principal vantagem é que, uma vez construído o módulo

de descodificação do conversor (módulo capaz de ler as propriedades do formato de origem), apenas será necessário desenvolver os codificadores específicos para cada formato de saída.

◦ Ao longo do tempo haverá um conjunto grande de conversores de modo a garantir a capacidade de transformar os objetos armazenados nos seus formatos originais para formatos que sirvam adequadamente as necessidades dos seus consumidores

Page 15: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

15

Migração

� Migração distribuída◦ Existe um conjunto de serviços de conversão que se encontram

acessíveis através da Internet e que podem ser utilizados remotamente.

◦ Existem várias iniciativas que visam o desenvolvimento deste tipo de conversores.� Typed Objects Model (TOM) - sistema distribuído de conversores, que

recorre a agentes mediadores para descobrir e executar conversões entre formatos.

� Lister Hill National Center for Biomedical Communications - Serviço Web que converte ojetos digitais de cinquenta formatos distintos para PDF.

◦ Hunter e Choudhury propõem uma rede de serviços de conversão que possibilita a sua descoberta e invocação automática por agentes de software.

◦ Na Universidade do Minho está atualmente a ser desenvolvida uma Arquitetura Orientada ao Serviço (SOA) que disponibiliza várias centenas de serviços de conversão, avaliação e recomendação.

Migração

� Migração distribuída◦ Este tipo de migração apresenta algumas vantagens face às

estratégias de migração mais convencionais:� A utilização de serviços de conversão permite esconder as

especificidades de cada conversor e da plataforma que o suporta;� A criação de serviços redundantes assegura a confiabilidade do

sistema perante situações de ruptura parcial;

◦ Este tipo de abordagem é compatível com uma série de variantes de migração, como por exemplo, normalização e migração a pedido;

◦ A criação de uma rede global de conversores poderá conduzir a uma redução generalizada dos custos de preservação.

◦ Qualquer organização poderá rentabilizar os seus investimentos no desenvolvimento de conversores, publicando-os na rede de serviços e cobrando uma pequena taxa pela sua utilização.

Page 16: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

16

Migração

� Migração distribuída◦ Apesar das vantagens apresentadas, a migração

distribuída poderá não será adequada a todos os contextos.� Um repositório de informação digital pode facilmente conter

milhares de itens, atingindo níveis de armazenamento na ordem dos múltiplos terabytes.

� Transferir através da Internet um volume de informação desta natureza acarreta custos que poderão ser impeditivos para muitas organizações.

◦ Requisitos em termos de largura de banda, segurança dos dados e tempo de transferência poderão ser fatores determinantes no sucesso deste tipo de estratégias.

Migração

� Vantagens◦ Disseminação dos materiais em formatos atualizados;

◦ Sem necessidade de preservar o software original;

◦ Possui um conjunto de procedimentos mais bem organizados e consolidadas;

� Desvantagens◦ Possível perda de informação durante a conversão

◦ Necessidade de diligência continua

◦ Dispendiosa a longo-prazo

Page 17: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

17

Finalizando...

� A migração é a estratégia que mais evolui e que mais está sendo utilizada;

� Emulação torna-se uma estratégia muito cara, necessitando da criação de um ambiente de software e hardware exatamente igual ao original.

� O refrescamento é uma estratégia que deve ser aplicada principalmente em função da obsolescência dos suportes e do hardware.

� É necessário que as instituições adotem estratégias de preservação digital em suas políticas, para cada tipo de objeto digital, avaliando-as periodicamente para determinar qual a melhor estratégia a ser implementada de acordo com as tecnologias existentes naquele momento.

� Necessidade do desenvolvimento de elementos de descrição que possam descrever todo o histórico das estratégias aplicadas aos objetos digitais, para que o mesmo possa ser entendido no futuro pelos novos ambientes tecnológicos.

� Nesse sentido, a criação de metadados específicos de preservação e que registrem todas as estratégias aplicadas é apontada como a melhor solução.

Bibliografia

Page 18: Preservação digital ESTRATÉGIAS - Unesp€¦ · Existem vários formatos para representação de imagens (BMP, GIF, JPEG, PNG). Se todas as imagens digitais forem convertidas para

08/01/2017

18

Bibliografia