Digitalizacao de obras e o formato pdfa

38
DIGITALIZAÇÃO DE OBRAS E DIGITALIZAÇÃO DE OBRAS E O FORMATO PDF/A O FORMATO PDF/A Ursula Blattmann Ursula Blattmann [email protected] Local: LABINFOR – CIN – CED- UFSC Das 14 às 18h Florianópolis, 22 de outubro de 2010 Promoção : Núcleo de Pesquisas e Estudos em Arquivos Contemporâneos Instituto de Pesquisas BIBLION URL: http://www.slideshare.net/blattmann

description

Minicurso apresentado na Sepex 2010, Digitalização, PDF/A , Florianópolis, UFSC

Transcript of Digitalizacao de obras e o formato pdfa

Page 1: Digitalizacao de obras e o formato pdfa

DIGITALIZAÇÃO DE OBRAS E DIGITALIZAÇÃO DE OBRAS E O FORMATO PDF/AO FORMATO PDF/A

Ursula BlattmannUrsula [email protected]: LABINFOR – CIN – CED- UFSC Das 14 às 18h Florianópolis, 22 de outubro de 2010

Promoção : Núcleo de Pesquisas e Estudos em Arquivos Contemporâneos

Instituto de Pesquisas BIBLION

URL: http://www.slideshare.net/blattmann

Page 2: Digitalizacao de obras e o formato pdfa

ESTRATÉGIAS DE PRESERVAÇÃO DIGITAL Ferreira (2006, p.33) foca a conservação do

objeto digital no seu formato original formato original e do conteúdo intelectualconteúdo intelectual. Na conservação do objeto digital no seu formato original, pode se aplicar duas estratégias:

a) Refrescamento: transferir a informação de um objeto físico de armazenamento para outro mais atual, antes que o primeiro deteriore.

b) Emulação: técnica de criar um ambiente tecnológico que emule o ambiente original do objeto digital. Mais relevante na preservação de aplicações de software, como por exemplo, jogos de computador.

Page 3: Digitalizacao de obras e o formato pdfa

O SUPORTE DO FORMATO DIGITAL

Evolução das fontes de informação

Pedra, papiro, papel, fotografias e microfilme,

para os mais recentes dispositivos, como

fitas magnéticas, fitas K7, discos flexíveis,

fitas VHS

Disquetes, discos rígidos (HD), Compact Disc

(CD’s), videolaser, DVD’s e pen-drives

Page 4: Digitalizacao de obras e o formato pdfa

OBJETOS DIGITAIS

Sayão (2007, p.15) para manter os objetos digitais perenemente acessíveis para uso, se requer algo mais do que preservar simplesmente o artefato físico; é necessário considerar também várias outras dimensões outras dimensões como:

a) Preservação física - foco está na preservação das mídias e na sua renovação quando se fizer necessário;

b) Preservação lógica - foco os formatos e a dependência de hardware e software que mantenha legíveis e interpretáveis a cadeia de bits;

c) Preservação intelectual - foco o conteúdo intelectual e sua autenticidade e integridade;

d) Preservação do aparato – na forma de metadados - necessária para localizar, recuperar e representar a informação digital; e,

e) Monitoramento e à instrumentalização da comunidade alvo - audiência para o qual a informação de forma privilegiada se dirige, no sentido de garantir que ele possa compreender plenamente a informação no momento do seu acesso.

Page 5: Digitalizacao de obras e o formato pdfa

CONTEÚDO INTELECTUAL DA OBRA DIGITAL

Ferreira (2006, p.36) lembra a importância de transferir periodicamente um objeto digital de uma tecnologia de hardware e/ou software para outra mais atual. Podem ser aplicadas as seguintes formas de migração:

a) Migração para suportes analógicos: consiste em converter um objeto digital para um suporte não digital, como, por exemplo, imprimir um texto e armazená-lo em papel.

b) Atualização de versões: utilizado essencialmente para software, consiste em criar uma versão mais atual do mesmo.

c) Conversão para formatos concorrentes: consiste em converter o objeto digital para outro formato concorrente, como, por exemplo, converter uma imagem para o formato jpeg.

d) Normalização: consiste um reduzir o número de formatos de um repositório de objetos digitais, criando condições favoráveis ao processo de interoperabilidade entre sistemas distintos.

e) Migração a pedido: consiste em aplicar processos de conversão sempre no objeto digital original, pois os diversos processos de conversão do objeto.

Page 6: Digitalizacao de obras e o formato pdfa

CONTEÚDO INTELECTUAL DA OBRA DIGITAL (2) f) Migração distribuída: consiste em aplicar

remotamente a um objeto digital um conjunto de conversores, acessíveis na Internet, reduzindo assim os custos de preservação.

g) Encapsulamento: consiste em manter o objeto digital original inalterado até que a comunidade efetivamente necessite do mesmo. Nesse momento que o objeto deverá ser tratado.

h) Pedra de Rosetta digital: como no caso da Pedra de Rosetta descoberta no delta do Nilo em 1799, essa estratégia propõe preservar não as regras que permitem decodificar o objeto, mas amostras representativas desse objeto que permitam sua recuperação.

Page 7: Digitalizacao de obras e o formato pdfa

O QUE PRECISA PARA DIGITALIZAR?

Análise do contexto e do documento

Autorização para efetuar a digitalização

Equipamentos

Softwares

Pessoas capacitadas

Estrutura de armazenamento

Page 8: Digitalizacao de obras e o formato pdfa

INICIAR A ORGANIZAÇÃO DA DIGITALIZAÇÃO DA DOCUMENTAÇÃO

Identificação

Documentos digitais preservados e compartilhados

Documentos físicos organizados

Chaves (2008 ) apresenta:

Page 9: Digitalizacao de obras e o formato pdfa

• Disponibilizar a informação para a tomada de decisão;

• Atender às demandas fiscais e legais;

• Preservar a memória da organização (instituição, empresa);

• Atender às demandas sociais.

QUAIS OS MOTIVOS PARA DIGITALIZAR?

Page 10: Digitalizacao de obras e o formato pdfa

ITENS PARA CONHECER UM DOCUMENTO DE ARQUIVO?

Objetividade

Inter-relação

Unicidade

Caráter seriado

Autenticidade

Integridade

Chaves (2008 ) apresenta:

Page 11: Digitalizacao de obras e o formato pdfa

IDENTIFICAR O CONTEXTO DA ORGANIZAÇÃO

Acessibilidade

Agilidade

Flexibilidade

Confiabilidade

Chaves (2008 ) apresenta:

Page 12: Digitalizacao de obras e o formato pdfa

PRINCÍPIOS DA ARQUIVÍSTICA

Proveniência = os documentos de uma mesma procedência não devem misturar-se com os de outra procedência;Ordem original = Os documentos são produzidos com base em um procedimento, pelo qual inatamente uns se vão colocando após os outros;Descrição coletiva = Princípio de descrever corpos documentais coletivamente em vez de fazê-lo individualmente.

Chaves (2008 ) apresenta:

Page 13: Digitalizacao de obras e o formato pdfa

IDENTIFICAR O VALOR DOS DOCUMENTOS

AdministrativoFiscal e Legal Histórico e

Científico

Chaves (2008 ) apresenta:

Page 14: Digitalizacao de obras e o formato pdfa

QUAL O CICLO DE VIDA DOS DOCUMENTOS?

NASCIMENTO

REGISTRO

START

DESENVOLV.

TRAMITAÇÃO

ON

REPOUSO

ARQUIVO

STAND BY MORTE

EXPURGO

OFF

PERMANÊNCIA

ARQUIVO GERAL

PERMANENTLY

corrente inter.

permanente

Chaves (2008 ) apresenta:

Page 15: Digitalizacao de obras e o formato pdfa

ATENÇÃO!

• Entender o contexto documental antes de

qualquer coisa;

• Preservar o fundo arquivístico;

• Atentar para a suposta organização que há

dentro da desorganização;

• Não desprezar informações constantes na

situação originalmente encontrada;

• Acreditar que documento classificado de

forma errada dificilmente será localizado.

Chaves (2008 ) apresenta:

Page 16: Digitalizacao de obras e o formato pdfa

PROCESSO DE ORGANIZAÇÃO

LEVANTAMENTO CLASSIFICAÇÃO SELEÇÃO

ELIMINAÇÃOORDENAMENTOINDEXAÇÃO

DIGITALIZAÇÃO

Chaves (2008 ) apresenta:

Page 17: Digitalizacao de obras e o formato pdfa

LEVANTAMENTO

• Permite a visão do todo;

• Evita surpresas;

• Viabiliza a padronização;

• Facilita a organização;

• Possibilita a pesquisa.

PROCESSO DE ORGANIZAÇÃOChaves (2008 ) apresenta:

Page 18: Digitalizacao de obras e o formato pdfa

CLASSIFICAÇÃO• Reúne documentos por semelhança;

• Sistematiza a organização;

• Agiliza a composição do plano de

arquivo;

• Possibilita a pesquisa.

PROCESSO DE ORGANIZAÇÃOChaves (2008 ) apresenta:

Page 19: Digitalizacao de obras e o formato pdfa

SELEÇÃO

• Separa o “joio do trigo”: guarda

temporária, guarda permanente ou

eliminação;

• Antecede a eliminação;

• Aponta o foco de trabalho;

• Possibilita a pesquisa.

PROCESSO DE ORGANIZAÇÃOChaves (2008 ) apresenta:

Page 20: Digitalizacao de obras e o formato pdfa

ELIMINAÇÃO

• Fundamenta-se na Tabela de

Temporalidade;

• Regula o fluxo documental do arquivo;

• Deve ser registrada, autorizada e

divulgada.

PROCESSO DE ORGANIZAÇÃO

Chaves (2008 ) apresenta:

Page 21: Digitalizacao de obras e o formato pdfa

ORDENAMENTO

• Estabelece critério de ordem

(alfabética, numérica ou cronológica);

• Corresponde ao início da Indexação;

• Disposição na pasta/caixa

• Facilita a pesquisa.

PROCESSO DE ORGANIZAÇÃOChaves (2008 ) apresenta:

Page 22: Digitalizacao de obras e o formato pdfa

INDEXAÇÃO

PROCESSO DE ORGANIZAÇÃO

• Estabelece índices de busca;

• Permite busca mais precisa;

• Representa o elo entre o documento

físico e os registros no sistema;

• Facilita a pesquisa.

Chaves (2008 ) apresenta:

Page 23: Digitalizacao de obras e o formato pdfa

PROCESSO DE DIGITALIZAÇÃO

Os formatos de arquivos com especificações proprietárias e abertas, também são encontrados em softwares com grande aceitação de mercado, como o Adobe Acrobat. Alguns desenvolvedores disponibilizaram publicamente suas especificações, permitindo que outras empresas produzam software que possam utilizá-los.

Existem ainda vários de formatos proprietários e abertos, que são adotados como norma, como é o caso do PDF. Existem ainda os formatos não proprietários e com especificação aberta como exemplo o PDF/A.

Page 24: Digitalizacao de obras e o formato pdfa

SOFTWARES E PADRÕES

Software BrOffice suporta nativamente o formato de arquivo ODF Open Document Format , criado em 1999 Formato Aberto de Documentos.

A versão 1.0 do ODF, finalizada pelo OASIS em 2005 foi aprovada por unanimidade pela ISO, em Março de 2006, como Norma Internacional, a norma ISO/IEC 26.300:2006. Em Maio de 2008, o ODF foi aprovado e publicado pela ABNT como norma brasileira a NBR ISO/IEC 26.300.

No Brasil, as definições referentes às tecnologias associadas à interoperabilidade são definidas pelos Padrões de Interoperabilidade de Governo Eletrônico (e-PING)( http://www.governoeletronico.gov.br/acoes-e-projetos/e-ping-padroesde-interoperabilidade )

De acordo com e-Ping, para que se conquiste a interoperabilidade,faz-se necessário o engajamento da sociedade num esforço contínuo para assegurar que sistemas, processos e culturas de uma organização sejam gerenciados e direcionados para maximizar oportunidades de troca e reuso de informações, interna e externamente ao governo federal.

Page 25: Digitalizacao de obras e o formato pdfa

E-PING

Ministério do Planejamento e Orçamento e Gestão do Governo do Brasil disponível em ( http://www.governoeletronico.gov.br/acoes-e-projetos/e-ping-padroesde-interoperabilidade ) a arquitetura e-PING cobre o intercâmbio de informações entre os sistemas do governo federal – Poder Executivo e as interações com:

•a) Cidadãos;•b) Outras esferas de governo (estadual e•municipal);•c) Outros Poderes (Legislativo, Judiciário e•Ministério Público Federal);•d) Governos de outros países;•e) Empresas (no Brasil e no mundo);•f) Terceiro Setor.

Page 26: Digitalizacao de obras e o formato pdfa

HISTÓRIA DO PDF

http://www.adobe.com/br/products/acrobat/adobepdf.html

Portable Document Format (PDF) é o padrão global para a captura e a revisão de informação de mídia rica de quase todos os aplicativos ou sistemas operacionais e para o compartilhamento com quase qualquer pessoa, em qualquer lugar.

Page 27: Digitalizacao de obras e o formato pdfa

O QUE É O FORMATO PDF/A?

Portable Document Format PDF, criado pela Adobe Systems:

1990 – Adobe PostScript 1992 – Divulgado o Formato PDF 1994 – Distribuição gratuita software

Acrobat Reader http://www.adobe.com/br/downloads/

1999 – American National Standards Institute - ANSI padrão de intercâmbio protegido de conteúdo impresso

Page 28: Digitalizacao de obras e o formato pdfa

O QUE É O FORMATO PDF/A?

2000 – e-book Stephen King “Riding the Bullet” 2003 – Suporte para XML e formulários 2005 – Library of Congress, National Archives e

Records Adminitration e várias empresas de Tecnologias da informação elegeram formato para preservação a longo prazo dos documentos

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. . ISO 19005-1: Information and documentation - electronic document file format for long-term preservation. Geneva: ISO, 2005. pt. BU/UFSC Número de Chamada: ISO 19005-1 I61i Pasta ISO 08

Page 29: Digitalizacao de obras e o formato pdfa

POR QUE USAR O FORMATO PDF/A?

PDF/A: PDF/A: Archive usado documentos a serem preservados em bibliotecas, arquivos e centros de documentação.

Page 30: Digitalizacao de obras e o formato pdfa
Page 31: Digitalizacao de obras e o formato pdfa

COMO IDENTIFICAR O FORMATO PDF/A?

Page 32: Digitalizacao de obras e o formato pdfa

PDF/A

Aprovado pela ISO em maio de 2005, o PDF/A

fornece especificações para a criação, a

visualização e a impressão de documentos digitais

para uma preservação a longo prazo. Os

arquivistas e os profissionais de gerenciamento de

documentos e de conformidade industrial podem

usar o Acrobat X para preservar e proteger com

facilidade os documentos finais de registro como

arquivos independentes, ajudando a garantir o

acesso futuro à informação.

Page 33: Digitalizacao de obras e o formato pdfa

PDF/E

Ratificado pela ISO como um padrão aberto em junho de 2007, o PDF/E fornece especificações para a criação, a visualização e a impressão de documentos utilizados em fluxos de trabalho de engenharia. Arquitetos, engenheiros, profissionais da construção e equipes de fabricação de produtos podem utilizar o Acrobat X para facilitar o intercâmbio de documentações e desenhos com outros profissionais da cadeia de fornecimento e para agilizar a revisão e a marcação do documento.

Page 34: Digitalizacao de obras e o formato pdfa

PDF/X As diversas versões do PDF/X, que foi o

primeiro padrão PDF da ISO, em 1999, fornecem especificações para a criação, a visualização e a impressão de páginas prontas para a impressão ou para a imprensa.

Este padrão define algumas configurações do PDF que causam um impacto em aspectos críticos da impressão, tais como espaço de cor e trapping. Profissionais da área de impressão, projetistas gráficos e outros profissionais de criação podem utilizar o Acrobat X para a criação e distribuição de arquivos previsíveis e prontos para impressão compatíveis com o padrão PDF/X.

Page 35: Digitalizacao de obras e o formato pdfa

OUTROS FORMATOS EM PDF

PDF/UA para a criação de arquivos PDF que sejam acessíveis universalmente para pessoas com deficiência visual ou mobilidade limitada.PRC para a representação de modelos em 3D e montagens em um formato de arquivos 3D, ideal para o armazenamento, o carregamento e a exibição de diversos tipos de dados em 3D.PDF/VT para a criação, a visualização e a impressão de arquivos utilizados na indústria de impressão variável e transacional, tais como declarações bancárias e faturas de negócios.

Page 36: Digitalizacao de obras e o formato pdfa

VEJA MAIS SOBRE PDF/A

ASOREY, Manuel. Introducción al PDF/A. PDF/A Competence Center

Webinars , 2010. Disponível em: <

http://www.slideshare.net/masorey/introduccion-al-pdfa >.

FANNING , Betsy. PDF/Archive: Preserving Electronic Documents.

Disponível em <

http://www.slideshare.net/bfanning/pdfarchive-preserving-electronic-docum

ents

>.

POE, Stephen D. PDF/A 101: An Introduction . 1st Intl. PDF/A Conference,

Amsterdam 2008, 10 April 2008 . Disponível em: <

http://www.slideshare.net/sdpoe/pdfa-an-introduction >.

SULLIVAN, Susan J. Preserving PDF Documents: Exploring the PDF/A

Standard. Chicago, 2005. Disponível em: <

http://www.slideshare.net/Nedrick/arma-september-2005-chicago >

Page 37: Digitalizacao de obras e o formato pdfa

AGRADECIMENTOS

Agradeço aos :Organizadores da SEPEX 2010 UFSC pelo espaço e oportunidadeAo Departamento de Ciência da Informação e ao Centro de Ciências da UFSC pelo uso do Laboratório de Informática Aos participantes do minicurso pela curiosidade e dedicação .Ao Curso de Graduação em Arquivologia da UFSC por estimular iniciativas desta natureza.

Em especial a Ana Luiza Chaves Ana Luiza Chaves pela apresentação disponível no Slideshare no sentido de facilitar a introdução e importância da organização de arquivos : CHAVES, Ana Luiza. Organização, automação (ged) e digitalização. Fortaleza, 11 de agosto de 2008. Evento sobre Organização, GED e Digitalização na Biblioteca Pública Fortaleza-CE. Disponível em: < http://www.slideshare.net/ivanezjunior/palestra-dia-110808-ana-maria-luiza-evento-sobre-organizao-ged-e-digitalizao-presentation >.

Page 38: Digitalizacao de obras e o formato pdfa

REFERÊNCIASADOBE Systems Incorporated. Família Adobe Acrobat / Acrobat e padrões PDF. 2010 .

CHAVES, Ana Luiza. Organização, automação (ged) e digitalização. Fortaleza, 11 de agosto de 2008. Evento sobre Organização, GED e Digitalização na Biblioteca Pública Fortaleza-CE. Disponível em: < http://www.slideshare.net/ivanezjunior/palestra-dia-110808-ana-maria-luiza-evento-sobre-organizao-ged-e-digitalizao-presentation >.

FERREIRA, M. Introdução à preservação digital: conceitos, estratégias e actuais consensos. Guimarães, Portugal: Escola de Engenharia da Universidade do Minho, 2006. Disponível em: < https://repositorium.sdum.uminho.pt/handle/1822/6411 >.

MÁRDERO ARELLANO, Miguel Ángel. Critérios para a preservação digital da informação científica. Brasília, 2008. 356f. Tese(Doutorado em Ciência da Informação). Programa de Pós-Graduação em Ciência da Informação. Universidade de Brasília, Brasília, 2008. Disponível em: < http://bdtd.bce.unb.br/tedesimplificado/tde_busca/arquivo.php?codArquivo=4547 >.

NATIONAL ARCHIVES AND RECORDS ADMINISTRATION. NARA. Disponível em:< http://www.archives.gov/index.html >. PDFLIB. XMP in PDF/A. Disponível em: < http://www.pdflib.com/knowledge-base/xmp-metadata/ >.

SAYAO, L. F.. Padrões para bibliotecas digitais abertas e interoperáveis. Encontros Bibli, v. 1, p. 2, 2007. Disponível em: < http://www.periodicos.ufsc.br/index.php/eb/article/viewFile/461/463 >.TAMMARO, Anna Maria; SALARELLI, Alberto. A biblioteca digital.Brasília: Briquet de Lemos, 2008. 377p.

Wensing, Jairo. Preservação e recuperação de informação em fontes de informações digitais: estudo de caso do Greenstone. 2010. 219 p. Dissertação (Mestrado em Ciência da Informação) – Programa de Pós Graduação em Ciência da Informação, Universidade Federal de Santa Catarina, Florianópolis, 2010. Disponível em: < http://www.cin.ufsc.br/pgcin/Wensing%20Jairo.pdf >.