Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes...
Transcript of Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes...
![Page 1: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/1.jpg)
Automação de ArquivosGerenciamento Eletrônico
de imagens de documentos
Prof. Carlos H. [email protected]
![Page 2: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/2.jpg)
Arquivos em formato “mapa de bits”:
![Page 3: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/3.jpg)
•
ARQUIVOS “MAPA-DE-BITS – “BIT MAP”
![Page 4: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/4.jpg)
Arquivos em formato “mapa de bits”: como reconhecer um caracter?
A a A a A a a
a A ? ? ? ? ?
![Page 5: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/5.jpg)
Processo de digitalização• Os sistemas de gerenciamento de
imagens eletrônicas de documentos associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca/recuperação de informações
Tipo | Num. | Setor | Data | Assunto |
![Page 6: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/6.jpg)
Processo de digitalização
A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨
Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII
![Page 7: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/7.jpg)
Vantagens do Gerenciamento Eletrônico de Imagens de Documentos
Maior “densidade” de informações por unidade de armazenamento: um CD-ROM pode conter cerca de 40.000 folhas de papel A4 digitalizadas a 300 dpi
As imagens de documentos podem ser acessadas através de redes, dispensando o acesso ao documento original
Isso ajuda a preservar os documentos originais
![Page 8: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/8.jpg)
Processo de digitalização
Imagens são formadas por pontosPontos são representados por um número X de “bits”
Bitonal ou preto-e-branco: 1 bit por ponto:
pontos pretos: “1”pontos brancos: “0”
Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por ponto)Colorido
8 bits por ponto: 256 cores12 bits por ponto : 4096 cores24 bits por ponto : 16.800.000 cores (“true color”)
![Page 9: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/9.jpg)
Processo de digitalização - RESOLUÇÃO
• Relação entre número de pontos de uma imagem / Área
• Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada
• A resolução é uma medida da LEGIBILIDADE de uma imagem
![Page 10: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/10.jpg)
Processo de digitalização - RESOLUÇÃO
• Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes.
![Page 11: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/11.jpg)
Processo de digitalização
RESOLUÇÃO - aplicação da digitalização em DOCUMENTOS
Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi)
Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE
Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la
Resolução razoável para documentos: 300 dpi
![Page 12: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/12.jpg)
Processo de digitalização
• Como não existe um código único para cada caracter,
A a A a A a a a A a,
• nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo
![Page 13: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/13.jpg)
Processo de digitalização - Etapas
• Preparação - desarquivamento, retirada de grampos e “clips” restauração, agrupamento em lotes para a digitalização.– Fatores críticos de sucesso
• o estado dos documentos• uniformidade dos documentos• critério de grupamento em lotes
![Page 14: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/14.jpg)
- Digitalização - alimentação e digitalização dos lotes no escaner– Os fatores críticos de sucesso desta etapa são
• velocidade do escaner• cores da imagem: preto-e-branco, colorido, tons-de-cinza,• uniformidade dos lotes, evitando interrupção e re-
ajustamento do escaner• resolução utilizada
- Conferência - exame das imagens geradas para controle de qualidade, agrupamento de imagens formando documentos, eventualmente re-escaneamento
Processo de digitalização - Etapas
![Page 15: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/15.jpg)
Processo de digitalização - Etapas
• Indexação - associação a cada arquivo de imagem ou a cada grupo de imagens que formam um documento, um conjunto de termos de indexação visando a recuperação da(s) imagem(ns) do documento digitalizado– Fatores críticos de sucesso desta etapa são
• facilidade/velocidade de extração dos termos de indexação a partir da imagem do documento
• padronização do “lay-out” do documento
![Page 16: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/16.jpg)
Processo de digitalização - “hardware” e “software” envolvidos
• Hardware– escaner: de mesa, com bandeja– gravador de CD-ROM– “Jukebox”: dispositivo leitor com
capacidade de 8 a 48 CD-ROMs, geralmente com 4 a 8 cabeçotes de leitura
![Page 17: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/17.jpg)
Digitalização – componentes de “hardware”
escaner
Gravador CD
“Jukebox”
“Software” de GED
Estações p. consulta
Impressora
Sistema COM
![Page 18: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/18.jpg)
O escaner – características técnicas
Fonte de luz
Documento
Sensor – matriz de fotocélulas (resolução de “hardware”)
![Page 19: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/19.jpg)
O escaner – características técnicas
• Alimentador de folhas – capacidade (no. Folhas, peso• Tipo de interface• Resolução máxima por hardware: resolução real do
sensor do escaner em dpi• Resolução interpolada: resolução obtida através de
software• Modo de digitalização: simplex (uma face) ou duplex
(ambas as faces)• Velocidade: em páginas (ppm) por minuto, num
determinado modo e numa determinada resolução• Tamanho dos documentos: capacidade de receber folhas
de papel em formatos An
![Page 20: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/20.jpg)
O escaner
![Page 21: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/21.jpg)
“JUKEBOX” – características técnicas
“Vitrola” robótica capaz de disponibilizar um grande número de CDs gravados com imagens de documentos
• Características:– Capacidade de armazenamento em GB – Número de discos– Número de leitores de discos– Tempo de troca de discos
![Page 22: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/22.jpg)
SISTEMAS COM– características técnicas
“Computer Output on MicroFiche – permite a saída de relatórios diretamente em microfichas
![Page 23: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/23.jpg)
• “Software”– FUNÇÕES
•entrada:
– Escaneamento
– Conferência
– Indexação
– Gravação
•saída: - recuperação pelos pontos de acesso estabelecidos na indexação
Processo de digitalização - “hardware” e “software” envolvidos
![Page 24: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/24.jpg)
![Page 25: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/25.jpg)
• Baseados em SGBDs
– usam “representações” de documentos; permitem armazenar e recuperar “representações” de documentos.
• Sistemas de Gerenciamento de Imagens de Documentos – GED
– permitem associar a “representações” de documentos imagens digitais desses documentos
• Sistemas de gerenciamento de fluxo de trabalho – “workflow”
– Permitem controlar o ciclo de vida de documentos – sua tramitação
Sistemas de Gestão Documentos
![Page 26: Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br.](https://reader036.fdocumentos.tips/reader036/viewer/2022062418/552fc10b497959413d8c2d58/html5/thumbnails/26.jpg)
Processo de digitalização - OCR
• “Optical Character Recognition” - Reconhecimento ótico de caracteres: processo de submeter uma arquivo de imagens .bitmap a um software especial, que reconhece as imagens dos caracteres e transforma a imagem de cada caracter no seu equivalente codificado (p.ex. em ASCII)
• Vantagem : um arquivo textual codificado pode ser objeto de busca por conteúdo
Arquivo “bitmap Arquivo codificado