Capítulo Scanners -...

17
Capítulo 30 Scanners O scanner e seu software Quando compramos um scanner, recebemos o seguinte material: Scanner Cabo de conexão Placa de interface* Software para captura de imagens Software para edição de imagens Software para OCR (reconhecimento ótico de caracteres) Manuais diversos (*) No caso de modelos que usam interface paralela e em alguns casos de modelos SCSI. O software mais importante que acompanha o scanner é aquele responsável pela captura de imagens. Capturar ou digitalizar uma imagem consiste em varrer uma figura ou foto com o scanner, gerando assim um arquivo gráfico. Este arquivo pode ser gravado nos vários formatos disponíveis (PCX, TIF, BMP, JPG, etc.), ou então pode ser enviado diretamente a um editor gráfico para que a imagem seja processada antes da gravação. Dentro do próprio editor gráfico podemos usar um comando de aquisição de imagem, fazendo assim com que o software de captura seja ativado. Não somos obrigados a usar o editor gráfico que acompanha o scanner. Podemos utilizar qualquer outro que seja de nosso gosto. Contudo, o software para captura é de uso obrigatório, já que foi desenvolvido especificamente para o modelo de scanner que acompanha.

Transcript of Capítulo Scanners -...

Capítulo 30 ScannersO scanner e seu softwareQuando compramos um scanner, recebemos o seguinte material:

Scanner Cabo de conexão Placa de interface* Software para captura de imagens Software para edição de imagens Software para OCR (reconhecimento ótico de caracteres) Manuais diversos

(*) No caso de modelos que usam interface paralela e em alguns casos de modelos SCSI.

O software mais importante que acompanha o scanner é aquele responsávelpela captura de imagens. Capturar ou digitalizar uma imagem consiste emvarrer uma figura ou foto com o scanner, gerando assim um arquivo gráfico.Este arquivo pode ser gravado nos vários formatos disponíveis (PCX, TIF,BMP, JPG, etc.), ou então pode ser enviado diretamente a um editor gráficopara que a imagem seja processada antes da gravação. Dentro do próprioeditor gráfico podemos usar um comando de aquisição de imagem, fazendoassim com que o software de captura seja ativado.

Não somos obrigados a usar o editor gráfico que acompanha o scanner.Podemos utilizar qualquer outro que seja de nosso gosto. Contudo, osoftware para captura é de uso obrigatório, já que foi desenvolvidoespecificamente para o modelo de scanner que acompanha.

30-2 Hardware Total

Atualmente qualquer editor gráfico é capaz de receber dados do scannerinstalado, graças ao padrão TWAIN. O Windows possui um driver chamadoTWAIN source manager, encarregado de fazer a conexão entre programasgráficos e os drivers dos scanners. Todos os programas gráficos modernossão TWAIN compatíveis, assim como ocorre com os scanners. Este padrãofaz com que o reconhecimento do scanner pelos programas gráficos seja tãopadronizado como é o uso do mouse.

OBS: TWAIN não é abreviatura ou sigla de termo algum. Muitos brincam dizendo quesignifica “Technology without an interesting name”.

Figura 30.1

Funcionamento do sistema TWAIN.

A figura 1 mostra o funcionamento do sistema TWAIN. O centro de tudo éo TWAIN source manager, indicado como TWAIN.DLL (no Windows 9xexistem dois gerenciadores, o TWAIN.DLL e o TWAIN_32.DLL). Progra-mas Twain compatíveis enviam comandos ao gerenciador TWAIN de umaforma padronizada, pedindo-lhes que seja enviado o arquivo gráficocapturado pelo scanner. A maioria dos editores gráficos modernos possui umcomando Scan (ou Acquire, ou ainda Capture), obedecendo ao sistemaTWAIN. O gerenciador TWAIN, por sua vez, envia comandos padronizadosao driver do dispositivo de entrada apropriado. Não é comum, mas umcomputador pode ter diversos dispositivos de entrada TWAIN (TWAINsources), como por exemplo, um scanner e uma câmera digital. Cadadispositivo de entrada de imagem deve ter o seu próprio TWAIN driver, queé fornecido pelo seu fabricante.

O OCR (Optical Character Recognition, ou Reconhecimento Ótico de Ca-racteres) é mais uma das interessantes aplicações dos scanners. Programas deOCR são capazes de receber de um scanner, um texto capturado a partir deum documento qualquer (o scanner trata este texto como um gráfico), ereconhece os caracteres existentes nesse texto, reconstituindo o texto original.

Capítulo 30 - Scanners 30-3

Assim podemos copiar um texto do papel para o computador, sem ter quedigitá-lo. O reconhecimento ótico de caracteres envolve diversas técnicasespeciais de processamento de imagem, mas mesmo assim não possibilitauma precisão de 100%, ou seja, alguns caracteres não chegam a serreconhecidos, e o usuário deve retocá-los manualmente.

Os programas para OCR também obedecem ao sistema TWAIN, o que fazcom que possam utilizar qualquer modelo de scanner que também siga estepadrão. Da mesma forma, se você comprou um scanner e não gostou doprograma OCR que o acompanha, pode adquirir separadamente um OCRde seu agrado.

Scanner com interface proprietáriaA instalação de um scanner pode ser dividida em duas etapas, sendo uma dehardware e uma de software. A etapa de hardware envolve a instalação daplaca de interface e a sua conexão com o scanner. Isto independe do tipo descanner, seja ele manual ou de mesa, o grau de dificuldade está relacionadoapenas com a interface usada. Podemos encontrar os seguintes tipos deinterface:

Interface proprietária Interface SCSI Interface paralela Interface USB

Vamos abordar a seguir as instalações de hardware, através de exemplos,começando pelas interfaces proprietárias. Usaremos como exemplo ainterface proprietária que acompanha o scanner Genius ScanMate Color.Muitas interfaces proprietárias apresentam métodos de instalação similares aodeste scanner.

30-4 Hardware Total

Figura 30.2

Scanner manual.

A placa de interface que acompanha este scanner não possui o recurso PnP.Isto pode ocorrer com vários scanners, mesmo aqueles lançados após oWindows 95. No caso da placa que acompanha o Genius ScanMate Color,apenas o seu endereço de E/S é configurado por jumpers. A IRQ e o canalde DMA são configurados através do software de instalação que oacompanha. O Windows não consegue detectar a sua interface (como ocorrecom a maioria das interfaces proprietárias), nem mesmo usando o comandoAdicionar Novo Hardware. Antes de conectar a placa, é preciso identificarendereços de E/S, IRQs e canais de DMA livres, decidindo assim quais serãousados pela placa de interface.

A instalação pode ser feita utilizando o software que acompanhaoriginalmente o scanner, mesmo que seja próprio para Windows 3.x. Se forutilizado um software para Windows 3.x, é preciso antes usar o comandoReservar Recursos no Gerenciador de Dispositivos. Se o seu scanner já éacompanhado por um software de instalação próprio para Windows 9x, estejá fará as atualizações no Gerenciador de Dispositivos, reservandoautomaticamente os recursos usados. Em geral os drivers de scanner paraWindows 3.x funcionam no Windows 9x. Entretanto se você tiver problemas,pode obter drivers mais novos, a partir do site do fabricante do seu scannerna Internet.

De acordo com o manual deste scanner, a placa de interface que oacompanha necessita dos seguintes recursos de hardware:

Endereços de E/S, escolhidos entre 280-283, 2A0-2A3, 330-333 ou 340-343.Interrupção, escolhida entre IRQ5, IRQ10, IRQ11 ou IRQ12Canal de DMA, escolhido entre DMA1, DMA3, DMA5 ou DMA6

Capítulo 30 - Scanners 30-5

Consultando os relatórios sobre uso de endereços de E/S, interrupções ecanais de DMA apresentados pelo Gerenciador de Dispositivos, resolvemosusar para a nossa placa de interface de scanner, a seguinte configuração:

Endereços de E/S: 2A0-2A3Interrupção: IRQ11Canal de DMA: DMA6

Na nossa placa existem dois jumpers, indicados como AD0 e AD1.Dependendo da situação de cada um deles (Open=sem jumper, Short=comjumper), teremos selecionado um dos quatro endereços possíveis.

Jumpers Addresses 280H 2A0H 330H 340H

AD0 Short Short Open OpenAD1 Short Open Short Open

O próximo passo é conectar a placa em um slot livre, o scanner no conectorexistente na parte posterior da placa, e ligar o computador. Instalamos entãoo software que acompanha a placa.

Feita a instalação do software, é apresentado o quadro da figura 3. No nossoexemplo, indicamos que a placa irá usar DMA6 e IRQ11. Usamos a seguir obotão Hardware Test..., para capturar uma figura, verificando se o scannerestá funcionando. Neste momento, não se preocupe com a qualidade daimagem, pois o objetivo é testar se as opções de DMA e IRQ são válidas.

Figura 30.3

Indicando o canal de DMA e a linha de IRQ utilizada.

Está terminada a instalação. A partir daí, o scanner já poderá ser usado porprogramas editores gráficos.

30-6 Hardware Total

Scanner com interface SCSIMuitos scanners de mesa utilizam interfaces SCSI. Para tornar o custo maisbaixo, essas interfaces SCSI são bem simples, não podendo ser utilizadascom todos os seus recursos como ocorre com as interfaces SCSI normais.Tratam-se de interfaces simplificadas, capazes de controlar exclusivamente osscanners que acompanham. Mesmo assim, o software de controle dessesscanners permite que a ligação seja feita também em uma interface SCSIpadrão. Na figura 4 vemos o início do programa de instalação do scannerMustek Color Page. Temos a opção de instalar o scanner usando a interfaceSCSI simplificada que o acompanha (Mustek scanner interface card) ou umainterface SCSI padrão, como os modelos da Adaptec. Nesse caso, é precisoque antes de instalar o scanner, sejam instalados os drivers SCSI queacompanham a placa (ASPI manager).

Figura 30.4

Selecionando o modelo de interface SCSI a ser usada.

No caso do uso da interface SCSI simplificada que acompanha este scanner,precisamos indicar o endereço base por ela ocupada. Na figura 5 é usado oendereço 280. Assim como ocorre em qualquer instalação de placas delegado, precisamos antes checar se esses endereços estão livres peloGerenciador de Dispositivos. Configuramos então os jumpers da placa daforma adequada. Caso o software de instalação usado seja próprio paraWindows 3.x, devemos reservar os recursos utilizados, através do Gerenci-ador de Dispositivos. Softwares de instalação para Windows 9x nãonecessitam desta reserva. Caso o seu scanner seja acompanhado apenas dedrivers para Windows 3.x, você pode obter drivers atualizados paraWindows 9x através da Internet.

Capítulo 30 - Scanners 30-7

Figura 30.5

Indicando o endereço base ocupado pela placa deinterface.

Você tem ainda a opção de conectar o scanner em uma interface SCSIpadrão. Este procedimento pode ser usado, por exemplo, quando a interfaceSCSI simplificada que acompanha o scanner é extraviada ou danificada.Você poderá usar uma placa SCSI Adaptec, por exemplo, mesmo que sejaum modelo simples e barato. Neste caso será preciso também adquirir umcabo SCSI externo, pois o cabo que acompanha o scanner normalmente usaconectores diferentes.

Se você instalar uma placa controladora SCSI, não precisará necessariamenteutilizar o software que acompanha o scanner. Pode comprar por exemplouma placa Adaptec junto com o software EZ SCSI. Entre os diversosutilitários deste pacote, encontramos o Quick Scan, um programa capaz decontrolar scanners SCSI conectados à placa Adaptec.

Os scanners SCSI também precisam ter configurado o seu SCSI ID. Possuemem geral um grupo de chaves, ou então uma chave seletora para a pro-gramação do SCSI ID, como mostra a figura 6.

30-8 Hardware Total

Figura 30.6

Indicando o SCSI ID do scanner.

Scanner de interface paralelaA instalação deste tipo de scanner é muito simples. Como o scanner estáligado na porta paralela, praticamente não existe mais nada a definir, emtermos de hardware. Bastará indicar o drive e diretório onde será feita ainstalação, e escolher quais são os softwares a serem instalados: driver Twain,Editor gráfico e OCR.

Figura 30.7

Conexão de um scanner na portaparalela.

A figura 7 mostra os passos envolvidos na instalação de um scanner paralelo:

1) Desconectar a impressora da porta paralela2) Ligar o cabo da impressora no conector do scanner com a indicação Printer3) Conectar o cabo do scanner no seu conector indicado como Computer4) Ligar o cabo do scanner na porta paralela do computador5) Ligar o adaptador AC no scanner (no caso de modelos que não têm fonte interna)6) Ligar o adaptador AC na rede elétrica (ou o cabo de força do scanner)

Capítulo 30 - Scanners 30-9

Antes de instalar o software que acompanha o scanner, devemos checar se aporta paralela está corretamente configurada e sem conflitos, através doGerenciador de Dispositivos (figura 8). Nesta ocasião podemos tambémtestar se a impressora está funcionando corretamente. A porta paraleladeverá estar configurada como ECP.

Figura 30.8

A porta paralela está corretamente configurada.

O scanner será reconhecido automaticamente pelo Windows, passando àetapa de instalação de drivers, assim como ocorre com outros dispositivosPlug and Play. A instalação do software que acompanha o scanner é similar àinstalação da maioria dos softwares. Será perguntada a linguagem, o diretórioda instalação, o nome do usuário e da empresa. Eventualmente pode sertambém perguntado o tipo de instalação (Normal, mínima ou personalizada).A figura 9 mostra as opções de uma instalação personalizada. Além dosdrivers, podemos instalar também um editor gráfico (no exemplo, o PhotoMagic 4.0), um programa de OCR (Type Reader) e um manual do usuário.Terminada a instalação devemos reiniciar o computador.

30-10 Hardware Total

Figura 30.9

Escolhendo os softwares a sereminstalados.

Usando um scanner manualPara mostrar como é feita a captura de imagens, ilustraremos esta operaçãousando o programa Ulead PhotoImpact. Assim como ocorre com todos osprogramas gráficos, existe um comando File / Acquire (ou File / Scan),mostrado na figura 10. Encontramos também agregado a este comando, umpróprio para fazer o selecionamento do Twain Data Source a ser usado.Quando um PC possui instalados, por exemplo, um scanner e uma câmeradigital, existirão dois Twain Data Sources.

Figura 30.10

Comandos relativos ao scanner.

No nosso exemplo, temos instalados drivers para um scanner GeniusScanMate Color e para uma câmera digital Canon PowerShot 600. Fazemosentão a seleção do scanner, como mostra a figura 11.

Capítulo 30 - Scanners 30-11

Figura 30.11

Selecionando o Twain Data Source.

Uma vez feita a seleção, usamos o comando File / Acquire / Image. Entra emação o Twain Data Source apropriado, ou seja o programa que faz acomunicação com o scanner, mostrado na figura 12. Este quadro poderávariar de um scanner para outro, mas em geral os comandos sãosemelhantes.

Figura 30.12

Programa para aquisição de imagens doscanner.

Encontramos neste programa, comandos para definir as dimensões daimagem a ser escaneada, o modo gráfico (color/mono, por exemplo) e aresolução. Existem ainda comandos para configurar o hardware (alterar IRQe DMA, caso seja necessário) e um botão Scan para dar início à captura. Nafigura 13 temos a captura em andamento. À medida em que movemos oscanner, a imagem lida é transferida para uma janela de controle. Esta janelapossui três indicadores, um verde, um amarelo e um vermelho. Serve paraindicar se a velocidade de movimentação do scanner está dentro de limitesseguros. Dependendo da velocidade do processador e da resoluçãoescolhida, pode ser necessário mover o scanner bem devagar.

30-12 Hardware Total

Figura 30.13

Captura em andamento.

Terminada a captura da imagem, a janela do Twain Data Source assumirá oaspecto mostrado na figura 14, já com a figura representada. Para retornar aoprograma que solicitou a figura, clicamos em OK.

Figura 30.14

Terminada a captura da imagem.

A figura capturada será transferida automaticamente para o programa que asolicitou, no nosso caso o PhotoImpact. Na figura 15 temos a figura já abertapelo programa, pronta para ser processada e armazenada em um arquivográfico.

Capítulo 30 - Scanners 30-13

Figura 30.15

Figura capturada.

OCR com scanners manuais

O reconhecimento ótico de caracteres pode ser utilizado com scannersmanuais, porém existe uma grande limitação, que é o tamanho máximo quepode ter o documento capturado. Para reconhecer os caracteres de umafolha tamanho A4, por exemplo, é preciso usar o scanner duas vezes. Apesarde funcionar, acaba sendo muito trabalhoso. Veja mais adiante a seção sobreuso de OCR em scanners de mesa, pois a operação com scanners manuais ésemelhante, apenas sendo diferente na forma de “passar” o scanner.

Usando um scanner de mesaTambém chamados scanners de página, esses modelos têm a capacidade decapturar de uma só vez, imagens em formatos maiores, como A4, carta eofício. O uso dos softwares que acompanham esses scanners é muitoparecido com o dos softwares para scanners manuais. Através de um editorgráfico qualquer, usamos o comando File / Scan, File / Acquire ou similar.Entrará em ação o Twain Data Source. Quando um PC possui mais de umdispositivo Twain compatível instalado (ex: scanner e câmera digital), épreciso antes usar o comando File / Select Source para indicar qual deles irágerar a imagem.

Os scanners de mesa possuem uma função chamada Prescan (pré-escanear)ou Preview. Com ela, é feita uma captura de rascunho em baixa resolução, emuitas vezes sem usar cores, da extensão completa da imagem. A partirdesta imagem, podemos marcar um retângulo que delimita o trecho

30-14 Hardware Total

desejado. Na figura 16 colocamos no scanner a página de uma revista efizemos o selecionamento da sua ilustração a ser capturada.

Figura 30.16

Usando a função pré-escanear e dimensionando a áreadesejada.

Neste programa sempre encontrarmos, não importa qual seja o modelo doscanner, um comando para definir características da imagem. No nossoexemplo, este comando é obtido pelo botão Painel. Será apresentado oquadro da figura 17, no qual podemos selecionar o modo de cores (preto ebranco, escala de cinzas ou RGB), a resolução ótica, a escala (100% resulta notamanho normal, valores maiores ativam a resolução interpolada), e aindacontroles para ajuste de brilho, contraste e formação de negativos.

Figura 30.17

Selecionando o modo de captura.

Capítulo 30 - Scanners 30-15

Depois de delimitar a área e definir os parâmetros de captura, usamos obotão Scan (escanear). A imagem será capturada e transferida para o editorgráfico.

Usando programas de OCRTodos os scanners são acompanhados de programas de OCR, mas nemsempre esses programas reconhecem os caracteres acentuados do idiomaportuguês – principalmente os modelos importados de forma extra-oficial.Alguns deles possuem um Setup para selecionamento do idioma, como oWordlinx, mostrado na figura 18. É possível que você consiga comprar umexcelente scanner por um bom preço, mas acompanhado de um programainadequado para nosso idioma. É possível também que encontre scannersnão tão bons, mas com um bom programa de OCR para português. Se vocênão estiver satisfeito com o seu OCR, pode adquirir outro em separado, jáque todos eles são compatíveis com qualquer modelo de scanner, graças aopadrão Twain.

Figura 30.18

Selecionando o idioma português.

Muitos programas de OCR possuem um comando Scan que dá acesso aoTwain Data Source. Observe que em geral os programas para OCRrecomendam usar o modo Line Art (preto e branco) e a resolução de 300dpi. Consulte o manual do seu programa para checar qual é a resoluçãomais indicada.

Alguns programas para OCR operam de forma diferente. O Type Reader,por exemplo, possui um comando Twain / Acquire, que fazautomaticamente a captura de toda a extensão da página localizada noscanner, usando a resolução padrão, que no seu caso é 300 dpi. Odocumento será inicialmente capturado como uma imagem, como vemos nafigura 19. É preciso verificar se na imagem capturada, o texto está legível, ese não está posicionado de forma inclinada. Muitas vezes as partes brancas

30-16 Hardware Total

da figura ficam cheias de manchas pretas, como em uma fotocópia de máqualidade. Devemos ajustar o brilho e o contraste até obter uma boaimagem. Este ajuste pode ser feito pelo programa OCR ou pelo Twain DataSource.

Figura 30.19

Página capturada pelo OCR na forma de imagem.

O comando View / Zoom permite ampliar a imagem capturada, e destaforma podemos checar sua qualidade, como vemos na figura 20. Quantomelhor a qualidade da imagem, mais facilidade o programa de OCR terápara fazer a conversão para texto.

Figura 30.20

Checando a qualidade da imagem capturada.

Depois de capturada a imagem, usamos no Type Reader os comandosLocate (para delimitar as colunas de texto) e Recognize (para converter emtexto). Note que quando um OCR não reconhece o idioma português, ouquando não está configurado para o português, os caracteres acentuados não

Capítulo 30 - Scanners 30-17

serão reconhecidos. No caso do Type Reader, basta usar o comandoLanguage / Portuguese, habilitando assim o reconhecimento dos caracteresacentuados de nossa língua. A figura 21 mostra um trecho reconhecido,primeiro sem a configuração para o português (esquerda), depois com oidioma português habilitado (direita).

Figura 30.21

Texto reconhecido, sem idioma portuguêse com idioma português.

Depois de ter o texto reconhecido, usamos o comando File Save. Podemosassim salvar um arquivo de formato TXT contendo o texto capturado (nocaso do Type Reader, é preciso gravar no formato DOC, do MicrosoftWord, para que os acentos sejam preservados). Agora podemos abri-lo comum editor de textos e fazer sua formatação e checagem gramatical. Osprogramas para OCR não são 100% eficientes, e sempre será necessário fazercorreção ortográfica e reformatar o texto. O trabalho do OCR não é perfeito,mas é muito melhor que ter o trabalho de digitar todo o texto.

///////////// FIM ///////////////