EDSON JOSÉ RODRIGUES JUSTINO - etsmtl.ca · Tabela 3.3 Características combinadas da grafologia e...
Transcript of EDSON JOSÉ RODRIGUES JUSTINO - etsmtl.ca · Tabela 3.3 Características combinadas da grafologia e...
-
EDSON JOS RODRIGUES JUSTINO
O GRAFISMO E OS MODELOS ESCONDIDOS DE MARKOV NA
VERIFICAO AUTOMTICA DE ASSINATURAS
Curitiba2001
-
EDSON JOS RODRIGUES JUSTINO
O GRAFISMO E OS MODELOS ESCONDIDOS DE MARKOV NA
VERIFICAO AUTOMTICA DE ASSINATURAS
Tese apresentada aoPrograma de Ps-Graduaoem Informtica Aplicada daPontifcia UniversidadeCatlica do Paran comoparte dos requisitos paraobteno do ttulo de Doutorem Cincias.
rea de Concentrao:MTODOS E TCNICAS
DE COMPUTAO
Orientador:Prof. Dr. Flvio Bortolozzi
Co-orientador:Prof. Dr. Robert Sabourin
Curitiba2001
-
Justino, Edson Jos Rodrigues
O grafismo e os modelos escondidos de Markov na verificaoautomtica de Assinaturas. Curitiba, 2001.
131p.
Tese (Doutorado) Pontifcia Universidade Catlica do Paran.Programa de Ps-Graduao em Informtica Aplicada.
1. Anlise de Documentos 2. Verificao de Assinaturas 3.Modelos Escondidos de Markov.
I. Pontifcia Universidade Catlica do Paran. Centro de CinciasExatas e de Tecnologia. Programa de Ps-Graduao em InformticaAplicada II-t
-
i
minha esposa Marinice, pelo estmulo e
incansvel compreenso durante todos
esses anos de trabalho.
-
ii
A G R A D E C I M E N T O S
Pontifcia Universidade Catlica do Paran pelo apoio
financeiro e estrutural, que permitiram a realizao desse
trabalho.
Ao amigo e orientador Prof. Dr. Flvio Bortolozzi pelas
diretrizes sempre seguras e permanente incentivo diante de
tantas atribulaes.
Ao Prof. Dr. Robert Sabourin pelas importantes contribuies
dadas a esse trabalho.
Ao Prof Dr. Abdenam El Yacoubi pelas importantes
contribuies dadas nos estudos dos Modelos Escondidos de
Markov.
Aos meus colegas de doutorado, que em todos os momentos
difceis pelos quais passamos, mantiveram-se sempre unidos em
busca de nosso objetivo comum.
todos que direta ou indiretamente colaboraram na execuo
deste trabalho.
-
iii
Sumrio
Lista de tabelas
Lista de figuras
Lista de abreviaturas e siglas
Lista de smbolos
Resumo
Abstract
1. Introduo 1
1.1. Histrico geral 2
1.2 O objetivo 2
1.3 O desafio 2
1.4 A motivao 3
1.5 A proposta 3
1.6 As contribuies 4
1.7 A organizao 4
2. Fundamentao Terica em Verificao Automtica de
Assinaturas Manuscritas: Vantagens e Limitaes
6
2.1 A assinatura manuscrita e os fatores de complexidade 6
2.1.1 Os fatores ligados autoria 6
2.1.2 Os fatores ligados s diferenas regionais 7
2.1.3 Os fatores ligados s falsificaes 8
2.2 Os mtodos dinmicos e os mtodos estticos de verificao
automtica de assinaturas
9
2.3 A classificao dos mtodos automticos de verificao esttica 11
2.3.1 O pr-tratamento 11
2.3.2 A segmentao e a extrao de primitivas 12
2.3.2.1 Os mtodos globais 12
2.3.2.2 Os mtodos locais 14
-
iv
2.3.3 A produo do modelo e a comparao 18
2.3.3.1 A classificao dos mtodos de verificao 19
2.3.3.1.1 Os mtodos estatsticos 19
2.3.3.1.1.1 Os mtodos paramtricos 19
2.3.3.1.1.2 Os mtodos no paramtricos 21
2.3.3.1.2 Os mtodos estruturais 21
2.3.3.2 Os mtodos de verificao segundo a abordagem
utilizada
22
2.3.4 Uma anlise crtica 24
3. A Proposta para um Mtodo de Verificao Automtica de
Assinaturas Manuscritas Estticas
25
3.1 A proposta 25
3.1.1 Os requisitos 25
3.1.2 As metas 26
3.1.3 A abordagem adotada 27
3.1.4 A base de dados de assinaturas 27
3.2 Os recursos 31
3.2.1 O grafismo 31
3.2.1.1 A grafoscopia 32
3.2.1.2 A grafologia 35
3.2.1.2.1 Elementos bsico da grafia 36
3.2.1.2.2 As letras e o movimento 38
3.2.1.2.3 Os aspectos grficos 38
3.2.1.2.4 O simbolismo do espao 39
3.2.1.2.5 A ordem 43
3.2.1.2.6 A proporo 44
3.2.1.2.7 A dimenso 45
3.2.1.2.8 A presso 45
3.2.1.2.9 A forma 46
3.2.1.2.10 O gesto caracterstico 46
3.2.1.3 Consideraes sobre o grafismo 48
-
v
3.2.2 Os modelos de Markov 50
3.2.2.1 A matriz de transio 51
3.2.2.2 A probabilidade de transio 51
3.2.2.3 Os modelos escondidos de Markov (MEM) 52
3.2.2.3.1 O modelo contnuo 52
3.2.2.3.2 O modelo discreto 53
3.2.2.3.3 Os tipos de MEM 54
3.2.2.3.4 Os problemas bsicos do MEM 56
3.2.2.3.4.1 A evoluo da probabilidade 56
3.2.2.3.4.2 A seqncia tima de estados 59
3.2.2.3.4.3 A reestimao dos parmetros 61
3.2.2.3.4.4 A estimao inicial dos
parmetros
63
3.2.2.3.4.5 O efeito do nmero insuficiente
de dados de aprendizado
64
3.2.2.3.5 Os modelos escondidos de Markov e as
mltiplas seqncias de observaes
64
3.2.2.3.6 Consideraes sobre o MEM 67
3.2.3 A quantizao vetorial e a aglomerao 68
3.2.3.1 A quantizao vetorial 68
3.2.3.1.1 A medida das distores 70
3.2.3.1.2 O projeto de um lxico 71
3.2.3.2 A aglomerao 73
3.2.3.3 Consideraes prticas sobre o QV 74
3.3 Comentrios finais 75
4. O Pr-tratamento, a Segmentao e a Extrao de Primitivas 76
4.1 O pr-tratamento 76
4.2 A segmentao 78
4.2.1 A estratgia de segmentao adotada 79
4.2.1.1 A estratgia de segmentao horizontal 81
4.2.1.2 A estratgia de segmentao vertical 83
-
vi
4.2.2 As caractersticas do grafismo incorporadas pelo mtodo de
segmentao
85
4.2.2.1 As primitivas estticas 85
4.2.2.2 As primitivas pseudo-dinmicas 87
4.3 A extrao de primitivas 88
4.3.1 As primitivas adaptadas s caractersticas estticas 88
4.3.1.1 A densidade de pixels 88
4.3.1.2 A distribuio de pixels 89
4.3.2 As primitivas adaptadas s caractersticas pseudo-dinmicas
das assinaturas
90
4.3.2.1 A inclinao axial 90
4.3.2.2 A forma 92
4.3.2.3 A progresso 93
4.4 A gerao do lxico usando a quantizao vetorial 94
4.5 Consideraes finais 96
5. O Mtodo Proposto para a Verificao Automtica de
Assinaturas Estticas usando MEM
97
5.1 O mtodo de verificao 97
5.1.1 A escolha do modelo 97
5.1.2 O processo de aprendizado 99
5.1.2.1 O nmero de estados do modelo 99
5.1.2.2 O algoritmo de aprendizado 100
5.1.2.3 O algoritmo de validao 101
5.1.2.4 A normalizao das probabilidades 102
5.1.2.5 A determinao dos parmetros para o ajuste dos
limiares de aceitao e rejeio
103
5.1.3 O processo de verificao 105
5.2 Comentrios fnais 106
6. Os Testes e a Anlise dos Erros 107
6.1 Os resultados experimentais 107
-
vii
6.1.1 O protocolo de avaliao 107
6.1.2 O resultado usando mltiplas resolues de grade de
segmentao e mltiplos lxico, para um nico MEM
108
6.1.3 A anlise qualitativa das primitivas isoladas 110
6.1.4 Os resultados usando primitivas isoladas com uma segunda
base dados e a presena de falsificaes simples e servis
111
6.1.5 As restries quanto ao nmero de primitivas usadas no MEM
multi-dimensional
112
6.1.6 Os resultados usando primitivas combinadas em um MEM
multi-dimensional
113
6.1.7 O ajuste dos limiares de aceitao e rejeio atravs dos
valores de
114
6.1.8 Os problemas decorrentes do processo de coleta da base de
dados
115
6.2 Consideraes finais 116
7. Concluses e Trabalhos Futuros 117
7.1 Concluses 117
7.2 Sugestes para trabalhos futuros 118
Anexo Normativas do Banco Central para Cheques 120
Referncias Bibliogrficas 127
-
viii
Lista de Tabelas
Tabela 3.1 Descrio das bases de dados de assinaturas usadas para avaliar o
desempenho dos mtodos de verificao automtica de assinaturas
estticas.
29
Tabela 3.2 Avaliao estatstica da ocupao do espao grfico e da variao
de escala da assinatura.
42
Tabela 3.3 Caractersticas combinadas da grafologia e da grafoscopia. 49
Tabela 3.4 Relao de caractersticas associadas s classes de primitivas
esttica e pseudo-dinmicas.
50
Tabela 4.1 Segmentao com mltiplas resolues. 83
Tabela 6.1 Resultados obtidos pelo mtodo de verificao, para as
falsificaes aleatrias, usando a densidade de pixels como
primitiva e a base de dados com 40 autores.
109
Tabela 6.2 Analise qualitativa das primitivas isoladas. 110
Tabela 6.3 Resultados obtidos usando o segundo subconjunto de autores e com
o uso de falsificaes simples e servis.
111
Tabela 6.4 Resultados obtidos usando as mesmas primitivas em um MEM
multi-dimensional.
113
Tabela 6.5 Resultados obtidos usando os valores mdios de . 115
-
ix
Lista de Figuras
Fig. 1.1 Variabilidades de estilos de assinaturas. 3
Fig. 2.1 (a) Exemplo de assinatura latina e (b) japonesa. 8
Fig. 2.2 (a) Exemplo de uma assinatura cursiva e (b) Exemplo de uma rubrica. 8
Fig. 2.3 (a) Exemplo de assinatura genuna. (b) Exemplo de falsificao
aleatria (assinatura original de outro autor). (c) Exemplo de
falsificao simples. (d) Exemplo de falsificao servil.
9
Fig. 2.4 Diagrama de funcionamento do mtodo de verificao automtica. 11
Fig. 2.5 Diagrama hierrquico de classificao dos mtodo de verificao
automtica de assinaturas estticas.
12
Fig. 2.6 Diagrama esquemtico dos modelos Estticos e Pseudo-dinmicos. 12
Fig. 2.7 Imagem do canto superior esquerdo desfocada com +2, +4, +8, +16
e +32 pixels respectivamente. Adaptada de [BRUYNE & FORR,
1988].
13
Fig. 2.8 (a) Assinatura genuna e (b) Falsificao simples. 13
Fig. 2.9 (a) Exemplo de assinatura; (b) O envelope superior; c) O envelope
inferior. Adaptada de [CHAUDHURY & BAJAJ, 1997].
14
Fig. 2.10 Pontos e linhas crticas em uma assinatura, para a extrao de
caractersticas. Adaptada de [CHUANG, 1977].
15
Fig. 2.11 Imagem de uma assinatura segmentada pelo processo de segmentao
proposto por Rosenfeld. Adaptado de [ROSENFELD et al., 1997].
16
Fig. 2.12 (a) Imagem binria de uma rubrica; (b) Ncleo da imagem binria. 16
Fig. 2.13 Modelo de clula usado por Sabourin e Genest. (a) Modelo detalhado
dos sensores. (b) Modelo do grid. Adaptado de [SABOURIN &
GENEST, 1994].
17
Fig. 2.14 Modelo de clula usada por Rigoll e Kosmala. Adaptado de [RIGOLL
& KOSMALA, 1998].
17
Fig. 2.15 (a) Ncleo da assinatura; (b) Contorno da assinatura; (c) Distribuio
dos pixels; (d) Ajuste fino da assinatura; (e) Regio de alta presso.
18
Fig. 3.1 (a) Exemplo de assinatura que ocupa a rea de assinatura sem 26
-
x
extrapolar. (b) Exemplo de assinatura que extrapola a rea destinada
assinatura. A perda encontra-se na parte superior e inferior da
assinatura, incluindo os laos maiores.
Fig. 3.2 Tipos de assinaturas da base de dados: (a) assinatura genuna; (b)
falsificao aleatria; (c) falsificao simples; (d) falsificao servil.
30
Fig. 3.3 Modelo do gabarito usado para a coleta das assinaturas. 31
Fig. 3.4 Elementos tcnicos genticos. Adaptado de [GOMIDE & GOMIDE,
1995].
33
Fig. 3.5 Elementos tcnicos genricos. Adaptado de [GOMIDE & GOMIDE,
1995].
34
Fig. 3.6 Exemplo de alguns dos elementos bsicos da grafia. Zona inicial; (2)
Zona final; (3) Haste; (4) Laada; (5) Bucle da haste; (6) Bucle da
laada; (7) bucle em forma de lao; (A) Zona superior; (B) Zona
mdia; (C) Zona inferior. Adaptado de [VELS, 1961].
37
Fig. 3.7 Exemplo das diferenas entre as partes de um elemento grfico: (A)
Partes essenciais; (B) Partes secundrias. Adaptado de [VELS, 1961].
38
Fig. 3.8 Exemplos de assinaturas segundo a simbologia do espao grfico. (a)
Diagrama representativo do espao grfico; (b) Escritor introvertido;
(c) Escritor extrovertido; (d) Escritor espiritualista; (e) Escritor
materialista e introvertido.
39
Fig. 3.9 Modelo do formulrio usado para a coleta das assinaturas para anlise
da ocupao do espao.
40
Fig. 3.10 Modelo do formulrio de coleta de assinatura e a representao das
sees.
41
Fig. 3.11 Exemplos de assinaturas do formulrio: (a) Exemplo do uso da seo
d; (b) Exemplo do uso da seo e; (c) Exemplo do uso da seo a; (d)
Exemplo do uso da seo b; (e) Exemplo do uso da seo c.
43
Fig. 3.12 Exemplos de assinaturas sob o ponto de vista da ordem: (a)
Assinatura clara; (b) Assinatura confusa; (c) Assinatura concentrada;
(d) Assinatura espaada.
44
Fig. 3.13 Exemplos de assinaturas sob o ponto de vista da proporcionalidade:
(a) Assinatura proporcional; (b) Assinatura desproporcional; (c)
44
-
xi
Assinatura mista.
Fig. 3.14 Exemplos de assinaturas sob o ponto de vista da dimenso: (a)
Assinatura alta; (b) Assinatura baixa.
45
Fig. 3.15 Exemplos de assinaturas sob o ponto de vista da presso do trao: (a)
Assinatura tensa; (b) Assinatura frouxa.
45
Fig. 3.16 Exemplos de assinaturas sob o ponto de vista da forma: (a) Assinatura
caligrfica; (b) Assinatura arredondada; (c) Assinatura reta vertical;
(d) Assinatura reta horizontal.
46
Fig. 3.17 Exemplos de assinaturas sob o ponto de vista dos gestos
caractersticos: (a) Gancho; (b) Clava, espiral e inflada; (c) Golpe de
sabre; (d) Bucle; (e) Tringulo e lao; (f) Guirlanda; (g) Serpentina;
(h) Arco.
47
Fig. 3.18 Diagrama resumo das abordagens do grafismo e suas principais
caractersticas.
48
Fig. 3.19 Exemplos de modelos discretos de MEM: a) Um exemplo de modelo
ergtico; b)Um exemplo de um modelo esquerda-direita. Adaptado de
[RABINER & JUANG, 1993].
55
Fig. 3.20 Seqncia de operaes requeridas para processamento da varivel
forward t(i). Adaptado de [RABINER & JUANG, 1993].
55
Fig. 3.21 Seqncia de operaes requeridas para processamento da varivel
backward t(i) . Adaptado de [RABINER & JUANG, 1993].
59
Fig. 3.22 Particionamento de um espao bidimensional (N = 2) em L = 18
clulas. Todos os vetores de entrada Ci devem ser quantificados no
vetor de cdigo yi. Adaptado de [RABINER & JUANG, 1993].
69
Fig. 3.23 A representao de um agrupamento de trs classes no espao
bidimensional.
73
Fig. 3.24 Diagrama representativo do sistema de QV usando o mesmo modelo
para todos os escritor.
75
Fig. 4.1 Imagem de um cheque bancrio brasileiro e a delimitao da rea
destinada assinatura.
76
Fig. 4.2 (a) Imagem de uma assinatura em nveis de cinza; (b) Imagem binria;
(c) Ncleo da assinatura.
78
-
xii
Fig. 4.3 (a) Grade usada por Rigoll e Kosmala; (b) Grade usada por Sabourin e
Genest. Adaptado de [RIGOLL & KOSMALA, 1998] e [SABOURIN
& GENEST, 1994].
79
Fig. 4.4 Exemplos da sobreposio das imagens afinadas dos vinte espcimes
da base de aprendizado.
80
Fig. 4.5 Exemplo dos modelos de grade quadrada: (a) Grade com resoluo de
40 pixels; (b) Grade com resoluo de 20 pixels; (c)Grade com
resoluo de 16 pixels; (d) Grade com resoluo de 10 pixels.
81
Fig. 4.6 (a) Segmentao usada pelo Grafismo; (c) Exemplo de uma
segmentao com 4 zonas de tamanho fixo.
82
Fig. 4.7 (a) e (b) Seqncias de observaes, usando clulas quadradas;(c) e
(d) Seqncias de Observaes, usando clulas retangulares.
84
Fig. 4.8 (a) Baixa resoluo com 4 clulas verticais; (b) Mdia resoluo
com 10 clulas verticais; (c) Alta resoluo com 25 clulas verticais.
85
Fig. 4.9 Calibre (Caractersticas do grafismo): (a) Assinatura alta; (b)
Assinatura baixa.
85
Fig. 4.10 Exemplo da incorporao da proporo: (a) Assinatura proporcional;
(b) Assinatura desproporcional; (c) Assinatura mista.
86
Fig. 4.11 Exemplo da incorporao do espaamento: (a) Assinatura com vrios
espaos entre blocos; (b) Assinatura sem espaos.
87
Fig. 4.12 Exemplos da variao do comportamento base. 87
Fig. 4.13 Imagem binria de uma assinatura e a correspondente tabela de
densidade de pixels.
89
Fig. 4.14 Exemplo do uso do ESC . Adaptado de [SABOURIN & GENEST,
1994].
89
Fig. 4.15 Exemplo do uso dos sensores na determinao da distribuio de
pixels.
90
Fig. 4.16 Exemplo da caracterstica inclinao axial. 91
Fig. 4.17 Conjunto de elementos estruturantes que representam os tipos de
inclinao axial das clulas.
92
Fig. 4.18 Ncleo da imagem de uma assinatura e a correspondente tabela de
inclinao axial.
92
-
xiii
Fig. 4.19 Vetor de caractersticas usado pela primitiva forma. 93
Fig. 4.20 Exemplo da primitiva progresso. (a) Clculo da dinmica do traado;
(b) Extrao do segmento mais significativo.
94
Fig. 4.21 Representao do conjunto de primitivas como um conjunto de
vetores.
95
Fig. 4.22 (a) Representa a densidade de pixels para um lxico igual a 100; (b)
Representa a inclinao axial para um lxico igual a 60.
96
Fig. 5.1 Modelo de MEM para palavras. Adaptado de [YACOUBI, 1996]. 98
Fig. 5.2 (a) Modelo esquerda-direita; (b) Exemplo da representao do modelo. 98
Fig. 5.3 Grfico indicador da variao do nmero de estados para cada modelo
de assinatura.
99
Fig. 5.4 Grfico que representa o nmero de observaes dos 20 espcimes de
cada autor (40 autores) usados no processo de aprendizado.
100
Fig. 5.5 Grfico tpico para as curvas de aprendizado e validao. 102
Fig. 5.6 Exemplo do processo de normalizao para os 20 espcimes de
aprendizado de um mesmo autor.
103
Fig. 5.7 Ponto de determinao dos melhores valores de .. 104
Fig. 5.8 Representao dos limiares de aceitao e rejeio de uma assinatura. 105
Fig. 6.1 Sobreposio, usando o centro de gravidade, dos 20 espcimes de
aprendizado de um mesmo escritor: (a) Exemplo de assinatura com
alta variabilidade intrapessoal. (b) Exemplo de assinatura com baixa
variabilidade intrapessoal.
112
Fig. 6.2 (a) Assinatura genuna e (b) Falsificao simples. 114
Fig. 6.3 Grfico que demonstra o comportamento da taxa de erro mdio,
durante a determinao dos parmetros auxiliares .
115
-
xiv
Lista de Abreviaturas e Siglas
ARD - Anlise e Reconhecimento de Documentos
BMP - Arquivo no formato bit map
CD-ROM - Compact Disk read only
dpi - dot per inch
HMM - Hidden Markov Model
LARDOC - Laboratrio de Anlise e Reconhecimento de Documentos
LBG - Linde, Buzo and Gray algorithm
MEM - Modelos Escondidos de Markov
PUCPR - Pontifcia Universidade Catlica do Paran
QV - Quantizao Vetorial
VQ - Vector Quantization
-
xv
Lista de Smbolos
P( . | . ), p - probabilidade condicional
A, P[ ] - matriz de transies da cadeia de Markov
t - intervalo de tempo
Pt[ ] - matriz de transies da cadeia de Markov no instante t
b( ) - distribuio da probabilidade de observao
n, S - estados do modelo de Markov
N - nmero mximo de estados do modelo de Markov
k - smbolo observvel
x - vetor de smbolos
Q - conjunto de estados do modelo
T - comprimento da seqncia de observaes
V - conjunto de smbolos observveis
M - nmero mximo de smbolos observveis em um alfabeto
B - matriz de probabilidades de observaes de smbolos
- matriz de densidades e probabilidades iniciais
= {A,B,} - conjunto necessrio e suficiente na definio do modelo de
Markov
O - seqncia de observaes
- varivel forward
- varivel backward
- probabilidade a priori
-
xvi
argmax( ) - funo que retorna o ndice relacionado ao argumento de
mxima probabilidade na seqncia de estados
- as mais altas probabilidades ao longo de um caminho simples
em uma seqncia
- vetor que contm o caminho de mxima probabilidade
- probabilidade condicional inicial
x, y - vetores multi-dimensionais
q( ) - operador de quantizao
Ci - centride da classe
d - medida da distoro
d2 - erro mdio quadrtico
W - funo de peso
D - distncia Euclidiana
J - mnimo erro quadrtico
t - taxa de erro total
Log P - logaritmo da probabilidade
x , Em - mdia aritmtica
pt, ptn - probabilidade de aprendizado e probabilidade de aprendizado
normalizada, respectivamente
pi, ps - probabilidade mxima do limiar de aceitao e probabilidade
mnima do limiar de aceitao, respectivamente
pv, pvn - probabilidade de verificao e probabilidade de verificao
normalizada, respectivamente
i, j e k - valores inteiros
-
xvii
- mdia simples de uma classe
-
xviii
Resumo
O problema em verificao automtica de assinaturas , em teoria, um processo
de reconhecimento de padres usado para discriminar as classes de assinaturas originais
e as falsas. Apesar dos muitos esforos para desenvolver novas tcnicas de verificao
de assinaturas estticas, a influncia dos vrios tipos de falsificaes ainda no foram
extensamente estudados sob a luz do grafismo.
Esse trabalho apresenta uma contribuio aos estudos j realizados em
verificao de assinaturas estticas, considerando os diferentes tipos de falsificaes,
aliada s tcnicas de modelagem Markovianas (usando Modelos Escondidos de Markov
MEM). Os experimentos mostram que as taxas de erro, para as falsificaes aleatrias
e simples, ficam bem prximas. Isso demostra a sua aplicabilidade real em cheques
bancrios brasileiros, onde a falsificao simples representa o principal tipo de fraude
envolvendo os cheques. Em adio a isso, os experimentos mostraram tambm
resultados promissores na verificao de falsificaes servis.
-
xix
Abstract
The problem of signature verification is in theory a pattern recognition task used
to discriminate two classes, original and forgery signatures. Even after many efforts in
order to develop new verification techniques for static signature verification, the
influence of the forgery types, using graphisms techniques, has not been extensively
studied.
This work reports the contribution to static signature verification, considering
different forgery types in an Hidden Markov Model - HMM framework. The experiments
have shown that the error rates of the simple and random forgery signatures are very
closed. This reflects the real applications in which the simple forgeries represent the
principal fraudulent case. In addition, the experiments show promising results in skilled
forgery verification by using a graphisms features subset.
-
Captulo 1 - Introduo
No domnio da Informtica Aplicada e especificamente na Anlise e
Reconhecimento de Documentos (ARD), a soluo de problemas complexos exige uma
grande quantidade de conhecimento e tambm alguns mecanismos para a manipulao
desse conhecimento, a fim de criar solues para os mesmos. Para definir precisamente
um problema necessrio incluir especificaes precisas sobre qual ser a situao ou
situaes iniciais e tambm sobre quais situaes finais sero consideradas solues
aceitveis. Existe tambm a necessidade de uma anlise detalhada do problema, pois
umas poucas caractersticas importantes podem ter enorme impacto sobre as vrias
tcnicas possveis para a soluo do mesmo.
A identificao e representao do conhecimento necessrio para solucionar o
problema, juntamente com a escolha das melhores tcnicas de soluo, formam o
conjunto de atribuies necessrias para a sua soluo em ARD.
A anlise grafotcnica tradicional de documentos manuscritos encaixa-se
perfeitamente no contexto dos problemas abordados pela ARD, pois envolvem
processos difceis de serem tratados, devido diversidade de critrios e subjetividades
empregadas pelos especialistas.
A despeito dos argumentos anteriores, as primeiras tentativas para
automatizao desse processo ficaram sujeitas inmeras dificuldades. Alm da
complexidade do problema j descrito, os pesquisadores encontraram limitaes
oriundas da indisponibilidade de recursos computacionais suficientes para realizao de
sistemas concretos e em tempo real. Os recentes progressos obtidos pelos sistemas
computacionais tornaram possvel a soluo desses problemas, pelo menos
parcialmente.
-
2
1.1 Histrico geral
Apresenta-se a seguir um breve resumo das principais referncias bibliogrficas
analisadas, sobre aplicaes do mtodo de verificao automtica de assinaturas, o
grafismo e os modelos escondidos de Markov.
Alguns dos principais trabalhos que abordam a verificao automtica de
assinaturas foram apresentados por: Chuang em [CHUANG, 1977], Ammar em
[AMMAR et al., 1988], Plamondon [PLAMNONDON & LORETTE, 1988] e Sabourin
em [SABOURIN & GENEST, 1994].
As primeiras publicaes sobre o grasfismo datam de 1622. No entanto, as mais
recentes foram apresentadas por: Vel em [VELS, 1961], Minicucci em [MINICUCCI,
1991] e Tito [GOMIDE & GOMIDE, 1995].
Existem inmeras bibliografias sobre os modelos escondidos de Markov. No
entanto, as que tiveram relevncia para esse trabalho foram: Rabiner em [RABINER &
JUANG, 1993], Elms em [ELMS, 1996], El Yacoubi em YACOUBI, 1996], Yang
[YANG et al., 1997] e Rigoll em [RIGOLL & KOSMALA, 1998].
1.2 O objetivo
O objetivo desse trabalho a apresentao de uma modelagem grafotcnica de
assinaturas manuscritas e sua respectiva anlise, fundamentada em processos
estocsticos, em razo do uso dos Modelos Escondidos de Markov (MEM). O ponto de
partida desse estudo norteia-se numa aplicao real: a verificao de assinaturas
manuscritas em cheques bancrios brasileiros.
-
3
1.3 O desafio
A verificao de assinaturas manuscritas aborda diferentes fontes de
conhecimento. Cada uma dessas fontes proporciona um conjunto complexo de
problemas de difcil soluo: do pr-tratamento da imagem, passando pela segmentao
e extrao de caractersticas, seguida pela gerao do modelo de referncia e culminado
com o processo de verificao, cada fase impe um estudo detalhado do problema e o
desenvolvimento de solues adequadas.
Fig. 1.1 Variabilidades de estilos de assinaturas.
1.4 A motivao
A despeito da automatizao de inmeros processos envolvendo transaes
bancrias ou mesmo comerciais, quer seja nos cheques bancrios ou em contratos em
geral, a assinatura manuscrita continua ainda sendo o meio legal usado para firmar
essas transaes.
Existem no mercado, sistemas de verificao de assinaturas automticos e semi-
automticos como o sistema Sival1 e SignPlus2. No entanto, ainda apresentam restries
relevantes como, por exemplo, o no tratamento dos diferentes tipos de falsificaes.
Isso faz com que a verificao de assinaturas ainda seja um problema em aberto.
1 SIVAL: Signature Image Validation, IBM, http://www.ibm.de/go/ide/solutions/bfs/sival.ttml, 1997.2 SignPus Signature Verification System, SoftPro GmbH, http://www.softpro.de, 1997.
-
4
1.5 A proposta
Dentro do domnio do problema existem algumas metas a serem atingidas, que
no impe restries sobre a forma e o tipo da escrita da assinatura latina, e que
confrontam com todos os fatores que originam a complexidade do processo de
verificao. Essas metas so:
Usar como base de dados de laboratrio, onde as assinaturas coletadas
obedeceram aos mesmos critrios de preenchimento de um cheque bancrio real,
com exceo da excluso do plano de fundo do cheque, da linha de base e de
quaisquer outras informaes que no pertencessem ao contexto. As assinaturas
estticas sero adquiridas atravs de um digitalizador;
Estar adaptada s assinaturas cujo alfabeto e a forma da escrita sejam latinas;
Permitir todos os estilos de assinaturas latinas possveis: cursiva e rubrica;
Ser sensvel aos trs tipos bsicos de falsificaes encontradas em cheques
bancrios brasileiros;
Ser tolerante s variaes intrapessoais e intolerante s variaes interpessoais.
1.6 As contribuies
A principal contribuio desse trabalho apresentar uma nova proposta de
modelagem no contextual de assinaturas (no existe a interpretao de texto), baseada
nos princpios do grafismo, usando caractersticas estticas e pseudo-dinmicas.
Outra contribuio importante encontra-se na definio a priori dos parmetros
de ajuste dos limiares de aceitao e rejeio de cada modelo de assinatura.
A base de dados de assinaturas criada para esse trabalho tambm uma
importante contribuio para os trabalhos futuros.
-
5
1.7 A organizao
Esse trabalho divide-se em sete Captulos. O primeiro contm essa breve
introduo. No segundo Captulo so tratados as generalidades sobre o domnio da
verificao automtica de assinaturas manuscritas e sua partes componentes. O terceiro
Captulo contm a contextualizao do problema envolvendo a verificao de
assinaturas em cheques bancrios brasileiros. Apresenta um estudo detalhado do
grafismo e os preceitos da anlise pericial grafotcnica. Apresenta tambm a descrio
dos princpios da codificao simblica usando a Quantizao Vetorial (QV) e a
modelagem Markoviana. O quarto Captulo apresenta o pr-tratamento das assinaturas
de laboratrio, a estratgia de segmentao e extrao de primitivas adotado. Por fim,
apresenta o mtodo de verificao automtica de assinaturas estticas, usando os
modelos escondidos de Markov (MEM). O sexto Captulo apresenta o protocolo de
testes, os resultados e a anlise dos erros. No stimo Captulo, so apresentados os
comentrios finais e propostas para trabalhos futuros.
-
Captulo 2 Fundamentao Terica em Verificao
Automtica de Assinaturas Manuscritas: Vantagens e
Limitaes
Este Captulo contm as caractersticas principais relacionadas s assinaturas.
Ele descreve as diferentes abordagens usadas na verificao automtica das mesmas.
So apresentadas as anlises e discusses de suas partes componentes, suas vantagens e
desvantagens.
2.1 A assinatura manuscrita e os fatores de complexidade
A escolha de um mtodo para a verificao de assinaturas manuscritas
motivada pela apresentao de vantagens e desvantagens, e tambm pela aplicao a ser
considerada. Tais parmetros influenciam de forma decisiva sobre a eficincia do
mtodo utilizado para a soluo do problema. Pode-se encontrar na literatura diversos
mtodos diferentes para o processo de verificao de assinaturas [AMMAR et al.,
1988], [BROCKLEHURST, 1985], [BRUYNE & FORR, 1988], [CARDOT et al.,
1992] [FUNG et al., 1996], [PLAMONDON et al., 1990], [RANDOLPH &
KRISHNAN ,1990] e [SABOURIN & GENEST, 1994]. De maneira geral, todos
buscam fatores que agregam melhorias em busca de uma soluo que satisfaa s
necessidades e restries de uma aplicao em particular.
2.1.1 Os fatores ligados autoria
Apesar de seguir uma certa estabilidade, a escrita no um processo preciso.
Somente em algumas caractersticas duas assinaturas do mesmo autor so idnticas. De
fato, grandes diferenas podem ser observadas em assinaturas de acordo com o pas,
-
7
idade, tempo, hbitos, estado psicolgico ou mental e condies fsicas. No entanto,
dois tipos de variaes so claramente identificveis:
As intraclasses ou intrapessoais, que so variaes observadas dentro de uma
mesma classe, entre espcimes de assinaturas genunas de um mesmo autor;
As interclasses ou interpessoais, que so diferenas que existem entre classes
de autores distintos.
Em teoria, uma variao intraclasse deve ser a mnima possvel e uma variao
interclasses deve ser a mxima possvel. Na prtica, as classes no so bem separadas.
Um espcime aceito pode ser um dos seguintes:
Autntica, se escrita pelo mesmo autor do modelo e se possuir uma
similaridade boa com o modelo de referncia;
Imitao, se escrita por algum escritor que no o autor e se possuir
similaridades com o modelo de referncia.
Igualmente, um espcime rejeitado pode ser um dos seguintes:
Degenerada, se escrita pelo mesmo autor do modelo e se no similar
assinatura de referncia. O termo disfarada freqentemente usado quando
a degenerao voluntria;
Falsa, se escrita por algum escritor que no o autor do modelo de
referncia.
2.1.2 Os fatores ligados s diferenas regionais
A verificao de assinaturas manuscritas est relacionado diretamente com o
alfabeto e a forma de escrita de uma determinada regio, como mostram os exemplos de
assinaturas latina e japonesa na Fig. 2.1.
-
8
Fig. 2.1 (a) Exemplo de assinatura latina e (b) japonesa.
Para as assinaturas latinas podem ser determinados dois tipos bsicos de estilos.
A assinatura cursiva, derivada do texto manuscrito ou chamada contextual, onde o autor
assina escrevendo o prprio nome. A rubrica, formada por um desenho estilizado feito
pelo autor, chamada de no contextual. Nesse ltimo caso, o desenho pode ou no
conter caractersticas de um texto, por exemplo as iniciais do nome do autor, mas isso
no uma regra. Confira na Fig. 2.2.
Fig. 2.2 (a) Exemplo de uma assinatura cursiva e (b) Exemplo de uma rubrica.
2.1.3 Os fatores ligados s falsificaes
A verificao de assinaturas manuscritas deve garantir a veracidade da amostra
em teste, quando confrontada com um modelo. A identificao de uma falsificao
portanto vista, em reconhecimento de padres, como um problema entre classes de
aceitao e rejeio. Na prtica, a identificao de uma falsificao depende das
condies de teste e do meio. Elas podem ser classificadas em:
Falsificaes aleatrias so aquelas onde o falsificador reproduz a assinatura
original sem conhece-la. Isto , a falsificao feita sem que o falsificador
conhea a assinatura original. Na maioria das vezes, a assinatura forjada no
possui semelhana com a original, conforme mostra a Fig. 2.3;
-
9
Falsificaes simples so aquelas onde o falsificador escreve o nome do
autor, sem incluir as caractersticas de sua grafia. A assinatura forjada pode
ou no ser semelhante assinatura original;
Falsificaes servis so aquelas onde o falsificador copia a assinatura
verdadeira usado um modelo como referncia.
(a) (b)
(c) (d)
Fig. 2.3 (a) Exemplo de assinatura genuna. (b) Exemplo de falsificao aleatria
(assinatura original de outro autor). (c) Exemplo de falsificao simples. (d) Exemplo de
falsificao servil.
2.2 Os mtodos dinmicos e os mtodos estticos de verificao automtica de
assinaturas
A principal diferena existente entre os mtodos automticos de verificao de
assinaturas encontra-se no mecanismo de aquisio dos dados. Se o sinal que descreve o
estilo da escrita obtido ao mesmo tempo em que a escrita executada, o mtodo dito
dinmico ou on-line. Se por outro lado, as informaes foram previamente colocadas
em uma folha de papel para o processamento posterior, o mtodo dito esttico ou off-
line.
Os mtodos dinmicos utilizam uma pequena mesa eletrnica que captura os
dados no momento em que a escrita executada. J nos mtodos estticos, os dados
esto armazenados em uma folha de papel, que so posteriormente transformados em
-
10
uma imagem composta por um conjunto de pixels, obtido atravs de uma cmera ou
digitalizador.
Tanto nos mtodos dinmicos como nos estticos, os dispositivos devem possuir
recursos que permitam a aquisio dos dados, numa preciso capaz de captar as
informaes relevantes. Para os digitalizadores, as resolues das imagens variam de
100 a 300 pontos por polegada (dpi).
A vantagem dos mtodos dinmico encontra-se na capacidade de obter as
caractersticas dinmicas de um assinante com mais preciso. Tais caractersticas podem
ser a velocidade do traado, presso da caneta, entre outras. Outra vantagem permitir a
adaptao do escritor ao novo equipamento de captura dos dados e no o oposto. A
grande desvantagem a falta de flexibilidade gerada por estes mtodos, pois a sua
temporalidade no permite variaes suplementares de informaes que podem ser
obtidas em uma imagem. O maior dos inconvenientes a necessidade de usar-se um
equipamento especial, que em uma situao real, como no caso dos cheques, torna-se
invivel.
Apesar de dificultar a aquisio de caractersticas dinmicas, os mtodos
estticos possuem a capacidade de obter dados mais permanentes, que podem viabilizar
o processo de suplementao das caractersticas usadas. Isso o torna mais flexvel. Uma
outra dificuldade a necessidade de usar-se um processo de pr-tratamento da imagem,
o que eleva o custo computacional.
Os mtodos estticos podem ser compostos por duas classes de caractersticas
extradas da imagem. A primeira chamada de esttica, porque possui a capacidade de
representar as caractersticas relacionadas com a forma, por exemplo o comprimento e a
altura mxima de uma assinatura. A segunda chamada de pseudo-dinmica, porque
possui a capacidade de representar as caractersticas relativas dinmica da escrita,
como por exemplo curvatura, inclinao e tenso do traado.
-
11
2.3 A classificao dos mtodos automticos de verificao esttica
No diagrama da Fig. 2.4 so apresentadas as partes componentes de um mtodo
genrico de verificao automtica de assinaturas estticas. Nos itens seguintes sero
apresentadas as principais abordagens adotadas pela literatura para cada parte.
Fig. 2.4 Diagrama de funcionamento do mtodo de verificao automtica.
2.3.1 O pr-tratamento
O pr-tratamento da imagem de uma assinatura est ligado a dois fatores
principais. O primeiro diz respeito s caractersticas do dispositivo de aquisio, como a
resoluo, contraste, luminosidade, presena ou ausncia cor, entre outras. O segundo
est diretamente ligado ao documento, como desgastes do papel, dobraduras,
complexidade do plano de fundo (cheques bancrios), entre outras. Alm desses fatores,
encontram-se outros decorrentes do processo de digitalizao, como rudos e falhas na
imagem.
No caso especfico dos cheques bancrios existe ainda o problema da separao
da assinatura do restante dos dados manuscritos, decorrente da eventual sobreposio da
data e do extenso.
Como o pr-tratamento do cheque no parte integrante do escopo desse
trabalho, somente no Captulo 4 sero abordadas as ferramentas de pr-tratamento
adotadas para a base de dados de assinaturas de laboratrio.
-
12
2.3.2 A segmentao e a extrao de primitivas
Existem basicamente dois enfoques na classificao dos mtodos de extrao de
primitivas. O enfoque depende do critrio escolhido para efetuar a classificao. A
escolha de um mtodo motivado pela apresentao de vantagens e desvantagens e,
tambm, em funo da aplicao a ser considerada. Tais parmetros influenciam de
forma decisiva sobre a eficincia do mtodo utilizado para a soluo do problema. As
Fig. 2.5 e 2.6 apresentam os diagramas hierrquicos que buscam classificar, de forma
estrutural, os mtodos de extrao.
Fig. 2.5 Diagrama hierrquico de classificao dos mtodo de verificao automtica
de assinaturas estticas.
Fig. 2.6 Diagrama esquemtico dos modelos Estticos e Pseudo-dinmicos.
-
13
2.3.2.1 Os mtodos globais
Os mtodos globais usam caractersticas gerais das assinaturas, como por
exemplo a altura e a largura. Possuem a vantagem de serem mais insensveis s
variaes intrapessoais. Contudo, no so capazes de distinguir detalhes pertinentes ao
formato do traado da escrita, impedindo o registro de informaes relevantes,
fundamentais na distino de falsificaes servis.
Debruyne e Forr em [BRUYNE & FORR, 1988] descrevem o uso de um
modelo global, onde a imagem de referncia e a de teste so sobrepostas, com o
objetivo de obter a maior quantidade de pontos coincidentes, conforme mostrado na Fig.
2.7. A vantagem desse mtodo a velocidade. A desvantagem propiciar o aumento da
taxa de confuso entre assinaturas de diferentes autores e nas falsificaes, conforme
exemplo na Fig. 2.8.
Fig. 2.7 Imagem do canto superior esquerdo desfocada com +2, +4, +8, +16 e +32
pixels respectivamente. Adaptada de [BRUYNE & FORR, 1988].
(a) (b)
Fig. 2.8 (a) Assinatura genuna e (b) Falsificao simples.
Chaudhury e Bajaj em [CHAUDHURY & BAJAJ, 1997] apresentam um
modelo, onde as caractersticas global utilizadas so o envelopes superiores e inferiores
da assinatura.. A vantagem encontra-se no mapeamento dos segmentos ascendentes,
-
14
descendentes e laos. A desvantagem no incorporar aspectos dinmicos desses
elementos, conforme apresentado na Fig. 2.9.
Fig. 2.9 (a) Exemplo de assinatura; (b) O envelope superior.; c) O envelope inferior.
Adaptada de [CHAUDHURY & BAJAJ, 1997].
Hunt e Qi em [HUNT & OI, 1995] apresentam um modelo onde as
caractersticas globais utilizadas so a altura da assinatura, o comprimento e o
comprimento, com os espaos em branco na direo horizontal retirados. A vantagem
permitir o mapeamento do calibre da assinatura e do dimensionamento dos
espaamentos entre os blocos da mesma. Possui a desvantagem de sozinhas no
modelarem espcimes de assinaturas similares, como as mostradas na Fig. 2.8.
Com exceo do modelo apresentado por Debruyne e Forr, todos os demais
apresentados anteriormente, fazem parte de um conjunto de caractersticas globais,
associadas a outras caractersticas locais, que juntas contribuem para a soluo do
problema.
2.3.2.2 Os mtodos locais
Os mtodos locais usam caractersticas que descrevem as particularidades do
traado. Possuem a vantagem de serem mais eficientes na identificao dos tipos
bsicos de falsificaes. No entanto, dependem fundamentalmente de um processo de
segmentao e das caractersticas usadas.
Em verificao automtica de assinatura estticas, a unidade bsica relacionada
com a assinatura o segmento. Diferentemente do texto manuscrito, a assinatura latina
-
15
no pode ser segmentada em letras. Ela apresenta variaes de estilo e, portanto, podem
possuir formas totalmente diferentes do nome do autor, como nas rubricas.
Chuang em [CHUANG, 1977] apresenta a segmentao da assinatura usando a
anlise local e contextual, baseada na grafometria. Em primeiro lugar, a assinatura
dividida em trs zonas, a mdia, a alta e a baixa, equivalente tcnica usada pelos
grafologistas, confira na Fig. 2.10. Em seguida, as seguintes caractersticas pseudo-
dinmicas so procuradas, a fluncia (contnua ou interrompida), a presso (pesada ou
suave) e velocidade (firme ou varivel). J as estticas so compreendidas pela margem
(normal ou estendida), alinhamento da linha (uniforme, flutuante, espaada ou
compacta), espao entre palavras (normal ou estendida), tamanho entre zonas
(proporcional ou desproporcional), legibilidade (boa ou m), conexes entre segmentos
(afilada, angular ou guirlanda), segmentos bsicos (linear ou cursivo), inclinao geral
(para a esquerda, para a direita, vertical ou flutuante), segmentos iniciais ou finais
(planos ou decorativo), barras dos ts (curta ou longa, alta ou baixa) e pingos dos is
(pequeno ou grande, alto ou baixo). A vantagem desse mtodo incorporar as
caractersticas pseudo-dinmicas, que pode atribuir ao processo robustez no trato das
falsificaes simples e servis. A desvantagem encontra-se no uso de uma segmentao
contextual, o que desfavorece o tratamento das rubricas.
Fig. 2.10 Pontos e linhas crticas em uma assinatura, para a extrao de caractersticas.
Adaptada de [CHUANG, 1977].
Rosenfeld em [ROSENFELD et al., 1997] apresenta a segmentao da
assinatura atravs dos pontos finais e de juno. Essa estratgia de segmentao permite
a anlise local dos segmentos da assinatura, como o comprimento, o centro de
-
16
gravidade, a taxa de curvatura, entre outras. Confira na Fig. 2.11. Numa assinatura
complexa, como a mostrada na Fig. 2.12, esse processo pode gerar um nmero relevante
de segmentos, que no carregam consigo caractersticas importantes para o processo de
verificao.
Fig. 2.11 Imagem de uma assinatura segmentada pelo processo de segmentao
proposto por Rosenfeld. Adaptado de [ROSENFELD et al., 1997].
(a) (b)
Fig. 2.12 (a) Imagem binria de uma rubrica; (b) Ncleo da imagem binria.
Sabourin e Genest em [SABOURIN & GENEST, 1994] apresentam um mtodo
de segmentao em clulas, para a extrao de caractersticas locais. Elas so
representadas pelas projees dos segmentos dos traos sobre os sensores localizados
nas quatro faces da clula e nas diagonais. O nmero de pixels de cada projeo
posteriormente normalizado pelo tamanho da face. Confira na Fig. 2.13. Com essa
caracterstica possvel mapear a distribuio geomtrica dos pixels na clula. No
entanto, no incorpora caractersticas pseudo-dinmicas, como por exemplo o grau de
curvatura do segmento.
-
17
(a)
(b)
Fig. 2.13 Modelo de clula usado por Sabourin e Genest. (a) Modelo detalhado dos
sensores. (b) Modelo do grid. Adaptado de [SABOURIN & GENEST, 1994].
Rigoll e Kosmala em [RIGOLL & KOSMALA, 1998] apresentam um mtodo
de segmentao em clulas, para a extrao de caractersticas locais. Nesse caso, usa-se
a contagem dos pixels pretos contidos em cada clula. Confira na Fig. 2.14. Essa
caracterstica possui a capacidade de incorporar um descritor estatstico em cada clula.
A vantagem a insensibilidade s variaes intrapessoais. No entanto, como no caso
anterior, no descreve adequadamente as caractersticas pseudo-dinmicas.
Fig. 2.14 Modelo de clula usada por Rigoll e Kosmala. Adaptado de [RIGOLL &
KOSMALA, 1998].
-
18
Huang e Yan em [HUANG & YAN, 1997] apresentam um modelo de
segmentao em clulas, para a extrao de caractersticas locais. As caractersticas so
obtidas do ncleo da assinatura, Fig. 2.15a, do contorno, Fig. 2.15b, da distribuio dos
pixels, Fig. 2.15c, do fator direcional de Fourier, Fig. 2.15d e da regio de mxima
presso, Fig. 2.15e.
Fig. 2.15 (a) Ncleo da assinatura; (b) Contorno da assinatura; (c) Distribuio dos
pixels; (d) Ajuste fino da assinatura; (e) Regio de alta presso.
As caratersticas estticas so formadas pela rea (calculada em (a) e (b)), regio
de alta presso (calculada em (e)), pelo nmero de partes constituintes (calculada em (c)
e (d)).
2.3.3 A produo do modelo e a comparao
A verificao de assinaturas consiste na extrao de uma forma desconhecida
(uma assinatura manuscrita), e o estabelecimento de uma regra de deciso. Essa regra de
deciso efetuada, geralmente, atravs da medida da verossimilhana da forma em
anlise (comparao), com um modelo de referncia devidamente armazenado em uma
base de conhecimento, que descreve uma representao anloga. O modelo de
referncia obtido numa fase anterior, chamada de aprendizado (produo do modelo).
-
19
A fase de aprendizado uma etapa muito importante do sistema de verificao.
Os modelos oriundos dessa fase possuem um conjunto rico de informaes que
permitem uma boa preciso do processo de verificao. Essas informaes possuem a
vantagem de possibilitar a eliminao de redundncias, que por sua vez propiciam a
reduo do tempo gasto no processo de deciso.
2.3.3.1 A classificao dos mtodos de verificao
Conforme foi dito anteriormente, a escolha do tipo de representao (os tipos de
primitivas) constitui uma etapa essencial na elaborao de um mtodo de verificao.
As dificuldades surgem principalmente da maneira com a qual so tratadas as entidades
naturais usadas para obter a descrio matemtica, induzidas por um mtodo terico
formal. Essa induo possui dois reflexos, sendo o primeiro o dimensionamento do
espao representativo do fenmeno, que deve possuir propriedades que facilitem o
processo de deciso. O segundo reflexo a obteno de um espao de representao que
permita uma implementao computacional. Os dois mtodos formais mais comuns so
os mtodos estatsticos e os mtodos estruturais.
2.3.3.1.1 Os mtodos estatsticos
Os mtodos estatsticos de reconhecimento de padres consistem em efetuar as
medies do espao mtrico atravs da estatstica [YACOUBI, 1996]. O aprendizado
executado atravs da separao de um conjunto de amostras em classes obedecendo a
um conjunto de caractersticas comuns. So especialmente importantes nos sistemas
cujas classes possuem uma elevada instabilidade entre os vrios espcimes. A
modelagem estatstica se beneficia dos processos automtico. Os mtodos principais so
os chamados paramtricos e os no paramtricos.
2.3.3.1.1.1 Os mtodos paramtricos
Mtodos estatsticos paramtricos trabalham com hipteses de que as classes em
questo possuem uma distribuio de probabilidade com comportamento determinado.
O mtodo supe o conhecimento prvio das leis que regem a probabilidade das classes
-
20
envolvidas e que seus parmetros de estimao possuem normalmente um
comportamento gaussiano. Esses mtodos exigem uma base de dados de aprendizado
para uma correta estimao dos parmetros.
Os modelo escondidos de Markov
Os Modelos Escondidos de Markov (MEM) [RABINER & JUANG, 1993]
possuem vrias propriedades teis para o reconhecimento de padres. Algumas dessas
propriedades so descritas a seguir:
O MEM apresenta uma representao complementar nos seus dois conjuntos de
parmetros. A probabilidade de observao de smbolos, que representa os
fenmenos morfolgicos e que possuem a capacidade de aproximar todas as
funes de densidade e probabilidade arbitrrias. J a probabilidade de transio,
representa a interao temporal entre os componentes interligados de uma
forma. A otimizao conjunta desse dois grupos de parmetros faz com que o
MEM sejam particularmente adaptado modelagem de dados variveis no
tempo, como no caso das assinaturas manuscritas;
Quer seja no reconhecimento de palavras como na verificao de assinaturas, o
reconhecimento de padres apresenta problemas de difcil soluo, em funo
do grau de variabilidade encontrada. Para tratar o problema de maneira eficiente,
faz-se necessrio o uso de uma grande quantidade de exemplares para o
aprendizado. Isso garante uma correta modelagem das variabilidades do
fenmeno observado. O MEM possuidor da capacidade de adotar hipteses
iniciais para a estrutura do modelo e, em seguida, utilizar a capacidade que os
modelos possuem de gerar as probabilidade sobre a base de dados de
aprendizado, para melhorar o prprio modelo;
A verificao de assinaturas requer uma razovel insensibilidade s
variabilidades intrapessoais. Sendo o MEM composto de modelos
probabilsticos, portanto o candidato natural na representao dessas formas.
A utilizao do MEM possui algumas limitaes, que podem ser resumidas da
seguinte maneira:
-
21
O MEM apoia-se sobre uma hiptese de independncia das variveis
aleatrias, para determinar a probabilidade de observao de uma seqncia de
smbolos. Isso decorre da hiptese de que as observaes extradas de um sinal
so independentes entre si, e que a gerao de um smbolo na seqncia de
observao no funo do estado na cadeia de Markov. claro que essas
afirmativas no so vlidas em todas as ocasies, mas oferecem a vantagem de
simplificao dos clculos;
O MEM necessita de uma quantidade elevada de amostra de treinamento
para um boa definio do modelo. No caso especfico da verificao de
assinaturas em cheques bancrios brasileiros, esse um problema ainda a ser
resolvido, pois os bancos coletam apenas trs espcimes de assinaturas de cada
cliente. No entanto, como os espcimes tm sua origem no mesmo autor, passam
a ter uma variabilidade menor, diferentemente do que ocorre nos
reconhecimento de palavras manuscritas.
2.3.3.1.1.2 Os mtodos no paramtricos
Nesses mtodos, as leis de formao da probabilidade de uma classe so
desconhecidas. O problema consiste em propor algoritmos de convergncia que
determinem o limiar ideal de deciso.
As janelas de Parzen
As janelas de Parzen [YACOUBI, 1996], que se enquadram no conjunto dos
mtodos estatsticos no paramtricos, tm o objetivo de estimar a distribuio de
probabilidade condicional f(x|w), para uma classe w. Esse mtodo no forma hipteses
restritivas sobre a natureza das distribuies subjacentes.
2.3.3.1.2 Os mtodos estruturais
Os mtodos estruturais buscam descrever informaes geomtricas de maneira
estrutural, representando formas complexas a partir de componentes elementares,
-
22
chamadas de primitivas. Os mtodos estruturais distinguem-se basicamente em dois
tipos:
Os mtodos estruturais propriamente ditos, onde a estrutura utilizada
um grafo que permite representar as formas, as primitivas e as relaes entre
elas. A fase de deciso consiste na comparao do grafo representativo da
forma do modelo com o grafo da forma em teste;
Os mtodos sintticos, onde a estrutura usada para codificar a forma em
uma lista, utilizando um alfabeto cujos termos representam elementos da
forma a descrever. A fase de deciso consiste na anlise da lista com a ajuda
de regras sintticas, como as utilizadas em um texto escrito em uma
linguagem natural.
Em geral, a principal vantagem dos mtodos estruturais, sobre os mtodos
estatsticos, a capacidade de fornecer um descritor de formas independente do
processo de classificao. O descritor de estrutura de uma forma permite reconstruir
uma forma a partir das primitivas.
Por outro lado, contrariamente aos mtodos estatsticos, quando uma classe de
caractersticas representada por um grande nmero de espcimes, com elevado grau de
variabilidade num espao de representao, os mtodos estruturais fazem uso de um
nmero muito elevado de prottipos representativos dessa classe.
2.3.3.2 Os mtodos de verificao segundo a abordagem utilizada
Bruyne e Forr em [BRUYNE & FORR, 1988] apresentam uma abordagem
global esttica, com um mtodo de verificao estatstico baseado em matching. A
imagem do modelo desfocada colocada sobre imagem em teste tambm desfocada.
Esse processo se repete com as imagens em vrios nveis de resoluo. A taxa de
verosimilhana entre as duas imagens determina a sua aceitao ou rejeio. A
vantagem desse mtodo a rapidez no processamento. A desvantagem no definir de
-
23
forma robusta os limiares de aceitao e rejeio, principalmente envolvendo
falsificaes simples e servis.
Sabourin e Plamondon em [SABOURIN & PLAMONDON, 1986] apresentam
uma abordagem global pseudo-dinmica, com um mtodo de verificao estatstico.
Esse mtodo utiliza dois classificadores, o primeiro usa o princpio da mxima
probabilidade, baseado em Bayes [HOEL, 1960]. O segundo utiliza um discriminante
linear de Fisher [HOEL, 1960], para o clculo do erro mnimo.
Hunt e Qi em [HUNT & QI, 1995] apresentam uma abordagem global com
caractersticas estticas e pseudo-dinmicas, com um mtodo de verificao estatstico
baseado em dois classificadores. O primeiro usa uma rede neural (RN), o segundo uma
quantizao vetorial (QV). O classificador baseado em QV possibilita o processamento
de mltiplas caractersticas com diferentes tamanhos e resolues. A RN capaz de
delinear arbitrariamente os limites das classes a reconhecer, mas a performance da rede
depende da arquitetura da mesma e do mtodo de treinamento.
Chaudhury e Bajaj em [CHAUDHURY & BAJAJ, 1997] apresentam uma
abordagem global com caractersticas estticas e pseudo-dinmicas, com um mtodo de
verificao estatstico baseado em trs classificadores de RN. O uso de mltiplos
classificadores introduzem um elemento de redundncia ao mtodo. possvel que os
erros de classificao provocados por um determinado classificador possa ser
compensado por outro.
Revillet em [REVILLET, 1991] apresenta uma abordagem local e contextual,
com caractersticas esttica e pseudo-dinmica, com um mtodo de verificao
estatstico baseado no vizinho mais prximo com distncia Euclidiana. Essas distncias
so ordenadas em ordem crescente e para cada classe de reconhecimento. Cada
caracterstica foi separada e seqencialmente ordenada.
Sabourin e Genest em [SABOURIN & GENEST, 1994] apresentam uma
abordagem local com caractersticas estticas, com um mtodo de verificao estatstico
-
24
e mltiplos classificadores, baseado no vizinho mais prximo com distncia Euclidiana.
A desvantagem desse processo o uso excessivo de classificadores.
Rigoll e Kosmala em [RIGOLL & KOSMALA, 1998] apresentaram uma
abordagem de verificao dinmica/esttica de assinaturas, com um mtodo de
verificao estatstico baseado em duplo classificadores. Um classificador QV usado
para modelar as colunas de clulas da grade de segmentao e um classificador MEM
para a gerao dos modelos e o processo de deciso.
2.3.4 Uma anlise crtica
Muitos dos mtodos apresentados nos itens anteriores so promissores. Cada um
deles possui pontos fortes que podem contribuir para a elaborao de um sistema
verificao automtica de assinaturas real. Os que adotam a abordagem local esto mais
preparados para tratar os trs tipos bsicos de falsificaes. O que utilizam a abordagem
no contextual [SABOURIN & GENEST, 1994] e [RIGOLL & KOSMALA, 1998],
possuem potencial para tratar mais eficientemente os diferentes tipos de assinaturas
latinas (cursiva e rubrica). Os que adotam uma composio entre caractersticas
estticas e pseudo-dinmica [HUNT & QI, 1995] e [HUANG & YAN, 1997], esto
mais adaptados para a deteco de falsificaes simples e servis. Aqueles que se
utilizam dos recursos da grafoscopia [CHUANG, 1977] possuem caractersticas
robustas na discriminao das falsificaes.
No caso especfico dos sistema de reconhecimento de documentos manuscritos,
a variao entre os diversos espcimes de uma mesma forma fica evidenciada j no
processo de extrao de primitivas. Os modelos estatsticos possuem requisitos
importantes no tratamento dessas caractersticas, ficando evidenciado pela literatura
apresentada. O interesse nos modelos de Markov encontra-se em sua capacidade de
integrar coerentemente diferentes nveis de modelagem (morfolgica, lxica e sinttica)
[YACOUBI, 1996] e na existncia de algoritmos eficientes na determinao de valores
timos para os parmetros e no aferimento da qualidade de aprendizado.
O prximo Captulo contm o mtodo de verificao automtica de assinaturas
estticas proposto e as ferramentas que daro suporte para a elaborao do mesmo.
-
Captulo 3 A Proposta para um Mtodo de Verificao
Automtica de Assinaturas Manuscritas Estticas
Nesse Captulo ser apresentada inicialmente uma proposta para uma mtodo de
verificao automtica de assinaturas esttica. Em seguida sero apresentados os
recursos que daro suporte na elaborao do mtodo proposto.
3.1 A proposta
Nessa seo so apresentadas as formalizaes do problema envolvendo a
verificao automtica de assinaturas em cheques bancrios brasileiros. Em seguida so
apresentadas as metas a serem atingidas, baseado nas motivaes levantadas e as
tcnicas a serem utilizadas em cada fase.
3.1.1 Os requisitos
A anlise de um problema, sob a luz de uma aplicao real, possui a vantagem
de limitar o escopo no contexto do problema. No entanto, apresenta a desvantagem de
impor restries em algumas etapas do processo. Essas restries podem auxiliar na
soluo do problema ou dificult-la. A seguir so apresentados alguns requisitos
relevantes, que devem ser objeto de um estudo detalhado em cada etapa do processo e
que no foram suficientemente abordados pela literatura:
A abordagem a ser adotada deve privilegiar a anlise no contextual, a fim
de atender aos estilos de assinaturas latinas, a cursiva e a rubrica;
O uso da abordagem no contextual, ligada aos requisitos legais, exige uma
reavaliao das tcnicas grafomtricas, j que a literatura no contempla tal
relao;
-
26
A adequao aos trs tipos bsicos de falsificaes exigem estudos
aprofundados da grafometria e sua relao com as caractersticas estticas e
pseudo-dinmicas, a fim de estabelecer suas contribuies para o processo de
verificao;
A adoo de critrios automatizados, para a determinao dos limiares de
aceitao e rejeio de uma assinatura, deve ser privilegiado para os
diferentes tipos de falsificaes;
Deve ser considerada uma limitao do espao grfico de aproximadamente
3x10 centmetros, que representa um retngulo destinado assinatura no
cheque, segundo as normas do Banco Central, em Anexo. Como trata-se de
uma rea reduzida, possvel a extrapolao desse rea durante o processo
de escrita. Essa extrapolao implica numa invaso de outros campos do
cheque, como a data e o montante por extenso. Sendo assim, necessrio
considerar somente a rea definida pelo retngulo (3x10 cm), confira na Fig.
3.1a e 3.1b.
Fig. 3.1 (a) Exemplo de assinatura que ocupa a rea de assinatura sem extrapolar. (b)
Exemplo de assinatura que extrapola a rea destinada assinatura. A perda encontra-se
na parte superior e inferior da assinatura, incluindo os laos maiores.
3.1.2 As metas
Para atender aos requisitos estabelecidos no item anterior, faz-se necessrio a
definio de metas a serem atingidas em cada fase, quais os recursos a serem utilizados
e quais as limitaes impostas por esses recursos. Essa metas so:
-
27
Usar como base de dados de laboratrio, com um conjunto de assinaturas
coletados obedecendo aos critrios de preenchimento de um cheque bancrio
real, com exceo da excluso do plano de fundo do cheque, da linha de base
e de quaisquer outras informaes que no pertenam ao contexto. As
assinaturas devem ser adquiridas atravs de um digitalizador;
Estar adaptado s assinaturas cujo alfabeto e a forma da escrita sejam latinas;
Permitir todos os estilos de assinaturas latinas, a cursiva e a rubrica;
Ser sensvel aos trs tipos bsicos de falsificaes encontradas em cheques
bancrios brasileiros, a aleatria, a simples e a servil.
3.1.3 A abordagem adotada
Com o objetivo de atender aos requisitos legais, faz-se uma adequao aos
estilos de escrita e aos tipos de falsificaes. A abordagem a ser adotada possui
caractersticas no contextuais (no existe a interpretao de texto), apresenta um
critrio de segmentao explcito em clulas [SABOURIN & GENEST, 1994] e
[RIGOLL & KOSMALA, 1998] e utiliza os preceitos do grafismo, entre eles a
grafoscopia [CHUANG, 1977], na definio de caractersticas estticas e pseudo-
dinmicas.
O mtodo a ser adotado para a verificao o estatstico, pela sua adaptao s
variabilidade impostas pelo problema. O uso do quantizao vetorial (QV), como pr-
classificador [HUNT & QI, 1995] e [RIGOLL & KOSMALA, 1998], permite a
adaptao mais adequada ao processo de segmentao a ser adotado. A adoo dos
modelo escondido de Markov [RIGOLL & KOSMALA, 1998] no aprendizado e na
comparao, propicia a manuteno da mtua independncia entre as caractersticas
extradas de cada observao.
3.1.4 A base de dados de assinaturas
Como a base de dados real depende de um processo de pr-tratamento para a
extrao dos dados do cheque bancrio brasileiro (o montante numrico, o valor por
extenso, a data e a assinatura), e como esse processo envolve um elevado grau de
-
28
complexidade, no faz parte do escopo desse trabalho. Adotou-se uma base de dados de
laboratrio, que ser descrita na seqncia.
Para avaliar o desempenho do processo de verificao de assinaturas, necessita-
se fundamentalmente de uma base de dados que permita a sua validao estatstica. O
nmero de espcimes por autor, bem como o nmero de autores, so fundamentais.
Outros aspectos, como resoluo da imagem e nveis de cinza, tambm so elementos
importantes, pois tratam da qualidade da imagem usada. A Tabela 3.1 mostra um
comparativo entre as vrias bases de dados utilizadas em trabalhos publicados
anteriormente. Esse resumo foi descrito por Plamondon e Lorette [PLAMONDON &
LORETTE, 1988], para os mtodos estticos. Tendo como base a tabela original, foram
feitas atualizaes incluindo trabalhos mais recentes.
Para compor a base de dados de referncia, foram coletadas 5.200 imagens de
assinaturas. Desse montante, existem 4.000 assinaturas genunas oriundas de 100
autores diferentes (40 amostras de assinaturas para cada autor) e 1.200 falsificaes,
geradas a partir dos 60 primeiros modelo de assinatura genunas. Foram produzidas 10
falsificaes simples e 10 falsificaes servis. A Fig. 3.2 apresenta exemplos dos tipos
de falsificaes coletadas para a base de dados.
-
29
RefernciasResoluo da imagem
eNveis de Cinza (NC)
Dados de Treinamento e TesteEspcimes (E) Assinantes(A)
Ammar, Yoshida e Fukumura[AMMA et al., 1985]
256x1024 grid256 NC
200 genunas(20E x 10A)200 falsificaes(20E x 10 imitadores)
Brocklehurts[BROCKLEHURST, 1985]
60 pixels/cmbinria
2820 genunas(60E x 47A)
Chuang[CHUANG, 1977]
100x300 gridbinria
2400 genunas(6E x 400A)1600 falsificaes(4E / A)
Bruyne eForr[BRUYNE & FORR, 1988]
512x512 imagemdesfocadas
150 teste em 10 assinaturas dereferncia
Nagel eRosenfeld[NAGEL & ROSENFELD, 1977]
500 pixels/polegada60 nveis de cinza
11 genunas(6E x 1A + 5E x 1A)14 falsificaes(9E x 1A + 5E x 1 A)
Nemcek eLin[NEMCK & LIN, 1974]
128x256 gridbinria
600 genunas(40E x 15A)120 falsificaes(10 A imitados 3E/A 4 imitadores)
Sabourin e Genest[SABOURIN & GENEST, 1994]
128x512 grid256 nveis de cinza
800 genunas(40E x 20A)
Sabourin e Plamondon[SABOURIN & PLAMONDON, 1986]
Linhas rtmicas 63 genunas para 1A
117 falsificaes simuladas de 6imitadoresamadores
Huang e Yang[HUANG & YAN, 1997]
12x2 cm100 dpi256 nveis de cinza
504 genunas(24E x 21A)3024 falsificaes(24 x 6E x 21 imitadores)
Plamondon, Lorette e Sabourin[PLAMONDON et al., 1990]
128x512 pixels256 nveis de cinza
248 genunas(31E x 8A)224 fotocopias das genunas
Rigoll eKosmala[RIGOLL & KOSMALA, 1998]
No especificado 280 genunas(20E x 14A)60 falsificaes(40 falsificaes perfeitas)(20 falsificaes simples)
Tabela 3.1 Descrio das bases de dados de assinaturas usadas para avaliar o
desempenho dos mtodos de verificao automtica de assinaturas estticas.
-
30
(a) (b)
(c) (d)
Fig. 3.2 Tipos de assinaturas da base de dados: (a) assinatura genuna ; (b) falsificao
aleatria; (c) falsificao simples; (d) falsificao servil.
As assinaturas foram coletadas utilizando uma folha de papel A4 em branco.
Como elemento guia, foi usado um gabarito no formato de quatro cheques bancrios,
conforme mostrado na Fig. 3.3. Portanto, as mesmas esto totalmente isentas de
qualquer elemento de fundo (linhas de base, etc.). As folhas A4 foram digitalizadas com
uma resoluo de 300dpi, 265 nveis de cinza. Em seguida, as imagens foram recortadas
e gravadas em um arquivo no formato BMP, num retngulo de tamanho de 3x10 cm ou
(400x1.000 pixels), correspondendo rea destinada assinatura no cheque.
Durante o processo de coleta, nenhum tipo de restrio foi imposto aos autores,
como por exemplo tipo de caneta. Por questes legais, definidas pelas normas do Banco
Central, em Anexo, somente canetas com cores azul e preta puderam ser usadas. Os
dados foram armazenados em CD-ROMs, que esto hoje aos cuidados do Laboratrio
de Anlise de Documentos (LARDOC), situado na PUCPR.
-
31
Fig. 3.3 Modelo do gabarito usado para a coleta das assinaturas.
3.2 Os recursos
O objetivo desse item descrever detalhadamente as principais ferramentas a
serem utilizadas no desenvolvimento da soluo para o problema proposto. Ele divide-
se em trs partes principais. A primeira trata da anlise da assinatura sob a tica do
grafismo e sua relao com os mtodos automticos. A segunda aborda os princpios da
modelagem Markoviana. A terceira descreve os preceitos da quantizao vetorial .
3.2.1 O grafismo
No campo de estudo do grafismo encontram-se vrias abordagens
[VELS, 1961], [MINICUCCI, 1991] e [GOMIDE & GOMIDE, 1995], como: a
grafoscopia, que o estudo da origem do documento grfico; a grafologia, que o
estudo da escrita visando determinar a psique do escritor; a paleografia, que o estudo
histrico da escrita; a caligrafia, que o estudo artstico da escrita. Das quatro
abordagens anteriores, duas delas, a grafoscopia e a grafologia, so importantes para
-
32
este trabalho, pois abordam o estudo das caractersticas pessoais de um escritor ligadas
sua escrita.
3.2.1.1 A grafoscopia
A grafoscopia tradicional foi desenvolvida com o objetivo de esclarecer questes
criminais. Tratando-se de um campo da criminalstica, ela tem sido conceituada como a
rea cuja finalidade a de verificao da autenticidade de um documento, isto ,
determinar caractersticas grficas na elaborao de um documento.
Como a escrita est sujeita a inmeras mudanas, decorrentes de causas
variadas, exigem conveniente interpretao tcnica, para o completo xito dos exames
grafoscpicos periciais. As variaes do grafismo originam-se de causas normais,
artificiais e ocasionais. As primeiras so aquelas que acompanham o prprio
desenvolvimento humano, nos perodos abrangidos pela infncia e adolescncia,
maturidade e velhice. J as segundas, so transformaes da escrita causadas pelo
artificialismo ocorridos nos casos de falsificaes e dissimulaes grficas. As ltimas
causas originam-se das molstias, dos estados emocionais, de leses na mo e de outros
fatores fsicos.
Os elementos tcnicos usados nos exames das identidades grficas, segundo Tito
e Lvio Gomide [GOMIDE & GOMIDE, 1995], so: os genricos, que se dividem em
calibre, espaamento, comportamento pauta, comportamento base, proporcionalidade,
valores angulares, valores curvilneos e inclinao axial; os genticos, que se
subdividem em, dinmicos (presso, progresso), trajetos (ataques, desenvolvimentos,
remates, mnimos grficos). Cada um desses elementos podem ser enquadrados, em um
exame grafoscpico, com convergncia ou divergncia (mnima, mdia, mxima). As
Fig. 3.4 e 3.5 mostram exemplos de cada um dos casos.
-
33
Fig. 3.4 Elementos tcnicos genticos. Adaptado de [GOMIDE & GOMIDE, 1995].
-
34
Fig. 3.5 Elementos tcnicos genricos. Adaptado de [GOMIDE & GOMIDE, 1995].
Segundo Tito e Lvio Gomide [GOMIDE & GOMIDE, 1995], a aceitao do
princpio fundamental da grafoscopia, que considera a escrita individual, exclui a
hiptese de erro na apurao da origem das escritas, inexistindo portanto as falsificaes
perfeitas. Essa afirmativa verdadeira quando existem subsdios necessrios e
suficientes para uma anlise correta.
-
35
No que se refere s assinaturas analisadas, elas nem sempre se apresentam em
condies adequadas, ocorrendo casos em que existem recobrimentos, falhas devido a
dobras ou desgastes do papel, ou outras anomalias, impedindo o levantamento de
elementos tcnicos suficientes para uma concluso decisiva. Ainda nesse contexto,
podem surgir dificuldades devido s caractersticas intrnsecas do grafismo, tais como
os campos grficos reduzidos, os polimorfismos, as escritas patolgicas, as escritas
mo guiadas, entre outras.
Tito e Lvio Gomide [GOMIDE & GOMIDE, 1995] sugerem, em muitos casos,
estabelecer um plano e projeto especfico, tal como a seleo de modelos seguros para a
assinatura ou rubrica, ou critrios para a produo e arquivamento de padres de
confronto seguros. Isto , o uso de um banco de dados de modelos.
3.2.1.2 A grafologia
O estudo pioneiro da grafologia foi realizado pelo italiano Camillo Baldi,
professor de Lgica e Metafsica da Universidade de Bolonha, que publicou em 1622 o
primeiro livro de grafologia [VELS, 1961].
Existem inmeras escolas grafolgicas e grafoanalticas, mas o objetivo deste
trabalho abordar somente aquelas que possam subsidiar os estudos aplicados
verificao de assinaturas. Para tanto, sero comentados somente os movimentos com
abordagem cientfica, ou seja, o movimento clssico que se baseia na mmica e o
movimento moderno psicanaltico, que se orientam nos smbolos.
A escola mmica baseia-se no movimento. Segundo a mmica, a grafologia
comporta dois estudos, o dos sinais e o das resultantes. Os sinais so tomados no
conjunto da escrita, onde se considera a altura, a largura, a inclinao, a regularidade ou
no pormenor das palavras, das letras, dos sinais. Sendo assim, deve-se procurar os sinais
de superioridade e de inferioridade, de natureza e dos meios de inteligncia, de carter
moral (costumes e sentimentos), vontade, senso esttico, idade, sexo e algumas
indicaes patolgicas.
-
36
J a escola simblica, baseia-se principalmente nos estudos da avaliao e
interpretao dos smbolos. Existem, indubitavelmente, relaes entre os diversos
smbolos grafolgicos de que se compem o trao individual e o psiquismo do escritor.
A condio imprescindvel para compreender a expresso grfica adequadamente, o
conhecimento dos conceitos bsicos, em sua maior parte inconscientes, que trabalham
na pessoa ao escrever. Ao escrever, projetamos inconscientemente nosso ser. Escrever
conscientemente o mesmo que desenhar inconscientemente. O desenho de si mesmo
o auto-retrato. [MINICUCCI, 1991].
importante salientar que, os sinais usados pela escola mmica e simblica
assemelham-se aos utilizados pela grafoscopia, mas a anlise das resultantes possuem
abordagens diferenciadas. As duas primeiras avaliam a psique do escritor, a fim de
estabelecer possveis patologias. J a ltima avalia a veracidade da autoria da escrita,
com a finalidade de identificar possveis fraudes.
3.2.1.2.1 Elementos bsico da grafia
Em grafologia pode-se considerar como elementares as noes e quase todos os
traos e termos a seguir [VELS, 1961]:
Campo grfico, o espao bidimensional em que a escrita feita;
Gesto grfico ou movimento grfico, todo movimento de dedos e/ou da mo que
o indivduo faz para escrever. Cada movimento grfico gera um trao grfico;
Trao, o trajeto que a caneta descreve em um nico gesto executado pelo escritor;
Trao descendente, fundamental, pleno, ou grosso, todo trao descendente e
grosso de uma letra;
Trao ascendente, ou perfil, o trao ascendente e fino de uma letra;
Ovais, so os elementos em forma de crculo das letras a, o, g, q, etc;
Hastes, so todos os traos plenos (movimento de descenso) das letras l, t, b,
etc. e do f at a base da zona mdia. Tambm so consideradas hastes os traos
verticais do m e do n maisculo e minsculo, confira na Fig. 3.6(3);
Lanadas inferiores, so todos os planos (descendentes) do g, j, y, etc. e do
f a partir da zona mdia at embaixo, confira na Fig. 3.6(4);
-
37
Bucles, so todos os traos ascendentes (perfis) das hastes e das laadas inferiores e,
por extenso, todo movimento que ascende cruzando a haste e unindo-se a ela
formando crculo, confira na Fig. 3.6(5)(6);
Partes essenciais, o esqueleto da letra, a parte indispensvel da sua estrutura,
confira na Fig. 3.7(A);
Parte secundria ou acessria, o revestimento ornamental ou parte no
necessria sua configurao, confira na Fig. 3.7(B).
Nas letras temos de distinguir tambm as diferentes zonas das mesmas:
Zona inicial, rea onde se encontra o ponto onde inicia-se a letra, confira na Fig.
3.6(1);
Zona final, rea onde se encontra o ponto onde termina a letra, confira na Fig.
3.6(2);
Zona superior, rea onde se encontra o ponto mais alto, ocupado pelas hastes, pelos
pontos e acentos, pelas barras do t e parte das maisculas, confira na Fig. 3.6(A);
Zona mdia, rea central, ocupada por todas as vogais minsculas (a, e, i , o, u) e
pelas letras m, n, r, etc. cuja altura toma-se como base para medir o nvel da
elevao das hastes e o nvel do descenso das lanadas inferiores, confira na Fig.
3.6(B);
Zona inferior, zona baixa da escrita a partir da base de todos os ovais descendentes,
das maisculas ou de outras letras, confira na Fig. 3.6(C).
Fig. 3.6 Exemplo de alguns dos elementos bsicos da grafia: (1) Zona inicial; (2) Zona
final; (3) Haste; (4) Laada; (5) Bucle da haste; (6) Bucle da laada; (7) bucle em forma
de lao; (A) Zona superior; (B) Zona mdia; (C) Zona inferior. Adaptado de [VELS,
1961].
-
38
Fig. 3.7 Exemplo das diferenas entre as partes de um elemento grfico: (A) Partes
essenciais; (B) Partes secundrias. Adaptado de [VELS, 1961].
3.2.1.2.2 As letras e o movimento
Sob o ponto de vista fisiolgico de movimento ou de execuo, o impulso grfico
pode seguir quatro direes principais ou vetores [MINICUCCI, 1991]:
De cima para baixo, cuja execuo obedece a um movimento de flexo do
antebrao, da mo e dos dedos e produz os traos plenos;
De baixo para cima, que obedece a um movimento de extenso e produz os perfis;
Da direita para a esquerda, que exige do antebrao, da mo e dos dedos um
movimento de abduso, cujo resultado so os traos em sentido horrio;
Da esquerda para a direita, que est condicionada por movimentos de abduso e que
d lugar aos traos em sentido anti-horrio.
Esses movimentos podem ser: retos, curvos e angulosos. O movimento reto quando
no apresenta inflexo, tores ou desvios em seu trajeto. O movimento curvilneo,
quando os traos das letras tm a forma de segmentos de crculo ou oval (as letras
interiores a, o, etc. ). O movimento anguloso quando as letras so formadas por
retas que se cruzam ou se quebram.
3.2.1.2.3 Os aspectos grficos
Segundo Vels [VELS, 1961], a escrita como grafia psicomotriz deve ser vista e
classificada sob seus aspectos e subaspectos, ou seja, medindo-se em cada caso o nvel
de tenso, rapidez, profundidade, irradiao (altura-extenso), relevo, esttica, coeso,
-
39
regularidade, inclinao, direo das linhas, progresso e proporo. Quase todos esses
aspectos do grafismo so mensurveis, isto , podem ser avaliados grafometricamente a
partir de um modelo ou padro. Tudo que exceda ou fique abaixo deste modelo
sintomtico.
3.2.1.2.4 O simbolismo do espao
Sob o ponto de vista simblico do espao e das formas, a grafologia moderna,
embasada nas teorias de Freud e Piaget [PIAGET, 1978], descobriu quatro vetores ou
direes principais do gesto grfico: o espiritual, o emocional, o biolgico e o de
contato. Na Fig. 3.8a observa-se a simbolismo dos vetores. O vetor A (espiritual) a
zona ou plano para onde se dirigem as tendncias que no tomam contato direto com a
realidade dos sentidos, confira na Fig. 3.8d. O vetor B (biolgico), engloba as
tendncias orgnicas (movimento fsico, trabalho, esporte, viagens, etc.), confira na Fig.
3.8e. O vetor C (emocional), o plano do sentimento, da sensibilidade. O plano mais
prximo do vetor C, ou seja, da zona mdia, representa o inconsciente. O vetor I,
representam a vida cotidiana, introverso, passado, egosmo inibio, etc., confira na
Fig. 3.8b e o D o futuro, extroverso, iniciativa, ambio, etc., confira na Fig. 3.8c.
V e to r I V e to r D
V e to r A
V e to r B
V e to r C
(a )
(b ) (c )
(d ) (e )
Fig. 3.8 Exemplos de assinaturas segundo a simbologia do espao grfico. (a) Diagrama
representativo do espao grfico; (b) Escritor introvertido; (c) Escritor extrovertido; (d)
Escritor espiritualista; (e) Escritor materialista e introvertido.
-
40
importante observar que, na simbologia de ocupao do espao grfico, podem ser
encontradas mais de uma das caractersticas pessoais.
No intuito de verificar o comportamento da ocupao de espao numa rea
restrita, como no caso do cheque bancrio brasileiro, realizou-se um experimento.
Foram usadas 13 amostras de assinaturas para 94 autores diferentes. Nesse caso, o
objetivo foi testar as variaes de escala da assinatura de um mesmo escritor e a
ocupao do espao destinado mesma, quando o espao disponvel para a assinatura
reduzido. Para tanto, foi elaborado um formulrio no formato A4 contendo vrias linhas
de base, algumas com bordas retangulares ajustadas para cima e para baixo, com o
objetivo de reduzir ou aumentar a rea da parte superior/inferior da linha de base,
confira na Fig. 3.9. Os escritores no foram instrudos a obedecer as fronteiras impostos
pelas molduras do formulrio, isto , ficaram livres para assinar como desejassem.
Fig. 3.9 Modelo do formulrio usado para a coleta das assinaturas para anlise da
ocupao do espao.
-
41
O formulrio foi dividido em 6 sees. A seo (a) composta de reas para a
assinatura emoldurada com uma reduo do espao na rea superior linha de base. O
objetivo testar a reduo de escala da assinatura quando a rea reduzida. A seo (b)
e (c), identificadas por no possuir molduras, possui o objetivo de analisar o
comportamento do assinante quando o espao destinado assinatura no possui
fronteiras perfeitamente determinadas. A seo (d) tem os mesmos objetivos de (a), s
que a linha de base encontra-se na regio central. A seo (e) possui o efeito contrrio
da (a), seu objetivo o mesmo de (a) e (d), confira na Fig. 3.10.
Fig. 3.10 Modelo do formulrio para coleta de assinaturas e a representao das sees.
-
42
A Tabela 3.2 apresenta os resultados da avaliao estatstica feita sobre os
formulrios.
Observaes Comentrios
Quantos escritores respeitaram as
fronteiras da moldura (total de assinantes =
94)?
Sim = 45 (48%)
No = 49 (52%)
(dos 45 que respeitaram as fronteiras, 34
mantiveram a escala da assinatura e 11 no
mantiveram. Isto eqivale a dizer que 83
escritores (88.3%) mantiveram a escala de
suas assinaturas).
A invaso das fronteiras da moldura
ocorreu?
Parte superior = 45 (48%)
Parte inferior = 21 (23%)
Lado esquerdo = 8 (9%)
Lado direito = 10 (10%)
No invadiram = 49 (52%)
Percebe-se que a incidncia de invases do
lado esquerdo, direito e em baixo da linha
de base pequena. A grande maioria das
invases ocorrem na parte superior. Isto
acontece porque a maior parte da
assinatura fica sobre a linha de base.
OBS: O escritor pode ter ultrapassado mais
de uma fronteira.
A ocupao do espao grfico ocorreu?
esquerda = 36 (38%)
direita = 7 (8%)
Centro = 51 (54%)
A maioria dos escritores tende a ocupar a
parte central da rea, mas existe tambm
uma grande nmero que ocupa o lado
esquerdo. O nmero de assinantes que usa
o lado direito no muito expressivo.
Tabela 3.2 Avaliao estatstica da ocupao do espao grfico e da variao de escala
da assinatura.
Como pode-se notar na Tabela 3.2, a variao de escala da assinatura em uma
rea determinada mnima, mesmo que essa rea seja reduzida. Confira as variaes da
posio da linha de base e na ausncia da moldura nos exemplos da Fig. 3.11.
-
43
Fig. 3.11 Exemplos de assinaturas do formulrio: (a) Exemplo do uso da seo d; (b)
Exemplo do uso da seo e; (c) Exemplo do uso da seo a; (d) Exemplo do uso da
seo b; (e) Exemplo do uso da seo c.
Quanto ocupao do espao grfico, mesmo que os cheques apresentem uma
rea reduzida, dificultado sua anlise [GOMIDE & GOMIDE, 1995], possvel
observar na Fig. 3.8, que essa caracterstica capaz de agregar informaes de contexto
importantes ao processo de verificao.
3.2.1.2.5 A ordem
Em relao ordem de distribuio dos elementos grficos, pode-se classificar a
distribuio em: clara, boa separao entre letras e palavras, isto , uma harmnica
distribuio das letras e palavras, confira na Fig. 3.12a; confusa, o texto aparece como
uma massa desuniforme e embaralhada, confira na Fig. 3.12b; concentrada, na viso do
conjunto prepondera o texto sobre os espaos em branco, confira na Fig. 3.12c;
espaada, na viso do conjunto prepondera os espaos em branco, confira na Fig.
3.12d.
-
44
Fig. 3.12 Exemplos de assinaturas sob o ponto de vista da ordem: (a) Assinatura clara;
(b) Assinatura confusa; (c) Assinatura concentrada; (d) Assinatura espaada.
3.2.1.2.6 A proporo
Segundo Vels [VELS, 1961], valorizar as assimetrias, os centros de
deslocamento das letras ou de seus elementos constitutivos, achar o centro de
gravidade das tendncias inconscientes. Em relao simetria da escrita, pode-se
classificar em: proporcional, assinatura onde as letras e as partes constitutivas da
mesma apresentam pequenas desigualdades rtmicas, confira na Fig. 3.13a;
desproporcional, a assinatura onde as letras ou partes de letras apresentam
desequilbrio e translaes mais ou menos exageradas, confira na Fig. 3.13b; mista,
nota-se a existncia simultnea da proporcionalidade e desproporcionalidade, afetando
principalmente as letras maiscula e as hastes, confira na Fig. 3.13c.
Fig. 3.13 Exemplos de assinaturas sob o ponto de vista da proporcionalidade: (a)
Assinatura proporcional; (b) Assinatura desproporcional; (c) Assinatura mista.
-
45
3.2.1.2.7 A dimenso
A dimenso traduz o grau de expansividade do escritor, cuja caracterstica mais visvel
nas assinaturas. A dimenso pode ser resumida em duas classes: a escrita alta, onde o
corpo da escrita (zona mdia) ultrapassa as propores em relao s hastes e as
lanadas inferiores, confira na