Interoperabilidade e funcionalidade de documentospaf/proj/Set2004/i980384... · 2004-09-06 ·...
Transcript of Interoperabilidade e funcionalidade de documentospaf/proj/Set2004/i980384... · 2004-09-06 ·...
Instituto Superior de Engenharia do Porto
Tema
Interoperabilidade e funcionalidade
de documentos
5º.ano Licenciatura
Ramo Computadores e Sistemas
Orientador Eng. Paulo Ferreira
Aluno Joel Filipe Mota Santos
980384
Agosto de 2004
i
Agradecimentos
A realização deste trabalho só foi possível graças à colaboração de diversas pessoas. A
todos aqueles, que sob as mais diversas formas, contribuíram para a concretização deste
projecto, expresso o meu afectuoso reconhecimento e agradecimento. Em particular:
• aos meus pais, pelo incentivo dado durante a elaboração deste trabalho;
• na I2S, ao engenheiro António Pinto que, mais uma vez, esteve presente para me
ajudar a concluir mais uma etapa importante da minha vida;
• no ISEP, ao engenheiro Paulo Ferreira, pela orientação dada na elaboração do
projecto;
• todos os demais colegas/amigos de trabalho na I2S, pelas “dicas” e apoio dado.
ii
iii
Índice
1. INTRODUÇÃO.................................................................................................................................1
1.1 ENQUADRAMENTO .....................................................................................................................2 1.2 ORGANIZAÇÃO DO RELATÓRIO...................................................................................................3 1.3 CONVENÇÃO TIPOGRÁFICA ........................................................................................................4
2. INTEROPERABILIDADE ..............................................................................................................5
3. TIPOS DE DOCUMENTOS..........................................................................................................11
3.1 CARACTERÍSTICAS DA INFORMAÇÃO DIGITAL ..........................................................................11 3.2 DOCUMENTO DIGITAL VS DOCUMENTO EM PAPEL ....................................................................12 3.3 TIPOS DE DOCUMENTOS ...........................................................................................................15
4. FORMATOS DE DOCUMENTOS...............................................................................................17
4.1 TEXTO PURO (ASCII)...............................................................................................................19 4.2 TEXTO COM FORMATO .............................................................................................................21
4.2.1 Processador de texto ..........................................................................................................21 4.2.2 Folhas de cálculo ...............................................................................................................25
4.3 FORMATOS DE VISUALIZAÇÃO E IMPRESSÃO ............................................................................25 4.4 LINGUAGENS DE FORMATO ......................................................................................................28 4.5 LATEX ....................................................................................................................................30
4.5.1 LYX .....................................................................................................................................31 4.5.2 Editores e outros programas ..............................................................................................32 4.5.3 O LaTeX no Windows .........................................................................................................32 4.5.4 A comunicação com outros sistemas e programas .............................................................34
4.6 XML........................................................................................................................................34 4.6.1 Vantagens e desvantagens do Formato XML .....................................................................38 4.6.2 Aplicação do XML..............................................................................................................39 4.6.3 Arquitectura Adobe XML....................................................................................................40 4.6.4 Microsoft Office 2003 e o XML ..........................................................................................41
4.7 CONCLUSÃO.............................................................................................................................43
5. O PRESENTE .................................................................................................................................47
5.1 O PROBLEMA............................................................................................................................47 5.2 AO SEU SERVIÇO ......................................................................................................................48 5.3 WEBSPHERE – WEBFACING.....................................................................................................50 5.4 .NET........................................................................................................................................53 5.5 STANDARDS .............................................................................................................................54
iv
6. GESTÃO DOCUMENTAL............................................................................................................57
6.1 A NECESSIDADE DO SOFTWARE DE GESTÃO DOCUMENTAL.......................................................59 6.2 WORKFLOW .............................................................................................................................61 6.3 PORTAIS E INTRANET ...............................................................................................................62 6.4 WEB: INTEGRAR É A SOLUÇÃO (?) ...................................................................................67 6.5 ECM – ENTERPRISE CONTENT MANAGEMENT.........................................................................68 6.6 EAI – ENTERPRISE APLICATION INTEGRATION ........................................................................70 6.7 EDI – ELECTRONIC DATA INTERCHANGE ................................................................................72 6.8 EBXML....................................................................................................................................73 6.9 FACTOR HUMANO.....................................................................................................................76
6.9.1 Mudança de gestão.............................................................................................................76 6.9.2 Falsa assumpção ................................................................................................................78
7. SOLUÇÕES.....................................................................................................................................79
7.1 MICROSOFT SHAREPOINT PORTAL SERVER .............................................................................82 7.2 SILVA.......................................................................................................................................84 7.3 IXOS .......................................................................................................................................86 7.4 NETAMINAS .............................................................................................................................88
8. CONCLUSÃO.................................................................................................................................91
9. GLOSSÁRIO...................................................................................................................................97
10. BIBLIOGRAFIA/ REFERÊNCIAS .........................................................................................99
11. ANEXOS...................................................................................................................................101
11.1 I2S .........................................................................................................................................105 11.2 ESPECIFICAÇÕES DE FORMATOS DE FICHEIROS.......................................................................109 11.3 XML......................................................................................................................................115 11.4 OFFICES SUITES .....................................................................................................................121 11.5 NORMAS.................................................................................................................................133
v
Índice de Figuras Figura 2.1 – Estrutura do ILE ..................................................................................5
Figura 2.2 – Interoperabilidade entre sistemas ........................................................6
Figura 2.3 – Exemplo de relação de versões entre empresas...................................7
Figura 2.4 – Exemplo de relação de versões entre postos de trabalho ....................8
Figura 2.5 – Exemplo de interoperabilidade............................................................9
Figura 3.1 – Dispositivo de leitura de documentos digitais...................................13
Figura 4.1 – Exemplo de resultado de um ficheiro não reconhecido pelo Word ..18
Figura 4.2 – Icone do Microcoft Word ..................................................................21
Figura 4.3 – AbiWord (versão 2.0)........................................................................23
Figura 4.4 – AbiWord: multi-plataforma...............................................................23
Figura 4.5 – AbiWord: alguns erros ortográficos a corrigir ..................................24
Figura 4.6 – Icone do Microsoft Excel ..................................................................25
Figura 4.7 – Icone do PDF.....................................................................................26
Figura 4.8 – Exemplo de conteúdo de um ficheiro em formato PostScript...........27
Figura 4.9 – HTML................................................................................................28
Figura 4.10 – LaTex...............................................................................................30
Figura 4.11 – Lyx...................................................................................................31
Figura 4.12 – MikTeK ...........................................................................................33
Figura 4.13 – Arquitectura Adobe XML ...............................................................40
Figura 4.14 – Portabilidade do Microsoft Office 2003..........................................42
Figura 4.15 – Exemplo de documento em Latex e o seu resultado intepretado ....44
Figura 4.16 – AbiWord: exemplo de texto ............................................................44
Figura 4.17 – PDF: documento original AbiWord exportado para LaTex............45
Figura 5.1 – Ecrã tipico de um AS400...................................................................50
Figura 5.2 – WebFacing.........................................................................................51
Figura 5.3 – WebFacing: estrutura de conversão ..................................................51
Figura 5.4 – WebFacing: possibilidade de use de ambas as formas......................52
Figura 5.5 – Evolução do iSeries ...........................................................................52
Figura 6.1 – Processo de Digitalização-Classificação-Distribuição ......................58
Figura 6.2 – Acesso ao Portal por mapeamento de rede........................................65
Figura 6.3 – Portal I2S ...........................................................................................65
Figura 6.4 – Portal I2S: acessos cliente .................................................................66
vi
Figura 6.5 – Portal ISEP ........................................................................................66
Figura 6.6 – Portal ISEP: opção de formato de listagem.......................................67
Figura 6.7 – Interoperabilidade do EAI .................................................................70
Figura 6.8 – Estrutura do EDI................................................................................72
Figura 6.9 – Explicação gráfica do EDI.................................................................73
Figura 7.1 – Millennium BCP................................................................................80
Figura 7.2 – Estrutura do SharePoint Portal Server..............................................82
Figura 7.3 – Silva...................................................................................................84
Figura 7.4 – Aspecto da ferramenta Silva..............................................................85
Figura 7.5 – Estrutura do IXOS .............................................................................87
Figura 7.6 – Estrutura do IXOS em parceria com ferramentas Microsoft.............88
Figura 11.1 – Esquema do XSL...........................................................................118
Figura 11.2 – Microsoft Office 2003 ...................................................................121
Figura 11.3 – Visão do OpenOffice.....................................................................123
Figura 11.4 – OpenOffice.org: conversão para diversos tipos de formatos ........137
Figura 11.5 – KOffice: já se encontra preparado para o OASIS .........................140
vii
Índice de Tabelas Tabela 4.1 – Códigos acrescidos à tabela ASCII...................................................20
Tabela 4.2 – Comparação do tamanho de ficheiros...............................................21
Tabela 4.3 – Resumo de alguns tipos de formato ..................................................46
Tabela 7.1 – Comparação entre processo papel e processo formato digital ..........80
Tabela 8.1 – Exemplo Microsoft: custo de aquisição do produto .........................92
Tabela 11.1 – I2S: Sectores da Empresa..............................................................107
Tabela 11.2 – Microsoft Office – versões e respectivos valores .........................122
viii
Lista de Abreviaturas
AFNOR Association Francaise de NORmalisation
API Aplication Program Interface
BPSS Bussiness Process Specification Schema
CEN Comité Europeu de Normalização
CLT Common Language Runtime
CMS Content Management System
CRM Customer Relationship Management
CSS Cascade Style Sheet
CTAN Comprehensive TEX Archive Network
EAI Enterprise Application Interface
ECM Enterprise Content Management
EDI Electronic Data Interchange
ERP Enterprise Resource Planning
HTML Hypertext Markup Language
IPQ Instituto Português da Qualidade
IRM Information Rights Management
ISO International Organization for Standardization
KDE K Desktop Environment
LGPL GNU Lesser GPL
MSMQ Microsoft MessageQueing
OCR Optical Caracter Recognition
PDA Personal Digital Assistant
PDF Portable Document Format
PME Pequena Média Empresa
RTF Rich Text Format
SGML Standard Generalized Markup Language
SISSL Sun Industry Standards Source License
SOAP Single Object Access Protocol
SPPS SharePoint Portal Server
UDDI Universal Description Discovery and Integration
ix
UMIC Unidade de Missão Inovação e Conhecimento
UN/CEFACT United Nations Centre for Trade Facilitation and
Electronic Business
WSDL Web Services Description Language
WWW World Wide Web
XHTML Extensible HTML
XML eXtensive Markup Language
1. Introdução
A evolução do Homem tem sido ao longo do tempo enorme em todos os aspectos. E
começando quer por Adão e Eva, quer pela teoria do Big Bang, o certo é que a evolução
foi de tal modo, que seria a nossa extinção se regredíssemos.
A informática veio permitir essa evolução e o salto dado trouxe tanta oferta que já se
torna difícil a escolha.
Quem não se lembra da existência de um reduzido número de processadores de texto
(tal como o Wordstar) e de folhas de cálculos (Lotus 123, Quattro), que veio facilitar a
vida privada e empresarial. No entanto, no presente, existem uma panóplia de
aplicações feitas à medida, que competem contra o software monopolista. De facto, as
tentativas do destronar estes softwares (como será observado) têm sido inúmeras e
provavelmente já teriam tido êxito mas existe um factor muito importante que não pode
ser esquecido – a mentalidade. Existem muitos produtos que tentaram a sua sorte e no
entanto não atingiram o êxito, talvez por não estarem no sítio certo, na altura certa e no
momento exacto. Apesar disso, a continuidade por atingir esse êxito permanece e cada
vez mais observa-se (lentamente) o seu trabalho.
O desenvolvimento de aplicações isoladas e independentes têm o seu fim, a relação 1-1
(um-para-um) de aplicação/formato de ficheiro está cada vez menos presente,
substituída por aplicações que “se conhecem e se entendem” – estamos na era da
interoperabilidade.
Com a presença da interoperabilidade, passamos a uma relação de n-n (n-para-n) onde,
com a “parceria” entre aplicações, é possível a existência de formatos de ficheiros que
se “entendem” entre as diversas aplicações, sem a necessidade de proceder a
importações/exportações, bem como as versões em si.
A abolição da mensagem “Format file not recognised” esta cada vez mais atingível.
A partilha do conhecimento entre as aplicações e formatos permite que estes se
encaminhem para uma “normalização” documental, para que todos possam “remar para
o mesmo sentido”.
2
O software livre trouxe uma maior abertura no desenvolvimento, permitindo a entrada
de particulares, que deste modo podem contribuir com o seu conhecimento. Esta
partilha de conhecimento já deu provas de sucesso em diversas áreas, como na aviação1
e até já mesmo na informática, com o nosso tão bem conhecido sistema Linux.
A história repete-se mais uma vez, e estamos perante uma luta entre David e Golias,
onde só vencerá quem tiver visão e souber levar a multidão. Será (esta a ser…) uma luta
difícil mas o facto de ela existir demonstra a nossa vontade de evoluir. Para já, podemos
agradecer o esforço de instituições e particulares que se apoiaram num software livre,
disponível a qualquer pessoa, sem a existência de uma necessidade “forçada” de
aquisição de um produto, e na “construção” de um formato livre.
1.1 Enquadramento Este projecto mostra o trabalho realizado no que actualmente temos de aplicação da
interoperabilidade, iniciando-se com a definição de alguns conceitos importantes,
associados ao tema do projecto, seguido de uma apresentação dos formatos mais usados
na produção e distribuição de documentos e respectivas aplicações associadas. Formatos
esses usados em aplicações como: Latex, Lyx, HTML, Microsoft Word, Microsoft
Excel e XML.
Mas será que uma simples aplicação “caseira” não satisfará uma empresa “caseira”?
Para tal apresentam-se alguns produtos actualmente existentes no mercado e que podem
satisfazer diversos níveis da empresas. Em anexo encontra-se uma referência a esses
produtos, onde se poderá observar as inúmeras aplicações que existem e se debatem
para se sobressaírem.
Para se proceder a uma possível comparação, foi usado como base o produto mais usado
actualmente, o Microsoft Office.
Mas questiona-se o que existe actualmente no mercado para além destes pacotes, que
permita o workflow documental nas empresas? O que leva a questionar, se esses
produtos conseguem satisfazer as necessidades actuais, e se não, que outras soluções
existem? Essas questões poderão ser respondidas nos últimos capítulos, onde se faz um
1 Pelos irmãos norte-americanos Wilbur e Orville Wright em 1908.
Introdução
3
case study da actualidade nas empresas/instituições, e o que existe de novidade no
mercado.
Alguns exemplos de casos práticos referem-se à empresa I2S – Informática, Sistemas e
Serviço, S.A., pelo facto de exercer nesta a minha actividade profissional. Para melhor
conhecimento da empresa, encontra-se em anexo um documento com uma breve
apresentação.
1.2 Organização do relatório Este relatório divide-se em duas partes. A primeira parte aborda a introdução aos tipos
de formatos e ficheiros existentes no mercado, os mais conhecidos e as suas respectivas
características.
• Capitulo 1 – Introdução – Breve introdução ao tema e ao relatório em si.
• Capitulo 2 – Interoperabilidade – Noção do conceito com breve exposição das
vantagens deste.
• Capitulo 3 – Tipos de Documentos – Apresentação dos principais de tipos de
documentos existentes.
• Capitulo 4 – Formatos de Documentos – Apresentação dos principais
formatos de documentos existentes, bem como algumas aplicações associadas.
Numa segunda parte, são abordados os conceitos existentes e as ferramentas que
existem disponíveis como solução para as necessidades actuais do mercado.
• Capitulo 5 – O presente – Uma introdução do que actualmente existe, das
aplicações e sistemas. É dada uma breve introdução a ferramentas existentes e
que utilizam a interoperabilidade.
• Capitulo 6 – Gestão Documental – Apresentação de alguns conceitos actuais
sobre a gestão documental, bem como workflow, ECM, EAI e EDI.
• Capitulo 7 – Soluções – Apresentação de algumas soluções existentes no
mercado.
Em anexo encontra-se também uma análise a Office Suites existente no mercado, e
algumas referências a formatos de ficheiros.
4
1.3 Convenção tipográfica Como no standard, foi necessário normalizar este relatório. Para isso foi definido um
tipo e tamanho de letra específico, Times New Roman n.º 12. As palavras em itálico
representam estrangeirismos e as “palavras entre aspas” servem para dar mais ênfase à
palavra em si. Cada título tem o tipo de letra Arial Negrito de tamanho n.º 36 e os
subtítulos têm tamanho n.º 16. O texto dentro de [parênteses rectos] referem-se à
especificação de uma extensão de ficheiro. O texto, ou palavras, em negrito pretendem
salientar uma palavra-chave ou uma frase de maior importância.
2. Interoperabilidade
“Interoperability is the ability of a system or a product to work with other systems or
products without special effort on the part of the customer. Interoperability becomes a
quality of increasing importance for information technology products as the concept
that «The network is the computer» becomes a reality. For this reason, the term is
widely used in product marketing descriptions“
in www.whatis.com
Uma primeira observação interessante, é da ausência desta palavra no dicionário
português e no entanto tão fundamental para diversas áreas. Numa tradução directa à
definição acima apresentada poderá ser a “habilidade de um sistema ou produto em
trabalhar com outros sistemas ou produtos sem o esforço especial por parte do cliente”.
No entanto, a ideia da interoperabilidade já existe desde muito cedo mas agora com uma
maior importância. Esta evoluiu de tal forma que existe em qualquer área – de facto, na
criação de algo novo (ou evolução), pensa-se na possibilidade de interagir com “outra
coisa”.
Um exemplo da interoperabilidade poderá ser encontrada no desenvolvimento de
aplicações no sistema AS400, através do ILE. O compilador permite a criação de
diversos módulos em diversas linguagens (RPG, Cobol, C+, etc.), sendo compiladas
num só único objecto.
RPG/400
C/400 SQLRPG/400
CL
ILE
Figura 2.1 – Estrutura do ILE
6
Actualmente existem diversos sistemas que interagem entre si. A existência de uma
base de dados num sistema AS400 não implica que o desenvolvimento tenha de ser
necessariamente feita no mesmo sistema. Existem ferramentas que permitem a
interacção entre os diversos sistemas. Deste modo, é possível o desenvolvimento num
outro ambiente (Windows, Linux, etc.) e em que as operações básicas são feitas num
outro ambiente.
BD
AS400
outros sistemas
Windows
Linux
Figura 2.2 – Interoperabilidade entre sistemas
Como será observado mais à frente, este esquema tenderá a evoluir para um outro nível
onde, com base numa normalização, poderá ser exportado, ou melhor, interpretado por
qualquer aplicação, sem a necessidade da aplicação que o leia tenha necessidade de
saber a origem do ficheiro. Ou seja, a interoperabilidade no seu máximo, permite o
ignorar da origem do ficheiro.
Interoperabilidade entre empresas Existem muitos problemas por causa da ausência da interoperabilidade, sendo mais
notório não dentro de uma empresa mas na relação entre empresas. A opção de um tipo
de aplicação deverá ser feita com base no que rodeia e sempre com uma perspectiva
futura. A Figura 2.3 serve de apresentação desse problema.
Interoperabilidade
7
Empresa A
Empresa C
Empresa D
Empresa B
Empresa E
versão A
versão B
versão C
versão E
versão D
A
B
C
C
C
CE
D
Figura 2.3 – Exemplo de relação de versões entre empresas
Para simplificar, assumimos que internamente, cada empresa possui a sua versão da
aplicação standardizada. Se a empresa A enviar documentação (encomendas, facturas,
etc.) para a empresa C, o primeiro problema possível de ocorrer será a versão da A ser
uma versão mais actualizada que a da empresa C. Sendo uma versão inferior, poderá
causar a impossibilidade de leitura dos documentos.
Esta situação poderá ser solucionada de diversas formas, mas implicando sempre a
cedência de uma das partes (ou até mesmo de ambas). No caso da empresa A, teria que
proceder às alterações necessárias para que quando fosse feito o envio da
documentação, houvesse um cuidado em saber em que versão deveria ser enviado, isto
assumindo que esta tinha capacidade/meios, para efectuar essa conversão. Para além
disso, implicaria a gestão de uma base de dados com a relação entre empresa e versão.
Na perspectiva da empresa C poderia acarretar custos, visto ter que proceder a um
upgrade à versão actual que possui, podendo esses custo não ficar somente a nível do
software, mas de hardware (devido aos requisitos da nova versão).
Em ambos os casos, existe obrigatoriamente uma necessidade de alteração que implica
não somente nos custos mas também na própria estrutura da empresa, tal como por
exemplo, na necessidade de formação a colaboradores para a nova versão, motivação à
mudança, etc.
Será que esse custo é aceitável? O investimento necessário para a adaptabilidade à
versão do cliente terá compensação na relação entre eles? E esta alteração que custo terá
no cliente para com as outras relações com fornecedores? O upgrade que este possa
8
fazer poderá implicar nos outros clientes e fornecedores que possua, gerando deste
modo um ciclo vicioso.
Esta situação pode estar dentro da empresa, assumindo em vez de empresas, temos
postos de trabalho, onde não existe qualquer tipo de normalização, conforme a figura
abaixo mostra.
versão A
versão B
versão C
versão E
versão D
Figura 2.4 – Exemplo de relação de versões entre postos de trabalho
Esta situação pode tornar-se um ciclo vicioso se transportamos para a relação entre
empresas. Sendo assim, a primeira norma a implementar numa empresa seria a da
standardização. Mas esta ainda não soluciona o problema entre as empresas.
Qual a aplicação standard a implementar? O mais lógico seria sempre a mais recente.
Mas voltemos ao tópico dos custos, é sabido que cada nova versão vem com requisitos
mínimos mais elevados.
Convém referir que estamos a falar somente em versões, mas o problema tende em
complicar com o acrescentar de aplicações, plataformas e todo o tipo de ferramentas
necessárias para a laboração em uma empresa.
Deste modo fica provada a necessidade da interoperabilidade, de ferramentas que
saibam interagir entre elas, não tendo a necessidade de importações/exportações de
Interoperabilidade
9
versões, sistemas, plataformas. Assim sendo, para a ferramenta seria somente um
ficheiro, algo que saiba identificar sem ter a preocupação de saber qual a sua origem.
Se idealizarmos a interoperabilidade, poderia ser vista do seguinte modo. Uma empresa
X com um sistema A, com uma aplicação B, com um formato C, numa versão D, envia
para outra empresa Y, que contém um sistema E, uma aplicação F, com um formato G,
numa versão H.
Sistema A
Aplicação B
Formato C
Versão D
Sistema E
Aplicação F
Formato G
Versão H
Empresa X Empresa Y
Figura 2.5 – Exemplo de interoperabilidade
Se estas duas empresas conseguirem interagir sem a necessidade de adaptação humana e
aplicacional no processo, teremos conseguido atingir a interoperabilidade.
3. Tipos de Documentos
Denomina-se informação digital ou electrónica a toda aquela que é armazenada num
formato binário, num suporte magnético ou óptico, e pode ser consultada num
computador. Este termo é muito amplo e inclui documentos de muitos tipos e formatos,
tais como livros electrónicos (eBooks), bases de dados, páginas Web, enciclopédias
electrónicas, etc. Podendo estar todas elas armazenados por exemplo, num CD-ROM ou
acessíveis via Internet.
Neste capítulo, começaremos por descrever as principais características do documento
digital, citando vantagens e desvantagens deste tipo de informação com o vulgo
documento em papel. Seguido das descrições dos principais tipos de documentos
digitais, quanto à sua forma e ao tipo de informação que apresentam.
3.1 Características da informação digital As principais características de todo o documento digital são as seguintes:
• Armazenado em formato binário – A informação digital é armazenada num
suporte magnético ou óptico em forma de zeros e uns.
• Processável por computador – Dado o tipo de suporte em que se armazena, a
informação pode ser acedida mediante programas de computador e pode ser
portanto processada informaticamente. Este tipo de processamento facilita o
levar a cabo de forma rápida e segura de operações repetitivas sobre a
informação que antes era necessário levar a cabo manualmente. Para além disso,
este tipo de formato aumentou enormemente a capacidade que temos em aceder,
manipular e visualizar a informação.
Como resultado dessa capacidade de processamento da informação:
a) É possível obter nova informação de valor acrescido, por exemplo,
mediante a extracção de gráficos ou estatísticas de uma série de dados
numéricos, ou mediante a obtenção de resumos e o contraste de distintas
informações sobre um mesmo tema.
12
b) É possível aceder à informação à distância. Através das redes
informáticas, podemos aceder de forma quase instantânea à informação
situada em qualquer parte do mundo.
c) É possível criar documentos que integram todo o tipo de informação
textual, visual e sonora – documentos multimédia.
• Informação é reutilizável – É fácil a duplicação da informação e a transferência
de um tipo de suporte para outro, mantendo um alto grau de fiabilidade na cópia.
Além disso, vários utilizadores podem aceder à mesma cópia ao mesmo tempo.
• Interactiva – Alguns documentos digitais pode ser interactivos, modificáveis
em função do comportamento do leitor. Uma forma básica de interactividade
pode ser por exemplo, a proporcionada através de formulários de motores de
busca em bases de dados de informação.
• Actualizável – A informação digital pode ser actualizada pelos seus autores de
forma fácil e económica, podendo gerar versões actualizadas da mesma de uma
forma rápida. A facilidade da distribuição na forma de discos ópticos, e pela
Internet, permite que as novas versões dos documentos cheguem aos
destinatários de uma forma rápida.
• Navegável – O uso de links em documentos hipertexto permitem que o
utilizador defina de forma na qual pretende aceder aos documentos, tanto quanto
à parte do documento a que quer aceder, bem como à ordem em que pretende
consultar.
• Recuperável – É fácil gerar manuais de documentos digitais e utilizar
mecanismos de busca dos mesmos. Os actuais motores de busca permitem a
procura de forma rápida, e relativamente eficaz, dos documentos que cumpram
uma grande variedade de condições em repositórios que podem conter milhares
deles.
3.2 Documento digital vs documento em papel Para comparar os documentos digitais com os documentos em papel será necessário
utilizar alguns parâmetros: ergonomia, actualização, densidade, interactividade,
durabilidade, autenticidade e visualização. Veremos as vantagens e desvantagens de
cada um dos tipos de documento em relação a estes parâmetros.
Tipos de Documentos
13
Com respeito à ergonomia, a versão em papel é muito mais fácil de manipular (pegar,
mover, etc.). Para aceder aos documentos digitais é necessário um computador, com um
aparelho de leitura e programas adequados. Obviamente, nem sempre dispomos de tais
elementos, e será muito mais fácil pegar num livro, num artigo em papel e lê-lo em
qualquer parte. No entanto, existem suportes de leitura a documentos digitais de
tamanho reduzido e fáceis de transportar. Quando este tipo de suporte estiver acessível
ao público em geral, os documentos digitais poderão igualar-se aos documentos de
papel.
Figura 3.1 – Dispositivo de leitura de documentos digitais
Este género de dispositivos ainda não tem o sucesso pretendido, quiçá pela tarefa
específica para qual se destina, havendo outras soluções mais completas, com
funcionalidades acrescidas. O dispositivo em causa é o PDA (Personal Digital
Assistant), uma ferramenta mais completa que, para além de permitir a leitura de
eBooks, ainda contém outras funcionalidades, tais como: lista de endereços, controlo de
tarefas, agenda, bloco de notas, email, etc. Para além disso permite a instalação de
outras aplicações tais como processador de texto, folha de cálculo e visualizador de
documentos, de entre outras, o que torna mais atractivo que o eBook.
A durabilidade é uma propriedade crítica para garantir a transmissão da ciência e da
cultura a longo prazo. Ainda que pareça mentira, os modernos sistemas de
armazenamento magnético e óptico são menos duráveis que os documentos em papel.
14
Sabe-se que um documento editado num papel de qualidade tem a duração mínima de
uns quinhentos anos, enquanto que um disco óptico pode durar em condições óptimas
uns cem anos. Mas mesmo assim, está comprovado que o uso normal de um disco
óptico tem uma garantia de vida média de uns dez anos.
Por outro lado, os documentos digitais estão sujeitos, não só ao desgaste físico do
suporte, mas também a tornarem-se obsoletos em termos de tecnológica. A evolução
dos tipos de suporte, da tecnologia e dos programas de acesso a documentos digitais em
poucos anos, torna um suporte que parecia legível a longo prazo deixe de ser acessível.
Basta ter como exemplo as disquetes de 5”1/4 e no que já está acontecer às de 3”1/2.
Actualmente já é difícil encontrar um computador novo que disponha de um leitor de
disquetes, com o qual será complicado aceder a toda a informação que tenha sido
guardada nesse tipo de suporte. Esta mesma dúvida pode-se colocar a respeito da
substituição dos “modernos” CDs, pelo mais “modernos” DVDs, embora os fabricantes
dos leitores de DVD garantam que estes leiam os CDs.
O terceiro parâmetro em que o papel supera ao documento digital é a autenticidade,
referida à sua resistência à falsificação. É relativamente complicado falsificar um
documento em papel, ao contrário, não existem muitos impedimentos para duplicar ou
modificar um documento digital, em ocasiões, indetectável. Esta circunstância faz com
que os documentos digitais não tenham validade jurídica. Também neste âmbito a
tecnologia e as leis estão a evoluir, e já se estão a estabelecer sistemas de autenticação
que permitam identificar de modo inequívoco a originalidade de um documento digital.
Em relação à visualização dos documentos, a qualidade da mesma é superior no caso
do papel que nos documentos digitais. Os monitores tradicionais somente funcionam na
base de um raio de luz que actualiza o conteúdo do mesmo várias vezes por segundo.
Este modo de funcionamento produz um “piscar”, imperceptível, mas que provoca
fadiga na visão. Sabe-se que uma frequência superior a 120 actualizações por segundo
(120Hz) elimina esse “piscar” e iguala-se à qualidade de visualização com o papel nesse
sentido. Actualmente a maioria dos monitores permitem frequências entre 60 e 90Hz.
Por outro lado, os documentos digitais são superiores ao papel nos parâmetros de
actualização, densidade e interactividade. Os suportes informáticos, tais como discos
ópticos ou magnéticos, permitem o armazenamento de uma enorme quantidade de
Tipos de Documentos
15
informação num espaço muito reduzido. Por exemplo, num disco óptico é possível
guardar mais de 200.000 páginas de texto. Imaginemos a quantidade de espaço que
ocupariam 1.000 livros de 200 páginas cada um e comparássemos com o espaço que
ocupa um CD.
3.3 Tipos de documentos Em primeiro lugar, podemos classificar os documentos electrónicos em função do tipo
de informação que armazenam. Neste sentido podemos diferenciar quatro grandes tipos
de documentos: texto, não texto, multimédia e hipertexto. Segue-se um resumo breve da
consistência de cada um destes tipos de documentos:
• Documentos de texto. Estes tipos de documentos contêm somente texto e são
bastantes habituais. Por exemplo, a maioria dos livros pode ser armazenado
neste formato, como também inúmeros artigos de jornal ou de revistas,
legislação, etc. Duas das principais vantagens deste formato são a possibilidade
de os visualizarmos facilmente, sem problemas de formato ao trocar de
computador ou de programa, e a grande quantidade de informação de texto que
podemos armazenar num espaço tão reduzido. Por exemplo, uma disquete ou um
disco óptico. Para além disso, existe uma grande quantidade de programas que
permitem visualizar e modificar os textos deste tipo.
• Documentos não texto. São documentos que contêm outro tipo de informação
diferente de texto. Por exemplo, podemos incluir neste tipo de documentos,
aqueles que armazenam imagens estáticas, sons, filmes ou programas
executáveis.
• Documentos Multimédia. São documentos electrónicos que combinam texto,
gráficos, sons, imagens e programas executáveis. Estes documentos permitem a
interacção do utilizador, e compõem-se de muitos elementos de informação
diferentes, cujo conteúdo pode variar em alguns casos como resultado da
interacção com o utilizador. Como exemplo, podemos destacar deste tipo de
documentos as paginas Web ou as enciclopédias interactivas de um CD/DVD.
• Hipertextos. São documentos que permitem definir uma estrutura complexa
composta de elementos com diferentes tipos de informação multimédia unidos
mediante ligações lógicas. Tratam-se de documentos que podem ser folheados
16
rapidamente e cuja visualização não tem de ser sequencial. O método de
interacção com estes documentos consiste em recorrer aos elementos de
informação (textos, imagens, animações, etc.) pela ordem preferida utilizando,
para tal as ligações lógicas. Desta maneira pode-se ir descartando comodamente
a informação que se ache irrelevante, ao mesmo tempo que se aprofunda nos
aspectos consideramos mais relevantes. O exemplo mais conhecido deste tipo de
documento é as páginas Web.
Em segundo lugar, podemos classificar os documentos em função do seu conteúdo e da
sua funcionalidade. Neste sentido, podemos diferenciar entre os documentos
secundários e os primários.
Os documentos secundários são aqueles que contêm referencias a outros documentos,
remetendo-nos a eles se queremos obter informação mais detalhada. Neste tipo de
documentos incluem por exemplo, as bibliografias, os catálogos de lojas ou bibliotecas,
os directórios de recursos à Internet, etc.
Os documentos primários são aqueles que não são secundários, isto é, aqueles que nos
fornecem a informação em primeira-mão, sem nos remeter a outros para a conseguir.
Podemos incluir neste tipo de documentos:
• As obras de criação, desde uma obra literária até a uma fotografia artística.
• As obras técnico-científicas, incluindo teses, artigos de revista cientificas, ou
manuais de utilizador de um electrodoméstico ou um programa de computador
• Os documentos administrativos ou legais, incluindo normativas e legislação,
documentação de gestão, como facturas, etc.
4. Formatos de documentos
No âmbito da informática, todos os documentos, e em geral toda a informação que é
manipulada mediante computadores armazena-se na forma de ficheiros. Os ficheiros são
o elemento básico pelo qual os sistemas operativos armazenam a informação. Sistemas
operativos como as distintas versões do Windows e do UNIX armazenam toda a
informação em ficheiros e o organizam em dispositivos de armazenamento (discos
duros, disquetes, disco ópticos, etc.) mediante um sistema hierárquico de ficheiros e
directórios. O Windows representa graficamente esses elementos mediante ícones
correspondentes a ficheiros e pastas. Dentro destas pastas podem ser armazenados
outros ficheiros e pastas, e assim continuamente.
Os ficheiros guardam a informação num determinado formato que, em sistemas
operativos tipo Windows se identifica mediante uma extensão de 2 a 4 letras,
acrescentadas ao seu nome e mediante um tipo particular de ícone com o qual se
apresenta no ecrã.
Quando se fala de formato de um ficheiro informático referimo-nos à forma em que se
codificou a informação do mesmo. Isto é, a extensão do formato de um ficheiro
identifica o modo em que se traduz os zeros e uns da informação que armazena. Este
formato deve ser reconhecido e interpretado de forma adequada pelos programas que o
manipulam para permitir a visualização e manipulação da informação que contém.
Existem formatos próprios para determinadas aplicações que correspondem à forma em
que as mesmas armazenam a informação por defeito. Por exemplo, os documentos
armazenados com o Microsoft Word têm a extensão [.doc], enquanto que os
armazenados com WordPerfect usam a extensão [.wpf]. Por outro lado, existem
formatos de ficheiros mais genéricos que correspondem a um tipo particular de
informação e que podem vir num formato standard. Por exemplo, a maioria das imagens
que existem na Internet estão armazenadas em formato GIF e JPEG. No caso dos
formatos genéricos, existem distintos programas que podem ler, visualizar e permitem
18
modificar o conteúdo dos ficheiros. Assim, inúmeras aplicações permitem-nos aceder
aos formatos GIF e JPEG ou guardar os gráficos que tenhamos gerado ou modificado
com elas nesses formatos. A afirmação anterior não significa que não possamos tentar
abrir qualquer tipo de ficheiro com a maioria das aplicações. O que ocorre simplesmente
será que quando as aplicações não reconhecem um determinado formato, podem
produzir erro ou mostrar a informação mais estranha e imaginável no ecrã, tal como
podemos constatar na Figura 4.1.
Figura 4.1 – Exemplo de resultado de um ficheiro não reconhecido pelo Word
Um dos tipos de informação mais difundida é o texto electrónico. Num primeiro nível
podemos classificar estes em dois tipos básicos:
O texto puro ou texto sem formato, correspondente a ficheiros que só armazenam
informação texto, incluindo letras, números, acentuação e outros símbolos como
parêntesis, pontos de interrogação, etc. Alguns destes ficheiros restringem tanto os
caracteres que podem armazenar, que não permitem, por exemplo, guardar texto com
acentos tal como o “ã”.
O texto com formato é aquele que não só contém a informação texto, mas que também
o dota de determinadas características que melhoram a apresentação global do
documento. Este tipo de documentos pode, por exemplo, incluir texto utilizando fontes
distintas (tipo de letra), podemos utilizar o texto em negrito, itálico, ou acrescentar
Formatos de documentos
19
operações, tais como o centrar ou justificação. Mais ainda, embora não seja estritamente
texto, podemos incluir na categoria de textos electrónicos com formato aqueles que
incorporam imagens, gráficos ou tabelas e que podem ser colocados em determinadas
posições do documento.
Algumas condições desejáveis nos ficheiros que guardam texto com formato são:
• Que possam ser visualizados com um leitor universal, fácil de se conseguir para
distintos sistemas operativos e se possível gratuito.
• Que conservem a cor, formatos e fontes com os quais foram gerados.
• Que possam incluir imagens.
• Que imprimam com fidelidade tal como o original.
• Que permitam acrescentar condições de segurança para impedir a sua alteração,
e até a sua impressão.
• Que ocupem pouco espaço de disco.
4.1 Texto puro (ASCII) Para guardar a informação texto será necessário acordar numa codificação que faça
corresponder qualquer carácter armazenado com uma combinação de zeros e uns.
Existem diversos standards internacionais que estabelecem essa correspondência, o mais
extenso de todos é o código ASCII (American Standard Code for Information
Interchange).
A versão básica deste código inclui um máximo de 128 caracteres, dos quais os 31
primeiros não correspondem aos caracteres observados no ecrã, sendo usados para
armazenar informação de controlo, por exemplo, indicar quando as alterações de
paragrafo. Neste código, os números de 0 a 9 correspondem aos códigos de 48 a 57 e as
letras minúsculas estão codificadas com os valores entre 97 e 122. Na versão básica do
código não estão representadas as letras com acentuação, como a letra ã, ou os símbolos
de interrogação ou exclamação (!, ?), nem diversos caracteres especiais utilizados por
diferentes idiomas, tal como o inglês. Dado que isto apresenta um claro problema em
outros países anglo-saxónicos, existe uma versão mais completa do código de ASCII,
que permite armazenar até 256 caracteres distintos e que incluem todos os da versão
20
básica na mesma posição e acrescenta os que temos referido. Na Tabela 4.1 podemos
ver alguns dos caracteres acrescidos ao código ASCII.
Tabela 4.1 – Códigos acrescidos à tabela ASCII
Quanto às vantagens e desvantagens dos documentos de texto puro, podemos concluir
que: a principal vantagem do texto puro será a utilização de uma codificação standard
de cada símbolo. Deste modo, numerosas aplicações podem ler o conteúdo deste tipo de
documento e nos permitir a sua modificação. Assim, todos os processadores e editores
de texto podem ler documentos com este formato e a maioria deles oferecem a
possibilidade de guardar os documentos na sua utilização. Isto é feito com a finalidade
de facilitar ao máximo a difusão da informação e simplificar o seu acesso.
Pela sua própria definição os documentos em texto puro não guardam cor, formatos ou
fontes porque não permite incorporá-los, nem tão pouco a inclusão de imagens.
Quanto à segurança, não é possível ter condições para evitar a alteração deste tipo de
documentos.
Finalmente, e como outra vantagem deste tipo de formato, os documentos guardados
neste formato ocupam um espaço muito reduzido, dado que somente guardam os
caracteres que contêm e nenhuma informação adicional sobre o seu formato.
Por exemplo, um texto com a seguinte frase “Isto é um teste.”, guardado em dois tipos
de formato (.txt e .doc), obtêm-se valores muito diferentes (ver a Tabela 4.1):
Formatos de documentos
21
16 bytes 36 Kbytes
Tabela 4.2 – Comparação do tamanho de ficheiros
Como pode ser observado, o texto puro somente ocupa o tamanho proporcional ao
número de caracteres nele contido (incluindo espaços e pontuação), enquanto que o
tamanho de um texto não puro atinge um valor muito superior.
4.2 Texto com Formato No contexto em que se enquadra o relatório, referem-se dois dos tipos de texto com
formato: processador de texto e folha de cálculo.
4.2.1 Processador de texto
Uma parte importante dos documentos de texto que queremos utilizar com os
computadores têm sido gerados utilizando um processador de texto. O objectivo deste
tipo de aplicações é precisamente a criação ou modificação de texto com formato.
Alguns dos processadores de texto mais conhecidos são o Microsoft Word e o
WordPerfect.
Figura 4.2 – Icone do Microcoft Word
Os processadores de texto mais utilizados são comerciais e guardam por defeito a
informação num formato que lhes é próprio. Isto significa que somente esse mesmo
processador é capaz de ler esses documentos. No entanto, dada a importância do fácil
intercâmbio de informação, todos os processadores permitem armazenar os documentos
em outros formatos que não possuam a restrição anterior. Por exemplo, podemos
22
guardar a informação como texto puro no formato RTF (Rich Text Format). O problema
de guardar os documentos com um processador de um formato diferente do que lhe é
próprio, é que em muitos casos se perdem partes das suas características. Por exemplo,
se guardarmos um documento Word como texto puro, perdemos toda a formatação que
o documento contenha incluindo, obviamente, qualquer imagem ou gráfico.
Outro problema que têm os formatos próprios dos processadores de texto é a pouca
consistência nos mesmos entre versões distintas do programa. Assim, distintas versões
do mesmo processador podem não reconhecer um documento gerado por outras ou
alterar notavelmente a sua aparência. É muito normal que versões antigas de um mesmo
processador não sejam capazes de abrir documentos gerados com versões mais recentes.
Por exemplo, Word 6 pode ter bastantes dificuldades em abrir e visualizar
correctamente um documento criado e guardado com o Word 2003. Para além disso,
uma mesma versão de um processador utilizada sobre dois distintos sistemas operativos
(por exemplo, Windows e MacOS) pode dar lugar a visualizações bastantes diferentes
do mesmo documento.
De igual modo ao que acontece com a visualização, nem sempre é possível imprimir
este tipo de documentos com fidelidade. O resultado depende em grande medida da
versão do processador que usamos para imprimir, dos tipos de caracteres disponíveis no
sistema operativo e na impressora utilizada.
Os principais processadores de texto só incorporam alguns mecanismos para proteger os
documentos contra a sua alteração posterior. Principalmente com o uso de palavras
passe (password).
Outro dos inconvenientes deste tipo de formato são os ficheiros que o utilizam muito
espaço. Sendo assim, bastante mais do que parece lógico para incluir informação sobre
o seu conteúdo e formato.
Mas não existem somente o processador de texto Word e WordPerfect, também existe o
AbiWord tendo como uma das principais vantagens ser open-source.
Fazendo parte de um enorme projecto conhecido como AbiSource, começado pela
SourceGear Corporation, tendo como objectivo o desenvolvimento de uma Office Suite.
Este foi começado pelo projecto de um processador de texto, o AbiWord.
Mal a SourceGear lançou o código fonte do AbiWord, foi formada de imediato uma
comunidade a volta do projecto, nunca tendo parado mais, lançando em Abril de 2002 a
Formatos de documentos
23
primeira versão, seguido de uma segunda versão em Setembro de 2003 (versão 2.0).
Actualmente, estão a trabalhar arduamente para que seja lançada uma versão 2.2.
Figura 4.3 – AbiWord (versão 2.0)
O AbiWord é um dos únicos entre diversos processadores de texto que corre em
diversas plataformas. O código fonte foi escrito de forma a permitir que corra em
qualquer sistema operativo tais como, UNIX, Windows 95 e seguintes, QNX Neutrino
6.2 e MacOS X, sendo este último numa versão nativa.
Figura 4.4 – AbiWord: multi-plataforma
24
Possui o conceito de interoperabilidade, permitindo desta forma, a partilha (leitura e
escrita) de outros tipos de documentos standards, tais como OpenOffice.org, Microsoft
Word, WordPerfect, bem como documentos RTF, páginas Web HTML e outras2.
No entanto, é uma versão ainda em evolução, e que necessita de correcções a nível de
menus.
Figura 4.5 – AbiWord: alguns erros ortográficos a corrigir
No entanto, erros destes não ocorrem somente em aplicações open-source. Um caso
disso é na versão portuguesa do Outlook, onde foi traduzida a palavra rules, para
réguas, onde supostamente deveria ser regras. Este exemplo serve como exposição do
não assumirmos que uma aplicação “famosa” não tenha erros – aliás, basta ver pelos
constantes e tão bem conhecidos critical updates e fix errors disponibilizados pela
Microsoft.
2 A comparação entre as diversas aplicações encontra-se em anexo. Comparação esta feita num nível de
pacotes de aplicação (Offices Suites) tendo como base a aplicação mais usada, o Microsoft Office.
Formatos de documentos
25
4.2.2 Folhas de cálculo
A folha de cálculo consiste numa poderosa ferramenta de apoio à gestão e ao processo
de tomada de decisão, dentro de uma empresa ou na vida particular.
Normalmente utilizada para elaboração de tabelas, folhas de cálculo em geral, bem
como atribuição de formulas para obtenção de resultados rápidos e precisos. Uma folha
de cálculo electrónica substitui o processo manual ou mecânico de escrita e cálculos.
Figura 4.6 – Icone do Microsoft Excel
O Excel é considerado a folha de cálculo mais poderosa e ao mesmo tempo a mais fácil
de utilizar. As potencialidades, a nível de realização de cálculos simples ou complexos,
a análise gráfica de dados, a possibilidade de partilha de dados com outras aplicações, e
um número de outras qualidades associadas às facilidades permitidas pelas barras de
botões, menus de atalho, preenchimento automático, tornam-no incomparável a
qualquer outra folha de cálculo.
4.3 Formatos de visualização e impressão Existem formatos especialmente criados para a visualização e impressão de qualidade
de texto com formatos. Entre eles podemos destacar dos mais usados: o formato PDF e
o formato PostScript.
O formato PDF (Portable Document Format) [.pdf] é um formato muito difundido,
criado pela Adobe e pensado especialmente para a distribuição de textos electrónicos
com formato. Incorpora todas as características desejáveis para este tipo de formato:
• Existe um visualizador universal de distribuição livre (gratuito) que permite
visualizar este tipo de documento em sistemas operativos mais avançados: o
Acrobar Reader.
• O formato está pensado para conservar as fontes, formatos e cores dos
documentos.
26
• Permite a publicação precisa de imagens e mantém-nas perante a troca de
sistema operativo.
• Embora não seja estritamente um formato de impressão, mantém um elevado
grau de fidelidade entre o original e as versões impressas.
• As aplicações para gerar documentos em PDF permitem incorporar condições de
segurança nos documentos que impedem a sua posterior alteração ou impressão.
• Os documentos em PDF costumam ocupar menos espaço que os equivalentes
gerados com os processadores de texto.
Figura 4.7 – Icone do PDF
O principal inconveniente dos documentos no formato PDF é que não podem ser
editados e modificados, e torna-se complicado extrair, copiar parte do texto ou das
imagens que contém. Dado que se trata de um formato pensado para o intercâmbio e a
visualização de documentos, não existem programas pensados para a sua modificação.
Podemos criar ficheiros com este formato a partir de processadores de texto e de outras
aplicações, como editores gráficos ou folhas de cálculo. Para tal, é necessário dispor de
uma aplicação comercial. Esta aplicação permite imprimir os documentos sobre uma
impressora especial que não gera uma cópia em papel, mas num ficheiro em formato
PDF. Ainda permite incorporar-se em aplicações, como Word, a possibilidade de
guardar directamente neste formato mediante uma das suas opções de menu.
O formato PostScipt [.ps] foi criado especificamente para permitir a impressão de
documentos com alta qualidade e fidelidade do original. Este tipo de ficheiros possui
umas características muito similares ao formato PDF:
• Existem visualizadores bastantes difundidos que permitem visualizar os
documentos PostScript. No entanto, não se trata de um documento pensado para
uma visualização de qualidade, mas para a impressão, com o que nem sempre
Formatos de documentos
27
podemos esperar bons resultados no ecrã. O visualizador mais difundido deste
tipo de formato é o GhostView.
• Permite conservar as fontes, formatos e cor dos documentos na sua versão
impressa.
• Conserva com total precisão o formato ao imprimir o documento, já que é a sua
principal finalidade. No obstante, para se poder imprimir documentos deste tipo
será necessário utilizar impressoras que reconheçam este formato. Este tipo de
impressoras denomina-se impressoras PostScript.
• O formato PostScript não incorpora mecanismos para impedir a sua
modificação, embora, tal como pode ser visto na Figura 4.8, não será difícil
conseguir aceder directamente à informação armazenada.
• Os documentos em PostScript costumam ser de tamanho pequeno salvo quando
incluem imagens e gráficos que ocupam muita memória.
Figura 4.8 – Exemplo de conteúdo de um ficheiro em formato PostScript
Tal como acontece com o formato PDF, os ficheiros em PostScript não podem
modificar-se, nem se pode extrair ou copiar parte dos mesmos, tão-somente podem ser
visualizados e, fundamentalmente, imprimir-se.
Os ficheiros PostScript podem ser gerados a partir de qualquer aplicação que gere um
documento susceptível de ser impresso. Se possuirmos uma impressora PostScript e o
28
software adequado para imprimir na mesma, as próprias aplicações permitirão imprimir
sobre um ficheiro PostScript em lugar do papel.
4.4 Linguagens de formato As linguagens de formato estão pensadas para descrever o conteúdo e formato de
documentos. Mediante uma sintaxe pré-estabelecida permite-nos descrever todas as
características relativas ao formato do documento e do texto que contém, podendo
incluir aspectos tais como margens, cabeçalhos, características associadas aos
caracteres, aos parágrafos, etc. Além disso, permite-nos descrever tabelas e publicar
imagens. A ideia é poder descrever textos electrónicos com formato totalmente
independente do que estejamos a visualizar, de modo que a sua aparência não varie
ainda que modifiquemos de computador ou de sistema operativo.
O mais difundido destas linguagens de formato é actualmente o HTML (HyperText
Markup Language), dado que se usa para a criação de páginas Web. Esta linguagem de
formato tem origem no SGML (Standard Generalized Markup Language) que consiste
num standard internacional para definir linguagens de formato baseado em etiquetas
(tags3). A linguagem HTML baseia-se em normas estabelecidas pelo SGML para dar
formato a textos e incorporar ligações, isto é, para criar documentos hipertexto com
formato.
Figura 4.9 – HTML
Dado que as páginas Web têm aumentado na complexidade para responder às exigências
dos utilizadores da Web, a linguagem utilizada para as poder descrever foram evoluindo.
3 Significa que existem textos especiais que incorporam o documento e que permitem definir as partes de
que constam e tudo relativo ao formato das mesmas.
Formatos de documentos
29
No entanto, esta linguagem continua a ter sérias limitações para adaptar-se às novas
tecnologias e meios, tal com o telemóvel. O que se fez foi definir uma nova versão das
normas dadas pela SGML, o denominado XML (eXtensible Markup Language), a partir
do qual é possível definir novas versões do HTML, denominado XHTML.
Para além das linguagens de formato relacionadas com o HTML e com as páginas Web,
existem outras linguagens de formato mais comum entre os cientistas e investigadores,
já que estão especialmente pensados para a descrição de artigos técnico-científicos com
um formato sofisticado, incluindo gráficos e formulas matemáticas complexas. Essa
linguagem denomina-se LaTeX e existem programas que permitem a tradução dos
documentos escritos nos mesmos formatos visualizáveis ou imprimiveis, tal como o
PostScript.
As características gerais dos documentos definidos mediante linguagens de formato são
as seguintes:
• Ao estar pensado para ser visualizados em qualquer sistema, existem programas
para distintos sistemas operativos que são capazes de traduzir a linguagem de
um documento com formato. Por exemplo, os Web browsers estão pensados
para visualizar documentos escritos em HTML, e as versões mais recentes dos
principais processadores de texto também permitem a sua visualização.
• Permitem a inclusão de fontes, formatos e cores no documento, ainda que a
variedade dos mesmos dependa da linguagem em concreto. Assim, a linguagem
HTML é bastante limitada neste sentido, enquanto o LaTeX é muito mais
completo.
• As linguagens de formatos podem permitir a publicação de imagens no texto,
mas para a precisão do resultado obtido depende de cada linguagem em
concreto.
• A qualidade de impressão obtida depende muito da linguagem utilizada.
Enquanto que o HTML não garante uma impressão fidedigna e depende muito
do programa visualizador utilizado para imprimir, a linguagem LaTeX está
pensada para gerar versões imprimiveis que não variem com o alterar do
trabalho.
• As linguagens de formato não estão pensadas para incorporarem mecanismos de
protecção dos documentos obtidos.
30
• Os ficheiros com linguagem de formato têm um tamanho reduzido, já que
contêm somente texto puro. No entanto, há que ter em conta que não incorporam
as imagens ou gráficos, e que estes devem ser tratados como ficheiros
adicionáveis cujo tamanho deve ser somado ao ficheiro com a linguagem de
formato.
4.5 LaTEX A melhor forma de editar documentos científicos é recorrendo ao TEX/LaTEX. O TEX é
um sistema completo de composição tipográfica, criado por Donald Knuth, da
Universidade de Stanford, apoiado por uma linguagem de macros, o LaTEX,
desenvolvido posteriormente por Leslie Lamport, permite a formatação dos documentos
a serem processados.
Tradicionalmente é muito utilizado por investigadores das ciências exactas, devido à sua
grande capacidade de compor fórmulas matemáticas, mas existem bons motivos para a
sua aplicação em outras áreas. Em geral, os processadores de texto são adequados para
pequenos textos, nomeadamente cartas, mas os problemas crescem à medida que o
tamanho do documento aumenta. No caso de uma tese, por exemplo, existe muita
frustração das figuras que teimavam em sair das margens ou de índices que não
indicavam as páginas correctamente.
Figura 4.10 – LaTex
Para além do sistema base, o LaTEX dispõe de uma enorme variedade de pacotes e
estilos para os mais diversos fins, desenvolvidos por vários autores, livremente
disponíveis através da Internet, nos servidores do CTAN (Comprehensive TEX Archive
Network).
Formatos de documentos
31
4.5.1 LYX
O LYX é um programa que funciona como uma interface gráfica do LaTEX, permitindo
que um investigador utilize os recursos avançados desta linguagem sem necessitar de a
conhecer. O programa é, nas palavras dos próprios autores, um processador de
documentos. Isto significa que, embora a utilização do LYX tenha parecenças com a de
um processador de texto, o utilizador só necessita de se concentrar na redacção do texto
e na atribuição de categorias e de algumas propriedades aos diferentes elementos do
mesmo.
O LYX funciona um pouco como um processador onde o autor atribui estilos aos
diferentes parágrafos e elementos do documento, mas onde não tem que se preocupar
com o aspecto dos mesmos, excepto através da definição global do tipo de documento
que pretende produzir. Da formatação final do mesmo, encarrega-se o próprio sistema
de composição, o TEX. Aquilo que o utilizador visualiza no monitor é uma imagem
representando o que ele pretende que o texto seja, não como este ficará depois de
composto, embora esta última imagem possa ser visualizada a qualquer momento.
Como todas as interfaces gráficas, o LYX, introduz algumas limitações aos recursos e
opções do LaTEX, mas mesmo isto não é um problema. Além de podermos incluir
comandos directamente no texto, dentro do próprio LYX, teremos sempre a
possibilidade de produzir um ficheiro em LaTEX, modificá-lo com um editor de texto e
processá-lo directamente como seria feito sem o LYX.
Se não necessitarmos de outras funcionalidades não incluídas no LYX, nem sequer
necessitamos de ver ou processar o LaTEX. O programa faz tudo isso em background e
cria os ficheiros necessários em pastas temporárias, longe da nossa vista.
Figura 4.11 – Lyx
O LYX é já um programa estável e maduro, mas continua a ser desenvolvido.
Actualmente, o programa inclui:
32
• Suporte para várias classes de documentos (artigos, livros, relatórios, cartas,
diapositivos).
• Inclusão de notas de rodapé e de margem, de referências bibliográficas, de
figuras, de tabelas e de referências cruzadas.
• Numeração de secções e formação automática do índice de conteúdos.
• Formação automática de bibliografias e de índices de figuras, de tabelas e de
termos.
• Correcção ortográfica.
• Editor de equações matemáticas.
4.5.2 Editores e outros programas
Caso necessitemos de algumas funcionalidade não incluídas no LYX, pode ser
necessário utilizar outros programas para editar e auxiliar o processamento do código do
LaTEX. Este encontra-se em ficheiros de texto normais, que podem ser modificados
com qualquer editor, mas existem vários que possuem a característica de reconhecer o
próprio código. O editor Emacs possui um módulo próprio para o TEX que, entre outras
funções, permite validar o código. Outros editores, como o Glimmer, o Kate ou o
KWrite, incluem o LaTEX entre as linguagens reconhecidas, o que se traduz na
possibilidade de distinguir visualmente os comandos, os comentários e o texto do
documento, através da atribuição automática de diferentes cores. Mais especializado é o
Kile que, além de incluir igualmente um editor com capacidades de realçar o código,
permite controlar várias operações de processamento e incluir muitos comandos do
LaTEX através do menu. Igualmente muito úteis são as várias interfaces gráficas que
permitem controlar de forma cómoda e centralizada todas as operações de edição e
processamento do LaTEX, evitando a introdução de comandos no terminal. Estes
programas não incluem um editor próprio, como acontece com o Kile, mas permitem-
nos definir livremente quais as ferramentas, incluindo o editor, que pretendemos utilizar
para cada tarefa.
4.5.3 O LaTeX no Windows
O Windows não é o melhor sistema operativo para utilizar o LaTEX, ou outras
aplicações de open-source. Os sistemas mais gráficos ou fáceis de utilizar são
Formatos de documentos
33
licenciados e com custos muito elevados. Mesmo assim, vários programas em open-
source podem ser utilizados, nomeadamente as distribuições MikTEX, de Christian
Schenk, e fpTEX, equivalente ao teTEX para Linux. Ambas reúnem, num sistema
coerente e fácil de instalar, os vários programas e ficheiros necessários para o TEX, o
LaTEX e os principais pacotes de aplicações funcionarem. Para além destes, os
utilizadores em Windows necessitarão de instalar o Ghostscript para interpretar a
linguagem PostScript, sem o qual só poderão processar documentos sem imagens nesse
formato. Também será aconselhável um visualizador desta linguagem, para o que
dispõem do GSview.
Figura 4.12 – MikTeK
WinEdt, de Aleksander Simonic, é um dos três programas licenciados aqui referido.
WinEdt não é uma aplicação em open-source, mas sim shareware, que permite uma
utilização à experiência durante 30 dias e pode ser registado por menos de uma dezena
de euros. É uma aplicação semelhante ao Kile e não ao LYX. WinEdt é um editor
especializado em LaTEX, que serve igualmente de interface para a manipulação de
ficheiros com comandos do LaTEX e para a visualização através dos programas
auxiliares, como o GSview, instalados no sistema. Como editor, o WinEdt identifica os
comandos do LaTEX e verifica a respectiva sintaxe, além de verificar a ortografia, para
o que dispõe de um dicionário em português. Na sua qualidade de shell do LaTEX, o
WinEdt facilita, e em regra dispensa, a utilização da linha de comandos do MS-DOS,
necessária se só dispomos do MikTEX. Igualmente proprietários são o Word2TEX e o
TEX2Word do Chikrii SoftLab, que permitem exportar e importar o formato LaTEX a
partir do Microsoft Word. São pequenos programas que alargam a funcionalidade de
gravação do TEX2Word, que na sua forma original ignora totalmente o LaTEX.
O módulo de exportação, Word2TEX, é mais maduro e suficientemente configurável
para se obterem documentos aceitáveis em LaTEX a partir de ficheiros produzidos no
Microsoft Word.
34
4.5.4 A comunicação com outros sistemas e programas
Por muito satisfeitos que possamos estar com o sistema de edição baseado em LaTEX, a
verdade é que não podemos dispensar a capacidade de converter os nossos ficheiros no
formato utilizado pelo Microsoft Word e vice-versa. O número de utilizadores deste
programa é de tal forma grande, que o seu formato se tornou um standard de facto na
troca de ficheiros entre entidades (empresas, institutos, pessoas, etc.). O facto de o
formato ser inteiramente proprietário e sujeito a alterações relacionadas com a versão do
programa (por exemplo, na passagem do Word 98 para o Word XP), não impediu este
desenvolvimento, que apenas começou a ser posto em causa com a difusão dos vírus de
macro. A troca de ficheiros através do formato [.doc] do Word é tanto mais aberrante,
quanto a própria Microsoft, que desenvolveu o formato RTF, e que mantém a
informação mais relevante contida nos ficheiros em Word.
4.6 XML
A plain text file is one-dimensional. It contains no information about its contents.
An HTML file is two-dimensional; it contains basic markup that describes the elements
of a document (...) With XML, documents become multidimensional – capable of being
processed by different programs, delivered by different methods, and displayed in
different views.
by Dougherty, 1997
O XML (eXtensible Markup Language) surgiu para suprir toda essa carência deixada
pelo HTML no desenvolvimento de aplicações avançadas para a Internet,
principalmente no que toca aquelas aplicações que precisam manipular um grande
volume de dados. Um dos objectivos por trás dessa linguagem é possibilitar a
transferência e manipulação de dados através da Internet de modo fácil e consistente, de
tal forma que qualquer tipo de aplicação, independentemente da plataforma, sistema
operativo, ou linguagem em que foi construída consiga manuseá-los.
O XML foi desenvolvido pela organização W3c (World Wide Web Consortium’s)
visando promover interoperabilidade entre aplicações. O XML fornece significativo
Formatos de documentos
35
avanço na forma como os dados são descritos e manipulados via aplicações Web através
do uso de um formato padrão simples e flexível. O W3c resume o XML em 10 pontos:
1. XML é para estruturar dados – São exemplos de dados estruturados, folhas de
cálculo, cadernos de endereços, parâmetros de configuração, transacções
financeiras e desenhos técnicos. XML é um conjunto de regras (podendo ser
encaradas como convenções ou directrizes) para projectar formatos de texto que
o permitam estruturar os dados. XML não é uma linguagem de programação e
não é necessário ser um programador para usá-la ou aprendê-la. XML torna
simples para o computador gerar e ler dados, e garantir que sua estrutura não
seja ambígua. XML evita os problemas mais comuns em projectos de
linguagens; ela é extensível, independente de plataforma e suporta
internacionalização e localização. XML é 100% conforme ao padrão Unicode.
2. XML parece-se um pouco com HTML – Como HTML, XML usa marcadores
(palavras envoltas pelos sinais “<” e “>”) e atributos (na forma nome=”valor”).
Mas enquanto HTML específica o que cada marcador e atributo significam, e às
vezes como seu conteúdo aparecerá num browser, XML usa os marcadores
apenas para delimitar o espaço entre os dados, deixando sua interpretação
completamente a cargo da aplicação que os lê. Por outras palavras, ao ver “<p>”
num arquivo XML, não assuma que é um parágrafo. Dependendo do contexto,
pode ser um preço, um parâmetro, uma pessoa, um p... — ora, quem disse que a
palavra tem que começar por “pê”?
3. XML é texto, mas não dá para se ler – Programas que produzem folhas de
cálculo, listas de endereços e outros dados estruturados frequentemente os
gravam em disco, usando um formato binário ou texto. Uma vantagem do
formato texto é que ele permite às pessoas, se necessário, ver os dados sem usar
o programa que os produziu; ou seja, pode-se ler um formato texto com o editor
de textos favorito. Formatos texto também ajudam os programadores a analisar
mais facilmente as aplicações. Como em HTML, os ficheiros XML são
ficheiros-texto que as pessoas não deveriam precisar ler, mas podem fazê-lo em
caso de necessidade. A semelhança diminui quando vemos que as regras para
arquivos XML são rígidas. Um marcador esquecido ou um atributo sem aspas
inutilizam um arquivo XML, enquanto em HTML tal prática é tolerada e com
frequência explicitamente permitida. A especificação oficial da XML proíbe as
aplicações de tentar inferir a intenção do autor de um arquivo defeituoso; se um
36
defeito é encontrado, a aplicação é obrigada a parar ali mesmo e sinalizar um
erro.
4. XML é prolixo de propósito – Como XML é um formato texto e usa
marcadores para delimitar os dados, os ficheiros XML são quase sempre
maiores que num formato binário equivalente. Isso é fruto de uma decisão
consciente dos programadores do XML. As vantagens de um formato texto são
evidentes e as desvantagens podem ser geralmente compensadas num outro
nível. Espaço em disco já não é tão caro como costumava ser, e programas de
compressão como zip e gzip podem comprimir ficheiros rápido e eficientemente.
Além disso, protocolos de comunicação modernos e o HTTP/1.1, o protocolo
central da Web, podem comprimir os dados em trânsito, poupando banda tão
eficientemente quanto um formato binário.
5. XML é uma família de tecnologias – XML 1.0 é a especificação que define o
que são "marcadores" e "atributos". Além de XML 1.0, a "família XML" é um
conjunto crescente de módulos que oferecem serviços úteis para levar a cabo
tarefas importantes e muito requisitadas. Xlink descreve uma forma padronizada
de inserir hiperligações num ficheiro XML. XPointer e XFragments são sintaxes
em desenvolvimento para endereçar partes de um documento XML. Um
XPointer parece-se com um endereço, mas ao invés de apontar para documentos
na Web, ele aponta para trechos de dados dentro de um ficheiro XML. CSS, a
linguagem de folhas de estilo, aplica-se tanto a XML como a HTML. XSL é
uma linguagem avançada para expressar folhas de estilo. Ela é baseada em
XSLT, uma linguagem de transformação usada para rearranjar, adicionar ou
apagar marcadores e atributos. O DOM é um conjunto padrão de funções para
manipular ficheiros XML (e HTML) com uma linguagem de programação. As
recomendações XML Schema 1 e 2 ajudam os programadores a definir
precisamente as estruturas de seus próprios formatos baseados em XML. Há
vários outros módulos e ferramentas disponíveis ou em desenvolvimento.
6. XML é novidade, mas nem tanto assim – O desenvolvimento de XML
começou em 1996 e é uma recomendação W3c desde Fevereiro de 1998, o que
pode levar a crer que XML é uma tecnologia imatura. Na verdade, esta
tecnologia não é muito recente. Antes de XML já existia SGML, desenvolvida
no início da década de 80 e padrão ISO desde 1986, largamente utilizada em
grandes projectos de documentação. O desenvolvimento de HTML começou em
Formatos de documentos
37
1990. Os projectistas do XML simplesmente pegaram nas melhores partes do
SGML, guiados pela experiência acumulada com HTML, e produziram algo que
não é em nada menos poderoso que SGML, e amplamente mais regular e
simples de usar. Contudo, às vezes é difícil distinguir algumas evoluções de
revoluções... E deve ser dito que, enquanto SGML é usada principalmente para
documentação técnica e muito menos para outros tipos de dados, com XML
ocorre exactamente o oposto.
7. XML leva a HTML ao XHTML – Há uma importante aplicação XML que é
um formato de documento: é o XHTML, o sucessor do HTML. XHTML tem
muitos dos mesmos elementos que HTML, mas a sintaxe foi ligeiramente
modificada para se conformar às regras do XML. Uma aplicação que é “baseada
em XML” herda a sintaxe de XML e a restringe de certas formas (i.e., XHTML
aceita “<p>”, mas não “<r>”); também acrescenta significado à sintaxe
(XHTML reza que “<p>” significa “parágrafo”, e não “preço”, “pessoa” ou
qualquer outra coisa).
8. XML é modular – XML permite que se defina um novo formato de documento
combinando ou reutilizando outros formatos. Como dois formatos desenvolvidos
independentemente podem ter elementos ou atributos homónimos, deve-se ter
cuidado ao combinar tais formatos (“<p>” significa “parágrafo” deste formato
ou “pessoa” daquele outro?). Para eliminar a confusão de nomes ao combinar
formatos, XML provê um mecanismo de espaços nominais (namespaces). XSL
e RDF são bons exemplos de formatos que usam espaços nominais. O Esquema
XML foi projectado para reproduzir este suporte à modularidade no nível da
definição da estrutura dos documentos XML, tornando fácil combinar dois
esquemas para produzir um terceiro que represente uma estrutura de documento
híbrida.
9. XML é a base de RDF e da Web Semântica – A framework para Descrição de
Recursos (RDF) é um formato texto XML para descrever recursos e aplicações
de metadados, como listas de reprodução de músicas, álbuns de fotos e
bibliografias. Por exemplo, RDF permite que se identifique pessoas num álbum
de fotos na Web usando informação de uma lista de contactos pessoais; assim, o
programa de correio poderia automaticamente disparar uma mensagem para
essas pessoas dizendo que as fotos estão disponíveis na Web. Assim como
HTML integrou documentos, sistemas de menu e formulários para “deslançar” a
38
Web original, RDF integra aplicações e agentes numa Rede (Web) Semântica.
Assim como as pessoas precisam concordar acerca do significado das palavras
que utilizam para se comunicar, os computadores também necessitam pactuar o
significado dos termos para poderem se comunicarem efectivamente. A
descrição formal dos termos de uma certa área (comércio ou manufactura, por
exemplo) são denominadas ontologias e são uma parte vital da Web Semântica.
RDF, ontologias e a representação formal do significado, de modo que os
computadores possam ajudar as pessoas em seus trabalhos, são todos tópicos em
discussão no grupo Semantic Web Activity.
10. XML é livre de licenças, independente de plataforma e bem suportada – Ao
basear um projecto em XML, herda-se um vasto e crescente conjunto de
ferramentas e uma comunidade de engenheiros com experiência na tecnologia.
Optar por XML é semelhante a escolher SQL para dados de dados: ainda tem
que se montar a própria base de dados e os programas e rotinas para manipulá-
la, mas há muitas ferramentas disponíveis e muita gente que pode ajudar. E
como XML é livre de licenças, pode-se criar seu próprio software com ela sem
ter que pagar nada a ninguém por isso. O vasto e crescente suporte significa que
não se está preso a um simples fornecedor. XML não é sempre a melhor
solução, mas vale sempre a pena considerá-la.
De referir que os tópicos anteriores foram retirados da W3c, tópicos esses mencionados
por Marcelo Jaccoud Amaral, na sua tese sobre o tema “Mantendo Código-Fonte em
XML – Rumo ao Hiperfonte”.
4.6.1 Vantagens e desvantagens do Formato XML
Numa perspectiva o XML é simplesmente um outro formato de dados, enquanto que
noutra o XML apresenta várias vantagens fundamentais sobre outros formatos que o
ajudaram a se distinguir como um meio para armazenar informações. Algumas dessas
vantagens são as seguintes:
• O XML permite ao programador criar suas próprias estruturas rotuladas para
armazenar informações.
Formatos de documentos
39
• O analisador XML (parser) é bem definido e extensamente implementado,
tornando possível recobrar informação de documentos XML em uma variedade
de ambientes.
• O XML é construído em uma fundação de Unicode, tornando mais fácil a
criação de documentos internacionalizados.
• As aplicações podem confiar em parsers de XML para fazer alguma validação
estrutural, bem como verificação de tipos de dados (quando schemas XML são
usados).
• Os formatos XML são baseados em texto, o que os tornam mais legíveis, mais
fáceis de documentar, e às vezes mais fáceis de analisar.
• Ferramentas para o processamento XML estão disponíveis em plataformas
diferentes. Isso faz com que seja mais simples usar XML em vez de formatos
binários para trocar fluxos complexos de informação.
• Os documentos XML já podem usar muito da infra-estrutura construída para
HTML, inclusive o protocolo HTTP e alguns browsers.
Apesar de todas essas vantagens porém, o XML não é apropriado para todas as
situações. Documentos XML tendem a ser maiores que os formatos binários que eles
substituem. Eles consomem maior largura de banda da rede e espaço de
armazenamento, ou exigem maior tempo de processamento para compressão. Os
parsers XML podem ser mais lentos que os parsers de formatos binários altamente
aperfeiçoados e podem requerer mais memória.
4.6.2 Aplicação do XML
Apesar de recente, tem já hoje grande implementação na área das tecnologias de
informação, marcando presença em grande parte dos sistemas baseados em tecnologias
Web e que tenham sido implementados recentemente.
Se navegarmos pela Web encontramos frequentemente exemplos de implementação de
soluções XML, especialmente se o fizermos tentando procurar sites que realizem
operações bancárias, leilões on-line ou pesquisa indexada de documentos.
Um dos exemplos mais divulgados é o do comércio electrónico. A maior parte das
soluções de e-commerce implementadas em ambientes Web, utilizam precisamente o
XML. O objectivo destas aplicações é a integração de sistemas e tecnologias diversas,
40
com apenas uma coisa em comum: a utilização do XML como linguagem de
comunicação.
Também no mundo empresarial esta tecnologia é utilizada, por exemplo, para realizar
acções que se repetem periodicamente, como é o caso dos relatórios estatísticos, em que
o relatório em si, só é produzido uma vez em XML, depois é visualizado no meio que
for desejado, qualquer que ele seja.
O XML trás igualmente valor acrescentado aos portais na medida em que pode ser
utilizado para seleccionar conteúdos, sendo possível a personalização de uma página em
função do perfil do utilizador, através de folhas de estilo ou por aplicação de filtros na
pesquisa na base de dados.
4.6.3 Arquitectura Adobe XML
A arquitectura Adobe XML oferece às empresas uma transição passo a passo dos fluxos
de trabalho manuais baseados em papel para processos dinâmicos e automatizados que
aceleram o fluxo de informações críticas do negócio entre os funcionários, clientes,
fornecedores e cidadãos.
O Adobe Intelligent Documents combina a familiaridade, a segurança e a fidelidade
visual do PDF com os recursos de lógica comercial e intercâmbio de dados de XML.
Como resultado, qualquer pessoa pode participar totalmente de processos empresariais
de missão crítica aproveitando o software gratuito.
Figura 4.13 – Arquitectura Adobe XML
Formatos de documentos
41
A arquitectura motiva os recursos de XML e PDF para dar suporte a diversos
aplicativos empresariais e, ao mesmo tempo, oferecer conectividade aos sistemas por
meio de diversas tecnologias da Adobe e padrões da indústria.
A arquitectura Adobe XML pode ajudar no:
• Maximizar o ROI4 da empresa sobre os investimentos em tecnologia
• Cumprir os requisitos de conformidade de normas reguladoras e aumentar a
aceitação do utilizador por meio de recursos de apresentação aprimorados
• Dar suporte aos esquemas padrão da indústria para XML arbitrário, como
finanças, seguros ou governamentais
• Melhorar a satisfação do cliente dando suporte ao conveniente preenchimento
off-line de formulários
• Adicionar lógica comercial aos formulários para melhorar a qualidade dos dados
4.6.4 Microsoft Office 2003 e o XML
Muitas empresas implementaram a linguagem XML como uma norma para transacções
que envolvam sistemas empresariais de grandes dimensões, tendo investido em redes e
serviços Internet para a suportar. No entanto, uma vez que ainda não existem
ferramentas XML fáceis de utilizar disponíveis para programas de ambiente de trabalho,
os colaboradores raramente associam tags ao conteúdo e estrutura dos respectivos
documentos. Assim, perde-se a oportunidade de recolher e, mais tarde, reutilizar as
informações contidas nesses documentos; como alternativa, as empresas têm de investir
muito tempo na migração dos dados para um sistema empresarial.
Tendo noção dessa situação, a Microsoft implementou nas ferramentas mais conhecidas,
como Word, Excel e Access, passando a suportar a linguagem XML. O Microsoft
Office InfoPath 2003, tira partido da linguagem.
Com a utilização da linguagem XML:
4 Return Of Investment
42
• É possível guardar e organizar novos dados como XML para que os restantes
colaboradores os possam utilizar.
• As empresas podem colocar dados XML provenientes de um variado leque de
fontes em documentos, bases de dados, apresentações e folhas de cálculo.
• Os programadores podem criar "programas inteligentes" (isto é, programas que
devolvem informações úteis com base em dados introduzidos pelo utilizador)
que permitam aos utilizadores recolher informações contidas em ficheiros.
Através da utilização do suporte XML no Office 2003, garante a criação, organização e
partilha, de forma rentável, das valiosas informações empresariais.
Figura 4.14 – Portabilidade do Microsoft Office 2003
Em todas as edições do Office, é possível guardar os documentos do Word e as folhas
de cálculo do Excel num formato XML nativo que pode ser manipulado e pesquisado
através de um programa com capacidade para processar a norma de indústria XML.
Com este Office, as empresas também podem utilizar formatos, ou esquemas, XML
personalizados para permitir a criação, recolha, intercâmbio e reutilização de
informações de uma forma mais fácil e avançada.
Formatos de documentos
43
4.7 Conclusão Como se pode observar, este uma enorme quantidade de tipos de formatos, e para cada
tipo existe uma enorme quantidade de aplicativos.
Enquanto que as diferenças entre os tipos de formatos são bem visíveis, nos aplicativos
não existe uma grande diferença, à excepção nos processadores de texto, onde
encontramos visíveis diferenças. Assim sendo, o que difere tanto entre o LaTeX e um
Word para que a Microsoft vença? O primeiro contacto é sempre um pouco diferente,
para quem está muito adaptado a um produto estilo “drag and drop”, torna-se difícil
ceder a aplicações tão funcionais como o LaTeX. Embora seja uma aplicação completa,
não ganha à fácil utilização de um Windows. O Word é muito mais intuitivo e não
implica conhecimentos técnicos, bastando conseguir entrar na aplicação que 90% da
complexidade fica resolvida (metaforicamente). Depois é só escrever, seleccionar e
“click”. É uma aplicação com diversos níveis de utilização para utilizadores, desde os
menus onde têm todas as opções, até às teclas de atalho (shortkeys) para utilizadores
mais avançados. Para quem veio de um WordStar onde todo o processo
(instruções/comandos) era à base de sequência de teclas, o Word permite uma fácil
adaptação.
No entanto, o LaTeX continua a ser uma aplicação muito usada mais a nível académico,
embora o conhecimento da existência desta ferramenta em outras instituições
académicas não é presente (não é divulgado). No ISEP, as ferramentas para realização
de relatórios, tal como este, é através de produtos Microsoft. Provavelmente motivada
por parcerias e também pela ausência da inovação na mentalidade estudantil. Mesmo a
nível nacional não existe uma grande promoção.
Um proclamado substituto do Word encontra-se disponível, oferecendo a
funcionalidade de interoperabilidade entre o seu formato próprio, Word e LaTeX. Mas
mesmo este contém alguns bugs a serem corrigidas para que possa vingar.
Temos como exemplo um documento criado em LaTeX e posteriormente exportado
para PDF.
44
Figura 4.15 – Exemplo de documento em Latex e o seu resultado intepretado
Agora, usando a funcionalidade disponibilizada pelo AbiWord, cria-se um documento,
gravando-o no formato LaTeX.
Figura 4.16 – AbiWord: exemplo de texto
Dentro do LaTeX, torna-se possível a conversão para PDF. O resultado observado
demonstra que não existe uma perfeita conversão.
Formatos de documentos
45
Figura 4.17 – PDF: documento original AbiWord exportado para LaTex
Conforme já referido, o LaTeX tem a desvantagem da escrita em código, enquanto que
o Microsoft Word ou AbiWord trazem consigo uma fácil e rápida utilização, requerendo
somente uma pequena adaptação (já que ambas as aplicações têm um interface muito
semelhante).
O Microsoft Word5 não tem qualquer possibilidade de conversão para LaTeX mas tem a
facilidade de conversão para MDI (Microsoft Document Imaging).Este formato (MDI)
funciona do mesmo modo que a digitalização de um documento físico.
Outra opção possível será o processador de texto do OpenOffice.org, uma aplicação
com uma interface também semelhante aos seus consórcios, tendo como vantagem a
junção de algumas funcionalidades das duas aplicações concorrentes. Não só permite a
conversão para LaTeX, como permite uma conversão directa para formato PDF e acima
de tudo é gratuito.
A nível de visualização e impressão, cada sistema tem o seu preferencial. No sistema
Windows, o Adobe Acrobat marca a sua presença. Basta entrar num site onde tenha
documentação que a referência é o Adobe Acrobat Reader (ainda por cima gratuito) já
com um link de acesso directo ao download da aplicação. Esta técnica desmotiva
qualquer pesquisa por parte do utilizador em procurar uma outra opção e dado que após
instalação, deixa de ter interesse essa pesquisa – “se este funciona para que é que
5 Na versão Word do Office 2003.
46
preciso de outro?”. Actualmente a Adobe já disponibiliza a criação de ficheiro on-line –
como forma de cativação à aplicação6. Existem outras aplicações que tem a mesma
funcionalidade que o Adobe e muito mais baratas. Como exemplo, o PDF995 que,
comparando-o com o Acrobat, equivale a cerca de oito licenças do PDF995 para uma do
Acrobat.
De referir que já existem aplicações para “recuperação” de um documento PDF, tal
como o PDF2DOC, não gratuito e nem sempre com resultado pretendido, estando
dependente da fonte, sendo esta uma das principais desvantagens.
A seguinte tabela resume os produtos apresentados.
Produto Extensão Descrição
Processadores de texto
Word .doc Microsoft
WordPerfect .wpf Corel
AbiWord .abw AbiSource Folhas de Cálculo
Excel .xls Microsft Visualização e impressão
PostScript .ps Adobe
Acrobat .pdf Adobe Linguagens de formato
HTML .html
LaTex .tex
XML .xml
Tabela 4.3 – Resumo de alguns tipos de formato
6 Tendo em conta que somente é gratuito a impressão nos primeiros cinco documentos.
5. O presente
Não há como negá-lo, a WWW (World Wide Web) está a tornar-se cada vez mais no
domínio das comunicações entre aplicações, onde a interacção humana tem pouco
(senão mesmo nenhum) poder. Uma nova geração de aplicações baseadas na Web
responde pelo nome de serviços Web, estando a mudar a face da Internet tal como a
conhecemos. Mas o que significa esta expressão? Definimos o termo relativamente a
tecnologias que removem o elemento humano da informação na Internet,
nomeadamente ao nível da troca e de obtenção de dados. Este tipo de serviço tem
software de interpretação de dados obtidos na Web independentemente da linguagem
em que o software foi escrito, da empresa que o desenvolveu e do sistema operativo em
que corre. Tudo isto traduz-se em dados que qualquer software consegue entender
facilmente.
Se, por exemplo, pretendermos saber qual o tempo que vai fazer numa área geográfica
nas próximas 24 horas, basta ir a um motor de busca, encontrar um site com a
meteorologia, analisar a informação e tirar as conclusões necessárias, com base na
temperatura e na humidade relativa. Mas se pretendermos desenvolver um software que
vá até esse site e obtenha a previsão do tempo, fazendo-o quatro vezes por dia e
mostrando a informação num formato perceptível, as coisas já não são assim tão óbvias.
A informação está lá e não é muito difícil de escrever algum código que faça download
da página e extraia os dados mais importantes.
Infelizmente, tal programa ficará obsoleto caso a apresentação dos dados seja mudada
ou se decida a colocar os mesmos numa página diferente.
5.1 O problema A colocação da informação numa página sob a forma de texto numa tabela não resolve
o problema, uma vez que este é demasiado aberto para alterar. Bastaria apenas que se
colocasse informação adicional nessa tabela para que o software deixasse de funcionar.
Quanto mais complexa for a aplicação, maior é o risco de deixar de funcionar devido a
pequenas alterações no modo como os dados são apresentados no site.
48
Os serviços Web são construídos com base na ideia de dados acerca de dados (ou
metadados), ou seja, informação acerca de dados que uma ou mais páginas Web contêm,
informação essa que uma máquina consegue ler. No núcleo de toda esta tecnologia está
o XML.
O XML lida com os dados que estão descritos, de modo que pode usar uma etiqueta
para indicar que os dados do seu interior se referem a um número de telefone. O modo
como esta informação é depois usada depende do software que o receber. Por outras
palavras, os mesmos podem ser processados da maneira que o software que os recebe
quiser, em vez de ser a máquina que envia os dados que dita o modo como eles devem
ou não ser processados. Daí que o mesmo número de telefone possa ser mostrado como
texto num programa, armazenado numa base de dados por outro e que um terceiro inicie
automaticamente a chamada. Melhor ainda, o aspecto extensível entra em cena porque a
marcação do XML é ilimitada e define-se automaticamente, o que significa que é
possível descrever quaisquer dados à medida que forem aparecendo. Deste modo, os
serviços Web são essencialmente componentes de aplicações agregados em toda a
Internet pelo XML.
5.2 Ao seu serviço Os três grandes nomes no desenvolvimento desta tecnologia são a IBM, a Sun e a
Microsoft. A IBM tem o seu sistema WebSphere, que inclui interfaces Java da Sun.
Esta, por sua vez, usa API que permitem a criação de serviços Web usando a linguagem
Java, com o API Java para o RPC baseado em XML (JAX-RPC) e o API Java para
XML Messaging (JAXM).
Seja como for, o interface que está a causar maior agitação, e que é aquele no qual é
depositado maior esperança, é o framework Microsoft .NET. As ferramentas de
desenvolvimento incluem o Visual Studio .NET com suporte para Visual Basic .NET.
Tal como o XML, a tecnologia .NET não é necessariamente nova. Já anda por cá há um
par de anos, mas só agora é que os serviços Web estão a começar a desenvolver-se
exponencialmente, começando a entrar nos verdadeiros modelos de negócio on-line. O
facto de todos podermos fazer parte do Visual Studio .NET dá uma intuitividade ao
processo de criação de serviços Web que certamente irá agradar a todo o tipo de
programadores.
O presente
49
O que é relativamente novo, pelo menos na sua versão beta, é o Indigo – o novo
framework de serviços Web da Microsoft. Este vai indicar ao Mundo que a Microsoft
acredita no próximo grande acontecimento é a programação orientada para os serviços,
abandonando a ideia do conceito de desenvolvimento da programação orientada por
objectos. Tal com a entendemos, vamos ver os principais processos de programação de
interfaces, como a Common Language Runtime (CLT), a .NET Enterprise Services, a
ASP.NET e a .NET REMOTING, todos juntos sob a forma de Microsoft
MessageQueing (MSMQ) e numa única framework. Apesar de suportar uma miríade de
interfaces de componentes, este Indigo irá tornar-se num novo código base para todos
os programadores.
O SOAP (Single Object Access Protocol) define os pedidos e respostas entre clientes e
fornecedores ao nível dos serviços Web. A WSDL (Web Services Description
Language) descreve ambos os serviços oferecidos e os protocolos, incluindo o SOAP.
Finalmente, temos a UDDI (Universal Description Discovery and Integration), que
pode ser usado pelos fornecedores de serviços Web para, nomeadamente, anunciar o
serviço que permite a descoberta por potenciais utilizadores. É muito simples ficar
seduzido por este triunvirato de tecnologias e, ao fazê-lo, estamos a esquecer-nos de que
o XML é a ponte que unifica todos os serviços Web.
Apesar de serem partes muito importantes, o SOAP, o WSDL e o UDDI pouco mais são
do que mecanismos de transporte para o XML.
Há que fazer ainda uma menção mais detalhada ao XHTML (eXtensible HTML), que
marca a evolução da Internet para a era da apresentação, da lógica e da separação de
dados. Será um HTML 4, com estrutura do XML ou, por outras palavras, o uso da
sintaxe XML para o HTML. Como é óbvio, a coisa é muito mais profunda do que isto,
uma vez que vai ajudar a ligar a divisão que existe na Internet de hoje e o mundo de
amanha, fornecendo uma linguagem simples para aqueles que já trabalham com o
HTML. Sem qualquer sombra de dúvidas, o XML vai tornar-se na linguagem da
Internet. O XHTML permite, no entanto, aos programadores a visualização da migração
que lhes possibilita seguir na direcção certa, sem que para isso tenham de perder tudo o
que investiram no HTML. Isto será verdade desde que estejam preparados para o facto
do XHTML ser o mais implacável com erros do que o HTML alguma vez foi.
Sem pretender o desvio do tema a que este relatório, mas mais para demonstrar que este
conceito de interoperabilidade cada vez mais existe no nosso meio. Neste contexto, será
50
feita uma breve introdução às funcionalidades do WebSphere da IBM e do .NET da
Microsoft.
5.3 WebSphere – WebFacing A IBM surgiu na década de 80, com a linguagem COBOL e RPG. Linguagens estas
desenvolvidas para terminais com ecrãs monocromáticos, com definições muitas básicas
(com poucas exigências gráficas), tendo uma definição de ecrã de 80 colunas por 24
linhas – ao contrário de hoje em dia, com definições usuais de 1024 por 768.
A reacção das pessoas quando se deparam com este género de ecrãs é interessante –
essa experiência ocorreu numa cadeira do bacharelato, onde todos os alunos tiveram um
primeiro contacto com ecrãs de 80x24, a preto e verde.
Figura 5.1 – Ecrã tipico de um AS400
O WebSphere da IBM veio permitir uma relação entre um ambiente que vive no mundo
do preto e verde, e um ambiente Web. Esta evolução veio permitir uma
interoperabilidade entre aplicações e plataformas. Esta ferramenta da iSeries permite
que os programas de COBOL e RPG se mantenham como estão, funcionando do
mesmo modo, mas com uma camada superior “embelezada”.
O presente
51
Figura 5.2 – WebFacing
O objectivo do WebFacing é a rápida conversão da aparência dos programas
interactivos em aplicações Web, sendo feito de forma muito minimizada.
Figura 5.3 – WebFacing: estrutura de conversão
52
Figura 5.4 – WebFacing: possibilidade de use de ambas as formas
Conforme a figura demonstra, o programa pode ser usado em diferentes plataformas
sem necessidade de qualquer alteração do programa base.
Figura 5.5 – Evolução do iSeries
Na figura acima é nítida a evolução das ferramentas para a possibilidade de
interoperabilidade entre diversas linguagens. É claro que esta interoperabilidade não se
refere apenas para o iSeries.
O presente
53
5.4 .NET O .NET é uma visão da Microsoft para aplicações na era da Internet. Providencia uma
maior interoperabilidade baseado em standards abertos de Internet. O .NET melhora a
robustez das aplicações Windows que até agora têm vindo a ser utilizadas, ao mesmo
tempo que oferece aos programadores uma nova plataforma, com novas ferramentas e
conceitos, permitindo um desenvolvimento muito mais rápido e focado nos objectivos
propostos. Nesta tecnologia o XML desempenha um papel fundamental, uma vez que
serve para estruturar grande parte da informação que é tratada pelo framework.
O Microsoft .NET é uma plataforma construída no topo do sistema operativo. Três anos
foram gastos na sua construção, antes da sua aparição ao público. O .NET representa o
maior investimento efectuado pela Microsoft, tendo sido influenciado por outros
avanços tecnológicos como XML, Java e COM.
OCS.Net O OCS.Net foi desenvolvido pela I2S – Informática, Sistemas e Serviços, S.A., para
satisfazer as novas necessidades empresariais, que cada vez mais se direccionam para a
Web. Esta ferramenta permite a transformação dos dados, que são extraídos em bases de
dados no AS400, para mapas finais. É uma aplicação desenvolvida para o ramo de
seguros, e encontra-se centralizada num servidor, em que qualquer utilizador autorizado
poderá extrair a informação pretendida. Os mapas, que se encontram previamente
definidos, executam inquéritos sobre a base de dados originando documentos com
informação não tratada, mas em bruto.
Os utilizadores seleccionam os dados a serem extraídos e, a partir daí, esse mapa pode
ser impresso quer numa impressora local quer numa outra impressora, num sítio
qualquer da intranet disponível em toda a infra-estrutura de empresa.
Além de imprimir este documento guardado num ficheiro físico pode ser enviado via
mail para qualquer ponto do país e mesmo a nível mundial, assegurando a chegada da
informação a qualquer uma das filiais de empresa ou cliente/fornecedor.
O OCS.Net é uma ferramenta direccionada à Web. Contudo, actualmente apenas
restringida à intranet com portas abertas à extranet. A aplicação tem como principal
54
objectivo servir de suporte ao apoio de decisão. Geralmente esta aplicação gere
documentação que circula nas camadas médias/altas da empresa. Porque só estas tomam
as decisões de como a empresa se há-de direccionar no futuro. A documentação gerada
pelo OCS.Net tem actualmente formatos, como [.txt], Excel [.xls], Word [.doc], PDF e
Crystal Reports [.rpt]. Encontra-se em conclusão, a curto prazo, o formato em HTML.
O OCS.Net consegue assim aceder a diversas bases de dados distribuídas pelos diversos
sistemas7, centralizar diversos documentos com uma diversidade de informação quase
ilimitada e assegurar a sua disponibilidade de uma forma quase imediata para qualquer
sector da empresa, quer local quer noutro local do mundo.
As bases de dados acedidas pela aplicação são quase sempre bases de dados massivas
no que diz respeito à informação e com diferentes níveis de detalhe. Contudo com esta
ferramenta basta um “click” para que toda uma informação dificilmente acedida fique
disponível para qualquer ponto da empresa no formato que assim pretender e circuláveis
pelas mais confusas redes de informação disponíveis.
5.5 Standards O Instituto Português da Qualidade (IPQ) descreve o processo de normalização como
um processo que "tem por finalidade a racionalização e a simplificação de processos,
componentes, produtos e serviços. Permite uma maior facilidade de entendimento e visa
o estabelecimento de parâmetros a utilizar em acções da avaliação da conformidade."
A norma técnica é apresentada pela AFNOR (Association Francaise de NORmalisation)
como "um dado de referência resultante de uma escolha pensada que serve de base a
solução dos problemas repetitivos". Esta definição parece cobrir uma área
extremamente vasta.
Assim sendo, podemos definir como “um conjunto de critérios e regras consensuais
para recolha, documentação, gestão, análise, transferência, distribuição e apresentação
de dados espaciais. Alguns dos standards são criados de um modo explícito através do
7 Por exemplo, Sistemas Financeiros, Sistemas Operacionais de Produção, Data Warehouse, etc.
O presente
55
estabelecimento de normas enquanto outros evoluem de acordo com a sua utilização
pelas indústrias e os utilizadores.”
Porquê standard? A história mostra que as alterações revolucionárias não se realizam sem antes existir
uma adopção difundida de Standards (normas) compatíveis. Para a electricidade, existiu
a normalização na voltagem e tomadas; para os comboios, a normalização dos
caminhos-de-ferro; e para a Internet, as normas do TCP/IP, HTTP, HTML. Normas
compatíveis para metadados, objectos de aprendizagem, e arquitectura de aprendizagem
são cruciais para um sucesso da economia de conhecimento, o que nos últimos anos tem
sido um trabalho desenvolvido por esse mundo fora.
A normalização é uma actividade dispendiosa em termos de tempo e recursos
financeiros, se for desenvolvida a uma escala internacional, em termos de meios
financeiros. Por isso, as empresas só participarão se o investimento realizado trouxer
garantias suficientes de rentabilidade, que podem ser positivas (desenvolvimento da
actividade, diminuição dos custos) ou negativas (não ser excluído do mercado pelas
normas).
Este cálculo é ainda mais fácil de fazer por uma empresa, uma vez que está numa
posição dominante no mercado com hipóteses razoáveis de impor a sua própria visão.
Mas na Europa, nomeadamente em Portugal, a maioria dos actores são pequenas e
médias empresas e nenhum actor está na posição de avaliar racionalmente as vantagens
que tirará de uma participação activa na normalização.
O nível de esforço individual pode ser dividido pelo apoio financeiro permitindo a
presença dos delegados nacionais nos vários grupos de trabalho CEN (Comité Europeu
de Normalização) e ISO (International Organization for Standardization), pela
presença física em reuniões e pela contribuição, nas comissões nacionais. Na medida em
que as entradas colectivas são consideráveis, um dos papéis das organizações
profissionais é o de substituir os membros que, considerados de maneira individual, não
têm interesse financeiro suficiente e vão esperar que os vizinhos invistam no seu lugar.
56
A vantagem da normalização num único formato é a facilidade no “controlo”, o que
pode não acontecer quando existem diversos tipos de documentos “espalhados”. Não só
porque permite que haja um único desenvolvimento em volta do formato para
proporcionar adaptações a futuras tecnologias que surjam no mercado.
Até agora temos visto que existe uma certa normalização da estrutura da informação.
Mas quem regeu, rege e regerá essas normas? Que entidades actuais existem e que
trabalham para a normalização dos formatos de ficheiros? Encontra-se em anexo uma
breve descrição de cada um dessas entidades associados à normalização.
6. Gestão Documental
“80% de toda a informação crítica para um negócio existe hoje nas organizações sob
a forma de documentos dispersos.”
by Gartner Group
Os produtos Office Suites existentes no mercado podem muito bem satisfazer as
necessidades de uma pequena empresa, mas para médias/grandes empresas será que as
aquisições desses pacotes satisfazem, ou melhor, será a solução correcta para atingir a
produtividade? Se a um nível o número de licenças pode acarretar custos avultados, a
escolha poderá não ser pela passagem para um software livre. Pode sim, ser
significativo na redução de custos mas não será a solução perfeita.
A tendência empresarial actualmente vira-se para a gestão documental, onde se podem
retirar os benefícios da redução de custos operacional e ganhos operacionais imediatos
com a implementação de uma solução de gestão documental integrada.
A grande maioria das empresas já dispõe de computadores pessoais para os seus
colaboradores. As ferramentas “Office” de produtividade elevaram substancialmente a
produtividade dos seus colaboradores. No entanto, os colaboradores das empresas ainda
trabalham com um número elevado de documentos em papel. Isto obriga a uma
duplicidade e não uniformização de processos, limitando os ganhos de produtividade e
dificultando a implementação de normas de qualidade.
A gestão documental electrónica, mesmo em arquivo de papel, está presente em todas as
empresas. Como tal, a introdução da gestão documental é tão indispensável como a
implementação de um ERP (Enterprise Recource Planning).
A gestão documental electrónica é um processo abrangente que é originado aquando da
recepção de um documento e que implementa os seguintes conceitos:
• Financeiro – Facturas, Notas de Crédito;
58
• Qualidade – Gestão de toda a documentação da Qualidade, fluxos de
aprovação, histórico de versões;
• Produção – Especificações, projectos, procedimentos, relatórios;
• Jurídica – Arquivo de contratos, actas, propostas;
• Marketing – Brochuras, “case studies”, estudos de mercado, listas de preços;
• Recursos Humanos – contratos de trabalho, perfis, regulamentos;
Todas as áreas manipulam documentos, quer em formato electrónico, quer em formato
papel, como por exemplo:
• Desmaterialização – Digitalização dos documentos (usualmente dos recebidos)
em formato papel. Como resultado a desmaterialização produz documentos
electrónicos que são uma “fotografia” do papel.
• Indexação – Catalogação e categorização dos documentos electrónicos. Esta
fase é equivalente ao processo de arquivo físico mas retirando os benefícios dos
sistemas de informação.
• Workflow – Definição dos vários estádios pelos quais um documento passa,
incluindo a publicação, aprovação, distribuição e reencaminhamento ou
destruição.
• Busca – Implementação de um motor de busca potente à semelhança do Google
ou Altavista e capaz de realizar OCRs (Optical Carácter Recognition) nos
documentos digitalizados.
Figura 6.1 – Processo de Digitalização-Classificação-Distribuição
A aplicação da gestão documental é seguramente menos mediática do que o
desenvolvimento de um site Internet B2C (business-to-consumer) mas tem impacto
directo na redução dos custos operacionais das empresas. Talvez por estes custos serem
muitas vezes custos escondidos e disseminados por vários departamentos e ao longo do
Gestão Documental
59
tempo é que esta área tem sido sistematicamente preterida face a outros tipos de
sistemas.
6.1 A necessidade do software de gestão documental A necessidade do software de gestão documental incide em dois pontos principais. O
primeiro ponto será a pesquisa e armazenamento de informação. Gerar documentos
ou introduzir informação num computador é uma tarefa corrente numa empresa
moderna. Mas, como fica armazenada essa informação e onde está ela guardada? Se não
tivermos uma regra bem definida a informação vai ser produzida e armazenada de
diferentes formas consoante as pessoas que a criaram. O resultado final é uma empresa
com um grande potencial em informação, mas que não é capaz de o aproveitar pois essa
informação está nas mãos de quem a produziu e apenas essa pessoa sabe onde
armazenou esse documento e eventualmente será uma das poucas pessoas que sabe da
existência de tal documento.
A pesquisa do documento, mesmo em formato electrónico, por vezes também não é
simples pois este não foi catalogado de uma forma objectiva e não existem relações
entre os documentos que nos permitam identificar todos os documentos relativos a um
determinado processo. Muitas vezes está na memória de cada pessoa saber que nome
atribuiu a determinado documento ou em que directório guardou esse documento.
São estas regras de armazenamento que são essenciais para toda a organização poder
aceder aos documentos de uma forma homogénea e conseguir pesquisar os mesmos
utilizando uma ferramenta standard e regras pré-definidas dentro de toda a organização.
Outra situação resolvida com uma ferramenta de gestão documental é a forma como a
informação circula dentro da empresa e a possibilidade de se saber por que pessoas um
determinado assunto passou e a forma como essa pessoa tratou esse assunto – a
circulação da informação dentro da organização.
Em muitas organizações o documento depois de produzido é impresso e enviado a outra
pessoa para o rever, aprovar ou simplesmente expedir. Se tivermos muita documentação
diariamente a ser tratada, acabamos por perder o controlo dos assuntos que temos por
resolver, pois ao passar esse documento para outra pessoa, essa pessoa pode ter atrasado
o processo sem que nos tenhamos apercebido de tal facto. É essencial saber todos os
60
assuntos que estamos a tentar resolver, quem está a tentar resolver esse assunto por nós,
e à quanto tempo esse assunto está a ser tratado.
Também não menos importante é estarmos na nossa posse de toda a documentação
relativa a determinado assunto, para que na presença de toda essa informação, possamos
dar a melhor resposta a esse problema.
Mais uma vez, ferramentas de gestão documental que assentem sobre mecanismos de
workflow permitem-nos fazer o encaminhamento electrónico de documentos dentro da
organização, de uma forma ad-hoc ou por circuitos pré-definidos mantendo-nos sempre
presente os assuntos que temos em mãos e quem está a tentar resolver e se esse
documento está a ser resolvido dentro de um prazo aceitável ou se quem está a resolver
o assunto está a perder muito tempo, com a sua resolução.
Outra capacidade deste tipo de soluções é a de sabermos exactamente por quem passou
determinado documento e o parecer de cada pessoa relativamente a esse assunto, para
que no futuro se possam atribuir responsabilidades às pessoas certas.
Sendo assim, podemos concluir que alguns dos benefícios da gestão documental serão:
• Redução de custo – a redução de custo provém de: redução de custos de cópias,
aumento de produtividade na procura e reencaminhamento de documentos,
redução do espaço de arquivo
• Gestão de informação integrada – consolidação transparente dos documentos
electrónicos e de documentos com origem em papel.
• Uniformização de processos – os processos de processamento de documentos:
reencaminhamento, aprovação, arquivo, etc., passaram a poder ser processados
segundo o mesmo processo e procedimento.
• Desmaterialização – integração directa com os fabricantes líderes em
equipamentos de digitalização na empresa.
• Aumento de rapidez do fluxo de informação – os documentos passa a ser
partilhados na empresa muito mais rapidamente, acelerando a partilha de
informação interna na empresa.
• Descentralização – o controlo, publicação, processamento e arquivo dos
documentos deve ser realizado pelas áreas funcionais a que respeita o
documento. A gestão documental permite isso.
Gestão Documental
61
• Backup – possibilidade de recuperar a informação em caso de incêndio ou
inundação do arquivo físico.
• Segurança – mais capacidades na configuração dos perfis de consulta e acesso
aos documentos.
6.2 Workflow As empresas actualmente começam a entrar num novo estado de desenvolvimento
depois das necessidades de sistemas de informação terem sido satisfeitas por sistemas
ERP que implementam os processos contabilísticos, facturação e de recursos humanos.
A produtividade que estas ferramentas trouxeram já não é uma vantagem competitiva e
diferenciadora, uma vez que estão largamente disseminadas junto dos próprios
concorrentes. Por outro lado a standardização do software e a busca de redução dos
custos de implementação aproximou ainda mais os processos de trabalho das empresas
em cada um dos sectores, diminuindo mais uma vez os factores diferenciadores.
A oportunidade reside em aumentar a produtividade de processos de trabalho mais
complexos e menos estruturados. É neste campo que as atenções se viram de forma
crescente para sistemas de Workflow ou CRM (Customer Relationship Management),
para que se possa estimular o trabalho realizado por uma equipa. Não é mais do que
uma solução que permite sistematizar de forma consistente os processos ou fluxos de
trabalho e informação de uma empresa, de forma a torná-los simples e transparentes aos
vários intervenientes no processo. As melhores práticas passam a estar embutidas e
suportadas no sistema de informação, permitindo que os colaboradores se possam focar
na qualidade e rapidez de execução. Permite que após estabelecidas as melhores práticas
do negócio, os colaboradores não tenham de sistematicamente consultar quais os
procedimentos a executarem e qual a informação a comunicar. Obtém, processa e
encaminha automaticamente a informação; permitindo eliminar a componente humana
sempre que a informação já existe de forma estruturada.
No contexto de uma crescente abertura das empresas com os seus parceiros, mas com
uma também crescente complexidade e heterogeneidade dos sistemas desses parceiros,
torna-se crucial ter sistemas que possam mapear de forma sistemática as decisões que
hoje em dia são tomadas por colaboradores. A empresa ganha qualidade e velocidade na
62
execução. O e-business começa aqui, numa vertente menos mediática mas com bastante
mais impacto no "bottom-line" das empresas.
O Workflow está presente em tudo o que envolva obtenção, consolidação,
processamento e decisão. Entre as áreas de maior aplicação encontram-se Marketing,
Gestão de Projectos, Qualidade e Sistemas de Informação, áreas que apresentam
precisamente uma elevada heterogeneidade de processos, com uma comunicação muito
forte em todos os departamentos da empresa e com um elevado volume de informação.
6.3 Portais e Intranet Os Portais são o endereço da Internet ou Intranet onde podemos fazer tudo aquilo que
queremos fazer, seja do ponto de vista de informação ou de negócio.
A tecnologia actual, e muito recente, veio permitir às empresas partilhar
interna/externamente informação de forma fácil, com um baixo investimento e com
resultados imediatos. Agora é possível descobrir e reutilizar de forma fácil a informação
existente na sua empresa.
O investimento no Portal varia consoante a dimensão da sua empresa, volume da
informação e número de processos a serem implementados e grau de profundidade da
implementação. O processo de implementação típico de uma intranet para uma empresa
portuguesa, incluindo o hardware necessário, estará entre os 25,000€ e os 125,000€. O
retorno do investimento será realizado tipicamente nos primeiros 12 meses de
utilização.
Numa conjuntura económica desfavorável, os ganhos de produtividade e qualidade têm
especial relevo, permitindo à sua organização ser mais ágil e recorrer à tecnologia de
forma a reduzir custos e a tornar a sua organização mais competitiva.
Alguns dos benefícios:
• Fácil de aceder – o Portal permite um acesso à informação da empresa sem
precedentes aumentando a rapidez na obtenção da informação e partilha. Os
colaboradores da sua empresa passam a dispor de uma ferramenta que lhes
permita partilhar o seu trabalho com os outros mantendo o mesmo processo de
Gestão Documental
63
trabalho que têm hoje, sem a necessidade de apreenderem outras ferramentas de
trabalho ou executarem as actuais tarefas de forma diferente.
• Maior produtividade – as organizações podem melhorar a eficiência através de
tomadas de decisão com mais informação e melhor satisfação dos colaboradores.
As tecnologias dos Portais que permitem melhorar a eficiência incluem motores
de busca de informação na empresa, integração dos processos de negócio,
integração com as ferramentas Office, e sistemas de self-service para uma rápida
colaboração nos projectos.
• Melhor Gestão do Conhecimento – processos de colaboração definidos, rápida
procura de informação, e integração dinâmica de informação torna muito mais
fácil para os colaboradores aceder, distribuir, e partilhar informação em tempo
real. As tecnologias existentes nos Portais tornam possível através de
tecnologias de categorização de documentos, definição de perfis, procura de
informação na empresa toda e capacidades de divulgação, e capacidades de
gestão que permite aos colaboradores serem notificados automaticamente
quando alguns itens são actualizados.
• Melhores Processos de Negócios – os portais ajudam as organizações a
melhorar os seus processos de negócio através de ferramentas de colaboração
com parceiros e clientes, integração transparente de processos de negócio, e
rápido acesso a informação dinâmica de negócio. Isto é possível usando
tecnologias acesso à Web através de standards de indústria, acesso integrado a
aplicações, e definição de processos de aprovação de documentos.
• Maior ROI nas TIs – através de melhor gestão, fiabilidade, segurança, e treino,
as organizações podem aumentar os resultados dos seus investimentos em Tis.
Os Portais suportam isto através de interfaces Web, e uma significativa redução
nos custos e tempo de implementação e treino
Algumas destas vantagens são referidas no texto abaixo, citado pela empresa Engil.
Hoje, na sequência da decisão de investir num portal corporativo por parte do grupo e
com boa parte do projecto já concluído e em produção, aponta algumas diferenças.
Eduardo Pimentel começa por sublinhar que existe uma maior interacção dos
64
utilizadores no portal corporativo. (…) Especifica que a disponibilização dos
documentos por parte dos utilizadores no âmbito da Intranet era mais difícil, até
porque exigia do lado deles algum conhecimento de HTML ou acesso aos servidores.
«Hoje é muito fácil a qualquer utilizador disponibilizar um documento, bastando para
isso fazer upload do ficheiro para a área do portal», esclarece. (…) Para Eduardo
Pimentel este é um projecto que continuará a evoluir. Uma das áreas previstas de
evolução tem a ver com a utilização da ferramenta de workflow que a solução
instalada, com base na plataforma aplicacional Plumtree, permite. «Para já
disponibilizamos toda a correspondência (faxes e email), com excepção da que nos
chega em papel (por carta), em determinadas pastas no portal. O que pretendemos é
utilizar a ferramenta de workflow para fazer circular essa correspondência na
empresa», adianta. Se até ao momento o portal corporativo tem estado muito voltado
para os utilizadores internos, a ideia é que deixe de ser apenas assim muito
brevemente. Está em fase final o desenvolvimento de uma aplicação que irá permitir a
todos os fornecedores acederem ao sistema ERP para verificarem a situação de
pagamento das suas facturas através do portal. Mas este é apenas o começo, porque o
objectivo é ir alargando a outras áreas. Do lado dos clientes está em estudo permitir o
acesso no campo da assistência em garantia, nomeadamente no que diz respeito a
habitação.
in Semana Informática, n.º 289/n.º 4
No contexto das implementações dos portais, serve de referência o Portal implementado
na empresa I2S – o Portal I2S. Ferramenta usada por mim na realização das tarefas do
dia-a-dia. No meu caso, tem como finalidade principal funcionalidade de pesquisa para
documentação técnica, manuais e outros que são de grande ajuda ao desenvolvimento.
O que antes existia em diversos sectores e localizações agora existe num único local, de
fácil acesso e sempre actualizado.
As pastas físicas do cliente passam a estar em formato electrónico numa respectiva
pasta do Portal, não ocorrendo a perda de tempo no desfolhar constante à procura do
documento, que infelizmente encontra-se sempre no local oposto onde é iniciado o
desfolhar.
O acesso ao Portal pode ser feito de duas formas:
Gestão Documental
65
1. Através do Explorador do Windows fazendo um mapeamento do local de rede,
resultando numa estrutura semelhante à seguinte:
Figura 6.2 – Acesso ao Portal por mapeamento de rede
2. Através do Web browser no endereço configurado: http://servidor/local
Figura 6.3 – Portal I2S
Existe uma cumplicidade entre as aplicações instaladas, o sistema operativo e o SPPS
(SharePoint Portal Server). Os documentos podem ser acedidos pelas formas habituais,
como se pode verificar na figura abaixo:
66
Figura 6.4 – Portal I2S: acessos cliente
A implementação de um portal na I2S veio optimizar a produtividade global da
empresa.
Outro exemplo observado, e recente, é o Portal ISEP, o qual demonstra que a aplicação
de Portais não aplicam somente a nível empresarial, mas também a nível académico.
Figura 6.5 – Portal ISEP
Neste segundo caso, posicionado mais como um mero utilizador, com acesso limitado,
mas com tendo disponível toda informação funcional num único local.
Das diversas funcionalidades que este Portal disponibiliza, uma a salientar, tal como já
referido anteriormente, existe a disponibilidade de extracção de informação para
determinados formatos. Como exemplo, a possibilidade de obtenção de calendário
escolar no formato HTML ou em folha de cálculo, vulgo Excel.
Gestão Documental
67
Figura 6.6 – Portal ISEP: opção de formato de listagem
Sendo assim, é fácil de entender que o conceito Portal é uma das óptimas alternativas.
6.4 WEB: INTEGRAR é a SOLUÇÃO (?)
“É incrível tudo o que é falado sobre Internet: "as empresas têm que entrar no mundo
virtual", "não sobreviveremos sem a Internet", entre outras frases que já viraram lugar
comum.
Todos nós temos uma noção das facilidades que a Internet têm trazido, desde a difusão
de informação, a facilidade de comunicação a grandes distâncias, entre muitas outras
coisas.
Entretanto, encaixar a Internet no contexto da sua empresa pode parecer uma ideia um
tanto vaga. Tudo bem, é necessário ter um site institucional com uma boa
apresentação da empresa, fornecer e-mails para os colaboradores... mas as
possibilidades da Internet não param por aí.
A quantidade de siglas e nomes que a Internet trouxe – e-business, e-commerce, e-
CRM e tantos "es" assustam, mas no final das contas, as siglas traduzem-se em formas
de facilitar o dia-a-dia da empresa, agilizar procedimentos, manter um canal de
comunicação eficaz com consumidores, representantes, distribuidores.
Um exemplo muito simples: Imagine só a quantidade de papel, rolos de fax e impulsos
telefónicos que pode ser economizada com o envio de pedidos pela Internet. Melhor
ainda se o pedido cair automaticamente no sistema de facturação da empresa. Sem
68
contar a economia em tempo e os erros que serão evitados já que não vai ser
necessário conferir pedido por pedido e digitar tudo.
Um sistema integrado com a Internet pode mostrar ao cliente a situação de seu pedido,
a previsão de entrega, avisar automaticamente se o produto está em falta e qual a
previsão de chegada e muito mais.
Só isto já representa uma melhora significativa em relacionamento com o cliente, não
é mesmo? A empresa demonstra clareza, transparência e profissionalismo.
E um atendimento on-line? Através de um chat, o cliente conversa directamente com
um assistente, que aceda às informações rapidamente pelo sistema, podendo sanar a
dúvida com muito mais eficácia e mais um detalhe: sem aqueles interurbanos que
duram horas!
Mas como ligar meu sistema de facturação, entregas, vendas com a Internet? O
software que utilizo não é compatível. A solução para este problema é o que
chamamos de INTEGRAÇÃO. Na maioria dos casos, a empresa não precisa investir na
troca do software que já é utilizado.
É criado um sistema que captura os dados do software da empresa, adaptando-os para
a linguagem do site e vice-versa: os dados capturados pelo site são "traduzidos" para
o sistema da empresa.
Em grande parte dos casos, o investimento em integração é compensado em poucos
meses. Possibilidades existem! Com um planeamento profissional, Internet pode
significar lucratividade e satisfação para o seu cliente. Pense nisso!”
by Luis Ribeiro, Colunista
Conforme podemos observar deste texto, as soluções vinculadas ao conceito Internet
estão cada vez mais presentes. E conforme foi referido, existem uma enorme quantidade
de conceitos “es”. Mas quais destes podem proporcionar uma interoperabilidade? Os
seguintes conceitos apresentam essa possibilidade.
6.5 ECM – Enterprise Content Management Nos dias que correm, as empresas possuem grande parte da informação crítica para o
seu negócio dispersa, sob a forma de documentos, por diversas ilhas de informação.
Gestão Documental
69
Com o advento dos canais electrónicos de contacto com o cliente, que proporcionaram
às organizações novas fontes de informação, esta passou a ser proveniente de diversas
origens e existe em diferentes formatos.
A capacidade de uma organização dispor de toda a documentação crítica para os seus
processos de negócio de uma forma integrada resulta num aumento de eficácia operativa
e melhoria do serviço prestado ao Cliente, que facilmente se transformam em vantagem
competitiva.
O ECM, gerido de forma integrada e incorporado nos processos de negócio, cria novas
formas de benefícios estratégicos, tais como:
• Excelência no Serviço a Cliente – A rapidez com que se localiza a informação
referente a um determinado processo permite um aumento da qualidade do
serviço prestado.
• Aumento de Produtividade – A gestão ergonómica e facilitada da informação,
que no suporte tradicional representa uma grande quantidade de papel, traduz
ganhos significativos no tempo gasto a manipulá-la.
• Acesso Imediato à Informação – A rápida resposta na localização de um
documento ou processo, que representa um aumento considerável na qualidade
do trabalho.
• Facilidade de Utilização – Uma interface com o utilizador ergonómica,
intuitiva e fácil de usar, que tendo um reduzido tempo de aprendizagem, leva a
uma aceitação mais célere da solução, em especial se integrada nos sistemas de
gestão do negócio já existentes na organização.
• Escalabilidade da Solução – As tecnologias não actuam como uma limitação a
um crescimento da utilização da solução, mas pelo contrário elas servem de base
ao eventual crescimento futuro do volume de informação, representando infra-
estruturas sólidas e duradouras, que protegem a totalidade dos investimentos
nelas efectuados.
Pretende-se com estas soluções proporcionar as seguintes funcionalidades:
• Capturar, classificar e disponibilizar documentos críticos no âmbito dos
processos de negócio em que as empresas participam.
70
• Gerir o ciclo de vida de um documento ao longo da sua existência.
• Localizar e imediatamente disponibilizar um documento quando necessário.
• Aumentar a qualidade da informação a disponibilizar aos utilizadores.
• Garantir a gestão integrada do arquivo físico e electrónico.
• Garantir sempre a operacionalidade da função de arquivo.
• Garantir a escalabilidade da solução, mantendo níveis de fiabilidade e
performance adequados, tendo em atenção os grandes volumes de informação a
tratar.
• Garantir o acesso à informação em topologia “Web based”.
6.6 EAI – Enterprise Aplication Integration Define-se por EAI (Enterprise Aplication Integration) a utilização de um layer comum,
estruturado e dotado de capacidade de segurança, que pode ser denominado de
middleware Inter-Aplicações para suporte de novas aplicações estratégicas,
nomeadamente na área da Web, que envolvem o acesso combinado e possivelmente
estruturado a diversas tecnologias de sistemas de informação, como por exemplo
Legacy – normalmente aplicações na plataforma mainframe, Package – ERP, CRM,
etc., ou pacotes de aplicações funcionais e finalmente o campo em maior expansão e
potencial da actualidade – as Web Applications.
EAI
ERP CRM
B2B WORKFLOW
Figura 6.7 – Interoperabilidade do EAI
O EAI envolve os sistemas transaccionais, e a integração de aplicações existentes para a
criação de novas aplicações estratégicas que utilizam processos e transacções actuais
Gestão Documental
71
que por sua vez acedem a bases de dados. Imaginemos um sistema de informação na
Web capaz de fornecer informações provenientes de diversos processos ou aplicações já
implementados, para suportar um novo produto em uma organização financeira – este é
um exemplo típico.
O acesso pode ser por exemplo a um Marketing DataBase System combinado a diversos
produtos em plataformas UNIX e NT e dados transaccionais em IBM mainframe. As
consultas devem saber inicialmente onde buscar as informações necessárias e em
seguida como ou através de que plataformas / tecnologias / produtos e interfaces, deverá
trazer estas informações. Imagine-se agora que esta aplicação além de consultar
informações, deve também actualizar dados em alguns processos utilizando diferentes
meios transaccionais existentes.
Este é o cenário. Com as novas necessidades de negócios através da Internet, a função
de TI tornou-se estratégica para o sucesso dos negócios empresariais e uma fonte
importantíssima de vantagem competitiva. TI hoje envolve-se directamente na criação e
manutenção de canais de marketing, vendas e suporte aos clientes.
A função de business intelligence tão importante internamente às empresas para a
tomada de decisões, deveria ser exportada aos clientes e fornecedores desta, para que
pudessem gerir a sua interacção com outra empresa. Imaginemos como exemplo a
capacidade de “slice and dice” com dados da facturação, para uma empresa que recebe
dezenas de facturas, por exemplo por número de telefone. Seria muito interessante
poder somar estes valores, agrupá-los ou criar médias, por localização geográfica, ou
departamento, ou ainda pesquisar máximos e mínimos.
Não existe um padrão, apenas um caminho geral, baseado nas tecnologias voltadas a
objecto dos front-ends actuais, Microsoft COM – Commom Object Model e CORBA –
Common Request Broker Architecture, assim como o uso de middleware na
intermediação entre os componentes. Este middleware pode envolver inclusive acesso a
camadas de metadados onde armazenam informações sobre os processos envolvidos e
dados necessários ao roteamento e ao acesso a estes processos.
O início da formalização do EAI deu-se aquando da criação do MOM (Message
Oriented Middleware) MQ/Series da IBM, que dispõe de capacidade de processamento
assíncrono.
Obviamente o EAI é para grandes empresas, que possuem ambientes de tecnologia
diversificados e portanto necessitam de tecnologias/metodologias de integração
72
sofisticados. Potencialmente todos os segmentos podem beneficiar-se do EAI. O maior
retorno será para aquelas empresas ou negócios que tenham maior interacção com os
seus clientes, ou que necessitem de informações sofisticadas para colocarem e
suportarem os seus produtos.
6.7 EDI – Electronic Data Interchange O EDI permite a transmissão electrónica de documentos entre computadores, utilizando
um formato standard entre parceiros comerciais.
As razões principais para a implementação do EDI são:
• Qualidade – Eliminação de introdução manual de dados, garantia de entrega e
disponibilização de métricas precisas sobre o processo
• Eficiência – Desempenho constante e eliminação de falhas no processo
• Redução de custos – Processos administrativos e redução dos níveis de
inventário e controlo da produção
• Controlo de Processos – Visibilidade a cada passo dos estados das mensagens
• Qualidade de Gestão – Redução drástica de erros
• Aumento de vendas – Optimização da cadeia logística, respondendo
rapidamente às necessidades do consumidor
Figura 6.8 – Estrutura do EDI
Mais uma vez o XML apresenta-se como uma necessidade visto os standards EDI serem
de alguma complexidade.
Gestão Documental
73
Figura 6.9 – Explicação gráfica do EDI
O público-alvo deste género de implementação será: Ramo automóvel, Retalho, Banca,
e DGA (Alfândega). Ou seja, empresas que lidem com muita documentação podem
obter elevados benefícios com este tipo de implementação.
6.8 ebXML Por toda a Internet, os programadores de comércio via Web estão a usar a tecnologia
Java como plataforma portátil de programação e o XML como plataforma portátil de
dados, ficando satisfeitos com os resultados. As duas tecnologias juntas proporcionam
um código e uma plataforma poderosos para a construção de aplicações baseadas em
padrões abertos e para a entrega de serviços via Web na actual rede. Enquanto o XML
oferece dados portáteis e reutilizáveis, a tecnologia Java permite aplicações portáteis e
de fácil manutenção.
Se o e-commerce ganha cada vez mais aderentes, o comércio entre empresas (B2B –
Business-to-Business) torna-se um segmento do mercado ainda maior do que se havia
estimado. Mas ligar duas empresas é apenas o começo. Para realizar, de facto, negócios
pela Internet, as duas empresas devem poder trocar, rotineiramente, um conjunto
completo de documentos comerciais, como mensagens de mail, licitações de ofertas,
formulários de compras, facturas e notas de confirmação de despacho, para citar apenas
alguns.
74
“What Java technology has done very well is unify these various data sources on a
uniform platform. We have to support XML to federate the data”
by Lisa Hammitt, President and CEO, Black Pearl, Inc.
Pode parecer simples, mas quando os compradores e os vendedores são, na realidade,
máquinas que lêem os formulários da outra empresa, as coisas não são tão claras assim.
Pensando bem, a factura para uma conta de cartão de crédito não requer o mesmo
tratamento que a factura para o despacho de peças de automóvel. Entra em cena o XML,
que faz para a troca de documentos, o que a tecnologia Java faz para as plataformas de
programação.
Tendo como finalidade a preparação do caminho para comunicações entre empresas, os
padrões XML estão a ser definidos por diversas organizações. Por exemplo, a iniciativa
Electronic Business XML (ebXML) é uma colaboração entre a OASIS (Organization
for the Advancement of Structured Information Standards – organização para o fomento
de padrões estruturados de informação) e o UN/CEFACT (o órgão das Nações Unidas
para a facilitação do comércio e dos negócios electrónicos) para criar uma estrutura
global em XML para o comércio electrónico. Mediante um processo aberto e
democrático, a Sun acredita que a iniciativa ebXML está a levar estes padrões na
direcção certa.
“XML é um formato excelente para dados”, diz Will Iverson, gerente de produto em
comissão para a XML do grupo de plataformas para software da Sun. "Está-se tornando
uma parte fundamental da construção de aplicativos na era da Internet." Vejamos as
mensagens, por exemplo. Há diversas maneiras de transmiti-las, segundo Shel
Finkelstein, gerente sénior para arquitectura e tecnologia do grupo de sistemas de
software. Produtos leves, como o SOAP, são apropriados para informar sobre eventos
de notícias ou a proximidade de determinado restaurante. Por outro lado, o ebXML
define um protocolo que lida com qualidades diferentes de serviço, desde mensagens de
pouco peso (como no caso do SOAP) até mensagens de qualidade comercial (próprio
para tratar de pedidos de compra entre empresas).
Gestão Documental
75
Segundo Iverson, “a ebXML oferece-lhe uma maneira padrão de formatar as
mensagens que voam para lá e para cá. É como se fosse o envelope.” A tecnologia Java
é a plataforma sobre a qual se lêem esses arquivos XML com invólucros de ebXML e
sobre a qual se processam as mensagens.
O ebXML é uma iniciativa para desenvolver normas que facilitem os negócios entre
empresas baseados na Internet. Traduzindo, o ebXML é uma norma para EDI na
Internet, que tenta cobrir a maioria das funcionalidades necessárias nos projectos deste
tipo, tornando-se por isso bastante complexa.
As normas são baseadas tanto na linguagem XML como no EDI tradicional, por isso a
maior razão para o seu sucesso talvez seja o patrocínio das duas organizações mais
importantes nestas áreas: OASIS e UN/CEFACT.
Para promover a sua actividade, a iniciativa ebXML tem publicado um conjunto de
documentos agrupados em quatro categorias:
• Especificações técnicas – várias normas cobrindo praticamente todos os temas
importantes da integração entre empresas, incluindo arquitectura técnica,
processos de negócio, protocolos de colaboração e serviços de mensagens.
• Relatórios técnicos – documentos que explicam como utilizar as especificações
técnicas.
• Documentos de referência – resume-se a um glossário.
• White papers – propostas de novas normas que ainda não foram aprovadas.
As actividades estão organizadas à volta de seis grupos de trabalho (também chamados
comités técnicos) que desenvolvem as normas mais importantes:
• Registry – este grupo de trabalho apoiado pela OASIS produz normas e
implementações de referência para registos e repositórios na área do XML.
• Messaging – produz normas para transportar, encaminhar e envelopar (no
mesmo sentido do SOAP) mensagens XML, que suportem transacções
electrónicas entre empresas.
• Collaborative Partner – produz normas para definir as capacidades técnicas das
empresas nesta área assim como definir contractos de colaboração entre duas ou
mais empresas.
76
• Implementation – auxilia as empresas de informática a produzir aplicações
compatíveis com as normas ebXML, assim como interoperáveis entre si.
• Business Process – este grupo de trabalho (sem grande actividade desde
Setembro de 2002) apoiado pela UN/CEFACT produziu uma norma chamada
Business Process Specification Schema (BPSS) que define um formato para
especificar processos de negócio em XML.
• Core Component – este grupo de trabalho também apoiado pela UN/CEFACT
produziu uma norma que permite metadata de suporte à troca de dados
electrónica entre empresas.
Como se pode ver, o ebXML cobre todos os tópicos importantes da integração entre
empresas. Infelizmente, a maioria das implementações de ebXML até ao momento
apenas suportam a troca de mensagem XML de forma segura e robusta. Existe também
as dificuldades normais nesta área, concretamente a inexistência de uma norma para
formatar as mensagens mais comuns e contractos normalizados de colaboração entre
empresas.
6.9 Factor humano A implementação de uma solução de gestão de conteúdo é de um enorme
empreendimento – e nem sempre com sucesso. Mesmo em pequenos projectos, o
software é instalado, ficando operacional e sendo usado por algumas pessoas. A razão
típica do fracasso destas implementações resido no factor humano, a aceitação por parte
do colaborador é essencial. A não aceitação leva a uma redução nos benefícios da
organização, bem como colocando em risco, podendo mesmo ficar-se pela fase piloto.
Quais serão as causas dessa resistência? Se uma empresa está para investir dinheiro e
tempo, terá de saber. Podemos dividir o problema em duas categorias: mudança fraca na
gestão e falsa assumpção da tecnologia.
6.9.1 Mudança de gestão
Até agora somente são apresentados sistemas, tecnologias e todo o tipo de projectos que
existem, no entanto, existe um factor muito importante para o êxito, o factor humano.
Gestão Documental
77
Na implementação de sistema, foca-se muito na tecnologia em vez das pessoas que o
envolvem. A mudança de gestão, a arte de ajudar pessoas na adaptação e aceitação nos
novos procedimentos, é crucial para o êxito da implementação.
Existem quatro passos importantes para a introdução do ECM numa organização:
• Envolvimento de todos os grupos nas decisões chave – Ao contrário de uma
imposição exterior (ou do departamento TI), certificar que os utilizadores se
conduzem nas escolhas e no calendário. Embora seja impossível a inclusão de
todos nas decisões, será essencial a representação dos departamentos chave na
equipa no início. O objectivo será convencer os membros da equipa a tornarem-
se missionários e mentores da solução na sua implementação.
• Dar a cada grupo uma interface de utilizador que se adapte às suas
necessidades – No interesse pela uniformização e na simplificação do treino e
suporte, uma introdução “tudo em um” do interface. No entanto, é importante
uma integração e costumatização opcional, de forma a oferecer a cada grupo de
trabalho um fácil acesso ao conteúdo, mas mantendo um repositório unificado.
Qualquer custo na costumatização do interface para grupos de utilizadores trará
recompensa numa melhor aceitação
• Não fazer tudo cedo demais – Embora ofereça uma mais valia na empresa,
muitos projectos aceitam muita mudança ao mesmo tempo. O nível de mudança
de aceitação pelo utilizador é finita, e os recursos para uma nova solução são
finitos.
• Não negligencie ou economize na formação – A formação deve ser conduzida
o mais próxima possível ao momento em que é solicitada a mudança ao
utilizador. E não deverá ser uma única formação. Plano de programas de refresh
será necessário. Deve ser encorajado à equipa que participa na solução em serem
tutores e mentores nos seus departamentos após a formação, dando também
feedback relativamente às próprias secções de formação.
Estes quatro princípios são referidos por Bernard Chester8, no conceito de ECM
(Enterprise Content Management).
8 Bernard Chester é um consultor da IMERGE Consulting, um conselheiro independente do ECM.
Frequente orador e autor de aplicações e integrações da tecnologia ECM.
78
6.9.2 Falsa assumpção
A mais comum assumpção após a implementação do sistema é a da não necessidade das
existentes funções de manutenção efectuadas no sistema em papel. Este erro da omissão
é comum. De tempos em tempos, existia uma análise à documentação, por exemplo, a
verificação do correcto arquivo dos documentos. Agora que tudo é electrónico, é fácil
negligenciar estas tarefas (assumindo que essas tarefas deixam de ser necessárias). No
entanto, este tipo de tarefas continua a ser necessárias; a diferença é a passagem do
processo manual para o uso de ferramentas em computador. Esta transição permite uma
maior disponibilidade de tempo para a auditoria em vez da movimentação de caixas.
O segundo erro cometido é a omissão da implementação de procedimentos e
esquematização para uma correcção indexação. Se um documento é inserido
incorrectamente, a possibilidade de este se perder no sistema é grande. Ao ser colocado
numa outra pasta, utilizadores terão um conjunto de documentos incompleto, logo a
informação estará incompleta.
7. Soluções
“When an IT system is implemented, the major focus is too often on the technology
rather than on the people involved. Change management, the art of helping people
adapt and accept new procedures, is crucial to any successful implementation.”
by Bernard Chester, 2004
A ideia da abolição do papel (físico) já não está tão longe quanto possa parecer, não só
por motivos ambientais mas também por outras razões quiçá mais financeiras. Algumas
entidades já adoptaram esta ideia, tais como entidades bancárias, que deixam de
disponibilizar o documento em papel, passando a colocar toda a documentação das
operações realizadas pela empresa na área do cliente (tais como notas de lançamento,
extractos, etc.), onde este, após notificação via mail poderá fazer download para a sua
máquina.
Este processo leva à redução significativa de custos, tais como:
• na aquisição de papel – liso e timbrado;
• em consumíveis necessários para o processo de impressão;
• na aquisição de hardware – como por exemplo impressoras;
• nos custos de envio dos documentos para os clientes – se tivermos em conta nas
possíveis dezenas.
80
Figura 7.1 – Millennium BCP
O formato mais usado actualmente para este tipo de operação é o PDF.
O banco disponibiliza as seguintes principais vantagens:
• Arquivo fácil, em suporte digital – Computador, DVD, CD-ROM ou disquete.
• Consulta fácil, por data, quando quiser, de onde quiser.
• Rapidez, os documentos estarão disponíveis no dia seguinte a sua produção,
evitando-se o tempo de correio.
• Privacidade e Segurança, inibir o envio por correio, podendo consultar os
documentos, quando quiser, de onde quiser, com toda a privacidade e segurança.
Exemplo Extracto Combinado
Processo Papel Processo formato digital Produção do Extracto Último dia útil do mês Último dia útil do mês Impressão, envelopagem e envio pelo correio
Dia útil seguinte -
Distribuição pelo correio 3 dias úteis - Recepção pelo cliente Entre o dia 8/9 de cada mês Disponível no dia útil
seguinte Tabela 7.1 – Comparação entre processo papel e processo formato digital
Uma outra vantagem será a possibilidade de 2ª via, dado que caso seja pretendido 2ª via
em papel, esta acarreta custos (e também não é acessível de imediato).
Soluções
81
“O Portal na Internet do Millennium BCP passou a disponibilizar as operações
bancárias e as principais consultas em língua inglesa. Uma melhoria que interessa a
33.000 mil clientes de nacionalidade estrangeira (excepto de países de língua oficial
portuguesa e espanhol) registados no portal”
in Expresso, 21 de Agosto de 2004
Os utilizadores particulares do Portal Millennium BCP passaram a poder visualizar e
imprimir a imagem dos cheques dados a pagamento e descontados pelos beneficiários.
(…) Para já o serviço de visualização tem estado a ser ensaiado com sucesso junto dos
clientes empresariais. «Aderiram 2.500 clientes, mesmo sem termos feito qualquer
esforço promocional», sublinha Miguel Maya9.
Outra inovação do Portal Millennium BCP para particulares é a disponibilização das
principais consultas e operações bancárias em língua inglesa. «Tínhamos muitas
solicitações de clientes», justifica o director-geral do banco. (…) Com uma taxa de
adesão de 14% entre os particulares, o Internet banking do Millennium BCP já é
utilizado por 90% das grandes empresas clientes. (…) Por outro lado, passou a
integrar on-line o serviço de home banking com o Money, o software da Microsoft.
«Os clientes mais exigentes podem sincronizar saldos e informação de contas à ordem,
gestão de crédito e de portofólio», conclui Miguel Maya.
in Expresso, 21 de Agosto de 2004
Aqui temos o resultado de uma aposta realizada por esta instituição. A expansão
realizada prova a crescente procura por novas tecnologias que permitam uma
simplicidade e maior facilidade de controlo da gestão financeiras empresarial e
particular.
9 Director-Geral do Millennium BCP – Servibanca
82
No segundo texto já se pode observar a interoperabilidade entre o home banking com
outras aplicações, onde já permite a sincronização de saldos e outras informações da
conta. Este factor é muito importante nas consolidações bancárias realizadas pelas
empresas. O cruzar de dados entre os lançamentos bancários contabilísticos e os registos
bancários permite uma automatização de um processo um tanto ao quanto enfadonho,
evitando algum erro humano. Embora não implique um controlo total, devido a algumas
operações específicas, torna a auditoria muito mais simplificada. Bastará imaginar os
movimentos bancários realizados por uma Sonae (pagamento a fornecedores e
funcionários, recebimentos, etc.).
Alguns dos produtos seguidamente apresentados servem de exemplo das soluções que
existem actualmente no mercado.
7.1 Microsoft SharePoint Portal Server Conforme referido no capitulo anterior, o SharePoint Portal Server (SPPS) é uma
solução de gestão de documentos eficiente. É um sistema que é suportado por uma base
de dados hierárquica que utiliza uma estrutura de folders (pastas) similar ao sistema de
ficheiros. Este repositório destina-se à gestão de documentos de qualquer formato da
Empresa.
A figura seguinte pode ilustrar a estrutura do produto SPPS:
Figura 7.2 – Estrutura do SharePoint Portal Server
As principais características do SPPS são as seguintes:
Soluções
83
• Workspace – É o nível mais alto na arquitectura documental do SPPS. É como
uma área de trabalho, uma colecção organizada de documentos, fontes de
conteúdo e componentes do SPPS.
• Dashboard Site – O produto SPPS inclui um website associado, possibilitando
um caminho alternativo para a gestão de documentos e pesquisa. O grande
benefício é que utilizadores que não possuam um Sistema Operativo compatível
com a Microsoft possam usufruir das vantagens do Portal.
• Categories – As categorias são uma estrutura para a visualização da informação;
consistentes, são um conjunto de valores que podem ser adicionados à metadata
dos documentos.
• Document Folders – As pastas dos documentos são utilizadas na organização
documental, sobretudo para os autores, e também para disponibilizar uma
plataforma para seguranças baseadas em papéis.
• Acessos – Permite criar diferentes acessos às diferentes pastas: leitores, autores e
coordenadores.
• Organização de documentos – Permite criar e organizar documentos.
• Publicação e Aprovação – Permite aprovar e publicar os documentos nas
diferentes pastas.
• Busca – Permite fazer buscas rápidas, através de pesquisa simples ou pesquisa
avançada utilizando propriedades do documento.
• Colaboração – Permite discussão e opinião sobre vários documentos entre
várias pessoas.
• Subscrições – Permite criar subscrições que nos avisam através de e-mail das
alterações ocorridas.
O SPPS permite catalogar os documentos, aplicando informação útil, tal como palavras-
chave aos mesmos, publicar os originais, gerir versões de documentos e entre outros,
possibilita a discussão de documentos.
No entanto existem outras tarefas que também têm implementado esta filosofia.
84
7.2 Silva Silva é um completo browser baseado no CMS (Content Management System) para
criar publicações para a rede, papel e outros dispositivos. O conteúdo é armazenado
num formato limpo e protegido para o futuro, independente de layout e apresentação,
adequando para o uso em diversos contextos. Silva permite a utilizadores principiantes a
entrada de documentos bem como a edição de documentos já existentes, por uma
simples interface Web.
O seu funcionamento baseia-se na gravação do conteúdo em XML, trazendo algumas
vantagens importantes:
• O mesmo conteúdo poderá ser usado na Web, em papel, ou processador de texto.
A publicação Web de conteúdos é nativa no Silva dado que é baseado no Zope,
para além da possibilidade de exportar filtros para PDF e Microsoft Word, bem
como outras conforme os requisitos venham a surgir;
• O conteúdo esta pensado para o futuro, sendo possível o seu uso num novo
sistema ou apresentado de uma maneira diferente;
• A facilidade da estrutura do conteúdo facilita uma pesquisa e indexação
sofisticada.
Figura 7.3 – Silva
Soluções
85
Embora não seja requerida, Silva suporta a separação entre autores que podem criar
novo conteúdo e editores que aprovam a localização do conteúdo a ser publicado.
Permite também a delegação de responsabilidades de edição ou criação de secções de
publicação para outros. Assim, utilizadores podem ter uma maior abertura (evitando o
controlo feito por uma única pessoa), sem a perda do controlo editorial.
Para apoio no processo de publicação, Silva implementa um workflow onde múltiplas
versões do mesmo documento são guardadas ao mesmo tempo. Uma versão de um
documento em particular pode ser publicada, ao mesmo tempo que outra versão se
encontra a em edição.
Silva é bastante escalável, porque permite a integração de novos tipos de documentos
bem como outros tipos de objectos.
Figura 7.4 – Aspecto da ferramenta Silva
86
Silva numa organização O website Silva elimina o engarrafamento e permite aos colaboradores uma criação on-
line fácil e segura do conteúdo pela organização.
As vantagens que o Silva apresenta são:
• Separa o conteúdo, gestão do site e design.
• Tem uma interface Web simples para edição e gestão da informação
• Permite aos autores submeter para revisão por um editor.
• Suporta versões de conteúdo.
• O público vê uma versão enquanto outra é actualizada.
Para além destas, o Silva também permite a atribuição segura de tarefas pela
organização (actua como uma delegação no sistema). Não só para grandes organizações,
bem como para pequenas e médias.
O conteúdo guardado em XML de forma transparente, podendo ser transformado numa
página Web, exportado para um documento Word ou em formato PDF. Os documentos
Microsoft Word podem ser importados, e convertidos novamente para XML.
A vantagem do Silva em relação ao SPPS é ser open-source.
7.3 IXOS
"Thanks to the migration from Arcis to IXOS Suite Document Management, we're now
using our workflow applications much more efficiently. Our users are more productive
because they now have access to electronic data and scanned documents directly. They
no longer have to switch back and forth between applications."
by Uwe Siller, IT Manager, Bitburger Brauerei
Soluções
87
A IXOS Document Management (DM) permite a migração do conteúdo e a metadata
associada para um repositório central, sendo possível aceder a este não só pela aplicação
como por outras aplicações.
Figura 7.5 – Estrutura do IXOS
A Gestão Documental cada vez mais é necessária para as organizações. O modo como
gerem os documentos tem um impacto directo no seu êxito. Muitas empresas não têm
uma estratégia sustentável para gerir informação não estruturada, como papel,
documentos Word ou Powerpoint, mail, páginas Web ou imagens digitalizadas.
A IXO permite a migração do conteúdo e a metadata associada para um repositório
central, sendo possível aceder a este, não só pela aplicação como por outras aplicações.
Outros workflows, por exemplo, são expeditos porque encomendas recebidas são
automaticamente digitalizadas e “linkados” em aplicações workflow ERP e entregues
aos respectivos colaboradores. Independentemente do workflow ser gerido num ERP,
CRM ou IXOS, os documentos podem ser obtidos por um computador autorizado ou
via Web, no contexto exacto do negócio, sem necessidade de aceder à aplicação
original.
Na figura abaixo mostra bem a relação entre IXOS e as ferramentas da Microsoft.
88
Figura 7.6 – Estrutura do IXOS em parceria com ferramentas Microsoft
7.4 Netaminas O sistema Netaminas é um gestor dinâmico de conteúdos, desenvolvido tendo em
consideração as necessidades e os problemas com que se defrontam os sites de Internet
das empresas. Permite criar, gerir e actualizar qualquer site de forma dinâmica sem
necessidade de conhecimentos em programação ou base de dados.
Privilegiando a autonomia e controlo total de um site de Internet, permite aos
utilizadores alterarem todos os conteúdos e layout gráfico de qualquer página do seu site
de Internet de uma forma dinâmica, sem necessidade de recorrer a qualquer apoio
especializado.
É um gestor dinâmico e integrado de eMarketing, desenvolvido tendo em consideração
as necessidades e os problemas com que se defrontam as empresas no seu
relacionamento com os clientes. Permite disponibilizar serviços, criar e actualizar
conteúdos de forma dinâmica e integrada.
Privilegiando a autonomia e controlo total de um site de Internet ou portal de intranet,
permite alteração de todos os conteúdos e layout gráfico de qualquer página do seu site
de Internet de uma forma dinâmica, sem necessidade de recorrer a qualquer apoio
especializado. Pode ainda, como ferramenta de eMarketing explorar um conjunto de
Soluções
89
funcionalidades de gestão interna e externa contribuindo para uma uniformização da
informação dentro da empresa.
Permite também uma análise de resultados, quem visitou, o que viu, que percurso
efectuou, quanto tempo ficou. Toda a informação disponível e convenientemente
tratada, disponibilizada como indicadores de gestão.
Trata-se de uma solução ideal para empresas que procurem uma solução para a Internet,
garantindo o valor acrescentado a quem as visita:
• Autonomia total na manutenção do site de Internet e intranet.
• Diversas soluções para diferentes necessidades.
• Disponibiliza não só um site na Internet, mas também um conjunto de
ferramentas de apoio a quem o visita.
• Possibilita a análise e gestão de tráfego, assim como o registo dinâmico dos
percursos de visita.
• Integração com o sistema de gestão da empresa através do formato XML.
• Utilização de sistema de gestão de entidades para gestão interna, exploração
comercial ou de assistência técnica.
• Gestão automática de campanhas comerciais.
• Comércio electrónico.
• eLearning.
Sendo especialmente recomendado:
• Que reconheçam o potencial de Marketing que um site de Internet oferece;
• Desejem autonomia na sua manutenção;
• Que optem por oferecer um valor acrescentado aos seus clientes;
• Reconheçam o potencial do serviço a clientes interactivo
8. Conclusão
Existe uma enorme quantidade de informação sobre a interoperabilidade, bem como
uma inúmera quantidade de produtos que neste momento podem satisfazer as
necessidades de uma empresa. Essa foi uma das maiores dificuldades na elaboração
deste relatório, o conseguir filtrar os inúmeros conceitos e ferramentas que existem. A
quantidade de soluções existentes no mercado torna a opção não tão certa e clara. Mas
também não se nota qualquer movimentação na implementação de novas soluções.
Não existe uma solução perfeita, existe sim diversas hipóteses, dependendo da
necessidade da empresa, dos custos que possa “dispensar” e que valha a pena. Podemos
sim, deixar um standard que poderá ser seguido. Para tal, podemos dividir em várias
partes a análise, desde as ferramentas standard de criação, edição e impressão de
documentos, e as ferramentas que geram todo este tipo de documentação. Uma coisa é
certa, para cada ferramenta com licença, existem duas livres.
Sendo assim, qual das ferramentas a utilizar? Qual a Office Suite10 a optar e qual a
ferramenta para a gestão documental?
Offices Suites Dependendo da utilização que, no dia-a-dia, cada empresa faz das várias aplicações do
Office, as suites existentes no mercado são uma opção a ponderar. Como diz o ditado,
não vale a pena «matar mosquitos com balas de canhão». Se as funções que mais se
utiliza no Word se relacionam com a criação de tabelas ou a edição de documentos
(definir o layout de páginas, alterar estilos e fontes, verificação ortográfica e
gramatical…), então as Suites existentes serão mais que suficientes.
10 Ver em anexo a análise realizada a algumas das Offices Suites existentes actualmente no mercado.
92
Antes de escolher uma Suite alternativa de aplicações, será necessária a verificação da
compatibilidade entre as aplicações, ou seja, verificar se os vários programas são
compatíveis com o Microsoft Office, em particular o Word e o Excel, os mais comuns
entre os utilizadores. Será necessária também uma verificação ao nível de integração
entre as várias aplicações da Suite, condição essencial para que se possa importar e
cruzar informação produzida nos diferentes programas.
O software abunda, mas há que notar as tendências – quanto pode obter mediante uma
despesa mínima. Nunca esta questão esteve tão clara como no software grátis
disponível, como por exemplo OpenOffice.org, relegados para segundo plano nas suas
pequenas caixas. Vale sempre a pena arranjar tempo para procurar na Web aquilo que se
precisa, se possível sem ter de se pagar – por exemplo, será que o freeware PDF se
esforça o suficiente para podermos passar sem as funções (mais caras) do Abode
Acrobat? E a Microsoft?
Os contractos realizados com a Microsoft têm uma duração mínima de 3 anos, em que o
cliente fica vinculado num pagamento de uma anuidade. Após o término do contracto o
cliente deverá renova-lo (ou seja, por mais três anos). Caso não opte pela renovação do
contracto, este deverá proceder à remoção do software das respectivas máquinas. O
custo da anuidade terá uma variação mediante o número de máquinas em que pretende
instalar o software.
Se assumirmos como exemplo a instalação base em 100 máquinas de um Windows e
Office por computador, o custo poderá ser de cerca de 430 euros. Se considerarmos a
necessidade de um software para o servidor, deverá ser acrescentado cerca de 300 euros
na anuidade.
Produto Quant. Total
Server 1 300,00 €
Microsoft Windows 100 26.000,00 €
Microsoft Office 100 17.000,00 €
43.300,00 €
Tabela 8.1 – Exemplo Microsoft: custo de aquisição do produto
Conclusão
93
Conforme podemos observar, o custo anual deste contacto rondam um valor que poderá
ser facilmente economizado.
Com isto em mente, não surpreende que pacotes como o OpenOffice.org se aproximem
cada vez mais da rampa de lançamento. O facto de não possuírem funções tão
completas como os seus rivais não é tão relevante no caso de executar a sua função
principal, mesmo que o processo de desenvolvimento constante possa deixar algumas
funções chave por desenvolver até que alguém decida corrigi-las.
Coloca-se a questão de qual aplicação vingará? O OpenOffice.org ou irá manter-se o
Microsoft como líder incondicional no mercado? Antes de mais deveremos “olhar” para
o que nos rodeia e daí tirar elações.
A decisão na aquisição de um pacote de software encontra-se no mesmo pé que a
aquisição de genéricos. Opta-se pelo mais conhecido e não se dá qualquer tentativa a
um outro, mais barato e com o mesmo princípio.
Um dos maiores inimigos presentes para o sucesso do open-source será mesmo a
pirataria porque apesar de haver outros produtos (gratuitos), a tendência é sempre a de
arranjar uma cópia pirata do produto mais conhecido, o Office. Mesmo que nem se
chegue alguma vez a usar ou, quando usado, somente usa-se 5% da capacidade da
ferramenta.
A falta de divulgação é outro problema, mesmo em instituições académicas, o software
instituicionalizado é o Office, o que leva tendenciosamente a uma preferência. Tal como
na aquisição de hardware, onde o Windows continua a ser o software standard – mesmo
a tendência é sempre a de ter o mesmo sistema que o vizinho tem.
A influência comercial é outra das desvantagens sobre o software gratuito, dado que
não temos um vendedor porta-a-porta a “prometer mundos e fundos”, apesar de hoje em
dia existir uma assistência via Web o que coloca ao mesmo nível ambos os produtos.
Até mesmo a falsa associação entre o conceito de open-source e o shareware, pelo que
de certo muitas pessoas assumem que seja a mesma coisa.
O open-source teve quiçá um início idêntico à da instalação do Linux, donde as
complexas instalações colocaram entraves para a evolução.
O processo de adaptação a esta nova filosofia deverá ser tipo “top-bottom” e não ao
contrário, porque a tendência será do nível inferior adaptar-se ao seu nível superior.
94
Deste modo, se a tendência para o open-source começar no nível superior, o nível
inferior irá adaptar-se. Mas como já foi referido anteriormente, isto implica a evolução
na mentalidade a longo prazo e talvez, com um bom marketing, seja possível a transição
numa fase em que surjam upgrades de elevado custo, o que levará a tender para o open-
source.
Presentemente a questão que nos seria colocada: “o que faria com o software adquirido
actualmente? E o investimento?”. Claro está que dar uma resposta do estilo colocar na
caixa um investimento caro e passar para um gratuito é como condenar um êxito logo à
partida. Este processo, como já foi referido, deverá ser levado com um bom marketing
como, por exemplo, eventos promocionais, oferta de embalagens atractivas (embora
disponível na Web), bem como outras medidas que promovam o êxito.
Este investimento deverá ser a médio e longo prazo, não só a nível privado, como
também público, com aposta em produtos gratuitos que levem a uma tendência para o
privado. Este investimento realizado pelas entidades públicas leva a uma redução nos
custos, podendo esse rendimento, ser aplicado em outras necessidades. Futuras
propostas podem levar a uma tendência para o software gratuito, dando até preferência.
No entanto, para ideologias “bonitas” contrapõem-se interesses financeiros que superam
o interesse económico. Tal como o nunca da evolução nas energias renováveis, que
parece não vingar contra os patrões do petróleo.
Gestão Documental
“Um número numa folha de papel é um beco sem saída; um número em forma digital é
o início de um raciocínio e de uma acção consequente”
by Bill Gates,
in «Negócios à Velocidade do Pensamento»
Das ferramentas apresentadas, todas são válidas e funcionais, estando somente a decisão
da aquisição inerente a alguns motivos referidos anteriormente. Também para estes
Conclusão
95
produtos, pode-se afirmar que existem ferramentas livres que podem muito bem
satisfazer as necessidades da empresa, tal como o Silva.
Estando o XML cada vez mais presente, torna-se cada vez mais acessível a
interoperabilidade.
Factor humano
"Aquele que não aplicar novos remédios deverá esperar novos males – pois o tempo é
o maior inovador"
by Francis Bacon (1561-1626)
O factor humano é muito importante para um possível êxito de aplicações sobre o
Office. As alternativas ao Office são diversas, sobressaindo de entre elas, o
OpenOffice.org, não só por ser gratuito (uma enorme vantagem) mas pelas enormes
potencialidades de interoperabilidade oferecida. No entanto, a paixão de nada serve sem
um acção. A elaboração deste relatório foi todo ele realizado no Microsoft Word, apesar
de terem sido instaladas diversas aplicações para processamento de texto, como
OpenOffice.org, AbiWord, etc.
Mas porque não foi feita essa transição? O que levou a não transição para outra
aplicação? A tendência foi sempre para o uso da aplicação que sempre respondeu às
necessidades. Aqui demonstra-se a já referida tendência para a expressão “sempre usei e
nunca deu problemas…”, conceito errado mas dará para compreender se a motivação de
um particular é fraca, a tendência empresarial é idêntica – visto uma empresa ser um
conjunto de elementos particulares a trabalhar para um mesmo objectivo.
A Microsoft motiva este Word dependência com a oferta do processador de texto,
disponibilizando-o de origem com o Windows.
Implementação Antes de qualquer implementação será necessário olhar para “o que nos rodeia” e
definir os objectivos a atingir. A área de negócio é muito importante para a decisão da
metodologia a implementar. Por exemplo, será necessária a implementação de um
96
sistema EDI na I2S? Não sendo uma empresa de enorme “fluxo” documental, um Portal
cobrirá perfeitamente as necessidades.
Nem será de bom senso que se deite ao “lixo” as aplicações instaladas só porque
existem gratuitas. Estaria a ser colocada em causa o investimento feito, e acima de tudo,
colocar em causa um sistema que funciona. O processo de adaptação teria ser gradual,
com uma evolução lenta na transição para, por exemplo, o OpenOffice.org. A decisão
para a transição deveria ser planeada aproveitando momentos cruciais, tais como o
upgrade do Office. Nessa altura poderia ser feita a transição para o OpenOffice.org,
permitindo uma redução no investimento em aplicações Office. Até chegar essa fase,
deveriam ser promovidas algumas secções de motivação – nunca esquecendo o factor
humano. Coloca-se em causa o envolvimento de um grupo de programadores para
possíveis adaptações no software.
No entanto, a I2S dificilmente terá poder de mudança nos seus clientes. Seria
impensável que conseguisse mudar uma filosofia já implementada nas instituições.
Tendo em conta que poucas são as empresas que possui um poder de persuasão sobre os
seus clientes e fornecedores, seria inconsciente afirmar que a adaptação para uma
estrutura open-source seria fácil. Mas, assumindo que era conhecida a chegada de uns
anos de “vacas magras”, então seria possível algum movimento revolucionário para essa
possível transição.
As ferramentas encontram-se disponíveis na mesa, agora só falta lançar-se ao
trabalho.
9. Glossário
DOM (Document Object Model)
Plataforma neutra e interface de voz que permite que os programas e scripts tenham
acesso dinâmico a documentos e que actualiza os respectivos conteúdos, estruturas e
formulários. Subsequentemente, os documentos podem ser tratados e, em seguida, os
resultados são acrescentados à página representada.
EAI (Enterprise Application Integration)
Software que permite a partilha inteligente e sem restrições de dados e processos de
negócio entre qualquer aplicação ou fonte de dados numa empresa;
ebXML
Acordo que permite que as empresas efectuem transacções comerciais através da
Internet, independentemente do seu local e dimensão. As empresas dispõem assim de
um método normalizado de enviarem mensagens entre si e de suportarem relações
comerciais, comunicação de dados, além da definição e registo de processos comerciais.
Middleware
Software que funciona como uma camada de tradução e que está entre uma aplicação
que reside num servidor e um grupo de clientes que querem aceder a essa aplicação.
Resumindo, o middleware permite aos utilizadores interagir entre si e com as aplicações
num ambiente de computação heterogéneo. O middleware também automatiza as
operações de negócios, unindo as operações back-end e front-end.
SOAP (Simple Object Access Protocol)
Descreve um modelo para o empacotamento de perguntas e respostas XML.O envio de
mensagens SOAP é utilizado para permitir o intercâmbio de uma variedade de
informações XML.A norma de SOAP assume a tarefa de transmitir pedidos e respostas
sobre serviços entre utilizadores e fornecedores de serviços.
98
UDDI (Universal Description Discovery and Integration)
Especificação para um índice de todos os serviços disponíveis na Web, comparável a
uma lista telefónica global das “Páginas Amarelas”. A UDDI ajuda as empresas a
produzir descrições dos serviços que oferecem, a transmitir os pormenores ao registo e,
assim, a serem consideradas fornecedoras de serviços. Utilizando o método UDDI, os
utilizadores de Web Services podem enviar perguntas sob a forma de mensagens SOAP
ao ponto de registo central a fim de avaliar fornecedores de um determinado serviço.
WSDL (Web Services Description Language)
Linguagem XML utilizada pelas interfaces de serviços e pelos acordos de protocolos,
entre outros, para descrever o acesso a Web Services. O WSDL é independente da
linguagem subjacente para a implementação de serviços ou do modelo de componentes.
XML (Extensible Markup Language)
Tal como a HTML, a XML é também uma especificação para a formatação de
documentos da Web e de páginas da Web. Suporta a comunicação entre várias empresas
e aplicações. Apesar das diversas plataformas de sistemas operativos e dispositivos
finais, a lógica de acesso de dados e a lógica das aplicações não precisam de ser
alteradas.
XSL (Extensible Style-sheet Language)
Linguagem para a conversão e representação de documentos XML que também
transforma o código XML em código HTML. Além disso, filtra e classifica os dados
XML, podendo abordar várias partes de um documento XML. Os dados XML são
apresentados individualmente, por exemplo, com valores negativos indicados a
vermelho. Os dados XML suportados por XSL podem ser transmitidos a vários
dispositivos finais tais como ecrãs, impressoras ou telemóveis.
10. Bibliografia/ Referências
Documentos Almeida, Pedro Quaresma de
Introdução ao LaTeX
Lisboa: Escolar Editora, 1996
Coelho, Pedro Alexandre
XML: a nova Linguagem da Web
FCA – Editora de Informática, 2000
Silva, Miguel Mira
Integração de Sistemas de Informação
FCA – Editora de Informática, 2003
Cover, Robin
The XML Cover Pages: Extensible Markup Language (XML)
22 March 2001. oasis-open.org/cover/xml.html
Dougherty, Dale
There’s a Bright Future Beyond HTML
16 May 1997. www.webreview.com/1997/05_16/webauthors/05_16_97_4.shtml
Chandra, David
Guidelines for Application Integration
December 2003. msdn.microsoft.com/library/en-us/dnpag/html/eappint.asp?frame=true
100
Websites
AbiWord – Word Processing for Everyone www.abisource.com
Adobe Systems Incorporated www.adobe.com Consultoria Tecnológica e Desenvolvimento de Soluções www.ace.pt
GhostScript www.ghostscript.com
GhostScript - GNU Project www.gnu.org/software/ghostscript/ghostscript.html
IBM www.ibm.com
Infrae (Silva) www.infrae.com/products/silva
IXOS Software www.ixos.com
Microsoft Corporation www.microsoft.com
Zope Community (Silva) zope.org/Members/infrae/Silva
Biblio soft – Informática, Formação e Serviços www.bibliosoft.pt
O’Reilly XML.COM: XML From the Inside Out www.xml.com
XML.ORG –Applying XML and Web Services Standards in Industry www.xml.org
LINUX Journal www.linuxjournal.com OASIS - Organization for the Advancement of Structured Information Standards www.oasis-open.org
Open Source Iniciative OSI www.opensource.org
Projecto Oásis – Open Source em Português… projecto-oasis.cx SourceFORGE.net – Open Source software development website sourceforge.net
W3c Word Wide Web consortium www.w3.org
Base de Conhecimento de Informática e Gestão www.tecnet.pt Bitpipe – IT Information: White Papers, Product Literature, Webcasts and Case Studies www.bitpipe.com SIGLAE – Siglas, Abreviaturas e Acrónimos em Educação www.giase.min-edu.pt/Sigla
whatis.com whatis.techtarget.com
Portal da I2S (interno)
11. Índice Remissivo
E
EAI ........................................ iv, vi, 3, 72, 73, 74, 101
ebXML........................................... iv, 76, 77, 78, 101
ECM...................................................iv, 3, 71, 79, 80
EDI ........................................ iv, vi, 3, 74, 75, 77, 100
G
Gestão Documental .... iv, 3, 59, 60, 61, 62, 91, 95, 98
I
Interoperabilidade.....1, iii, v, vi, 1, 2, 3, 5, 6, 7, 9, 24,
35, 44, 51, 52, 55, 71, 73, 86, 95, 99, 119, 127,
139, 142
L
LaTeX .......... iii, 29, 33, 43, 44, 45, 46, 103, 117, 118
M
Microsoft Excel ...............................................v, 2, 25
Microsoft Word.. 2, 17, 21, 24, 33, 34, 46, 88, 90, 99,
114
P
Portal .......... v, vi, 64, 66, 67, 68, 69, 85, 87, 100, 104
S
SharePoint Portal Server ......iv, vi, viii, 67, 86, 87, 90
W
WebSphere ...................................................iii, 50, 52
Workflow ......... iv, 2, 3, 60, 62, 63, 64, 65, 89, 90, 91
12. Anexos
Anexos
105
12.1 I2S Pretendo agora revelar um pouco mais da organização que serviu de base para alguns
dos casos práticos apresentados ao longo do relatório – a I2S. Esta sigla I2S tem um
significado que pode passar despercebido a uma leitura menos atenta: a letra ‘I’
significa Informática, o ‘2’ ‘multiplica’ a letra ‘S’, significando respectivamente
Sistemas e Serviços.
A I2S dedica-se à instalação de sistemas e ao desenvolvimento de aplicações
informáticas na área dos seguros.
Breve historial Fundada em 1984 por cinco elementos do corpo docente do curso de Informática do
Instituto Superior de Engenharia do Porto, a I2S começou por ser uma empresa de
formação com o objectivo de vir a tornar-se posteriormente numa entidade oficial de
ensino superior na área das novas tecnologias e sistemas de informação.
Começou também, por desenvolver software genérico na área de gestão como a
contabilidade, a facturação, a gestão de stocks, entre outros.
Em 1989, a I2S aceitou a proposta da REAL Companhia de Seguros, S.A., que consistia
no desenvolvimento e na manutenção dum conjunto de soluções informáticas eficazes
de forma a responder às necessidades dos agentes de seguros.
Beneficiando do lançamento pela IBM do sistema informático AS/400, em 1988, a I2S
passou, quase sem concorrência, a liderar o mercado nacional de soluções informáticas
para a actividade seguradora.
Em 1996, devido ao alargamento dos negócios para o estrangeiro, esta empresa
procedeu a um aumento do capital social de 50.000 cts para 1.000.000 euros.
Missão Concepção, desenvolvimento e implementação de soluções informáticas de elevado
nível de integração e flexibilidade, para o mercado global de seguros.
106
Direcções Estratégicas 1. Especialização por área de negócio (seguros);
2. Fornecimento de serviço global ao cliente;
3. Ligação com centros de formação e investigação;
4. Estrutura organizacional assente em projectos.
Tipo de Empresa Forma jurídica: Sociedade Anónima
Capital Social: 1.000.000 euros
Organização Interna De forma a identificar a organização da I2S, apresenta-se uma breve descrição das
funções dos diversos sectores da empresa (Tabela 2 1)
Sector Função
Administração Dirige e coordena todos os sectores de forma a atingir os
objectivos da empresa (exerce também as funções de
departamento dos recursos humanos).
Ramo Não Vida Desenvolve programas destinados à gestão da actividade
técnica de seguros do ramo não vida.
Ramo Vida e
Fundos Pensões
Desenvolve programas destinados à gestão da actividade
técnica de seguros do ramo vida e de gestão de fundos de
pensões em micro-computadores.
ADF/SIG Desenvolve programas que satisfazem as necessidades de
tratamento Administrativo/Financeiro de uma companhia
de seguros com um grande nível de integração entre si e
com toda a área técnica.
Mediadores Desenvolve programas destinados ao apoio de agentes
mediadores e corretores de seguros com eventual ligação
aos sistemas das companhias.
Comercial Promove novos produtos, negocia os contratos com os
clientes, averigua as necessidades dos clientes e adquire
os bens necessários ao desenvolvimento.
Anexos
107
Sistemas Garante o bom funcionamento do hardware existente na
I2S e nos clientes.
Projectos
Especiais
Apoio técnico a todas as áreas, investiga soluções e
produz aplicações específicas para a resolução de
problemas pontuais.
Administrativo/
Secretariado
Executa as directivas definidas pela administração
nomeadamente pagamentos, facturação e recepção, e
todas as actividades inerentes ao dia-a-dia da empresa.
Projectos
E-Business
Desenvolvimento direccionadas a Web
I&D Inovações & Desenvolvimento, realizando investigações
e pesquisa de novas tecnologias
Tabela 12.1 – I2S: Sectores da Empresa
Mercado Especialização integral na actividade seguradora - dispõe de soluções para todos os
intervenientes do sector (Companhias de Seguros Vida, Não Vida, Agentes/Brockers)
Área Geográfica (Soluções instaladas e em instalação):
Europa
África
Brasil
Colaboradores Quadro com 110 colaboradores, na generalidade com formação superior e que
conjugam o domínio das tecnologias de informação com a experiência e o
conhecimento profundo da actividade seguradora.
Anexos
109
12.2 Especificações de formatos de ficheiros Este anexo tem a intenção de apresentar algumas especificações dos formatos mais
conhecidos.
Extension: DOC
Program and/or Extension Function Company
Word Document Microsoft
Specific Notes
Different versions of Word may have slightly different initial file contents. Use TrID to determine the version of Word. Are you trying to access older Word or PowerPoint documents in Office 2003 and can't? The original Office 2003 will not open older documents that have Office 2000 Clip Art in them. Check the Microsoft site for a critical update that fixes this.
MIME Type File Classification Associated Links
application/msword application/doc appl/text application/vnd.msword application/vnd.ms-word application/winword application/word application/x-msw6 application/x-msword zz-application/zz-winassoc-doc
Identifying Characters
Hex: D0 CF 11 E0 A1 B1 1A E1
Program ID
Word.Document.6 Word.Document.8 WordDocument WordPad.Document.1
General Notes
(None)
• Free Microsoft Viewer • Jarte Word Processor
This is record 3405 last modified on 2004-08-29.
110
System Extension Info
ProgramID FileType AppName EXEFile
602Text.Document 602Text Document 602Text 602Text.exe
CorelDRAW.Graphic.11 CorelDRAW 11.0 Graphic CorelDRAW(R) coreldrw.exe
Frigate3.view HTML Document Frigate3
soffice6.doc Microsoft Word Document OpenOffice.org 1.1.0
Word.Document.6 Microsoft Word 6.0 - 7.0 Document
Word.Document.6 Microsoft Word Document
Microsoft Word for Windows® 95
Word.Document.8 Microsoft Word Document Microsoft Office Word
Word.Document.8 Microsoft Word Document Microsoft Word WINWORD.EXE
Word.Document.8 Microsoft Word Document Microsoft Word for Windows WINWORD.EXE
Word.Document.8 Microsoft Word Document
Microsoft Word for Windows® 97
Word.Document.8 Microsoft Word Document
Microsoft Word Viewer for Windows® 97 wordview.exe
WordDocument Microsoft Word 2.0 Document
WordPad.Document.1 Wordpad Document Rights Management Add-on for Internet Explorer
WordPad.Document.1 Wordpad Document WordPad WORDPAD.EXE
wp10doc WordPerfect 10 Document WordPerfect(R) 10
MIME Type Info
ProgramName MIMEType
application/mswor2C sc2
application/octet-stream
application/wordperfect5.1
application/x-detective
application/x-pressleaf
application/x-soffice
text/plain
Anexos
111
Extension: XLS
Program and/or Extension Function Company
Excel Worksheet Microsoft
Specific Notes
Program: EXCEL.EXE. Also used by the Excel Viewer: XLVIEW.EXE. Can be captured by the OpenOffice Suite.
MIME Type File Classification Associated Links
application/msexcel application/x-msexcel application/x-ms-excel application/vnd.ms-excel application/x-excel application/x-dos_ms_excel application/xls application/x-xls zz-application/zz-winassoc-xls
Spreadsheet
Identifying Characters
Hex: D0 CF 11 E0 A1 B1 1A E1 00
Program ID
Excel.Sheet.5 Excel.Sheet.8 soffice6.xls
General Notes
(None)
• Free Microsoft Viewer
This is record 13408 last modified on 2004-06-01. System Extension Info
ProgramID FileType AppName EXEFile
602Tab.Document 602Tab Document 602Tab Application 602Tab.exe
CorelDRAW.Graphic.11 CorelDRAW 11.0 Graphic CorelDRAW(R) coreldrw.exe
Frigate3.edit Write Document Frigate3
QuattroPro.Notebook Quattro Pro 10 Notebook
viewer.rmh.1 Microsoft Rights Managed HTML Document
Rights Management Add-on for Internet Explorer
112
MIME Type Info
ProgramName MIMEType
application/octet-stream
application/x-excel5book
application/x-soffice
Extension: XML
Program and/or Extension Function Company
Extensible Markup Language File
Specific Notes
(None)
MIME Type File Classification Associated Links
text/xml application/xml application/x-xml
Identifying Characters
(None or Unknown)
Program ID
(None or Unknown)
General Notes
(None)
• XML Info Page
This is record 13428 last modified on 2004-06-23. System Extension Info
ProgramID FileType AppName EXEFile
FotoSlatePageDesigner.Document Untitled Document XMLEditor XMLEDI~1.EXE
Microsoft.XMLDSO XML Data Source Object
MozillaXML XML Document Mozilla MOZILLA.EXE
MozillaXML XML Document Netscape NETSCP.EXE
Opera.HTML HTML Document
Opera Internet Browser opera.exe
UltraEdit.xml XML Document
UltraEdit-32 Professional Text/Hex Editor
xmlfile XML Dreamweaver MX Dreamweaver.exe
Anexos
113
Document
Xmlfile XML Document Internet Explorer iexplore.exe
Xmlfile XML Document
Microsoft Internet Explorer
Xmlfile XML Document XML Editor
MIME Type Info
ProgramName MIMEType
magnus-internal/xmlform
text/xml
text/x-pidl
widetext/xml
Extension: TEX
Program and/or Extension Function Company
LaTeX Source LaTeX3 Project
Specific Notes
LaTeX is based on Donald E. Knuth's TeX typesetting language. LaTeX was first developed in 1985 by Leslie Lamport, and is now being maintained and developed by the LaTeX3 Project. LaTeX is available free and can also be viewed and edited somewhat by emacs, which has been ported to MS Windows as well as UNIX versions and available at GNU.ORG.
MIME Type File Classification Associated Links
application/x-tex
Identifying Characters
(None or Unknown)
Program ID
(None or Unknown)
General Notes
(None)
• None
This is record 11965 last modified on 2003-03-15.
114
Extension: TEX
Program and/or Extension Function Company
TeX
Specific Notes
Also see LaTeX entry.
MIME Type File Classification Associated Links
application/x-tex
Identifying Characters
(None or Unknown)
Program ID
(None or Unknown)
General Notes
(None)
• None
This is record 11968 last modified on 2003-03-15. MIME Type Info
ProgramName MIMEType
application/x-latex
application/x-tex
application/x-tex; application/x-latex; text/x-tex
text/anytext
text/plain
text/x-tex
Anexos
115
12.3 XML
A evolução da tecnologia Web permite o acesso a informações de forma cada vez mais
interactiva e dinâmica. Da simples exibição de documentos estáticos, a Web passou a
suportar sistemas com grande quantidade de informações e diferentes plataformas.
Nesse contexto, eXtensible Markup Language (XML) surge como um poderosa
ferramenta para lidar com documentos dinâmicos na Web devido à sua característica de
fazer distinção entre conteúdo e dados. O XML pode ser usada como um formato
padrão para armazenamento de dados e/ou um formato intermédio para representar
qualquer fonte de informação disponibilizada a diversos dispositivos. XML pode ser
utilizada no desenvolvimento de aplicações da Web em diversas áreas.
A flexibilidade do XML provém da possibilidade de transportar qualquer tipo de dados,
mantendo-os estruturalmente coesos e inteligíveis, como binários através da estrutura
markup (<tag>value</tag>). Devido a esta estrutura, é também possível combinar num
mesmo documento, vários objectos com tipos de dados diferentes.
Para a visualização e interpretação de documentos em XML é, por vezes, necessário
utilizar a linguagem XSL e uma estrutura standard (DOM). É essencial para quem
pretende usar marcas nos documentos que disponibiliza na Web ou numa rede interna
(Intranet). É uma tecnologia única que, agrupa a descrição de um documento e o seu
conteúdo.
O XML foi desenvolvido pela organização World Wide Web Consortium’s (W3c)
visando promover interoperabilidade entre aplicações. O XML fornece significativo
avanço na forma como os dados são descritos e manipulados via aplicações Web através
do uso de um formato padrão simples e flexível.
Assim sendo, a XML foi definida com o objectivo de assegurar um estrutura de dados
uniforme e independente de aplicações e fabricantes, visando interoperabilidade. XML
oferece uma abordagem padrão para descrição, captura, processamento e publicação de
informação. XML concentra-se no conteúdo da informação e não na apresentação.
Folhas de estilo descrevem como os documentos são apresentados na Web, permitindo
diferentes visões do mesmo lado.
116
Existem duas linguagens de especificação de estilo para documentos XML: Cascading
Style Sheet (CSS) e eXtensible Stylesheet Language (ESL). As ferramentas que definem
a descrição da estrutura do documento XML são Document Type Definition (DTD) e
XML Schemas. Elas oferecem a capacidade de diferentes aplicações em compartilhe os
mesmos dados.
Linguagem derivada do SGML O XML é um subconjunto do SGML, compreendendo todas as suas potencialidades,
designadamente a possibilidade de poder estruturar todo o tipo de dados. Por
conseguinte, cada documento estruturado em XML, segue as regras do SGML. Tal
como o SGML, é uma linguagem de Metadata, estruturada em etiquetas e em "markup",
recorrendo a DTD’s para definir a sua semântica.
O SGML formaliza a estrutura de um documento para obter a portabilidade do mesmo,
permitindo que um dado formato de um documento seja específico ao domínio em
questão. O SGML é muito poderoso, mas também muito complexo, o que o torna difícil
de utilizar. O objectivo da criação do XML, foi retirar o que havia de bom no SGML e
torna-lo o mais simples possível.
Relação do XML e HTML Tal como o HTML, o XML também utiliza etiquetas como <title> ou <body> e
atributos como "lang=en". Mas, enquanto que com o HTML é a própria linguagem que
especifica o que cada etiqueta e atributo especificam, o XML usa as etiquetas apenas
para delimitar blocos de dados e deixa a interpretação dos mesmos para a aplicação.
Assim, em função do contexto programático, um <p> que em HTML significa sempre
um novo parágrafo, pode em XML significar um preço, uma pessoa, ou o que nós
desejarmos.
Apesar de ser uma ferramenta fácil de usar e aprender, facto pelo qual se generalizou
bastante o seu uso, verificam-se algumas desvantagens na utilização do HTML que se
prendem com o facto de: os dados estarem dependentes da sua apresentação gráfica; não
nos fornecer conteúdo semântico e ter um número limitado de etiquetas.
O HTML especifica a formatação gráfica de um documento, enquanto que o XML
especifica a estrutura de dados. Com o XML, não existe limitação a etiquetas
Anexos
117
predefinidas, podemos criar a nossa estrutura e definir uma interpretação para essa
estrutura, sempre disponível no nosso sistema informático.
O XML é uma tecnologia de conteúdos alternativa e também complementar ao HTML,
que vai provavelmente rivalizar mais com os formatos proprietários de armazenamento
de documentos, do que propriamente com o HTML. Por ser altamente adaptável aos
dados que pretende descrever, por facilitar a interacção entre aplicações e documentos, e
por produzir documentos auto-descritivos, a tecnologia XML tem condições para se
tornar num standard para a publicação, armazenamento e transferência de documentos
por via electrónica.
Relativamente ao HTML, o XML trás grandes vantagens na sua utilização. Para além da
possibilidade de definição de novas marcas e etiquetas à medida dos utilizadores e de
um maior controlo sobre a aplicação de formatações e da forma como estas aparecem
nos browsers, o utilizador do XML fica com a certeza de publicar os seus documentos
num formato standard (independente dos fabricantes de software), facilmente
interpretável por múltiplas aplicações e, em certa medida, auto-explicativo.
O XSL O XSL é uma linguagem de folhas de estilo. Um conjunto de instruções destinadas à
visualização. Divide-se em duas partes, uma para transformar o documento XML noutro
tipo de documento a outra para definir objectos de formatação para apresentação
gráfica:
• XSLT – linguagem de transformação
• XSLFO – linguagem de formatação de objectos
O XSL é especialmente conhecido através da sua linguagem de transformação XSLT. É
com este tipo de aplicação que o XSL está implementado nos browsers www utilizados
na Internet. O XSLT é uma linguagem XML que respeita as regras de bem formado e
válido. Define: uma transformação a aplicar a um documento XML; a transformação de
um documento original HTML válido e bem formado, de forma a respeitar as regras do
XML.
118
documento
folha deestilos
documentode saída
processadorXSL
Figura 12.1 – Esquema do XSL
Os documentos XML são hierárquicos, o que quer dizer que podem ser vistos como
uma árvore onde cada nível possui vários elementos. O XSLT tem definido
transformações que podem abarcar um elemento, um ou vários níveis. A aplicação
XSLT percorre o documento, verificando para cada nível se existe uma transformação
associada. Caso exista ela é aplicada. A escolha dos elementos a transformar é feita
através de operadores de selecção e de pattern matching.
Noções básicas da estrutura do XML O XML oferece ao seu utilizador a possibilidade de definir as suas próprias marcas à
medida e conforme as suas necessidades. No entanto, há um conjunto de regras que têm
de ser seguidas de modo a ter como resultado um documento "bem formado", ou seja,
um documento que respeita integralmente as regras gramaticais definidas. Esta restrição
permite o processamento do XML de forma muito mais eficiente do que no HTML, a
simplificação do software de processamento e a representação de uma estrutura de
dados de forma inequívoca.
Um documento XML é composto por duas partes distintas:
• Cabeçalho <?xml version="1.0"> (facultativo)
• Árvore de elementos
Ex:
<marca>
...
conteúdo
...
Anexos
119
</marca>
Para além destes, existem mais três géneros de informação:
• Declaração XML
• Instruções de processamento
• Declaração de tipo de documento (DTD)
Quanto à estrutura deve salientar-se que os documentos XML começam sempre pela
declaração do XML
<?xml version="1.0"?>
A seguir à declaração do XML vem a declaração do tipo de documento
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN">
Só pode existir uma raiz por documento, esta tem que ter um nome único e deve possuir
um significado óbvio
<apresentação>
Os elementos são usados para definir o conteúdo do documento XML, podem conter
outros elementos, texto ou estar vazios
<aluno>
Os atributos definem propriedades sobre os elementos e não podem ser repetidos dentro
de um elemento
<dia data="10" assunto="O que é o XML?"/>
Existem uma série de entidades pré-definidas no XML, mas é possível criar as próprias
entidades.
Os comentários não podem aparecer dentro dos elementos e possuem a mesma sintaxe
do HTML
120
<!- - isto é um comentário - ->
O XML é case-sensitive
<ELEMENTO> é diferente de <elemento>
Todos os atributos devem estar entre aspas
<apresentação título="xml"/>
Todos os elementos devem possuir uma etiqueta de início e de fim
<título>Estrutura do XML</título>
Todos os elementos devem estar contidos num elemento raiz que identifica o domínio.
Os elementos XML não podem começar por números, ou sinais de pontuação, embora
possam incluir números e os caracteres:
_
:
Anexos
121
12.4 Offices Suites Este texto talvez seja considerado um pouco comercial mas de certa forma necessário
para a noção do que actualmente existe no mercado. A regra dos 80/20 – segundo a qual
80% dos utilizadores servem apenas de 20% das funcionalidades dos programas –
aplica-se bem às Office Suites. Estes pacotes integrados incluem, de um modo geral, as
aplicações essenciais para qualquer utilizador: um processador de texto, uma folha de
cálculo e um programa para criar apresentações. Hoje em dia, boa parte das suites inclui
ainda programas de desenho e de criação de bases de dados, bem como um cliente de e-
mail.
Existem no mercado várias alternativas ao Microsoft Office. Todas elas incluem, pelo
menos, um processador de texto do tipo Word e uma folha de cálculo semelhante ao
Excel. Algumas são completamente gratuitas e estão disponíveis para download na
Internet; outras podem ser adquiridas por uma fracção do preço do Microsoft Office.
As seguintes suites apresentadas são base de comparação para com o oponente
Microsoft Office. Este capítulo pretende expor algumas das suites que podem substituir
o Office, sem contudo ter qualquer perda, e de fácil “migração” para outra suite.
Office 2003 Com mais de 90% do mercado, o Microsoft Office é líder incontestado nas suites
Office. Word, Excel, Powerpoint, Outlook e Access são aplicações conhecidas e usadas
pela maioria dos utilizadores, ainda que boa parte destes tire partido apenas de uma
pequena percentagem das funcionalidades dos programas. A última versão do Office,
lançada em Outubro de 2003, inclui melhorias das aplicações e, mais importante,
suporte alargado para XML.
Figura 12.2 – Microsoft Office 2003
122
Contudo, tudo isto tem o seu preço. A versão mais barata do Microsoft Office 2003
custa 223,66 euros (versão Profissional para estudantes, professores e escolas, em
português).
A seguinte tabela apresenta os valores das demais versões:
Versão Preço11
Profissional para estudantes, professores e escolas, em português 223,66 €
Standard (Word, Excel, Outlook, Powerpoint) 535,74 €
Small Business 588,46 €
Professional 653,79 €
Tabela 12.2 – Microsoft Office – versões e respectivos valores
Esta versão do Office destina-se a um público ainda mais elevado do que as edições
anteriores, em que a maioria das grandes novas alterações foi criada especialmente para
o sector empresarial – documentos baseados em XML, a firme protecção contra cópia
da gestão de direitos informáticos (Information Rights Management) e um conjunto de
funções de bloqueio interno que faz tudo menos exigir que o utilizador seja uma PME
para que o seu dinheiro valha a pena.
OpenOffice.org 1.1 O OpenOffice.org é um completo pacote aplicacional de produtividade
de escritório, que fornece um ambiente de trabalho semelhante a
outros pacotes de produtividade. O OpenOffice.org assume-se como
uma alternativa real e multi-plataforma a outras Offices Suites com
custo bastante significativo. Com o OpenOffice.org, a empresa nada
tem de pagar e, acima de tudo, utiliza um pacote de livre
produtividade, onde pode gravar os documentos em formato aberto, sem se preocupar
com licenciamentos ou compatibilidades.
11 Valores de Agosto de 2004.
Anexos
123
Trabalha de forma completamente transparente, com uma grande variedade de formatos
de ficheiros, permitindo aos utilizadores que os troquem com colegas que usam outros
pacotes de produtividade, como o Microsoft Office e o StarOffice. É também multi-
plataforma, o que significa que pode-se usar o OpenOffice.org nativamente em Linux
(qualquer distribuição), Linux, Solaris, Windows (qualquer versão) e em Mac OS X,
tornando-o assim num pacote de produtividade ideal para uma migração de sistemas
operativos livres, com a particularidade de manter o formato de ficheiros original.
Com mais de 7,5 milhões de linhas de código, o OpenOffice.org é o resultado de mais
de 18 meses de trabalho colaborativo entre membros da comunidade OpenOffice.org,
que envolveu colaboradores da Sun MicroSystems, voluntários da CollabNet e
utilizadores finais, criando um pacote de produtividade de classe mundial, por muitos
considerado a “killer aplication” concorrente ao Microsoft Office.
Figura 12.3 – Visão do OpenOffice
Com mais de 15 anos de experiência e com o patrocínio da Sun MicroSystems, é escrito
em C++, com interfaces de programação de aplicações (API) documentados, licenciado
sobre LGPL (GNU Lesser GPL) e SISSL (Sun Industry Standards Source License). O
OpenOffice.org oferece conhecimentos ao programador, permitindo-lhe beneficiar do
código fonte. Como o formato de ficheiro é XML, a interoperabilidade está garantida,
possibilitando futuros desenvolvimentos sem problemas.
124
O OpenOffice.org é apenas um pacote de aplicações, gratuitas e disponíveis para uso
geral, mas também uma comunidade de utilizadores e colaboradores. Com mais de 18
mil colaboradores, esta é uma das maiores comunidades de software livre do mundo.
O projecto português, lançado há mais de dois anos, acompanha o desenvolvimento do
OpenOffice.org de perto, colabora em iniciativas e desenvolve a manutenção do
OpenOffice.org em Português padrão, em estreita colaboração com o grupo brasileiro.
Também garante apoio aos utilizadores portugueses, e em parceria com empresas
privadas, patrocina um fórum de ajuda, um sistema de relatório de problemas e cria e
aloja novos projectos portugueses relativos a este pacote aplicacional de produtividade.
O Dicionário de Sinónimos é o mais recente projecto, estando já em plena actividade o
projecto de Marketing, Localização e Dicionário. Mais de 100 elementos participam
activamente no OpenOffice.org, suportando diariamente o seu próprio programa de
produtividade de escritório.
O OpenOffice.org é mais do que apenas uma colecção de excelentes ferramentas.
Contrariamente ao que se passou com a concorrência, este pacote não foi criado como
um conjunto de programas, mas desenhado como uma peça apenas, funcionando
enquanto um todo. Todas as aplicações possuem um aspecto semelhante e um interface
extremamente simples de usar, com o intuito de “aprender uma vez e usar em todo o
lado”. Como o Navegador e o Editor de Estilos partilham o mesmo dicionário e
idênticas opções, ao alterar-se uma aplicação, essa mesma alteração será válida para
outra. A informação pode ser transferida com facilidade entre aplicações. Gravam os
dados no mesmo formato, padronizado internacionalmente, o XML, com gravações
frequentes do seu trabalho para que não perca dados essenciais.
Esta última versão possui ainda a habilidade de gravar documentos de texto
directamente em formato PDF, ou uma apresentação em formato Flash, entre outros
melhoramentos. Finalmente, podem ser lançadas sobre o sistema livre e gratuito
GNU/Linux – não existem asteriscos ou cláusulas especiais. A versão portuguesa foi
lançada no mês de Março.
O OpenOffice.org oferece o melhor de dois mundos: facilidade e produtividade num
pacote profissional livre e gratuito.
Anexos
125
EasyOffice 6 O EasyOffice, desenvolvido por uma empresa do Canadá, é uma das
mais completas suites de aplicações. Está disponível em português
(Brasil). Além dos programas habituais, inclui muitos outros, como
sejam:
• o EasyContactManager (gestor de contactos, integrado com o
processador de texto),
• o EasyDataBase (criação de base de dados) e
• o DataBaseServer (servidor de base de dados).
Tem também ferramentas de backup, de compressão de ficheiros (o EasyZip),
aplicações para gerar códigos de barras e criar páginas Web. Tudo isto além dos úteis
dicionários, calendário, calculadora, etc.
602PC Suite O 602PC Suite, actualmente na versão 4.0, é uma das mais conhecidas alternativas ao
Microsoft Office. É compatível com o Word, dado que utiliza o formato [.doc] e abre
ficheiros [.txt], [.rtf] e [.html]. De igual modo, é compatível com o Excel (utiliza o
formato [.xlt], [.cvs] e [.dbf]). Além disso, inclui uma aplicação para organizar, editar e
imprimir fotos digitais, bem como uma outra de edição de imagem.
GoBeProductive 3 O GoBeProductive não é uma suite de aplicações propriamente dita, pois não se trata de
um conjunto de programas integrados num único pacote. É, na verdade, um único
programa: no menu de entrada, o utilizador pode escolher cinco tipos de documentos,
dispondo de ferramentas próprias para cada tipo.
ThinkFree Office 2.1 Construída em Java, esta é uma suite office bem conhecida, que inclui aplicações
essenciais a qualquer utilizador. Permite abrir, editar e gravar documentos directamente
126
nos formatos Office correspondentes ([.doc], [.xls] e [.ppt]) e é compatível com sistemas
Windows e Macintosh. Suporta a partilha de ficheiros via Internet.
StarOffice 7 O StarOffice tem já alguns utilizadores de peso, como o Departamento
de Defesa dos EUA ou as Juntas de Extremadura e Andaluzia. Em
Portugal, a Sun e a UMIC (Unidade de Missão Inovação e
Conhecimento) estabeleceram um acordo no sentido de disponibilizar
o StarOffice a custo zero aos estudantes que aderem à campanha e-U Campus Virtuais.
O StarOffice, cujos documentos nativos são baseados em XML, é totalmente
compatível com o Microsoft Office. A suite já foi gratuita mas, há mais de uma ano
atrás passou a cobrar pelo pacote. Para empresas, o valor depende do volume de
licenças. Para professores e estudantes, o pacote é gratuito (pagam apenas o custo do
CD-ROM e da distribuição).
Ability Office 2002 O Ability Office é, de longe, o menos conhecido dos concorrentes
apresentados. Embora tecnicamente ofereça muitas mais ferramentas
que quaisquer programas, as escolhas reais são algo curiosas. Para
além da combinação de um processador de texto e de uma folha de
cálculo normal, também tem um programa de desenho baseado em
vectores, uma alternativa para fotografias e ainda uma base de dados.
Nenhum outro programa, nem mesmo o Microsoft Office, cobre todas estas bases. É
claro que o preço a pagar por isto tudo também é duplo. O Draw em particular sofre
com isto – seria indigno queixar-se da sua inclusão, mas na prática não passa de um
Microsoft Paint vectorial. No seguimento do Excel e do Access, este pacote possui o
Database e o Spreadsheet, que possuem apenas um conjunto de assistentes básicos e
muito pouco tempo para ajudas. Mais crucialmente, não há uma oferta equivalente ao
Powerpoint, o que torna o produto ainda menos atraente para um ambiente de escritório.
Nem será preciso referir que as funções de trabalho de equipa e de Internet podem desde
já ser eliminadas.
Anexos
127
Embora estes problemas não sejam dramáticos, existem alguns pontos que temos de ter
em conta. Nas aplicações principais o processador de texto é, simplesmente, um
processador de texto e, neste campo, a oferta do Ability não é má. Para além das várias
ferramentas de dactilografia, possui uma gama de funções de bónus extra tais como o
sistema WriteFX, que visa abrilhantar os cabeçalhos com barras e texturas
personalizadas, e um efeito drop-shadow capaz de dar o efeito de um filtro de brilho. É
claro que nenhuns dos resultados que poderemos obter serão impressionantes. A
merecer algum destaque está o Photopaint que, ironicamente, demonstra ser a surpresa
mais agradável do conjunto. Embora não dê luta ao Paint Shop Pro nem ao Photoshop, é
um editor de imagem surpreendentemente poderoso, com uma vasta gama de pincéis,
padrões e texturas que poderá ser experimentado. Terá, inclusive, a capacidade de
carregar filtros externos do Photoshop para obter efeitos mais impressionantes. Pintar é
extremamente simples, e seria possível criar resultados impressionantes de alta
qualidade usando apenas este programa. De volta ao conjunto principal, o Ability Office
é capaz de importar e exportar ficheiros para os formatos tradicionais da Microsoft. Esta
é uma funcionalidade sempre bem-vinda (e pretendida) para quem quer enviar
documentos para outras pessoas. Fica-se altamente relutante se tudo irá funcionar
correctamente, na situação inversa.
Apesar disto, a emoção que o Ability provoca é: frustação. Não funciona tão bem como
muitos dos seus rivais, mas também não é assim tão mau que se tenha de deitar fora em
prol de outros. Muitos sistemas informáticos vêm com ele instalado, em vez do
tradicional Microsoft Works. Por oposição ao OpenOffice.org gratuito, o resultado é
menos claro. Mais funções não levam necessariamente a que este possa ser considerado
um programa mais completo e, em termos de facilidade de uso, o Ability Office não se
compara à flexibilidade oferecida pelo WorPerfect.
Works 8.0 Uma das melhores alternativas ao Microsoft Office vem da própria
Microsoft. O Works, agora na versão 8, uma versão “light” do
Office. Inclui processador de texto, folha de cálculo, base de dados
e calendário. A nova versão do Works inclui novos modelos de
documento criados por profissionais e uma nova ferramenta para
128
organizar objectos.
Para fortalecer este produto, a Microsoft disponibiliza o Microsoft Works Suite 2004,
sendo este na realidade o Office para utilizador doméstico. Obtém-se a parte mais
importante do conjunto de programas ascendente no Word, que é ideal para qualquer
tarefa – desde a publicação básica no desktop até à simples escrita de cartas, em paralelo
com alguns dos pacotes mais úteis disponíveis para PC. Esses pacotes são:
• Encarta 2004 – o pacote mais famoso, uma enciclopédia electrónica com mais
de 38000 artigos para visualização;
• Money 2004 – aplicação financeira pessoal;
• Streets and Trips 2004 – um planeador de percursos;
• PictureIt – editor de imagem.
No entanto, sendo estes referidos pacotes mais tendentes para a utilização doméstica,
será assumido o Works 8.0.
KOffice 1.3 A suite KOffice é destinada a ambientes KDE (K Desktop
Environment), uma interface gráfica para sistemas Linux e Unix. O
KOffice vem com tantas distribuições do Linux que, se estiver em
posição de o usar, basta apenas usar um dos discos de instalação
outra vez na drive e instalá-lo. Como recompensa pelo seu esforço,
terá um processador de texto (KWord), uma folha de cálculo
(KSpread) e um substituto para Powerpoint (KPresenter), com os outros elementos do
conjunto disponíveis gratuitamente no site site oficial.
Estes incluem o KLivio para fluxogramas e gráficos de gestão e a aplicação de desenho
vectorial Karbon14, o gerador de relatórios empresarias Kugar, o utilitário de gráficos
Kchart, o conector de bases de dados Kexi e o editor de fórmulas KFormula. Preparado
para um lançamento futuro está o editor de imagem Krita, que pretende ser uma
alternativa fácil de usar ao GIMP e outros editores mais avançados. Não é necessário
dizer que é muita funcionalidade por dinheiro nenhum. Como muitos projectos de open-
source, o KOffice é muito funcional, ainda que isto não signifique completo. Em
particular, embora possa ler texto de ficheiros com formatos Microsoft, elementos mais
Anexos
129
avançados como cabeçalhos normalmente não aparecem. Mais ainda, o programa não
consegue exportar para esses formatos, restringindo-o a formas mais básicas como RTF,
sempre que precisa de partilhar os documentos. Embora tal não seja um problema no
uso pessoal, e qualquer distribuição de Linux oferece pelo menos um modo simples de
exportar os documentos para o formato universal PDF, isto diminui radicalmente a
utilidade que o KOffice pode ter no mundo empresarial. A diferença entre os dois
programas de open-source é bastante clara. O OpenOffice.org pretende substituir o
software que já se tenha na máquina, enquanto o KOffice quer dar o que precisa já à
partida.
A maior parte das posições já estão preenchidas por outros programas, quer por
conjuntos completos, como o StarOffice, ou por software mais específico, como é o
caso do já mencionado The GIMP. Os novos utilizadores nada têm a perder em
agarrarem um dos conjuntos mais completos de open-source no mercado.
Nem que seja pelo simples facto de, assim que tiver o conjunto completo no
computador, se tornar muito mais fácil passar para software mais avançado. É claro que,
se isto nunca acontecer, terá o que precisa sem ter gasto um cêntimo. O KOffice é uma
daquelas opções com o qual se sai sempre a ganhar.
Corel WordPerfect Office 11 Quando se olha para estes conjuntos de software, há sempre uma coisa que salta à vista:
são todos muito parecidos. Oferecem mais ou menos as mesmas funções essenciais,
numa forma imediatamente reconhecível, com poucos acréscimos pessoais. O
WordPerfect não é diferente neste aspecto, mas pode dizer-se que oferece a maior parte
das funcionalidades habituais já há bastante tempo – as vantagens de se ser um software
estabelecido no mercado. É claro que isto não é sinónimo de qualidade. No caso do
WordPerfect, as opções começam com a caixa de Prompt As You Go. O filtro de erros
de Prompt As You Go conseguem oferecer a mais completa variedade de termos para
uma palavra que jamais encontrará. No entanto, não é de admirar se, na extensa lista de
alternativas que o programa oferece, não encontrar a expressão que se procura.
No pacote estão, basicamente, os programas suspeitos do costume – o WordPerfect trata
dos documentos e das apresentações, passando os deveres de folha de cálculo para o
Quattro Pro. Não há muitos pontos negativos a apontar ao processamento de texto do
130
WordPerfect. Para além do processamento de texto simples, a capacidade de pré-
visualizar o efeito que a alteração do tipo de letra numa selecção pode causar no
documento, pode revelar-se bastante útil. Neste contexto temos ainda o acesso, através
do botão direito do rato, a drop caps e linhas horizontais. Tristemente, nem tudo é assim
tão simples – é o caso da exportação intoleravelmente lenta para PDF. Depois de meses
com o OpenOffice.org a exportar documentos de Acrobat através de um “click” rápido,
é impossível regressar às barras de progresso.
Quando vamos ao Quatro Pro encontra-se, no entanto, uma das melhores funções do
WordPerfect. Um exmplo muito simples: pode-se carregar os templates disponíveis e
preenchê-los imediatamente com amostras de dados. Também importante, poderá ser a
remoção de tudo isto apenas com um simples clique. Estes templates são especialmente
bons na secção de apresentações. Embora não seja mais difícil de usar que o
Powerpoint, o facto de ter um sistema baseado em tarefas torna consideravelmente mais
fácil as transições de sons e links de clipart, uma vez que não se terá de andar à procura
da opção que se precisa. Pode-se simplesmente importar um objecto vectorial e depois
procurar nos ecrãs Add Special Effects a opção que se deseja, sejam transições,
animações efeito bizarros de distorção e até texto 2D rudimentar, completo com
iluminação e mapas de textura. Será interessante observar que muitos destes efeitos
podem ser usados uns com os outros, permitindo definir alguns efeitos bem bizarros
para os documentos.
No geral, o WordPerfect é um concorrente muito sólido, especialmente para utilizadores
menos experientes que necessitem de mais ajuda do que aquela fornecida com outros
programas. Para utilizadores mais avançados, há poucas razões para escolher este
conjunto e não outro. Vale, porém, a pena lembrar que apenas alguns efeitos menores
impedem de ser um conjunto de Office tão bom como qualquer outro que se encontre
nas prateleiras. Isto, claro, se conseguir convencer a Corel a vender uma cópia.
Anexos
131
Tabela comparativa de Offices Suites
Anexos
133
12.5 Normas
Seguem-se algumas das instituições que regem as normas para que seja atingida a
normalização.
W3c O World Wide Web Consortium (W3c), é um órgão internacional que define os padrões
das linguagens que são usadas na Internet, linguagens como, HTML, XML, etc. O W3c
é composto de profissionais altamente qualificados, incluindo o próprio Tim-bernes
Lee12, que trabalham em conjunto na definição e aperfeiçoamento das linguagens Web.
Estas linguagens, são pensadas cuidadosamente para garantir maiores benefícios ao
maior número possível de utilizadores (utilizadores de carne e osso, ou não) da Web,
assegurando ao mesmo tempo que a viabilidade a longo prazo de qualquer documento
que seja publicado na Web seja garantida.
O W3c é um fórum de informação, comércio, comunicação e compreensão colectivas,
tem como membros cerca de 450 organizações por todo o mundo e tem ganho
reconhecimento internacional pelas suas contribuições no crescimento da Web.
Quando finaliza a regulamentação e padronização de uma determinada linguagem, um
documento oficial detalhando o padrão é publicado (e distribuído) para os produtores de
software. A implementação desta linguagem deve então seguir a documentação oficial
escrita pelos membros.
Desta forma, os profissionais de Web podem trabalhar com uma única sintaxe para cada
linguagem, um padrão único, sabendo que este será compatível com softwares
desenvolvidos por várias empresas.
A universalidade da Web é mantida graças ao empenho do W3c em deixar a rede
independente e aberta.
12 O inventor da Web
134
Isto, pelo menos, é o que deveria acontecer... Durante um certo tempo, algumas
empresas (fabricantes de Web browsers) foram-se distanciando do trabalho de
padronização realizado pelo W3c. Mas, felizmente, com a introdução no mercado de
novos browsers, melhores e mais atraentes, o cenário actual do mundo de
desenvolvimento Web tende a mudar bastante.
Podem-se resumir os padrões recomendados pelo W3c:
• Garantir benefícios significativos ao maior número de utilizadores da Internet.
• Garantir a viabilidade em longo prazo de qualquer documento na Internet.
• Simplificar os códigos e baixar os custos de produção.
• Tornar os sites acessíveis a mais utilizadores e a mais dispositivos capazes de
aceder a Internet.
• Garantir que os documentos continuem a funcionar correctamente a medida em
que os navegadores evoluam e a medida em que novos dispositivos cheguem ao
mercado.
Sendo assim, o objectivo da W3c resume-se nos seguintes tópicos:
• Acesso universal – W3c define a Web como um universo de informação
acedido por rede (disponível por computador, telefone, televisão, etc.).
Actualmente este universo beneficia a sociedade ao disponibilizar novas formas
de comunicação e oportunidades na partilha do conhecimento. Um dos
principais objectivos da W3c é a disponibilidade desses benefícios a todo o
mundo, independentemente do hardware, software, infra-estruturas, língua,
cultura, localização geográfica, da capacidade física ou mental.
• Semântica Web – Actualmente existe uma partilha do conhecimento pela Web
numa linguagem acessível a outra pessoa. com Semântica Web será possível
expressarmo-nos em termos que os nossos computadores possam interpretar e
trocar. Com isto, é possível a resolução de problemas que consideremos
tediosos, para ajudar em encontrar de forma rápida o que procuramos:
informação médica, uma critica cinematográfica, a encomenda de um livro, etc.
As linguagem RDF, XML, XML Schema, e o XML são a base da semântica
Web.
Anexos
135
• Confiança – A Web é um meio colaborativo, não como uma leitura de uma
revista. De facto, o primeiro Web browser foi também um editor. Para promover
um ambiente mais colaborativo, tem de ser criada uma “confiança na Web” que
ofereça confidencialidade, inspira confiança, e torna possível para que as
pessoas tenham essa responsabilidade com o que publicação na Web.
• Interoperabilidade – Vinte anos atrás as pessoas compravam software que
somente trabalhava com outro software do mesmo vendedor. Hoje, as pessoas
têm mais liberdade na escolha e esperam, correctamente, que os componentes de
software sejam intercambiavel. Também esperam que seja capaz de visualizar
conteúdo Web com o seu software preferido. W3c, uma organização neutra,
promove a interoperabilidade ao desenhar e promover uma linguagem de
computador aberta (não-proprietaria) e protocolos que evitam a fragmentação no
mercado como em tempos. Isto é arquivado por um consenso industrial e
encorajada a abertura de um fórum de discussão.
• Envolvimento – a W3c aponta para uma excelência técnica mas está ciente que
o que sabe e precisa hoje poderá ser insuficiente para resolver problemas
futuros. Para tal, existe um esforço na construção de uma Web que possa
envolver-se numa Web melhor, sem prejudicar o que actualmente funciona. A
simplicidade, modularidade, compatibilidade e extensibilidade guiam os seus
desígnios.
• Descentralização – Descentralização é um dos princípios dos modernos
sistemas distribuídos, inclusive sociedades. Num sistema centralizado, cada
mensagem ou acção tem de passar por uma autoridade central, causando
“engarrafamento” quando o tráfego aumenta.
• Multimédia – A W3c não limita a criatividade. Pela sua comunidade, W3c
escuta os utilizadores e trabalha no sentido da criação de uma framework para o
desenvolvimento de uma Cooler Web com linguagens como a Scalable Vector
Graphics (SVG) e a Synchronized Multimédia Integration Language (SMIL).
136
Oasis
“A common set of file formats has the potential to be the most meaningful advancement
for free software on the desktop.”
by Marco Fioretti, 2004
A integração de um desktop começa com documentos, não com qualquer toolkit ou
pacote de aplicações. Se os ficheiros podem ser lidos e escritos por qualquer aplicação,
os utilizadores podem comunicar e trabalhar em conjunto, logo interagem. Nesta óptica,
o formato XML da OASIS para documentos office tem o potencial para ser um dos
avanços mais significantes em computação gratuita.
OASIS (Organization for the Advancement of Structured Information Standards)
antigamente designado de SGML Open, este consórcio sem fins lucrativos que inclui
companhias como a IBM, Sun e Boeing, via a criação de um padrão aberto para quase
qualquer tipo de informação estruturada. Neste documento, será referido o formato
baseado no XML, comum a todos os tipos de ficheiros usados num escritório – texto,
folha de cálculo, apresentações e outros.
O esforço na promoção deste tipo de formato de ficheiro, ao contrário de uma
especificação de desktop, aplicações ou do próprio Kernel do Linux, não podem ser
menosprezado. Um formato livre é tão importante quanto um software livre. Somente
com ambos e com uma estrutura interna que o XML oferece, permite a transacção com
novos ou diferentes programas sem a necessidade de qualquer conversão. Permite uma
directa actualização, indexação análise e troca entre grupos e servidores heterogéneos –
como serviços Web sem hiper links. Os dados começarão a pertencer aos utilizadores
finais.
Anexos
137
Figura 12.4 – OpenOffice.org: conversão para diversos tipos de formatos
O Comité Técnico da OASIS Office teve a sua primeira reunião em Fevereiro de 2003.
O voto para a aprovação do formato de ficheiro oficial deveria ter sido um ano após, em
Fevereiro de 2004. Depois da aprovação, avançar-se-á para a 2ª fase. O seu principal
objectivo será em estender a especificação base para outras áreas de aplicação. O
objectivo principal será a mudança para um modelo de documento, independente e
disponível para qualquer aplicação, indiferente à sua licença. Este Comité está
determinado em deixar o assumir que cada ficheiro tem que estar associado a uma
aplicação específica.
Algumas instituições públicas já começam a pensar do mesmo modo. Uma agência
sueca da Administração Pública afirma: “(Nós) devemos seguir e se possível trabalhar
em conjunto com a OASIS. Um formato de ficheiro aberto é de extrema importância e
138
de aumento da interoperabilidade”13. Ao nível da União Europeia, o IDA (Interchange
of Data Between Administration) decidiu em 2003 levar a cabo um trabalho de
investigação de formatos de documentos abertos e em como as administrações públicas
poderiam persuadir os comerciais de software em os apoiar.
Qual é o seu aspecto?
A standardização está conforme o padrão geral definido pela W3C para a tecnologia do
XML e cobre quaisquer aspectos de uso do documento. A interacção com o utilizador, é
descrita num template XML Schema, que funciona como uma API tradicional. Mesmo
estes, porém, são independentes de uma única aplicação.
Um formato de texto pode ser maior e mais ineficiente em comparação com um formato
livre mas binário. Até mesmo quando a performance é notada, os benefícios obtidos são
importantes para se desistir. Em si mesmo, um ficheiro OASIS Office (seja texto, folha
de cálculo ou apresentação) é um ficheiro compactado: o formato de compressão
escolhido é um compromisso de eficiência, rapidez de acesso às partes internas e licença
de algoritmo. Descompactado, encontramos cinco tipos de ficheiros:
• style.xml – apresentação e formatação;
• contents.xml – conteúdo actual;
• settings.xml – settings da aplicação, como o nível de zoom e a impressora;
• meta.xml – linguagem e uncoding metadata
• manifest.xml – uma explicação do que são todos os outros ficheiros e o
respectivo path
Outros componentes (cada um numa pasta pré-definida, para que o anti-vírus tenham
maior facilidade na pesquisa) podem ser macros, diálogos e objectos, tal como tabelas
ou fórmulas.
Dado que a standardização impõe que todos as partes estejam dentro de um ficheiro
compactado, nenhum informação será perdida: conteúdo, layout e tudo o resto andam
13 www.openoffice.org/servlets/ReadMsg?msgId=585772&listName=discuss
Anexos
139
juntos. Ao contrário de algumas ofertas de uso no mesmo espaço, não existe restrição
no uso da aplicação a utilizar.
E o utilizador final?
O design e a implementação estão bem, mas o utilizador final necessita de alguma
aplicação para usar. O que está disponível? Absoluta e completa compatibilidade é
possível somente com software “construído do nada” ou por software que tenha sido
alterado para conseguir isso. De um modo geral, programas existentes e os seus
programadores podem ter de assumir um compromisso entre o standard e o conceito
actual da estrutura perfeita do documento perfeito. Por exemplo, margens são uma
secção ou propriedade de uma página em algumas aplicações enquanto que em outras é
uma propriedade de um parágrafo.
Dito isto, os utilizadores do OpenOffice.org terão a sua vida facilitada; o standard da
OASIS foi construído e é quase idêntico aos formatos OO actuais. AbiWord tem filtros
de importação/exportação menos avançados, mas não se encontram a funcionar a 100%,
sendo todos os contributos bem-vindos. Esta aplicação também oferece aos utilizadores
a opção de usar o OO como formato de ficheiro default. O plano da KOffice, após
melhoramentos na versão 1.3, será começar a transição para o formato standard da
OASIS, passando a ser o formato nativo em lançamentos futuros. David Faure14 prevê
que não haja qualquer obstáculo para a transição.
14 Um dos fundadores da KOffice e sócio do Comité Técnico da OASIS
140
Figura 12.5 – KOffice: já se encontra preparado para o OASIS
SIAG oferece algum apoio na leitura de ficheiros de texto e de folhas de cálculo para
aplicações externas, mas nada existe disponibilizado para a escrita. Emacs certamente
irá propor, mais cedo ou mais tarde, o seu próprio OASIS, e a WordPerfect também
representa oficialmente o Comité Técnico. Em resumo, as coisas parecem bem
encaminhadas. Já existe uma escolha, e a única coisa deixada por fazer é o fixar pela
OASIS de um formato de gravação default e recusar a recepção ou envio de ficheiros
em formatos proprietários.