Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras...

10
Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais Eduardo Amadeu Dutra Moresi [email protected] Universidade Católica de Brasília QS 07 – Lote – EPCT - 71966-700 – Brasília – DF – Brasil e Wesley Vaz Silva [email protected] Universidade Católica de Brasília QS 07 – Lote – EPCT - 71966-700 – Brasília – DF – Brasil e Gilson Libório de Oliveira Mendes [email protected] Controladoria-Geral da União SAS Quadra 01 - Bloco A – Sala 727 – 70070-905 - Brasília - DF - Brasil RESUMO Com o crescente aumento da informatização do processo de compras governamentais, vem aumentando a demanda de informações consolidadas por parte dos usuários especialistas. O Portal Comprasnet, uma das ferramentas utilizadas na automação das licitações públicas, expõe publicamente informações úteis para o acesso ao cidadão e aos usuários especialistas. Entretanto, esses dados estão disponíveis isoladamente, o que dificulta sua análise de maneira agregada e inter- relacionada e torna inviável a análise exploratória e descritiva dessas informações por parte dos especialistas. Esse trabalho tem como objetivo propor uma arquitetura funcional que permita coletar e disponibilizar, aos usuários especialistas, as informações públicas sobre compras governamentais constantes do Portal Comprasnet, viabilizando a produção de conhecimento útil sobre o assunto e a eventual automatização de sua análise. Palavras-chave: compras governamentais; coleta e análise de informações públicas; descoberta de conhecimento em bancos de dados; CRISP-DM. 1. INTRODUÇÃO Atualmente, o Estado brasileiro exerce um papel de grande importância na economia nacional. Seja fomentando novas ações, estabelecendo ajustes fiscais e controlando o papel da moeda, boa parte das decisões que afetam o ambiente econômico nacional passa pela égide das leis e da discricionariedade dos atores políticos à época. Uma das principais afirmações do estado sobre a economia se dá em relação aos seus dispêndios em contratações de bens e serviços. De certo, isso tem um grande impacto sobre as empresas nacionais, envolvendo grande quantidade de recursos financeiros. Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

description

Artigo apresentado na Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011.

Transcript of Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras...

Page 1: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

Eduardo Amadeu Dutra [email protected]

Universidade Católica de BrasíliaQS 07 – Lote – EPCT - 71966-700 – Brasília – DF – Brasil

eWesley Vaz Silva

[email protected] Católica de Brasília

QS 07 – Lote – EPCT - 71966-700 – Brasília – DF – Brasile

Gilson Libório de Oliveira [email protected]

Controladoria-Geral da UniãoSAS Quadra 01 - Bloco A – Sala 727 – 70070-905 - Brasília - DF - Brasil

RESUMO

Com o crescente aumento da informatização do processo de compras governamentais, vem aumentando a demanda de informações consolidadas por parte dos usuários especialistas. O Portal Comprasnet, uma das ferramentas utilizadas na automação das licitações públicas, expõe publicamente informações úteis para o acesso ao cidadão e aos usuários especialistas. Entretanto, esses dados estão disponíveis isoladamente, o que dificulta sua análise de maneira agregada e inter-relacionada e torna inviável a análise exploratória e descritiva dessas informações por parte dos especialistas. Esse trabalho tem como objetivo propor uma arquitetura funcional que permita coletar e disponibilizar, aos usuários especialistas, as informações públicas sobre compras governamentais constantes do Portal Comprasnet, viabilizando a produção de conhecimento útil sobre o assunto e a eventual automatização de sua análise.

Palavras-chave: compras governamentais; coleta e análise de informações públicas; descoberta de conhecimento em bancos de dados; CRISP-DM.

1. INTRODUÇÃO

Atualmente, o Estado brasileiro exerce um papel de grande importância na economia nacional. Seja fomentando novas ações, estabelecendo ajustes fiscais e controlando o papel da moeda, boa parte das decisões que afetam o ambiente econômico nacional passa pela égide das leis e da discricionariedade dos atores políticos à época.

Uma das principais afirmações do estado sobre a economia se dá em relação aos seus dispêndios em contratações de bens e serviços. De certo, isso tem um grande impacto sobre as empresas nacionais, envolvendo grande quantidade de recursos financeiros.

Com a informatização do processo de compras governamentais e a criação da modalidade de licitação denominada pregão, o processo de contratação de bens e serviços passou a ser mais eficiente e efetivo.

Um ponto positivo da informatização do processo de compras é o de que a implantação dos controles legais em um software tende a diminuir os problemas associados à fraudes e irregularidades nas licitações, configurando outro fator positivo relacionado ao uso intensivo da tecnologia da informação nessa área. Esses controles, entretanto, não são suficientes para eliminar quaisquer chances de problemas nas licitações públicas e, em virtude disso, o papel do controle assume grande relevância no intuito de aferir o cumprimento das normas por parte dos agentes públicos

No entanto, a capacidade dos profissionais do controle (auditores e analistas) em acompanhar e verificar a legalidade e legitimidade dos procedimentos licitatórios cresce em taxa inferior ao aumento do volume de aquisições efetuadas pelo governo Federal. Isso faz com o que o trabalho do controle tenha que se adaptar à essa nova realidade, estabelecendo mecanismos mais dinâmicos de verificação do cumprimento das normas por parte dos agentes públicos.

Embora os sistemas de compras públicas tenham evoluído bastante desde a sua criação, os seguintes óbices ainda permanecem: - interfaces públicas de consulta a esses sistemas disponibilizam, por exemplo, somente informações específicas sobre licitações em um órgão ou unidade administrativa, não permitindo uma analise conjunta de licitações com determinadas características;- respostas obtidas por meio das interfaces de consulta são complexas e de difícil entendimento, fazendo com que uma analise exploratória mais completa seja feita sobre essas informações;

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

Page 2: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

- impossibilidade de análise conjunta entre procedimentos licitatórios provenientes de duas consultas distintas, o que impede uma analise.

Portanto, esse trabalho considera relevante o problema de disponibilizar, para a análise de profissionais de controle, as informações referentes às compras governamentais efetuadas por órgãos da Administração Pública Federal direta e indireta por meio do Portal de Compras do Governo Federal - Comprasnet [1]. O objetivo geral é apresentar uma arquitetura de informação que contemple as funcionalidades de coleta, tratamento e disponibilização das informações sobre despesas da Administração Pública Federal, disponíveis por meio do acesso livre ao Portal Comprasnet. 2. REFERENCIAL TEÓRICO

2.1. Compras governamentais

A Administração Pública brasileira é regida por princípios estabelecidos no arcabouço jurídico vigente no país. Desde a promulgação da Constituição Federal de 1998, princípios gerais têm sido positivados em leis e decretos que normatizam o funcionamento da máquina pública na intenção de que ela atinja os objetivos fundamentais estabelecidos para o Estado.Dentre os vários princípios presentes no ordenamento jurídico vigente e, portanto, parâmetros jurídicos a serem seguidos pelos administradores públicos, são prementes os da legalidade, impessoalidade, moralidade, pessoalidade e eficiências, todos extraídos de extensa doutrina e citados explicitamente no art. 37, caput da Constituição Federal [2].

Todas as atividades executadas pelos agentes públicos no exercício da função pública devem se pautar pelos princípios descritos no parágrafo anterior. Entretanto, não são os únicos. São inúmeras as atividades previstas para a administração pública, como a elaboração de políticas públicas, administração de recursos, execução de ações e projetos, elaboração de orçamento e administração de compras, para citar poucas. Para cada atividade específica a ser realizada por um agente público no exercício de outras funções, há uma base normativa própria que regulamenta de maneira singular as regras daquela função. Entre essas, destacam-se as Leis n. 8.666/93 [3] e 10520/02 [4] que abordam, respectivamente, as normas gerais sobre contratações na Administração Pública e regulamenta a modalidade de licitação pregão para aquisição de bens e serviços comuns.

A Lei n. 8.666/93 estabelece normas gerais sobre licitações e contratos administrativos pertinentes a obras, serviços, inclusive de publicidade, compras, alienações e alocações no âmbito dos Poderes da União, dos Estados, do Distrito Federal e dos Municípios [art. 1, Lei 8.666/93].

Dos princípios por ela abordados, destaca-se no âmbito deste trabalho o da publicidade. O art. 16 da referida Lei afirma que será dada publicidade da relação de compras feita pela Administração Pública mensalmente, em órgão de divulgação oficial (Diário Oficial da União) ou em quadro de avisos de amplo acesso público, e maneira a identificar o bem comprado, a quantidade adquirida, o preço unitário o nome do vendedor e o valor total da operação, resguardadas as exceções previstas em lei.

Outros dispositivos da lei associados ao princípio da publicidade podem ser encontrados nos art. 20 inciso III, art. 20 § 4°, art. 40 § 1°, art. 15 e art. 26. Da leitura desses dispositivos, é fácil constatar que a publicidade deverá ser dada aos interessados na referida compra e, em virtude da publicação em instrumento oficial, a todos os cidadãos.

Com a evolução administrativa da máquina governamental, a necessidade de melhorar o processo de contratação de bens e serviços fomentou a criação de novos normativos associados ao tema, culminando com a publicação da Lei n° 10.520/2002 que normatiza o pregão, uma nova modalidade de licitação que estabelece uma espécie de leilão inverso para a aquisição de bens e serviços cujos padrões de desempenho e qualidade possam ser objetivamente especificadas por padrões de mercado (art. 1°). Essa lei descreve o processo de contratação dessa modalidade, de modo que todos os passos possam ser cumpridos para licitações com essas características.

Como esperado, deve ser dada publicidade às atividades da fase externa das contratações por meio do pregão. Diante disso, todos os elementos necessários para que as propostas dos eventuais participantes do pregão e acompanhamento pela sociedade deverão ser divulgadas na imprensa oficial, conforme prevê o art. 4°, inciso I da Lei n° 10.520/02.

Em 2005 foi publicado o Decreto n° 5.450 [5], que regulamenta a operação da modalidade pregão na forma eletrônica para aquisição de bens e serviços comuns. Com o advento desse decreto, foi estabelecido ainda que as contratações na modalidade pregão para a administração direta, autárquica e fundacional federais fosse feito obrigatoriamente de maneira eletrônica, por meio de um sistema que promova a comunicação pela internet (art. 1° e 2° do Decreto). Tal sistema, segundo o normativo, deve ser dotado de recursos de criptografia e de autenticação que assegurem condições de garantir a segurança em todas as etapas do certame (art. 2° § 3°).

Quanto aos princípios da publicidade e eficiência, o Decreto n° 5.450 estabelece obrigações quanto à publicação de alguns elementos do processo licitatório e ao uso do sistema de pregão eletrônico. Estabelece que ao aderirem ao sistema de governo eletrônico do governo federal, disponibilizarão na integra o edital da contratação, em meio eletrônico, no portal de Compras

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

Page 3: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

do Governo Federal [1]. Mais que isso, o sistema de compras do governo federal foi concebido para informatizar o processo de pregão para os seus usuários. As regras de negócio previstas nas normas que regulamentam o processo são implementadas no sistema Comprasnet, o que o torna o sistema de informação que automatiza os processos de pregão eletrônico.

O Compranet tem a função de fornecer serviços aos fornecedores que participam do processo de contratação, como o pedido de inscrição no cadastro de fornecedores do Governo Federal, a obtenção de editais e a participação em processos eletrônicos de aquisição de bens e contratação de serviços. Além disso, constata-se que o número de contratações divulgadas por meio do sistema Comprasnet cresce a cada ano. A Figura 1 ilustra a série histórica do número de licitações divulgadas na imprensa oficial (DOU - Diário Oficial da União) e as disponibilizadas pelo Comprasnet.

Além dessas informações, estão disponíveis no Portal Comprasnet várias informações ao cidadão, como: pregões em seus diversos estados (agendados, em andamento, realizados, pendentes, revogados, anulados, abandonados e internacionais com recursos do BID); atas de homologação do pregão; atas de registro de preços; extratos de contratos; aviso de licitações (com download de Editais); certificado SICAF; certidões negativas; e intenção de registro de preços.

Figura 1 – Licitações Divulgadas pelo SIDEC - Sistema de Divulgação Eletrônica de Compras e Contratações [6,7].

Com a informatização do processo de contratação por meio de pregão, especificamente aquele realizado na forma eletrônica, as informações podem ser facilmente disponibilizadas para acesso aos envolvidos na contratação e aos cidadãos, satisfazendo assim o principio da publicidade. No entanto, a simples disponibilização das informações digitais na internet, embora seja de suma importância, não é suficiente para análises mais complexas sobre os dados.

Em suma, para um trabalho de análise descritiva ou exploratória dos dados do Comprasnet, é necessário que haja um esforço no sentido de tabular, formatar e organizar os dados disponíveis para posterior tratamento e obtenção de informação contextualizada.

Desse modo, entender e definir as atividades necessárias para transformar os dados sobre compras governamentais de interesse do analista em informação útil é tarefa primordial. Este trabalho descreve, na Seção , uma das metodologias utilizadas para organizar e documentar as atividades utilizadas mais comumente no processo de descoberta de conhecimento, o CRISP-DM.

2.2. CRISP-DM

CRISP-DM é a abreviação de Cross Industry Standard Process for Data Mining, que pode ser traduzido como Processo Padrão Inter-Indústrias para Mineração de Dados. É uma metodologia de mineração de dados baseada em um modelo hierárquico de processos comumente usados na descoberta de conhecimento.

O método CRISP-DM [8] é baseado um processo cíclico de descoberta do conhecimento, conforme mostrado na Figura 2. Sua natureza cíclica assegura que processos subseqüentes de descoberta de conhecimento beneficiam a experiência e do conhecimento adquiridos em processos anteriores.

Figura 2 - Fases do CRISP-DM [8].

O modelo contém fases, cada fase contém respectivas tarefas, e essas tarefas possuem relacionamentos entre si. Os relacionamentos entre as tarefas variam de acordo com os objetivos do processo de mineração, do interesse do usuário, do assunto tratado e das características dos dados. Além disso, cada atividade produz um ou mais artefatos que servirão ao propósito de documentar a execução do processo de mineração.

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

Page 4: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

As principais atividades de cada fase estão ilustradas a seguir:- entendimento do negócio: determinação dos objetivos do negócio, reconhecimento dos recursos envolvidos e restrições, riscos e benefícios, determinação dos objetivos da mineração de dados e apresentação de um planejamento para o projeto;- entendimento dos dados: coleta/acesso aos dados, descrição dos dados, exploração e análise dos dados, verificação da qualidade dos dados;- preparação dos dados: preparação da base de dados a ser trabalhada; seleção dos dados a serem analisados; limpeza, consolidação e atualização dos dados;- modelagem: seleção da técnica de modelagem e premissas relacionadas, geração do procedimento de validação do modelo (qualidade), construção do modelo, entendimento e identificação da relevância do modelo;- avaliação: avaliação dos resultados sob a ótica do negócio, identificar fatores relacionados ao negócio que estejam impactando o modelo, revisão do processo, determinação dos próximos passos – prosseguir ou não;- implantação: planejamento da apresentação e preparação para implementação, planejamento do acompanhamento/monitoração, relatório final e revisão do projeto.

A próxima seção apresenta a arquitetura desenvolvida para coleta automática de informações no Portal ComprasNet.

3. ARQUITETURA DA SOLUÇÃO

Diante do exposto nas seções anteriores, propõe-se uma arquitetura que, baseada nas definições previstas no CRISP-DM e dadas as características dos dados públicos de compras governamentais disponíveis para análise, permita atingir os objetivos do trabalho. Uma série de requisitos dessa solução foram considerados, tendo em vista o tempo disponível para sua elaboração, o perfil dos profissionais utilizados, as ferramentas computacionais disponíveis e as características das tecnologias utilizadas (linguagem de programação, sistema gerenciador de bancos de dados e sistema operacional).

A arquitetura proposta para a solução, ilustrada na Figura 3, é composta de um extrator de informações do Portal Comprasnet, de um parser determinístico [10] para estruturar as informações sobre as atas de pregões em formato HTML, um repositório de dados semi-estruturado utilizado para armazenar as informações extraídas do Comprasnet e uma interface direta entre os usuários e o SGBD.

O extrator e o parser foram desenvolvidos tanto para coletar as informações do Portal Comprasnet como para estruturar as informações sobre as atas de pregões. O primeiro módulo possui a função “Parâmetros”, responsável por obter todos os

parâmetros informados pelo usuário, de acordo com a funcionalidade escolhida.

O segundo módulo, é o responsável pela implementação da regra de negócio de cada funcionalidade, o que abrange basicamente gerar automaticamente as URLs (função GerarURLs) para extração das informações e algoritmos de parser utilizados para cada tipo de informação extraída (função Parser) [9].

Figura 3 - Descrição da arquitetura proposta.

Por fim, o terceiro módulo, responsável por estabelecer conexões com o Portal Comprasnet para o download de páginas web. Nessa mesma camada, estão disponíveis as funções para o armazenamento dos dados recuperados. A Figura 4 ilustra a divisão dos módulos dentro de cada camada.

Figura 4 - Módulos e funções do software

No atual estágio de desenvolvimento do projeto, já é possível analisar as informações sobre as atas de pregões cadastrados no Portal Comprasnet e os dados genéricos dos pregões em todas as situações previstas (agendados, em andamento, realizados, pendentes, revogados, anulados, abandonados e internacionais).

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

Page 5: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

O funcionamento de cada um dos módulos da solução depende, basicamente, dos parâmetros de entrada associados ao tipo de informação disponível a ser tratada. Até o momento, foram consideradas duas classes de informações: dados gerais sobre os pregões, em cada uma das situações possíveis; e as atas dos pregões finalizados.

Os passos necessários para obter dados sobre pregões são semelhantes para cada estado do pregão. As principais funcionalidades implementadas foram:- receber os parâmetros do usuário (função Parâmetros): essa funcionalidade é simples, consistindo em obter os parâmetros necessários para começar a coletar as informações. Primeiramente, o usuário informa a situação do pregão que deseja coletar e a UF desejada;- buscar órgãos da UF informada (função GerarURLs): antes de começar a coletar as informações gerais sobre os pregões, é necessário conhecer todos os órgãos associados à UF informada pelo usuário. Para isso, é obtida uma lista contendo todos os órgãos cadastrados para a referida UF. Este processo consiste em obter uma página HTML passando como parâmetro a UF informada e o tipo de pregão. A página HTML coletada é simples e bem estruturada, contendo uma tag HTML de combo box com todos os órgãos associados à UF. Diante disso, a solução obtém e armazena em memória as informações da página;- buscar as informações de UASG (Unidades Administrativas e Gestoras) para cada órgão recuperado (função GerarURLs): com os órgãos todos disponíveis, é necessário obter as informações das UASGs para cada um dos órgãos associados à UF inicialmente informada. Para tanto, é necessário coletar o arquivo contendo a lista de UASG para cada um dos órgãos, de modo a analisá-lo e obter dele o código e descrição de cada UASG. Este processo será repetido separadamente para cada órgão, com o intuito de montar uma lista com o conjunto de UASG de cada um dos órgãos associados à UF informada pelo usuário;- buscar os identificadores de pregões para cada UASG (função GerarURLs): é necessário gerar a URL que trás a página HTML contendo a lista de todos os pregões de uma determinada UASG. Este processo será repetido separadamente para cada UASG, visando montar uma lista com o conjunto de pregões de cada uma das UASGs associadas os órgãos presentes à UF informada pelo usuário. Em seguida, é necessário e analisar tal arquivo de modo a recuperar as informações específicas de cada um dos pregões e estruturá-las visando o posterior armazenamento;- buscar as informações sobre pregões (função GerarUrls): uma vez obtidas as informações dos módulos anteriores, basta acessar a URL informando os parâmetros necessários para caracterizar cada pregão (UF, órgão, UASG e número do pregão). Esta URL é a mesma para todos os tipos de pregão exceto para pregões internacionais;

- recuperar informações sobre pregões (função Parser): uma vez carregadas as informações sobre os pregões, é necessário estruturar seu conteúdo de modo a disponibilizá-lo de maneira organizada no repositório de informações. É aplicado, portanto um parser diferente para cada tipo de pregão obtido. Em alguns casos, inclusive, podem existir alguns links associados ao pregão, contendo informações adicionais. Neste caso, a solução busca acessar ao link, verificar se há padrão estabelecido nas informações presentes no arquivo HTML, processá-las e associá-las ao pregão a que se referem;- armazenar as informações no repositório (função GravarDados): uma vez processadas pelo parser todas as informações de cada pregão, essas informações são armazenadas de maneira estruturada no repositório. No atual estágio do projeto, essas informações estão sendo armazenadas em arquivo em formato txt, de modo a facilitar a futura transferência dessas informações para um banco de dados relacional.

Para a coleta de atas de pregão, o processo é semelhante ao descrito acima para os dados genéricos sobre pregão. A principal diferença reside no fim do processo, em razão do armazenamento das informações em um banco de dados relacional.

De maneira similar, para o usuário obter uma ata de pregão ele precisa informar em qual UF deseja buscar atas e em qual período a ata deve ser considerada. Após a coleta de parâmetros do usuário, o sistema precisa coletar todos os órgãos e UASG da UF informada. Após a coleta das informações das UASGs, são pesquisadas, através de requisições para URLs específicas, páginas que descrevem todos os pregões associados àquela UASG. Com a página de resultados para a busca de atas, o algoritmo realiza uma pesquisa para identificar se, diante dos parâmetros informados, existe alguma ata de pregão a ser recuperada.

Caso o sistema identifique alguma ata de pregão disponível para download, este recupera o identificador único da ata e o submete a uma URL que permite o download das informações completas sobre a referida ata em formato HTML. O processo de armazenar as informações sobre atas é diferente daquele utilizado para as informações gerais de pregões. O algoritmo de armazenamento dos dados de atas de pregões é mais complexo, dado que a estrutura HTML desses arquivos é complexa e se altera freqüentemente, de acordo com as características do pregão. Diante disso, é necessário aplicar um algoritmo de parser não-determinístico sobre os arquivos obtidos para tratar essas informações. A construção desse algoritmo demandou uma análise minuciosa de uma amostra considerável de atas de pregões, de modo a tentar tratar a maior combinação possível de elementos para poder tratar uma população cada vez maior de atas.

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.

Page 6: Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

Como não há padrão de armazenamento ou disposição de elementos para o caso em questão, a melhora do algoritmo de parser do arquivo HTML é iterativa para cada nova estrutura diferente identificada e codificada. Para verificar a eficiência do parser, foi realizada uma verificação manual de uma amostra de 400 atas. Como resultado, obteve-se uma taxa de sucesso na execução desse parser em torno de 60%.

Conforme exposto acima, o armazenamento das informações coletadas e tratadas difere-se em virtude do seu tipo. No caso dos dados genéricos sobre os pregões, os dados são armazenados em arquivos txt para cada situação prevista. Para o caso das atas de pregões, os dados são armazenados em um banco de dados relacional estruturado. O objetivo é permitir acesso aos usuários finais dessas informações por meio de interfaces de SGBD, utilizando scripts SQL ou mesmo por meio de ferramentas OLAP, mais flexíveis e fáceis de operar.

A opção por estruturar as informações das atas de pregões reside do fato de que esse documento resume o maior número de informações possíveis sobre o pregão eletrônico que já foi finalizado. Diante disso, os dados presentes na ata de pregão caracterizam todo o processo de compra governamental segundo essa modalidade, desde a abertura das propostas até a adjudicação do resultado ao vencedor.

Pela completude das informações, entende-se que a ata de pregão é um objeto interessante para a análise exploratória tanto dos usuários leigos (como os cidadãos em geral) quanto para os auditores, que buscam nas informações indícios de irregularidades ou impropriedades no processo de compra.

4. CONCLUSÃO

Embora o trabalho ainda esteja em andamento, ele já atingiu o objetivo geral proposto de coletar, tratar e disponibilizar as informações presentes no Portal Comprasnet. Contudo, foram encontradas dificuldades devido à falta de padronização dos resultados presentes no Portal ComprasNet e ao número elevado de parâmetros em consultas para determinados tipos de dados. Isso dificultou o mapeamento de todas as informações extraídas do Portal para as respectivas bases de dados relacionais associadas a cada assunto.

De qualquer modo, a arquitetura de solução proposta, embora ainda incompleta para contemplar todas aquelas previstas no ciclo de vida de produção da informação estratégica, disponibiliza elementos para coleta, armazenamento e disponibilização das informações obtidas sobre pregões. Além disso, parte das atividades das fases de entendimento de negócio, coleta e tratamento de dados, conforme prevê o CRISP-DM são executadas e documentadas, o que facilita a continuidade da implantação das outras fases que completem o ciclo de descoberta de conhecimento para os dados públicos de compras governamentais.

Como proposta de trabalhos futuros, sugere-se a:- melhoria dos algoritmos utilizados para o parser de informações sobre atas de pregão;- modelagem relacional dos elementos de dados gerais do pregão para cada um dos seus tipos;- documentação detalhada dos passos executados seguindo o estabelecido pelo CRISP-DM;- validação dos dados obtidos e tratados por meio da comparação com repositórios de referência;- execução das fases de modelagem, avaliação e implantação previstas no CRISP-DM, visando finalizar o ciclo de descoberta de conhecimento para os dados públicos sobre compras governamentais;- apresentação de resultados de forma gráfica visando possibilitar ao cidadão comum a visualização e o entendimento das despesas governamentais.

AGRADECIMENTOS

Esse trabalho é financiado pelo Escritório Sobre Drogas e Crime (UNODC/Nações Unidas) e pela Fundação de Apoio à Pesquisa do Distrito Federal (FAP-DF), sendo executado na Universidade Católica de Brasília (UCB) em parceria com a Controladoria-Geral da União (CGU).

REFERÊNCIAS BIBLIOGRÁFICAS

[1] BRASIL. Comprasnet: Portal de Compras do Governo Federal. Disponível em:< www.comprasnet.gov.br>. Acesso em: 17/04/2011.[2] BRASIL. Constituição da República Federativa do Brasil. Brasília: Imprensa Nacional. Diário Oficial da União de 05 de outubro de 1988.[3] BRASIL. Lei Nr 8.666/93, de 21 de junho de 1993. Brasília: Imprensa Nacional. Diário Oficial da União de 22 de junho de 1993.[4] BRASIL. Lei Nr 10.520, de 17 de julho de 2002. Brasília: Imprensa Nacional. Diário Oficial da União de 18 de julho de 2002.[5] BRASIL. Decreto Nr 5.450, de 31 de maio de 2005. Brasília: Imprensa Nacional. Diário Oficial da União de 01 de junho de 2005.[6] BRASIL. Licitações Divulgadas pelo SIDEC. Disponível em: www.comprasnet.gov.br/ajuda/siasg/numeros/GraficoSIDEC.asp>. Acesso em:17/04/2011.[7] BRASIL. Sistema de Divulgação Eletrônica de Compras e Contratações - SIDEC: manual do usuário. Brasília: Ministério do Planejamento, Orçamento e Gestão, 2005.[8] CHAPMAN, P.; CLINTON, J.; KERBER, R.; KHABAZA, T.; REINARTZ, T.; SHEARER, C.; WIRTH, R. CRISP-DM 1.0 - Step-by-step data mining guide. The CRISP-DM Consortium, 2000.[9] LACROIX, Z. Web data retrieval and extraction. Data & Knowledge Engineering, v. 44, n. 3, p. 347-67, 2003. [10] SENG, J-L; LAI, J. T. An Intelligent information segmentation approach to extract financial data for business valuation. Expert Systems with Applications.v. 37, n. 9, p. 6515-30, 2010.

Décima Conferencia Iberoamericana en Sistemas, Cibernética e Informática: CISCI 2011 – 19 a 22 de Julio de 2011 – Orlando – FL ~ EE.UU.