UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. ·...

109
UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS CANDIDATOS AO ENEM - EXAME NACIONAL DO ENSINO MÉDIO Palhoça 2010

Transcript of UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. ·...

Page 1: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

UNIVERSIDADE DO SUL DE SANTA CATARINA

CRISTINA MARTINS

DERLEI EDSON DE FARIA

BUSINESS INTELLIGENCE:

ANÁLISE DO PERFIL SOCIOECONÔMICO DOS CANDIDATOS

AO ENEM - EXAME NACIONAL DO ENSINO MÉDIO

Palhoça

2010

Page 2: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

CRISTINA MARTINS

DERLEI EDSON DE FARIA

BUSINESS INTELLIGENCE:

ANÁLISE DO PERFIL SOCIOECONÔMICO DOS CANDIDATOS

AO ENEM - EXAME NACIONAL DO ENSINO MÉDIO

Projeto de Trabalho de Conclusão de Curso apresentado ao Curso de Graduação em Sistemas de Informação da Universidade do Sul de Santa Catarina, como requisito parcial à obtenção do título de Bacharel em Sistemas de Informação.

Orientador: Prof. Aran Bey Tcholakian Morales, Dr.

Palhoça

2010

Page 3: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

CRISTINA MARTINS

DERLEI EDSON DE FARIA

BUSINESS INTELLIGENCE:

ANÁLISE DO PERFIL SOCIOECONÔMICO DOS CANDIDATOS

AO ENEM - EXAME NACIONAL DO ENSINO MÉDIO

Este trabalho de Conclusão de Curso foi julgado adequado à obtenção do título de Bacharel em Sistemas de Informação e aprovado em sua forma final pelo Curso de Sistemas de Informação, da Universidade do Sul de Santa Catarina.

Palhoça, 24 de junho de 2010.

________________________________________________

Profº. e orientador Aran Bey Tcholakian Morales, Dr.

Universidade do Sul de Santa Catarina

________________________________________________

Profª. Mauro Notarnicola Madeira, Dr.

Universidade do Sul de Santa Catarina

________________________________________________

Jovelino Domingos Cardoso Júnior

Secretaria de Estado da Educação de Santa Catarina

Gerência de Tecnologia da Informação

Page 4: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

Dedico este trabalho aos meus pais, porque

sem eles nada disso seria possível, por me

ensinarem a ter caráter, humildade, amor,

carinho e respeito, gestos e valores cada vez

mais raros de se encontrar, e principalmente,

por sempre acreditarem que eu era capaz de

vencer, tanto esta, como todas as outras

caminhadas que já fiz, e que ainda farei. À

minha irmã pelo apoio e compreensão, pelos

sempre bons e alegres momentos que me

oferece. A uma pessoa em especial, Sidney

Lourenço Dal Sasso que diretamente

contribuiu para meu crescimento pessoal e

esteve disposto a me ajudar em todas as horas,

além do carinho e confiança à mim

depositados, e a todos os meus familiares,

amigos e colegas, que direta ou indiretamente,

ajudaram-me a dar mais esse passo na vida.

Cristina

Dedico este trabalho aos meus pais, por tudo

o que me ensinaram e me ajudaram a

conquistar, sempre com muito amor, carinho e

dedicação. À minha namorada pelo apoio,

compreensão e aos sempre bons e alegres

momentos que me proporciona, e a todos

familiares, amigos e colegas, que direta ou

indiretamente, contribuíram para a conquista

deste desafio.

Derlei

Page 5: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

AGRADECIMENTOS

Agradeço primeiramente a Deus, aos meus pais e à minha irmã por tudo, pois sem esse amor

nada seria possível. Ao meu colega e amigo Derlei Edson de Faria pela sua dedicação e

companheirismo. A todos os bons professores que estiveram à minha frente e que me

engrandeceram com seu conhecimento, em especial ao professor e orientador desta

monografia Dr. Aran Bey Tcholakian Morales, pela sua disponibilidade, interesse e

orientação. A Sidney Lourenço Dal Sasso e Rodrigo de Souza Ribeiro por todo o apoio

prestado e o carinho de sempre. E a todos os meus amigos e colegas.

Cristina

Agradeço primeiramente, aos meus pais por me proporcionarem todo o alicerce necessário

para mais essa conquista, à minha colega e grande amiga Cristina Martins pelo

companheirismo e dedicação, à minha namorada pelo carinho e compreensão, ao professor e

orientador Dr. Aran Bey Tcholakian Morales por toda atenção e orientação, e a todos os

colegas e amigos.

Derlei

Page 6: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

RESUMO

Vivemos em uma sociedade que valoriza o conhecimento e utiliza como seu principal recurso

a informação, fator que motiva a competitividade. Para melhores desempenhos neste

contexto, é preciso embasamento em informações dadas como relevantes, e isso causa a

diferença entre os resultados positivos e negativos. Atualmente, com o intuito de gerar e

propagar o conhecimento, as pessoas mantêm seu foco na educação. Porém, é necessário

avaliar suas reais condições nas escolas, com avaliações de estruturas físicas e educacionais,

dando ênfase ao Ensino Médio, por anteceder um passo muito importante: a entrada no

mercado de trabalho. A inexistência de dados nem sempre é o motivo para a falta de

consciência dessas informações, mas sim a dificuldade no acesso destes em faces analíticas,

seja por formato ou quantidade. A partir dessa necessidade, realizou-se a presente proposta, o

qual teve início capturando junto ao Instituto Nacional de Estudos e Pesquisas Anísio Teixeira

(INEP) os dados relativos ao ENEM referente ao último ano de realização do exame, 2008.

Desenvolveu-se então, uma arquitetura BI para a transformação dos dados operacionais para a

extração e geração de informações. Para isso, fez-se um levantamento dos dados contidos nos

arquivos texto, criou-se duas bases de dados no PostgreSQL 8.3, sendo uma relacional e uma

multidimensional, cuja modelagem foi feita no DB Designer 4.0 e utilizando-se o Kettle

Spoon 3.2.0 da suíte Pentanho, criou-se dois scripts ETL, sendo o primeiro para carregar os

dados dos arquivos texto para a base relacional e o segundo para classificar e sumarizar os

dados contidos na base relacional e inseri-los na base multidimensional. Concluído o Data

Warehouse (DW), foram feitas análises a partir de gráficos dinâmicos gerados pela ferramenta

front-end Microsoft Excel 2007, a fim de demonstrar o resultado do trabalho realizado e o

valor das informações encontradas.

Palavras chave: Business Intelligence. Perfil Candidatos. Análise de dados. Informações.

Necessidades.

Page 7: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

ABSTRACT

We live in a society that values knowledge and uses information as its main feature, a factor

that drives competitiveness. In this context, for better performance is necessary to be based on

information provided as relevant, and this causes the difference between positive and negative

results. Nowadays, people keep their focus on education, in order to generate and propagate

knowledge. However, it is necessary to check the actual conditions of knowledge in schools,

assessing the physical structure and educational facilities, especially in high school, because it

comes before a crucial stage: entering into the labor market. The non-existence of data is not

always the reason for the lack of awareness of this information, but the difficulty in accessing

these faces in analytical, either by format or quantity. This proposal is originated this need,

from data obtained from ENEM (by National Institute of Studies and Research Anísio

Teixeira - INEP), referring to the last year of the examination in 2008. Then was developed a

BI architecture for the transformation of operational data for extracting and generating

information. For this, a search was made of the data contained in text files, were created two

databases in PostgreSQL 8.3 (relational and multidimensional), whose modeling was done in

DB Designer 4.0 and using the Kettle Spoon's suite 3.2.0 Pentanho, and more two ETL scripts

were created, the first being for loading data from text files to a relational database and the

second to classify and summarize the data in the relational database and insert them into the

multidimensional database. After completion of the Data Warehouse (DW), analysis were

performed from the dynamic charts, generated by the front-end tool Microsoft Excel 2007

with the purpose of demonstrating the result of work done and value of information obtained.

Keywords: Business Intelligence. Candidate Profile. Data Analysis. Information. Needs.

Page 8: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

LISTA DE ILUSTRAÇÕES

Figura 1 - Arquitetura de um sistema BI. ................................................................................. 23

Figura 2 - Dados, Informação e Conhecimento. ....................................................................... 24

Figura 3 - Processos ETL. ........................................................................................................ 28

Figura 4 - Arquitetura Genérica de Data Warehouse. .............................................................. 32

Figura 5 - Implementação Top Down. ...................................................................................... 35

Figura 6 - Implementação Button Up. ...................................................................................... 36

Figura 7 - Star-Schema (Esquema Estrela) .............................................................................. 39

Figura 8 - Exemplo de um Modelo Dimensional. .................................................................... 40

Figura 9 - Composição Básica de uma Tabela Fato. ................................................................ 41

Figura 10 - Drill Down. ............................................................................................................ 44

Figura 11 - Roll Up. .................................................................................................................. 45

Figura 12 - Drill Across. ........................................................................................................... 46

Figura 13 - Slice and Dice. ....................................................................................................... 47

Figura 14 – Arquitetura BI – Solução Proposta ....................................................................... 55

Figura 15 – Modelo Dimensional. ............................................................................................ 63

Figura 16 – Arquitetura da Proposta de Solução. ..................................................................... 64

Page 9: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

LISTA DE GRÁFICOS

Gráfico 1 – Total de inscritos no ENEM nos dez maiores municípios de Santa Catarina. ...... 67

Gráfico 2 – Qual sexo? Moram sozinhos? ............................................................................... 68

Gráfico 3 - Em que tipo de escola cursa ou cursou o Ensino Médio? ...................................... 68

Gráfico 4 – Avaliação da estrutura da escola no Ensino Médio (Biblioteca, Salas de Aula e laboratórios). ............................................................................................................................. 69

Gráfico 5 – Avaliação do Ensino Médio quanto Língua Estrangeira e Acesso a Computadores/Recursos de Informática. .................................................................................. 70

Gráfico 6 – Conhecimento dos professores e maneira como é transmitido aos alunos............ 71

Gráfico 7 – Avaliação de conduta dos professores de Ensino Médio. ..................................... 72

Gráfico 8 – Trabalhou durante o Ensino Médio? Qual a avaliação? ........................................ 73

Gráfico 9 – Os conhecimentos são adequados ao mercado? O inscrito se considera preparado com o Ensino Médio? ............................................................................................................... 74

Gráfico 10 – Nota para a formação no Ensino Médio. ............................................................. 74

Gráfico 11 – Renda familiar dos inscritos. ............................................................................... 75

Gráfico 12 – Pai e Mãe: não estudou, ensino médio completo ou superior completo. ............ 76

Gráfico 13 – Possuem casa própria e automóvel? .................................................................... 77

Gráfico 14 – Possuem computador, acesso à Internet e TV? ................................................... 77

Gráfico 15 – Participaram de cursos extracurriculares: pré-vestibular, língua estrangeira e computação ou informática. ..................................................................................................... 78

Gráfico 16 – Motivo para prestar o ENEM. ............................................................................. 79

Gráfico 17 – Freqüência que lê revistas de Informação e revistas científicas. ......................... 80

Gráfico 18 – Interesse em política nacional e municipal.......................................................... 80

Gráfico 19 – A principal decisão que alunos pretendem tomar após concluir o Ensino Médio. .................................................................................................................................................. 81

Gráfico 20 – Escolha das Profissões......................................................................................... 82

Gráfico 21 – Ajuda na profissão: pais, escola ou trabalho? ..................................................... 83

Gráfico 22 – Estímulo financeiro, facilidade de obter emprego ou identificação com a profissão? .................................................................................................................................. 83

Gráfico 23 – Notas da prova objetiva. ...................................................................................... 84

Gráfico 24 – Notas da Redação. ............................................................................................... 84

Page 10: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

LISTA DE QUADROS

Quadro 1 - Comparativo OLTP versus OLAP. ........................................................................ 42

Quadro 2 – Tecnologias Utilizadas. ......................................................................................... 66

Page 11: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

LISTA DE SIGLAS

AED – Análise Exploratória de Dados

BI – Business Intelligence

DM – Data Mart

DW – Data Warehouse

ENEM – Exame Nacional do Ensino Médio

ER – Entity Relationship

ERP - Enterprise Resource Planning

ETL – Extract Transform and Load

INEP – Instituto Nacional de Estudos e Pesquisas Anísio Teixeira

ODS – Operational Data Storage

OLAP – On-line Analytic Processing

OLTP – On-line Transaction Processing

SQL – Structured Query Language

Page 12: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

SUMÁRIO

1 INTRODUÇÃO................................................................................................................. 15

1.1 PROBLEMÁTICA .......................................................................................................... 16

1.2 OBJETIVOS .................................................................................................................... 17

1.2.1 Objetivo Geral ............................................................................................................. 17

1.2.2 Objetivos Específicos................................................................................................... 17

1.3 JUSTIFICATIVA ............................................................................................................ 18

1.4 ESTRUTURA DA MONOGRAFIA ............................................................................... 19

2 REVISÃO BIBLIOGRÁFICA ........................................................................................ 20

2.1 INTRODUÇÃO ............................................................................................................... 20

2.2 SISTEMAS DE APOIO À DECISÃO ............................................................................ 20

2.3 BUSINESS INTELLIGENCE (BI) ................................................................................. 21

2.3.1 Arquitetura BI – Principais Componentes ............................................................... 23

2.3.1.1 Dados, Informações e Conhecimento ......................................................................... 24

2.3.1.2 ODS (Operational Data Storage) .............................................................................. 25

2.3.1.3 ETL (Extract, Transform and Load) .......................................................................... 25

2.3.1.4 Data Warehouse.......................................................................................................... 25

2.3.1.5 Data Mart .................................................................................................................... 26

2.3.1.6 Ferramentas Front-end................................................................................................ 26

2.4 ETL (EXTRACT, TRANSFORM AND LOAD) ............................................................ 27

2.5 DATA WAREHOUSE .................................................................................................... 28

2.5.1 Características ............................................................................................................. 29

2.5.2 Arquitetura .................................................................................................................. 30

2.5.2.1 Tipos de Arquitetura ................................................................................................... 30

2.5.2.1.1 Arquitetura Global ................................................................................................... 30

2.5.2.1.2 Arquitetura de Data Mart Independente ................................................................. 31

2.5.2.1.3 Arquitetura de Data Marts Integrados .................................................................... 31

2.5.2.2 Componentes de uma Arquitetura de Data Warehouse .............................................. 32

2.5.3 Implementação de um DW ......................................................................................... 34

2.5.3.1 Tipos de Implementação............................................................................................. 34

2.5.3.1.1 Implementação Top Down ....................................................................................... 34

Page 13: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

2.5.3.1.2 Implementação Button Up ....................................................................................... 35

2.5.3.1.3 Implementação Combinada ..................................................................................... 36

2.5.3.2 Considerações Sobre a Implementação de um DW ................................................... 37

2.5.4 Modelagem Dimensional ............................................................................................ 38

2.5.4.1 Tabelas Fato................................................................................................................ 40

2.5.4.2 Tabelas Dimensão ...................................................................................................... 41

2.6 ANÁLISE DE DADOS ................................................................................................... 41

2.6.1 OLTP versus OLAP .................................................................................................... 42

2.6.2 OLTP (On-line Transaction Processing) .................................................................. 42

2.6.3 OLAP (On-line Analytic Processing)......................................................................... 43

2.6.3.1 Drill-Down ................................................................................................................. 44

2.6.3.2 Roll-Up ....................................................................................................................... 44

2.6.3.3 Drill Across ................................................................................................................ 45

2.6.3.4 Drill Throught ............................................................................................................. 46

2.6.3.5 Slice and Dice ............................................................................................................. 46

2.6.3.6 Pivot ............................................................................................................................ 47

2.6.4 Análises Exploratórias de Dados (AED) ................................................................... 48

2.6.5 Mineração de Dados e suas Técnicas ......................................................................... 48

2.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO ............................................................... 52

3 MÉTODO .......................................................................................................................... 53

3.1 CARACTERIZAÇÃO DO TIPO DE PESQUISA .......................................................... 53

3.2 ETAPAS METODOLÓGICAS ....................................................................................... 53

3.3 ARQUITETURA DA SOLUÇÃO .................................................................................. 54

3.4 DELIMITAÇÕES ............................................................................................................ 55

3.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO ............................................................... 56

4 AMBIENTE DE BI PARA ANÁLISES DOS DADOS DO ENEM ............................. 57

4.1 PROPOSTA DE SOLUÇÃO ........................................................................................... 64

4.2 TECNOLOGIAS UTILIZADAS ..................................................................................... 65

4.3 ANÁLISES ...................................................................................................................... 67

4.3.1 Avaliação do Ensino Médio ........................................................................................ 69

4.3.2 Família e Recursos ...................................................................................................... 75

4.3.3 Interesses e Profissão .................................................................................................. 79

4.3.4 Desempenho no ENEM ............................................................................................... 84

4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO ............................................................... 85

Page 14: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

5 CONCLUSÕES E TRABALHOS FUTUROS ............................................................... 86

5.1 CONCLUSÕES ............................................................................................................... 86

5.2 TRABALHOS FUTUROS .............................................................................................. 87

REFERÊNCIAS ..................................................................................................................... 89

APÊNDICE A – SCRIPT SQL PARA CRIAÇÃO DO DW ............................................... 92

APÊNDICE B – MODELO DIMENSIONAL ..................................................................... 98

ANEXO A – QUESTIONÁRIO SOCIOECONÔMICO ENEM 2008 ............................ 103

Page 15: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

15

1 INTRODUÇÃO

Visando a um conhecimento mais abrangente do perfil socioeconômico dos

candidatos para a realização do Exame Nacional do Ensino Médio (ENEM) e com o intuito de

expor alguns pontos falhos das instituições de Ensino Médio em Santa Catarina, realizou-se

uma pesquisa para análise de dados disponibilizados pelo INEP relativos ao ENEM do ano de

2008, com a finalidade de fundamentar a tomada de decisões, imprescindíveis para um

processo de melhoramento contínuo.

Vivemos cada vez mais em uma sociedade que valoriza o conhecimento, sintetiza

novas orientações voltadas ao aprendizado, estimula a competitividade, a globalização e a

inovação e utiliza a informação como seu principal recurso.

Dentro deste contexto de apoio à decisão e uso de recursos de tecnologia de

informação e conhecimento é que apresentamos algumas características importantes sobre o

Business Intelligence, que é basicamente uma combinação de dados com ferramentas

analíticas, com o objetivo de disponibilizar informações relevantes.

Nessa perspectiva, este projeto visa à implementação de uma arquitetura para

moldar dados operacionais brutos em informação estratégica. A arquitetura proposta é

composta pela base de dados operacionais; utilização dos sistemas de extração, transformação

e carga; modelagem dimensional lógica e física do repositório de dados (Data Warehouse); e

a utilização de uma ferramenta para a visualização e análise de dados.

Conforme opinião de Inmon (1997), segundo a qual, o processamento

informacional ou analítico é o processamento que atende às necessidades dos gestores durante

as tomadas de decisão. Este termo significa SAD (Sistema de Apoio à Decisão) e examina os

aspectos de dados para detectar as tendências.

“O Data Warehouse é o alicerce do processamento dos SADs” (Inmon, 1997,

p.33).

Assim, o tratamento de todas as informações foi feito através do Data Warehouse,

realizando-se as análises e, posteriormente, a apresentação dos resultados expostos nesta

pesquisa.

Page 16: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

16

1.1 PROBLEMÁTICA

Criado em 1998 para alunos concluintes ou que já concluíram o ensino médio, o

Exame Nacional do Ensino Médio (ENEM) tem por objetivo avaliar o desempenho dos

estudantes ao fim da escolaridade básica.

Para atingir esse objetivo, existe um legado de informações operacionais imenso,

o qual representa um valioso conhecimento sobre o perfil socioeconômico de cada candidato,

opiniões de seu interesse e planos futuros.

A principal dificuldade é a transformação dos dados brutos em informações

estratégicas que auxiliem na avaliação das condições que os candidatos possuem durante a

sua formação, avaliando o nível de oportunidade de acordo com os dados repassados pelos

estudantes cadastrados.

Ao longo do tempo, com a divulgação e o amadurecimento do ENEM, vieram

juntamente com o mesmo, o crescimento do número de inscritos, dos cerca de 160 mil

inscritos, em 1998, saltaram para 4 milhões de inscritos na edição do Exame de 2008.

Conseqüentemente com a multiplicação do número de participantes, o aumento em grande

escala da geração das informações foi considerável, portanto formando uma grande massa de

dados, cuja manipulação se torna cada vez mais complexa.

A complexidade da disponibilização de dados coerentes para subsidiar o processo

decisório em sua totalidade, representando o esforço para o aperfeiçoamento e gestão,

independentemente de área que se atue, se torna uma grande necessidade para os gestores que

dependem dessas informações corretas e em tempo hábil para as iniciativas decisórias.

Segundo Barbieri (2001), as informações vitais para as tomadas de decisões

estratégicas estão escondidas em milhares de tabelas e arquivos inacessíveis aos “mortais”,

ligadas por relacionamentos e correlações transacionais, numa anatomia inadequada para os

tomadores de decisão.

De encontro ao problema mencionado por Barbieri (2001), é exposta como

solução a utilização de técnicas de uma arquitetura chamada Business Intelligence.

De acordo com Colavito et al., o BI (Business Intelligence) surgiu para simplificar

as operações de negócio das empresas e apresenta-se como a melhor opção de apoio à

decisão, pois com o uso de seus relatórios, garante-se uma visão da empresa/instituição, que

será útil para informar, analisar, otimizar e planejar todos os processos.

Page 17: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

17

Embasados nas informações supracitadas, a pesquisa utilizou o conceito, técnicas

e as ferramentas de BI para moldar os dados operacionais em informações relevantes com o

intuito de construir uma arquitetura que permita o acesso a essas informações de forma fácil e

ágil.

1.2 OBJETIVOS

1.2.1 Objetivo Geral

Desenvolvimento de uma arquitetura de BI para a transformação dos dados

operacionais do ENEM 2008, contidos em arquivos no formato texto, em um mais adequado

para a realização de análises que permitissem a extração de informações explícitas e

implícitas sobre o perfil dos alunos do Ensino Médio. As informações foram moldadas,

conforme as análises necessárias para a construção do perfil socioeconômico dos candidatos à

realização do Exame Nacional do Ensino Médio (ENEM) e com o intuito de expor alguns

pontos falhos dessas instituições em Santa Catarina.

1.2.2 Objetivos Específicos

� Modelar e criar uma base dimensional definindo as dimensões e a granularidade dos

dados;

� Criação e execução de scripts para a transformação dos dados contidos em arquivos no

formato texto e carga dos mesmos para a base dimensional, utilizando a ferramenta de

ETL Kettle;

Page 18: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

18

� Realizar a análise dos dados do modelo dimensional utilizando a ferramenta de análise

de dados do aplicativo Microsoft Office Excel;

� Expor os resultados obtidos pelas análises através da funcionalidade de geração de

diagramas e informações dinâmicas do aplicativo Excel.

1.3 JUSTIFICATIVA

Atualmente estamos na era da economia da informação sendo um resultado da

“Revolução Informacional” caracterizada pelos efeitos da difusão das Tecnologias da

Informação e Comunicações através da economia, utilizando a inteligência competitiva,

estratégias e a conversão dos mais variados tipos de informações como benefícios (Lastres et.

al. (1999, p. 35)). Nesta era, possuímos muitas empresas e conseqüentemente uma enorme

exigência no mercado. O BI atua na gestão de conhecimentos, dedicado a captura e

modelagem de dados trabalhando com a inteligência competitiva, o mesmo contempla várias

linhas de conceitos, não se aplicando somente no mercado de negócios, mas também

provendo benefícios em prol da sociedade.

Desta forma, os benefícios propiciados pela utilização de um BI para auxílio de

obtenção de informações corretas, dispostas de forma simples e ágil, podem resultar em um

melhoramento considerável na gestão de Ensino Médio, abrindo portas para a inclusão destes

estudantes aos cursos superiores e, conseqüentemente, instigando-os o acesso às informações,

conhecimento e cultura, impactando diretamente na sociedade, proporcionando um melhor

padrão de vida.

Os fatores implicantes para a escolha do tema e a construção da arquitetura BI

estão relacionados à importância da transformação das informações brutas em conhecimento.

Esta proposta agrega valor a uma grande massa de dados que, moldada pode

proporcionar em sua gestão, melhorias no sistema de ensino médio em Santa Catarina, bem

como, nas Universidades do Estado, pois terão o conhecimento da realidade dos candidatos.

Page 19: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

19

1.4 ESTRUTURA DA MONOGRAFIA

A pesquisa está dividida em 05 capítulos, sendo que o capítulo 1 apresenta o tema,

a problemática, os objetivos, a justificativa, e a estrutura da monografia.

O capítulo 2 enfatiza a arquitetura dos sistemas de BI, focando os sistemas de

extração, transformação e carga (ETL), o repositório de dados, do tipo Data Warehouse e as

aplicações de Front-end, como ferramentas OLAP, ferramentas de análise exploratória de

dados e técnicas de mineração de dados. O capítulo 3 apresenta a metodologia adotada para o

desenvolvimento do trabalho, o capítulo 4 aborda a modelagem e desenvolvimento do

protótipo desenvolvido e o capítulo 5 as conclusões e trabalhos futuros.

Page 20: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

20

2 REVISÃO BIBLIOGRÁFICA

2.1 INTRODUÇÃO

Este capítulo visa apresentar os principais conceitos do ambiente de BI, baseados

nos principais autores da área, bem como, algumas conclusões obtidas por meio de pesquisas

efetuadas.

2.2 SISTEMAS DE APOIO À DECISÃO

Conforme Furlan et al. (1994, p. 157), há tempos, quando se iniciava um processo

de informatização nas empresas, desenvolviam-se vários sistemas com o intuito de atender as

diferentes necessidades primordiais do negócio. Com o passar do tempo, os executivos

passavam a receber vários relatórios impressos, primeiro em formulários contínuos e depois

em folhas impressas a laser, onde muitos apresentavam informações conflitantes entre si,

colocando em questão sua verdadeira utilidade. Contribuindo muito pouco para o que já era

de conhecimento do executivo, esses relatórios conflitantes acabaram tornando-se irrelevantes

para o processo de decisões estratégicas e prioritárias.

Segundo Turban et. al. (2009, p. 21), atualmente o ambiente de negocio no qual as

empresas operam está se tornando cada vez mais complexo e mutante. As empresas, privadas

ou públicas, sentem crescentes pressões forçando-as a responder rapidamente a condições que

estão em constante mutação, além da exigência de inovações na maneira operante. Essas

atividades exigem das empresas agilidade, tomadas de decisão rápidas e freqüentes, sejam

elas estratégicas, táticas e operacionais, algumas das quais são muito complexas.

Segundo Serra (2002, p. 77), o grande desafio no gerenciamento de qualquer

processo é a análise dos fatos/informações relacionados a seu dever. Essa análise deve ser

Page 21: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

21

feita de tal forma que seja possível detectar tendências e tomar decisões eficientes e em tempo

hábil, utilizando as ferramentas e dados disponíveis para este propósito. O mesmo também

afirma que há uma extrema necessidade das empresas de captar, compreender e explorar os

seus dados para dar suporte a estas tomadas de decisão, o qual vem se tornando cada vez mais

uma obrigação competitiva, visto que há uma redução constante no tempo do ciclo de

negócios.

Segundo Singh (2001, p. 382), a maioria das organizações não sofre pela

ausência, mas sim pela abundância de dados redundantes e inconsistentes, difíceis de acessar

e usar para fins de tomada de decisão, e então, administrar com eficiência.

O Universo empresarial hoje padece de um mal clássico. Possui uma montanha de dados, mas enfrenta grande dificuldade na extração de informações a partir dela. Essa crescente inundação de informações dificulta o processo de tomada de decisão, na medida em que a alta e a média gerência se sentem impotentes no processo de sua busca e recuperação (BARBIERI, 2001, p. 34).

O acúmulo de informações nas rotinas organizacionais e relatórios desintegrados

são fatores que causam pontos falhos em uma empresa, diferentemente de informações

tratadas, relatórios consistentes e integrados que se tornam armas estratégicas de investimento

no atual mercado que se encontra cada vez mais competitivo.

Conforme Turban et al. (2009, p. 21), o processo de tomada de decisões pode e

exige quantidades consideráveis de dados, informações e conhecimento. O correto

processamento/utilização destas informações deve ser feito de forma rápida e com freqüência

em tempo real, exigindo na maioria dos casos algum suporte computadorizado. É para realizar

este suporte que surgiu o conceito de Business Intelligence (BI).

2.3 BUSINESS INTELLIGENCE (BI)

Barbieri (2001, p. 34) cita que em linhas gerais o BI (Business Intelligence) é a

utilização de várias fontes de informação de forma a auxiliar na definição de estratégias de

negócio no mercado competitivo.

Segundo o mesmo autor supracitado, Barbieri (2001, p. 34) “os Sistemas legados

e os emergentes Enterprise Resource Planning [ERP], sistemas integrados corporativos, não

Page 22: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

22

trazem as informações gerencias na sua forma mais palatável”, ou seja, as empresas que ainda

não possuem o conceito de BI em sua política utilizam a seguinte frase: “Não se sabe o que se

sabe e não se sabe o que não se sabe”.

As informações vitais para tomadas de decisões estão escondidas em milhares de tabelas e arquivos inacessíveis aos mortais, ligadas por relacionamento e correlações transacionais, numa anatomia inadequada para os tomadores de decisão. Dessa forma, o conhecimento corporativo e as informações externas não estão prontamente disponíveis. O Jogo de palavras que melhor define essa situação é: “Não se sabe o que se sabe e não se sabe o que não sabe”. O objetivo maior das técnicas de BI neste contexto está exatamente na definição de regras e técnicas para a formatação adequada destes volumes de dados, visando transformá-los em depósitos estruturados de informações, independente de sua origem. (BARBIERI, 2001, p.34).

Para Serra (2002, p. 77), as funções primordiais dos sistemas de BI são as

seguintes:

* Extração e integração de dados de múltiplas fontes; * Reutilização de experiência; *Análise de dados contextualizados; * Trabalho com hipóteses; * Busca de relações de causa e efeito; *Transformação dos registros obtidos em informação útil para processo decisório.

De acordo com Colavito et al. (2009, p. 5), o BI surgiu para simplificar as

operações de negócio das empresas e apresenta-se como a melhor opção de apoio à decisão,

pois por meio de seus relatórios garante uma visão da empresa, que será útil para informar,

analisar, otimizar e planejar.

Benefícios do BI: * Permite uma aproximação integrada e colaborativa para capturar, criar, organizar e utilizar todos os ativos de informação de uma empresa; * Torna possível uma antecipação às mudanças bruscas no mercado e às ações sobre os competidores; * Amplia o conhecimento sobre o negócio; * Auxilia na implementação de novas ferramentas gerenciais; *Permite maior conhecimento sobre novas tecnologias, produtos ou serviços que possam afetar direta e indiretamente o negócio. (COLAVITO et. al. 2009, p. 5).

Os sistemas de BI tornaram-se essenciais aos gestores das empresas, as quais

buscam aproveitar as oportunidades que um mercado em constante transformação pode

oferecer.

Page 23: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

23

2.3.1 Arquitetura BI – Principais Componentes

Conforme descrições na figura 1, os principais componentes de BI são as fontes

de dados (dados operacionais), o componente ETL (Extração, carga e transformação de

dados), o componente Repositório de dados (Data Warehouse ou Data Marts) e o acesso ao

usuário (Front-end (OLAP)).

Todos componentes supracitados comungam em uma arquitetura BI com objetivo

de transformar os dados em informações e conhecimento relevante para o processo de tomada

de decisões (Morales, 2009, p. 9).

Figura 1 - Arquitetura de um sistema BI. Fonte: Morales, 2009, p. 8.

Page 24: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

24

2.3.1.1 Dados, Informações e Conhecimento

Segundo Santos et. al. (2009, slide 6) dados são base para informação, em que

tudo pode ser capturado pelos nossos órgãos dos sentidos, em princípio, não tem valor

agregado e não permitem conectividade e entendimento. Informação é a base para o

conhecimento, agrega valor aos dados, tem relevância e propósito e é um conhecimento

codificado. Já o conhecimento tem um processo cognitivo que mistura vários elementos:

experiência, valor, verdade fundamental, discernimento (julgamento) e pode ser associada.

A figura 2 mostra um comparativo entre dados, informação e conhecimento.

Figura 2 - Dados, Informação e Conhecimento. Fonte: Morales, 2009 p. 17 APUD (Trajano Leme Filho, 2004).

Page 25: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

25

2.3.1.2 ODS (Operational Data Storage)

Conforme Machado (2008, p. 37), Operational Data Storage “Representa um

armazenamento intermediário dos dados, facilitando a integração dos dados do ambiente

operativo antes de sua atualização no Data Warehouse.”

Tem o papel de armazenar informações correntes, ou seja, dados de forma

temporária, com o objetivo de facilitar o processamento desses dados para a carga no Data

Warehouse, servindo de base para análises do ambiente operativo, pois sua granularidade é

condizente com os sistemas deste ambiente, este não é uma componente indispensável para

um data warehouse, mas sim é uma decisão de projeto (Machado, 2008, p. 37-38).

2.3.1.3 ETL (Extract, Transform and Load)

Machado (2004, p. 42) ETL é o processo de extração, transformação e carga dos

dados.

Barbieri (2001, p. 74) define ETL como sendo uma etapa responsável pela

transferência dos dados de sua fonte original para uma base de dados dimensional.

2.3.1.4 Data Warehouse

Segundo Serra (2002, p. 140) “É um banco de dados voltado ao suporte de

decisão de usuários finais, derivado de diversos outros bancos de dados operacionais”.

Serra (2002, p. 140), ainda completa citando que o Data Warehouse “é um

conjunto de diversas tecnologias, como ferramentas de extração e conversão, banco de dados

voltados para consultas complexas, ferramentas inteligentes de prospecção e análise de dados

e ferramentas de administração e gerenciamento”.

Page 26: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

26

Para Inmom (2000, p. 33) ”um Data Warehouse é um conjunto de dados baseado

em assuntos, integrado, não-volátil, e variável em relação ao tempo, de apoio às decisões

gerenciais”.

Segundo Inmom (200, p. 33) de todos os aspectos mais importantes do Data

Warehouse o fato de ele ser integrado é o que mais se destaca.

2.3.1.5 Data Mart

Segundo Serra (2002, p. 136) um Data Mart é um pequeno data warehouse

aplicado para grupo de pequenas pessoas, como por exemplo, para setores de uma empresa,

este tipo de utilização pode servir como experimento para a implantação de Data Warehouse.

O menor tempo de implantação, menor custo e os correntes avanços tecnológicos também são

fatores que atraem na escolha por um data mart. A diferença entre um data warehouse e um

data mart está relacionada apenas com o tamanho e o escopo do problema a ser resolvido.

Conforme Serra (2002, p. 138), como há a implantação de data marts para

futuramente se ter um data warehouse, também acontece o oposto, dar-se-á quando as

organizações acumulam grandes volumes de dados históricos para suporte à decisão que se

mostram pouco ou nunca utilizados, assim elas podem contrair as informações necessárias de

seu data warehouse em data mart mais focado.

2.3.1.6 Ferramentas Front-end

Segundo Morales (2009, p. 9) front-end são aplicações, as quais são a parte visível

ao usuário de um projeto de BI.

Esse componente é composto pelas ferramentas de análise de dados Data Mining,

descrito no item “2.6.5 Mineração de Dados e suas Técnicas”, pelo OLAP descrito no item

“2.6.3 OLAP (On-line Analytic Processing)” e pelos relatórios gerados a partir desses dois

itens.

Page 27: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

27

Esta é parte integrante da estrutura do Data Warehouse que será disposta aos

usuários finais.

2.4 ETL (EXTRACT, TRANSFORM AND LOAD)

ETL ou da sigla, em português ETC, de acordo com Barbieri (2001, p. 74),

“Nessa etapa deverão ser definidos os processos requeridos de transformação do modelo

Fonte para o modelo Dimensional”, ou seja, é a extração, transformação e carga dos dados do

modelo original para o dimensional.

Segundo Barbieri (2001, p. 75) o conceito de extração dos dados e seu tratamento

que são a ETL podem ser divididos em:

*Filtro de Dados: Relaciona os procedimentos e condições para se eliminar os elementos de dados indesejáveis no modelo Dimensional. Por exemplo, desejamos que somente Ordens de Compra com valores totais maiores que R$1.000,00 sejam consideradas no sistema gerencial em projeto. *Integração de Dados: Define a forma de se correlacionar informações existentes em fontes distintas, e que deverão ser integradas no sistema gerencial. Suponha que alguns dados de fornecedor estejam no BD de Fornecedores corporativo da empresa, mas que algumas informações específicas, de interesse da área objeto do sistema aplicativo, estejam em planilhas locais. A integração dessas informações se torna fundamental para os requisitos do sistema e deverá ser previsto nessa fase. Outro exemplo poderia ser o caso de dados que estão codificados em um ambiente (por exemplo, o código do fornecedor embute região) e que deverão ser decodificados a fim de facilitar o seu uso, associando-se a ele uma informação explícita sobre região. *Condensação de Dados: Define forma de se reduzir volumes de dados visando obter informações resumidas e sumariadas. Normalmente essas sumarizações acontecem nas dimensões dos dados, como tempo e geografia. Um exemplo seria a sumarização em termos semanais de dados diários de venda, ou o resumo em níveis geográficos, como por exemplo, vendas por região. *Conversão de Dados: Define os procedimentos para se transformar dados em unidades, formatos e dimensões diferentes. *Derivação de Dados: Define os meios e fórmulas para de produzir dados virtuais, a partir de dados existentes. (BARBIERI, 2001, p.75).

O ETL pode ser aplicado, conforme mencionado acima por Barbieri (2001) em

quantas etapas precisarem para integração dos dados.

A figura 3 apresenta um esboço do processo de ETL.

Page 28: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

28

Figura 3 - Processos ETL. Fonte: TURBAN et. al., 2009, p. 72.

2.5 DATA WAREHOUSE

O Data Warehouse pode ser definido como um banco de dados, porém,

construído especialmente para servir como suporte a aplicações de análise de dados para

tomada de decisões. Conforme Turban et. al (2009), os dados nele contidos são normalmente

estruturados para atender as atividades de processamento analítico, como por exemplo, OLAP

e Data Mining,

Turban et. al (2009), define o Data Warehouse como um repositório de dados

atuais e históricos, e um conjunto de dados organizado para oferecer suporte à tomada de

decisões, sendo então de grande interesse aos gerentes de toda a organização.

Para Machado (2004, p. 20, 43), o Data Warehouse representa uma base dados

capaz de disponibilizar, de forma integrada, a história da empresa, dados de clientes, de

fornecedores e operacionais, informações que encontram-se distribuídas pelos sistemas

operacionais da empresa e em fontes externas que serão utilizadas nos sistemas de apoio à

decisão.

Inmon (1997) descreve o Data Warehouse como “um conjunto de dados baseado

em assuntos, integrado, não-volátil, e variável em relação ao tempo, de apoio às decisões

gerenciais”.

Page 29: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

29

Resumidamente, o Data Warehouse é, portanto, um conjunto de processos, ferramentas e recursos que armazenam e manipulam dados, aglutinados de fontes heterogêneas, orientados por assuntos, variáveis com o tempo e não-voláteis, cujo objetivo é gerenciar e disponibilizar informações de negócios precisas e inteligíveis para que os indivíduos possam tomar decisões efetivas, dado suporte ao processo de tomada de decisão estratégica da empresa. (FIALHO, 2006, p.146).

2.5.1 Características

Algumas das características essenciais de um Data Warehouse são citadas por

Serra (2002), Machado (2004) e Turban et al. (2009), como orientação por assunto,

integração, variável no tempo e não volatilidade, as quais são explicadas na seqüência.

A orientação por assunto define a organização dos dados por áreas de interesse da

organização, como vendas, produtos ou clientes, contendo especificamente as informações

relevantes à tomada de decisões.

Visto que o DW contém dados de diversas outras fontes, há uma grande

possibilidade de que estes estejam em formatos diferentes, então, é necessário padronizá-los

para uma representação única, eliminando as inconsistências. Este é o conceito de integração.

Machado (2004) afirma que “em ambientes de múltiplas plataformas sistêmicas, a

característica de integração se torna fundamental, pois necessitamos de unicidade de

informações”.

O DW é variável em relação ao tempo, ou seja, armazenam dados históricos.

Segundo Turban et al. (2009), esta característica dá suporte ao processo decisório, pois

possibilita a detecção de tendências, variações, relações de longo prazo para previsão e

comparações.

A não volatilidade define que no DW existem somente duas operações básicas,

inserção e seleção, ou seja, após inserir os dados os mesmos não serão mais alterados,

justamente para manter os dados históricos.

Machado (2004) ainda descreve algumas características do Data Warehouse que o

distingue de outros sistemas convencionais de armazenamento de dados, tais como:

� Extração de dados de fontes heterogêneas;

� Transformação e integração dos dados antes de sua carga final;

� Normalmente requer máquina e suporte próprio;

Page 30: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

30

� Visualização dos dados em diferentes níveis. Os dados do DW podem ou não ser

extraídos para um nível mais específico, os Data Marts, e a partir deste para um banco

de dados individual;

� Utilização de ferramentas voltadas para acesso com diferentes níveis de apresentação;

� Dados somente são inseridos, não existindo atualização.

2.5.2 Arquitetura

2.5.2.1 Tipos de Arquitetura

Para Machado (2004, p. 47), a escolha da arquitetura a ser utilizada em um projeto

de Data Warehouse, além de fazer parte do escopo gerencial do projeto, deve levar em conta

fatores relacionados à infra-estrutura disponível, ao ambiente de negócio, à abrangência

desejada, à capacitação dos empregados da empresa e aos recursos disponíveis para tal

investimento.

Os tipos de arquitetura apresentados por Machado (2004), que serão mostrados a

seguir são: global, independente e integrada. Elas determinam a localização do Data

Warehouse ou Data Marts, ou seja, se estarão localizados em uma instalação central ou

distribuídos em instalações remotas ou locais, administradas de maneira centralizada ou

independente.

2.5.2.1.1 Arquitetura Global

Page 31: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

31

Neste modelo, o projeto e a construção do DW são baseados nas necessidades da

empresa, consolidando um repositório de dados de suporte à decisão disponível em toda a

empresa.

A arquitetura global ainda pode ser classificada como centralizada ou distribuída,

de acordo com a sua localização.

A arquitetura global centralizada possui apenas um Data Warehouse e é utilizada

quando a empresa possui apenas uma sede.

A arquitetura global distribuída é utilizada quando a empresa possui várias sedes

(locais de instalação).

Tanto na distribuída como na centralizada, o Data Warehouse é administrado por

um departamento de Tecnologia da Informação, o qual é responsável por definir os dados que

serão carregados no DW e quando deverão ser atualizados, bem como definir as permissões

de acesso aos mesmos.

2.5.2.1.2 Arquitetura de Data Mart Independente

Como o próprio nome sugere, esta arquitetura é composta por Data Marts

independentes uns dos outros, controlados por um grupo específico de usuários e que atendem

exclusivamente as necessidades específicas e departamentais destes. Neste modelo, não existe

conectividade entre os Data Marts dos diversos departamentos ou áreas de negócio da

empresa.

Como já foi dito, a administração dos Data Marts é realizado pelas suas

respectivas áreas de negócio ou departamentos, cabendo ao departamento de Tecnologia da

Informação apenas o auxílio na manutenção técnica do ambiente.

2.5.2.1.3 Arquitetura de Data Marts Integrados

Page 32: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

32

Neste modelo, os Data Marts são implementados separadamente por áreas de

negócio ou departamentos, porém, ao contrário da arquitetura independente, eles são

interconectados e os usuários de um determinado departamento podem acessar e utilizar

dados de um Data Mart de outro departamento. Esta característica provê uma visão

corporativa mais ampla das informações.

Com relação à administração e controle dos Data Marts, neste modelo são pontos

mais críticos, portanto, ficando sob responsabilidade do departamento de Tecnologia da

Informação e não dos departamentos como no caso dos Data Marts independentes.

2.5.2.2 Componentes de uma Arquitetura de Data Warehouse

Autores como Serra (2002), Clemes (2001) e Gonçalves (2002), apresentam uma

arquitetura genérica de Data Warehouse, considerando os seus principais e mais comuns

componentes, conforme a figura 4.

Figura 4 - Arquitetura Genérica de Data Warehouse. Fonte: CLEMES, 2001, p. 45.

a) Camada de Banco de Dados Operacionais e Fontes Externas

Page 33: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

33

“Corresponde aos dados das bases de dados operacionais da organização e de

fontes de dados externas que serão tratados e integrados, compondo o data warehouse”.

(CLEMES, 2001, p. 45).

b) Camada de Acesso à Informação

É a camada através da qual os usuários finais interagem com o DW. Representa as

ferramentas de manipulação, análise e apresentação de dados, como por exemplo, o Microsoft

Excel.

c) Camada de Acesso aos Dados

Segundo Gonçalves (2002, p. 34), é uma interface entre as ferramentas de acesso

à informação e os bancos de dados operacionais, comunicando-se com diversos sistemas de

bancos de dados, sistemas de arquivos e fontes que utilizam protocolos de comunicação

distintos, caracterizando-a como um acesso universal de dados.

d) Camada de Metadados

Nesta camada estão localizadas as informações sobre os dados mantidos pela

empresa, os metadados, que também são conhecidos como dicionário de dados.

De acordo com Serra (2002, p. 151), uma grande variedade de metadados é

indispensável para manter a funcionalidade de um Data Warehouse, desde os dados referente

às visões dos usuários até os dados sobre os bancos de dados operacionais.

e) Camada de Gerenciamento de Processos

Conforme Serra (2002, p. 151), esta camada é responsável pelo controle das

tarefas realizadas para construir e manter as informações do dicionário de dados e do Data

Warehouse atualizadas e consistentes.

f) Camada de Transporte

É a camada responsável pelo transporte das informações através da rede. Segundo

Serra (2002), nela é realizada a separação das aplicações operacionais das aplicações de apoio

à decisão, incluindo também a coleta de mensagens e transações e a entrega das mesmas em

seus destinos e tempos determinados.

Page 34: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

34

g) Camada do Data Warehouse

Gonçalves (2002, p. 35), define esta camada como o Data Warehouse

propriamente dito, o local de fato onde os dados estão armazenados.

h) Camada de Gerenciamento e Replicação

“Esta camada inclui todos os processos necessários para selecionar, editar,

resumir, combinar e carregar o data warehouse e as correspondentes informações de acesso a

partir das bases operacionais e fontes externas”. (SERRA, 2002, p. 152).

2.5.3 Implementação de um DW

2.5.3.1 Tipos de Implementação

Segundo os autores Machado (2004) e Barbieri (2001), são três os tipos de

implementação de projetos de Data Warehouse: top down, button up e a convergência das

duas. O segundo autor, refere-se à implementação top dowm como “Abordagem de Bill

Inmon” e à button up como “Abordagem de Ralph Kimball”, por serem os precursores de

cada uma delas.

A opção por um tipo de implementação é influenciada por fatores como a infra-estrutura de Tecnologia da Informação, a arquitetura escolhida, o escopo da implementação, os recursos disponíveis e principalmente pela necessidade ou não de acesso corporativo dos dados, assim como pelo retorno de investimento desejado e velocidade de implementação. (MACHADO, 2004, p. 52).

2.5.3.1.1 Implementação Top Down

Page 35: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

35

Segundo Barbieri (2001), esta abordagem segue o estilo mais tradicional de

construção de bancos de dados, no qual se buscava uma forte interação entre todos os dados

espalhados pelos diversos departamentos da empresa. Conforme apresentado na figura 5, o

ponto central da metodologia é o Data Warehouse propriamente dito, que segundo o mesmo

autor, “significa um grande depósito central de informações empresariais tratadas, limpas e

integradas, construído inicialmente, e de onde outros pequenos depósitos secundários (Data

Marts, ou mercado de dados) são originados e construídos”.

Conforme Machado (2004, p. 52), antes de se iniciar a implementação “devem ser

tomadas as decisões sobre as fontes de dados que serão utilizadas, segurança, estruturas de

dados, qualidade de dados a ser considerada, padrões de dados e vários modelos de dados dos

sistemas transacionais atuais devem estar completos [...]”.

Figura 5 - Implementação Top Down. Fonte: MACHADO, 2004, p. 53.

Na figura acima, primeiramente os dados dos sistemas transacionais são extraídos,

transformados e integrados para um ODS, na seqüência, esses dados e os metadados são

transferidos para o DW, do qual serão extraídos e carregados para os Data Marts.

(MACHADO, 2004, p. 52).

2.5.3.1.2 Implementação Button Up

Page 36: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

36

Esta abordagem, segundo Barbieri (2001, p. 53), segue um estilo mais simples,

apontando para projetos de Data Marts independentes que deverão ser integrados na medida

da sua evolução, conforme mostrado na figura 6. “Os projetos serão menores, independentes,

focando áreas ou assuntos específicos e terão sua conexão com o passar do tempo, desde que

mantidas a compatibilidade dimensional entre chaves das tabelas”.

Este tipo de implementação permite que o planejamento e o desenho dos Data Marts possam ser realizados sem esperar que seja definida uma infra-estrutura corporativa para Data Warehouse na empresa. Essa infra-estrutura não deixará de existir, só que ela poderá ser implementada incrementalmente conforme forem sendo realizados os Data Marts. (MACHADO, 2004, p. 54).

De acordo com Machado (2004, p. 54), “o processo começa com a extração,

transformação e a integração dos dados para um ou mais Data Marts, os quais são modelados,

normalmente, com base em um modelo dimensional”.

Figura 6 - Implementação Button Up. Fonte: MACHADO, 2004, p. 55.

2.5.3.1.3 Implementação Combinada

Page 37: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

37

A implementação combinada prevê a convergência entre as implementações top

down e button up, buscando uma nova abordagem a partir dos pontos positivos de cada uma

delas.

Conforme Machado (2004), nessa Abordagem é realizada a modelagem de dados

do Data Warehouse de visão macro e na seqüência é feita a implementação de partes deste

modelo, as quais constituirão os Data Marts. Ainda de acordo com o mesmo autor, “cada

Data Mart pode ser gerado a partir do macromodelo de dados do Data Warehouse e integrado

ao modelo físico do Data Warehouse”.

Segundo Machado (2004), “a principal vantagem dessa abordagem é a garantia de

consistência dos dados, obtida em virtude do modelo de dados para os Data Marts ser único,

possibilitando realizar o mapeamento e controle dos dados”.

2.5.3.2 Considerações Sobre a Implementação de um DW

Segundo Serra (2002, p. 159), o sucesso de um projeto de Data Warehouse

depende diretamente da estratégia adotada, tais como a arquitetura e tipo de implementação

que serão utilizadas, adequando-a as características e necessidades do ambiente para o qual

será implementado.

A especificação de requisitos para o desenvolvimento de qualquer sistema é um

dos pontos cruciais para o seu sucesso, no entanto, deve-se levar em conta que esta etapa

possui suas particularidades pelo fato de estarmos tratando de um ambiente de apoio à

decisão. Serra (2002, p. 161), cita algumas das diferenças relacionadas à especificação de

requisitos para sistemas de um ambiente operacional e para sistemas de um ambiente de

suporte à decisão, conforme abaixo:

� Enquanto em um ambiente operacional os requisitos são claramente identificados, no

ambiente de apoio à decisão são indeterminados, pois dependem das necessidades de

informação individuais de seus usuários;

� Em ambientes operacionais os requisitos são relativamente estáveis ao longo do

tempo, enquanto em ambientes de suporte à decisão são instáveis, pois dependem das

variações das necessidades de informações dos tomadores de decisão.

Page 38: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

38

Serra (2002, p. 163), aponta nove pontos que constituem definições a serem feitas

em um projeto de DW, os quais são chamados de pontos de decisão e correspondem a etapas

do projeto. São elas:

Os processos e, por conseqüência, a identidade das tabelas de fatos; A granularidade de cada tabela de fatos; As dimensões de cada tabela de fatos; Aos fatos, incluindo fatos pré-calculados; Os atributos das dimensões; Como acompanhar mudanças graduais em dimensões; As agregações, dimensões heterogêneas, minidimensões e outras decisões de projeto físico; Duração histórica do banco de dados; A urgência com que se dá a extração e carga para o data warehouse.

Para Serra (2002, p. 165), a granularidade refere-se ao nível de detalhe que os

dados são mantidos no DW, sendo que, quanto maior este nível, menor será o nível de

granularidade. O mesmo considera este ponto como uma questão fundamental em um projeto

de DW, pois afeta na quantidade de dados que serão armazenados e, ao mesmo tempo, limita

os tipos de consulta que poderão ser respondidas pelo sistema.

2.5.4 Modelagem Dimensional

A modelagem de dados utilizada em um projeto de Data Warehouse não é a

mesma aplicada nos bancos de dados convencionais, os quais utilizam o modelo ER (Entity

Relationship). Como o modelo ER não atende às necessidades impostas em um projeto de

DW, então surgiu a modelagem dimensional ou multidimensional.

Serra (2002), define a modelagem dimensional como sendo uma técnica de

projeto de banco de dados para Data Warehouse, onde os dados são organizados em cubos,

nos quais as informações procuradas estão localizadas na interseção de suas arestas.

A modelagem multidimensional é uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descreve aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. (MACHADO, 2004, p. 79).

Page 39: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

39

“A modelagem dimensional permite que o usuário perceba os dados numa forma

próxima de seu entendimento, com várias perspectivas possíveis, dentre elas o tempo e o

espaço”. (BARBIERI, 2001, p. 80).

Serra (2002, p. 47), descreve que o princípio da modelagem dimensional é o

relacionamento entre as tabelas de dimensão e a tabela fato, formando os esquemas de

estrutura. Estes irão definir os elementos de composição dos cubos e variam de acordo com

sua estrutura, podendo ser do tipo star-schema, snowflacke ou parent-child.

O tipo de esquema de estrutura abordado neste trabalho é o star-schema (esquema

estrela), ilustrado na figura 7, visto que é o mais utilizado em projetos de Data Warehouse.

Figura 7 - Star-Schema (Esquema Estrela) Fonte: MACHADO, 2004, p. 93.

De acordo com Barbieri (2001, p. 81), “o produto final da modelagem

Dimensional é a produção de modelo conceitual dimensional, formado por tabelas Fato e

tabelas Dimensão”, conforme exemplo mostrado na figura 8.

Page 40: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

40

Figura 8 - Exemplo de um Modelo Dimensional. Fonte: BARBIERI, 2001, p. 82.

2.5.4.1 Tabelas Fato

Machado (2004, p. 100), define fato como tudo aquilo que pode ser representado

por meio de valores numéricos, sendo que o conjunto destes é denominado de métricas ou

medidas. Um fato é evolutivo e muda suas medidas ao longo do tempo, podendo esta

evolução ser questionada ao longo de um espaço de tempo.

As tabelas Fato servem para armazenar medidas numéricas associadas a eventos de negócio. Uma tabela Fato contém vários fatos, correspondentes a cada uma de suas linhas. Cada fato pode armazenar uma ou mais medidas numéricas, que constituem os calores objetos da análise dimensional. Possuem como chave-primária, normalmente um campo multi-key, formado pelas chaves-primárias das dimensões com que ela se relacionam. Normalmente armazenam muito mais linhas do que as tabelas Dimensão, e merecem cuidado especial em função do seu alto volume. Contém dados normalmente aditivos (manipulados por soma, média, etc.) e relativamente estáticos. (BARBIERI, 2001, p. 81).

A figura 9 exemplifica a composição básica de uma tabela fato.

Page 41: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

41

Figura 9 - Composição Básica de uma Tabela Fato. Fonte: BARBIERI, 2001, p. 82.

2.5.4.2 Tabelas Dimensão

Segundo Machado (2004, p. 80), as dimensões são os elementos que participam

de um fato e determinam o contexto de um assunto de negócios. “São as possíveis formas de

visualizar os dados, ou seja, são os ‘por’ dos dados: ‘por mês’, ‘por país’, ‘por produto’, ‘por

região’, etc.”.

As tabelas Dimensão representam entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente, etc. As tabelas Dimensão têm uma relação 1:N com a tabela Fato, e possuem um número significativamente menor de linhas do que as tabelas Fato. Possuem múltiplas colunas de informação, algumas das quais representam a sua hierarquia. Apresentam sempre uma chave primária, que lhes confere unicidade, chave essa que participa da tabela Fato, como parte da sua chave múltipla. Devem ser entendidas como as tabelas que realizam os filtros de valores aplicados na manipulação dos fatos e por onde as consultas entram no ambiente do DW/DM. (BARBIERI, 2001, p. 81).

2.6 ANÁLISE DE DADOS

O objetivo principal do sistema BI é possibilitar a análise de dados. Neste ponto

que ocorrem as transformações dos dados (dados operacionais) advindos do componente

OLTP em informações utilizado OLAP.

Page 42: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

42

Em seguida, serão apresentados alguns conceitos, técnicas e ferramentas

referentes à análise de dados.

2.6.1 OLTP versus OLAP

OLTP (On-line Transaction Processing) é a parte integrante do sistema de apoio

operacional, enquanto o OLAP (On-line Analytic Processing) é parte integrante do sistema de

apoio decisório. No quadro 1, é realizado um comparativo entre OLTP e OLAP, destacando

suas principais características.

OLTP OLAP Relacional Multidimensional Individualizados Sumarizados Presente Histórico Um registro de cada vez Muitos registros por vez Orientados ao processo Orientados ao negócio

Quadro 1 - Comparativo OLTP versus OLAP. Fonte: SERRA, 2002, p. 157.

2.6.2 OLTP (On-line Transaction Processing)

Segundo Morales (2009, p. 6) ”Os sistemas OLTP tem a tarefa de monitorar e

processar as funções básicas e rotineiras de uma organização, tais como processamento da

folha de pagamento, faturamento, estoque, etc.”.

Page 43: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

43

2.6.3 OLAP (On-line Analytic Processing)

Conforme Serra (2002, p. 156) OLAP refere-se ao tipo de processamento e

ferramentas voltados para a análise de dados e apoio a processos de gestão por meio da visão

multidimensional.

“É [OLAP] o conjunto de ferramentas que possibilita efetuar a exploração de

dados de um Data Wharehouse.” (MACHADO, 2008, p. 86).

“A atividade para qual, OLAP é útil: operações e apoio á decisão”. (THOMSEN,

2002, p. 5).

O termo processamento analítico on-line (OLAP- Online Analytical Processing) descreve o processamento analítico de dados assim que ocorrem as transações. As ferramentas OLAP podem analisar dados para refletir as necessidades de negócios reais. (TURBAN et. al., 2005, p.88). Os conceitos de OLAP incluem a noção ou idéia de múltiplas dimensões hierárquicas e podem ser usados por qualquer um para que se pense mais claramente a respeito do mundo, seja o mundo material de estala atômica à escala galáctica, o mundo econômico dos micro agentes às macro economias, ou o mundo social dos relacionamentos interpessoais aos internacionais. Em outras palavras, mesmo sem qualquer tipo de linguagem formal, é útil apenas sermos capazes de pensar em termos de um mundo multidimensional e com múltiplos níveis, independente de sua posição na vida. O termo OLAP (On-line Analytical Processing), hoje muito difundido, traduzido para Processamento Analítico On-line, representa essa característica de se trabalhar os dados, como operadores dimensionais, possibilitando uma forma múltipla e combinada de análise. (THOMSEN, 2002, p.5). A importância da boa informação pode ser considerada como a diferença em valor entre decisões certas e decisões erradas, onde as decisões são tomadas baseadas nessa informação. Assim, OLAP, como qualquer outra forma de processamento de informação, precisa oferecer informações existentes, oportunas, precisas e inteligíveis. (THOMSEN, 2002, p. 8).

“As ferramentas OLAP são as aplicações às quais os usuários finais têm acesso

para extrair os dados de suas bases e construir os relatórios capazes de responder às suas

questões gerenciais.” (MACHADO, 2008, p. 86).

Em base dessa definição, abaixo apresentaremos algumas operações definidas

como básicas do OLAP segundo (MACHADO, 2008, p. 86).

Page 44: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

44

2.6.3.1 Drill-Down

Segundo Machado (2008, p. 87), “o Drill Down ocorre quando o usuário aumenta

o nível de detalhe da informação, diminuindo o nível de granularidade”, conforme

exemplificado na figura 10.

“Drill-Down aumenta o nível de detalhe, ir para o menor grão”. (MACHADO,

2008, p.88).

Figura 10 - Drill Down. Fonte: MACHADO, 2008, p. 88.

2.6.3.2 Roll-Up

Segundo Machado (2008, p. 87), o Roll Up é a operação inversa ao Drill Down,

“ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de

detalhamento da informação”, conforme exemplificado na figura 11.

“Roll-Up diminui o nível de detalhe, subir para o maior grão”. (MACHADO,

2008, p. 88).

Page 45: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

45

Figura 11 - Roll Up. Fonte: MACHADO, 2008, p. 87.

2.6.3.3 Drill Across

“Ocorre quando o usuário pula um nível intermediário dentro de uma mesma

dimensão”. (MACHADO, 2008, p. 89).

Conforme exemplificado por MACHADO (2008, p. 89) na figura 12, tem-se uma

dimensão tempo composta por ano, semestre, trimestre, mês e dia, o Drill Across acontece

quando o usuário vai direto de ano para semestre ou mês.

Page 46: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

46

Figura 12 - Drill Across. Fonte: MACHADO, 2008, p. 89.

2.6.3.4 Drill Throught

“Ocorre quando o usuário passa de uma informação contida em uma dimensão para uma

outra”. (MACHADO, 2008, p. 90).

2.6.3.5 Slice and Dice

Para Machado (2008, p. 90) “São operações para realizar navegação por meio dos

dados na visualização de um cubo”.

Quanto ao seu significado, Machado (2008, p. 90) expõe, “Slice and dice significa

em uma forma simplista a redução do escopo dos dados em análise, além de mudar a ordem

das dimensões, mudando dessa forma a orientação segundo a qual os dados são visualizados”,

conforme exemplificado na figura 13.

Page 47: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

47

Figura 13 - Slice and Dice. Fonte: MACHADO, 2008, p. 91.

2.6.3.6 Pivot

“É o ângulo pelo qual os dados são vistos ou trocados. Na prática, corresponde à

modificação na posição das dimensões em um gráfico ou troca de linhas por colunas em uma

tabela. Uma característica de planilhas eletrônicas”. (Machado 2008, p. 93).

Page 48: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

48

2.6.4 Análises Exploratórias de Dados (AED)

Segundo Morales (2009, p. 9) a análise exploratória de dados ou a mineração de

dados possibilita a descoberta de informações implícitas (que não estavam disponíveis de

forma clara) e que também podem ser úteis para as organizações.

Ou seja, tornar clara as informações para uso de forma estratégica para

organizações.

AED consiste em resumir e organizar os dados coletados por meio de tabelas,

gráficos ou medidas numéricas, e a partir desses dados resumidos, interpreta-os.

Para Carvalho (2001, p. 7), mineração de dados consiste mais especificamente em descobrir relações entre produtos, classificar consumidores, prever vendas, localizar áreas geográficas potencialmente lucrativas para novas filiais, inferir necessidades, entre outras.

2.6.5 Mineração de Dados e suas Técnicas

“A expressão, Mineração de Dados, mais popular, é, na realidade, uma das etapas

da Descoberta de Conhecimento em Bases de Dados.” (GOLDSCHIMIDT; PASSOS, 2005,

p. 2).

Para Thomsen (2002, p. 237) com a visualização apropriada e consistente dos

dados se descobre padrões e melhores práticas que ao encontro dos objetivos das

organizações auxiliam em tomadas de decisões assertivas.

Carvalho (2001, p. 7) trata o Data Warehouse como a memória da empresa e o

Data Mining como a Inteligência da empresa.

Para criar relações um-para-um em uma grande empresa, o proprietário humano precisa ser substituído por uma máquina capaz de tratar grandes números, o computador. A memória do proprietário é substituída por um grande banco de dados denominado data warehouse, enquanto a capacidade de aprendizado é substituída por técnicas de Inteligência Artificial e Estatísticas genericamente denominadas de Datamining (Mineração de Dados). (CARVALHO, 2001, p. 6). Datamining é o uso de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de

Page 49: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

49

dados, não seriam facilmente descobertos a olho nu pelo ser humano (CARVALHO, 2001, p. 6).

Carvalho (2001, p. 7) ainda expõe algumas justificativas de porque as técnicas de

data mining passaram a ser usadas como exploração de dados:

� “O volume de dados disponível é enorme atualmente. Datamining é uma técnica que

só se aplica a grandes massas de dados, pois necessita disto para calibrar seus

algoritmos e extrair dos dados conclusões confiáveis.” (CARVALHO, 2001, p. 7).

� “Os dados estão sendo organizados: [...] Data warehousing, os dados de várias fontes

estão sendo organizados e padronizados [...]”. (CARVALHO, 2001, p. 7).

� “Os recursos computacionais são potentes: o datamining necessita de muitos recursos

computacionais para operar seus algoritmos sobre grande quantidade de dados.”

(CARVALHO, 2001, p. 7).

� “A competição empresarial exige técnicas mais modernas de decisão: [...] empresas

buscam adquirir dados para analisar melhor seus caminhos futuros por meio dos

sistemas de apoio a decisão.” (CARVALHO, 2001, p. 7).

� “Programas comerciais de datamining já podem ser adquiridos: [...] técnicas de

datamining são antigas conhecidas da Inteligência Artificial, [...] já saíram dos

laboratórios para as empresas.” (CARVALHO, 2001, p.7).

Conforme a afirmação de Carvalho (2001, p. 27), “Tanto nos data warehouse

empresarias, quanto em pequenos bancos de dados pessoais, os dados a serem utilizados no

datamining precisam ser preparados”.

Para esta preparação, Carvalho (2001, p. 27) expõe ainda algumas tarefas a serem

realizadas:

� Tarefa 1 - Seleção dos dados:

Nem todo o data warehouse precisa ser vasculhado pelas ferramentas do datamining. Em muitas situações, o fenômeno estudado está registrado apenas em uma parte da grande massa de dados existente, enquanto em outros casos nem todos os campos de informação de cada registro precisam ser considerados. Tanto a limitação da massa de dados a ser explorada quanto a redução do número de variáveis consideradas na análise são fatores importantes, pois tornam o processo de mineração de dados mais eficiente e eficaz. Estes dois processos são realizados com base no sentimento do analista ou em técnicas estatísticas. (CARVALHO, 2001, p. 27).

� Tarefa 2 - Complementação dos dados:

Page 50: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

50

Em qualquer massa de dados, é extremamente comum a existência de elementos ausentes por falha de digitação, erros de preenchimento de formulários, ou mesmo porque os registros pertencem a empresas ou épocas diferentes nas quais aquele dado em específico não era questionado ou considerado importante. No entanto, para a utilização de certas ferramentas do datamining, precisamos de registros com todos os dados (variáveis do problema) devidamente valorados, não se admitindo campos em branco. Para complementarmos os dados, podemos simplesmente assumir que um valor padrão, definido a priori, será considerado para fins de análise de ferramenta de datamining. (CARVALHO, 2001, p. 27,28).

� Tarefa 3 - Eliminação de registros :

Finalmente, a etapa de preparação dos dados pode ainda contar com processos de eliminação de registros cujos dados pareçam “errados” ou “não representativos” do fenômeno em questão, além da eliminação de “ruído” que de alguma forma tenha sido adicionado ao dado. Estes processos são realizados por técnicas específicas de Estatística ou Inteligência Artificial, de novo, em um datamining prévio ao datamining final e desejado. (CARVALHO, 2001, p. 28).

Após as etapas de preparação, Carvalho (2001, p. 30) estabelece os protocolos de

implantação:

� Definição do problema:

“Se há pouco conhecimento, faz-se a descoberta não supervisionada; Se há

suspeita de alguma relação interessante, faz-se a testagem de hipótese; Se há muito

conhecimento, faz-se a modelagem matemática da relação”. (CARVALHO, 2001, p. 30).

� Descoberta das relações novas:

Em função do problema definido, escolhem-se a técnica (classificação, estimativa, previsão, etc.) e a ferramenta (rede neurais artificiais, algoritmos genéticos, etc.) capaz de executá-la; Faz-se a preparação dos dados (Seleção, complementação, etc.) de acordo com a ferramenta a ser usada; Aplica-se a ferramenta, gerando “novas” relações. (CARVALHO, 2001, p. 30).

� Análise das novas relações:

“Uma equipe de especialistas analisa e escolhe as relações viáveis e promissoras”.

(CARVALHO, 2001, p. 30).

� Aplicação das novas relações:

“As novas relações são aplicadas (ou explicadas) em caráter experimental.”

(CARVALHO, 2001, p. 30).

� Avaliação dos resultados:

Page 51: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

51

“Os resultados da aplicação (ou explicação) da relação nova são contrapostos aos

objetivos iniciais. Eventualmente, retorna-se para a redefinição do problema.” (CARVALHO,

2001, p. 30).

Quanto às técnicas abordadas por Babieri, (2001) citamos:

� Árvore de Decisão:

“A árvore de decisão é uma técnica que, a partir de uma massa de dados, cria e

organiza regras de classificação e decisão em formato de diagrama de árvores, que irão

classificar suas observações ou predizer resultados futuros.” (BARBIERI, 2001, p. 190).

� Análise de Conglomerados:

O objetivo da Análise de Conglomerados é identificar a existência de diferentes grupos dentre de um conjunto de dados e, constatada esta existência, agrupar os elementos estudados de acordo com as semelhanças entre si, considerando-se as características analisadas. (BARBIERI, 2001, p. 196).

� Redes Neurais:

“Essa não é exatamente uma técnica estatística, mas sim um recurso

matemático/computacional que pode ser usado na aplicação destas.” (BARBIERI, 2001, p.

189).

As Redes Neurais são uma tecnologia cada vez mais usada em Data Mining. Sua grande vantagem está basicamente em sua habilidade de aprendizagem a partir das experiências, não ficando restritas a uma ordem seqüencial pré-fixada. Elas consistem em algoritmos e procedimentos computacionais que imitam a capacidade de aprendizagem do cérebro. (BARBIERI, 2001, p. 199).

� Análise de Regressão:

A Análise de Regressão processa as informações de uma base e dados de maneira a determinar um modelo (uma equação) que representa o relacionamento existente entre as variáveis em estudo. Os principais objetivos da análise de regressão são: sumarização dos dados, predição, controle e estimação. Uma só análise pode atender a mais de um objetivo ao mesmo tempo. (BARBIERI, 2001, p. 204).

� Séries Temporais:

Page 52: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

52

Séries Temporais é uma técnica estatística utilizada principalmente no cálculo de previsão de um conjunto de observação, dados seus valores ao longo do tempo. O que faz esta técnica tão especial é a possibilidade de considerar, na analise, a sazonalidade ou ciclos intrínsecos ao processo, utilizando-os na predicação de valores futuros de série em questão ou na investigação de seu mecanismo gerador. (BARBIERI, 2001, p. 208).

2.7 CONSIDERAÇÕES FINAIS DO CAPÍTULO

O próximo capítulo tratará da elaboração de uma proposta de solução para o

problema apresentado no item “1.1 Problema”, que atende ao objetivo geral deste trabalho

descrito no item “1.2.1 Objetivo Geral”, aos objetivos específicos definidos no item “1.2.2

Objetivos Específicos” e que siga as idéias dos autores da área sobre cada assunto estudado na

revisão bibliográfica apresentada neste capítulo.

Page 53: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

53

3 MÉTODO

3.1 CARACTERIZAÇÃO DO TIPO DE PESQUISA

Do ponto de vista da sua natureza, de acordo com Silva (2005, p. 20), este

trabalho é considerado uma pesquisa aplicada, pois visa gerar conhecimentos para aplicação

de uma arquitetura de Business Intelligence voltada para a solução de um problema

específico.

Em relação à forma de abordagem do problema, segundo Silva (2005, p. 20), este

trabalho se classifica como uma pesquisa quantitativa, pois busca a análise de dados

disponibilizados pelo INEP relativos ao ENEM do ano de 2008, utilizando técnicas

estatísticas de forma a traduzi-los em números e informações, com a finalidade de identificar

tendências para fundamentar as tomadas de decisões.

Quanto aos seus objetivos, segundo Silva (2005, p. 21), classifica-se como uma

pesquisa exploratória, pois visa através de análises dos dados do ENEM tornar explícito o

perfil socioeconômico dos candidatos deste exame.

Como exposto por Silva (2005, p. 21), do ponto de vista dos procedimentos

técnicos, este trabalho pode ser considerado como uma pesquisa bibliográfica, pois utiliza

conceitos e definições dos principais autores da área como forma de embasamento teórico,

bem como um estudo de caso, já que busca definir o perfil socioeconômico dos candidatos ao

ENEM 2008 por meio de análises profundas dos dados disponibilizados.

3.2 ETAPAS METODOLÓGICAS

Este trabalho divide-se nas seguintes etapas:

Page 54: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

54

a) Definição do tema, levantamento do problema, definição dos objetivos e elaboração

da justificativa, consolidando o conteúdo do capítulo 1;

b) Elaboração do capítulo 2, no qual é realizada a pesquisa bibliográfica que

conceitualiza os assuntos que fomentam este trabalho a partir dos principais autores do

ramo.

c) Caracterização da pesquisa, definição de etapas e arquitetura para solução proposta ao

problema encontrado, levantamento de recursos e delimitações e construção do

cronograma para realização das atividades, que constituem o capítulo 3;

d) Composição do capítulo 4, que consiste na implementação da arquitetura proposta

para solução do problema e que envolve as atividades como:

� Modelar e criar uma base dimensional definindo as dimensões e a granularidade

dos dados.

� Criação e execução de scripts para a transformação dos dados contidos em

arquivos no formato texto e carga dos mesmos para a base dimensional, utilizando

a ferramenta de ETL Kettle.

� Análise dos dados através do aplicativo Microsoft Excel. Consiste no cruzamento

dos dados e geração de gráficos buscando identificar padrões pertinentes ao foco

do trabalho.

e) Elaboração do capítulo 5, que consiste na explanação dos resultados obtidos através da

análise dos dados.

3.3 ARQUITETURA DA SOLUÇÃO

De acordo com a pesquisa realizada pode-se observar que existem várias

arquiteturas que poderiam atender ao problema encontrado, desta forma, para elaboração

deste trabalho foi elaborada uma arquitetura alternativa, conforme mostrado na figura 14.

Page 55: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

55

Figura 14 – Arquitetura BI – Solução Proposta Fonte: Os autores.

Abaixo, segue a descrição dos componentes utilizados na arquitetura proposta:

Fonte de dados: conjunto de dados operacionais do ENEM 2008 contidos em

arquivos no formato texto, os quais foram disponibilizados pelo INEP;

ETL (Extração, Carga e Transformação dos dados): camada na qual foi

realizada a execução de scripts para a transformação dos dados contidos em arquivos no

formato texto e carga dos mesmos para a base dimensional, utilizando a ferramenta de ETL

Kettle;

Repositório de dados (Data Warehouse): base de dados dimensional, na qual

foram carregados os dados após a realização do processo ETL;

Front-end (análise dos dados): nesta camada foi utilizado o aplicativo Microsoft

Excel para análise dos dados carregados no Data Warehouse.

3.4 DELIMITAÇÕES

Este trabalho foi elaborado em base da arquitetura BI proposta no item “3.3 –

ARQUITETURA DA SOLUÇÃO”.

A fonte de dados utilizada foi a base de dados do ENEM disposta pelo INEP,

referente ao exame do ano de 2008, apesar de haver bases referentes a outros anos.

Page 56: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

56

3.5 CONSIDERAÇÕES FINAIS DO CAPÍTULO

O próximo capítulo contempla a implementação da estrutura proposta e

apresentada no item "3.3 Arquitetura da Solução", para a qual foram executadas as atividades

previstas na etapa 4 do item "3.2 Etapas Metodológicas".

Page 57: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

57

4 AMBIENTE DE BI PARA ANÁLISES DOS DADOS DO ENEM

O foco deste trabalho se deu em âmbito de pesquisa, priorizando o

desenvolvimento para busca dos dados com o objetivo da construção das análises referentes

ao tema escolhido.

Os dados capturados para embasamento das análises foram encontrados no sítio

do INEP (http://www.inep.gov.br). Além do arquivo no formato texto contendo os dados,

também estava disponível o dicionário de dados. Visto que o formato do arquivo dificultava a

manipulação dos dados, foi necessário realizar a migração dos mesmos para uma grande

tabela em uma base de dados operacional, que no caso deste trabalho utilizou-se o

PostgreSQL. A extração dos dados do arquivo texto, a transformação dos mesmos e a carga

na base de dados foram realizadas com a utilização do aplicativo Kettle.

Foram encontradas algumas dificuldades no momento da migração dos dados,

pois alguns campos do arquivo texto não condiziam com a descrição encontrada no dicionário

de dados, principalmente em relação ao tipo de dado e à formatação alfanumérica dos

campos, os quais não eram preenchidos de forma padronizada.

Posterior a carga dos dados na base de dados, os mesmos foram analisados,

através das respostas obtidas de script`s SQL, comparando o percentual gerado de cada

resposta de forma crítica ao seu retorno e o foco do tema abordado. Esta pré-analise visou

delimitar as questões a serem utilizadas, para que o produto da análise final pudesse mostrar

resultados mais relevantes em relação ao problema levantado.

Com os dados filtrados, padronizados e organizados foi construído então,

conforme figura 15, o modelo dimensional do tipo estrela com as tabelas fato e dimensões.

As variáveis do modelo foram agrupadas por assuntos interligados através de

aspectos semelhantes referentes ao questionário preenchido pelos inscritos do ENEM.

a) Dimensão Avaliação Professores: Filtrados os dados referentes às avaliações por

parte do candidato aos professores que tiveram no ensino médio. São elas:

• Questão 90 - Avaliação da escola em que fez o ensino médio quanto ao

conhecimento que os(as) professores(as) têm das matérias e a maneira de

transmiti-lo;

Page 58: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

58

• Questão 91 - Avaliação da escola em que fez o ensino médio quanto à

dedicação dos(as) professores(as) para preparar aulas e atender aos alunos;

• Questão 116 – Os(as) professores(as) têm autoridade, firmeza?

• Questão 118 – Os(as) professores(as) têm respeito?

• Questão 120 - Os(as) professores(as) são preocupados(as) e dedicados(as)?

• Questão 122 – Os(as) professores(as) valorizam a identidade étnica dos(as)

alunos(as)?

b) Dimensão Emprego: Dados referentes ao mercado de trabalho e empregabilidade em

paralelo ao estudo. São eles:

• Questão 43 - Trabalhou ou teve alguma atividade remunerada durante o ensino

médio (2º grau)?

• Questão 50 - Qual a sua posição neste trabalho?

• Questão 52 - Os conhecimentos no ensino médio foram adequados ao que o

mercado de trabalho solicita?

• Questão 56 - Avaliação de ter estudado e trabalhado, simultaneamente, durante

o ensino médio;

• Questão 115 - De acordo com os ensinamentos no ensino médio, como

considera o preparo para conseguir um emprego, exercer alguma atividade?

c) Dimensão Escola: Filtrados os dados considerados relevantes as escolas freqüentadas

pelos candidatos ao ENEM 2008. São eles:

• Questão 76 - Em que turno cursou ou esta cursando o ensino médio?

• Questão 77 - Em que escola cursou ou está cursando o ensino médio (2º grau)?

• Questão 78 - Em que modalidade de ensino concluiu ou vai concluir o ensino

médio (2º grau)?

• Questão 92 - Avaliação da escola em que fez o ensino médio quanto às

iniciativas da escola para realizar excursões, estudos do meio ambiente;

• Questão 93 - Avaliação da escola em que fez o ensino médio quanto à

biblioteca;

Page 59: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

59

• Questão 94 - Avaliação da escola em que fez o ensino médio quanto às

condições das salas de aula;

• Questão 95 - Avaliação da escola em que fez o ensino médio quanto às

condições dos laboratórios;

• Questão 96 - Avaliação da escola em que fez o ensino médio quanto ao acesso

a computadores e outros recursos de informática;

• Questão 97 - Avaliação da escola em que fez o ensino médio quanto ao ensino

de língua estrangeira;

• Questão 104 - Avaliação da escola em que fez o ensino médio quanto à

localização;

• Questão 105 - Avaliação da escola em que fez o ensino médio quanto à

segurança (iluminação, policiamento, etc.);

• Questão 107 - A escola em que estuda ou estudou realiza palestras / debates?

• Questão 108 - A escola em que estuda ou estudou realiza jogos / esportes /

campeonatos?

• Questão 109 - A escola em que estuda ou estudou realiza teatro?

• Questão 110 - A escola em que estuda ou estudou realiza coral?

• Questão 111 - A escola em que estuda ou estudou realiza dança / música?

• Questão 112 - A escola em que estuda ou estudou realiza estudos do meio

ambiente / passeios?

• Questão 113 - A escola em que estuda ou estudou realiza feira de ciências /

feira cultural?

• Questão 114 - A escola em que estuda ou estudou realiza festas / gincanas?

• Questão 127 - Avaliação sobre a escola quanto à discussão dos problemas da

atualidade nas aulas;

• Questão 136 - Nota para a formação que obteve no ensino médio;

• Questão 189 - É a mais importante contribuição que obteve ao realizar o ensino

médio (2º grau).

d) Dimensão Família: Filtrados os dados considerados relevantes das famílias dos

candidatos ao ENEM 2008. São eles:

• Questão 17 - Até quando seu pai estudou?

Page 60: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

60

• Questão 18 - Até quando sua mãe estudou?

• Questão 23 - Renda familiar (somando a do respondente e com a das pessoas

que moram com ele).

e) Dimensão Inscrito: Foram filtrados os dados mais relevantes, relacionados à

identificação do inscrito para o exame. Sendo eles:

• Número da inscrição;

• Data de nascimento;

• Sexo;

• Nome do Município da cidade de prova;

• Dependência administrativa;

• Localização/Zona da Escola;

• Nota da prova Objetiva;

• Nota da Redação;

• Questão 7 - Mora sozinho;

• Questão15- Quantidade de pessoas que moram em sua casa.

f) Dimensão Interesses: Filtrados os dados considerados relevantes aos interesses/

motivos expressados pelos candidatos ao ENEM 2008. São eles:

• Questão 40 - Motivo para fazer o Enem;

• Questão 85 - Com que freqüência lê jornais?

• Questão 86 - Com que freqüência lê revistas de informação geral (Veja, Isto é,

Época, etc.)?

• Questão 88 - Com que freqüência lê revistas de divulgação científica (Ciência

Hoje, Galileu, etc.)?

• Questão 89 - Com que freqüência lê romances, livros de ficção?

• Questão 175 - O quanto você se interessa pela política nacional, o papel dos(as)

deputados(as) e senadores(as), o Presidente da República, etc.?

• Questão 176 - O quanto você se interessa pela política dos outros países?

• Questão 177 - O quanto você se interessa pela economia nacional, a questão da

inflação?

Page 61: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

61

• Questão 178 - O quanto você se interessa a política da sua cidade, o prefeito, os

vereadores?

• Questão 192 - A principal decisão que vai tomar quando concluir o ensino

médio (2º grau);

• Questão 193 - Em médio prazo, daqui a uns 4 ou 5 anos já planejou o que

gostaria que acontecesse?

g) Dimensão Outros Cursos: Filtrados os dados considerados relevantes aos cursos

extracurriculares e profissionalizantes que são ou não cursados pelos candidatos ao

ENEM 2008. São eles:

• Questão 79 - Fez curso de língua estrangeira fora da escola durante o ensino

médio (2º grau)?

• Questão 80 - Fez curso de computação ou informática fora da escola durante o

ensino médio (2º grau)?

• Questão 81 - Fez curso preparatório para o vestibular (cursinho) fora da escola

durante o ensino médio (2º grau)?

h) Dimensão Profissão: Dados referentes ao que influenciou na escolha ou identificação

de profissão. São eles:

• Questão 194 - Que profissão escolheu seguir?

• Questão 195 - Meus pais ajudaram a tomar minha decisão sobre minha

profissão;

• Questão 196 - A escola ajudou a tomar minha decisão sobre minha profissão;

• Questão 199 - Meu trabalho ajudou a tomar minha decisão sobre minha

profissão;

• Questão 200 - Estímulo financeiro ajudou a tomar minha decisão sobre minha

profissão;

• Questão 201- Facilidade de obter emprego ajudou a tomar minha decisão sobre

minha profissão;

• Questão 202 - Minha identificação com a profissão me ajudou a tomar minha

decisão sobre minha profissão.

Page 62: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

62

i) Dimensão Recursos: Foram filtrados os dados referentes aos principais recursos que

os candidatos ao Enem possuem disponibilidade. Sendo eles:

• Questão 24 - Tem Televisão e quantas?

• Questão 27 - Tem microcomputador e quantos?

• Questão 28 - Tem automóvel e quantos?

• Questão 33 - Tem acesso a internet e quantos?

• Questão 35 - Tem casa própria?

j) Tabela Fato: É a tabela central que une os dados contidos nas dimensões, é dela que retiramos os dados necessários para as análises.

Page 63: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

63

Figura 15 – Modelo Dimensional. Fonte: Os autores, 2010.

O modelo dimensional, do tipo estrela, foi elaborado utilizando a ferramenta

DBDesigner, através da qual foram gerados os script`s SQL para a criação da base de dados

Page 64: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

64

dimensional, o Data Warehouse, o qual também foi construído baseado no banco de dados

PostgreSQL. As próximas etapas foram a extração dos dados da base operacional, a

transformação dos mesmos e a carga destes na base dimensional, para as quais utilizamos

novamente o aplicativo Kettle.

Depois de concluído o DW, a ferramenta front-end utilizada foi o software

Microsoft Excel. Por meio dele, foram montadas tabelas dinâmicas e a partir destas, com a

utilização de fórmulas e gráficos dispostos pela ferramenta, partiu-se para a elaboração das

respostas e comparações pertinentes, bem como o caminho a ser percorrido para as

adequações futuras.

4.1 PROPOSTA DE SOLUÇÃO

A figura 16 apresenta a proposta de solução elaborada para atender os objetivos

do trabalho.

Figura 16 – Arquitetura da Proposta de Solução. Fonte: Os autores, 2010.

Fonte de Dados - Os dados que a compõem foram disponibilizados pelo INEP em

formato de arquivo texto e trazem informações sobre os inscritos que realizaram a prova do

ENEM do ano de 2008, bem como um vasto questionário socioeconômico com avaliação do

ensino médio, questões pessoais e profissionais. É desta fonte que os dados foram extraídos,

transformados e carregados para o Data Warehouse.

ETL - Extração dos dados da fonte de dados realizada com o auxílio do aplicativo

Kettle. Nesta etapa foi realizado um segundo filtro, através do qual se determinou os dados

considerados relevantes de acordo com o intuito deste trabalho. Estes dados foram

Page 65: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

65

transformados para um único formato seguindo os padrões do banco de dados Postgres 8.3, o

qual foi utilizado para montagem do DW. O último passo foi a carga dos dados no DW,

possibilitando então o início das análises das informações.

Data Warehouse – Repositório de dados baseado em assuntos, integrado e não

volátil. Foi construído de acordo com a modelagem dimensional apresentada na figura 15 e

utilizado para a análise de dados e como sistema de apoio à decisão. Através da linguagem

SQL, foi possível realizar o cruzamento de tabelas e dados, com o propósito de visualizar os

dados confrontados em novas tabelas que foram analisadas exploratoriamente.

Análise dos Dados – A análise exploratória dos dados armazenados no DW foi

utilizada para esclarecimento de dúvidas e dogmas em torno do perfil socioeconômico dos

candidatos ao ENEM 2008. Utilizando o Excel, montaram-se os gráficos para visualizar as

informações.

4.2 TECNOLOGIAS UTILIZADAS

O Microsoft Visio, o Microsoft Excel e o Microsoft Word fazem parte do pacote

Microsoft Office®. Dos três, o Microsoft Excel foi o que mereceu o maior destaque, pois foi

utilizado como a ferramenta front-end da solução, possibilitando por meio de seus recursos a

análise dos dados do DW. O site do INEP serviu como base de busca onde se adquiriu as

informações e dados necessários para o desenvolvimento do Data Warehouse. Os dados

recolhidos na Internet foram transformados, ou seja, filtrados e padronizados através do Kettle

para a criação da fonte de dados, e em seguida filtrados novamente para popular o Data

Warehouse. Com o DW construído no PostgreSQL, foi utilizada a linguagem SQL

(Structured Query Language) para realizar as relações e consultas, e com base nestas

consultas, tornar possível a análise dos dados.

O quadro 2 mostra as tecnologias utilizadas durante o trabalho e suas respectivas

funções.

Page 66: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

66

Ferramentas Uso

Microsoft

Visio Modelagem das arquiteturas.

Microsoft Excel Análise dos Dados.

INEP - Instituto Nacional de Estudos e Pesquisas

Origem dos dados.

Banco de Dados

PostgreSQL Repositórios de dados (fonte de dados e DW).

Structured

Query Language

Linguagem de consulta estruturada, usada para extrair as informações e fazer o relacionamento das tabelas.

Kettle - pentaho

data integration Extração, transformação e carga dos dados.

DB Designer Modelagem XML e geração do script de criação no banco de dados em SQL do Modelo Estrela.

JEdit Ferramenta utilizada para edição dos script’s SQL.

Windows XP Plataforma utilizada em todas as partes do trabalho.

Windows Vista Ultimate

Plataforma utilizada em todas as partes do trabalho.

Quadro 2 – Tecnologias Utilizadas. Fonte: Os autores, 2010.

Page 67: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

67

4.3 ANÁLISES

Após a construção do DW e o carregamento dos dados no mesmo, iniciaram-se as

análises pertinentes ao foco do trabalho. Para facilitar a visualização e manipulação dos dados

foram utilizadas as ferramentas de tabela e gráfico dinâmicos do Microsoft Excel.

Para melhor organização do trabalho, as análises foram divididas nos seguintes

focos: Avaliação do Ensino Médio, Família e Recursos, Interesses e Profissão e Desempenho

no ENEM.

Inicialmente, antes de dar continuidade nas análises divididas em seus respectivos

focos, mostraremos, através do gráfico 1, a distribuição dos inscritos ao exame pelos dez

maiores municípios do estado de Santa Catarina. No gráfico 2, a distribuição por sexo e no

gráfico 3, a distribuição por dependência administrativa.

Gráfico 1 – Total de inscritos no ENEM nos dez maiores municípios de Santa Catarina. Fonte: Os autores, 2010.

No gráfico abaixo, podemos verificar a distribuição dos inscritos por sexo,

relacionando se moram sozinhos ou não, no qual “F” indica feminino, “M” masculino, “A”

que moram sozinhos e “B” que não moram sozinhos.

Page 68: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

68

Gráfico 2 – Qual sexo? Moram sozinhos? Fonte: Os autores, 2010.

O gráfico 3 mostra o tipo de escola, pública ou particular, na qual os inscritos

cursam ou cursaram o Ensino Médio, considerando que em alguns casos poderiam cursar

parte em escola pública e parte em escola particular. Podemos observar que a maioria

(82,26%) cursam ou cursaram totalmente em escola pública e apenas 13,16% somente em

escola particular. Cerca de 1,69% e 2,83% dos inscritos informaram que cursam ou cursaram

respectivamente a maior parte em escola particular e maior parte em escola pública. A

resposta “E” representa o número de inscritos que cursaram somente em escola indígena.

Gráfico 3 - Em que tipo de escola cursa ou cursou o Ensino Médio? Fonte: Os autores, 2010.

Page 69: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

69

4.3.1 Avaliação do Ensino Médio

Os gráficos apresentados neste tópico foram obtidos através do cruzamento de

informações relacionadas às dimensões Escola e Emprego e têm o intuito de mostrar a visão

dos inscritos em relação à escola que estudaram no Ensino Médio e aos professores, alguns

dos recursos disponíveis na escola, questões relacionadas com o estudo e o trabalho e por fim,

a avaliação dos inscritos referente à formação no Ensino Médio.

No gráfico 4, é apresentado o cruzamento da avaliação dos inscritos em relação à

estrutura da escola do Ensino Médio. Os itens avaliados são, respectivamente, biblioteca,

condições das salas de aula e condições dos laboratórios, em que “A” indica insuficiente a

regular e “C” bom a excelente.

Gráfico 4 – Avaliação da estrutura da escola no Ensino Médio (Biblioteca, Salas de Aula e laboratórios). Fonte: Os autores, 2010.

Page 70: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

70

Podemos observar que a maioria do inscritos (46,53%), quase a metade, avaliou

os três itens como insuficientes a regular. Cerca de 30,71% dos inscritos consideraram os três

itens como bom a excelente.

Gráfico 5 – Avaliação do Ensino Médio quanto Língua Estrangeira e Acesso a Computadores/Recursos de Informática. Fonte: Os autores, 2010.

Os números apresentados no gráfico 5 representam a avaliação da escola do

Ensino Médio quanto ao acesso a computadores e outros recursos de informática e ao ensino

de línguas estrangeiras. As medidas de avaliação utilizadas são: “A” para insuficiente a

regular, “B” para regular a bom e “C” para bom a excelente. Analisando estes números

podemos perceber que há uma grande deficiência em relação ao acesso a computadores e

recursos de informática, pois a maioria dos inscritos indicou como insuficiente a regular

(24,95%). Já o ensino de línguas estrangeiras, essa mesma maioria considerou como regular a

bom.

No gráfico 6, temos uma avaliação dos professores do Ensino Médio, no qual

foram considerados o conhecimento dos mesmos e a maneira como o transmitem para os

alunos e a dedicação para preparação das aulas e atendimento aos alunos. As medidas

utilizadas nestes itens são as mesmas aplicadas na avaliação do gráfico 4.

Page 71: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

71

Observando os números apresentados, podemos considerar que os professores

estão cumprindo bem suas atividades, pois 45,11% dos inscritos avaliaram os dois itens como

regular a bom e outros 20,07% como bom a excelente.

Gráfico 6 – Conhecimento dos professores e maneira como é transmitido aos alunos. Fonte: Os autores, 2010.

O gráfico 7 também está relacionado com a avaliação dos professores, entretanto,

neste instante os pontos avaliados são características de conduta, tais como autoridade e

firmeza, respeito, preocupação e dedicação. Nesse caso, a forma de avaliação é determinada

pela presença ou não destas características, onde “A” indica que sim e “B” indica que não.

Podemos observar que a maioria dos inscritos (61,98%) informou que os

professores possuem as três características em questão. Apenas uma pequena parcela dos

inscritos (2,71%) acha que seus professores não possuem nenhuma das características

avaliadas.

Page 72: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

72

Gráfico 7 – Avaliação de conduta dos professores de Ensino Médio. Fonte: Os autores, 2010.

No gráfico 8, é apresentada a opinião dos inscritos em relação os estudos e o

trabalho, mostrando os que trabalharam durante o Ensino Médio e qual o impacto gerado,

bem como os que apenas estudaram.

Os números mostram que a maioria dos candidatos trabalhou pelo menos um ano

durante os estudos, dos quais 32,04% consideraram a experiência positiva, inclusive

possibilitando crescimento pessoal, outros (19,51%) informaram que mesmo gerando tal

crescimento, trabalhar em paralelo aos estudos atrapalhou seus rendimentos. Cerca de 22,78%

consideraram apenas que o trabalho juntamente com o ensino médio não atrapalhou os seus

estudos e 19,51% não trabalharam durante o Ensino Médio.

Page 73: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

73

Gráfico 8 – Trabalhou durante o Ensino Médio? Qual a avaliação? Fonte: Os autores, 2010.

O gráfico 9 apresenta a opinião dos inscritos referente ao conhecimento adquirido

no Ensino Médio, se é ou não adequado para o mercado de trabalho.

Pode-se observar que a porcentagem maior além de considerar os conhecimentos

adequados ao mercado, também se considera preparado com o Ensino Médio. Outra parcela

considerável de inscritos (18,10%) julga os conhecimentos absorvidos inadequados,

entretanto, se consideram preparados para o mercado de trabalho.

Page 74: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

74

Gráfico 9 – Os conhecimentos são adequados ao mercado? O inscrito se considera preparado com o Ensino Médio? Fonte: Os autores, 2010.

O gráfico 10 mostra a avaliação dos inscritos em relação à formação no ensino

Médio, na qual 83,91% avaliaram com nota igual ou superior a sete.

Gráfico 10 – Nota para a formação no Ensino Médio. Fonte: Os autores, 2010.

Page 75: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

75

4.3.2 Família e Recursos

As análises realizadas neste item são frutos do cruzamento das informações

contidas nas dimensões Família, Recursos e Outros Cursos. O objetivo principal é identificar

o nível do alicerce que os inscritos tiveram para concluir o Ensino Médio.

O gráfico 11 apresenta a renda familiar dos inscritos. Nesta questão é considerada

a soma da renda do inscrito com a das pessoas que moram com ele.

Os números mostram que a maior parcela possui renda de dois a cinco salários

mínimos, que no ano do exame, compreendiam os valores entre R$ 830,00 a R$ 2.075,00.

Ainda é possível notar outras faixas que se destacaram no gráfico 11, como a “B”

(renda entre R$ 415,00 a R$ 830,00), “C” (R$ 830,00 a R$ 2.075,00) e a “D” (de R$ 2.075,00

a R$ 4.150,00).

As faixas “A” e “E” representam, respectivamente, rendas até R$ 415,00 e rendas

de R$ 4.150,00 a R$ 12.450,00.

Gráfico 11 – Renda familiar dos inscritos. Fonte: Os autores, 2010.

O gráfico 12 tem como objetivo apresentar o nível de escolaridade dos pais dos

inscritos. Pode-se observar que a maioria (59,17%) informou que ambos possuem o Ensino

Médio completo. Entre as demais respostas, merecem destaques as parcelas dos 13,24%,

Page 76: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

76

12,78% e 10,26%, as quais indicam respectivamente, pai com ensino superior completo e mãe

com ensino médio completo, ambos com ensino superior completo e pai com ensino médio

completo e mãe com ensino superior completo. Apenas 3,27% dos inscritos informaram que

ambos não estudaram.

Gráfico 12 – Pai e Mãe: não estudou, ensino médio completo ou superior completo. Fonte: Os autores, 2010.

Os números apresentados no gráfico 13 indicam a quantidade de inscritos que

possuem casa própria e automóvel, por meio dos quais é possível notar que ambos os recursos

estão disponíveis para a maioria dos inscritos (56,43%). Dos demais, 22,69% informaram que

possuem apenas casa própria, 10,23% possuem apenas automóvel e os outros 10,64% que não

possuem nenhum dos dois recursos.

Page 77: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

77

Gráfico 13 – Possuem casa própria e automóvel? Fonte: Os autores, 2010.

O gráfico 14 relaciona outros três recursos que julgamos necessários para a boa

formação de um indivíduo nos dias de hoje: computador, acesso à Internet e televisão.

Gráfico 14 – Possuem computador, acesso à Internet e TV? Fonte: Os autores, 2010.

Page 78: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

78

A maioria (44,17%) não possui computador e acesso à Internet, somente televisão.

Outra grande parcela dos inscritos (34,30%) informou que possui todos os três recursos e uma

terceira parcela que merece destaque (17,69%), assinalou apenas computador e televisão.

Apenas 1,46% dos inscritos informaram que não possuem nenhum dos três recursos.

As questões que compõem o gráfico 15 estão relacionadas a cursos

extracurriculares freqüentados pelos inscritos, tais como pré-vestibular, língua estrangeira e

computação ou informática. Do total dos inscritos 40,63% indicaram que fizeram somente a

última modalidade, computação ou informática. Entretanto, o número que mais nos chamou a

atenção é dos que não freqüentaram nenhum dos cursos, 35,17% dos inscritos. As parcelas

que totalizam 8,21% e 7,52 indicam, respectivamente, os que freqüentaram os cursos de

língua estrangeira e computação ou informática, e apenas língua estrangeira. Somente 1,70%

informaram ter freqüentado os três cursos.

Gráfico 15 – Participaram de cursos extracurriculares: pré-vestibular, língua estrangeira e computação ou informática. Fonte: Os autores, 2010.

Page 79: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

79

4.3.3 Interesses e Profissão

Os gráficos deste item foram gerados a partir do cruzamento das questões contidas

nas dimensões Interesses e Profissão.

O gráfico 16 apresenta os principais motivos indicados pelo inscritos para estarem

participando do exame. A maioria (63%) indicou que prestará o exame para facilitar o

ingresso na faculdade, ou seja, obter pontos para vestibulares. Do restante, 22% realizarão o

exame para testar seus conhecimentos, 14% para saber se está preparado para o futuro

profissional e 1% informou não saber o motivo.

Gráfico 16 – Motivo para prestar o ENEM. Fonte: Os autores, 2010.

O gráfico 17 apresenta o interesse dos inscritos pela leitura de revistas

informativas (Veja, Isto é, Época, etc.) e de divulgação científica (Ciência Hoje, Galileu, etc.),

a fim de verificar o nível de interesse de se manterem atualizados em relação a assuntos

diversos. Apenas 3,86% informaram que lêem freqüentemente os dois tipos de revistas e

10,46% que não possuem este hábito. A maioria (42,19%) informou que lê ambos os tipos,

porém, somente às vezes e outros 26,96% que lêem, esporadicamente, somente as revistas de

Page 80: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

80

divulgação científica. Através destes números pode-se considerar um baixo interesse às

atualidades por parte dos inscritos.

Gráfico 17 – Freqüência que lê revistas de Informação e revistas científicas. Fonte: Os autores, 2010.

No gráfico 18 temos números que indicam o interesse dos inscritos pela política

municipal e nacional, no qual podemos verificar que a parcela majoritária (64%) se interessa

muito por ambos os níveis. Dos demais, 12% se interessam apenas pela política do município

e 10% informaram que não se interessam por política.

Gráfico 18 – Interesse em política nacional e municipal. Fonte: Os autores, 2010.

Page 81: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

81

No gráfico 19 temos a opinião dos inscritos sobre o que pretendem fazer após

concluir o ensino médio. Observa-se que a maioria (55%) pretende prestar o vestibular e

continuar os estudos no ensino superior e que apenas 3% pretendem procurar emprego logo

após concluir esta fase dos estudos. Ainda temos 14% dos inscritos que também pretendem

prestar o vestibular e continuar a trabalhar. A parcela dos 13% é composta pelo inscritos que

já concluíram o ensino médio.

Gráfico 19 – A principal decisão que alunos pretendem tomar após concluir o Ensino Médio. Fonte: Os autores, 2010.

Na questão que compõe o gráfico 20, os inscritos informaram qual a profissão

pretendem seguir após concluir o ensino médio.

Page 82: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

82

Gráfico 20 – Escolha das Profissões. Fonte: Os autores, 2010.

Nos gráficos 21 e 22 são apresentadas as principais influências na escolha da

profissão dos inscritos. No primeiro estão relacionados como influências, respectivamente, os

pais, a escola e o trabalho, e no segundo o estímulo financeiro, a facilidade de obter emprego

e a identificação com a profissão, sendo que “A” indica que ajudou muito na escolha e “C”

que não ajudou.

No primeiro, podemos verificar que a maioria dos inscritos (38,11%) informou

que não foram influenciados por nenhuma das três alternativas em questão. Entretanto, cerca

de 18,19% informou que os pais e a escola influenciaram na escolha e outros 16,33% que

apenas os pais tiveram influência.

Page 83: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

83

Gráfico 21 – Ajuda na profissão: pais, escola ou trabalho? Fonte: Os autores, 2010.

Já no segundo gráfico, observamos que a maioria dos inscritos (39,86) informou

ter sido influenciada pela identificação com a profissão e que a outra grande parte (37,27%)

foi influenciada pelos três itens.

Gráfico 22 – Estímulo financeiro, facilidade de obter emprego ou identificação com a profissão? Fonte: Os autores, 2010.

Page 84: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

84

4.3.4 Desempenho no ENEM

Neste item tem-se o intuito de apresentar o desempenho dos inscritos no exame, o

qual é dividido em duas partes: a prova objetiva, apresentada no gráfico 23, e a redação, que

pode ser visto no gráfico 24.

Gráfico 23 – Notas da prova objetiva. Fonte: Os autores, 2010.

Gráfico 24 – Notas da Redação. Fonte: Os autores, 2010.

Page 85: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

85

4.4 CONSIDERAÇÕES FINAIS DO CAPÍTULO

Por meio da análise exploratória dos dados, foram construídas representações

gráficas que possibilitaram a melhor visualização das informações armazenadas no DW. Estas

proveram a formação do perfil socioeconômico dos inscritos ao ENEM, tendo como base a

estrutura familiar e recursos disponíveis, as oportunidades e os interesses aliados à obtenção

do conhecimento, a avaliação da formação do ensino médio e a preparação que a mesma

proporcionou para a escolha da profissão e o futuro ingresso no mercado de trabalho, além de

expor o desempenho geral no exame.

Page 86: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

86

5 CONCLUSÕES E TRABALHOS FUTUROS

5.1 CONCLUSÕES

O acesso da população a uma educação de qualidade é um fator primordial ao

desenvolvimento econômico e social. Neste contexto, é que surge a necessidade de avaliar

periodicamente o nível do ensino das escolas, principalmente as públicas, já que estas são as

de maior acesso pela população. Então, por meio da análise do questionário socioeconômico

do ENEM, definimos o perfil dos candidatos, bem como levantamos alguns pontos falhos do

ensino médio do estado de Santa Catarina, os quais serão expostos a seguir.

A maioria dos candidatos mora com os pais, os quais possuem formação completa

no ensino médio e renda compreendida entre 830 e 2075 reais, além de possuírem casa

própria e no mínimo um automóvel. Também foi possível verificar que grande parte dos

inscritos não possui acesso a computadores e internet, utilizando como acesso às informações

a televisão, já que menos de 4% se interessam em ler freqüentemente revistas de informação e

divulgações científicas. Em contrapartida, o interesse na política municipal e nacional se dá

na maioria dos inscritos, cerca de 64%.

Percebe-se que 40,63% dos candidatos obtiveram apenas oportunidade de realizar

curso extracurricular na área de computação e informática, se restringindo a uma pequena

parcela de 1,70% os que tiveram a possibilidade de cursar além deste, cursos pré-vestibular e

línguas estrangeiras.

Foi possível observar que do total dos inscritos, 82,27% cursaram o ensino médio

somente em escola pública e também que praticamente a metade destes avaliou a estrutura da

escola como insuficiente a regular, levando em consideração bibliotecas, salas de aulas e

laboratórios. Considerando o ensino de línguas estrangeiras e o acesso a computadores e

recursos de informática, apenas o primeiro item foi considerado satisfatório. Quanto à

avaliação dos professores do ensino médio, em relação à conduta, o conhecimento e à maneira

como transmiti-lo, foi possível observar um resultado positivo de acordo com a ótica dos

candidatos.

Page 87: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

87

Em relação ao conhecimento adquirido durante o ensino médio, o mesmo foi

considerado adequado, tornando os alunos aptos ao mercado de trabalho. Ainda relacionando

os estudos e o trabalho, notou-se que a maioria dos inscritos trabalhou pelo menos um ano

durante o ensino médio e considerou esta experiência positiva, pois possibilitou o crescimento

pessoal.

Observou-se que uma parcela de 14% dos inscritos informou que o motivo para

realizar o exame teve o intuito de saber se estavam preparados para o futuro profissional,

enquanto 63% realizaram com o objetivo de facilitar o ingresso ao ensino superior, sendo

este, a principal decisão a ser tomada após a conclusão do ensino médio.

Tratando-se da escolha da profissão a ser seguida, a maioria dos candidatos ainda

não definiu a sua opção e entre os que já definiram, as áreas mais apontadas foram as ligadas

as engenharias/ciências tecnológicas e ciências biológicas e de saúde. Na decisão destas

escolhas, grande parte informou que não tiveram influência dos pais, da escola e do trabalho,

no entanto, o maior estímulo deu-se pela identificação com a profissão, seguida pelo estímulo

financeiro e a empregabilidade.

Através das análises supracitadas concluiu-se que, do ponto de vista dos

candidatos, a avaliação geral do ensino médio foi positiva. Inclusive, 83,91% destes,

atribuíram nota acima da média sete para a sua formação. Porém, esta avaliação contradiz a

realidade demonstrada pelo desempenho no exame, pois 95% e 74,77% respectivamente, das

notas da prova objetiva e redação, ficaram abaixo da média sete. Com isso, pode-se concluir

que existem alguns pontos falhos na rede pública de ensino, pois apesar dos alunos

acreditarem encontrar-se preparados, estes em sua maioria não atinge a nota mínima esperada

para aprovação no exame.

5.2 TRABALHOS FUTUROS

Buscando ampliar o escopo da pesquisa, sugere-se incluir uma dimensão tempo,

contendo as várias edições do exame, bem como expandir a dimensão geográfica, de forma a

obter maior granularidade dos dados, realizando a análise de outros estados, regiões até

atingir o âmbito nacional.

Page 88: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

88

Também, através destas análises e de um maior detalhamento do perfil

socioeconômico dos candidatos é possível desenvolver uma pesquisa voltada para o mercado

das universidades, destacando as possibilidades de acesso nesta esfera.

Page 89: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

89

REFERÊNCIAS

BARBIERI, Carlos. BI - Business Intelligence – Modelagem e Tecnologia. 1. ed. Rio de Janeiro: Axcel Books, 2001. CARVALHO, Luís Alfredo Vidal de. Datamining: A mineração de dados no marketing, medicina, economia, engenharia e administração. 1. ed. São Paulo: Érica 2001. CLEMES, Márcio. Data Warehouse como suporte ao sistema de informações gerenciais em uma instituição de ensino superior: estudo de caso na UFC. 2001. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal de Santa Catarina, Florianópolis, 2001. COLAVITO, Daniel S. et al. A informação, o processo decisório e as ferramentas para..este..fim...Disponível..em <http://www.frb.br/ciente/Impressa/ADM/2004.2/ADM_informacao,%20processo....pdf>. Acesso em: 08/04/09. FIALHO, Francisco Antônio Pereira. Gestão do conhecimento e aprendizagem: as estratégias competitivas da sociedade pós-industrial. Florianópolis: Visual Books, 2006. FURLAN, J. D. et al. Sistemas de informação executiva: como integrar os executivos ao sistema informacional das empresas, fornecendo informações úteis e objetivas para suas necessidades estratégicas e operacionais. São Paulo: Makron Books, 1994. GONÇALVES, Márcio Elias. Uma ferramenta de extração de dados para data warehouse baseada em agentes distribuídos. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Santa Catarina, Florianópolis, 2003. INMON, William H. Como construir o data warehouse. 1. ed. Tradução. Rio de Janeiro: Campus, 1997. LASTRES, Helena Maria Martins; FERRAZ, João Carlos. Economia da Informação, do Conhecimento e do Aprendizado. Rio de Janeiro. Disponível em <http://www.uff.br/ppgci/editais/saritalivro.pdf> Acesso em: 17/06/2010. MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de Data Warehouse: uma visão multidimensional. 1.ed. São Paulo: Érica, 2004. MORALES, Aran Bey Tcholakian. Inteligência nos Negócios (Business Intelligence). Florianópolis. Disponível em <http://aran.ispeople.org/sad/Aula_2_Alunos_2009.pdf> Acesso em: 08/04/2009. SANTOS, Antonio Raimundo dos. Metodologia Científica: a construção do conhecimento. Rio de Janeiro: DP&A editora, 2000. SERRA, Laércio. A essência do business intelligence. São Paulo: Berkeley, 2002.

Page 90: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

90

SILVA, Edna Lúcia da. Metodologia da pesquisa e elaboração de dissertação. Florianópolis: UFSC, 2005. SINGH, H. S. Data warehouse. São Paulo: Makron Books, 2001.

THOMSEN, Erik. OLAP : Construindo sistemas de informações multidimensionais. Tradução 2. ed. Rio de Janeiro: Campus, 2002. TURBAN, Efraim et al. Administração de Tecnologia da Informação: Teoria e Prática. Rio de Janeiro: Campus, 2005. TURBAN, Efraim et al. Business Intelligence. 1. ed. Porto Alegre: Bookman, 2009.

Page 91: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

91

APÊNDICE

Page 92: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

92

APÊNDICE A – Script SQL para Criação do DW

O script apresentado a seguir foi utilizado para criação das tabelas fato e dimensões que

formaram o DW.

CREATE TABLE dw_enem_2008.DIM_AVALIACAO_PROFESSORES ( SEQ_ID_DIM_AVALIACAO_PROFESSORES SERIAL NOT NULL, Q90 VARCHAR(4) NULL, Q91 VARCHAR(4) NULL, Q120 VARCHAR(4)NULL, Q116 VARCHAR(4)NULL, Q118 VARCHAR(4)NULL, Q122 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_AVALIACAO_PROFESSORES) ); CREATE TABLE dw_enem_2008.DIM_EMPREGO ( SEQ_ID_DIM_EMPREGO SERIAL NOT NULL, Q43 VARCHAR(4) NULL, Q50 VARCHAR(4) NULL, Q52 VARCHAR(4) NULL, Q56 VARCHAR(4) NULL, Q115 VARCHAR(4)NULL, PRIMARY KEY(SEQ_ID_DIM_EMPREGO) ); CREATE TABLE dw_enem_2008.DIM_ESCOLA ( SEQ_ID_DIM_ESCOLA SERIAL NOT NULL, Q76 VARCHAR(4) NULL, Q77 VARCHAR(4) NULL, Q78 VARCHAR(4) NULL, Q92 VARCHAR(4) NULL, Q93 VARCHAR(4) NULL, Q94 VARCHAR(4) NULL, Q95 VARCHAR(4) NULL, Q96 VARCHAR(4) NULL, Q97 VARCHAR(4) NULL, Q104 VARCHAR(4)NULL, Q105 VARCHAR(4)NULL, Q107 VARCHAR(4)NULL, Q108 VARCHAR(4)NULL, Q109 VARCHAR(4)NULL, Q110 VARCHAR(4) NULL, Q111 VARCHAR(4) NULL, Q112 VARCHAR(4) NULL, Q113 VARCHAR(4) NULL,

Page 93: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

93

Q114 VARCHAR(4) NULL, Q127 VARCHAR(4) NULL, Q136 VARCHAR(4) NULL, Q189 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_ESCOLA) ); CREATE TABLE dw_enem_2008.DIM_FAMILIA ( SEQ_ID_DIM_FAMILIA SERIAL NOT NULL, Q17 VARCHAR(4) NULL, Q18 VARCHAR(4) NULL, Q23 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_FAMILIA) ); CREATE TABLE dw_enem_2008.DIM_INSCRITO ( SEQ_ID_DIM_INSCRITO SERIAL NOT NULL, NU_INSCRICAO VARCHAR(16) NULL, DT_NASCIMENTO VARCHAR(20) NOT NULL, TP_SEXO VARCHAR(1) NULL, NO_MUNICIPIO_ESC VARCHAR(150) NULL, ID_DEPENDENCIA_ADM VARCHAR(1) NULL, ID_LOCALIZACAO VARCHAR(1) NULL, NU_NT_OBJETIVA VARCHAR(9) NULL, NU_NOTA_REDACAO VARCHAR(9) NULL, Q7 VARCHAR(4) NULL, Q15 VARCHAR(4)NULL, PRIMARY KEY(SEQ_ID_DIM_INSCRITO) ); CREATE TABLE dw_enem_2008.DIM_INTERESSES ( SEQ_ID_DIM_INTERESSES SERIAL NOT NULL, Q40 VARCHAR(4) NULL, Q85 VARCHAR(4) NULL, Q86 VARCHAR(4) NULL, Q88 VARCHAR(4) NULL, Q89 VARCHAR(4) NULL, Q175 VARCHAR(4) NULL, Q176 VARCHAR(4) NULL, Q177 VARCHAR(4) NULL, Q178 VARCHAR(4) NULL, Q192 VARCHAR(4) NULL, Q193 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_INTERESSES) ); CREATE TABLE dw_enem_2008.DIM_OUTROS_CURSOS ( SEQ_ID_DIM_OUTROS_CURSOS SERIAL NOT NULL, Q79 VARCHAR(4) NULL, Q80 VARCHAR(4) NULL,

Page 94: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

94

Q81 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_OUTROS_CURSOS) ); CREATE TABLE dw_enem_2008.DIM_PROFISSAO ( SEQ_ID_DIM_PROFISSAO SERIAL NOT NULL, Q194 VARCHAR(4) NULL, Q195 VARCHAR(4) NULL, Q196 VARCHAR(4) NULL, Q199 VARCHAR(4) NULL, Q200 VARCHAR(4) NULL, Q201 VARCHAR(4) NULL, Q202 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_PROFISSAO) ); CREATE TABLE dw_enem_2008.DIM_RECURSOS ( SEQ_ID_DIM_RECURSOS SERIAL NOT NULL, Q24 VARCHAR(4) NULL, Q27 VARCHAR(4) NULL, Q28 VARCHAR(4) NULL, Q33 VARCHAR(4) NULL, Q35 VARCHAR(4) NULL, PRIMARY KEY(SEQ_ID_DIM_RECURSOS) ); CREATE TABLE dw_enem_2008.FATO_ENEM ( SEQ_ID_DIM_RECURSOS SERIAL NOT NULL, SEQ_ID_DIM_OUTROS_CURSOS SERIAL NOT NULL, SEQ_ID_DIM_FAMILIA SERIAL NOT NULL, SEQ_ID_DIM_AVALIACAO_PROFESSORES SERIAL NOT NULL, SEQ_ID_DIM_EMPREGO SERIAL NOT NULL, SEQ_ID_DIM_PROFISSAO SERIAL NOT NULL, SEQ_ID_DIM_INTERESSES SERIAL NOT NULL, SEQ_ID_DIM_ESCOLA SERIAL NOT NULL, SEQ_ID_DIM_INSCRITO SERIAL NOT NULL, FOREIGN KEY(SEQ_ID_DIM_OUTROS_CURSOS) REFERENCES dw_enem_2008.dim_outros_cursos(SEQ_ID_DIM_OUTROS_CURSOS), FOREIGN KEY(SEQ_ID_DIM_FAMILIA) REFERENCES dw_enem_2008.dim_familia(SEQ_ID_DIM_FAMILIA), FOREIGN KEY(SEQ_ID_DIM_AVALIACAO_PROFESSORES) REFERENCES dw_enem_2008.dim_avaliacao_professores(SEQ_ID_DIM_AVALIACAO_PROFESSORES),

Page 95: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

95

FOREIGN KEY(SEQ_ID_DIM_EMPREGO) REFERENCES dw_enem_2008.dim_emprego(SEQ_ID_DIM_EMPREGO), FOREIGN KEY(SEQ_ID_DIM_PROFISSAO) REFERENCES dw_enem_2008.dim_profissao(SEQ_ID_DIM_PROFISSAO), FOREIGN KEY(SEQ_ID_DIM_RECURSOS) REFERENCES dw_enem_2008.dim_recursos(SEQ_ID_DIM_RECURSOS), FOREIGN KEY(SEQ_ID_DIM_INTERESSES) REFERENCES dw_enem_2008.dim_interesses(SEQ_ID_DIM_INTERESSES), FOREIGN KEY(SEQ_ID_DIM_ESCOLA) REFERENCES dw_enem_2008.dim_escola(SEQ_ID_DIM_ESCOLA), FOREIGN KEY(SEQ_ID_DIM_INSCRITO) REFERENCES dw_enem_2008.dim_inscrito(SEQ_ID_DIM_INSCRITO), Q7 VARCHAR(1) NULL, Q15 VARCHAR(1) NULL, Q17 VARCHAR(1) NULL, Q18 VARCHAR(1) NULL, Q23 VARCHAR(1) NULL, Q24 VARCHAR(1) NULL, Q27 VARCHAR(1) NULL, Q28 VARCHAR(1) NULL, Q33 VARCHAR(1) NULL, Q35 VARCHAR(1) NULL, Q40 VARCHAR(1) NULL, Q43 VARCHAR(1) NULL, Q50 VARCHAR(1) NULL, Q52 VARCHAR(1) NULL, Q56 VARCHAR(1) NULL, Q76 VARCHAR(1) NULL, Q77 VARCHAR(1) NULL, Q78 VARCHAR(1) NULL, Q79 VARCHAR(1) NULL, Q80 VARCHAR(1) NULL, Q81 VARCHAR(1) NULL, Q85 VARCHAR(1) NULL, Q86 VARCHAR(1) NULL, Q88 VARCHAR(1) NULL, Q89 VARCHAR(1) NULL, Q90 VARCHAR(1) NULL, Q91 VARCHAR(1) NULL, Q92 VARCHAR(1) NULL, Q93 VARCHAR(1) NULL, Q94 VARCHAR(1) NULL, Q95 VARCHAR(1) NULL,

Page 96: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

96

Q96 VARCHAR(1) NULL, Q97 VARCHAR(1) NULL, Q104 VARCHAR(1) NULL, Q105 VARCHAR(1) NULL, Q107 VARCHAR(1) NULL, Q108 VARCHAR(1) NULL, Q109 VARCHAR(1) NULL, Q110 VARCHAR(1) NULL, Q111 VARCHAR(1) NULL, Q112 VARCHAR(1) NULL, Q113 VARCHAR(1) NULL, Q114 VARCHAR(1) NULL, Q115 VARCHAR(1) NULL, Q116 VARCHAR(1) NULL, Q118 VARCHAR(1) NULL, Q120 VARCHAR(1) NULL, Q122 VARCHAR(1) NULL, Q127 VARCHAR(1) NULL, Q136 VARCHAR(1) NULL, Q175 VARCHAR(1) NULL, Q176 VARCHAR(1) NULL, Q177 VARCHAR(1) NULL, Q178 VARCHAR(1) NULL, Q189 VARCHAR(1) NULL, Q192 VARCHAR(1) NULL, Q193 VARCHAR(1) NULL, Q194 VARCHAR(1) NULL, Q195 VARCHAR(1) NULL, Q196 VARCHAR(1) NULL, Q199 VARCHAR(1) NULL, Q200 VARCHAR(1) NULL, Q201 VARCHAR(1) NULL, Q202 VARCHAR(1) NULL, PRIMARY KEY(SEQ_ID_DIM_INSCRITO)); CREATE INDEX fato_enem_FKIndex1 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_ESCOLA); CREATE INDEX fato_enem_FKIndex2 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_RECURSOS); CREATE INDEX fato_enem_FKIndex3 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_PROFISSAO); CREATE INDEX fato_enem_FKIndex4 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_EMPREGO); CREATE INDEX fato_enem_FKIndex5 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_AVALIACAO_PROFESSORES);

Page 97: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

97

CREATE INDEX fato_enem_FKIndex6 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_FAMILIA); CREATE INDEX fato_enem_FKIndex7 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_OUTROS_CURSOS); CREATE INDEX fato_enem_FKIndex8 ON dw_enem_2008.fato_enem (SEQ_ID_DIM_INTERESSES);

CREATE INDEX idx_dim_inscrito_lookup ON dw_enem_2008.dim_inscrito ( nu_inscricao , tp_sexo , no_municipio_esc , id_dependencia_adm , id_localizacao , nu_nt_objetiva , nu_nota_redacao , q7 , q15 , dt_nascimento); CREATE INDEX idx_dim_inscrito_tk ON dw_enem_2008.dim_inscrito ( seq_id_dim_inscrito); insert into dw_enem_2008.dim_avaliacao_professores values (1, 'Q90', 'Q91', 'Q120','Q116','Q118','Q122'); insert into dw_enem_2008.dim_emprego values (1, 'Q43', 'Q50', 'Q52', 'Q56', 'Q115'); insert into dw_enem_2008.dim_escola values (1, 'Q76', 'Q77', 'Q78', 'Q92', 'Q93', 'Q94', 'Q95', 'Q96', 'Q97', 'Q104', 'Q105', 'Q107', 'Q108', 'Q109', 'Q110', 'Q111', 'Q112', 'Q113', 'Q114', 'Q127', 'Q136', 'Q189'); insert into dw_enem_2008.dim_interesses values (1, 'Q40 ', 'Q85 ', 'Q86 ', 'Q88 ', 'Q89', 'Q175', 'Q176', 'Q177', 'Q178', 'Q192', 'Q193'); insert into dw_enem_2008.dim_familia values (1, 'Q17', 'Q18', 'Q23'); insert into dw_enem_2008.dim_profissao values (1, 'Q194', 'Q195', 'Q196', 'Q199', 'Q200', 'Q201', 'Q202'); insert into dw_enem_2008.dim_outros_cursos values (1, 'Q79', 'Q80', 'Q81'); insert into dw_enem_2008.dim_recursos values (1, 'Q24', 'Q27', 'Q28', 'Q33', 'Q35');

Page 98: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

98

APÊNDICE B – Modelo Dimensional

Page 99: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

99

Page 100: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

100

Page 101: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

101

Page 102: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

102

ANEXOS

Page 103: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

103

ANEXO A – Questionário Socioeconômico ENEM 2008

Page 104: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

104

Page 105: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

105

Page 106: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

106

Page 107: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

107

Page 108: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

108

Page 109: UNIVERSIDADE DO SUL DE SANTA CATARINA CRISTINA MARTINS DERLEI EDSON DE FARIA · 2020. 12. 2. · DERLEI EDSON DE FARIA BUSINESS INTELLIGENCE: ANÁLISE DO PERFIL SOCIOECONÔMICO DOS

109