MÉTODOS QUANTITATIVOS EM CIÊNCIAS SOCIAIS: ANÁLISE DE DADOS QUALITATIVOS
description
Transcript of MÉTODOS QUANTITATIVOS EM CIÊNCIAS SOCIAIS: ANÁLISE DE DADOS QUALITATIVOS
MÉTODOS QUANTITATIVOS EM CIÊNCIAS SOCIAIS:ANÁLISE DE DADOS QUALITATIVOS
Ana Paula Vidal Bastos
Indicadores e sua Construção
Indicadores são medidas compostas de variáveis, ou seja, medições baseadas em mais de um dado.
Um índice é construído através do somatório de resultados de atributos individuais.
Métodos Quantitativos: análise da dados
qualitativos
Indicadores e sua Construção
De acordo com Babbie (1989) existem etapas específicas na construção de indicadores: seleção dos itens, avaliação de suas relações
empíricas, combinação dos itens no indicador, e a validação do indicador.
Métodos Quantitativos: análise da dados
qualitativos
Seleção dos itens Um indicador composto é sempre criado para medir uma variável. O primeiro critério na seleção dos itens é a validade lógica do item. Se quisermos avaliar a degradação ambiental devemos escolher itens que, pelo menos aparentemente, estejam medindo esta variável. É importante observar as características específicas das dimensões que se pretende mensurar.
2. Relações binárias entre itens: Uma vez determinada a validade lógica do item sendo considerado para inclusão no indicador, deve-se fazer uma análise das relações binárias entre os itens para se determinar o tipo e a força da relação empírica os pares de itens têm entre si. Podem-se utilizar tabelas de percentagem, ou coeficientes de correlações, ou ambos para conduzir esta análise. Pares com relações muito fracas dificilmente estarão medindo a mesma dimensão da variável, e devem ser eliminados. Relações demasiadamente fortes indicam que ambos os itens estão medindo a mesma dimensão da mesma maneira. Neste caso um dos itens deve ser eliminado do indicador. 3. Análise multivariada: O objetivo principal da construção de um indicador é desenvolver um método de classificar o sujeito da pesquisa de acordo com alguma variável, como nível de degradação ambiental de uma localidade. Os sujeitos da pesquisa são a localidade e a degradação ambiental como variáveis de interesse. O indicador deverá ser capaz de demonstrar diferentes níveis de degradação ambiental quando usado em diferentes localidades. Para que isto aconteça cada item que constitui o indicador deve contribuir para a avaliação de cada sujeito de pesquisa. Por esta razão dois itens perfeitamente correlacionados não devem fazer parte do mesmo indicador. Se um dos itens já foi incluído a adição do outro não contribuiria em nada para a avaliação dos sujeitos da pesquisa. Recomenda-se a 5 utilização de tabelas multivariadas complexas para conduzir a análise das relações entre todos os itens do indicador. 4. Pontuação do indicador: Uma vez escolhidos os itens que irão compor o indicador é necessário fazer duas decisões importantes. A primeira decisão irá determinar o intervalo de variação do indicador e o número de casos em cada ponto do índice. Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada extremo. Sendo assim deve-se considerar o nível de graduação exigido pelo estudo para determinar o número de intervalos na escala do indicador. A segunda decisão importante a ser tomada é quanto cada item do indicador vai contribuir para o valor final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a menos que existam razões fortes para dar pesos diferentes aos itens. Estes passos simples na construção de indicadores compostos podem ser vistos em mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também auxilia na avaliação e utilização destes indicadores. A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como também identificar seus principais elementos constitutivos e suas principais características. Desenvolvimento Sustentável: Principais Ferramentas de Avaliação Existem várias ferramentas desenvolvidas especificamente para avaliar a sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma consulta a um painel de especialistas em um assunto específico, e busca encontrar um consenso entre estes especialistas participantes. Métodos Quantitativos:
análise da dados qualitativos
Por exemplo, existem vários tipos diferentes de degradação ambiental (poluição do ar, derrubada de vegetação nativa, extinção de espécies).
Se o indicador pretende medir aspectos específicos da degradação ambiental deve-se selecionar itens que mensurem estes aspectos específicos.
Por outro lado, se a intenção do indicador medir a degradação ambiental de maneira mais ampla, o indicador pode se utilizar de um índice menos específico que represente a variável degradação ambiental. Métodos Quantitativos:
análise da dados qualitativos
Seleção dos itens
A natureza dos itens irá determinar a especificidade ou não do indicador.
Métodos Quantitativos: análise da dados
qualitativos
Relações binárias entre itens Uma vez determinada a validade lógica do item
sendo considerado para inclusão no indicador, deve-se fazer uma análise das relações binárias entre os itens para se determinar o tipo e a força da relação empírica os pares de itens têm entre si.
Podem-se utilizar tabelas de percentagem, ou coeficientes de correlações, ou ambos para conduzir esta análise.
Métodos Quantitativos: análise da dados
qualitativos
Relações binárias entre itens
Pares com relações muito fracas dificilmente estarão medindo a mesma dimensão da variável, e devem ser eliminados.
Relações demasiadamente fortes indicam que ambos os itens estão medindo a mesma dimensão da mesma maneira.
Neste caso um dos itens deve ser eliminado do indicador.
Métodos Quantitativos: análise da dados
qualitativos
Análise multivariada O objetivo principal da construção de um
indicador é desenvolver um método de classificar o sujeito da pesquisa de acordo com alguma variável, como nível de degradação ambiental de uma localidade.
Os sujeitos da pesquisa são a localidade e a degradação ambiental como variáveis de interesse.
O indicador deverá ser capaz de demonstrar diferentes níveis de degradação ambiental quando usado em diferentes localidades.
Métodos Quantitativos: análise da dados
qualitativos
Análise multivariada Para que isto aconteça cada item que constitui o indicador deve contribuir para a avaliação de cada sujeito de pesquisa. Por esta razão dois itens perfeitamente correlacionados não devem fazer parte do mesmo indicador. Se um dos itens já foi incluído a adição do outro não contribuiria em nada para a avaliação dos sujeitos da pesquisa. Recomenda-se a utilização de tabelas multivariadas complexas para conduzir a análise das relações entre todos os itens do indicador. 4. Pontuação do indicador: Uma vez escolhidos os itens que irão compor o indicador é necessário fazer duas decisões importantes. A primeira decisão irá determinar o intervalo de variação do indicador e o número de casos em cada ponto do índice. Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada extremo. Sendo assim deve-se considerar o nível de graduação exigido pelo estudo para determinar o número de intervalos na escala do indicador. A segunda decisão importante a ser tomada é quanto cada item do indicador vai contribuir para o valor final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a menos que existam razões fortes para dar pesos diferentes aos itens. Estes passos simples na construção de indicadores compostos podem ser vistos em mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também auxilia na avaliação e utilização destes indicadores. A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como também identificar seus principais elementos constitutivos e suas principais características. Desenvolvimento Sustentável: Principais Ferramentas de Avaliação Existem várias ferramentas desenvolvidas especificamente para avaliar a sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma consulta a um painel de especialistas em um assunto específico, e busca encontrar um consenso entre estes especialistas participantes. Métodos Quantitativos:
análise da dados qualitativos
Pontuação do indicador Uma vez escolhidos os itens que irão compor o indicador é necessário fazer duas decisões importantes. A primeira decisão irá determinar o intervalo de variação do indicador e o número de casos em cada ponto do índice. Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada extremo. Sendo assim deve-se considerar o nível de graduação exigido pelo estudo para determinar o número de intervalos na escala do
indicador. A segunda decisão importante a ser tomada é quanto cada item do indicador vai contribuir para o valor final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a menos que existam razões fortes para dar pesos diferentes aos itens. Estes passos simples na construção de indicadores compostos podem ser vistos em mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também auxilia na avaliação e utilização destes indicadores. A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como também identificar seus principais elementos constitutivos e suas principais características. Desenvolvimento Sustentável: Principais Ferramentas de Avaliação Existem várias ferramentas desenvolvidas especificamente para avaliar a sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma consulta a um painel de especialistas em um assunto específico, e busca encontrar um consenso entre estes especialistas participantes.
Métodos Quantitativos: análise da dados
qualitativos
Pontuação do indicador A segunda decisão importante a ser tomada é
quanto cada item do indicador vai contribuir para o valor final.
Deve-se decidir se cada item terá o mesmo valor ou se haverá um sistema de pesos para cada item.
Utilizam-se sempre valores iguais para cada item, a menos que existam razões fortes para dar pesos diferentes aos itens.
Babbie (1989) . Métodos Quantitativos:
análise da dados qualitativos
Pontuação do indicador
A melhor compreensão das etapas na elaboração de indicadores compostos também auxilia na avaliação e utilização destes indicadores.
Métodos Quantitativos: análise da dados
qualitativos
Existem várias ferramentas desenvolvidas especificamente para avaliar a sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características teóricas e práticas destas ferramentas.
Métodos Quantitativos: análise da dados
qualitativos
Desenvolvimento Sustentável: Principais Ferramentas de Avaliação
ANÁLISE MULTIVARIADA
Análise de variância multivariada Componentes Principais Análise de Agrupamento Análise de Fatores Análise de Correlação Canônica
ANÁLISE MULTIVARIADA
Análise de variância multivariada Componentes Principais Análise de Agrupamento Análise de Fatores Análise de Correlação Canônica
ANÁLISE MULTIVARIADA Os objetivos gerais, para os quais a análise
multivariada conduz são: a. redução de dados ou simplificação estrutural:
o fenômeno sob estudo é representado da maneira mais simples possível, sem sacrificar informações valiosas e tornando as interpretações mais simples;
b. ordenação e agrupamento: agrupamento de objetos (tratamentos) ou variáveis similares, baseados em dados amostrais ou experimentais;
c. investigação da dependência entre variáveis: estudos das relações estruturais entre variáveis muitas vezes é de interesse do pesquisador;
d. predição: relações entre variáveis devem ser determinadas para o propósito de predição de uma ou mais variável com base na observação de outras variáveis;
e. construção e teste de hipóteses
Métodos Quantitativos: análise da dados
qualitativos
As técnicas estatísticas constituem se uma parte integral da pesquisa científica e em particular as técnicas multivariadas tem sido regularmente aplicada em várias investigações científicas nas áreas de biologia, física, sociologia e ciências médicas.
A utilização de gráficos e arranjos tabulares são importantes auxiliares nas análises de dados.
Por outro lado, números que resumem, ou seja, que descrevem quantitativamente certas características, são essenciais para a interpretação de os dados amostrais ou experimentais.
As medidas são tomadas em cada unidade da amostra ou do experimento. A representação destes dados é feita com a notação xjk para indicar um valor particular da j-ésima unidade amostral ou experimental e da k-ésima variável mensurada.
Métodos Quantitativos: análise da dados
qualitativos
Matriz de dados Considere a situação em que observamos ‘p’ características de ‘n’
indivíduos de uma população π. As características observadas são representadas pelas variáveis x1, x2, x3, ..., xp. A matriz de dados é de ordem ‘n x p’ e normalmente denominada de matriz ‘X’.
npnnn
p
p
p
xxxx
xxxx
xxxx
xxxx
X
321
3333231
2232221
1131211
exemplo 4 firmas de ração queremos avaliar a venda
de rações. Cada observação bivariada forneceu a
quantidade de sacos de ração vendidos e a quantidade de reais de cada venda.
Os dados são: Variável 1 (Reais/venda) 80, 120, 90, 110 Variável 2 (número de sacos de ração
vendidos)10; 12; 6; 8
8110
690
12120
1080
X
Usando a notação proposta anteriormente, tem-se:X11=80; X21=120; X31=90; X41=110; X12=10; X22=12; X32=6; X42=8
Métodos Quantitativos: análise da dados
qualitativos
As características são observadas em unidades de medidas diferentes entre si, e neste caso, é conveniente padronizar as variáveis Xj (i=1, 2, 3, ..., p). A padronização pode ser feita com média zero e variância 1, ou com variância 1 e média qualquer.
Métodos Quantitativos: análise da dados
qualitativos
Matriz de covariância S
A partir da matriz X de dados de ordem ‘n x p’ podemos fazer uma estimativa da matriz de covariância Σ da população π que representaremos por S. A matriz S é simétrica e de ordem ‘p x p’.
)x(arV)xx(ovC)xx(ovC)xx(ovC
)xx(ovC)x(arV)xx(ovC)xx(ovC
)xx(ovC)xx(ovC)x(arV)xx(ovC
)xx(ovC)xx(ovC)xx(ovC)x(arV
S
p3p2p1p
p332313
p232212
p131211
Medidas de associação e correlação Covariância
1
n
yyxxs ii
xy
Métodos Quantitativos: análise da dados
qualitativos
Padronização com média zero e variância 1 (curva normal)
p,,2,1jen,,2,1i,)x(s
xxz
j
jijij
A padronização dos valores é muito importante em estatística é o que nos permite avaliar o quanto dos nossos dados amostrais podem ser inferidos para os valores da população.
Métodos Quantitativos: análise da dados
qualitativos
Padronização com variância 1e média qualquer
em que, e são, respectivamente, a estimativa da média e o desvio padrão da característica j:
p,,2,1jen,,2,1i,)x(s
xz
j
ijij
n
xx
n
1iij
j
p,2,1j,)x(arV)x(s jj
1
)(ˆ1
)(ˆ 1
2
122
1
nn
x
xxarVou
n
xxxarV
n
i
n
iij
ij
j
n
ijij
j
Métodos Quantitativos: análise da dados
qualitativos
Matriz de valores padronizados
np3n2n1n
p3333231
p2232221
p1131211
zzzz
zzzz
zzzz
zzzz
Z
A maioria das técnicas multivariadas é baseada no simples conceito de distância, por mais formidável que isso possa parecer.
A princípio, será considerada a construção de uma distância entre um ponto P, com p coordenadas, da origem. O argumento que pode ser usado refere-se ao fato de que as coordenadas de P podem variar no espaço produzindo diferentes posições para os pontos.
Para ilustrar, suponha que se tenha n pares de medidas em duas variáveis (x1 e x2) e que as medidas de x1 variam independentemente das mensurações em x2.
O significado de independente neste ponto pode ser dado pelo fato de que os valores de x1 não podem ser preditos com nenhuma acurácia a partir dos valores de x2 e vice-versa.
Em adição, é assumido que as observações de x1 possuem maior variabilidade que as de x2.
Análise de variância multivariada A análise de variância multivariada
(MANAVA) é usada para investigar se os vetores de médias de tratamento são os mesmos, e se não, qual componente de média difere significativamente.
Fazemos o teste de hipóteses da significância de diferenças de médias, para avaliar se existe ou não diferença nos tratamentos.
Análise de componentes principais A análise de componentes principais está
relacionada com a explicação da estrutura de covariância por meio de poucas combinações lineares das variáveis originais em estudo.
Os objetivos dessa análise são:
i) redução da dimensão original; e
ii) facilitação da interpretação das análises realizadas.
Em geral, a explicação de toda a variabilidade do sistema determinado por p variáveis só pode ser efetuada por p componentes principais.
No entanto, uma grande parte dessa variabilidade pode ser explicada por um número r menor de componentes, r≤p.
Os componentes principais são uma técnica de análise intermediária e, portanto não se constituem em um método final e conclusivo.
Métodos Quantitativos: análise da dados
qualitativos
A análise de componentes principais é uma técnica de análise multivariada que consiste em transformar um conjunto de variáveis em outro conjunto, os componentes principais, de mesma dimensão, porém com propriedades importantes: cada componente principal é uma combinação linear de todas as variáveis originais, são independentes entre si e estimados com o propósito de reter, em ordem de estimação, o máximo de informação, em termos da variação total contida nos dados.
Métodos Quantitativos: análise da dados
qualitativos
A análise de componentes principais é associada à idéia de redução de massa de dados, com menor perda possível da informação.
Procura-se redistribuir a variação observada nos eixos originais de forma a se obter um conjunto de eixos ortogonais não correlacionados.
Esta técnica também pode ser utilizada para o agrupamento de indivíduos similares, mediante exame visual em gráficos de dispersão no espaço bi ou tridimensional.
A análise agrupa os indivíduos de acordo com sua variação, isto é, os indivíduos são agrupados segundo suas variâncias, ou seja, segundo seu comportamento dentro da população, representado pela variação do conjunto de características que define o indivíduo, ou seja, a técnica agrupa os indivíduos de uma população segundo a variação de suas características.
Métodos Quantitativos: análise da dados
qualitativos
Métodos Quantitativos: análise da dados
qualitativos
Podemos decidir quantos componente vamos usar na análise, isto é, quantos componentes serão utilizados para diferenciar os indivíduos.
Não existe um modelo estatístico que ajude nesta decisão. Segundo REGAZZI (2000) para aplicações em diversas áreas do conhecimento o número de componentes utilizados tem sido aquele que acumula 70% ou mais de proporção da variância total.
Métodos Quantitativos: análise da dados
qualitativos
A matriz Z das variáveis padronizadas zj é igual a matriz de correlação da matriz de dados X.
Para determinar os componentes principais normalmente partimos da matriz de correlação R.
A recomendação é que a padronização só dever ser feita quando as unidades de medidas das características observadas não forem as mesmas.
Métodos Quantitativos: análise da dados
qualitativos
Os componentes principais apresentam as seguintes propriedades: 1) A variância do componente principal Yi é igual ao
valor do autovalor λi.
2) O primeiro componente é o que apresenta maior variância e assim por diante
3) O total de variância das variáveis originais é igual ao somatório dos autovalores que é igual ao total de variância dos componentes principais
4) Os componentes principais não são correlacionados entre si
iiYarV
)Y(arV)Y(arV)Y(arV p21
)Y(arV)X(arV iii
0Y,YovC ji
Métodos Quantitativos: análise da dados
qualitativos
Exemplo de aplicaçãoNo quadro estão os valores originais observados (X1 e X2) e
padronizados (Z1 e Z2) de duas variáveis para cinco tratamentos (n=5).
Tratamentos
Variáveis originais Variáveis padronizadas
X1 X2 Z1 Z2
1 102 96 24,3827 6,9554
2 104 87 24,8608 6,3033
3 101 62 24,1436 4,4920
4 93 68 22,2313 4,9268
5 100 77 23,9046 5,5788
Variância 17,50 190,50 1 1
Média 100,00 78,00 23,9046 5,6513
Análise de agrupamentos
As análises rudimentares e exploratórias de dados como os procedimentos gráficos auxiliam, em geral, o entendimento da complexa natureza da análise multivariada.
No entanto existem outras técnicas gráficas para agrupar objetos (itens ou variáveis) e também apresentar os algoritmos que devem ser usados para efetivamente realizá-los.
Encontrar nos dados uma estrutura natural de agrupamento é uma importante técnica exploratória.
A análise de agrupamento deve ser distinguida da análise discriminante, pelo fato desta última ser aplicada a um número de grupos já conhecidos, tendo por objetivo a discriminação de um novo indivíduo a um destes grupos.
A análise de agrupamento por sua vez não considera o número de grupos e é realizada com base na similaridade ou dissimilaridade (distâncias).
Objetivo dessa análise é agrupar objetos semelhantes segundo suas características (variáveis).
Todavia, não existem impedimentos para realizar o agrupamento de variáveis semelhantes segundo as realizações obtidas pelos objetos amostrados.
Um outro problema para o qual uma resposta é necessária consiste em verificar se um indivíduo A é mais parecido com B do que com C.
Quando o número de variáveis envolvidas é pequeno, a inspeção visual poderá responder.
Para fazer tal inferência usou-se o conceito de distância euclidiana, o qual definiu a idéia de parecença.
Especificar um coeficiente de parecença que indique a proximidade entre os indivíduos.
É importante considerar, em todos os casos semelhantes a este, a natureza da variável (discreta, contínua, binária) e a escala de medida (nominal, ordinal, real ou razão).
Análise fatorial
Análise de fatores pretende descrever, se possível, as relações de covariância entre diversas variáveis em função de poucas, não observáveis, quantidades aleatórias denominadas de fatores.
Sob o modelo de fatores cada variável resposta é representada por uma função linear de uma pequena quantidade de fatores
comuns, não observáveis, e de uma simples variável latente específica.
Os fatores comuns geram as covariâncias entre as variáveis observadas e os termos específicos contribuem somente para as variâncias de suas respostas relacionadas.
Os coeficientes dos fatores comuns não são restritos a condição de ortogonalidade, o que confere generalidade, apesar de se exigir normalidade dos dados e a determinação, a priori, do número de fatores.
Iij indica o grau de interação entre o centro i e o centro j;Ai, Aj são a dimensão dos aglomerados (população) dos centros i e j;dbij é a medida da distância entre i e j;G é a constante semelhante à constante gravitacional numérica;b é um parâmetro exponencial.
Exemplo de aplicação: POLARIZAÇÃO
CONSTRUINDO A NOVA MASSA
Foram selecionadas 46 variáveis após levantamentos, estudos e comparação com outras pesquisas sócio - econômicas. Estas variáveis estão distribuídas por 10 municípios em estudo na região do Xingu, que é a referência espacial. As variáveis selecionadas estão aliadas ao tipo de fundamento econômico: capital físico, capital humano, capital social e capital natural.
Submetendo-se as 46 variáveis a uma análise de componentes principais, foram encontrados componentes significativos, para a região em estudo, que em conjunto explicam a variância total do conjunto de variáveis.
Observa-se que o conjunto de variáveis que compõem o componente principal 1 explicam 89% da variância total.
Com o auxílio da análise dos componentes principais, encontrou-se as massas do conjunto de variáveis para cada um dos municípios em estudo.
Analisando o componente 1, nota-se que as concentrações urbanas na nesta região dependem positivamente de variáveis ligadas ao capital físico com potencial de mercado, como: Número de Contratos na Agricultura, Valor de Contratos na Agricultura, Estabelecimentos de Saúde, População urbana, Valor da produção na extração vegetal Madeira em tora e Pessoal ocupado na construção.
V36 V17 V27 V9 V20 V8
0.0
0.10
Comp. 1
V21 V16 V5 V22 V6 V28
-0.4
0.2
Comp. 2
V22 V16 V21 V23 V5 V24
-0.2
0.4
Comp. 3
V25 V6 V15 V28 V24 V16
-0.4
-0.1
Comp. 4
V38 V11 V31 V33 V18 V3
-0.3
0.1
Comp. 5
Município Municípios com maior potencial de atração: Distribuição dos municípios pelos respectivos pólos de atração (função da maior carga de atração)
ALTAMIRA MEDICILÂNDIA PACAJÁ P DE MOZ ALTAMIRA MEDICILÂNDIA PACAJÁ P DE MOZ
ALTAMIRA 16.45 0.205335146 0.165567197 0.427028215 X X
ANAPU 0.019904577 0.010000072 0.087170682 0.03800408 X X
B NOVO 0.048762603 0.078527696 0.016198572 0.027403439 X X
MEDICILÂNDIA 0.201215961 16.12 0.089820847 0.135878986 X X
PACAJÁ 0.051028917 0.028250105 5.07 0.083342395 X X
PLACAS 0.004270376 0.006491042 0.002998259 0.003667121 X X
P DE MOZ 0.077877486 0.025287653 0.049315027 3 X X
S J PORFIRIO 0.030465979 0.011879597 0.032398233 0.123003057 X
URUARÁ 0.014913431 0.027073852 0.009578056 0.012264578 X X
V DO XINGU 0.041373613 0.012408865 0.02183472 0.338042745 X X
O potencial polarizador de cada município é obtido através da integração das forças da nova “massa” tendo como denominador a distância, por entender que, dados determinados estoques em duas localidades, os fluxos entre elas serão tanto maiores, quanto menores forrem a distância que as separa.
Municípios pólos com respectivos municípios de influência
MedicilândiaMedicilândia
PacajáPacajá
P de MozP de Moz
AltamiraAltamira
Porto de Moz
S José Porfírio
V do Xingú
Brasil Novo
Medicilândia
UruaráPlacas
ALTAMIRA
Brasil Novo
MEDICILÂNDIA
UruaráPlacas
PACAJÁAnapu
P DE MOZ
V do Xingú
Pacajá
AnapuAltamira
Uma regressão ou curva pode ser o primeiro passo para a modelagem.
“O termo regressão surgiu no séc. XIX, utilizado por Sir Francis que estudou a relação entre altura de pais e filhos, observando que, na média, havia um decréscimo nos valores encontrados entre as duas gerações. Ele considerou esta tendência como sendo uma regressão genética e por algum motivo, não muito claro chamou este fato de regression to mediocrity.”
Exemplo: Retornos da Educaçao Um modelo de investimento em capital humano
implica que um indivíduo com mais anos de educação teria salários mais elevados.
No caso mais simples, temos uma equação como:
ueducnda 10Re
Dados
RENDA EDUC.20,5 1231,5 1647,7 1826,2 16
44 128,28 1230,8 1617,2 1219,9 109,96 1255,8 1625,2 20
29 1285,5 1615,1 1028,5 1821,4 1617,7 206,42 1284,9 16
diagrama de dispersão
0
20
40
60
80
100
8 10 12 14 16 18 20 22
educação
ren
da
ESTATÍSTICAS DESCRITIVAS
2
1
1
2
1
1
1
n
xs
xn
x
n
ii
x
n
ii
x
ESTATÍSTICAS DESCRITIVAS
yx
xyxy
n
iii
xy
sss
r
n
yxs
yx
11
Exemplo: (cont.)
O estimador de 1, é o retorno da educação, mas podemos afirmar que é causal?
Uma vez que o erro, u, incluí outros fatores que podem afetar os ganhos, queremos controlar para o máximo de fatores possíveis
Algumas coisas continuam sem serem observadas, o que pode ser problemático
Para prosseguir temos que assumir um pressuposto fundamental da ausencia de relaçao de u com x
O fato de sabermos x não implica que saibamos alguma coisa acerca de u;
E(u|x) = E(u) = 0, que implica que
E(y|x) = 0 + 1x
Curva de regressão:
.
..
.
y4
y1
y2
y3
x1 x2 x3 x4
}
}
{
{
u1
u2
u3
u4
x
y
Linha de regressão e dados da amostra com os erros associados.
E(y|x) = 0 + 1x
Neste caso a curva de regressão indica a tendência geral entre uma variável a ser explicada e as variáveis independentes.
Uma relação funcional obtida através de um ajuste de dados, propicia condições para a elaboração de hipóteses que levam a formulação de modelos.
Considerando o peso e o comprimento podemos chegar a um modelo dinâmico:
Os Modelos são relações funcionais que incorporam as particularidades do fenômeno analisado.
PIBi = 𝛼0 + 𝛼1CATi + 𝛼2APi + 𝜈t (1) PIBi = 𝛼0 + 𝛼1CATi + 𝜈t (2) PIBi = 𝛼0 + 𝛼1APi + 𝜈t (3)
Métodos Quantitativos: análise da dados
qualitativos
EQUAÇÃO III
PIB SERVIÇOS = f(COEFICIENTE DE AVANÇO TECNOLÓGICO, ÁREA PLANTADA)
ANO PS CAT AP1985 53.057,48 3,113272992 100001986 55.510,63 3,240974388 87001987 58.077,20 3,373913888 85001988 60.762,44 3,51230635 162001989 63.571,83 3,656375445 219001990 66.511,12 3,806354021 151001991 69.586,30 4,338992363 45101992 72.803,67 4,94616492 211221993 76.169,80 5,638301561 424551994 79.691,56 6,42729165 616911995 83.376,16 7,326688278 866701996 87.231,11 8,60454482 626271997 105.080,58 10,10527386 1081601998 126.582,47 11,86774687 1382581999 152.484,12 13,93761492 1585982000 156.129,47 16,36849115 1682372001 189.796,04 17,9860926 1994642002 187.244,40 19,76355206 2217232003 236.370,27 21,71666735 2506512004 268.582,49 23,86279751 302163
ANO ln(PS) ln(CAT) ln(AP)
1985 10,88 1,14 9,21
1986 10,92 1,18 9,07
1987 10,97 1,22 9,05
1988 11,01 1,26 9,69
1989 11,06 1,30 9,99
1990 11,11 1,34 9,62
1991 11,15 1,47 8,41
1992 11,20 1,60 9,96
1993 11,24 1,73 10,66
1994 11,29 1,86 11,03
1995 11,33 1,99 11,37
1996 11,38 2,15 11,04
1997 11,56 2,31 11,59
1998 11,75 2,47 11,84
1999 11,93 2,63 11,97
2000 11,96 2,80 12,03
2001 12,15 2,89 12,20
2002 12,14 2,98 12,31
2003 12,37 3,08 12,43
2004 12,50 3,17 12,62
Estatística Descritiva
PS CAT AP
Média 11,49525084Média 2,027895716Média 10,80551711
Erro padrão 0,114949649Erro padrão 0,159994988Erro padrão 0,297027743
Mediana 11,30851834Mediana 1,926038427Mediana 11,03742255
Desvio padrão 0,514070457Desvio padrão 0,715519338Desvio padrão 1,328348448
Variância da amostra 0,264268435
Variância da amostra 0,511967923
Variância da amostra 1,764509599
Curtose -0,918373626Curtose -1,485354609Curtose -1,341740411
Assimetria 0,658806829Assimetria 0,259988583Assimetria -0,272869772
Intervalo 1,621782259Intervalo 2,036646075Intervalo 4,204669453
Mínimo 10,8791311Mínimo 1,135674582Mínimo 8,414052432
Máximo 12,50091336Máximo 3,172320657Máximo 12,61872189
Soma 229,9050167Soma 40,55791431Soma 216,1103421
Contagem 20Contagem 20Contagem 20
Nível de confiança(95,0%) 0,240592379
Nível de confiança(95,0%) 0,334873358
Nível de confiança(95,0%) 0,621686209
RESUMO DOS RESULTADOS
Estatística de regressãoR múltiplo 0,983807263R-Quadrado 0,96787673R-quadrado ajustado 0,964097522Erro padrão 0,097405809
Observações 20
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0%Superior
95,0%
Interseção 10,68954232 0,380843292 28,06808611 1,10883E-15 9,886033219 11,49305143 9,8860332 11,493051
ln(CAT) 0,856061602 0,096063955 8,911371611 8,15378E-08 0,653384375 1,058738829 0,6533844 1,0587388
ln(AP) -0,086094458 0,051745171 -1,663816284 0,114472191 -0,195267225 0,023078309 -0,1952672 0,0230783
Métodos Quantitativos: análise da dados
qualitativos
Tabela . Estimação das Equações 4, 5 e 6: Variável dependente PIB (Produto Interno Bruto)
N = 20 para todos os modelos.*** p < .001; ** p < .01; * p < .10
Variáveis Equação 4 Equação 5 Equação 6
CATi0,6105***
(8,6396)
- 0,5702**
(2,8204)
APi- 0,2232***
(6,9900)
0,0167+
(0,2134)
R² ajustado 0,7542 0,6660 0,7435
Durbin Watson - -
interpretação
A partir dos resultados do teste econométrico da equação 4 é possível identificara, com alto nível de significância, que a produção de riquezas do setor agropecuário do Pólo Balsas é altamente sensível ao avanço tecnológico da cadeia produtiva da soja.
Nesse sentido, o coeficiente β indica que um incremento em 10% no coeficiente de avanço tecnológico, ceteris paribus, tende gerar crescimento de 3,6% no PIB Agropecuário.
Métodos Quantitativos: análise da dados
qualitativos
Do mesmo modo, os resultados da equação 5 atestam, com alto grau de significância, que a produção de riquezas agropecuárias é elástica à área plantada de soja, de forma que o incremento de 10% na área plantada de soja, ceteris paribus, tende a gerar um crescimento de 2,1% no PIB Agropecuário.
Métodos Quantitativos: análise da dados
qualitativos
Nesse sentido, os resultados da equação 6 permitem afirmar que, em média, no período compreendido entre 1975 e 2004, 65,43% das alterações no PIB Agropecuário do Pólo Balsas são explicadas pelas varições na área plantada de soja e pela intensificação na utilização de novas tecnologias.
Métodos Quantitativos: análise da dados
qualitativos
Diante disso, os modelos econométricos, confirmam a fundamentação teórica das teorias schumpeterianos e neo-schumpeterianos.
Métodos Quantitativos: análise da dados
qualitativos