ESTATISTICA - PRONTOfinal

download ESTATISTICA - PRONTOfinal

of 11

description

Trabalho estatistica

Transcript of ESTATISTICA - PRONTOfinal

  • 2

    RESUMO

    Este trabalho acadmico estuda o crescimento da urbanizao do estado de So Paulo em funo do

    nvel de escolaridade dos cidados da faixa etria de 15 60 anos, com ensino mdio concluido.

    Com o objetivo de auxiliar futuramente como material secundrio para estudos voltados tomada

    de decises empresariais.

    Para firmar a relao entre os dados dispostos utilizou-se o Programa R Verso 386 3.2.0, onde

    utilizou-se das funes necessrias para construir grficos que comprovem a solidez e

    confiabilidade do estudo em caso.

  • 3

    INTRODUO

    Dada a importncia do crescimento ou declnio urbano para tomada de decises empresariais, este

    trabalho visa identificar as possveis sucessividades e periodicidades no aumento ou queda da

    populao urbana, para este ento, servir de base em outros projetos, pesquisar e estudos relevantes

    na tomada de decises empresariais.

    Observa-se que a varivel urbanizao cresce em funo dos anos decorrentes como dado na

    tabela feita:

    Tabela com dados da Urbanizao no Estado de So Paulo:

    Anos Urbanizao

    (%)

    (Y)

    1996 0,932

    1997 0,933

    1998 0,933

    1999 0,934

    2001 0,937

    2002 0,94

    2003 0,942

    2004 0,945

    2005 0,947

    2006 0,95

    2007 0,952

    2008 0,955

    2009 0,957

    2011 0,961

    2012 0,962

    Figura 1: Tabela dos dados da urbanizao no estado de So Paulo em porcentagem.

    Com o intuito de possibilitar uma previso dos dados futuros relaciona-se os dados secundariamente

    pesquisados com a funo, tambm progressiva, dos cidados que possivelmente possam ter aquela

    relao com a urbanizao, sendo que as condies usadas para filtrar os resultados foram:

    Pessoas de ambos os sexos;

    Entre a faixa etria de 15 a 60 anos;

    Concluintes do Ensino Mdio;

    Indiferena quanto possvel escolaridade superior.

    Constata-se ento que o crescimento segue, assim como no urbano:

  • 4

    Tabela de dados da escolaridade no estado So Paulo

    Figura 1.1: Tabela de dados de pessoas de 59 60 anos com escolaridade igual ou superior ao ensino mdio no estado

    de So Paulo em porcentagem.

    OBJETIVO:

    Por tanto, a fim de possibilitar a previso desse crescimento urbano nos prximos anos, investiga-se

    o padro da urbanizao do Estado de So Paulo, atravs do aumento contnuo dos cidados com

    seu grau de escolaridade igual ou superior a Ensino Mdio Concludo.

    METODOLOGIA:

    Utilizando o Programa R Verso 386 3.2.0 aborda-se a possibilidade de prever o crescimento da

    urbanizao com a base no crescimento da populao entre 15 e 60 anos com escolaridade igual ou

    superior a Ensino Mdio Concludo. Realizaram-se as estatsticas necessrias para relacionar ambos

    os dados coletados.

    ESTATSTICA DESCRITIVA

    Utilizou-se da estatstica descritiva para resumir os dados, de modo que fosse possvel realizar

    anlises mais extensas tendo essa como base.

    Resumo (X1) Resumo (Y)

    Min. 0.2743 0.9320

    1 Qd 0.3451 0.9355

    Mediana 0.4408 0.9450

    Mdia 0.4353 0.9453

    3 Qd 0.5143 0.9535

    max 0.6066 0.9620

    Anos Urbanizao

    (%)

    (Y)

    1996 0,2743

    1997 0,2936

    1998 0,3137

    1999 0,3255

    2001 0,3647

    2002 0,3981

    2003 0,4229

    2004 0,4408

    2005 0,4584

    2006 0,4928

    2007 0,5131

    2008 0,5155

    2009 0,5304

    2011 0,5789

    2012 0,6066

  • 5

    Figura 2: Tabela de estatstica descritiva das variveis X1 e Y.

    BOXPLOT DE X1:

    A partir da anlise do boxplot de X1 e da estatstica

    descritiva, nota-se que 25% dos dados se encontram abaixo

    de 0.3451 (primeiro quartil) e 25% acima de 0.5143

    (terceiro quartil), as costeletas mostram que os dados acima

    de terceiro quartil esto concentrados, enquanto que os

    abaixo do primeiro esto mais dispostos. E ainda que h

    uma concentrao maior dos dados na parte superior ao

    segundo quartil (mediana). O grfico deixa claro que no h

    outliers nos dados de X1.

    Figura 3: Boxplot dos dados de X1

    BOXPLOT DE Y:

    O mesmo nota-se na anlise do boxplot e descritiva

    dos dados de Y. 25% dos dados esto abaixo do

    primeiro quartil (0.9355) e 25% esto acima do

    terceiro quartil (0.9535). Pelo tamanho das costeletas

    do grfico possvel inferir que os dados abaixo do

    primeiro quartil esto mais dispersos, enquanto que os

    que esto acima do terceiro quartil esto concentrados.

    Ao contrrio dos dados de X1, os dados entre os

    quartis (primeiro e segundo) esto melhor distribudos.

    Figura 3.1: Boxplot dos dados de Y

    ANLISE DE REGRESSO:

    O modelo de regresso serve para estudar uma varivel em funo de outra, pois muitas vezes no

    se possui a varivel desejada ou ela invivel.

    Nesse caso, a varivel estudada ser a urbanizao em funo da escolaridade.

    A seguir possvel analisar dois grficos de disperso dos dados:

  • 6

    Figura 4: Diagrama de disperso entre a varivel independente Escolaridade (X) e a varivel dependente Urbanizao

    (Y).

    Figura 4.1: Diagrama de disperso entre a varivel independente Escolaridade (X) e a varivel dependente

    Urbanizao (Y), com reta de regresso.

    A partir desses dois grficos possvel inferir que o aumento de pessoas com escolaridade igual ou

    superior ao ensino mdio e o crescimento da urbanizao so proporcionais, ou seja, a medida que

    aumenta a taxa de escolaridade tambm cresce a taxa de urbanizao. E ainda, pelo grfico 1.2,

    possvel concluir que essas duas variveis possuem variao linear.

    Outra forma de observar a variabilidade do modelo a partir do Coeficiente de Determinao (R).

    O princpio do modelo que quanto mais prximo de "1" R se aproxima melhor, pois desse modo

    a variabilidade de um dado explica mais a do outro.

    No caso dos dados utilizados o R encontrado foi igual a:

  • 7

    0.9789532

    Ou ainda pode-se verificar atravs do Coeficiente de Correlao (r), que diferencia-se do

    Coeficiente de Determinao atravs da sua caracterstica determinante ser sua maior aproximao

    de "1" ou "-1", pois isso significa que a variao dos dados linear.

    Nos dados:

    r= 0.9894207

    Por tanto comprova-se, a partir de R e r, o que havia sido proposto apenas observando os grficos.

    TESTE DE NORMALIDADE:

    Figura 5: Histograma dos resduos padronizados

    Para verificar a normalidade dos resduos foram feitos os grficos: Histograma dos resduos

    padronizados e o grfico Normal Q-Q Plot.

    No histograma verifica-se a normalidade pela curva normal que as barras devem formar. No caso do

    histograma dos resduos padronizados possvel observar a leve formao dessa curva, porm,

    como os nmeros de dados so pequenos, esta no se formou completamente.

  • 8

    Figura 5.1: Grfico dos quantis da normal

    O grfico de quantis normalizados determina a normal pelo comportamento dos pontos, onde esses

    devem se apresentar da forma mais linear possvel, ou seja, quando os pontos apresentam a

    formao de uma reta significa que a distribuio normal.

    Analisando o grfico Normal Q-Q plot pode-se concluir que os dados esto prximos de uma

    distribuio normal, pois embora no estejam em uma linearidade perfeita apresentam uma

    formao retilnea.

    AVALALIAO DO MODELO:

    ANLISE DOS RESDUOS

    Figura 2: Grfico de disperso dos erros na unidade.

    Por esse grfico possvel analisar como os resduos se comportam. Nesse caso, h tanto resduos

  • 9

    positivos quanto negativos, e levando em conta que a mdia dos erros necessariamente 0,

    possvel inferir que o modelo bom, pois tendo resduos em ambos os quadrantes (positivo e

    negativo) um anula o outro.

    Alm desse grfico, outro ponto que deve ser levado em considerao o erro padro dos resduos,

    essa medida muito importante, pois ela expressa quanto os valores observados variam em relao

    aos estimados em mdia. O erro mdio padro (Syx) dos resduos estudados : 0.00158. O que

    demonstra que os valores observados e os estimados esto prximos.

    H ainda o grfico de disperso dos erros padronizados, que so os erros normalizados ou

    Studentizados (t deStudent),

    Figura 2.1: Grfico de disperso dos resduos padronizados.

    Esse, alm de mostrar a disperso dos resduos, tambm nos mostra o intervalo de confiana. Ao

    analisar o grfico pode-se perceber que no h erros fora do intervalo de confiana.

    ANOVA:

    FONTES DE

    VARIAO

    G.L SQ QM Fcalc. Ftab

    Regresso 1 0.00150889 0.0015089 604.68 2.763e-12 ***

    Resduo 13 0.00003244 0.0000025 - - Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Para a aprovao do modelo necessrio verificar a seguinte hiptese:

    HIPTESE: =0,

    Ou seja, testar se beta () igual zero, pois quando isso acontece a reta do grfico no tem

    utilidade. impossvel prever algo.

    Para testar isso verifica-se os valores de F, pois se Fcalculado for menor que Rtabelado, significa que a

  • 10

    hiptese verdadeira e o modelo no bom. Para o modelo ajustado estudado Fcalculado maior

    que Ftabelado, como possvel ver na tabela acima. Sendo assim, rejeita-se a hiptese e aceita-se o

    modelo.

    Sendo assim, o modelo encontrado para esse caso :

    =0.90235+0.09875x

  • 11

    CONCLUSO

    Conforme os dados coletados e os dados construdos a partir do programa R, constatou-se que

    palpvel a relao entre os dados, com consistentes resultados alcanados. Em consequncia disso,

    possvel concluir que o estudo relevante como embase para a tomada de decises empresariais,

    que envolvam um plano a longo prazo e necessitem mapear o crescimento urbano do Estado de So

    Paulo.

  • 12

    REFERNCIAS BIBLIOGRFICAS

    INDICADORES E DADOS BASICOS BRASIL 2012. Grau de Urbanizao: Anos 1991 2000. Disponvel em:< http://tabnet.datasus.gov.br/cgi/idb2012/a04a.htm>. Acesso em: 10 Abr 2015 INDICADORES E DADOS BASICOS BRASIL 2012. Grau de Urbanizao: Anos 2000 2012. Disponvel em:< http://tabnet.datasus.gov.br/cgi/idb2012/a04b.htm>. Acesso em: 10 Abr 2015 INDICADORES E DADOS BASICOS BRASIL 2012. Escolaridade da populao de 15 anos ou mais: Anos: 1992-1993, 1995-1999. Disponvel em:. Acesso em: 14 Abr 2015 INDICADORES E DADOS BASICOS BRASIL 2012. Escolaridade da populao de 15 anos ou mais: 2001-2009, 2011-2012. Disponvel em: Acesso em: 14 Abr 2015 R-PROJECT. R: The R Project for Statistical Computing. Disponvel em: http://www.R-project.org/> Acesso em: 5 abr 2015