Metodos 9 hoyos hdi_maio2011.doc

16
PONTIFICIA UNIVERSIDADE CATÓLICA DE SÂO PAULO FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE PÓS GRADUAÇÃO EM ADMINISTRAÇÃO MÉTODOS IX ANÁLISE DE AMOSTRAS SUPERVISIONADAS

description

 

Transcript of Metodos 9 hoyos hdi_maio2011.doc

Page 1: Metodos 9 hoyos hdi_maio2011.doc

PONTIFICIA UNIVERSIDADE CATÓLICA DE SÂO PAULO

FACULDADE DE ECONOMIA E ADMINISTRAÇÃO

PROGRAMA DE PÓS GRADUAÇÃO EM ADMINISTRAÇÃO

MÉTODOS IXANÁLISE DE AMOSTRAS SUPERVISIONADAS

PROF. DR. ARNOLDO HOYOS

ALUNO: CIRINEU JOSÉ DA COSTA

Page 2: Metodos 9 hoyos hdi_maio2011.doc

1. INTRODUÇÃO

O objetivo deste trabalho é efetuar uma pesquisa por amostragem de dados estatísticos representados por índices do Banco Mundial sobre o HDI com amostra supervisionada. O software estatístico utilizado é o MINITAB.

2. ENTENDENDO OS DADOS

2.1 Os Indivíduos

Os indivíduos desta análise são 36 países, classificados em função do índice de desenvolvimento humano (HDI), incluindo os países do BRICS (Brasil, Rússia, Índia, China e África do Sul).

2.2 As Variáveis

São 6 as variáveis desta pesquisa:

-Taxa de fertlidade adolescentes-Escolaridade das crianças-PIB per capita-valores do HDI-Expectativa de vida ao nascer-Taxa de Mortalidade infantil

3.TABELA

Link para tabela completa:http://info.worldbank.org

PAISES_50 TFA50_3 EC50_3PIBPC50_3 IDH50_3

EVN50_3 TMI50_3

Algeria 7,3 12,81 8320,2 0,677 72,9 1802Bahrain 16,7 14,31 26663,9 0,801 76 322Barbados 42,7 13,417 21672,6 0,788 77,7 162Belgium 7,7 15,91 34872,7 0,867 80,3 82Brazil 75,6 13,81 10607 0,699 72,9 1102Brunei Darussalam 25 14,01 49914,6 0,805 77,4 132Bulgaria 42,2 13,71 11139,2 0,743 73,7 112Canada 12,8 16,01 38668,4 0,888 81 72Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102Chile 59,6 14,51 13561 0,783 78,8 162

Page 3: Metodos 9 hoyos hdi_maio2011.doc

China 9,7 11,41 7258,5 0,663 73,5 452Czech Republic 10,6 15,21 22678,4 0,841 76,9 42El Salvador 82,7 12,11 6498,1 0,659 72 1702Fiji 31,5 13,01 4315,4 0,669 69,2 2102Gabon 89,9 12,71 12746,5 0,648 61,3 5202Guyana 62,7 12,21 3302,1 0,611 67,9 4702India 68,1 10,31 3337,4 0,519 64,4 4502Jamaica 77,3 11,71 7206,9 0,688 72,3 1702Maldives 13,4 12,41 5408,1 0,602 72,3 1202Malta 11,5 14,41 21004,3 0,815 80 82Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702Pakistan 45,7 6,81 2678,3 0,49 67,2 3202Papua New Guinea 55 5,21 2227,1 0,431 61,6 4702Portugal 16,5 15,51 22105,2 0,795 79,1 112Russian Federation 25,1 14,11 15258,2 0,719 67,2 282Saudi Arabia 26,1 13,51 24726 0,752 73,3 182Slovakia 20,7 14,91 21657,8 0,818 75,1 62South Africa 59,2 13,41 9812,1 0,597 52 4002Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582Suriname 39,5 12,01 7092,9 0,646 69,4 722Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242Yemen 68,1 8,61 2386,6 0,439 63,9 4302

Tabela retirados alguns outleyrs:

PAISES_50TFA50_3

EC50_3

PIBPC50_3

IDH50_3

EVN50_3

TMI50_3

CLUSTER

Algeria 7,3 12,81 8320,2 0,677 72,9 1802Bahrain 16,7 14,31 26663,9 0,801 76 322Barbados 42,7 13,417 21672,6 0,788 77,7 162Belgium 7,7 15,91 34872,7 0,867 80,3 82Brazil 75,6 13,81 10607 0,699 72,9 1102Bulgaria 42,2 13,71 11139,2 0,743 73,7 112Canada 12,8 16,01 38668,4 0,888 81 72Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102Chile 59,6 14,51 13561 0,783 78,8 162China 9,7 11,41 7258,5 0,663 73,5 452Czech Republic 10,6 15,21 22678,4 0,841 76,9 42El Salvador 82,7 12,11 6498,1 0,659 72 1702Fiji 31,5 13,01 4315,4 0,669 69,2 2102Guyana 62,7 12,21 3302,1 0,611 67,9 4702India 68,1 10,31 3337,4 0,519 64,4 4502Jamaica 77,3 11,71 7206,9 0,688 72,3 1702

Page 4: Metodos 9 hoyos hdi_maio2011.doc

Maldives 13,4 12,41 5408,1 0,602 72,3 1202Malta 11,5 14,41 21004,3 0,815 80 82Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702Portugal 16,5 15,51 22105,2 0,795 79,1 112Russian Federation 25,1 14,11 15258,2 0,719 67,2 282Saudi Arabia 26,1 13,51 24726 0,752 73,3 182Slovakia 20,7 14,91 21657,8 0,818 75,1 62South Africa 59,2 13,41 9812,1 0,597 52 4002Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582Suriname 39,5 12,01 7092,9 0,646 69,4 722Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242Yemen 68,1 8,61 2386,6 0,439 63,9 4302

4. PESQUISA POR AMOSTRAGEM

A pesquisa por amostra supervisionada, excluindo-se outliers, com 31 países, incluídos os BRICS.

4.1 Sumário

Sumário e Histogramas da amostra

48003600240012000

Median

Mean

2000150010005000

1st Quartile 162,0

Median 722,03rd Quartile 2102,0Maximum 5202,0

959,3 2114,4

254,2 1702,0

1359,9 2202,8

A-Squared 2,55

P-Value < 0,005

Mean 1536,9StDev 1681,2Variance 2826566,9

Skewness 0,980462Kurtosis -0,448315N 35

Minimum 42,0

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for TMI50_3

Page 5: Metodos 9 hoyos hdi_maio2011.doc

80726456

Median

Mean

747372717069

1st Quartile 67,300

Median 72,3003rd Quartile 76,000Maximum 81,000

69,146 73,534

69,261 73,770

5,166 8,367

A-Squared 0,42

P-Value 0,308

Mean 71,340StDev 6,386Variance 40,784

Skewness -0,83378Kurtosis 1,04493N 35

Minimum 52,000

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for EVN50_3

0,90,80,70,60,5

Median

Mean

0,740,720,700,680,660,640,62

1st Quartile 0,59700

Median 0,669003rd Quartile 0,78800Maximum 0,88800

0,63374 0,71741

0,62584 0,74087

0,09851 0,15957

A-Squared 0,25

P-Value 0,733

Mean 0,67557StDev 0,12179Variance 0,01483

Skewness -0,233093Kurtosis -0,707573N 35

Minimum 0,43100

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for IDH50_3

Page 6: Metodos 9 hoyos hdi_maio2011.doc

480003600024000120000

Median

Mean

1750015000125001000075005000

1st Quartile 3337

Median 83203rd Quartile 21673Maximum 49915

9162 17268

5335 14741

9543 15458

A-Squared 1,80

P-Value < 0,005

Mean 13215StDev 11798Variance 139189973

Skewness 1,34662Kurtosis 1,57235N 35

Minimum 2020

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for PIBPC50_3

151296

Median

Mean

13,513,012,512,011,5

1st Quartile 11,410

Median 12,7103rd Quartile 14,110Maximum 16,010

11,701 13,307

11,801 13,649

1,891 3,063

A-Squared 0,72

P-Value 0,055

Mean 12,504StDev 2,338Variance 5,464

Skewness -1,16937Kurtosis 2,20333N 35

Minimum 5,210

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for EC50_3

Page 7: Metodos 9 hoyos hdi_maio2011.doc

10080604020

Median

Mean

55504540353025

1st Quartile 16,500

Median 34,6003rd Quartile 62,700Maximum 112,700

32,182 51,818

25,030 54,634

23,119 37,448

A-Squared 0,81

P-Value 0,033

Mean 42,000StDev 28,582Variance 816,936

Skewness 0,680436Kurtosis -0,433690N 35

Minimum 7,300

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for TFA50_3

Amostra com 31 paises

40003000200010000

Median

Mean

2000150010005000

1st Quartile 162,0

Median 582,03rd Quartile 1802,0Maximum 4702,0

762,9 1853,4

222,5 1702,0

1187,8 1986,9

A-Squared 2,42

P-Value < 0,005

Mean 1308,1StDev 1486,4Variance 2209457,8

Skewness 1,21981Kurtosis 0,30502N 31

Minimum 42,0

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for TMI50_3_1

Page 8: Metodos 9 hoyos hdi_maio2011.doc

80757065605550

Median

Mean

747372717069

1st Quartile 68,200

Median 72,9003rd Quartile 76,000Maximum 81,000

69,668 74,164

69,738 73,995

4,898 8,192

A-Squared 0,48

P-Value 0,212

Mean 71,916StDev 6,129Variance 37,561

Skewness -1,10374Kurtosis 2,40625N 31

Minimum 52,000

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for EVN50_3_1

0,90,80,70,60,5

Median

Mean

0,7500,7250,7000,6750,650

1st Quartile 0,60200

Median 0,677003rd Quartile 0,78800Maximum 0,88800

0,64439 0,72793

0,63658 0,74592

0,09100 0,15222

A-Squared 0,17

P-Value 0,924

Mean 0,68616StDev 0,11388Variance 0,01297

Skewness -0,169425Kurtosis -0,627277N 31

Minimum 0,43900

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for IDH50_3_1

Page 9: Metodos 9 hoyos hdi_maio2011.doc

400003000020000100000

Median

Mean

1750015000125001000075005000

1st Quartile 4315

Median 83203rd Quartile 21673Maximum 38668

8984 16497

5374 17124

8184 13690

A-Squared 1,51

P-Value < 0,005

Mean 12740StDev 10241Variance 104888050

Skewness 0,943303Kurtosis -0,031457N 31

Minimum 2020

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for PIBPC50_3_1

16141210

Median

Mean

14,013,513,012,512,0

1st Quartile 11,410

Median 12,8103rd Quartile 14,310Maximum 16,010

12,220 13,517

11,913 13,742

1,413 2,363

A-Squared 0,29

P-Value 0,585

Mean 12,868StDev 1,768Variance 3,125

Skewness -0,085689Kurtosis -0,299141N 31

Minimum 8,610

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for EC50_3_1

Page 10: Metodos 9 hoyos hdi_maio2011.doc

1209060300

Median

Mean

6050403020

1st Quartile 13,400

Median 31,5003rd Quartile 62,700Maximum 112,700

29,889 51,040

19,401 55,554

23,039 38,538

A-Squared 0,91

P-Value 0,018

Mean 40,465StDev 28,831Variance 831,221

Skewness 0,768804Kurtosis -0,280749N 31

Minimum 7,300

Anderson-Darling Normality Test

95% Confidence I nterval for Mean

95% Confidence I nterval for Median

95% Confidence I nterval for StDev95% Confidence I ntervals

Summary for TFA50_3_1

5. ANÁLISE DE DADOS

5.1.2 Dendograma

Page 11: Metodos 9 hoyos hdi_maio2011.doc

7429

22

18

11

20

2332

24

21965

31

15

14

28

30

13

27

198

25

17

16

12

26

101

77,61

85,08

92,54

100,00

Observations

Sim

ilarity

DendrogramSingle Linkage; Euclidean Distance

Cluster Analysis of Observations: TFA50_3_1; EC50_3_1; PIBPC50_3_1; ...

Euclidean Distance, Single LinkageAmalgamation Steps

Number of obs. Number of Similarity Distance Clusters New in newStep clusters level level joined cluster cluster 1 30 99,7179 103,50 3 23 3 2 2 29 99,4461 203,20 14 15 14 2 3 28 99,1327 318,16 10 26 10 2 4 27 98,8107 436,27 3 20 3 3 5 26 98,4899 553,99 19 27 19 2 6 25 98,4683 561,91 22 29 22 2 7 24 98,4258 577,49 3 11 3 4 8 23 98,2175 653,89 3 18 3 5 9 22 98,0678 708,82 12 16 12 2 10 21 97,7906 810,52 17 25 17 2 11 20 97,7108 839,80 8 19 8 3 12 19 97,3515 971,61 14 31 14 3 13 18 97,3086 987,34 10 12 10 4 14 17 97,2419 1011,79 8 13 8 4 15 16 96,9470 1119,97 1 10 1 5 16 15 96,9347 1124,48 5 6 5 2 17 14 96,7256 1201,21 1 17 1 7 18 13 96,1408 1415,74 1 8 1 11 19 12 95,7687 1552,22 1 30 1 12 20 11 95,6160 1608,25 3 22 3 7 21 10 95,3609 1701,83 9 21 9 2 22 9 94,7036 1942,98 2 3 2 8 23 8 94,6400 1966,29 1 28 1 13 24 7 94,3116 2086,76 1 14 1 16 25 6 93,4782 2392,51 1 5 1 18 26 5 93,3968 2422,38 1 9 1 20

Page 12: Metodos 9 hoyos hdi_maio2011.doc

27 4 92,7525 2658,74 1 24 1 21 28 3 89,6531 3795,72 4 7 4 2 29 2 84,3270 5749,61 1 2 1 29 30 1 77,6138 8212,31 1 4 1 31

Final PartitionNumber of clusters: 3

Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroidCluster1 21 331798596 3392,21 8890,59Cluster2 8 26448534 1594,60 3574,16Cluster3 2 7203733 1897,86 1897,86

Cluster Centroids

GrandVariable Cluster1 Cluster2 Cluster3 centroidTFA50_3_1 50,21 22,4 10,3 40,5EC50_3_1 12,11 14,1 16,0 12,9PIBPC50_3_1 6508,14 23092,7 36770,6 12740,4IDH50_3_1 0,63 0,8 0,9 0,7EVN50_3_1 69,53 76,0 80,7 71,9TMI50_3_1 1856,29 177,0 77,0 1308,1

Distances Between Cluster Centroids

Cluster1 Cluster2 Cluster3Cluster1 0,0 16669,4 30314,7Cluster2 16669,4 0,0 13678,2Cluster3 30314,7 13678,2 0,0

Ficamos então com 3 clusters que englobam os seguintes países:

CLUSTER 1: 1-10-26-12-16-17-25-8-19-27-13-30-28-14-15-31-5-6-9-21-24PAISES TFA EC50 PIBPC50 IDH EVN TMI CLUSTER

1 Algeria 7,3 12,81 8320,2 0,677 72,9 1802 15 Brazil 75,6 13,81 10607 0,699 72,9 1102 16 Bulgaria 42,2 13,71 11139,2 0,743 73,7 112 18 Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102 19 Chile 59,6 14,51 13561 0,783 78,8 162 1

10 China 9,7 11,41 7258,5 0,663 73,5 452 112 El Salvador 82,7 12,11 6498,1 0,659 72 1702 113 Fiji 31,5 13,01 4315,4 0,669 69,2 2102 114 Guyana 62,7 12,21 3302,1 0,611 67,9 4702 115 India 68,1 10,31 3337,4 0,519 64,4 4502 116 Jamaica 77,3 11,71 7206,9 0,688 72,3 1702 117 Maldives 13,4 12,41 5408,1 0,602 72,3 1202 119 Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702 1

Page 13: Metodos 9 hoyos hdi_maio2011.doc

21 Russian Federation 25,1 14,11 15258,2 0,719 67,2 282 124 South Africa 59,2 13,41 9812,1 0,597 52 4002 125 Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582 126 Suriname 39,5 12,01 7092,9 0,646 69,4 722 127 Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702 128 Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802 130 Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242 131 Yemen 68,1 8,61 2386,6 0,439 63,9 4302 1

CLUSTER 2: 2-3-23-20-11-18-22-29

PAISES TFA EC PIBPC IDH EVN TMICLUSTER

2 Bahrain 16,7 14,31 26663,9 0,801 76 322 23 Barbados 42,7 13,417 21672,6 0,788 77,7 162 211 Czech Republic 10,6 15,21 22678,4 0,841 76,9 42 218 Malta 11,5 14,41 21004,3 0,815 80 82 220 Portugal 16,5 15,51 22105,2 0,795 79,1 112 222 Saudi Arabia 26,1 13,51 24726 0,752 73,3 182 223 Slovakia 20,7 14,91 21657,8 0,818 75,1 62 229

Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452 2

CLUSTER 3: 4-7

PAISES TFA EC50 PIBPC IDH EVN TMI CLUSTER

4 Belgium 7,7 15,9134872,

7 0,867 80,3 82 3

7 Canada 12,8 16,0138668,

4 0,888 81 72 3

6. CONCLUSÕES

Constatamos então que os BRICS (Brasil, Índia, Rússia, China e África do Sul) ficaram todos no CLUSTER 1.

Este cluster apresenta as seguintes médias:

Page 14: Metodos 9 hoyos hdi_maio2011.doc

a)Taxa de fertilidade de adolescentes com valor de 50,21 superior à média do cluster 2 (22,4) e do cluster 3 (10,3);

b)Escolaridade das crianças com valor de 12,11 inferior à do cluster 2 (14,1) e do cluster 3 (16,0);

c) Produto Interno Bruto per capita com valor de 6508,14 também inferior ao cluster 2 (23092,70) e cluster 3 (36770,60);

d)Expectativa de vida ao nascer com valor de 69,53 também abaixo dos valores dos clusters 2 (76 anos) e 3 (80,7 anos).

Os BRICS foram agrupados, dentro desta amostra supervisionada, em um cluster que abriga os países com os piores índices das taxas avaliadas.

O cluster 2 abriga os países com índices medianos e o cluster 3 abriga 2 países da amostra com os melhores índices.( Bélgica e Canadá).(Taxa de fertilidade de adolescentes de 10,3; Escolaridade das crianças de 16 anos; PIB per capita de 36.770,60; IDH de 0,90; expectativa de vida ao nascer de 80,7 anos e taxa de mortalidade infantil de 77,0 .