Post on 19-Dec-2014
description
PONTIFICIA UNIVERSIDADE CATÓLICA DE SÂO PAULO
FACULDADE DE ECONOMIA E ADMINISTRAÇÃO
PROGRAMA DE PÓS GRADUAÇÃO EM ADMINISTRAÇÃO
MÉTODOS IXANÁLISE DE AMOSTRAS SUPERVISIONADAS
PROF. DR. ARNOLDO HOYOS
ALUNO: CIRINEU JOSÉ DA COSTA
1. INTRODUÇÃO
O objetivo deste trabalho é efetuar uma pesquisa por amostragem de dados estatísticos representados por índices do Banco Mundial sobre o HDI com amostra supervisionada. O software estatístico utilizado é o MINITAB.
2. ENTENDENDO OS DADOS
2.1 Os Indivíduos
Os indivíduos desta análise são 36 países, classificados em função do índice de desenvolvimento humano (HDI), incluindo os países do BRICS (Brasil, Rússia, Índia, China e África do Sul).
2.2 As Variáveis
São 6 as variáveis desta pesquisa:
-Taxa de fertlidade adolescentes-Escolaridade das crianças-PIB per capita-valores do HDI-Expectativa de vida ao nascer-Taxa de Mortalidade infantil
3.TABELA
Link para tabela completa:http://info.worldbank.org
PAISES_50 TFA50_3 EC50_3PIBPC50_3 IDH50_3
EVN50_3 TMI50_3
Algeria 7,3 12,81 8320,2 0,677 72,9 1802Bahrain 16,7 14,31 26663,9 0,801 76 322Barbados 42,7 13,417 21672,6 0,788 77,7 162Belgium 7,7 15,91 34872,7 0,867 80,3 82Brazil 75,6 13,81 10607 0,699 72,9 1102Brunei Darussalam 25 14,01 49914,6 0,805 77,4 132Bulgaria 42,2 13,71 11139,2 0,743 73,7 112Canada 12,8 16,01 38668,4 0,888 81 72Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102Chile 59,6 14,51 13561 0,783 78,8 162
China 9,7 11,41 7258,5 0,663 73,5 452Czech Republic 10,6 15,21 22678,4 0,841 76,9 42El Salvador 82,7 12,11 6498,1 0,659 72 1702Fiji 31,5 13,01 4315,4 0,669 69,2 2102Gabon 89,9 12,71 12746,5 0,648 61,3 5202Guyana 62,7 12,21 3302,1 0,611 67,9 4702India 68,1 10,31 3337,4 0,519 64,4 4502Jamaica 77,3 11,71 7206,9 0,688 72,3 1702Maldives 13,4 12,41 5408,1 0,602 72,3 1202Malta 11,5 14,41 21004,3 0,815 80 82Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702Pakistan 45,7 6,81 2678,3 0,49 67,2 3202Papua New Guinea 55 5,21 2227,1 0,431 61,6 4702Portugal 16,5 15,51 22105,2 0,795 79,1 112Russian Federation 25,1 14,11 15258,2 0,719 67,2 282Saudi Arabia 26,1 13,51 24726 0,752 73,3 182Slovakia 20,7 14,91 21657,8 0,818 75,1 62South Africa 59,2 13,41 9812,1 0,597 52 4002Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582Suriname 39,5 12,01 7092,9 0,646 69,4 722Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242Yemen 68,1 8,61 2386,6 0,439 63,9 4302
Tabela retirados alguns outleyrs:
PAISES_50TFA50_3
EC50_3
PIBPC50_3
IDH50_3
EVN50_3
TMI50_3
CLUSTER
Algeria 7,3 12,81 8320,2 0,677 72,9 1802Bahrain 16,7 14,31 26663,9 0,801 76 322Barbados 42,7 13,417 21672,6 0,788 77,7 162Belgium 7,7 15,91 34872,7 0,867 80,3 82Brazil 75,6 13,81 10607 0,699 72,9 1102Bulgaria 42,2 13,71 11139,2 0,743 73,7 112Canada 12,8 16,01 38668,4 0,888 81 72Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102Chile 59,6 14,51 13561 0,783 78,8 162China 9,7 11,41 7258,5 0,663 73,5 452Czech Republic 10,6 15,21 22678,4 0,841 76,9 42El Salvador 82,7 12,11 6498,1 0,659 72 1702Fiji 31,5 13,01 4315,4 0,669 69,2 2102Guyana 62,7 12,21 3302,1 0,611 67,9 4702India 68,1 10,31 3337,4 0,519 64,4 4502Jamaica 77,3 11,71 7206,9 0,688 72,3 1702
Maldives 13,4 12,41 5408,1 0,602 72,3 1202Malta 11,5 14,41 21004,3 0,815 80 82Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702Portugal 16,5 15,51 22105,2 0,795 79,1 112Russian Federation 25,1 14,11 15258,2 0,719 67,2 282Saudi Arabia 26,1 13,51 24726 0,752 73,3 182Slovakia 20,7 14,91 21657,8 0,818 75,1 62South Africa 59,2 13,41 9812,1 0,597 52 4002Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582Suriname 39,5 12,01 7092,9 0,646 69,4 722Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242Yemen 68,1 8,61 2386,6 0,439 63,9 4302
4. PESQUISA POR AMOSTRAGEM
A pesquisa por amostra supervisionada, excluindo-se outliers, com 31 países, incluídos os BRICS.
4.1 Sumário
Sumário e Histogramas da amostra
48003600240012000
Median
Mean
2000150010005000
1st Quartile 162,0
Median 722,03rd Quartile 2102,0Maximum 5202,0
959,3 2114,4
254,2 1702,0
1359,9 2202,8
A-Squared 2,55
P-Value < 0,005
Mean 1536,9StDev 1681,2Variance 2826566,9
Skewness 0,980462Kurtosis -0,448315N 35
Minimum 42,0
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for TMI50_3
80726456
Median
Mean
747372717069
1st Quartile 67,300
Median 72,3003rd Quartile 76,000Maximum 81,000
69,146 73,534
69,261 73,770
5,166 8,367
A-Squared 0,42
P-Value 0,308
Mean 71,340StDev 6,386Variance 40,784
Skewness -0,83378Kurtosis 1,04493N 35
Minimum 52,000
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for EVN50_3
0,90,80,70,60,5
Median
Mean
0,740,720,700,680,660,640,62
1st Quartile 0,59700
Median 0,669003rd Quartile 0,78800Maximum 0,88800
0,63374 0,71741
0,62584 0,74087
0,09851 0,15957
A-Squared 0,25
P-Value 0,733
Mean 0,67557StDev 0,12179Variance 0,01483
Skewness -0,233093Kurtosis -0,707573N 35
Minimum 0,43100
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for IDH50_3
480003600024000120000
Median
Mean
1750015000125001000075005000
1st Quartile 3337
Median 83203rd Quartile 21673Maximum 49915
9162 17268
5335 14741
9543 15458
A-Squared 1,80
P-Value < 0,005
Mean 13215StDev 11798Variance 139189973
Skewness 1,34662Kurtosis 1,57235N 35
Minimum 2020
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for PIBPC50_3
151296
Median
Mean
13,513,012,512,011,5
1st Quartile 11,410
Median 12,7103rd Quartile 14,110Maximum 16,010
11,701 13,307
11,801 13,649
1,891 3,063
A-Squared 0,72
P-Value 0,055
Mean 12,504StDev 2,338Variance 5,464
Skewness -1,16937Kurtosis 2,20333N 35
Minimum 5,210
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for EC50_3
10080604020
Median
Mean
55504540353025
1st Quartile 16,500
Median 34,6003rd Quartile 62,700Maximum 112,700
32,182 51,818
25,030 54,634
23,119 37,448
A-Squared 0,81
P-Value 0,033
Mean 42,000StDev 28,582Variance 816,936
Skewness 0,680436Kurtosis -0,433690N 35
Minimum 7,300
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for TFA50_3
Amostra com 31 paises
40003000200010000
Median
Mean
2000150010005000
1st Quartile 162,0
Median 582,03rd Quartile 1802,0Maximum 4702,0
762,9 1853,4
222,5 1702,0
1187,8 1986,9
A-Squared 2,42
P-Value < 0,005
Mean 1308,1StDev 1486,4Variance 2209457,8
Skewness 1,21981Kurtosis 0,30502N 31
Minimum 42,0
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for TMI50_3_1
80757065605550
Median
Mean
747372717069
1st Quartile 68,200
Median 72,9003rd Quartile 76,000Maximum 81,000
69,668 74,164
69,738 73,995
4,898 8,192
A-Squared 0,48
P-Value 0,212
Mean 71,916StDev 6,129Variance 37,561
Skewness -1,10374Kurtosis 2,40625N 31
Minimum 52,000
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for EVN50_3_1
0,90,80,70,60,5
Median
Mean
0,7500,7250,7000,6750,650
1st Quartile 0,60200
Median 0,677003rd Quartile 0,78800Maximum 0,88800
0,64439 0,72793
0,63658 0,74592
0,09100 0,15222
A-Squared 0,17
P-Value 0,924
Mean 0,68616StDev 0,11388Variance 0,01297
Skewness -0,169425Kurtosis -0,627277N 31
Minimum 0,43900
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for IDH50_3_1
400003000020000100000
Median
Mean
1750015000125001000075005000
1st Quartile 4315
Median 83203rd Quartile 21673Maximum 38668
8984 16497
5374 17124
8184 13690
A-Squared 1,51
P-Value < 0,005
Mean 12740StDev 10241Variance 104888050
Skewness 0,943303Kurtosis -0,031457N 31
Minimum 2020
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for PIBPC50_3_1
16141210
Median
Mean
14,013,513,012,512,0
1st Quartile 11,410
Median 12,8103rd Quartile 14,310Maximum 16,010
12,220 13,517
11,913 13,742
1,413 2,363
A-Squared 0,29
P-Value 0,585
Mean 12,868StDev 1,768Variance 3,125
Skewness -0,085689Kurtosis -0,299141N 31
Minimum 8,610
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for EC50_3_1
1209060300
Median
Mean
6050403020
1st Quartile 13,400
Median 31,5003rd Quartile 62,700Maximum 112,700
29,889 51,040
19,401 55,554
23,039 38,538
A-Squared 0,91
P-Value 0,018
Mean 40,465StDev 28,831Variance 831,221
Skewness 0,768804Kurtosis -0,280749N 31
Minimum 7,300
Anderson-Darling Normality Test
95% Confidence I nterval for Mean
95% Confidence I nterval for Median
95% Confidence I nterval for StDev95% Confidence I ntervals
Summary for TFA50_3_1
5. ANÁLISE DE DADOS
5.1.2 Dendograma
7429
22
18
11
20
2332
24
21965
31
15
14
28
30
13
27
198
25
17
16
12
26
101
77,61
85,08
92,54
100,00
Observations
Sim
ilarity
DendrogramSingle Linkage; Euclidean Distance
Cluster Analysis of Observations: TFA50_3_1; EC50_3_1; PIBPC50_3_1; ...
Euclidean Distance, Single LinkageAmalgamation Steps
Number of obs. Number of Similarity Distance Clusters New in newStep clusters level level joined cluster cluster 1 30 99,7179 103,50 3 23 3 2 2 29 99,4461 203,20 14 15 14 2 3 28 99,1327 318,16 10 26 10 2 4 27 98,8107 436,27 3 20 3 3 5 26 98,4899 553,99 19 27 19 2 6 25 98,4683 561,91 22 29 22 2 7 24 98,4258 577,49 3 11 3 4 8 23 98,2175 653,89 3 18 3 5 9 22 98,0678 708,82 12 16 12 2 10 21 97,7906 810,52 17 25 17 2 11 20 97,7108 839,80 8 19 8 3 12 19 97,3515 971,61 14 31 14 3 13 18 97,3086 987,34 10 12 10 4 14 17 97,2419 1011,79 8 13 8 4 15 16 96,9470 1119,97 1 10 1 5 16 15 96,9347 1124,48 5 6 5 2 17 14 96,7256 1201,21 1 17 1 7 18 13 96,1408 1415,74 1 8 1 11 19 12 95,7687 1552,22 1 30 1 12 20 11 95,6160 1608,25 3 22 3 7 21 10 95,3609 1701,83 9 21 9 2 22 9 94,7036 1942,98 2 3 2 8 23 8 94,6400 1966,29 1 28 1 13 24 7 94,3116 2086,76 1 14 1 16 25 6 93,4782 2392,51 1 5 1 18 26 5 93,3968 2422,38 1 9 1 20
27 4 92,7525 2658,74 1 24 1 21 28 3 89,6531 3795,72 4 7 4 2 29 2 84,3270 5749,61 1 2 1 29 30 1 77,6138 8212,31 1 4 1 31
Final PartitionNumber of clusters: 3
Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroidCluster1 21 331798596 3392,21 8890,59Cluster2 8 26448534 1594,60 3574,16Cluster3 2 7203733 1897,86 1897,86
Cluster Centroids
GrandVariable Cluster1 Cluster2 Cluster3 centroidTFA50_3_1 50,21 22,4 10,3 40,5EC50_3_1 12,11 14,1 16,0 12,9PIBPC50_3_1 6508,14 23092,7 36770,6 12740,4IDH50_3_1 0,63 0,8 0,9 0,7EVN50_3_1 69,53 76,0 80,7 71,9TMI50_3_1 1856,29 177,0 77,0 1308,1
Distances Between Cluster Centroids
Cluster1 Cluster2 Cluster3Cluster1 0,0 16669,4 30314,7Cluster2 16669,4 0,0 13678,2Cluster3 30314,7 13678,2 0,0
Ficamos então com 3 clusters que englobam os seguintes países:
CLUSTER 1: 1-10-26-12-16-17-25-8-19-27-13-30-28-14-15-31-5-6-9-21-24PAISES TFA EC50 PIBPC50 IDH EVN TMI CLUSTER
1 Algeria 7,3 12,81 8320,2 0,677 72,9 1802 15 Brazil 75,6 13,81 10607 0,699 72,9 1102 16 Bulgaria 42,2 13,71 11139,2 0,743 73,7 112 18 Cape Verde 94,9 11,21 3305,6 0,534 71,9 2102 19 Chile 59,6 14,51 13561 0,783 78,8 162 1
10 China 9,7 11,41 7258,5 0,663 73,5 452 112 El Salvador 82,7 12,11 6498,1 0,659 72 1702 113 Fiji 31,5 13,01 4315,4 0,669 69,2 2102 114 Guyana 62,7 12,21 3302,1 0,611 67,9 4702 115 India 68,1 10,31 3337,4 0,519 64,4 4502 116 Jamaica 77,3 11,71 7206,9 0,688 72,3 1702 117 Maldives 13,4 12,41 5408,1 0,602 72,3 1202 119 Nicaragua 112,7 10,81 2567,4 0,565 73,8 1702 1
21 Russian Federation 25,1 14,11 15258,2 0,719 67,2 282 124 South Africa 59,2 13,41 9812,1 0,597 52 4002 125 Sri Lanka 29,8 12,01 4886,3 0,658 74,4 582 126 Suriname 39,5 12,01 7092,9 0,646 69,4 722 127 Tajikistan 28,4 11,41 2019,9 0,58 67,3 1702 128 Timor-Leste 53,8 11,21 5303,2 0,502 62,1 3802 130 Uzbekistan 12,9 11,51 3084,9 0,617 68,2 242 131 Yemen 68,1 8,61 2386,6 0,439 63,9 4302 1
CLUSTER 2: 2-3-23-20-11-18-22-29
PAISES TFA EC PIBPC IDH EVN TMICLUSTER
2 Bahrain 16,7 14,31 26663,9 0,801 76 322 23 Barbados 42,7 13,417 21672,6 0,788 77,7 162 211 Czech Republic 10,6 15,21 22678,4 0,841 76,9 42 218 Malta 11,5 14,41 21004,3 0,815 80 82 220 Portugal 16,5 15,51 22105,2 0,795 79,1 112 222 Saudi Arabia 26,1 13,51 24726 0,752 73,3 182 223 Slovakia 20,7 14,91 21657,8 0,818 75,1 62 229
Trinidad and Tobago 34,6 11,41 24233,3 0,736 69,9 452 2
CLUSTER 3: 4-7
PAISES TFA EC50 PIBPC IDH EVN TMI CLUSTER
4 Belgium 7,7 15,9134872,
7 0,867 80,3 82 3
7 Canada 12,8 16,0138668,
4 0,888 81 72 3
6. CONCLUSÕES
Constatamos então que os BRICS (Brasil, Índia, Rússia, China e África do Sul) ficaram todos no CLUSTER 1.
Este cluster apresenta as seguintes médias:
a)Taxa de fertilidade de adolescentes com valor de 50,21 superior à média do cluster 2 (22,4) e do cluster 3 (10,3);
b)Escolaridade das crianças com valor de 12,11 inferior à do cluster 2 (14,1) e do cluster 3 (16,0);
c) Produto Interno Bruto per capita com valor de 6508,14 também inferior ao cluster 2 (23092,70) e cluster 3 (36770,60);
d)Expectativa de vida ao nascer com valor de 69,53 também abaixo dos valores dos clusters 2 (76 anos) e 3 (80,7 anos).
Os BRICS foram agrupados, dentro desta amostra supervisionada, em um cluster que abriga os países com os piores índices das taxas avaliadas.
O cluster 2 abriga os países com índices medianos e o cluster 3 abriga 2 países da amostra com os melhores índices.( Bélgica e Canadá).(Taxa de fertilidade de adolescentes de 10,3; Escolaridade das crianças de 16 anos; PIB per capita de 36.770,60; IDH de 0,90; expectativa de vida ao nascer de 80,7 anos e taxa de mortalidade infantil de 77,0 .