cap2entradadedados-1227661017183783-9
Transcript of cap2entradadedados-1227661017183783-9
-
8/4/2019 cap2entradadedados-1227661017183783-9
1/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 1
Prof. Afonso C. Medina
Prof. Leonardo Chwif
Coleta e Modelagem dos Dados de EntradaCaptulo 2Pginas 24-52
Este material disponibilizado para uso
exclusivode docentes que adotam o livroModelagem e Simulao de EventosDiscretosem suas disciplinas. O materialpode (e deve) ser editado pelo professor.
Pedimos apenas que seja sempre citadaafonte original de consulta.
Verso 0.119/04/06
-
8/4/2019 cap2entradadedados-1227661017183783-9
2/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 2
Coleta
Tratamento Inferncia
Trs Etapas
-
8/4/2019 cap2entradadedados-1227661017183783-9
3/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 3
1. Escolha adequada davarivel de estudo
2. O tamanho da amostra deve estarentre100 e 200 observaes. Amostras com
menos de 100 observaes podemcomprometer a identificao do melhormodelo probabilstico, e amostras com
mais de 200 observaes no trazemganhos significativos ao estudo;
Coleta dos Dados
-
8/4/2019 cap2entradadedados-1227661017183783-9
4/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 4
3. Coletar e anotar as observaesna mesmaordem em que o fenmeno est ocorrendo,para permitir a anlise de correlao ;
4. Se existe alguma suspeita de que os dadosmudam em funo do horrio ou do dia dacoleta, acoleta deve ser refeitaparaoutros horrios e dias. Na modelagem de
dados, vale a regra: toda suspeita deveser comprovada ou descartadaestatisticamente.
Coleta dos Dados
-
8/4/2019 cap2entradadedados-1227661017183783-9
5/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 5
Exemplo 2.1: Filas nos Caixas do Supermercado
Um gerente de supermercado est preocupadocom as filas formadas nos caixas de pagamentodurante um dos turnos de operao. Quais seriamas variveis de estudo para coleta de dados? (S)ou (N).
( ) O nmero de prateleiras no supermercado
( ) Os tempos de atendimento nos caixas
( ) O nmero de clientes em fila
( ) O tempo de permanncia dos clientes no supermercado
( ) Os tempos entre chegadas sucessivas de clientes noscaixas de pagamento
N
S
N
N
S
resultado!!
-
8/4/2019 cap2entradadedados-1227661017183783-9
6/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 6
Exemplo 2.1: Coleta de DadosIntervalo entre chegadas de pessoas nos caixas do supermercado(100 medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
-
8/4/2019 cap2entradadedados-1227661017183783-9
7/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 7
Exemplo 2.1: Medidas de Posio e Disperso
13,80Coeficiente Assimetria
493%Coeficiente de Variao
2.643,81Varincia da amostra
51,42Desvio padro
728Amplitude
Medidas de disperso
728Mximo
0Mnimo
3Moda
5Mediana
10,44Mdia
Medidas de posio
O 728 um outlier?
-
8/4/2019 cap2entradadedados-1227661017183783-9
8/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 8
Exemplo 2.1: OutlierIntervalo entre chegadas de pessoas nos caixas do supermercado(100 medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
-
8/4/2019 cap2entradadedados-1227661017183783-9
9/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 9
Outliers ou Valores Discrepantes Erro na coleta de dados. Este tipo de outlier o mais comum,
principalmente quando o levantamento de dados feito por meiomanual.
Eventos Raros. Nada impede que situaes totalmente atpicasocorram na nossa coleta de dados. Alguns exemplos:
Um dia de temperatura negativa no vero da cidade do Rio deJaneiro;
Um tempo de execuo de um operador ser muito curto emrelao aos melhores desempenhos obtidos naquela tarefa;
Um tempo de viagem de um caminho de entregas na cidade deSo Paulo, durante o horrio de rush, ser muito menor do quefora deste horrio.
-
8/4/2019 cap2entradadedados-1227661017183783-9
10/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 10
Exemplo 2.1: Outlier (valor discrepante)
43,602.643,81Varincia da amostra
55Mediana
6,8310,44Mdia
sem o
outlier
com o
outlier
Dados
-
8/4/2019 cap2entradadedados-1227661017183783-9
11/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 11
Identificao de Outliers: Box-plot
0
5
10
15
20
A B C Sries
Valores
mediana
outlier
Q1
Q3
Q1-1,5(Q3- Q1)
Q3+1,5(Q3- Q1)
-
8/4/2019 cap2entradadedados-1227661017183783-9
12/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 12
Anlise de Correlao
0
10
20
30
40
50
0 10 20 30 40 50Observao
k
Observao
k+1
Diagrama de disperso dos temposde atendimento do exemplo de
supermercado, mostrando que noh correlaoentre as observaesda amostra.
-
8/4/2019 cap2entradadedados-1227661017183783-9
13/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 13
10
12
14
16
18
20
10 12 14 16 18 20Observao
k
Observao
k+1
Anlise de CorrelaoDiagrama de disperso de umexemplo hipottico em que existe
correlaoentre os dados quecompem a amostra.
-
8/4/2019 cap2entradadedados-1227661017183783-9
14/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 14
Exemplo 2.1: Construo do Histograma
1. Definir o nmero de classes:nK 10log3,31+=
nK=
Ohistograma utilizado para identificar qual a distribuio a serajustada aos dados coletados ou utilizado diretamente dentro domodelo de simulao.
2. Definir otamanhodo intervalo:K
Amplitudeh =
3. Construir a tabela de freqncias
4. Construir o histograma
-
8/4/2019 cap2entradadedados-1227661017183783-9
15/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 15
Exemplo 2.1: HistogramaHistograma h=4.8
0
20
40
60
80
100
120
4.8 14.3 23.9 33.4 43
Bloco
Freqncia
-
8/4/2019 cap2entradadedados-1227661017183783-9
16/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 16
Exemplo 2.1: InfernciaQual o melhor modelo probabilstico oudistribuio estatstica que pode representar a
amostra coletada?Histograma h=4.8
0
20
40
60
80
100
120
4.8 14.3 23.9 33.4 43
Bloco
Freqncia
x
f(x )
1/
x
f(x )
x
f(x )
a bm
x
f(x)
=1=1
=1=0,5
Exponencial?
Normal?
Triangular?
Lognormal?
-
8/4/2019 cap2entradadedados-1227661017183783-9
17/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 17
Testes de Aderncia (no paramtricos)Testa avalidade ou noda hiptese de aderncia (ou hiptesenula) em confronto com a hiptese alternativa:
H0:o modelo adequadopara representar a distribuio da
populao.
Ha:o modelono adequadopara representar a distribuio da
populao.
Se a um dado nvel de significncia(100)% rejeitarmos H0, o modelo testadono adequadopara representar a distribuio da populao. O nvel designificncia equivale probabilidade de rejeitarmos a hiptese nula H0,
dado que ela est correta. Testes usuais:
Qui quadrado
Kolmogorov-Sminov
-
8/4/2019 cap2entradadedados-1227661017183783-9
18/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 18
Teste do Qui=quadrado
Inf Sup Exponencial Terica (T) Observada (O) (O-T)^2/T
0 4.8 0.5022 100 96 0.16
4.8 9.6 0.2500 50 55 0.55
9.6 14.3 0.1244 25 25 0.00
14.3 19.1 0.0620 12 13 0.04
19.1 1.0E+10 0.0614 12 10 0.40
E 1.15
Confiana5%
3
Valor Terico 7.81
p-value 0.76
Graus de liberdade
Limites Freqncias
Portanto,no
rejeitamos
a hiptese de que os dados
aderem ao modelo
exponencial
-
8/4/2019 cap2entradadedados-1227661017183783-9
19/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 19
P-value
Evidnciafraca ou inexistente contra ahiptese de aderncia
0,10p-value
Evidnciapotencialcontra a hiptese deaderncia
0,05p-value
-
8/4/2019 cap2entradadedados-1227661017183783-9
20/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 20
Distribuies discretas: Binomial
x
f( x )
-
8/4/2019 cap2entradadedados-1227661017183783-9
21/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 21
Distribuies discretas: Poisson
(x )
-
8/4/2019 cap2entradadedados-1227661017183783-9
22/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 22
Distribuies contnuas: Beta
0 0,5 1x
f(x )
=2
=1=3
=2
=4
=4
=2
=3
=1,5 =5 =6 =2
=2
=1
-
8/4/2019 cap2entradadedados-1227661017183783-9
23/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 23
Distribuies contnuas: Erlang
x
f(x )
=0,5 k= 3
=0,5
=0,2 k= 10
-
8/4/2019 cap2entradadedados-1227661017183783-9
24/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 24
Distribuies contnuas: Exponencial
x
f(x )
1/
-
8/4/2019 cap2entradadedados-1227661017183783-9
25/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 25
Distribuies contnuas: Gama
x
f(x )
=0,
=1
=2
-
8/4/2019 cap2entradadedados-1227661017183783-9
26/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 26
Distribuies contnuas: Lognormal
x
f(x )
=1 =1
=1 =0,5
-
8/4/2019 cap2entradadedados-1227661017183783-9
27/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 27
Distribuies contnuas: Normal
f(x )
-
8/4/2019 cap2entradadedados-1227661017183783-9
28/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 28
Distribuies contnuas: Uniforme
ba
1/(b-a )
x
f(x )
-
8/4/2019 cap2entradadedados-1227661017183783-9
29/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 29
Distribuies contnuas: Triangular
x
f(x )
a bm
-
8/4/2019 cap2entradadedados-1227661017183783-9
30/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 30
Distribuies contnuas: Weibull
x
f(x )
=0,5 =1
=1 =1 =2 =1
=3 =1
=3 =2
-
8/4/2019 cap2entradadedados-1227661017183783-9
31/31
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2006) Slide 31
Modelagem de dados... Sem dados!
Utilizada para a escolha de parmetros das entidades(por exemplo: em uma certa loja, 30% dos clientesrealizam suas compras no balco e 70% nas prateleiras)Quando se conhecem apenas valores intermedirios dadistribuio ou a porcentagem de ocorrncia de alguns
valores discretos
Apenas assume osvalores fornecidos peloanalista
Valores eprobabilidadede ocorrnciadestes valores
Discreta
Quando no se tem nenhuma informao sobre oprocesso ou apenas os valores limites (simulao do pior
caso)
Todos os valores nointervalo so
igualmente provveisde ocorrer
Maior valor e
menor valor
Uniforme
Quando a probabilidade de ocorrncia de valores acima
da mdia a mesma que valores abaixo da mdiaQuando o tempo de um processo pode ser considerado asoma de diversos tempos de sub-processosProcessos manuais
SimtricaForma de sinoVariabilidadecontrolada pelo desvio-padro
Mdia edesvio-padro
Normal
Quando se conhece ou se tem um bom chute sobre amoda (valor que mais ocorre), o menor valor e o maiorvalor que podem ocorrer
Simtrica ou noMenor valor,moda e maiorvalor
Triangular
Grande variabilidade dos valoresIndependncia entre um valor e outroMuitos valores baixos e poucos valores altosUtilizada para representar o tempo entre chegadas
sucessivas e o tempo entre falhas sucessivas
Varincia altaCauda para direita
MdiaExponencial
AplicabilidadeCaractersticasParmetrosDistribuio