Variáveis Contínuas - mat.ufrgs.brviali/estatistica/mat2274/material/laminas/Comp... · O...
Transcript of Variáveis Contínuas - mat.ufrgs.brviali/estatistica/mat2274/material/laminas/Comp... · O...
1
Prof. Lorí Viali, Dr.
http://www.ufrgs.br/~viali/
Mat02274Estatística Computacional
04Métodos de Geração
de Variáveis Aleatórias
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Existem algumas técnicas para a geração
de variáveis aleatórias. O tipo de algoritmo a
ser utilizado depende da distribuição que se
quer gerar.
Contudo, quase todas as técnicas podem
ser classificadas conforme suas bases teóricas.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
As principais abordagens são:
(i) Inversão;
(ii) Composição;
(iii) Convolução;
(iv) Aceitação e Rejeição;
(v) Propriedades Especiais.
Método da
Transformada
Inversa
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Suponha que se queira gerar uma
variável contínua X com FDA F(x).
Vamos admitir que a inversa existe e que
será representada por F-1(x). Então um
algoritmo para gerar valores da VAC X
com fdp f(x) é:
Variáveis Contínuas
2
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
1. Gerar u ≈ U(0, 1);
2. Fazer x = F-1(u).
Note-se que F-1(u) vai sempre
estar definida, pois 0 ≤ u ≤ 1 e a
imagem da F é o intervalo [0, 1].
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Ilustração do Método da Inversão
u2
u1
x1x2
F(x)
x
1
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para mostrar que o valor de X obtido
com o algoritmo anterior, denominado de
método da transformada inversa, tem a
desejada distribuição F, é preciso mostrar
que para qualquer número real x, P(X ≤ x)
= F(x).
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Mas, como F é inversível, tem-se:
P(X ≤ x) = P[F-1(U) ≤ x] = P[F(F-1(U)) ≤ F(x)]
= P[U ≤ F(x)] = P[0 ≤ U ≤ F(x)] =
= F(x) – 0 = F(x).
Onde a última igualdade segue do fato de
que U ≈ U(0, 1) e 0 ≤ F(x) ≤ 1.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Seja X uma VAC com uma distribuição
W(α, β). Assim a fdp de X é:
A FDA de X é:
Exemplo
≤
>βα=βα−
α−−α
0 x se 0
0 x se ex)x(f)/x(1
≤
>−=∫=
βα
−
0 x se 0
0 x se e1du)u(f)x(F)/x(
x0
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Resolvendo U = F(x) para X, tem-se:
Uma vez que 1 – U ~U(0, 1) pode-se
escrever: X = β[-ln(U)]1/α
Exemplo
)]U1ln([X
)U1ln()/x(
U1e
e1U
/1
)/x(
)/x(
−−β=
−=β−
−=
−=
α
α
−
−
β
β
α
α
3
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Gere 10000 valores de uma W(2, 3).
Represente graficamente a distribuição e o
modelo. Compare os parâmetros do modelo e
estime os seus valores com os dados obtidos,
determinando as seguintes medidas: média,
desvio, mediana, assimetria e curtose.
Exercício
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Seja X uma VAD onde p(xi) é a
função de probabilidade, isto é, p(xi) =
P(X = xi).
Vamos supor que X possa assumir os
valores x1, x2, ..., xn, ..., onde x1 < x2 < ...
< xn < .... Então o algoritmo é:
Variáveis Discretas
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
1. Gerar U ≈ U(0, 1);
2. Determinar o menor inteiro positivo I tal
que U ≤ F(xI) e retornar X = xI.
Para verificar que o método da
transformada inversa discreta é válido, devemos
mostrar que P(X = xi) = pi para todo i.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Método da Inversão para variáveis discretas
xp(x1)
p(x2)
p(x3)
p(x4)
p(x5)
p(x6)
x1 x2 x3 x4 x5 x6
X
u
F(x)
1
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para i = 1, teremos X = x1 se e só se U ≤
F(x1) = p(x1), uma vez que os valores xi estão em
ordem crescente. Como U ≈ U(0, 1), P(X = x1) =
p(x1) como o requerido. Para i ≥ 2, o algoritmo
coloca X = xi se e só se F(xi-1) < U ≤ F(xi), já
que o i determinado pelo algoritmo é o menor
inteiro positivo tal que U ≤ F(xi).
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Seja X uma VAD assumindo os
valores: 1, 2, ..., 10 com probabilidades
1/10 para x = 1, 2, ..., 10. Gerar 5000
valores dessa distribuição. Representar
graficamente e determinar: média,
desvio, mediana, assimetria e curtose.
Exercício
4
Método da
Aceitação Rejeição
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Suponha que desejamos uma
amostra de uma VAC com fdp f(x) e que
isso não possa ser feito pelo método da
Inversão.
Suponha que sejam válidas as
seguintes hipóteses:
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
1. Existe uma função r(x) que domina f(x),
isto é, r(x) ≥ f(x) para todo x.
2. É possível gerar pontos uniformente
espalhadas sob o gráfico da r(x), acima
do eixo x. Representa-se as coordenadas
de um desses pontos por (X, Y).
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
3. Se o gráfico da r(x) é esboçado no
mesmo diagrama, os pontos (X, Y)
estarão acima ou abaixo dele de acordo
com Y > f(X) ou Y ≤ f(X).
4. Se a função r(x) não for uma fdp então
fazer g(x) = r(x)/c, onde c é a área da r(x).
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
1. Gerar Y tendo uma densidade g(x).
2. Gerar U(0, 1) (independente de Y em um).
3. Se U ≤ f(Y)/r(Y), retorna X = Y e pare;
senão volte para o passo um e tente
novamente (repita até que uma aceitação
aconteça no passo 3).
O Algoritmo
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Seja B(4, 3), isto é, com fdp dada por
f(x) = 60x3(1 – x)2 se 0 ≤ x ≤ 1 e 0 cc.
O topo da densidade é f(0,6) =
2,0736. Vamos fazer r(x) = 2,0736 se
0 ≤ x ≤ 1. Assim c = 2,0736 e g(x) =
r(x)/c e, portanto, g(x) é uma U(0,1).
Exemplo
5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Ilustração do Método da Aceitação-Rejeição
PontosRejeitados
PontosAceitos
x x x x
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
1. Gerar Y ~ U(0, 1).
2. Gerar U ~ U(0, 1) (independente de Y).
3. Se U ≤ 60Y3(1 – Y)2/2,0736, retorna
X = Y e para, senão volta ao passo 1.
O Algoritmo
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Gerar 10000 valores da variável
aleatória abaixo, utilizando o método
da Aceitação/Rejeição.
Exercício
c. c. 0
0 x se e4x)x(f
-2x
≥
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para obter uma função r(x) simples
para simular valores de f(x) vamos
desconsiderar valores acima de x = 5,
pois se x < 5, F(x) = 0,9995.
Solução
c. c. 0
0 x se e4x)x(f
-2x
≥
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então uma função r(x) poderá
ser:
A função g(x) será obtida
integrando a r(x) no intervalo
considerado.
c. c. 0
5 x 0 se x/5-1)x(r
≤≤
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então uma função r(x) poderá ser:
A função g(x) será obtida
integrando a r(x) no intervalo
considerado.
c. c. 0
5 x 0 se x/5-1)x(r
≤≤
=
6
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Assim a função g(x) será:
A função g(x) é obtida integrando a
r(x) no intervalo considerado e
dividindo r(x) pela área obtida.
c. c. 0
5 x 0 se x/5)-(15
2)x(g
≤≤
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então a G(x) será:
Igualando a expressão de G(x) a U e
isolando X, obtém-se:
que é o gerador da variável com fdp g(x).
)U1(5X −=
5 x se 1
5 x 0 se )/25x-(10x
0 x se 0
)x(G 2
>
≤≤
<
=
Método da
Composição
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O método da composição pode ser
aplicado quando a FDA da qual
precisamos gerar valores pode ser expressa
como uma combinação convexa de outras
FDAs F1, F2, ... . Com isso, espera-se
poder determinar valores das Fis de uma
forma mais simples do que da F original.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Especificamente, assume-se que
para todo x a F(x) pode ser escrita como:
onde os pesos, pi, satisfazem pi > 0 e
Σpi = 1 e cada Fi é uma FDA.
)x(Fp)x(F i1i
i∑=∞
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
De forma equivalente se X tem
densidade f então:
onde as fi são outras densidades.
O caso discreto é análogo.
)x(fp)x(f i1i
i∑=∞
=
7
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O algoritmo para o método da
composição é, então:
(i) Gerar um número inteiro aleatório I tal
que: P(I = i) = pi para i = 1, 2, ...
(ii) Retornar X com FDA FI.
O Algoritmo
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O problema é encontrar Fi que
possibilite uma geração rápida e fácil.
Algumas vezes a geometria da
distribuição pode dar uma ideia dessa
decomposição.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Considere a distribuição
triangular simétrica em [-1, 1].
c. c. 0
1 x 0 se 1x
0 x 1- se 1x
)x(f
≤<+−
≤≤+
=
Exemplo 1
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
0,0
0,2
0,4
0,6
0,8
1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A distribuição acumulada é:
1 x se 1
1 x 0 se 2
1x
2x-
0 x 1- se 2
1x
2x
1- x se 0
)x(F2
2
>
≤<++
≤≤++
<
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
0,0
0,2
0,4
0,6
0,8
1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
8
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A transformação inversa será
feita por:
1/2 Use 2
1x
2x-
1/2 Use 2
1x
2x
)x(FU2
2
≥++
≤++
==
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então:
1/2 Use U)-2(1-1
1/2 Use 1- 2U X
>
≤=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Definir a função indicadora para o
conjunto A como:
Assim:
∉
∈=
A x se 0
A x se 1)x(IA
(x)fp (x)fp
)]x(I)1x(2[5,0)]x(I)1x(0,5[2
)x(I)1x()x(I)1x()x(f
2211
]1,0[]0,1[
]1,0[]0,1[
+=
=+−++=
=+−++=
−
−
A Composição
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
U-1-1 )U(F 1 - U )U(F
2x x- )x(F 1 2x x )x(F1
21
1
22
21
==
+=++=
−−
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Obs. Agora não é necessário somar ½ na
segunda função, pois a f2(x) é agora
uma fdp e assim F2(x) é uma FDA
sem a necessidade de somarmos
mais 0,5.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O algoritmo da composição será:
1. Gerar U1 e U2 ~ U(0, 1) de forma
independente;
2. Se U1 < ½, retorna
senão, retorna .
1UX 2 −=
U11X 2−−=
O Algoritmo
9
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Considere a distribuição trapezoidal
em [0; 1] com parâmetro a (0 < a < 1).
Expresse a distribuição como uma soma
de duas densidades mais simples.
c. c. 0
1 x 0 se x)a1(2a2)x(f
≤≤−−−
=
Exercício
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
-0,5 -0,3 -0,1 0,1 0,3 0,5 0,7 0,9 1,1 1,3 1,5
a
a 2−a Área =
a -1 Área =
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A distribuição acumulada é:
1 x se 1
1 x 0 se xa)-(1-a)x-(2
0 x se 0
)x(F 2
>
≤≤
<
=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A representação é:
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
-0,5 -0,3 -0,1 0,1 0,3 0,5 0,7 0,9 1,1 1,3 1,5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A transformação inversa é dada por:
U = F(X) = (2 – a)X – (1 – a)X2.
Então:
a1
U
a)-(14
2)-(a-
)a1(2
a2X
2
2
−−
−
−=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Definir a função indicadora para oconjunto A como:
onde p1 = a e f1(x) = I[-1,0](x), p2 = 1 – a
e f2(x) = 2(1 – x)I[0, 1](x)
(x)fp (x)fp
)]x(I)x1(2)[a1()]x(I[a)x(f
2211
]1,0[]0,1[
+=
=−−+= −
A composição
10
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
U)U(F
x )x(F1
1
1
=
=
− U-1-1 )U(F
2x x- )x(F1
1
21
=
+=
−
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
-0,5 0,0 0,5 1,0 1,50,0
0,5
1,0
1,5
2,0
-0,5 0,0 0,5 1,0 1,5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O algoritmo da composição:
1. Gerar U1 e U2 ~ U(0, 1) de forma
independente.
2. Se U1 < a, retorna X = U2
senão, retorna .U11X 2−−=
O Algoritmo
Método da
Convolução
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Suponha que a VA desejada tem a
mesma distribuição que Y1 + Y2 + ... + Yn,
onde as Yi são IID.
X ~ Y1 + Y2 + ... + Yn, é denominado
uma convolução das Yi.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Resumindo tem-se:
Composição: a função de distribuição (a fp
ou fdp) é expressa como uma soma
(ponderada) de outras funções de
distribuição (a fd ou fdp).
Convolução: expressa a própria variável
como a soma de outras variáveis.Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
01. Gerar Y1 + Y2 + ... + Yn,
independente da sua distribuição.
02. Retornar X ~ Y1 + Y2 + ... + Yn.
O Algoritmo
11
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Se X é uma Erlang de parâmetros r
inteiro e λ, isto é, X ~ E(r, λ).
Expresse X ~ Y1 + Y2 + ... + Yr onde
as Yi são variáveis IDD exponenciais
com média λ. Faça r = 5 e λ = 2.
Exemplo 1
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Considere a distribuição triangular
simétrica em [-1, 1]. A densidade é:
c. c. 0
1 x 0 se 1x
0 x 1- se 1x
)x(f
≤≤+−
≤≤+
=
Exemplo 2
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
0,0
0,2
0,4
0,6
0,8
1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Por uma probabilidade condicional: se
U1 e U2 são IID U(0, 1), então U1 + U2 ~ é
triangular simétrica em [0, 2], basta então
deslocar por 1:
X = U1 + U2 – 1 = U1 – 0,5 + U2 – 0,5
= Y1 + Y2.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
CARLO, David. Random Number Generation: Types
and Techniques, 2012.
FISHMAN, George S. Monte Carlo: Concepts,
Algortihms, and Applications. New York (NY):
Springer, 1996.
KNUTH, Donald E. The Art of Computer Programing.
Volume 2 - Seminumerical Algorithms. Reading
(Massachusetts): Addison Wesley, 1981.
Referências
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
LEWIS, P. A. W., ORAV, E. J. Simulation
Methodology for Statisticians, Operations
Analysts and Engineers. Volume I. Belmont
(California): Wadsworth, Inc., 1989.
MADRAS, Neal. Lectures on Monte Carlo
Methods. Providence (RI): American
Mathematical Society, 2002.