Projeto BELIEVe Andamento de projeto - ieav.cta.br - Angelo.pdf · Andamento de projeto . Junho /...

27
Projeto Projeto BELIEVe BELIEVe : : Andamento de projeto Andamento de projeto Junho / 2003

Transcript of Projeto BELIEVe Andamento de projeto - ieav.cta.br - Angelo.pdf · Andamento de projeto . Junho /...

Projeto Projeto BELIEVeBELIEVe : :

Andamento de projeto Andamento de projeto

Junho / 2003

Participantes

EFA

Angelo Passaro

Onofre Felix de Lima Neto (Sgto)

Roberto Y. Tanaka

Ademar Muraro Jr.

Nancy M. Abe

Marcos A. Rugierri Franco

Antônio C. J. Paes

ENU

Alexandre D. Caldeira

Lamartine N. F. Guimarães

Mauricio A. P. Rosa

Francisco Dias Rocamora Jr

Lucio Marcos de Freitas

ParticipantesColaborações

Antônio L. Ribeiro (EFO)

Felipe Leonardo Lôbo Medeiros (EIN)

Augusto B. d’Oliveira (IBILCE-UNESP)

José Marcio Machado (IBILCE-UNESP)

Estudantes

Walter Schimidt, Odirlei Mantoan (IC-UBC)

Marco Antonio Hidalgo Cunha (IC-UNITAU)

Gleber Nelson Marques (Dout./CNPq)

BELIEVe

Tarefas – CGP&D/2002

Pacotes de EF Paralelos E1 E2 E3 E4 Bibl. Simulação de Sistemas F1 F2 F3 F4 F5 F6

Integradores Numéricos G1 G2 G3 G4 G5 Aplicativos (MCNP, Octave, MATLAB,...) H1 H2 H3 H4

Treinamento Software de Termohidráulica J1 J2 J3 J4 J5

Ações Objetos Es

tudar

Ad

equa

ção

Anali

sar

Para

lelism

o

Imple

men

tar

Adqu

irir

hard

ware

Instal

ar

Testa

r

Docu

menta

r

Tarefa – Instalação/ adequação deAplicativos

Adaptação do módulo de montagem de sistema deequações (MEF) para equação de Poisson 3D

Instalação MCNP (Monte Carlo)

Experimentos com MATLAB

Desempenho - FEM Montagem e resolução

Tempo (haste)

Leitura : 3,8%

Estr. Matriz : 3,4%

Montagem : 32%

Resolução : 58,6%

Cálculos derivados : 2% 0 2 4 6 8 10

processadores

0

2

4

6

spee

dup

montagem da matriz

total

paralelaexecuçãodetemposequencialexecuçãodetempospeedup =

MCNP - PVMTempo de Execução

• número de ciclos

• número de histórias/ciclo

Tempo de execução por número de nós (1.000 histórias)

00:00:00

00:01:26

00:02:53

00:04:19

00:05:46

00:07:12

00:08:38

00:10:05

00:11:31

1 1 2 3 4 5 6 7 8

Speedup (1.000 histórias)

0

1

2

3

4

1 1 2 3 4 5 6 7 8

número de nóssp

eed

up

Eficiência (1.000 histórias)

0

20

40

60

80

100

120

1 1 2 3 4 5 6 7 8

número de nós

Efi

ciên

ci

100*n

speedupeficiência =

MCNP - PVMSoftware MCNP (Monte Carlo N Particle transport)

0 20000 40000 60000 80000 100000Histórias

0

2

4

6

8

spee

dup

0

20

40

60

80

100

Efic

iênc

ia

speedup

Eficiência

Avaliação com 8 nós

Tarefas – CGP&D/2002

Ações Objetos Es

tuda

r Ad

equa

ção

Anal

isar

Pa

rale

lism

o

Impl

emen

tar

Adqu

irir

hard

ware

Inst

alar

Test

ar

Cluster de PCs A1 A2 A3 A4 Bibliotecas Matemáticas B1 B2 B3 Software de óptica integrada C1 C2 C3 C4

Métodos de IA D1 D2 D3 D4 D5 Pacotes de EF Paralelos E1 E2 E3 E4

Docu

men

tar

Tarefa – Instalação / testes de Bibliotecas Matemáticas

BLAS (Basic Linear Algebra System) – processamento seqüencial : pacote otimizado testado e resultados em fase de documentação;

LAPACK (Linear Algebra Package) – processamento seqüencial : pacote otimizado testado e resultados em fase de documentação;

BLACS (Basic Linear Algebra Communication Subprograms) – processo de instalação documentado;

SCALAPACK (Scalable Linear Algebra Package) – processamento paralelo pacote otimizado testado e resultados em fase de documentação;

SUPERLU – processamentos seqüencial e paralelo – Bibliotecas instaladas, mas a avaliação de desempenho ainda não foi realizada; e

ARPACK – processamento seqüencial : Biblioteca instalada, mas a avaliação de desempenho ainda não foi realizada.

Hierarquia de softwareScaLAPACK

PBLAS

LAPACK

BLASBLACS

Message Passing Primitives

(MPI, PVM, etc)

Independente de plataforma

Específico de plataforma

ARPACK

SUPERLU

PARPACK

Global

Local

Atlas – Desempenhomatriz x matriz

400 800 1200 1600 2000ordem da matriz

0

1000

2000

3000De

sem

penh

o (M

flops

)

K = 30

K = 130

K = 200

ATLAS

NETLIB

Desempenho Resolução de sistema linear

0 2000 4000 6000 8000N

0

500

1000

1500

2000

tem

po (s

) tempo de resolucao

tempo de execucao

DesempenhoResolução de Sistema Matricial

0 20 40 60 80tempo (s)

0

20

40

60

80

100

porc

enta

gem

"front-end"Sistema Matricial (N=5400)

ATLAS

CPU (usuario)

CPU (sistema)

SWAP

RAM

Atlas – Desempenho

0 20 40 60 80 100 120 140tempo (s)

0

40

80

120

porc

enta

gem

"front-end" Sistema Matricial (N=5600)ATLAS

CPU (usuario)

CPU (sistema)

SWAP

RAM

Atlas – Desempenho

0 400 800 1200 1600tempo (s)

0

40

80

120

porc

enta

gem

"front-end" Sistema Matricial (N=7000)ATLAS

CPU (usuario)

CPU (sistema)

SWAP

RAM

Scalapack – DesempenhoResolução de sistema linear

0 2 4 6 8 10processadores

0

4

8

spee

dup

ATLASNETLIB

paralelaexecuçãodetemposequencialexecuçãodetempospeedup =

Equações: 5000

Scalapack – DesempenhoResolução de sistema linear

Equações: 5000

2 4 6 8 10numero de estações

0

100

200

300

400

tem

po d

e re

solu

cao

(s) Scalapack

otimizada

Netlib

Scalapack - Desempenho

2 4 6 8 10numero de estações

0

1E-4

2E-4

3E-4

4E-4

Erro

NAxbAx

Erroε−

=

Scalapack - Desempenho

0 100 200 300 400 500tempo (s)

0

40

80

120

porc

enta

gem

BELIEVe Sistema Matricial (N=5000)

Grid 2x2

CPU master

CPU cluster102

RAM master

RAM cluster102

swap

master: 2%

nós : 0%

Tarefas – CGP&D/2002

Ações Objetos Es

tuda

r Ad

equa

ção

Anal

isar

Pa

rale

lism

o

Impl

emen

tar

Adqu

irir

hard

ware

Inst

alar

Test

ar

Cluster de PCs A1 A2 A3 A4 Bibliotecas Matemáticas B1 B2 B3 Software de óptica integrada C1 C2 C3 C4

Métodos de IA D1 D2 D3 D4 D5 Pacotes de EF Paralelos E1 E2 E3 E4

Docu

men

tar

Tarefa – Expansão do cluster

ClusterPrevisto

16

10

5

Atual

9

18

7,2

Ago/2003

+1 cluster

• número de nós

• Desemp. Pico (Gflops)

• D. sustentável (Gflops)

Formação de RH

Iniciação científica (2002/2003)

Avaliação de bibliotecas matemáticas – TGI – UBC (2 alunos)Paralelização de programas com MATLAB – IC/FAPESP – UNITAU

Doutorado (2002/2003)

Projeto Ótimo Multidisciplinar de Dispositivos e Componentesde Óptica Integrada – INPESimulações computacionais em problemas de magneto-aerodinâmica – INPE /CNPq - Convênio UNESP/CTA –Laboratório de Aerotermodinâmica e Hipersônica da EFO

Indices

Publicações (2003): 2 congresso nacional1 congresso internacional1 TGI

Palestras proferidas (2002/2003) : 3

Documentos internos: 2 publicados1 em fase de revisão2 em elaboração

Perspectivas

Paralelização de aplicações em eletromagnetismoutilizando MATLAB

Cálculos de dinâmica caótica

Adequação de software para solução da Equação deTransporte Matricial

Implementação de formulação de Elementos Finitos para resolução de problemas de magnetoaerodinâmica

Paralelização de software de óptica integrada (EF)

PPA – 2004 - 2007

Formação anual de dez mil doutores como meta para 2006;

Popularização da ciência e tecnologia C&T (Sempre que possível, as propostas deverão conter mecanismos de divulgação, à população, dos resultados obtidos, em particular aqueles que dizem respeito aos benefícios para o seu bem-estar e para o desenvolvimento econômico -IEAv).

As propostas que integrem, de forma cooperativa, outros institutos de pesquisa e, eventualmente, o setor produtivo, serão altamente estimuladas. (INPE, UNESP, ITA)