ARQUITETURA DE COMPUTADORES DEPT. DE CIÊNCIA DA COMPUTAÇÃO - UFMG Aula19: Desempenho de SSM...

ARQUITETURA DE COMPUTADORESDEPT. DE CIÊNCIA DA COMPUTAÇÃO - UFMG

Aula19: Desempenho de SSMLarge-Scale MPSincronização

Coerência de Caches Classificação de MR

em 3 C’s

O que pode acontecer em uma cache coerente?

Sharing miss

False sharing

Time P1 P21 Write x12 Read x23 Write x14 Write x25 Read x2

Extendendo Coerência de Caches para Memórias Compartilhadas Distribuídas

Ao contrário de memórias compartilhadas centralizadas, não possuímos neste caso um recurso centralizado que vê todas as transações (bus) Não há meio de broadcast Não há maneira de serializar transações

barramento funciona como meio de garantir serialização das operações

Técnicas Extender protocolos do tipo snoopy Protocolos baseados em diretórios

Snoopy Hierárquico Maneira mais simples: hierarquia de

barramentos, coerência snoopy a cada nível

Duas possibilidades

Main Mem

L2Mem Mem

Hierarquias com Memória Global

Caches primárias: Alta performance (SRAM) B1 segue protocolo snoopy

básico Caches secundárias:

Muito maiores que L1 (precisam manter propriedade de inclusão)

L2 funciona como filtro p/ B1 e L1

L2 pode ser baseada em tecnologia DRAM

Main Mem

Hierarquias com Memória Global

Vantagens: Misses na memória principal requerem

tráfego único para a raiz da hierarquia Utilização de dados compartilhados não é

uma questão importante Desvantagens:

Misses para dados locais também trafegam na hierarquia

Memória em barramento global deve ser intercalada para aumentar BW

L2Mem Mem

Hierarquias Baseadas em Clusters

Memória principal é distribuída entre clusters Alocação de dados locais pode reduzir tráfego em barramento global Reduz latência (acessos locais mais rápidos) Exemplos: Encore Gigamax

L2 pode ser substituída por uma chave roteadora baseada em tags com coerência

Resumo de Hierarquias Vantagens:

Conceitualmente simples de se construir (aplica-se snoopy recursivamente)

Pode-se reduzir hardware necessário ao se combinar as funcionalidades

Desvantagens: Gargalo de comunicação na direção da raiz Latências podem ser grandes na direção da raiz

Protocolos de Coerência Baseados em Diretórios

Protocolos do tipo snoopy não escalam bem porque dependem de algum meio de broadcast

Snoop hierarquico faz raiz se tornar um gargalo

Mecanismos baseados em diretório escalam bem Evitam broadcasts

Mantém informação de todas as caches que possuem cópia do bloco

Utilizam mensagens ponto-a-ponto para manter coerência

Protocolo Baseado em Diretório

Rede de Interconexão

Memória Diretório

Bits de presença Dirty

K processadores

Para cada bloco de cache na memória => k bits de presença, 1 dirty-bit

Para cada bloco na cache Invalid Exclusive Shared

Estados Shared: um ou mais processadores

possuem o bloco cached, e o bloco na memória é atualizado

Invalid ou Uncached: nenhum processador possui uma cópia do bloco

Exclusivo: um único processador possui uma cópia do bloco

Protocolo Baseado em Diretório

Message Source Destination ContentsRead miss Cache Dir P,AWrite miss Cache Dir P,AInvalidate Dir R. Caches A

Fetch Dir R. Caches AFetch/Inv. Dir R. Caches A

Data value reply Dir Cache DataData write back R.Cache Dir A,Data

Protocolo (Cache)

Invalid Shared

Exclusive

Send read miss message

CPU read

Invalidade

CPU read hit

CPU read missRead miss

CPU write

Send w

rite m

iss message

Fetch D

CPU read m

Data writ

e-back, r

ead miss

CPU write missData write-backWrite miss

CPU write hitCPU read hit

Protocolo (Diretório)

Uncached Shared

Exclusive

Data value replySharers = {P}

Read missRead missData value replySharers += {P}

Invalidate; S

harers

= {P};

data value reply

Read miss

Fetch, d

ata valu

e reply,

Sharers

+= {P}

Write missFetch/InvalidateData value replySharers = {P}

Organização de Diretórios Implementação dos diretórios na memória (como

o apresentado anteriormente) Apresenta problemas de escalabilidade Pode apresentar problemas de BW

Implementação dos diretórios na cache (SCI) Listas encadeadas (simples ou duplo) Mantém em cada cache “link” do próximo processador

compartilhando bloco SCI utiliza listas duplamente encadeadas Precisamos agora da mensagem “desconectar da lista”

e “conectar à lista” (a última equivalente a um MISS)

Sincronização SSM: sequência de instruções capazes de

recuperar ou alterar valores atomicamente

LSM: latência pode adicionar problemas de desempenho

Primitivas de Hardware Atomic exchange

Test-and-set

Fetch-and-increment

Load-linked

try: OR R3,R4,R0

LL R2,0(R1)

SC R3,0(R1)

BEQZ R3,try

MOV R4,R2

Implementando fetch-and-increment com load-linked

try: LL R2,0(R1)

DADDUI R3,R2,#1

SC R3,0(R1)

BEQZ R3,try

Implementando Locks com Coerência de Cache

DADDU R2,R0,#1

lockit:

EXCH R2,0(R1)

BNEZ R2,lockit

lockit:

LD R2,0(R1)

BNEZ R2,lockit

DADDUI R2,R0,#1

EXCH R2,0(R1)

BNEZ R2,lockit

Implementando Locks com Coerência de Cache

lockit:

LL R2,0(R1)

BNEZ R2,lockit

DADDUI R2,R0,#1

SC R2,0(R1)

BEQZ R2,lockit

ARQUITETURA DE COMPUTADORES DEPT. DE CIÊNCIA DA COMPUTAÇÃO - UFMG Aula19: Desempenho de SSM...

Documents

Transcript of ARQUITETURA DE COMPUTADORES DEPT. DE CIÊNCIA DA COMPUTAÇÃO - UFMG Aula19: Desempenho de SSM...

SSM 27 ROTO · Semeato S/A Industria e Comércio - Rua Camilo Ribeiro 190 - Passo Fundo - RS - Brasil CEP 99060-000 Fone: (54) 21032400 – SAC +55 (54) 2103 2400 1 SSM 27 ROTO ÍNDICE

Dept Financeiro Sheraton

AAF ContabilidadeAvancada Aula19 EugenioMontoto MatProfI

SSM 27 E SSM 27 SEED - br404.teste.websitebr404.teste.website/.../2018/07/SEMEATO-SSM-27.pdf · de rotação de gramíneas e leguminosas, e este sistema pode ser implantado com a

TÍTULO Dept°. de Engenharia de Produção ... - UFSCar

Autores: Equipe de SSM Elektro Abril de 2011 Contribuição 96 Desenvolvimento de Competência dos Condutores Elektro (DIREÇÃO DEFENSIVA.

Instrumentos de microondas. SSM/I e SSMIS AMSR-E AMSU e MHS.

Estudio Hidrologico-Hidraulico de la Cuenca Baja del Rio Grande (Dept. Santa Cruz, Bolivia)

Manual de uso do SSM Pessoa Natural · 2 Solicitando acesso ao SSM 2.1 Localizando o formulário para pedido acesso ao SSM Para preencher o formulário e solicitar acesso, o representante

Cluster de alta disponibilidade SSM On-Prem 8.X em ...

Dept-Shalakyatantra Lecturer- Dr.Varsha Devidas Ahire Date ... · 1 Dept-Shalakyatantra Lecturer- Dr.Varsha Devidas Ahire Date- 15-4-2020 Topic of presentation- Netra Sharir and modern

DPS/SSM/OEA1 Departamento de Segurança Pública Subsecretaria de Segurança Multidimensional DEFINIÇÃO E CATEGORIZAÇÃO DE QUADRILHAS.

ASA: Envie o tráfego de rede do ASA ao exemplo de configuração CSC-SSM · ASA - Diagrama de fluxo CSC SS Este diagrama mostra o fluxo do tráfego dentro do ASA e do CSC-SSM: Neste

Aula19 Complexo

IA889 – Sistemas de Cognição Artificialgudwin/ftp/ia889/Aula19.pdf · chamado de reflexo condicionado) Condicionamento Operante ... Condicionamento Operante [Touretzky 1997] ...

Geologia Geral SSM 2014

Bombeiros Oliveira do Bairro - Associação Humanitária internos...Bombeiro de 1? Flávio Nogueira Oficial Bombeiro 2.è Bruno Almeida Joel Vieira Designação Dept. Operacional Dept.

Autores: Equipe de SSM Elektro Abril de 2011 Contribuição 35 05 Compromissos da Liderança com a Segurança.

Herança e Polimorfismo (Universal)albertocn.sytes.net/2011-1/plp/slides/Aula19-LingObjetos_Heranca... · Universal:: Paramétrico ... abstração sobre uma declaração ... – Generics

Kasp8.0 Ak Deploy Gui Dept Br