Limite Da Tecnologia Single Core

8
 MULTICORE Bruno Cardoso IC - UNICAMP RA 023241 [email protected] Sávio R. A. dos Santos Rosa IC - UNICAMP RA 025144 [email protected] Tiago M. Fernandes IC - UNICAMP RA 025313 [email protected] 1 INTRODUÇÃO Processadores Multicore representam uma grande revolução na tecnologia computacional. São capazes de prover maior capacidade de processamento com um custo/benefício melhor do que processadores Single-Core, e suas vantagens não param por aqui. Ao longo deste texto são explicadas as principais características da arquitetura Multicore, a motivação que levou a seu desenvolvimento, suas vantagens e princípios de funcionamento. Posteriormente enfatizamos implementações específicas desta tecnologia realizadas por duas grandes empresas concorrentes no mercado: AMD e Intel. Assim pode-se exemplificar com maior riqueza as propriedades desta arquitetura. 2 OS LIMITES DA TECNOLOGIA SINGLE-CORE No atual mundo digital, as demandas das complexas simulações 3D, arquivos de streaming media, níveis adicionais de segurança, interfaces do usuário mais sofisticadas, bancos de dados maiores e mais usuários on-line estão sempre pedindo por mais poder de processamento. A solução até agora aplicada foi aumentar a freqüência da operação dos processadores, assim aumentando sua capacidade de processamento. Isto exige que a fabricação de transistores seja feita em camadas de silício cada vez menos espessas. Entretanto, segundo o trabalho "Limits to Binary Logic Switch Scaling--A Gedanken Model" publicado por quatro pesquisadores da Intel no “Proceedings of the IEEE” em novembro de 2003, este método de fabricação tem seus dias contados, o que obriga a busca de uma tecnologia alternativa para a fabricação de circuitos integrados e, com eles, microprocessadores. A figura 1 mostra protótipos de transistores da Intel. [10] No canto superior esquerdo da figura 1, corresponde à tecnologia atual: camada de silício de 90 nm e porta de 50 nm. Os seguintes são protótipos de transistores que, seguindo uma linha crescente de tempo para a direita, devem ser fabricados no futuro pela Intel. Porém, após o último dos protótipos, previsto por volta de 2011, a situação fica problemática. Quanto menor a largura da porta, mais próximas ficarão as regiões da fonte e dreno do transistor. Os técnicos afirmam que, quando a largura da porta chegar a cinco nm, fonte e dreno ficarão separadas por um trecho de silício tão pequeno que não conseguirá isolá-los completamente, gerando uma probabilidade de 50% de que a corrente flua mesmo quando não houver tensão aplicada à porta (este fenômeno denomina-se tunelamento). Quando isso ocorre o transistor deixa de ser confiável como dispositivo de processamento de dados. [10] Figura 1. Protótipos de processadores Intel. Além disso, temos um outro problema ainda mais grave: a dissipação de energia. Há 40 anos atrás, Gordon Moore propôs empiricamente que com o ritmo de evolução da tecnologia observado, seria possível duplicar o número de transistores numa mesma área de silício aproximadamente a cada 18 meses. Por muito tempo esta lei inspirou e promoveu o progresso do mercado de tecnologia, mas começa-se a perceber que estamos cada vez mais próximos de um limite máximo para esta técnica. Quanto menores são os transistores em um circuito integrado, maior sua “densidade”, ou seu número por unidade de área. O acúmulo de um número muito grande de transistores em uma área pequena concentra tremendamente a produção de calor devido à dissipação de energia pela corrente elétrica que circula nos transistores. Se essa energia não for rapidamente removida do circuito e transferida para o ambiente, o chip atingirá temperaturas tão elevadas que, literalmente, derreterá [10]. A figura 2, a seguir, mostra uma extrapolação da evolução da energia dissipada por processadores. Segundo Paolo Gargine, Diretor de Tecnologia da Intel, mesmo que se conseguisse contornar o limite da largura da porta, não haveria como remover dele o calor com a mesma rapidez com que seria produzido. O chip se autodestruiria. Além dessas, há diversas outras limitações impostas pela arquitetura de núcleo único. Entre elas, temos que a estreita banda de dados, aliada à grande diferença entre a velocidade do processador e a da memória, faz com que 75% do tempo da cpu, em média, seja gasto esperando por resultados dos acessos à memória. [7]

Transcript of Limite Da Tecnologia Single Core

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 1/8

 

MULTICORE

Bruno Cardoso

IC - UNICAMPRA 023241

[email protected]

Sávio R. A. dos Santos Rosa

IC - UNICAMPRA 025144

[email protected]

Tiago M. Fernandes

IC - UNICAMPRA 025313

[email protected]

1  INTRODUÇÃOProcessadores Multicore representam uma grande revolução natecnologia computacional. São capazes de prover maiorcapacidade de processamento com um custo/benefício melhor doque processadores Single-Core, e suas vantagens não param poraqui. Ao longo deste texto são explicadas as principais

características da arquitetura Multicore, a motivação que levou aseu desenvolvimento, suas vantagens e princípios defuncionamento. Posteriormente enfatizamos implementaçõesespecíficas desta tecnologia realizadas por duas grandes empresasconcorrentes no mercado: AMD e Intel. Assim pode-seexemplificar com maior riqueza as propriedades desta arquitetura.

2  OS LIMITES DA TECNOLOGIASINGLE-CORE

No atual mundo digital, as demandas das complexas simulações3D, arquivos de streaming media, níveis adicionais de segurança,interfaces do usuário mais sofisticadas, bancos de dados maiores emais usuários on-line estão sempre pedindo por mais poder deprocessamento. A solução até agora aplicada foi aumentar a

freqüência da operação dos processadores, assim aumentando suacapacidade de processamento. Isto exige que a fabricação detransistores seja feita em camadas de silício cada vez menosespessas. Entretanto, segundo o trabalho "Limits to Binary LogicSwitch Scaling--A Gedanken Model" publicado por quatropesquisadores da Intel no “Proceedings of the IEEE” emnovembro de 2003, este método de fabricação tem seus diascontados, o que obriga a busca de uma tecnologia alternativa paraa fabricação de circuitos integrados e, com eles,microprocessadores.

A figura 1 mostra protótipos de transistores da Intel. [10]

No canto superior esquerdo da figura 1, corresponde à tecnologiaatual: camada de silício de 90 nm e porta de 50 nm. Os seguintes

são protótipos de transistores que, seguindo uma linha crescentede tempo para a direita, devem ser fabricados no futuro pela Intel.Porém, após o último dos protótipos, previsto por volta de 2011, asituação fica problemática. Quanto menor a largura da porta, maispróximas ficarão as regiões da fonte e dreno do transistor. Ostécnicos afirmam que, quando a largura da porta chegar a cinconm, fonte e dreno ficarão separadas por um trecho de silício tãopequeno que não conseguirá isolá-los completamente, gerandouma probabilidade de 50% de que a corrente flua mesmo quandonão houver tensão aplicada à porta (este fenômeno denomina-setunelamento). Quando isso ocorre o transistor deixa de serconfiável como dispositivo de processamento de dados. [10]

Figura 1. Protótipos de processadores Intel.

Além disso, temos um outro problema ainda mais grave: adissipação de energia. Há 40 anos atrás, Gordon Moore propôsempiricamente que com o ritmo de evolução da tecnologiaobservado, seria possível duplicar o número de transistores numa

mesma área de silício aproximadamente a cada 18 meses. Pormuito tempo esta lei inspirou e promoveu o progresso do mercadode tecnologia, mas começa-se a perceber que estamos cada vezmais próximos de um limite máximo para esta técnica. Quantomenores são os transistores em um circuito integrado, maior sua“densidade”, ou seu número por unidade de área. O acúmulo deum número muito grande de transistores em uma área pequenaconcentra tremendamente a produção de calor devido à dissipaçãode energia pela corrente elétrica que circula nos transistores. Seessa energia não for rapidamente removida do circuito etransferida para o ambiente, o chip atingirá temperaturas tãoelevadas que, literalmente, derreterá [10]. A figura 2, a seguir,mostra uma extrapolação da evolução da energia dissipada porprocessadores.

Segundo Paolo Gargine, Diretor de Tecnologia da Intel, mesmoque se conseguisse contornar o limite da largura da porta, nãohaveria como remover dele o calor com a mesma rapidez com queseria produzido. O chip se autodestruiria.

Além dessas, há diversas outras limitações impostas pelaarquitetura de núcleo único. Entre elas, temos que a estreita bandade dados, aliada à grande diferença entre a velocidade doprocessador e a da memória, faz com que 75% do tempo da cpu,em média, seja gasto esperando por resultados dos acessos àmemória. [7]

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 2/8

 

 

Figura 2. Gráfico da dissipação de energia por processadores.

Somando todas as implicações, chega-se à conclusão de que énecessário o desenvolvimento de uma nova opção. Uma boaalternativa capaz de contornar a maioria dos problemas queestamos enfrentando é a tecnologia Multicore.

3  A TECNOLOGIA MULTICORE

3.1  DescriçãoEm poucas palavras, a tecnologia Multicore (múltiplos núcleos)consiste em colocar duas ou mais unidades de execução (cores) nointerior de um único 'pacote de processador' (um único chip). Osistema operacional trata esses núcleos como se cada um fosse umprocessador diferente, com seus próprios recursos de execução.Na maioria dos casos, cada unidade possue seu próprio cache epode processar várias instruções simultaneamente.

Adicionar novos núcleos de processamento a um processadorpossibilita que as instruções das aplicações sejam executadas emparalelo em vez de serialmente, como ocorre em um núcleo único.Adicionar um novo núcleo assemelha-se a abrir uma nova pistaem uma estrada para aliviar o trânsito: os carros não precisamdirigir mais rápido para chegarem mais cedo ao seu destino, elesapenas não são atrasados tanto pelo gargalo de poucas pistas econgestionamentos. [5]

Os processadores de múltiplos núcleos permitem trabalhar em umambiente multitarefa. Em sistemas de um só núcleo, as funções demultitarefa podem ultrapassar a capacidade da CPU, o que resultaem queda no desempenho enquanto as operações aguardam serem

processadas. Em sistemas de múltiplos núcleos, como cada núcleotem seu próprio cache, o sistema operacional dispõe de recursossuficientes para lidar com o processamento intensivo de tarefasexecutadas em paralelo. Portanto, melhora-se a eficiência dosistema e o desempenho dos aplicativos em computadores queexecutam vários aplicativos simultaneamente.

A figura 3 exemplifica o gargalo (bottleneck) que surge quandovários aplicativos são executados em um único core. Já a figura 4mostra o desaparecimento do gargalo quando adicionamos umanova unidade de processamento [4]. A presença de vários núcleosé especialmente eficaz quando uma das aplicações deve ficarsendo executada continuamente (ou quase), como no caso dosystem scan da figura, ou de um programa de antivírus.

Figura 3. Gargalo presente na arquitetura Single-Core.

Figura 4. Ausência do gargalo na arquitetura Multicore.

Podemos citar como sendo as principais vantagens da arquiteturaMulticore [7]:

•  Maior eficácia (troughput) do sistema e desempenhoaprimorado de aplicativos em computadores executandovários aplicativos simultaneamente

•  Desempenho aprimorado para aplicativos multi-threaded

•  Compatibilidade para mais usuários ou tarefas emaplicativos com muitas transações

•  Desempenho superior em aplicativos que utilizamprocessamento de forma intensiva

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 3/8

 

•  Economia no preço de licenciamento de softwaresproprietários, passando a ter um maior poder deprocessamento sem necessitar de uma nova máquina

•  Redução da dissipação térmica quando comparado aoSingle-Core

É importante notar que, para uma total utilização do poder deprocessamento oferecido pelo Multicore, as aplicações devem serescritas de modo a usar intensivamente o conceito de threads.Assim, melhora-se o desempenho de cada aplicaçãounitariamente, conforme ilustrado pela figura 5 [4] a seguir.

Um exemplo de mudanças que a tecnologia Multicore prometecriar, como descrito em propagandas de desenvolvedores, é oseguinte: “Imagine um pai de família fazendo seus cálculosfinanceiros no escritório, enquanto seu filho assiste na sala a umfilme na TV gravado na véspera para o PC, e sua filha escutaMP3s em seu quarto - tudo isso a partir do mesmo PC. Isso será

possível graças aos fantásticos recursos de multitarefa oferecidospelos processadores de múltiplos núcleos” [3].

Figura 5. Aplicação utilizando a vantagem de ter váriasthreads na arquitetura Multicore.

3.2  Arquitetura MulticoreUma arquitetura Multicore é geralmente um multiprocessamentosimétrico (SMP) implementado em um único circuito VLSI (VeryLarge Scale Integration). O objetivo é melhorar o paralelismo nonível de threads, ajudando especialmente as aplicações que nãoconseguem se beneficiar dos processadores superescalares atuaispor não possuírem um bom paralelismo no nível de instruções.Esta arquitetura propicia o chamado paralelismo ao nível de chip.Algumas de suas vantagens são: melhor localidade de dados secomparado com outras arquiteturas de multiprocessamento;melhor comunicação entre as unidades; economia de espaço eenergia. É importante observar que o aumento de throughput nãoocorre no caso da execução de uma única aplicação que não possaser paralelizada, mas, nos outros casos, e sempre que se considera

o sistema como um todo (rodando várias aplicaçõessimultaneamente), tal aumento é bem notável. Com todas essasvantagens, os Multicores apresentam um melhor custo/benefíciodo que os Single-Core. [7]

Há outras alternativas ao SMP para criar uma arquiteturaMulticore. A seguir discutimos com um pouco mais deprofundidade as mais comuns.

Multiprocessamento simétrico, ou SMP, é uma arquitetura demultiprocessadores onde dois ou mais processadores idênticos sãoconectados a uma única memória principal. Isso permite quequalquer processador trabalhe em qualquer tarefa, não importandoonde que ela esteja localizada. Assim, é possível ficar movendo astarefas entre processadores de modo a tornar a carga de trabalho omais eficiente possível. Porém, há um custo a se pagar: como amemória é muito mais devagar do que o processador, se emarquiteturas single-core é gasto uma grande parcela do tempoesperando pelos dados da memória, na SMP fica pior ainda, pois

vários processadores podem ficar esperando por uma mesmamemória. [8]

Uma alternativa ao SMP é a NUMA (Non-Uniform MemoryAccess), na qual cada processador tem a sua própria parte damemória. Essa arquitetura permite acessos paralelos à memória,melhorando em muito o throughput se os dados de um processoforem bem localizados. Por outro lado, o custo de mover dados deum processador ao outro fica bem mais caro, ou seja, balancear acarga de trabalho é bem mais custoso.

Há ainda outras alternativas não tão utilizadas como as acima: oMultiprocessamento Assimétrico (ASMP) designa diferentesprocessadores especializados para tarefas específicas, enquantoque, no multiprocessamento com clusters de computadores, nem

toda a memória está disponível para todos os processadores.

4  EXEMPLO DE IMPLEMENTAÇÃOMULTICORE

Hoje podemos achar a tecnologia Multicore em diversasarquiteturas. A seguir mostraremos um pouco mais da tecnologiapresente em duas das maiores empresas atuantes no mercado: aIntel e a AMD. Assim, facilita-se o entendimento da arquiteturaMulticore, visível agora sob a luz destes exemplos.

4.1  IntelO Dual Core Intel é relativamente simples: são dois processadorescom núcleo Prescott 90 nm revisão E0 juntos na mesma pastilha

de silício, incluindo instruções de 64 bits e tecnologias que visamdiminuir a dissipação de calor. Cada núcleo possui as suasunidades de execução e seu próprio Cache L2 e o restante doprocessador é exatamente igual ao Pentium 4 Single-Core.

A Intel batizou seu Dual Core com núcleo Prescott de“Smithfield”.

A figura 6 a seguir representa o modelo Dual Core da Intel. [15]

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 4/8

 

 

Figura 6. Modelo do Intel Dual core.

4.1.1  FSB (Front Side Bus): O grande problema O grande problema do Smithfield é a comunicação entre os doisnúcleos. A conversa entre ambos é feita através do FSB externo,gerando disputa para a utilização do barramento. Esse tipo decomunicação é razoavelmente lento.

O Smithfield é muito semelhante a um sistema multiprocessadoXeon (2 a 4 processadores), onde a comunicação entre osprocessadores é feita através do FSB e a banda de memóriadividida entre eles e é compartilhada com os dispositivos doSuper I/O (Controlador IDE e SATA, AGP, PCI-EXPRESS,USB, etc), surgindo um grande gargalo que causa uma boa perdade desempenho.

O Smithfield também compartilha dessas desvantagens do Xeon,o que o torna mais lento. A figura 7 exemplifica a relação entre osnúcleos em um Xeon. [15]

4.1.2   Dual Core – Características GeraisO Smithfield utiliza o socket top de linha atual da Intel, porém osprocessadores Dual Core não são compatíveis com as atuais

placas mãe. Para utilizá-los é necessário uma placa mãe com oChipset Nforce 4 Intel Edition. Por esses processadoresnecessitarem de reguladores de tensão mais robustos, o modelo daplaca precisa ser especial.

O Dual Core Intel não pode trabalhar a freqüências tão elevadascomo a dos processadores Single-Core. Esta limitação é impostadevido ao aumento excessivo de dissipação de calor ao adicionaro segundo core. O Smithfield possue um clock menor que ostradicionais processadores Single-Core com núcleo Prescott,tendo um desempenho inferior ao Single-Core em váriasaplicações não otimizadas.

Figura 7. Relação entre núcleos de um processador Intel

Uma característica interessante dos processadores Dual Core Intelé o modo como resolvem problemas de concorrência entre ascaches utilizando um protocolo chamado MESI (Modified,Exclusive, Shared and Invalid). Suponha que a CPU 1 pegou umdado na RAM, este dado é então marcado como Exclusivo e,passados alguns instantes, a CPU 2 pega o mesmo dado da RAM.Na tabela local desta CPU o dado é marcado como compartilhado

(shared). Agora uma das duas CPUs, a 2, por exemplo, modificaesse dado em seu cache, causando a ação do protocolo, que marcao dado como Modificado. A partir deste momento, a 1 não podemais usar esse dado. Então, para sinalizar isto, ele é marcadocomo inválido. Se a 1 não precisar usar esse dado, terá queesperar de qualquer maneira que a 2 grave o novo valor namemória RAM para poder ler novamente.

Até o presente momento a Intel lançou apenas processadores DualCore destinados apenas ao desktop, o Xeon Dual Core(processador destinado a servidores com capacidade de trabalharem sistemas com até quatro processadores) chegará ao mercadoapenas no fim do ano.

4.1.3  Pentium D e Pentium Extreme Edition

O Pentium D e a versão top de linha Pentium Extreme Edition sãoas duas implementações Dual Core da Intel presentes atualmenteno mercado.

Ambas implementações possuem núcleos Smithfield, trabalham a800Mhz de FSB e 1MB de Cache L2 para cada núcleo. Adiferença entre o Pentium D e o Pentium Extreme Edition é apresença do HyperTheading no Extreme Edition. O Pentium Dnão possui este recurso (no caso, o sistema operacionalreconhecerá apenas dois processadores no caso do Pentium D equatro no caso do Pentium Extreme Edition, devido aoHyperThreading).

Atualmente o Pentium Dual Core Intel é disponibilizado nasseguintes versões:

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 5/8

 

Tabela 1. Versões disponíveis do Pentium Dual Core Intel

Processador Freqüência Interna Cache L2

Pentium Extreme Edition840 3.2 Ghz 2 x 1 MB

Pentium D 840 3.2 Ghz 2 x 1 MB

Pentium D 830 3.0 Ghz 2 x 1 MB

Pentium D 820 2.8 Ghz 2 x 1 MB

Pentium 4 Extreme Edition840 3.73

3.73 Ghz 2 MB

Pentium 4 670 3.8 Ghz 2 MB

Pentium 4 630 3.0 Ghz 2 MB

4.1.4   Exemplo de desempenho: Eficiência em

renderização 3D Para mostrar o desempenho dos processadores Pentium DualCore, vamos analisar a eficiência do processamento em aplicaçõesde renderização 3D (um dos principais mercados atingidos pelosprocessadores Intel).O Pentium 4 com tecnologia HyperThreading(HT) se aproveita das otimizações Multi-Threading e apresentaum excelente desempenho nessas aplicações de renderização. Já oPentium Extreme Edition 840 é bem superior ao Pentium 4 HTmesmo com o clock bem inferior, já que, além de dual core,possui tecnologia HT.

A Figura 8 mostra o tempo (segundos) que cada processador

gastou para realizar uma tarefa, confirmando o que foi dito noparágrafo anterior. [15]

Figura 8. Comparação entre os processadores

4.1.5   Dissipação Térmica A Intel não libera oficialmente o consumo dos seus processadoresDual Core, mas estima-se que seja algo em torno de 130 watts. Oconsumo real é em média 80% superior ao Dual Core top de linhada concorrente AMD.

No gráfico da figura 9 temos o consumo do Pentium XE 840 DualCore entre outros que serão analisados posteriormente. [15]

Figura 9. Consumo de energia dos processadores

4.2  AMDO projeto Dual Core da AMD é muito diferente do projeto da

rival Intel. O processador é feito com a combinação de doisprocessadores K8  na mesma pastilha de silício e a maneirainovadora de como os núcleos se comunicam é diferente e maiseficiente que a comunicação feita nos processadores Dual CoreIntel.

Quando começou a desenvolver a arquitetura dos processadoresK8 (Opteron e Athlon 64) a AMD já o fez pensando nosprocessadores MultiCore, por esse motivo não houve dificuldadeem desenvolver a sua atual linha de Dual Core.

A Intel (como visto anteriormente), ao desenvolver o dual core,simplesmente colocou dois núcleos Prescott em uma únicapastilha de silício, sem nenhum mecanismo especial para acomunicação entre eles. Tal comunicação é feita através do FSBexterno, ou seja, é semelhante a um sistema tradicional bi-processado Xeon. Dessa forma a comunicação entre os doisnúcleos é lenta, já que além de se comunicarem através do FSBexterno os núcleos compartilham a banda da memória através dopróprio barramento externo, o que aumenta o tempo de acesso àmemória RAM.

A AMD, com a tecnologia de HyperTransport e controlador dememória integrado, criou um sistema de comunicação inovador,compatível bem mais eficiente, como será visto a seguir.

4.2.1   HyperTransport e Controlador de

 Memória Integrado: O fim do gargaloO que beneficia a arquitetura "K8" é o controlador de memóriaintegrado. Dessa forma não há necessidade de fazer a

comunicação com as memórias através do Chipset, pois asmemórias são acessadas diretamente pelo processador através deum barramento exclusivo (HyperTransport), o que resulta em ummelhor aproveitamento da banda. Não há mais dependência doFSB, a comunicação com os outros componentes é feita tambématravés do HyperTransport (não há necessidade de compartilharos recursos com os dispositivos do Super I/O - Controlador IDE eSATA, AGP, PCI-EXPRESS, USB e etc).

O HyperTransport é uma conexão ponto-a-ponto, paralela, de altaperformance, alta velocidade, alta largura de banda e de baixalatência. É utilizado em conexões chip-a-chip, em duas viasunidirecionais (full-duplex), uma para transmissão e outra pararecepção, onde os dados são transmitidos em pacotes usando a

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 6/8

 

tecnologia DDR (Double Data Rate), transmitindo dois bits dedados por ciclo de clock.

A figura 10 representa o modelo Multicore (e multiprocessado)

utilizado pela AMD. [15]

Figura 10. Modelo Multicore AMD

4.2.2   Dual Core – Características GeraisNo Dual Core AMD cada núcleo possui as suas unidades deexecução e Cache L2 individuais, apenas o controlador dememória e o HyperTransport são divididos entre os dois núcleos.O design foi feito dessa forma para manter a compatibilidade comos atuais Chipsets e placas mãe. Os dois núcleos comunicam-secom os recursos compartilhados através do “Crossbar Switch” edo “System Request Queue”. Assim, a comunicação entre osnúcleos é feita internamente e não depende do barramento externoe nem do barramento das memórias.

No Opteron, ao contrário do Dual Core Intel, usa-se o MOESI aoinvés do MESI para o controle de concorrência entre as caches. Oestado adicional “O”, é de Owner, que no caso significa que umaCPU pode apropriar-se de um dado em seu cache local e, se fizeruma alteração, ela mesma servirá uma nova cópia do dado à outraCPU, sem qualquer acesso adicional à RAM, sendo tudo feitoatravés do barramento HyperTransport.

O modelo da arquitetura dos processadores Dual Core AMD édado na figura 11. [4]

O único “gargalo” da arquitetura Dual Core AMD é banda damemória: são 6.4 GB/s (Dual Channel DDR 400), compartilhados

pelos dois núcleos. A AMD planeja utilizar em 2006 memóriasDDR2, o que deve resolver este problema em partes.

Os processadores Dual Core AMD são fabricados no processo de90 nm utilizando uma nova tecnologia de silício esticado chamada"Dual Stress Liner", que mantém o consumo do processador baixomesmo operando a maiores freqüências. Esses processadorespossuem também instruções SSE3 e controladora de memóriamais eficientes.

Figura 11. Modelo do processador Dual Core AMD

As implementações atuais de Dual Core AMD se dividem emduas categorias:

Tabela 2. Categorias do Dual Core AMD

Nome Tipo

Athlon 64 X2 Desktop

Opteron série x75 Servidor

4.2.3  OpteronOs processadores Dual Core Opteron são fabricados utilizando anova revisão do Athlon 64, "E". O Opteron possui capacidade demultiprocessamento, sendo então destinado a servidores, podendotrabalhar em sistemas com até oito processadores.

Os processadores Opteron se dividem em três famílias, de acordocom o suporte da placa ma, conforme pode ser visto na tabela 3.

Tabela 3. Famílias em que o Opteron se divide

Família Características

1xxPlaca mãe com um soquete, não suporta

multiprocessamento, e possui apenas 1 barramentoHyperTransport.

2xxPlaca mãe com dois soquetes, aceita até dois

processadores e possui 2 barramentosHyperTransport.

8xxPlaca mãe com oito soquetes, suporta até oito

processadores e possui 3 barramentosHyperTransport.

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 7/8

 

O Opteron Dual Core tem tudo para ser um sucesso. Além de sera única solução Dual Core x86 da atualidade destinada aservidores, será possível aproveitar as placas mãe atuais e dobraro número de processadores reais. Por exemplo, se uma placa mãepossui dois soquetes, suportando naturalmente apenas doisprocessadores, no caso do Dual Core esse número dobra paraquatro (cada processador é Dual Core) e o ganho de desempenhoé considerável, pois normalmente aplicações utilizadas emservidores possuem otimizações Multi-Threading e se beneficiamcom a multitarefa.

O Opteron bi-processado Dual Core também é mais eficiente queum sistema bi-processado tradicional. Em um sistema bi-processado Opteron a comunicação entre os dois processadores éfeita através do HyperTransport (e a comunicação entre osnúcleos de mesmo encapsulamento é feita internamente napastilha), não se utilizando do gargalo como em outrosprocessadores.

4.2.4   Athlon 64 X2O Athlon 64 X2 é baseado na nova revisão do Athlon 64 (E).Utiliza os núcleos Toledo/Manchester (1 MB de Cache L2), quesão baseados no Venice e San Diego (nomes dos cores utilizadosnos processadores Athlon 64 Single-Core).

Atualmente estão disponíveis os seguintes Athlon 64 X2:

Tabela 4. Modelos disponíveis de Athlon 64 X2

Processador Freqüência Cache

Athlon 64 X2 3800+ 2.0 Ghz 512KB

Athlon 64 X2 4200+ 2.2 Ghz 512KB

Athlon 64 X2 4400+ 2.2 Ghz 1MB

Athlon 64 X2 4600+ 2.4 Ghz 512KB

Athlon 64 X2 4800+ 2.4 Ghz 1MB

O Athlon 64 X2 trabalha com freqüências relativamente elevadas,2.0, 2.2 e 2.4 Ghz, isso significa que mesmo em aplicações ondenão há otimização para multiprocessamento (jogos atuais, porexemplo) esse processador terá bom desempenho.

A AMD especifica o Athlon 64 X2 como um processadortotalmente independente da sua linha de processadores Single-Core. O público alvo são os usuários avançados que trabalhamcom multitarefa ou utilizam aplicações destinadas a workstations,codificação de vídeo, renderização 3D, etc. Ou seja, o Athlon 64X2 não é concorrente do Athlon 64 FX-57 e sim uma opção paraquem procura rapidez para o seu trabalho. Para jogos o Athlon 64FX-57 continua sendo o melhor processador da atualidade, já quenão há otimização para multiprocessamento (Multi-Threading).

A Figura 12 mostra a família de processadores AMD. [15]

Figura 12. Família de processadores AMD

4.2.5   Diferenças entre Athlon 64 X2 e OpteronComo são feitos com o objetivo de atingir públicos diferentes(Desktop, Workstation, e Servidor), o Athlon 64 X2 e o Opteron,possuem algumas características distintas.

Como não possui capacidade para trabalhar em sistemas comvários processadores, o Athlon 64 dispõe de apenas umbarramento HyperTransport, que serve para ligar os processadoresem um sistema multiprocessado (2 a 8 processadores). O Opteron,no entanto, possui 3 barramentos HyperTransport (já que utiliza otanto para conexões com periféricos como com outrosprocessadores).

Como dito anteriormente, o Dual Core da AMD utiliza ocontrolador de memória e o HyperTransport compartilhados entre

os dois núcleos para manter compatibilidade com os atuaisChipsets e placas mãe. Esses processadores diferem porutilizarem soquetes diferentes: 939 no caso do Athlon 64 X2, esoquete 940 no caso do Opteron. Para habilitar o funcionamento,é necessária apenas uma atualização de Bios.

4.2.6    Desempenho em JogosOs processadores da AMD fazem um grande sucesso entre osgame-maníacos por apresentarem um excelente desempenho em

 jogos.Como já foi dito neste tópico, inicialmente os jogos não terãoganhos de desempenho com os processadores Dual Core por nãopossuírem otimizações Multi-Threading. Apesar disso, odesempenho ainda é excelente. No teste realizado na Figura 13[15], o Athlon 64 X2 4800+, que possui os dois núcleos

funcionando a 2.4 Ghz, teve desempenho semelhante ao Athlon64 4000+, que também possui 2.4 Ghz. Naturalmente odesempenho foi menor que o do Athlon 64 FX-55, que possui 2.6Ghz.

5/14/2018 Limite Da Tecnologia Single Core - slidepdf.com

http://slidepdf.com/reader/full/limite-da-tecnologia-single-core 8/8

 

 

Figura 13. Comparação de desempenho dos processadores

4.2.7    Dissipação TérmicaA dissipação térmica dos processadores Dual Core AMD não émuito elevada em relação a um processador Single-Core.Oficialmente (segundo a AMD), Os Athlon 64 X2, das famílias

4400+, 4600+ e 4800+, gastam 110W enquanto o Athlon 64Single-Core 130nm consome apenas 89 watts. Os valores emwatts de dissipação relativa entre os processadores Intel (Single eDual Core) e AMD (Single e Dual Core) estão representados nafigura 14. [15]

Figura 14. Dissipação térmica de processadores

4.2.8  Considerações FinaisOs Processadores Dual Core são as implementações existentes eacessíveis de arquitetura Multicore. Apesar dos preços aindabastantes altos, estão ficando mais baratos com o tempo, devido àcompetição entre a AMD e a Intel que lançam um modelo melhorem prazos de tempos pequenos (portanto, os que vão ficandoantigos têm seus preços reduzidos).

O mais viável em questões de custo/benefício atualmente é oprocessador Dual Core AMD, que custa mais caro que umprocessador Dual Core Intel (o modelo mais simples - X2 3800+ -tem um preço mais elevado que o Pentium D 820).

5  CONCLUSÃODadas as limitações encontradas pela arquitetura Single-Core, asolução encontrada na forma de Multicore é muito bem vinda.Suas inúmeras vantagens quando comparada com a primeira, já adão um custo/benefício melhor, mesmo sendo ela uma tecnologiarelativamente bem nova e, portanto, sujeito a altos preços. Com opassar do tempo, a indústria está descobrindo métodos cada vezmelhores de projetar processadores com a tecnologia Multicore,como visto da comparação entre Intel e AMD, tentando eliminar

todas desvantagens em potencial encontradas. Para um futuropróximo é esperada que a tecnologia Multicore seja maioria nosconsumidores domésticos e mais e mais novas arquiteturas, cadavez mais impressionantes, sejam desenvolvidas.

6  REFERÊNCIAS[1]  Multi-Core Processors – The Next Evolution In Computing.

http://multicore.amd.com/WhitePapers/Multi-Core_Processors_WhitePaper.pdf , visitado em 25/10/2005.

[2]  Lançamento da tecnologia de múltiplos núcleos.http://multicore.amd.com/pt-BR/Technology/ , visitado emvisitado em 25/10/2005.

[3]  Vantagens da tecnologia de múltiplos núcleos da AMD.http://multicore.amd.com/pt-BR/Products/Benefits/ , visitadoem 25/10/2005.

[4]  O que é a tecnologia de múltiplos núcleos?.

http://multicore.amd.com/WhatIsMC/ , visitado em25/10/2005.

[5]  Multi-Core Technology Brief.http://www1.us.dell.com/content/topics/topic.aspx/global/products/precn/topics/en/multi_core_precn?c=us&l=en&s=gen,visitado em 25/10/2005.

[6]  Intel Multi-Core Platforms.http://www.intel.com/technology/computing/multi-core/ ,visitado em 25/10/2005.

[7]  Multicore. From Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/Multicore, visitado em25/10/2005.

[8]  Symmetric multiprocessing. From Wikipedia, the free

encyclopedia.http://en.wikipedia.org/wiki/Symmetric_multiprocessing,visitado em 25/10/2005.

[9]  Non-Uniform Memory Access. From Wikipedia, the free

encyclopedia. http://en.wikipedia.org/wiki/Non-Uniform_Memory_Access, visitado em 25/10/2005

[10] Lei de Moore: até quando? – V A razão do limite.http://www.forumpcs.com.br/coluna.php?b=107220, visitadoem 27/10/2005

[11] Características e recursos dos processadores.http://www.guiadohardware.net/tutoriais/processadores/caracteristicas_e_recursos/parte-4/index.php, visitado em27/10/2005

[12] First Tests of Intel's Dual-Core Processor.http://www.pcworld.com/reviews/article/0,aid,120264,00.asp, visitado em 27/10/2005

[13] Intel's Dual-Core Chips Debut.http://www.pcworld.com/news/article/0,aid,117718,00.asp,visitado em 27/10/2005

[14] Let the Dual-Core Revolution Begin.http://www.intel.com/personal/desktopcomputer/dual_core/index.htm, visitado em 27/10/2005

[15] Fórum do Clube do Hardware > Processadores Dual-Core.http://forum.clubedohardware.com.br/index.php?showtopic=263159, visitado em 27/10/2005