Arquitetura de Computadores

28
Aula 01 – Introdu¸c˜ ao Clodoaldo A. M. Lima 2 de abril de 2014 Material baseado no livro ”Patterson, David A., Hen- nessy, J. L. – Computer Organization And Design: The Hardware/Software Interface” 3aEdi¸c˜ ao 4aEdi¸c˜ ao 4aEdi¸c˜ ao R 5aEdi¸c˜ ao Clodoaldo A. M. Lima Aula 01 – Introdu¸c˜ ao 2 de abril de 2014 1 / 28

description

Introdução Arquitetura

Transcript of Arquitetura de Computadores

Aula01IntroducaoClodoaldoA.M.Lima2deabrilde2014Material baseadonolivroPatterson,DavidA.,Hen-nessy, J. L. Computer Organization And Design: TheHardware/SoftwareInterface3aEdicao 4aEdicao4aEdicaoR5aEdicaoClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 1/28ApresentacaodaDisciplinaSumarioObjetivosdaDisciplinaProgramaeConte udoFerramentasutilizadasCriteriosdeAvalia caoRecupera caoBibliograaClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 2/28ObjetivosdaDisciplinaObjetivosIntroduzirosconceitosdeArquiteturadeVonNeumaneosaprimoramentosqueestaarquiteturavemexperimentando.FornecercontatocomosprincipaiscomponentesdeinternosdeumprocessadorConte udosArquiteturadeVonNeuman. TecnicasdePipelineIntrodu cao`asArquiteturasRISCeCISC.ProcessadoresSuperescalares. ProcessadoresvetoriaisArquiteturasparalelas. AnalisedeArquiteturasComercias.CargaHorariaTotal: 30hMetodoAulasexpositivas,exercciosetrabalhos.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 3/28Programaeconte udos(02/04)-Aula1-Apresenta caodadisciplina: Programa,Cronograma,Avalia coes(09/04)-Aula2-Introdu caoaArquiteturadeComputador-Arq. deVonNeuman(16/04)-Feriado(23/04)-Aula3-Linguagemdemaquina-Revisao(30/04)-Aula4-Avaliandoecompreendendoodesempenho(07/05)-Aula5-Oprocessador: caminhodedadosecontrole(14/05)-Aula6-MelhorandoodesempenhocomoPipelining(21/05)-Aula7-Paralelismononveldedados(28/05)-Aula8-ProvaP1ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 4/28Programaeconte udos(04/06)-Aula9-Paralelismononveldeinstrucao(11/06)-Aula10-Paralelismononveldethread(18/06)-Aula11-ArquiteturaRISC(25/06)-Aula13-ArquiteturaModernas: RISCxCISC(02/07)-Aula14-TopologiadeRededemultiprocessadores(09/07)-Aula15-ArquiteturasAvan cadas: Super-Escalar,Vetorial.(16/07)-ProvaP2(23/07)-ProvaSubstitutiva(30/07)-RECClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 5/28CriteriosdeAvaliacaoAvaliacaoFrequenciaMnima: 70%2Trabalhos(EP1,EP2)Mediadotrabalho(MP)MT=(EP1+EP2)/22ProvasIndividual(P1,P2)MediadasProvas(MP)MP=(P1+P2)/2MediaFinal(MF)MF=0.7*MP+0.3*MTSeMF> 5.0entaoAlunoAPROVADOSenaoSeMF> 3.0entaoAlunoemRecuperacaoSenaoAlunoREPROVADOClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 6/28BibliograaBasicaPATTERSON,D.A.;HENNESSY,J.L.ComputerOrganizationandDesign: TheHardware/SoftwareInterface,MorganKaufmann,5aedition,2014STALLINGS,W.ArquiteturaeOrganizacaodeComputadores,PrenticeHall,5a. ed.,2002.ComplementarTANENBAUM,A.S.StructuredComputerOrganization,PrenticeHall,4thed,1999.CHAN,P.K.;MOURAD,S.DigitalDesignUsingFPGAs. PrenticeHall,1994.WAKERLY,J.F.DigitalDesign-Principles&Practices. 3aEd.,PrenticeHall,2000.MANO,M.M.ComputerSystemArchitecture,Prentice-Hall,1993.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 7/28BibliograaComplementarMANO,M.M.;KIME,C.R.LogicandComputerDesignFundamentals,2a.Ed.,P.Hall,2000.BROWN,S.;VRANESIC,Z.FundamentalsofDigitalLogicwithVHDLDesign,MGHill,2000.redHENNESSY,J.;PATTERSON,D.ComputerArchitecture: AQuantitativeApproach,MK,5aedition,2011.HWANG,K.AdvancedComputerArchitecture: Parallelism,Scalability,Programmability,McGraw-Hill,1996.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 8/28Aoterminodocurso,espera-seComoosprogramasescritosemumalinguagemdealtonivel,comoCouJava,saotraduzidosparaalinguagemdemaquinaecomoohardwareexecutaosprogramasresultantes?Compreender esses conceitos forma o alicerce para entender os aspectosdohardwareesoftwarequeafetamodesempenhodosprogramas.Oque eainterfaceentreosoftwareeohardware,ecomoosoftwareinstruiohardwarearealizarasfuncoesnecessarias?Essesconceitossaovitaisparaentendercomoescrevermuitostiposdesoftware.Oquedeterminaodesempenhodeumprogramecomoumprogramadorpodemelhorarodesempenho?Comoveremos,istodependedoprogramaoriginal,datradu caodesseprogramaparaalinguagemdocomputadoredaecienciadohardwareemexecutaroprograma.Quetecnicaspodemserusadaspelosprojetistasdehardwareparamelhorarodesempenho?Estecursoapresentaraosconceitosbasicosdoprojetodeumcomputadormoderno.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 9/28ArquiteturaversusOrganizacaoArquiteturaRefere-seaatributosquetemimpactosdiretossobreaexecu caologicadeumprograma. Essesatributossao: conjuntodeinstru coes,numerodebitsquerepresentaumdeterminandodado,mecanismosdeentradaesada,entreoutros. LidacomofuncionamentodoSistemaComputacional.Correspondeaosaspectosvisveisaumprogramadoremlinguagemdemaquina,taiscomorepertoriodeinstrucoes,n umerodebitsutilizadopararepresentarvariostiposdedados,mecanismodeE/Semodosdeenderecamento.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 10/28ArquiteturaversusOrganizacaoOrganizacaoRefere-seasunidadesoperacionaisesuasinterconexoes. Osatributosquerepresentaaorganizacaodeumcomputadorsao: detalhesdehardwaretaiscomosinaisdecontrole,interfacesentrecomputadoreseperifericos,tecnologiasdememoriasutilizadas.Dizrespeito`asunidadesoperacionais(UCP,unidadedememoria,barramentos,sinaisdecontrole,etc)necessariasparaimplementarasespecicacoesdeumaarquitetura. Aorganizacao eemgeraltransparenteaoprogramador.ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 11/28Desempenhohist oricodomicroprocessadorClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 12/28PontosaseremobservadosOcrescimentode52%aoano eporcausadavelocidadedeclockcadavezmaisrapidoeinova coesarquitetonicas(levouaumavelocidade25xmaisalta)Oaumentodavelocidadedeclockcaiupara1%aoanonos ultimosanosOcrescimentode22%incluiaparalelizacaodem ultiplosn ucleosLei deMoore: On umerodetransistoresemumchipdobraacada18-24mesesClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 13/28AumentodavelocidadedeclockClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 14/28AumentodavelocidadedeclockClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 15/28TendenciasdeTecnologiadoprocessadorDensidadedostransistoresaumentaem35%poranoetamanhodon ucleoaumentaem10-20%porano... maisfuncionalidadesVelocidadedotransistormelhoralinearmentecomotamanho(equacaocomplexaqueenvolvetensoes,resistencias,capacitancias)....podelevaramelhoriasdevelocidadedeclock!AtrasosnoonaodiminuinomesmoritmoqueatrasosnalogicaBarreiradaenergia: nao epossvelexecutardeformaconsistenteemfrequenciasmaisaltassematingirlimitespotencia/termicos(ModoTurbopodecausaraumentosdefrequenciaocasionais)ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 16/28Oqueajudanaperformance?SemaumentaravelocidadedeclockEmumciclodeclock,podehavermaistrabalho-umavezqueostransistoressaomaisrapido,emaisecientesemtermosdeenergia,epodehavervariosdelesMelhoranaarquitetura: encontrarmaisparalelismoemumathread,melhorprevisaodedesvios,melhorespolticasdecache,melhororganizacoesdememoria,maisparalelismononveldethread,etcClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 17/28ParaondevamosAstendenciasmodernas:MelhoriasnavelocidadedoclockestaodiminuindorestricoesdeenergiaDifcil otimizar ainda mais um unico core para melhorar o desempenhoMulti-n ucleos: cadanovageracaodeprocessadoresvaiacomodarmaisn ucleosPrecisademelhoresmodelosdeprogramacaoeecienteexecucaodeaplicacoesmulti-threadPrecisademelhorhierarquiasdememoriaPrecisadeumamaiorecienciaenergeticaEmalgunsdomnios,n ucleosmenospotentesaoatraentesClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 18/28ProcessadoratualIntelCorei7Frequenciadorelogio: 3.2-3.33GHzprodutos45nme32nmN ucleos: 4-6Potencia: 95-130WDoisthreadsporn ucleo3nveldecache,12MBdecacheL3Preco: ??ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 19/28TendencianoconsumodeenergiaPotenciaDyn(dynpower) atividadexcapacitanciaxvoltagexfrequenciaCapacitanciaportransistoreatensaoestaodiminuindo,mason umerodetransistoresestaaumentandoaumritmomaisrapido;portanto,frequenciadeclockdevesermantidaconstanteFugadeenergiatambemestaaumentando; eumafun caodon umerodetransistor,correntedefugaetensaodealimentacaoConsumodeenergiajaestaentre100-150WemprocessadoresdealtodesempenhoatuaisEnergia=Potenciaxtempo=(dynpower+lkgpower)xtempoClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 20/28PotenciaxEnergiaEnergia eumametricanal: elanosdizoverdadeirocustonaexecucaodeumatarefaxa.Potencia(energia/tempo)implicaemrestricoes,sopodeserbastanterapidoateapotenciamaximafornecidaouaplicaralgumtipoderesfriamentoSeumprocessadorAcomsone1,2xapotenciadoprocessadorB,masterminaatarefaem30%menostempo,asuaenergiarelativa ede1.2x0.7 = 0, 84;ProcessadorA emelhor,assumindoque1.2xdeenergiapodeserfornecidapelosistemaClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 21/28ReduzindoaPotenciaeaEnergiaDesligarostransistoresqueestaoinativos(reduzovazamento)ProjetarocasotpicoedesacelerarquandoaatividadeexcederumlimiarDFS:escalonamentodinamicodafrequencia-reduzfrequenciaepotenciadinamica,masprejudicaaenergiaDVFS:escalonamentodinamicodatensaoefrequencia-reduziratensaoefrequenciapor(digamos)10%;podedeixarumprogramamaislento(digamos)em8%,reduzapotenciadinamicaem27%,reduzapotenciatotal(digamos)por23%,reduzindoaenergiatotalem17%Nota: aquedadetensao transistormaislento quedanafrequencia)ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 22/28OutrasTendenciasTecnol ogicaDRAMaumentadensidadeem40-60%porano,alatenciatemsidoreduzidaem33%em10anos,larguradebandamelhoraduasvezesmaisrapidoquealatenciadiminuiDensidadedodiscomelhoraem100%acadaano,alatenciamelhoradeformasimilar`aDRAMSurgimentodetecnologiasNVRAMpodemfornecerumaponteentreDRAMeunidadesdediscorgidoAlemdisso,crescentepreocupacaocomaconabilidade(transistoresmenores,operandoabaixasvoltagens,emuitosdeles)ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 23/28DenindoConabilidadeeDisponibilidadeUmsistemaalternaentreRealizacaodeservicos: servicocorresponda`asespecicacoesInterrupcaodoservico: servicosdesviadasespecica coesAalternancia ecausadaporfalhaserestaura coesConabilidademedearealiza caodeumservi codeformacontnuae enormalmenteexpressacomotempomedioateafalha(MTTF)Disponibilidademedeafra caodetempoqueosservi coscorrespondeasespecicacoes,expressacomoMTTF/(MTTF+TMPR)ClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 24/28CustoOcusto edeterminadoporvariosfatores: volume,rendimento,maturidadefabricacao,etapasdeprocessamento,etcImportante: areadochipPequenaarea maischipsporwaferPequenaarea umdefeitonoslevaadescartarumapequenaareadochips,ouseja,orendimentosobeDeummodogeral,ametadedaarea umtercodocustoClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 25/28TecnologiaparaconstrucaodeProcessadoreseMem oriaTransistor esimplesmenteumachaveliga/desligacontroladaporeletricidade.Circuitointegrado eacombinacaodedezenasacentenasdetransitoresemum unicochipVLSI(EscalaMuitogrande)usadoparadescreveroaumentonon umerodetransitoresdecentenasparamilhoesSemicondutor eomaterialousubstanciaquenao ebomcondutordeeletricidadeClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 26/28TecnologiaparaconstrucaodeProcessadoreseMem oriaComumprocessoqumicoespecial, epossvelacrescentaraosilciomateriaisquepermitemmin usculasareassetransformememumaentretresdispositivosExcelentescondutoresdeeletricidadeExcelentesisolantesdeeletricidadeAreasquepodemconduzirouisolarsobcondicoesespeciaisClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 27/28TecnologiaparaconstrucaodeProcessadoreseMem oriaAp osolingotedesilcioseremfatiados,oswafersvirgenspassampor20a40paracriarwaferscompadr oesEsseswaferscompadr oessaotestadoscomumtestadordewaferse ecriadoummapadaspartesboasOswafersaodivididosemdies(moldes)EssesdiesbonssaosoldadoseencapsuladosNovamentesaotestadosantesdeseremremetidosparaosclientesClodoaldoA.M.Lima Aula01Introducao 2deabril de2014 28/28