Hd’s e armazenamento

Post on 14-Feb-2017

359 views 0 download

Transcript of Hd’s e armazenamento

Fundamentos de Hardware

HD’s e Armazenamento

Prof. Washington Batista

HD’s e Armazenamento

• Sem dúvida, o disco rígido foi um dos componentes que maisevoluiu na história da informática. O primeiro disco rígido (oIBM 350) foi construído em 1956 e era formado por umconjunto de nada menos que 50 discos de 24 polegadas dediâmetro, com uma capacidade total de 4.36 MB.

• Características:

1,70 mt de altura

Quase 1.000 kg

Conhecido como “unidade de disco”

Custo: 35 mil dólares

Como um HD funciona• Disco rígido ou disco duro, no Brasil popularmente tambémHD é a parte do computador onde são armazenadas asinformações, ou seja, é a "memória permanente"propriamente dita. É caracterizado como memória física,não-volátil, que é aquela na qual as informações não sãoperdidas quando o computador é desligado.

Como um HD funciona

• O disco é constituído de ligas de vidro ou materias híbridosde vidro e cerâmica, e precisa ser completamente plano,pois, o mesmo gira a grandes velocidades e as cabeças deleitura trabalham extremamente próximas da superfíciemagnética, logo, qualquer variação seria fatal.

• Para atingir a perfeição necessária, o disco é polido em umasala limpa, até que se torne perfeitamente plano. Vem entãoa parte final, que é a colocação da superfície magnética nosdois lados do disco.

Como um HD funciona

Os discos são montados em um eixo feito de

alumínio, que deve ser sólido o suficiente

para evitar qualquer vibração dos discos,

mesmo a altas rotações.

No caso de HDs com vários discos, eles são

separados usando espaçadores, novamente

feitos de ligas de alumínio.

Finalmente, temos o motor de rotação,

responsável por manter uma rotação

constante.

Como um HD funciona

• Velocidade dos discos:

• 3.600 RPM;

• 5.400 RPM;

• 7.200 RPM ou

• 10.000 RPM.

• Para ler e gravar dados no disco, são usadas cabeças de leituraeletromagnéticas (heads) que são presas a um braço móvel(arm), oque permite seu acesso a todo o disco.

Principais componentes de um HD

Ao ler um arquivo, a controladora posiciona a cabeça de leitura sobre a trilhaonde está o primeiro setor referente a ele e espera que o disco gire até osetor correto.Este tempo inicial, necessário para iniciar a leitura, é chamado de tempo deacesso, e mesmo os HDs atuais de 7.200 RPM fica em torno de 12 ms.

• O HD é relativamente rápido ao ler setores seqüenciais, mas ao ler váriospequenos arquivos espalhados pelo HD, o desempenho pode “despencar”.

• Desfragmentadores: São softwares que que procuram reorganizar a ordemdos arquivos, de forma que eles sejam gravados em setores contínuos.

Como um HD funciona

O HD possui duas cabeças de leitura para cada disco (umapara cada face), de forma que um HD com 4 discos utilizaria8 cabeças de leitura, presas ao mesmo braço móvel.

Embora usar mais discos permita construir HDs de maiorcapacidade, não é comum que os fabricantes utilizem maisde 4, pois a partir daí torna-se muito difícil (e caro)produzir componentes com a precisão necessária paramanter todos os discos alinhados.

Discos rígidos

A placa controladora

• A placa lógica, ou placa controladora, é a parte "pensante"do HD. Com exceção dela, o HD é um dispositivorelativamente simples, composto por uma série dedispositivos mecânicos.

• É a controladora que faz a interface com a placa-mãe,controla a rotação do motor e o movimento das cabeças deleitura, de forma que elas leiam os setores corretos, faz averificação das leituras, de forma a identificar erros (e sepossível corrigi-los, usando os bits de ECC disponíveis emcada setor), atualiza e usa sempre que possível os dadosarmazenados no cache de disco.

A placa controladora

Organização dos discos

Para organizar o processo de gravação e leitura dos dados, asuperfície dos discos é dividida em trilhas e setores.

As trilhas são círculos concêntricos, que começam no final dodisco e vão se tornando menores conforme se aproximam docentro, e cada uma recebe um número de endereçamento, quepermite sua localização.

A trilha mais externa recebe o número 0 e as seguintesrecebem os números 1, 2, 3, e assim por diante.As trilhas se dividem em setores, que são pequenos trechosde 512 bytes cada um, onde são armazenados os dados.

Organização dos discos

• As cabeças de leitura estão presas no mesmo braçomóvel e não possuem movimento independente, portanto,todas as cabeças de leitura sempre estarão na mesmatrilha de seus respectivos discos, deixamos de chamá-las de trilhas e passamos a usar o termo "cilindro".

Organização dos discos

Um cilindro nada maisé do que o conjunto detrilhas com o mesmonúmero nos váriosdiscos.

Correção de erros e badblocks

• Por melhor que seja sua qualidade, nenhuma mídiamagnética é 100% confiável (como pode confirmarquem já teve o desprazer de trabalhar comdisquetes).

• Pequenas falhas na superfície da mídia podem levar aerros de leitura.

Correção de erros e badblocks

•Caso seja verificado um erro, os bytes de ECC sãousados para tentar corrigir o problema, na qual, amaioria dos casos é eficiente.

•Estes erros transitórios, que são corrigidos com aajuda dos códigos ECC são chamados de "softerrors" e não causam nenhum efeito colateral alémde um delay de alguns milissegundos na leitura.

Correção de erros e badblocks

• Em um HD, cada setor armazena, 512 bytes de dadose alguns bytes contendo os códigos ECC;

• Os bytes de ECC são criados pela placa lógica;

• Ao ler um setor a cabeça de leitura lê também oscódigos de ECC, que visam apenas verificar se osdados que estão sendo lidos são os mesmos queforam gravados

Correção de erros e badblocks

• Badblocks: São defeitos físicos na mídia magnética, onde não é mais possível gravar dados.

• O jeito é marcar os badblocks, de forma que eles não sejam mais usados.

• Os HDs atuais são capazes de marcar automaticamente os setores defeituosos.

• A própria controladora faz isso, independentemente do sistema operacional.

Correção de erros e badblocks

• Existe uma área reservada no início do disco chamada"defect map" (mapa de defeitos) com alguns milhares desetores que ficam reservados para alocação posterior.

• Sempre que a controladora do HD encontra um erro ao lerou gravar num determinado setor, ela remapeia o setordefeituoso, substituindo-o pelo endereço de um setor"bom", dentro do defect map.

• Como a alocação é feita pela própria controladora, o HDcontinua parecendo intacto para o sistema operacional.

Parâmetros de desempenho

• Tempo de Busca (Seek Time)

O tempo de busca indica o tempo que a cabeça deleitura demora para ir de uma trilha à outra do disco,ou seja, indica a performance do actuator usado noHD.

O tempo de busca é importante, pois ele é o fator quemais influencia no tempo de acesso econsequentemente na performance geral do HD.

Parâmetros de desempenho

• Tempo de Latência (Latency Time)Dentro do disco rígido, os discos magnéticos giramcontinuamente. Por isso, dificilmente os setores aserem lidos estarão sob a cabeça de leitura/gravaçãono exato momento de executar a operação.

No pior dos casos, pode ser necessária uma voltacompleta do disco até o setor desejado passarnovamente sob a cabeça de leitura.

Parâmetros de desempenho

• Tempo de Acesso (Access Time)O tempo de acesso é a combinação do tempo de buscae do tempo de latência, o tempo médio necessário pararealizar um acesso a um setor aleatório do HD.

Assim que o comando é processado, a cabeça deleitura é movida para a trilha especificada (tempo debusca) e aguarda até que a rotação dos discos a façapassar pelo setor especificado (tempo de latência).

Parâmetros de desempenho•NCQ•A grande maioria dos HDs SATA atuais suportao NCQ, onde a controladora utiliza o tempoocioso, entre uma leitura e outra, para estudar ereorganizar a ordem das leituras seguintes, deforma que elas possam ser executadas na ordemem que seja necessário o menor movimentopossível dos discos.

Parâmetros de desempenhoNCQ - Native Command Queuing (Comando Nativo de Enfileiramento)

Parâmetros de desempenho• CACHE DE DISCO

Permite à controladora executar um conjunto de operaçõesúteis para melhorar o desempenho.

Geralmente ao ler um arquivo, serão lidos vários setoresseqüenciais.

A forma mais rápida de fazer isso é, fazer com que a cabeçade leitura leia de uma vez todos os setores da trilha, passepara a trilha seguinte, passe para a terceira e assim pordiante.

Parâmetros de desempenho

• MTBF e service life

• MTBF significa "Medium Time Between Failures" ou "tempomédio entre falhas".

• A maioria dos HDs de baixo custo, destinados ao mercadodoméstico, possuem MTBF de 300.000 ou 600.000 horas,enquanto os modelos high-end, ou destinados a servidores,normalmente ostentam um MTBF de 1.200.000 horas.

Parâmetros de desempenho

• O service life indica o tempo de vida "recomendado" pelo fabricante, que normalmente é de 5 anos.

• Como o HD é composto por componentes mecânicos, um certo desgaste é acumulado durante o uso, culminando na falha do HD.

• Um service life de 5 anos indica que o HD é projetado para durar 5 anos e que a grande maioria das unidades deve realmente resistir ao tempo especificado.

Interfaces/IDE

As interfaces usadas como meio de conexão para osHDs passaram por um longo caminho evolutivo.

As placas-mãe usadas nos primeiros PCs sequerpossuíam interfaces de disco embutidas.

Naquela época, as interfaces IDE ainda não existiam,de forma que novas interfaces eram vendidas junto comos HDs e instaladas em slots ISA disponíveis.

Interfaces/IDE

• Desenvolvido pela Quantum e a Western Digital, osprimeiros HDs e interfaces IDE chegaram ao mercadoem 1986. Em 1990 o padrão foi ratificado peloANSI(American National Standards Institute - "InstitutoNacional Americano de Padrões") dando origem ao padrãoATA(Advanced Technology Attachment). Como o nome"IDE" já estava mais difundido, muita gente continuouusando o termo "IDE", e outros passaram a usar"IDE/ATA" ou simplesmente “PATA".

Interfaces/IDE

• Na placa-mãe encontravamos duas portas IDE. Apósa popularização das interfaces SATA, as portas IDEainda continuaram sendo incluídas nas placasrecentes (muitas placas passaram a trazer apenasuma porta IDE) mas estima-se que não demore adesaparecer completamente.

Interfaces/IDE Master

Slave

Interfaces/SATA

• A partir de um certo ponto, ficou claro que o padrãoIDE/ATA estava chegando ao seu limite e que mudançasmais profundas só poderiam ser feitas com a introduçãode um novo padrão. Surgiu então o SATA (Serial ATA).

• O SATA é um barramento serial, onde é transmitido umúnico bit por vez em cada sentido (Full-duplex). Issoelimina os problemas de sincronização e interferênciaencontrados nas interfaces paralelas, permitindo quesejam usadas freqüências mais altas.

Interfaces/SATA

• Existem três padrões de controladoras SATA, o• SATA 150 (também chamado de SATA 1.5 Gbit/s ou SATA

1500);• SATA 300 (SATA 3.0 Gbit/s ou SATA 3000);• SATA 600 (ou SATA 6.0 Gbit/s);

• Como o SATA utiliza dois canais separados, um paraenviar e outro para receber dados, temos 150 ou 300MB/s em cada sentido, e não 133 MB/s compartilhados,como no caso das interfaces ATA/133.

• Os cabos SATA são bem mais práticos que os cabos IDE e nãoprejudicam o fluxo de ar dentro do gabinete.

• Os cabos podem ter até um metro de comprimento e cadaporta SATA suporta um único dispositivo, ao contrário dopadrão master/slave do IDE/ATA.

• Por isso, é comum que as placas-mãe ofereçam 4 portas SATA(ou mais), com apenas as placas de mais baixo custo incluindoapenas duas.

Interfaces/SCSI (Small Computer Systems Interface)

• Foi originalmente definido como uma interfaceparalela universal a nível de sistema para conectarvários dispositivos através de um único cabo, chamadobarramento SCSI.

• Os dispositivos recebem números de identificação(IDs) que são números de 0 a 7 (nas controladoras de8 bits) ou de 0 a 15 nas de 16 bits. Um dos IDsdisponíveis é destinado à própria controladora,deixando 7 ou 15 endereços disponíveis para osdispositivos.

Interfaces/SCSI

• O ID de cada dispositivo é configurado através de umachave ou jumper, ou (nos mais atuais), via software. Aregra básica é que dois dispositivos não podem utilizar omesmo endereço, caso contrário você tem um conflitosimilar ao que acontece ao tentar instalar dois HDsjumpeados como master na mesma porta IDE.

Barramento SCSI

Interfaces/SAS

• Com a introdução do Serial ATA, o barramento SCSIperdeu grande parte de seus atrativos, já que o SATAoferece uma grande parte das vantagens que antes eramatribuídas ao SCSI e, ao mesmo tempo, oferece umsistema de cabeamento mais simples.

• Para preencher a lacuna, surgiu o SAS (Serial AttachedSCSI), um barramento serial, muito similar ao SATA emdiversos aspectos, que adiciona várias possibilidadesinteressantes voltadas para o uso em servidores.

Interfaces/SAS

• Assim como o SCSI conviveu com o padrão IDE por mais deduas décadas, o SAS está destinado a concorrer com oSATA, com cada um em seu respectivo nicho:

• O SATA nos micros domésticos e servidores de baixo custo.• O SAS em servidores maiores e estações de trabalho.

• As versões iniciais do SAS suportavam taxas detransferência de 150 e 300 MB/s, posteriormente foiintroduzido o padrão de 600 MB/s e passou a serdesenvolvido o padrão seguinte, de 1.2 GB/s.

Interfaces/SAS

•A maior velocidade é necessária, pois o SAS permiteo uso de extensores (expanders), dispositivos quepermitem ligar diversos discos SAS a uma únicaporta. Existem dois tipos de extensores SAS.

• “Edge Expanders” que permitem ligar até 128 discosna mesma porta, e

• “Fanout Expanders” que permitem conectar até 128Edge Expanders (cada um com seus 128 discos!),chegando a um limite teórico de até 16.384 discospor porta SAS.

Maior Velocidade

Fácil Expansão

Hot swap

RAID

• Devido à sua natureza mecânica, o HD é um doscomponentes mais lentos de qualquer PC. Embora odesempenho venha crescendo a cada nova geração, osganhos não têm acompanhado o aumento na capacidade dearmazenamento;

• Ex; HD de 1 TB X HD de 40 GB;

• Ao invés de criar HDs muito rápidos, ou com um númeromuito grande de discos, os fabricantes de HDs seespecializaram em fabricar modelos padronizados,utilizando um único braço de leitura e de 1 a 4 platters,fabricados em grande quantidade e a um custorelativamente baixo.

RAID• Para quem precisa de HDs mais rápidos, ou com umacapacidade muito maior, a melhor opção é montar umsistema RAID, onde é possível somar a capacidade eo desempenho de vários HDs, ou então sacrificarparte do espaço de armazenamento em troca de maisconfiabilidade.

• O termo RAID significa "Redundant Array of InexpensiveDisks", indicando justamente o uso de HDs padronizados ebaratos como "blocos de montagem" para a criação desistemas que se comportam como um único disco, maior,mais rápido e/ou mais confiável do que suas peçasindividuais.

RAID 0 (Striping) – Técnica de divisão de dados

• O RAID 0 é um "RAID pra inglês ver", onde o objetivo é unicamentemelhorar o desempenho, sacrificando a confiabilidade.

• Ao usar o RAID 0, todos os HDs passam a ser acessados como sefossem um único drive.

• Ao serem gravados, os arquivos são fragmentados nos vários discos,permitindo que os fragmentos possam ser lidos e gravadossimultaneamente, com cada HD realizando parte do trabalho.

• Usando RAID 0 a performance fica em um patamar próximo davelocidade de todos os HDs somada.

RAID 0 (Striping) – Técnica de divisão de dados

• O RAID 0 é possivelmente o mais usado em desktops e também em alguns servidores de alto desempenho;

• Utilização de HDs idênticos não obrigatória, mas aconselhável;

• Ao utilizar um HD de 500 GB e outro de 300 GB em RAID 0, o sistema ignora os últimos 200 GB do HD maior;

• Vantagem

• Acesso rápido as informações (até 50% mais rápido).

• Custo baixo para expansão.

• Desvantagens;

• Se um HD pifar, as informações são perdidas;

• Não há paridade.

RAID 0 (Striping) – Técnica de divisão de dados

- Os arquivos são divididos entre os discos;

- Melhor desempenho;

- Não é a melhor maneira de se fazerredundância

RAID 1 (Mirroring) – Técnica de espelhamento de dados

• Permite usar dois HDs, sendo que o segundo armazenará uma imagemidêntica do primeiro.

• Na prática, será como se você tivesse apenas um disco rígidoinstalado, mas caso o disco titular falhe por qualquer motivo, vocêterá uma cópia de segurança armazenada no segundo disco. Oobjetivo é aumentar a confiabilidade do sistema.

• Também é possível utilizar RAID 1 com quatro ou mais discos (desde que seja utilizado sempre um número par). Nesse caso, um dos discos de cada par é visto pelo sistema como um HD separado e o outro fica oculto, guardando a cópia atualizada do primeiro. Ao utilizar 4 HDs de 500 GB em RAID 1, por exemplo, o sistema enxergaria 2 HDs, de 500 GB cada um.

RAID 1 (Mirroring) – Técnica de espelhamento de dados

• Usar RAID 1 não proporciona qualquer ganho de desempenho. Pelocontrário, ele acaba causando uma pequena perda em comparaçãocom usar um único drive, já que todas as alterações precisam serduplicadas e realizadas em ambos os drives.

• Caso um dos HDs titulares falhe, o segundo entra em açãoautomaticamente, substituindo-o até que você possa substituir odrive;

• É um sistema dedicado a aumentar a disponibilidade;

• Segurança nos dados (com relação a possíveis falhas que possamocorrer no HD).

RAID 1 (Mirroring) – Técnica de espelhamento de dados

- Os arquivos são duplicados entre os discos;

- Consome o dobro de espaço;

- Alta redundância;

RAID 1+0 (Mirroring/striping) – Técnica de espelhamento e divisão de dados

• Este modo pode ser usado apenas caso você tenha a partir de 4 discos rígidos e o módulo total seja um número par (6, 8, etc.);

• Neste modo, metade dos HDs serão usados em modo striping (RAID 0), enquanto a segunda metade armazena uma cópia dos dados dos primeiros, assegurando a segurança;

• Este modo é na verdade uma combinação do RAID 0 e RAID 1, daí o nome;

• O ponto fraco é que você sacrifica metade da capacidade total. Usando 4 HDs de 500 GB, por exemplo, você fica com apenas 1 TB de espaço disponível.

RAID 1+0 (Mirroring/striping) – Técnica de espelhamento e divisão de dados.

RAID 5 (distribuição com paridade)

• Este modo é muito utilizado em servidores com um grandenúmero de HDs. Ele utiliza um método bastante engenhosopara criar uma camada de redundância, sacrificando apenasuma fração do espaço total, ao invés de simplesmente usarmetade dos HDs para armazenar cópias completas, como nocaso do RAID 1.

• O RAID 5 usa um sistema de paridade para manter aintegridade dos dados. Os arquivos são divididos emfragmentos de tamanho configurável e, para cada grupo defragmentos, é gerado um fragmento adicional, contendocódigos de paridade.

RAID 5 (distribuição com paridade)

RAID 6

• O ponto fraco do RAID 5 é que ele suporta a falha deum único HD.

• Se por ventura um segundo HD falhar antes que oprimeiro seja substituído, ou antes que a controladoratenha tempo de regravar os dados, você perde tudo,assim como acontece ao perder um dos HDs num arrayRAID 0.

RAID 6

•O RAID 6 é semelhante ao RAID 5, porém usa o dobro de bits de paridade, garantindo a integridade dos dados caso até 2 dos HDs falhem ao mesmo tempo.

•Ao usar 7 HDs de 500 GB em RAID 6, por exemplo, teríamos 2.5 TB para dados mais 1 TB de códigos de paridade.

RAID 6

Categorias de RAID.

No RAID via hardware uma controladora realiza todas asoperações, o que inclui a maior parte das controladoras SCSIe SAS. Esse modo é o ideal tanto do ponto de vista dodesempenho quanto do ponto de vista da compatibilidade econfiabilidade, já que a própria controladora executa todas asfunções necessárias, de forma independente. O sistemaoperacional apenas acessa os dados, como se houvesse umúnico HD instalado.

Categorias de RAID.

•No RAID via software, todas as funções sãoexecutadas diretamente pelo sistema operacional e osHDs são ligados diretamente às interfaces da placa-mãe. Neste caso, temos um trabalho adicional deconfiguração, mas em compensação não é precisogastar com uma controladora dedicada. É possívelcriar arrays RAID via software tanto no Linux quantono Windows.

SSDs e HHDs• Além da popularização dos pendrives e cartões, a queda no preço

da memória Flash possibilitou o surgimento dos primeiros SSDsou "Solid State Disks" de grande capacidade.

• Um SSD é um "HD" que utiliza chips de memória Flash no lugarde discos magnéticos, é projetado para substituir o HD, sendoconectados a uma porta SATA ou IDE.

Hybrid Hard Drives

• Todos os HDs atuais incluem uma pequena quantidade dememória SDRAM, usada como cache de disco. O cache ébastante rápido, mas é limitado por dois fatores: é muitopequeno (16 MB na maioria dos HDs atuais) e perde osdados armazenados quando o micro é desligado.

• Um meio termo entre os SSDs eos HDs tradicionais são os HHDs(Hybrid Hard Drives), que sãoHDs tradicionais, que incorporamchips de memória Flash, usadoscomo um buffer de dados.

O gigabyte de 1 bilhão de bytes

• Nós, como seres humanos, estamos acostumados apensar em valores segundo o padrão decimal, por issotemos muito mais facilidade em lidar com númerosmúltiplos de 10.

• Os computadores, por outro lado, trabalhamutilizando o sistema binário, ou seja, com potênciasdo número 2. Um único bit permite duas combinaçõespossíveis, dois bits permitem 4, oito bits permitem256, 16 bits permitem 65.536 e assim por diante.

O gigabyte de 1 bilhão de bytes

• Diversos dispositivos seguem essa notação binária,incluindo módulos de memória e CD-ROMs.

• Um módulo de memória de 1 GB possui exatamente1.073.741.824 bytes, enquanto um CD-ROM de 650 MBé dividido em 333.000 setores de 2048 bytes cada um,totalizando 681.984.000 bytes, ou 650.39 MB.

O gigabyte de 1 bilhão de bytes

• O ponto de discórdia são os fabricantes de HDs, que comodamente adotaram o padrão decimal para medir a capacidade dos seus produtos.

• A discordância começou muito antes do que se imagina, datando dos primeiros discos fabricados pela IBM. O IBM 350 não armazenava 5 megabytes, mas sim 5 milhões de caracteres, com 7 bits cada um.

• Concordando ou não, todos os fabricantes acabaram sendo obrigados a aderir à idéia, já que qualquer fabricante que preferisse seguir o padrão binário teria a capacidade de seus produtos "encolhida" em relação à concorrência.

• Querendo ou não, o anúncio de um HD de "1 terabyte" soa melhor do que o anúncio de um HD de "931 gigabytes binários".

O gigabyte de 1 bilhão de bytes