SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e...

426
IBM System Storage SAN Volume Controller Guia de Resolução de Problemas GC27-2284-11 IBM

Transcript of SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e...

Page 1: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

IBM System Storage SAN Volume Controller

Guia de Resolução de Problemas

GC27-2284-11

IBM

Page 2: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NotaAntes de usar estas informações e o produto que ela suporta, leia as informações em “Avisos” na página 391.

Esta edição se aplica ao IBM SAN Volume Controller, Versão 7.6 e a todas as liberações e modificaçõessubsequentes, até que indicado de outra forma em novas edições.

© Copyright IBM Corporation 2003, 2016.

Page 3: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Índice

Figuras . . . . . . . . . . . . . . vii

Tabelas . . . . . . . . . . . . . . . ix

Sobre este guia . . . . . . . . . . . xiQuem deve ler este guia . . . . . . . . . . xiÊnfase . . . . . . . . . . . . . . . . xiBiblioteca do SAN Volume Controller e PublicaçõesRelacionadas . . . . . . . . . . . . . . xiiComo Solicitar Publicações IBM . . . . . . . xivWebsites relacionados. . . . . . . . . . . xivEnviando Seus Comentários . . . . . . . . . xvComo Obter Informações, Ajuda e AssistênciaTécnica . . . . . . . . . . . . . . . . xvSumarização de mudanças para o Guia deresolução de problemas do SAN VolumeController GC27-2284-07 . . . . . . . . . xviiResumo de mudanças para a publicação Guia deResolução de Problemas do SAN VolumeController, G517-9943-06 . . . . . . . . . xvii

Capítulo 1. Visão geral do SAN VolumeController . . . . . . . . . . . . . . 1Systems . . . . . . . . . . . . . . . 12

Nó de Configuração . . . . . . . . . . 12Endereçamento do nó de configuração . . . . 12Failover de IP do Management . . . . . . 13

Visão geral da malha SAN . . . . . . . . . 15

Capítulo 2. Apresentando oscomponentes de hardware do SANVolume Controller . . . . . . . . . . 17Nós do SAN Volume Controller . . . . . . . 17

Controles e indicadores do SAN VolumeController . . . . . . . . . . . . . . 17SAN Volume Controller painel de informações dooperador . . . . . . . . . . . . . . 22Indicadores e conectores do painel traseiro doSAN Volume Controller . . . . . . . . . 26Números de porta do Fibre Channel e nomes dasportas universais . . . . . . . . . . . 37Requisitos para o ambiente do SAN VolumeController . . . . . . . . . . . . . . 38

Comutador de energia de corrente alternadaredundante . . . . . . . . . . . . . . 45

Requisitos do Ambiente do Energia de correntealternada redundante . . . . . . . . . . 46Cabeamento do comutador de energia decorrente alternada redundante (Exemplo) . . . 47

Fonte de Alimentação Ininterrupta. . . . . . . 502145 UPS-1U . . . . . . . . . . . . . 51Requisitos do Ambiente do Fonte de alimentaçãoininterrupta . . . . . . . . . . . . . 56

Definindo os FRUs SAN Volume Controller FRUs 56

Listagem de peças . . . . . . . . . . . 56Comutador de energia de corrente alternadaredundante partes . . . . . . . . . . . 57

Capítulo 3. Interfaces com o SANVolume Controller Usuário paraManutenção do seu Sistema . . . . . 59Interface do GUI de Gerenciamento . . . . . . 59

Quando Utilizar o GUI de gerenciamento . . . 60Acessando o GUI de gerenciamento . . . . . 61Excluindo um nó de um sistema em clusterusando o GUI de gerenciamento . . . . . . 61Incluindo um nó em um sistema . . . . . . 63

Interface do Assistente de Serviço . . . . . . . 67Quando Utilizar o Assistente de Serviço . . . . 67Acessando o Assistente de Serviço. . . . . . 68

Interface da linha de comandos. . . . . . . . 68Quando usar a interface da linha de comandos 68Acessando a interface da linha de comandos dosistema . . . . . . . . . . . . . . . 69

Interface da Linha de Comandos de Serviço . . . 69Quando Utilizar a CLI de Serviço . . . . . . 69Acessando a CLI de serviço . . . . . . . . 69unidade flash USB . . . . . . . . . . . 69

Porta técnica para acesso do nó. . . . . . . . 75Interface do painel frontal . . . . . . . . . 76

Capítulo 4. Executando ações derecuperação usando a CLI do SANVolume Controller . . . . . . . . . . 79Validando e reparando cópias de volume espelhadousando a CLI . . . . . . . . . . . . . . 79Reparando um volume thin-provisioned usando aCLI . . . . . . . . . . . . . . . . . 80Recuperando volumes off-line usando a CLI(interface da linha de comandos) . . . . . . . 81

Capítulo 5. Visualizando os dadosvitais do produto . . . . . . . . . . 83Download dos dados vitais do produto usando oGUI de gerenciamento. . . . . . . . . . . 83Exibindo os dados vitais do produto usando a CLI 83

Exibindo as propriedades de nó usando a CLI . . 83Exibindo Propriedades do Sistema em ClusterUsando a CLI . . . . . . . . . . . . 84

Campos para os VPD do nó . . . . . . . . . 85Campos para os VPD do sistema . . . . . . . 91

Capítulo 6. Usando o painel frontal doSAN Volume Controller. . . . . . . . 95Indicador de progresso da inicialização . . . . . 95Falha na inicialização . . . . . . . . . . . 96Carregando . . . . . . . . . . . . . . 96Códigos de erros . . . . . . . . . . . . 96

© Copyright IBM Corp. 2003, 2016 iii

Page 4: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Inicialização de hardware. . . . . . . . . . 97Solicitação de resgate do nó . . . . . . . . . 97Falha de energia . . . . . . . . . . . . . 97Desligando . . . . . . . . . . . . . . 97Recuperando . . . . . . . . . . . . . . 98Reiniciando . . . . . . . . . . . . . . 98Encerrando . . . . . . . . . . . . . . 98Opção Validar WWN? . . . . . . . . . . . 99Opção de menu do SAN Volume Controller . . . 100

Opções de cluster (sistema). . . . . . . . 102Opções do nó . . . . . . . . . . . . 104Opções de versões. . . . . . . . . . . 104Opções de Ethernet . . . . . . . . . . 105Opções de porta do Fibre Channel . . . . . 105Opções de ação. . . . . . . . . . . . 106Opção Idioma? . . . . . . . . . . . . 121

Usando o controle de energia para o nó do SANVolume Controller . . . . . . . . . . . . 122

Capítulo 7. Diagnosticando problemas 125Iniciando a Coleta de Estatísticas . . . . . . . 125Relatório de Eventos . . . . . . . . . . . 135

Autoteste inicial . . . . . . . . . . . 136Entendendo os Eventos . . . . . . . . . . 136

Gerenciando o Log de Eventos . . . . . . 137Visualizando o Log de Eventos . . . . . . 137Descrevendo os Campos no Log de Eventos . . 137

Notificações de Eventos . . . . . . . . . . 139email de Informações sobre Inventário . . . . . 142Entendendo os Códigos de Erro . . . . . . . 143

Usando as tabelas de código de erro. . . . . 143IDs de Evento . . . . . . . . . . . . 144Relatório de eventos do SCSI . . . . . . . 149Tipos de objeto . . . . . . . . . . . . 152IDs de Eventos de Erro e Códigos de Erro. . . 153Resolvendo um problema com as unidades deinicialização do SAN Volume Controller2145-DH8 . . . . . . . . . . . . . 165Determinando uma falha de inicialização dehardware . . . . . . . . . . . . . . 167Referência de código de inicialização . . . . 168Visão Geral do Código de Erro do Nó . . . . 168Visão Geral do Código do Sistema em Cluster 170Faixa de Códigos de Erro . . . . . . . . 171

Procedimento: determinação de problema da SAN 264Resolvendo um problema com clientes SSL/TLS 265Procedimento: fazendo com que unidadessuportem informações de proteção . . . . . . 265Resolvendo um problema com novos gabinetes deexpansão . . . . . . . . . . . . . . . 266Falhas do Link de Fibre Channel e Ethernet de 10G 267Problemas de link do host iSCSI Ethernet . . . . 268Problemas com link de host do Fibre Channel overEthernet . . . . . . . . . . . . . . . 268Manutenção de Sistemas de Armazenamento . . . 269

Capítulo 8. Recuperação de desastre 271

Capítulo 9. Procedimentos derecuperação . . . . . . . . . . . . 273Procedimento do Sistema de Recuperação . . . . 273

Quando Executar o Procedimento deRecuperação do Sistema . . . . . . . . . 275Corrigir Erros de Hardware . . . . . . . 275Removendo informações do sistema em clusterpara nós com código de erro 550 ou 578 usandoo painel frontal . . . . . . . . . . . . 276Removendo as informações do sistema para nóscom código de erro 550 ou código de erro 578usando o assistente de serviço . . . . . . . 277Concluindo o procedimento de recuperaçãopara os sistemas em cluster usando o painelfrontal . . . . . . . . . . . . . . . 278Executando Recuperação do Sistema Usando oAssistente de Serviço . . . . . . . . . . 279Recuperando a partir de volumes offline usandoa CLI . . . . . . . . . . . . . . . 281O Que Verificar Após a Execução daRecuperação do Sistema . . . . . . . . . 282

Fazendo Backup e Restaurando a Configuração doSistema . . . . . . . . . . . . . . . 284

Fazendo Backup da Configuração do SistemaUtilizando a CLI . . . . . . . . . . . 286Restaurando a Configuração do Sistema . . . 287Excluindo Arquivos de Configuração de BackupUtilizando a CLI . . . . . . . . . . . 293

Concluindo o resgate do nó quando o nó forinicializado . . . . . . . . . . . . . . 293

Capítulo 10. Entendendo os Erros deMídia e os Blocos Inválidos . . . . . 297

Capítulo 11. Usando osprocedimentos de análise demanutenção . . . . . . . . . . . . 299MAP 5000: Iniciar . . . . . . . . . . . . 299MAP 5040: energia SAN Volume Controller2145-DH8 . . . . . . . . . . . . . . 308MAP 5050: Energia do 2145-CG8 e 2145-CF8 . . . 313MAP 5150: 2145 UPS-1U. . . . . . . . . . 317MAP 5250: Verificação de reparo do 2145 UPS-1U 323MAP 5320: Energia de corrente alternadaredundante . . . . . . . . . . . . . . 324MAP 5340: verificação de energia de correntealternada redundante. . . . . . . . . . . 326MAP 5350: Desligando um nó . . . . . . . . 328

Usando o GUI de gerenciamento para desligarum sistema . . . . . . . . . . . . . 330Usando a CLI do SAN Volume Controller paradesligar um nó . . . . . . . . . . . . 331Usando o botão de controle de energia do SANVolume Controller . . . . . . . . . . . 332

MAP 5400: Painel frontal . . . . . . . . . 334MAP 5500: Ethernet . . . . . . . . . . . 337

Definindo um nó de configuração alternativo 340

iv SAN Volume Controller: Guia de Resolução de Problemas

Page 5: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

MAP 5550: porta do adaptador ativadaindividualmente da Ethernet e Fibre Channel overEthernet de 10G . . . . . . . . . . . . 340MAP 5600: Fibre Channel . . . . . . . . . 343MAP 5700: Verificação de reparo . . . . . . . 349MAP 5800: indicadores luminosos . . . . . . 350

Indicadores luminosos para o SAN VolumeController 2145-DH8 . . . . . . . . . . 351Indicadores luminosos para o SAN VolumeController 2145-CG8 . . . . . . . . . . 360Indicadores luminosos para o SAN VolumeController 2145-CF8 . . . . . . . . . . 366

MAP 5900: Inicialização de hardware . . . . . 372MAP 6000: Substitua a SSD offline . . . . . . 377

MAP 6001: Substitua a SSD offline em umamatriz RAID 0 . . . . . . . . . . . . 378MAP 6002: Substitua a unidade de estado sólidooffline na matriz RAID 1 ou na matriz RAID 10 . 380

Capítulo 12. Análise e ajuste dedesempenho iSCSI . . . . . . . . . 383

Apêndice A. Recursos deAcessibilidade do SAN VolumeController . . . . . . . . . . . . . 387

Apêndice B. Onde localizar aDeclaração de Garantia Limitada . . . 389

Avisos . . . . . . . . . . . . . . 391Marcas Registradas . . . . . . . . . . . 393

Declaração de Homologação . . . . . . . . 393Avisos de Emissão Eletrônica . . . . . . . . 393

Declaração do FCC (Federal CommunicationsCommission) . . . . . . . . . . . . 394Declaração de Conformidade do Segmento deMercado do Canadá . . . . . . . . . . 394Declaração Classe A para Austrália e NovaZelândia . . . . . . . . . . . . . . 394Diretiva De Compatibilidade EletromagnéticaDa União Europeia . . . . . . . . . . 394Diretriz de Compatibilidade Eletromagnética daAlemanha . . . . . . . . . . . . . 395Instrução Classe A da República Popular daChina . . . . . . . . . . . . . . . 396Declaração de Conformidade Classe A paraTaiwan . . . . . . . . . . . . . . 396Informações de Contato de Taiwan . . . . . 396Declaração Classe A do Conselho VCCI doJapão . . . . . . . . . . . . . . . 397Instrução da Japan Electronics and InformationTechnology Industries Association . . . . . 397Instrução Classe A da Korean CommunicationsCommission . . . . . . . . . . . . . 398Instrução de Classe A de InterferênciaEletromagnética da Rússia . . . . . . . . 398

Índice Remissivo . . . . . . . . . . 399

Índice v

Page 6: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

vi SAN Volume Controller: Guia de Resolução de Problemas

Page 7: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Figuras

1. SistemaSAN Volume Controllerem uma malha 22. Fluxo de dados em um sistema SAN Volume

Controller . . . . . . . . . . . . . 33. Exemplo de um volume básico . . . . . . 44. Exemplo de volumes espelhados . . . . . . 45. Exemplo de volumes estendidos . . . . . . 56. Exemplo de volumes HyperSwap . . . . . 67. Exemplo de uma topologia do sistema padrão 78. Exemplo de uma topologia do sistema

estendido . . . . . . . . . . . . . 79. Exemplo de uma topologia do sistema

HyperSwap . . . . . . . . . . . . . 810. Nós do SAN Volume Controller com unidades

flashinterno . . . . . . . . . . . . 1011. Nó de configuração do SAN Volume

Controller . . . . . . . . . . . . . 1212. Painel Frontal do SAN Volume Controller

2145-DH8 . . . . . . . . . . . . . 1813. Painel Frontal do SAN Volume Controller

2145-CG8 . . . . . . . . . . . . . 2014. Painel Frontal do SAN Volume Controller

2145-CF8 . . . . . . . . . . . . . 2015. Painel de informações do operador SAN

Volume Controller 2145-DH8. . . . . . . 2316. SAN Volume Controller 2145-CG8 ou 2145-CF8

painel de informações do operador . . . . 2417. SAN Volume Controller 2145-CG8 ou 2145-CF8

painel de informações do operador . . . . 2418. Indicadores do Painel Traseiro do SAN Volume

Controller 2145-DH8 . . . . . . . . . 2719. Conectores na Parte Traseira do SAN Volume

Controller 2145-DH8 . . . . . . . . . 2720. Conector de energia. . . . . . . . . . 2821. Portas de serviço do SAN Volume Controller

2145-DH8 . . . . . . . . . . . . . 2822. Porta sem uso Ethernet do SAN Volume

Controller 2145-DH8 . . . . . . . . . 2923. Indicadores do Painel Traseiro do SAN Volume

Controller 2145-CG8 . . . . . . . . . 2924. Indicadores do Painel Traseiro do SAN Volume

Controller 2145-CG8 para o Recurso Ethernetde 10 Gbps. . . . . . . . . . . . . 30

25. Conectores na Parte Traseira do SAN VolumeController 2145-CG8 . . . . . . . . . 30

26. Portas Ethernet de 10 Gbps na Parte Traseirado SAN Volume Controller 2145-CG8 . . . . 31

27. Conector de energia. . . . . . . . . . 3128. Portas de Serviço do SAN Volume Controller

2145-CG8 . . . . . . . . . . . . . 3129. Porta não usada do SAN Volume Controller

2145-CG8 . . . . . . . . . . . . . 3230. Indicadores do Painel Traseiro do SAN Volume

Controller 2145-CF8 . . . . . . . . . . 3231. Conectores na Parte Traseira do SAN Volume

Controller 2145-CG8 ou 2145-CF8 . . . . . 3332. Conector de energia. . . . . . . . . . 33

33. Portas de Serviço do SAN Volume Controller2145-CF8 . . . . . . . . . . . . . 34

34. Porta não Usada do SAN Volume Controller2145-CF8 . . . . . . . . . . . . . 34

35. LEDs de erro de AC, DC e energia do SANVolume Controller 2145-DH8. . . . . . . 36

36. LEDs de CA, CD e de erro de energia do SANVolume Controller 2145-CG8 ou 2145-CF8 . . 37

37. Foto do comutador de energia de correntealternada redundante . . . . . . . . . 46

38. Um sistema de quatro nós SAN VolumeController com o comutador de energia decorrente alternada redundante de recurso . . 48

39. Exemplo de Cabeamento do Rack. . . . . . 5040. 2145 UPS-1U da montagem do painel frontal 5241. Conectores e Comutadores do 2145 UPS-1U 5442. Comutadores DIP do 2145 UPS-1U. . . . . 5543. Portas não Usadas pelo 2145 UPS-1U . . . . 5544. Conector de energia. . . . . . . . . . 5545. Visualização da FRU do comutador de energia

de corrente alternada redundante . . . . . 5746. Conjunto do Painel Frontal do SAN Volume

Controller . . . . . . . . . . . . . 9547. Exemplo de uma Exibição do Progresso da

Inicialização . . . . . . . . . . . . 9548. Exemplo de um Código de Erro para um

Sistema em Cluster . . . . . . . . . . 9649. Exemplo de um Código de Erro do Nó 9650. Exibição de Resgate do Nó . . . . . . . 9751. Navegação Validar navegação . . . . . . 9952. Opções do SAN Volume Controller no

Monitor do Painel Frontal . . . . . . . 10153. Visualizando o Endereço IPv6 no Monitor do

Painel Frontal . . . . . . . . . . . 10454. Opções da Parte Superior do Menu Ações no

Painel Frontal . . . . . . . . . . . 10855. Opções da Parte do Meio do Menu Ações no

Painel Frontal . . . . . . . . . . . 10956. Opções da Parte Inferior do Menu Ações no

Painel Frontal . . . . . . . . . . . 11057. Navegação navegação. . . . . . . . . 12158. Exemplo de e-mail de informações sobre o

inventário. . . . . . . . . . . . . 14359. Exemplo de um Código de Erro de

Inicialização . . . . . . . . . . . . 16860. Exemplo de uma Exibição do Progresso da

Inicialização . . . . . . . . . . . . 16861. Exemplo de um Código de Erro do Nó

Exibido . . . . . . . . . . . . . 16962. Exemplo de um Código de Erro de Resgate

do Nó . . . . . . . . . . . . . . 17063. Exemplo de uma Criação de Código de Erro

para um Sistema em Cluster . . . . . . 17064. Exemplo de um Código de Erro de

Recuperação . . . . . . . . . . . . 171

© Copyright IBM Corp. 2003, 2016 vii

Page 8: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

65. Exemplo de um Código de Erro para umSistema em Cluster . . . . . . . . . 171

66. Exibição de Resgate do Nó . . . . . . . 29467. LED de Erro nos Modelos do SAN Volume

Controller . . . . . . . . . . . . . 30268. SAN Volume Controller 2145-SV1 painel de

informações do operador . . . . . . . 30269. SAN Volume Controller 2145-DH8 painel de

informações do operador . . . . . . . 30370. Exibição de Inicialização de Hardware 30371. Painel Frontal do SAN Volume Controller

2145-DH8 . . . . . . . . . . . . . 30472. LED de Energia no SAN Volume Controller

2145-DH8 . . . . . . . . . . . . . 30973. Indicador de LED de energia no painel

traseiro do SAN Volume Controller 2145-DH8 31074. Corrente alternada, corrente direta e

indicadores do LED de energia no paineltraseiro do SAN Volume Controller 2145-DH8. 311

75. LED de energia nos modelos SAN VolumeController 2145-CG8 ou 2145-CF8 painel deinformações do operador . . . . . . . 314

76. Indicador do LED de Energia no PainelTraseiro do SAN Volume Controller 2145-CG8ou 2145-CF8 . . . . . . . . . . . . 315

77. Indicador de LED de Energia e Indicadoresde corrente alternada e corrente contínua noPainel Traseiro do SAN Volume Controller2145-CG8 ou 2145-CF8 . . . . . . . . 316

78. 2145 UPS-1U da montagem do painel frontal 31879. Botão de controle de energia nos modelos

SAN Volume Controller 2145-CF8, 2145-CG8 e2145-DH8 . . . . . . . . . . . . . 332

80. Botão de controle de energia e luzes de LEDno modelo SAN Volume Controller 2145-SV1 . 333

81. Luz de Erro do Controlador de Serviço doSAN Volume Controller . . . . . . . . 335

82. Monitor do Painel Frontal quando os Botõesde Comando São Pressionados . . . . . . 336

83. LED do link da Ethernet da porta 2 no paineltraseiro do SAN Volume Controller . . . . 338

84. Portas Ethernet na parte traseira do SANVolume Controller 2145-DH8 . . . . . . 338

85. SAN Volume Controller 2145-DH8 painel deinformações do operador . . . . . . . 351

86. Pressione a trava de liberação . . . . . . 35287. SAN Volume Controller 2145-DH8 . . . . 35288. LEDs da placa-mãe do sistema SAN Volume

Controller 2145-DH8. . . . . . . . . . 35489. SAN Volume Controller 2145-CG8 ou

2145-CF8 painel de informações do operador . 36090. Painel do sistema de diagnósticos por

indicadores luminosos do SAN VolumeController 2145-CG8 ou 2145-CF8 . . . . . 361

91. Painel de Diagnósticos dos LEDs daPlaca-mãe do SAN Volume Controller2145-CG8 . . . . . . . . . . . . . 362

92. SAN Volume Controller 2145-CG8 ou2145-CF8 painel de informações do operador . 366

93. Painel do sistema de diagnósticos porindicadores luminosos do SAN VolumeController 2145-CG8 ou 2145-CF8 . . . . . 367

94. Painel de Diagnósticos dos LEDs daPlaca-mãe do SAN Volume Controller2145-CF8 . . . . . . . . . . . . . 368

95. Exibição de Inicialização de Hardware 37296. Exibição de Resgate do Nó . . . . . . . 37397. Portas do Teclado e do Monitor no SAN

Volume Controller 2145-CF8 . . . . . . 37498. Portas do Teclado e do Monitor no SAN

Volume Controller 2145-CG8 . . . . . . 37499. Portas do teclado e do monitor no SAN

Volume Controller 2145-DH8, frontal. . . . 375100. Portas do teclado e do monitor no SAN

Volume Controller 2145-DH8, traseira . . . 375

viii SAN Volume Controller: Guia de Resolução de Problemas

|||

Page 9: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabelas

1. Websites IBM para Ajuda, Serviços eInformações . . . . . . . . . . . . xii

2. Biblioteca do SAN Volume Controller . . . . xii3. Outras publicações IBM . . . . . . . . xiv4. Documentação do IBM e Web Sites

Relacionados . . . . . . . . . . . . xiv5. Websites do IBM para Ajuda, Serviços e

Informações . . . . . . . . . . . . xv6. Resumo da topologia do sistema e do volume 87. Tipos de comunicações do SAN Volume

Controller . . . . . . . . . . . . . 98. Estado e atividade do link para o LED inferior

do Fibre Channel. . . . . . . . . . . 359. Velocidade do link para o LED superior do

Fibre Channel . . . . . . . . . . . . 3510. Velocidades do link reais . . . . . . . . 3511. Requisitos da Voltagem de Entrada . . . . 3812. Consumo de Energia . . . . . . . . . 3813. Especificações Físicas . . . . . . . . . 3914. Dimensões e peso . . . . . . . . . . 3915. Requisitos de Espaço Adicional . . . . . . 3916. Saída máxima de calor de cada nó do

2145-DH8 . . . . . . . . . . . . . 4017. Requisitos da Voltagem de Entrada . . . . 4018. Consumo Máximo de Energia . . . . . . 4019. Requisitos do ambientesem energia AC

redundante . . . . . . . . . . . . 4120. Requisitos do ambiente com energia AC

redundante . . . . . . . . . . . . 4121. Dimensões e peso . . . . . . . . . . 4222. Requisitos de espaço adicional . . . . . . 4223. Saída máxima de calor de cada nó do SAN

Volume Controller 2145-CG8 . . . . . . . 4224. Saída máxima de calor de cada 2145 UPS-1U 4225. Requisitos da Voltagem de Entrada . . . . 4326. Requisitos de energia para cada nó. . . . . 4327. Requisitos do ambiente sem energia AC

redundante . . . . . . . . . . . . 4428. Requisitos do ambiente com energia AC

redundante . . . . . . . . . . . . 4429. Dimensões e peso . . . . . . . . . . 4530. Requisitos de espaço adicional . . . . . . 4531. Saída de calor de cada nó do SAN Volume

Controller 2145-CF8 . . . . . . . . . . 4532. Espaço de rack necessário para o comutador

de energia de corrente alternada redundante . 4733. Espaço de rack necessário para as placas de

montagem do lado do comutador de energiade corrente alternada redundante . . . . . 47

34. Espaço de rack necessário para o 2145 UPS-1U 5635. Saída de calor do 2145 UPS-1U . . . . . . 5636. Comutador de energia de corrente alternada

redundante . . . . . . . . . . . . 5737. Campos para a placa-mãe . . . . . . . . 8638. Campos para as baterias . . . . . . . . 8739. Campos para os processadores . . . . . . 87

40. Campos para os ventiladores. . . . . . . 8741. Campos repetidos para cada módulo de

memória instalado . . . . . . . . . . 8842. Campos repetidos para cada adaptador

instalado . . . . . . . . . . . . . 8843. Campos repetidos para cada dispositivo SCSI,

IDE, SATA e SAS instalado . . . . . . . 8844. Campos específicos para o software do nó 8945. Campos fornecidos para o conjunto do painel

frontal . . . . . . . . . . . . . . 8946. Campos fornecidos para a porta Ethernet 8947. Campos fornecidos para as fontes de

alimentação no nó . . . . . . . . . . 8948. Campos fornecidos para o conjunto de fonte

de alimentação ininterrupta que estejaativando o nó . . . . . . . . . . . . 90

49. Campos fornecidos para o adaptador debarramento do host (HBA) SAS . . . . . . 90

50. Campos fornecidos para o unidade flash doSAS . . . . . . . . . . . . . . . 91

51. Campos fornecidos para o transceptor dosmall form factor pluggable (SFP) . . . . . 91

52. Campos fornecidos para as propriedades dosistema . . . . . . . . . . . . . . 92

53. Quando as opções estão disponíveis . . . . 10654. Estatísticas a coleta para nós individuais 12655. coleta de estatísticas para os volumes para

nós individuais . . . . . . . . . . . 12756. coleta de estatísticas para volumes que são

usados nos relacionamentos do Metro Mirrore do Global Mirror para nós individuais . . 127

57. coleta de estatísticas para portas do nó 12858. Coleção de estatísticas para nós . . . . . 12959. Coleta de estatísticas de cache para volumes e

cópias de volumes . . . . . . . . . . 13060. Coleta de estatísticas para cache de volume

por nós individuais . . . . . . . . . 13261. Estatísticas XML para uma porta de parceria

IP . . . . . . . . . . . . . . . 13462. Descrição de Campos de Dados para o Log

de Eventos . . . . . . . . . . . . 13763. Níveis de Notificação . . . . . . . . . 13964. Tipos de notificação do SAN Volume

Controller e códigos de nível do syslogcorrespondentes. . . . . . . . . . . 140

65. Valores do SAN Volume Controller deidentificadores de origem por mensagemdefinida pelo usuário e códigos de recurso dosyslog . . . . . . . . . . . . . . 141

66. Eventos informativos . . . . . . . . . 14467. status SCSI . . . . . . . . . . . . 14968. Qualificadores, códigos e chaves do SCSI

Sense . . . . . . . . . . . . . . 15069. Códigos de razão . . . . . . . . . . 15170. Tipos de objeto . . . . . . . . . . . 15271. IDs de Eventos de Erro e Códigos de Erro 153

© Copyright IBM Corp. 2003, 2016 ix

Page 10: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

72. Faixa de Números da Classificação deMensagens . . . . . . . . . . . . 171

73. Arquivos criados pelo processo de backup 28774. Erros de Bloco Inválido . . . . . . . . 29875. Indicadores de erro do 2145 UPS-1U . . . . 31976. Conjuntos de Fibre Channel. . . . . . . 34677. SAN Volume ControllerHardware de conexão

do adaptador Fibre Channel . . . . . . 348

78. LED do painel de diagnósticos. . . . . . 35479. Ações prescritas do LED do painel de

diagnósticos . . . . . . . . . . . . 36380. Ações prescritas do LED do painel de

diagnósticos . . . . . . . . . . . . 369

x SAN Volume Controller: Guia de Resolução de Problemas

Page 11: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Sobre este guia

Este guia descreve como solucionar problemas do IBM® SAN Volume Controller.

Os capítulos a seguir apresentam o SAN Volume Controller, o gabinete deexpansão, o comutador de energia de corrente alternada redundante e o fonte dealimentação ininterrupta. Eles descrevem como é possível configurar e verificar ostatus de um nó SAN Volume Controller em um sistema em cluster de nós atravésdo painel frontal, com a GUI do assistente de serviço ou com o GUI degerenciamento.

Os capítulo de dados vitais do produto (VPD) fornece informações sobre o VPDque define exclusivamente cada elemento de hardware e microcódigo que está noSAN Volume Controller. Também é possível aprender como diagnosticar problemasusando oSAN Volume Controller.

Os procedimentos de análise de manutenção (MAPs) podem ajudá-lo a analisarfalhas que ocorrem em um SAN Volume Controller. Com os MAPs, é possívelisolar os field-replaceable units (FRUs) do SAN Volume Controller que falham.Inicie todos os procedimentos de determinação de problemas e reparo a partir do“MAP 5000: Iniciar” na página 299.

Quem deve ler este guiaEste guia é destinado a administradores de sistema ou representante de serviçosdos sistemass que usam e diagnosticam problemas com o SAN Volume Controller,o comutador de energia de corrente alternada redundante e o fonte de alimentaçãoininterrupta.

ÊnfaseSão usados diferentes fontes neste guia para mostrar ênfase.

Os seguintes fontes são usados para mostrar ênfase:

Negrito O texto em negrito representa itens demenu.

Negrito com monoespaçamento O texto em negrito com monoespaçamentorepresenta nomes de comandos.

Itálico O texto em itálico é utilizado para enfatizaruma palavra. Na sintaxe de comando, ele éutilizado para variáveis para as quais vocêfornece valores reais, como um diretóriopadrão ou o nome de um sistema.

Monoespaçamento O texto em monoespaçamento identifica osdados ou comandos digitados, amostras desaída de comando, exemplos de código doprograma ou mensagens do sistema, ounomes de sinalizadores de comando,parâmetros, argumentos e pares nome-valor.

© Copyright IBM Corp. 2003, 2016 xi

Page 12: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Biblioteca do SAN Volume Controller e Publicações RelacionadasManuais de produto, outras publicações e Web sites contêm informações que serelacionam a SAN Volume Controller.

IBM Knowledge Center para SAN Volume Controller

A coleção de informações no IBM Knowledge Center contém todas as informaçõesnecessárias para instalar, configurar e gerenciar o sistema. A coleta de informaçõesno IBM Knowledge Center é atualizada entre liberações do produto para fornecer adocumentação mais recente. A coleta de informações está disponível no seguintewebsite:

http://www.ibm.com/support/knowledgecenter/STPVGU

Biblioteca do SAN Volume Controller

A não ser que indicado de outra forma, as publicações na biblioteca estãodisponíveis no Adobe portable document format (PDF) em um website.

www.ibm.com/e-business/linkweb/publications/servlet/pbi.wss

Clique em Procurar publicações para localizar as publicações on-line nas quais estáinteressado e, então, visualize ou faça download da publicação clicando no itemapropriado.

Tabela 1 lista websites nos quais é possível encontrar ajuda, serviços e maisinformações.

Tabela 1. Websites IBM para Ajuda, Serviços e Informações

Web site Endereço

Diretório de contatos em todo o mundo http://www.ibm.com/planetwide

Suporte para SAN Volume Controller (2145) www.ibm.com/storage/support/2145

Suporte para produtos IBM System Storage e IBM TotalStorage www.ibm.com/storage/support/

Cada uma das publicações em PDF na biblioteca do Tabela 2 também estádisponível no IBM Knowledge Center ao clicar no número na coluna “Número daordem”:

Tabela 2. Biblioteca do SAN Volume Controller

Título Descrição Número de pedido

IBM SAN Volume ControllerModel 2145-SV1 HardwareInstallation Guide

O guia fornece as instruçõesque o Representante deserviços IBM usa parainstalar o hardware do SANVolume Controller modelo2145-SV1.

GI13-4547

IBM SAN Volume ControllerModel 2145-DH8 HardwareInstallation Guide

O guia fornece as instruçõesque o Representante deserviços IBM usa parainstalar o hardware do SANVolume Controller modelo2145-DH8.

GC27-6490

xii SAN Volume Controller: Guia de Resolução de Problemas

Page 13: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 2. Biblioteca do SAN Volume Controller (continuação)

Título Descrição Número de pedido

IBM System Storage SANVolume Controller HardwareMaintenance Guide

O guia fornece as instruçõesque o Representante deserviços IBM usa parareparar o hardware do SANVolume Controller, incluindoa remoção e a substituição depeças.

GC27-2283

Guia de resolução de problemasdo IBM SAN VolumeController

O guia descreve os recursosde cada modelo do SANVolume Controller, explicacomo usar o painel frontalou a GUI de assistente deserviço e forneceprocedimentos de análise demanutenção para ajudá-lo adiagnosticar e solucionarproblemas com o SANVolume Controller.

GC27-2284

IBM Avisos de Segurança doSAN Volume Controller

O guia contém instruções decuidado e perigo traduzidas.Cada instrução de cuidado eperigo na documentação doSAN Volume Controller temum número. Use o númeropara localizar a instruçãocorrespondente em seuidioma no IBM SAN VolumeController Safety Notices.

Flyer Leia Primeiro do IBMSystem Storage SAN VolumeController

O documento apresenta osprincipais componentes dosistema SAN VolumeController e descreve comoinstalar o hardware e osoftware.

GA32-0843

IBM System Storage SANVolume Controller and IBMStorwize V7000 Command-LineInterface User's Guide

O guia descreve oscomandos que podem serusados a partir da interfaceda linha de comandos (CLI)do SAN Volume Controller.

GC27-2287

IBM Statement of LimitedWarranty (2145 e 2076)

Este documento multilínguefornece informações sobre agarantia IBM para os tiposde máquina 2145 e 2076.

Número de peça: 4377322

Contrato de Licença IBM para oCódigo de Máquina

Este guia multilíngue contémo Contrato De Licença paraCódigo de Máquina doproduto SAN VolumeController.

SC28-6872 (contémZ125-5468)

Outras publicações IBM

O Tabela 3 na página xiv lista uma publicação do IBM que contém informaçõesrelacionadas ao SAN Volume Controller.

Sobre este guia xiii

Page 14: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 3. Outras publicações IBM

Título Descrição Número de pedido

Guia do Usuário do IBM SystemStorage Driver de DispositivoSubsistema de Caminhos Múltiplos

O guia descreve o IBM System StorageDriver de Dispositivo Subsistema deCaminhos Múltiplos para os produtos doIBM System Storage e como usá-lo com oSAN Volume Controller.

GC52-1309

Documentação do IBM e Web Sites Relacionados

Tabela 4 lista websites que fornecem publicações e outras informações sobre o SANVolume Controller ou produtos ou tecnologias relacionados. As publicações doIBM Redbooks fornecem posicionamento e orientação de valor, experiências deinstalação e implementação, cenários de solução e procedimentos passo a passopara diversos produtos.

Tabela 4. Documentação do IBM e Web Sites Relacionados

Web site Endereço

Centro de Publicações IBM www.ibm.com/e-business/linkweb/publications/servlet/pbi.wss

Publicações IBM Redbooks www.redbooks.ibm.com/

Informações de Acessibilidade Relacionadas

Para visualizar um arquivo PDF, é necessário ter o Adobe Reader, que pode sertransferido por download a partir do site da Adobe:

www.adobe.com/support/downloads/main.html

Como Solicitar Publicações IBMO Centro de Publicações IBM é um repositório central global para publicações emateriais de marketing do produto IBM.

O Centro de Publicações IBM oferece funções de procura customizadas paraajudá-lo a encontrar as publicações que precisar. Algumas publicações estãodisponíveis para visualização ou download sem encargos. Também é possívelsolicitar publicações. O centro de publicações exibe preços em sua moeda local. Épossível acessar o Centro de Publicações IBM através do seguinte Web site:

www.ibm.com/e-business/linkweb/publications/servlet/pbi.wss

Websites relacionadosOs websites a seguir fornecem informações sobre SAN Volume Controller ouprodutos relacionados ou tecnologias:

Tipo de Informação Website

Suporte ao SAN Volume Controller www.ibm.com/storage/support/2145

Suporte técnico para produtos dearmazenamento IBM

www.ibm.com/storage/support/

Registro no Suporte Eletrônico da IBM www-01.ibm.com/support/electronicsupport/

xiv SAN Volume Controller: Guia de Resolução de Problemas

Page 15: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Enviando Seus ComentáriosSeu feedback é importante para ajudar a fornecer informações mais precisas e demais alta qualidade.

Para enviar quaisquer comentários sobre este manual ou qualquer outradocumentação do SAN Volume Controller:v Envie seus comentários por e-mail para [email protected]. Inclua as

informações a seguir para essa publicação ou use substituições adequadas para otítulo da publicação e o número do formulário para a publicação na qual vocêestá colocando comentário:– Título da publicação: Guia de resolução de problemas do IBM SAN Volume

Controller

– Form number da publicação: GC27-2284-07– Página, tabela ou números de ilustração sobre os quais você está comentando– Uma descrição detalhada de qualquer informação que deve ser alterada

Como Obter Informações, Ajuda e Assistência TécnicaSe precisar de ajuda, serviço, assistência técnica ou apenas quiser mais informaçõessobre produtos IBM, você localizará uma ampla variedade de fontes disponíveis naIBM para auxiliá-lo.

Informações

A IBM mantém páginas na web em que é possível obter informações sobreprodutos IBM e serviços de taxas, implementação de produto e assistência de uso,suporte de serviço de quebra e conserto e as informações técnicas mais recentes.Para obter informações adicionais, consulte Tabela 5.

Tabela 5. Websites do IBM para Ajuda, Serviços e Informações

Website Endereço

Diretório de contatos em todo omundo

http://www.ibm.com/planetwide

Suporte para SAN VolumeController (2145)

www.ibm.com/storage/support/2145

Suporte para produtos IBM SystemStorage e IBM TotalStorage

www.ibm.com/storage/support/

Nota: Os serviços, números de telefone e links da web disponíveis estão sujeitos amudança sem aviso prévio.

Ajuda e Serviço

Antes de ligar para o suporte, assegure-se de ter seu IBM Customer Numberdisponível. Se estiver nos EUA ou Canadá, é possível ligar 1 (800) IBM SERV paraobter ajuda e serviço. De outras partes do mundo, consulte http://www.ibm.com/planetwide para obter o número que você pode ligar.

Ao ligar dos Estados Unidos ou Canadá, escolha a opção armazenamento. Oagente decide para onde rotear sua chamada, para o software de armazenamentoou o hardware de armazenamento, dependendo da natureza de seu problema.

Sobre este guia xv

Page 16: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se você ligar de um local fora dos EUA ou Canadá, deverá escolher a opçãosoftware ouhardwarequando ligar para obter assistência. Escolha a opção softwarese não tiver certeza se o problema envolve o SAN Volume Controller software ou ohardware. Escolha a opção de hardware somente se tiver certeza do problema queenvolve somente o hardware do SAN Volume Controller.Ao ligar para a IBM paraobter o serviço relativo ao produto, siga estas diretrizes para as opções de softwaree hardware:

Opção de SoftwareIdentifique o produto SAN Volume Controller como seu produto e forneceseu número de cliente como prova de compra. O número do cliente é umnúmero de 7 dígitos (0000000 - 9999999) designado pela IBM quando oproduto é comprado. Seu número de cliente deve estar na planilha deinformações do cliente ou na fatura de sua compra do armazenamento. Sefor solicitado a você um sistema operacional, use Armazenamento.

Opção de HardwareForneça o número de série e o tipo de máquina de quatro dígitosapropriado. Para SAN Volume Controller, o tipo de máquina é 2145.

Nos Estados Unidos e Canadá, serviço de hardware e suporte podem serestendidos para 24x7 no mesmo dia. A garantia base é de 9x5 no próximo dia útil.

Obtendo Ajuda Online

É possível localizar informações sobre produtos, soluções, parceiros e suporte nowebsite IBM.

Para localizar informações atualizadas sobre produtos, serviços e parceiros, visite owebsite IBM em www.ibm.com/storage/support/2145.

Antes de Ligar

Certifique-se de ter executado as etapas para tentar resolver o problema sozinhoantes de ligar.

Algumas sugestões para resolver o problema antes de chamar o IBM Supportincluem:v Verifique se todos os cabos estão conectados.v Verifique todos os interruptores para ter certeza de que o sistema e os

dispositivos opcionais estejam ligados.v Use as informações de resolução de problemas na documentação do sistema. A

seção de resolução de problemas do Knowledge Center contém procedimentospara ajudá-lo a diagnosticar problemas.

v Acesse o website de Suporte IBM em www.ibm.com/storage/support/2145 paraverificar informações técnicas, dicas, sugestões e novos drivers de dispositivo oupara enviar uma solicitação de informação.

Usando a Documentação

Informações sobre seu sistema de armazenamento IBM estão disponíveis nadocumentação que acompanha o produto.

Essa documentação inclui documentos impressos, documentos on-line, arquivosleia-me e arquivos de ajuda além do Knowledge Center. Consulte as informaçõesde resolução de problemas para obter instruções de diagnóstico. O procedimento

xvi SAN Volume Controller: Guia de Resolução de Problemas

Page 17: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

de resolução de problemas pode requerer que você faça download de drivers dedispositivos atualizados ou do software. A IBM mantém páginas na web em que épossível obter as informações técnicas mais recentes e fazer download dos driversde dispositivos e atualizações. Para acessar essas páginas, acessewww.ibm.com/storage/support/2145 e siga as instruções. Além disso, algunsdocumentos estão disponíveis por meio do Centro de Publicações IBM.

Inscrição para a Oferta da Linha de Suporte

Se tiver questões sobre como usar e configurar a máquina, assine a oferta de IBMSupport Line para obter uma resposta profissional.

A manutenção fornecida com o sistema fornece suporte quando há um problemacom um componente de hardware ou uma falha no código da máquina do sistema.Às vezes, você pode precisar de conselho de especialista sobre o uso de umafunção que é fornecida pelo sistema ou sobre como configurar o sistema. Comprara oferta de IBM Support Line lhe dá acesso a esse aconselhamento profissional aoimplementar seu sistema e no futuro.

Entre em contato com o Representante de vendas IBM local ou com seu grupo desuporte para obter informações de disponibilidade e de compra.

Sumarização de mudanças para o Guia de resolução de problemas doSAN Volume Controller GC27-2284-07

O resumo de mudanças fornece uma lista das informações novas e atualizadasdesde a última versão do guia.

Novas informações

As informações a seguir foram incluídas neste guia desde a edição anterior,GC27-2284-06.v “unidade flash USB” na página 69v “Resolvendo um problema com clientes SSL/TLS” na página 265v “Procedimento: fazendo com que unidades suportem informações de proteção”

na página 265

Informações atualizadas

Esta versão inclui atualizações para:v “Porta técnica para acesso do nó” na página 75v “IDs de Eventos de Erro e Códigos de Erro” na página 153

Resumo de mudanças para a publicação Guia de Resolução deProblemas do SAN Volume Controller, G517-9943-06

O resumo de mudanças fornece uma lista das informações novas e atualizadasdesde a última versão do guia.

Novas informações

As informações a seguir foram incluídas neste guia desde a edição anterior,GC27-2284-05.

Sobre este guia xvii

Page 18: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v “Controles e indicadores do painel fronta do SAN Volume Controller 2145-DH8”na página 17

v “Painel de informações do operador SAN Volume Controller 2145-DH8” napágina 23

v “Requisitos do Ambiente do SAN Volume Controller 2145-DH8” na página 38v “MAP 5040: energia SAN Volume Controller 2145-DH8” na página 308

xviii SAN Volume Controller: Guia de Resolução de Problemas

Page 19: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 1. Visão geral do SAN Volume Controller

O software O SAN Volume Controller combina software e hardware em umdispositivo modular e abrangente, que usa virtualização simétrica.

A virtualização simétrica é conseguida através da criação de um conjunto de discosgerenciados (MDisks) a partir dos sistemas de armazenamentos conectados. Então,esses sistemas de armazenamentos são mapeados para um conjunto de volumespara uso pelos sistemas host conectados. Os administradores do sistema podemvisualizar e acessar um conjunto comum de armazenamentos na rede de área dearmazenamento (SAN). Esta funcionalidade ajuda os administradores a usar osrecursos de armazenamento mais eficientemente e fornece uma base comum paraas funções avançadas.

Uma SAN é uma rede de alta velocidade do Fibre Channel que conecta sistemashost e dispositivos de armazenamento. Em uma SAN, um sistema host pode serconectado a um dispositivo de armazenamento através da rede. As conexões sãofeitas através de unidades, como roteadores e comutadores. A área da rede quecontém essas unidades é conhecida como a malha da rede.

IBM Spectrum Virtualize software

O IBM SAN Volume Controller é construído com o IBM Spectrum Virtualizesoftware, que faz parte da família IBM Spectrum Storage.

O IBM Spectrum Virtualize é um membro chave do portfólio do IBM SpectrumStorage. Ele é uma solução de armazenamento altamente flexível que permite arápida implementação de serviços de armazenamento de bloco para cargas detrabalho novas e tradicionais, no local, fora do local e em uma combinação deambos. Projetado para ajudar ativar ambientes de nuvem, é baseado na tecnologiacomprovada. Para obter mais informações sobre o portfólio do IBM SpectrumStorage, consulte o website a seguir.http://www.ibm.com/systems/storage/spectrum

O software fornece essas funções para os sistemas host que se conectam ao SANVolume Controller.v Cria um único conjunto de armazenamentosv Fornece virtualização da unidade lógicav Gerencia volumes lógicosv Espelha volumes lógicos

O sistema também fornece essas funções.v Cache grande e escalávelv Copy Services

– Função do IBM FlashCopy (cópia point-in-time), incluindo FlashCopythin-provisioned para tornar diversos destinos financeiramente suportáveis

– Função IBM HyperSwap (cópia ativa-ativa)– Metro Mirror (cópia síncrona)– Global Mirror (cópia assíncrona)– Migração de dados

© Copyright IBM Corp. 2003, 2016 1

|||||||

|

|

Page 20: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Gerenciamento de espaço– A função IBM Easy Tier para migrar os dados usados mais frequentemente

para armazenamento de desempenho superior– Medição de qualidade de serviço quando combinada com IBM Spectrum

Control Base Edition. Para obter informações, consulte a documentação doIBM Spectrum Control Base Edition.

– Volumes lógicos thin-provisioned– Volumes compactados para consolidar armazenamento

O Figura 1 mostra os hosts, nós do SAN Volume Controller e RAID sistemas dearmazenamento conectados a uma malha SAN. A malha SAN redundante consisteem um acordo tolerante de falha de duas ou mais SANs de contraparte quefornecem caminhos alternativos para cada dispositivo conectado à SAN.

Volumes

Um sistema de nós do SAN Volume Controller apresenta volumes para os hosts. Amaioria das funções avançadas que o SAN Volume Controller fornece são definidasnos volumes. Esses volumes são criados a partir de discos gerenciados (MDisks)apresentados pelo RAID sistemas de armazenamento. Os volumes também podemser criados pelas matrizes que são fornecidas por unidades flash em um gabinetede expansão. Toda a transferência de dados ocorre por meio do nó do SANVolume Controller, descrito como virtualização simétrica.

Zona do host

Zona do sistema de armazenamento

Sistema de armazena-

mento RAID

Sistema de armazena-

mento RAID

Malha

SAN redundante

HostHostHostHost

svc00600

Figura 1. SistemaSAN Volume Controllerem uma malha

2 SAN Volume Controller: Guia de Resolução de Problemas

Page 21: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A Figura 2 mostra o fluxo de dados pela malha.

Os nós em um sistema estão dispostos em pares conhecidos como grupo de E/S.Um único par é responsável por servir a E/S em um volume. Como um volume éservido por dois nós, nenhuma perda de disponibilidade ocorrerá se um nó falharou ficar offline.

Tipos de volume

É possível criar os seguintes tipos de volumes no sistema.v Volumes básicos, em que uma única cópia do volume é armazenada em cache em

um grupo de E/S. Os volumes básicos podem ser estabelecidos em qualquertopologia do sistema; no entanto, o Figura 3 na página 4 mostra uma topologiado sistema padrão.

Hosts enviamentrada/saídaa volumes.

Sistema de armazena-mento RAID

Sistema de armazena-mento RAID

MalhaSAN redundante

HostHostHostHost

svc00

60

1

Transferênciade dados

Entrada/saída enviada adiscos gerenciados.

Figura 2. Fluxo de dados em um sistema SAN Volume Controller

Capítulo 1. Visão geral do SAN Volume Controller 3

Page 22: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Volumes espelhados, em que as cópias do volume podem estar no mesmo conjuntode armazenamentos ou em conjuntos de armazenamentos diferentes. O volumeé armazenado em cache em um único grupo de E/S. Normalmente, os volumesespelhados são estabelecidos em uma topologia do sistema padrão.

v Volumes estendidos, em que as cópias de um volume único estão em diferentesconjuntos de armazenamentos em locais diferentes. O volume é armazenado emcache em um grupo de E/S. Os volumes estendidos estão disponíveis somenteem sistemas de topologia estendida.

Sistema padrão

Grupo de E/S 1

Cópia devolume

Volume básico

svc00909

Figura 3. Exemplo de um volume básico

Grupo de E/S 1

Volume espelhado

Cópia devolume

Cópia devolume

Sistema padrão

svc00908

Figura 4. Exemplo de volumes espelhados

4 SAN Volume Controller: Guia de Resolução de Problemas

Page 23: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Volumes HyperSwap, em que as cópias de um único volume estão em conjuntosde armazenamentos diferentes, os quais estão em locais diferentes. O volume éarmazenado em cache em dois grupos de E/S que estão em locais diferentes.Esses volumes podem ser criados somente quando a topologia do sistema éHyperSwap.

Sistema

EstendidoGrupo de E/S 1

Cópia devolume

Cópia devolume

Site 1 Site 2

Volume esticado

svc00907

Figura 5. Exemplo de volumes estendidos

Capítulo 1. Visão geral do SAN Volume Controller 5

Page 24: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Topologia do sistema

A propriedade da topologia de um sistema SAN Volume Controller pode serconfigurada para um dos estados a seguir.

Nota: Não é possível combinar grupos de E/S de topologias diferentes no mesmosistema.v Topologia padrão em que todos os nós no sistema estão no mesmo local.A

topologia

Grupo de E/S 2Grupo de E/S 1

Sistema HyperSwap

Site 1 Site 2

Cópia devolume

Cópia devolume

Volume de mudança Volume de mudança

Cópia devolume

Cópia devolume

Volume HyperSwap

svc00906

relacionamentoativo/ativo

Figura 6. Exemplo de volumes HyperSwap

6 SAN Volume Controller: Guia de Resolução de Problemas

Page 25: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Topologia Estendida, em que cada nó de um grupo de E/S está em um sitediferente. Quando um site não está disponível, o acesso a um volume podecontinuar mas com desempenho reduzido.

v Topologia do HyperSwap, em que o sistema consiste em pelo menos dois gruposde E/S. Cada grupo de E/S está em um local diferente. Os dois nós de umgrupo de E/S estão no mesmo site. Um volume pode ficar ativo em dois gruposde E/S para que possa ser acessado imediatamente através do outro site quandoum site não estiver disponível.

Site 1

Grupo de E/S 1

svs00919

Nó 1 Nó 2

Figura 7. Exemplo de uma topologia do sistema padrão

Grupo de E/S 1

svs00920

Nó 2

Site 2

Nó 1

Site 1

Figura 8. Exemplo de uma topologia do sistema estendido

Capítulo 1. Visão geral do SAN Volume Controller 7

Page 26: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resumo da topologia do sistema e dos volumes

O Tabela 6 resume os tipos de volumes que podem ser associados a cada topologiado sistema.

Tabela 6. Resumo da topologia do sistema e do volume

TopologiaTipo de Volume

Básico Espelhado Alongado HyperSwap customizado

Padrão X X X

Alongado X X X

HyperSwap X X X

Gerenciamento de sistema

Os nós do SAN Volume Controller em um sistema operam como um único sistemae apresentam um único ponto de controle para gerenciamento de sistema e deserviços. O gerenciamento de sistemas e o relatório de erros são fornecidos atravésde uma interface Ethernet para um dos nós no sistema, chamado de nó deconfiguração. O nó de configuração executa um servidor da web e fornece umainterface da linha de comandos (CLI). Qualquer nó no sistema pode ser o nó deconfiguração. Se o nó de configuração atual falhar, um novo nó de configuraçãoserá selecionado dos nós restantes. Cada nó também fornece uma interface da linhade comandos e a interface da web para iniciar as ações de serviço de hardware.

Grupo de E/S 1

svs00921

Nó 1

Site 1

Nó 2

Grupo de E/S 2

Nó 3

Site 2

Nó 4

Figura 9. Exemplo de uma topologia do sistema HyperSwap

8 SAN Volume Controller: Guia de Resolução de Problemas

Page 27: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tipos de malha

As operações de E/S entre hosts e nós do SAN Volume Controller e entre nós doSAN Volume Controller e matrizes usam o padrão SCSI. Os nós do SAN VolumeController se comunicam entre si através de comandos SCSI privados.

Todos os nós do SAN Volume Controller que executam a versão 6.4 ou posteriordo software do sistema podem suportar a conectividade Fibre Channel overEthernet (FCoE).

O Tabela 7 mostra o tipo de malha que pode ser usado para a comunicação entrehosts, nós e o sistemas de armazenamentodo RAID. Esses tipos de malha podemser usados ao mesmo tempo.

Tabela 7. Tipos de comunicações do SAN Volume Controller

Tipo decomunicações

Host para nós doSAN Volume

Controller

SAN VolumeController para

sistema dearmazenamento

Nós do SAN VolumeController para nós

do SAN VolumeController

Fibre Channel SAN Sim Sim Sim

iSCSI (Ethernet de 1Gbps ou Ethernet de10 Gbps, dependendodo nó)

Sim Sim Não

Fibre Channel OverEthernet SAN(Ethernet de 10Gbps)

Sim Sim Sim

unidades flash

Alguns nós do SAN Volume Controller contêm unidades flash ou estão conectadosa gabinetes de expansão que contêm unidades flash. Essas unidades flash podemser usadas para criar discos gerenciados (MDisks) pelo RAID que, por sua vez,podem ser usados para criar volumes. No SAN Volume Controller 2145-DH8 e nosnós do SAN Volume Controller 2145-SV1, os unidades flash estão em um gabinetede expansão que é conectado a ambos os lados de um grupo de E/S.

unidades flash fornece servidores host com um conjunto de armazenamento dealto desempenho para aplicativos críticos. O Figura 10 na página 10 mostra estaconfiguração. Os MDisks no unidades flash também podem ser colocados em umconjunto de armazenamentos com MDisks a partir do RAID regular sistemas dearmazenamento. O IBM Easy Tier executa o posicionamento automático de dadosno conjunto de armazenamentos movendo os dados de alta atividade para umarmazenamento de melhor desempenho.

Capítulo 1. Visão geral do SAN Volume Controller 9

|||

||||

1

||

Page 28: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Hardware do SAN Volume Controller

Cada nó do SAN Volume Controller é um servidor individual em um SAN VolumeController sistema em cluster no qual o software SAN Volume Controller éexecutado.

Os nós são sempre instalados em pares; um mínimo de um par e um máximo dequatro pares de nós constituem um sistema. Cada par de nós é conhecido como umgrupo de E/S.

Os grupos de E/S obtêm o armazenamento apresentado à SAN pelo sistemas dearmazenamento como MDisks e converte o armazenamento em discos lógicos(volumes) usados pelos aplicativos nos hosts. Um nó está em apenas um grupo deE/S e fornece acesso aos volumes nesse grupo de E/S.

nós do SAN Volume Controller

Em um sistema em cluster, um nó é um servidor individual no qual o softwareSAN Volume Controller é executado.

Os nós são sempre instalados em pares; um mínimo de um par e um máximo dequatro pares de nós constituem um sistema. Cada par de nós é conhecido como umgrupo de E/S.

Grupos de E/S tomam o armazenamento apresentado à SAN (rede de área dearmazenamento) pelo sistemas de armazenamento como MDisks. Oarmazenamento é então convertido em discos lógicos (volumes) que são usadospelos aplicativos nos hosts. Um nó está em apenas um grupo de E/S e forneceacesso aos volumes nesse grupo de E/S.

Recursos do SAN Volume Controller 2145-SV1 nó

O sistema SAN Volume Controller 2145-SV1 possui os recursos a seguir.v Um gabinete montado no rack de 19 polegadasv Dois processadores de oito núcleosv Memória base de 64 GB por processador. Opcionalmente, incluindo 64 GB de

memória, o processador pode suportar 128 GB, 192 GB ou 256 GB de memória.

Hosts enviamentrada/saída avolumes mapeados emunidades de estadosólido internas.

MalhaSAN redundante

HostHostHostHost

svc00602

Nócom SSDs

Figura 10. Nós do SAN Volume Controller com unidades flashinterno

10 SAN Volume Controller: Guia de Resolução de Problemas

1

11

111

11111

|

|

|

|

||

Page 29: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Oito compartimentos de unidade Small Form Factor (SFF) na parte frontal dogabinete de controle

v Suporte para uma variedade de placas adaptadoras de host opcionais, incluindo:– Placas adaptadoras Fibre Channel 4 portas e 16 Gbps– Placas adaptadoras Fibre Channel over Ethernet(FCoE) 4 portas e 10 Gbps

para conexão de host– Placas SAS de 4 portas e 12 Gbps para anexar os gabinetes de expansão

v Suporte para conexão de host iSCSI (Ethernet de 10 Gbps)v Suporte para gabinetes de expansão para suportar unidades adicionais

– SAN Volume Controller 2145-24F para hospedar até 24 unidades flash SFF– SAN Volume Controller 2145-12F para hospedar até 12 unidades flash ou

HDD compactas (LFF)v Suporte para placas do Acelerador de Compactação opcional para o IBM

Real-time Compressionv Fontes de alimentação duplas redundantesv Baterias duplas redundantesv Uma porta técnica dedicada para inicializar ou reparar o sistema

Recursos do SAN Volume Controller 2145-DH8 nó

O nó do SAN Volume Controller 2145-DH8 possui os seguintes recursos:v Um gabinete montado no rack de 19 polegadasv Pelo menos um adaptador Fibre Channel ou um adaptador Ethernet de 10 Gbpsv Segundo, terceiro e quarto adaptadores Fibre Channel opcionaisv Memória de 32 GB por processadorv Um ou dois processadores de oito núcleosv Fontes de alimentação duplas redundantesv Baterias redundantes duais para maior confiabilidade, disponibilidade e

capacidade de manutenção do que para um SAN Volume Controller 2145-CG8com um fonte de alimentação ininterrupta

v Até dois gabinetes de expansão SAN Volume Controller 2145-24F para hospedaraté 24 unidades flash cada

v Gabinetes de expansão do SAN Volume Controller 2145-12F para hospedar até12 unidades de disco rígido LFF ou unidades flash

v Conexão de host iSCSI (Ethernet de 1 Gbps e Ethernet de 10 Gbps opcional)v Suporta o IBM Real-time Compression opcionalv Um porta técnica dedicada para acesso local à ferramenta de inicialização ou à

interface do assistente de serviço.

Recursos do Nó do SAN Volume Controller 2145-CG8

O nó do SAN Volume Controller 2145-CG8 possui os seguintes recursos:v Um gabinete montado no rack de 19 polegadasv Um adaptador Fibre Channel de 8 Gbps com 4 portasv Um adaptador de rede convergido opcional Fibre Channel over Ethernet de 10

Gbps com 2 portasv Segundo adaptador Fibre Channel de 8 Gbps com 4 portas opcionalv 24 GB de memória

Capítulo 1. Visão geral do SAN Volume Controller 11

||

|

|

||

|

|

|

|

||

||

|

|

|

||

Page 30: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Conexão de host Fibre Channel over Ethernet (é necessário incluir apenas uma)v Um processador quad-corev Fontes de alimentação duplas redundantesv Suporta até quatro unidades flash opcionaisv Conexão de host iSCSI (Ethernet de 1 Gbps e Ethernet de 10 Gbps opcional)v Suporta IBM Real-time Compression opcional

Nota: O unidades flash opcional e o Ethernet opcional de 10 Gbps não pode estarno mesmo nó 2145-CG8.

SystemsUm sistema é uma coleção de SAN Volume Controller nós.

Um sistema pode consistir entre dois a oito nós do SAN Volume Controller.

Todas as definições de configuração são replicadas em todos os nós no sistema. Osendereços IP de gerenciamento são designados para o sistema. Cada interfaceacessa o sistema remotamente através de endereços de gerenciamento de sistemasEthernet, também conhecido como endereços IP dos sistemas primário esecundário.

Nó de ConfiguraçãoUm nó de configuração é um nó único que gerencia a atividade de configuração dosistema.

Se o nó de configuração falhar, o sistema escolherá um novo nó de configuração.Essa ação é chamada de failover do nó de configuração. O novo nó deconfiguração assume os endereços IP de gerenciamento. Portanto, é possívelacessar o sistema por meio dos mesmos endereços IP, embora o nó de configuraçãooriginal tenha falhado. Durante o failover, há um período curto em que não épossível usar as ferramentas de linha de comandos ou o GUI de gerenciamento.

O Figura 11 mostra um exemplo de um sistema em cluster que contém quatro nós.O nó 1 é o nó de configuração. Os pedidos do usuário (▌1▐) são manipulados pelonó 1.

Endereçamento do nó de configuraçãoA qualquer momento, apenas um nó em um sistema em cluster do SAN VolumeController é designado a endereços IP.

Nó 1 Nó 2 Nó 3 Nó 4

2

Interface IPdo nó de

configuração

1

Figura 11. Nó de configuração do SAN Volume Controller

12 SAN Volume Controller: Guia de Resolução de Problemas

|

|

Page 31: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Um endereço IP para o sistema em cluster deve ser designado à porta Ethernet 1.Um endereço IP também pode ser designado à porta Ethernet 2. Estas são asúnicas portas que podem ser endereços IP de gerenciamento designadas.

Este nó então age como o ponto focal para todas as configurações e outrassolicitações que são feitas a partir do aplicativo GUI de gerenciamento ou a daCLI. Este nó é mostrado como o nó de configuração.

Se o nó de configuração for parado ou falhar, os nós restantes no sistemadeterminam qual nó assumirá a função do nó de configuração. O novo nó deconfiguração vincula os endereços IP de gerenciamento às suas portas Ethernet. Eletransmite este novo mapeamento de forma que as conexões com a interface deconfiguração do sistema possam ser retomadas.

O novo nó de configuração transmite o novo mapeamento de endereço IP usandoo Protocolo de Resolução de Endereço (ARP). É necessário configurar algunscomutadores para encaminhar o pacote ARP para outros dispositivos na sub-rede.Assegure-se de que todos os dispositivos Ethernet estejam configurados paratransmitir pacotes ARP não solicitados. Caso contrário, se o pacote ARP não forencaminhado, um dispositivo perde sua conexão com o sistema do SAN VolumeController.

Se um dispositivo perde sua conexão com o sistema do SAN Volume Controller,ele pode gerar novamente o endereço rapidamente se o dispositivo estiver namesma sub-rede que o sistema. No entanto, se o dispositivo não estiver na mesmasub-rede, pode demorar horas para que o cache de resolução de endereço dogateway seja atualizado. Nesse caso, é possível restaurar a conexão ao estabeleceruma conexão de linha de comandos para o sistema a partir de um terminal queesteja na mesma sub-rede e, em seguida, ao iniciar uma cópia segura para odispositivo que perdeu sua conexão.

Failover de IP do ManagementSe o nó de configuração falhar, os endereços IP para o sistema em cluster serãotransferidos para um novo nó. Os serviços do sistema são usados para gerenciar atransferência dos endereços IP do gerenciamento do nó de configuração com falhapara o nó da nova configuração.

As alterações a seguir são desempenhadas pelo serviço do sistema:v Se o software no nó de configuração com falha ainda estiver operacional, o

software encerrará as interfaces IP de gerenciamento . Se o software não puderencerrar as interfaces IP de gerenciamento, o serviço de hardware forçará oencerramento do nó.

v Quando as interfaces IP do de gerenciamento encerrarem, todos os nós restantesescolherão um novo nó para hospedar as interfaces de configuração.

v A nova configuração inicializa os daemons de configuração, incluindo SSHD eHTTPD e, em seguida, liga as interfaces IP de gerenciamento a suas portasEthernet.

v O roteador é configurado como o gateway padrão para a nova configuração.v As tabelas de roteamento são estabelecidas na nova configuração para os

endereços IP de de gerenciamento. A nova configuração envia cinco pacotes deprotocolos de resolução de endereço (ARP) não solicitados para cada endereço IPpara o endereço de transmissão de sub-rede local. Os pacotes ARP contêm oendereço IP do de gerenciamento e o endereço do Controle de Acesso à Mídia(MAC) do novo nó de configuração. Todos os sistemas que recebem pacotes

Capítulo 1. Visão geral do SAN Volume Controller 13

11

Page 32: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

ARP são forçados a atualizar suas tabelas de ARP. Após as tabelas de ARP serematualizadas, esses sistemas poderão se conectar ao novo nó de configuração.

Nota: Alguns dispositivos Ethernet podem não redirecionar pacotes ARP. Se ospacotes ARP não forem encaminhados, a conectividade com o novo nó deconfiguração não poderá ser estabelecida automaticamente. Para evitar esseproblema, configure todos os dispositivos Ethernet para aprovar os pacotes ARPnão solicitados. É possível restaurar a conectividade perdida efetuando login nosistema e iniciando uma cópia segura para o sistema afetado. Iniciar uma cópiasegura força uma atualização para o cache ARP para todos os sistemasconectados ao mesmo comutador que o sistema afetado.

Falhas de link Ethernet

Se o link de Ethernet para sistema falhar devido a um evento não relacionado aSAN Volume Controller, o sistema não tentará executar failover do nó deconfiguração para restaurar o acesso IP de gerenciamento . Por exemplo, o linkEthernet pode falhar se um cabo estiver desconectado ou um roteador Ethernetfalhar. Para proteger contra este tipo de falha, o sistema fornece a opção para duasportas Ethernet, cada uma contendo um endereço IP de gerenciamento . Se não forpossível se conectar por meio de um endereço IP, tente acessar o sistema por meiodo endereço IP alternativo.

Nota: Os endereços IP usados pelos hosts para acessar o sistema através de umaconexão Ethernet são diferentes dos endereços IP de gerenciamento.

Considerações sobre roteamento para notificação de eventos eNetwork Time Protocol

SAN Volume Controller suporta os seguintes protocolos que fazem as conexões desaída do sistema:v E-mailv Protocolo Simples de Gerenciamento de Rede (SNMP)v Syslogv Network Time Protocol (NTP)

Esses protocolos operam apenas em uma porta configurada com um endereço IPde de gerenciamento. Ao fazer conexões de saída, o sistema usa as decisões deroteamento a seguir:v Se o endereço IP de destino estiver na mesma sub-rede que um dos endereços IP

de gerenciamento, o sistema enviará o pacote imediatamente.v Se o endereço IP de destino não estiver na mesma sub-rede de um dos

endereços IP do de gerenciamento, o sistema enviará o pacote para o gatewaypadrão para a porta Ethernet 1.

v Se o endereço IP de destino não estiver na mesma sub-rede de um dosendereços IP do de gerenciamento e a porta Ethernet 1 não estiver conectada àrede Ethernet, o sistema enviará o pacote para o gateway padrão para a portaEthernet 2.

Ao configurar qualquer um desses protocolos para notificações de evento, useessas decisões de roteamento para assegurar que essa notificação de eventosfuncione corretamente se a rede falhar.

14 SAN Volume Controller: Guia de Resolução de Problemas

11

Page 33: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Visão geral da malha SANA malha SAN é uma área da rede que contém roteadores e comutadores. Uma SANé configurada em um número de zonas. Um dispositivo que usa a SAN pode secomunicar somente com dispositivos que estão incluídos nas mesmas zonas nasquais ela se encontra. Um sistema requer vários tipos distintos de zonas: uma zonade sistema, zonas de host e zonas de disco. A zona intersistema é opcional.

Na zona de host, os sistemas host podem identificar e endereçar os nós. É possívelter mais de uma zona de host e mais de uma zona de disco. A menos que vocêesteja usando um design de malha dual-core, a zona do sistema conterá todas asportas de todos os nós no sistema. Crie uma zona para cada porta do FibreChannel do host. Em uma zona de disco, os nós identificam os sistemas dearmazenamento. Geralmente, cria-se uma zona para cada sistema dearmazenamento externo. Se você estiver usando o recurso do Metro Mirror e doGlobal Mirror, crie uma zona com pelo menos uma porta de cada nó em cadasistema. Até quatro sistemas são suportados.

Nota: Alguns sistemas operacionais não podem tolerar outros sistemasoperacionais na mesma zona de host, embora você possa ter mais de um tipo dehost na malha SAN. Por exemplo, você pode ter uma SAN que contém um hostque é executado em um sistema operacional IBM AIX e outro host que é executadoem um sistema operacional Microsoft Windows.

Toda a comunicação entre os nós do SAN Volume Controller é executada atravésda SAN. Todos os comandos de serviço e configuração doSAN Volume Controllersão enviados para o sistema através de uma rede Ethernet.

Capítulo 1. Visão geral do SAN Volume Controller 15

Page 34: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

16 SAN Volume Controller: Guia de Resolução de Problemas

Page 35: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 2. Apresentando os componentes de hardware doSAN Volume Controller

Um sistema SAN Volume Controller consiste nos nós SAN Volume Controller ecomponentes de hardware relacionados, tais como unidades fonte de alimentaçãoininterrupta e o comutadores de energia de corrente alternada redundanteopcional. Note que os nós e as unidades fonte de alimentação ininterrupta estãoinstalados em pares.

Nós do SAN Volume ControllerSAN Volume Controller suporta vários tipos de nós diferentes.

Os seguintes nós são suportados:v O nó SAN Volume Controller 2145-DH8 está disponível para compra, com os

recursos a seguir:– Pelo menos um adaptador Fibre Channel ou um adaptador Ethernet de 10

Gbps– Adaptadores Fibre Channel segundo e terceiro opcionais– Até dois gabinetes de expansão do SAN Volume Controller 2145-24F para

hospedar as unidades flash opcionais– Conexão de host iSCSI (Ethernet de 1 Gbps e Ethernet de 10 Gbps opcional)

v O nó SAN Volume Controller 2145-CG8 está disponível para compra, com osrecursos a seguir:– Um adaptador SAS de alta velocidade com até quatro unidades flash– Um adaptador Ethernet de 10 Gbps com duas portas– Um segundo adaptador Fibre Channel com quatro portas

v Os seguintes nós não estão mais disponíveis para compra, mas permanecemsuportados:– SAN Volume Controller 2145-CF8

Um rótulo na frente do nó indica o tipo de nó do SAN Volume Controller , arevisão de hardware (se apropriada) e o número de série.

Controles e indicadores do SAN Volume ControllerOs controles e os indicadores são usados para energia e navegação e para indicaras informações, como a atividade do sistema, as opções de serviço e configuração,as falhas do controlador de serviço e a identificação do nó.

Controles e indicadores do painel fronta do SAN VolumeController 2145-DH8Os controles e indicadores no painel frontal são usados para energia e indicarinformações, como atividade do sistema, falhas do nó e identificação do nó.

O Figura 12 na página 18 mostra os controles e indicadores no painel frontal doSAN Volume Controller 2145-DH8.

© Copyright IBM Corp. 2003, 2016 17

Page 36: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ LED de atividade de unidade de disco rígido▌2▐ LED de status de unidade de disco rígido▌3▐ Porta USB▌4▐ Conector de vídeo▌5▐ Painel de informações do operador▌6▐ Trava de liberação do rack▌7▐ LED de status do nó▌8▐ LED de falha do nó▌9▐ LED de status da bateria▌10▐ LED de falha da bateria▌11▐ Baterias▌12▐ Unidades de disco rígido (unidades de inicialização)

LED de status do nó

O LED de status do nó fornece os seguintes indicadores de atividade do sistema:

ApagadoO nó não está operando como um membro de um sistema.

Aceso O nó está operando como um membro de um sistema.

Piscando lentamenteO nó está em um estado de candidato ou de serviço.

Piscando rapidamenteO nó está realizando dump dos dados de cache e estado para o disco localem antecipação a uma reinicialização de sistema a partir de uma ação dedesligamento pendente ou outra sequência de reinicialização controlada.

LED de falha do nó

Uma falha de nó é indicada pelo LED de falha de nó âmbar.

ApagadoO nó não tem nenhum erro que o evitará de fazer a E/7S ou o software dosistema não está em execução no nó.

SAN Volume Controller

1 3 4 5 6 7 8

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

+ -2

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

+ -1

1 2 3 4

2

4 5

1

2

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

10

3

svc00800

6

12

+--

7

8

9

11

6

Figura 12. Painel Frontal do SAN Volume Controller 2145-DH8

18 SAN Volume Controller: Guia de Resolução de Problemas

Page 37: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Aceso O nó tem um erro do nó fatal e não faz parte do sistema.

LED de status da bateria

O LED verde de status da bateria indica uma das condições de bateria a seguir.

ApagadoO software do sistema não está em execução no nó ou o estado do sistemanão pode ser salvo se a energia para o nó for perdida.

Piscando rapidamenteO nível de carga da bateria está muito baixo para que o estado do sistemaseja salvo se a energia para o nó for perdida. As baterias estão carregando.

Piscando lentamenteO nível de carga da bateria é suficiente para que o estado do sistema sejasalvo uma vez se a energia para o nó for perdida.

Aceso O nível de carga da bateria é suficiente para que o estado do sistema sejasalvo duas vezes se a energia para o nó for perdida.

LED de falha da bateria

O LED âmbar de falha da bateria indica uma das condições da bateria a seguir.

ApagadoO software do sistema não está em execução no nó ou essa bateria não temuma falha.

PiscandoEsta bateria está sendo identificada.

Aceso Esta bateria tem uma falha. Ela não pode ser usada para salvar o estado dosistema se a energia do nó for perdida.

LED de atividade da unidade de disco rígido

O LED verde de atividade da unidade indica uma das condições a seguir.

ApagadoA unidade não está pronta para uso.

PiscandoA unidade está em uso.

Aceso A unidade está pronta para uso, mas não está em uso.

LED de status da unidade de disco rígido

O LED âmbar de status da unidade indica uma das condições a seguir.

ApagadoA unidade está em bom estado ou não tem energia.

PiscandoA unidade está sendo identificada.

Aceso A unidade falhou.

Controles e indicadores do SAN Volume Controller 2145-CG8Os controles e os indicadores são usados para energia e navegação e para indicaras informações, como a atividade do sistema, as opções de serviço e configuração,as falhas do controlador de serviço e a identificação do nó.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 19

Page 38: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O Figura 13 mostra os controles e indicadores no painel frontal do SAN VolumeController 2145-CG8.

▌1▐ LED de status do nó▌2▐ Monitor do painel frontal▌3▐ Botões de navegação▌4▐ Painel de informações do operador▌5▐ Botão Selecionar▌6▐ LED de erro

Controles e indicadores do SAN Volume Controller 2145-CF8Os controles e os indicadores são usados para energia e navegação e para indicaras informações, como a atividade do sistema, as opções de serviço e configuração,as falhas do controlador de serviço e a identificação do nó.

O Figura 14 mostra os controles e indicadores no painel frontal do SAN VolumeController 2145-CF8.

▌1▐ LED de status do nó▌2▐ Monitor do painel frontal▌3▐ Botões de navegação▌4▐ Painel de informações do operador▌5▐ Botão Selecionar▌6▐ LED de erro

21

43

1 2

6

3

5

4

svc00717

Figura 13. Painel Frontal do SAN Volume Controller 2145-CG8

svc0

05

41

c

2 3 4

56

21

43

1

Figura 14. Painel Frontal do SAN Volume Controller 2145-CF8

20 SAN Volume Controller: Guia de Resolução de Problemas

Page 39: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

LED de status do nóA atividade do sistema é indicada por meio do LED verde de status do nó.

O LED de status do nó fornece os seguintes indicadores de atividade do sistema:

ApagadoO nó não está operando como um membro de um sistema.

Aceso O nó está operando como um membro de um sistema.

Piscando lentamenteO nó está em um estado de candidato ou de serviço.

Piscando rapidamenteO nó está realizando dump dos dados de cache e estado para o disco localem antecipação a uma reinicialização de sistema a partir de uma ação dedesligamento pendente ou outra sequência de reinicialização controlada.

Monitor do painel frontalA exibição do painel frontal mostra informações de serviço, configuração enavegação.

É possível selecionar o idioma que é exibido no painel frontal. A exibição podemostrar informações alfanuméricas e informações gráficas (barras de progresso).

A exibição do painel frontal mostra informações de configuração e serviço sobre onó e o sistema, incluindo os seguintes itens:v Indicador de progresso da inicializaçãov Falha na inicializaçãov Carregandov Inicialização de hardwarev Solicitação de resgate do nóv Falha de energiav Desligandov Recuperandov Reiniciandov Encerrandov Códigos de errosv Validar WWN?

Botões de navegaçãoÉ possível usar os botões de navegação para mover através dos menus.

Há quatro botões de navegação que podem ser usados para movimentação portodo um menu: para cima, para baixo, direita e esquerda.

Cada botão corresponde à direção que é possível mover em um menu. Porexemplo, para mover para a direita em um menu, pressione o botão de navegaçãolocalizado no lado direito. Se você deseja mover para baixo em um menu,pressione o botão de navegação localizado na parte inferior.

Nota: O botão de seleção é usado em tandem com os botões de navegação.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 21

Page 40: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Número de série do produtoO nó contém um SAN Volume Controllernúmero de série do produto que égravado no hardware da placa-mãe. O número de série do produto também éimpresso na etiqueta do número de série que está localizada no painel frontal.

Este número é usado para verificação de autorização de garantia e serviço e éincluído nos dados enviados com relatórios de erros. É essencial que este númeronão seja alterado durante a vida do produto. Se a placa-mãe é substituída, deve-seseguir as instruções de substituição da placa-mãe cuidadosamente e regravar onúmero de série na placa-mãe.

Botão SelecionarUse o botão de seleção para selecionar um item de um menu.

O botão de seleção e de navegação ajudam a navegar e selecionar opções de menue inicialização e iniciam um teste do painel de serviço. O botão de seleção estálocalizado no painel frontal do SAN Volume Controller, próximo aos botões denavegação.

Rótulo de identificação do nóO rótulo de identificação do nó no painel frontal exibe um número de identificaçãode nó de seis dígitos. Às vezes, esse número é chamado de nome do painel ou IDdo painel frontal.

O rótulo de identificação de nó é o número de seis dígitos que é a entrada para ocomando addnode. É legível pelo software do sistema e é usado pelo software deconfiguração e serviço como um identificador de nó. O número de identificação denó também pode ser exibido na exibição do painel frontal quando node éselecionado no menu.

Se o painel frontal do conjunto do controlador de serviço for substituído, aconfiguração e o software de serviço mostrarão o número que está impresso nafrente do painel de substituição. Futuros relatórios de erro conterão o novonúmero. Nenhuma reconfiguração do sistema será necessário quando o painelfrontal for substituído.

LED de erroAs falhas críticas no controlador de serviço são indicadas através do LED de erroâmbar.

O LED de erro possui os dois estados a seguir:

DESLIGADOO controlador de serviço está funcionando corretamente.

LIGADOUma falha crítica do controlador de serviço foi detectada e você devesubstituir o controlador de serviço.

O LED de erro poderá acender temporariamente quando o nó estiverligado. Se o LED de erro estiver aceso, mas a exibição do painel frontalestiver completamente em branco, aguarde cinco minutos para permitir aoLED um tempo para desligar antes de executar qualquer ação de serviço.

SAN Volume Controller painel de informações do operadorO painel de informações do operador está localizado no painel frontal do SANVolume Controller .

22 SAN Volume Controller: Guia de Resolução de Problemas

Page 41: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Painel de informações do operador SAN Volume Controller2145-DH8O painel de informações do operador indica informações como erros da placa-mãe,atividade Ethernet e o status de energia.

O Figura 15 mostra o painel de informações do operador para o SAN VolumeController 2145-DH8.

(▌1▐Botão ligar/desligar e LED de inicialização (verde)▌2▐ Ícone Ethernet

▌3▐Botão localizador do sistema e LED (azul)▌4▐ Trava de liberação para o painel de sistema de diagnósticos por indicadoresluminosos▌5▐ LEDs de atividade da Ethernet

▌6▐ LED do log de verificação

▌7▐ LED de erro no sistema (amarelo)

Nota: Se o nó tiver mais de quatro portas Ethernet, a atividade em portas cinco eacima não será refletida nos LEDs de atividade Ethernet do painel de informaçõesdo operador.

SAN Volume Controller 2145-CG8 painel de informações dooperadorO painel de informações do operador contém botões e indicadores, como o botãode controle de energia e os LEDs que fornecem informações do sistema.

O Figura 16 na página 24 mostra o painel de informações do operador para o SANVolume Controller 2145-CG8.

5 6 7

1 2 3 4

ifs00064

Figura 15. Painel de informações do operador SAN Volume Controller 2145-DH8

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 23

Page 42: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ Tampa do botão de energia▌2▐ LED de atividade de Ethernet 1. Os LEDs do painel de informações dooperador fazem referência às portas Ethernet que são montadas na placa-mãe.▌3▐ LED de atividade de Ethernet 2. Os LEDs do painel de informações dooperador fazem referência às portas Ethernet que são montadas na placa-mãe.▌4▐ LED de informações do sistema▌5▐ LED de erro do sistema▌6▐ Trava de liberação▌7▐ Botão localizador e LED▌8▐ Botão e LED de energia

Nota: Se você instalar o recurso Ethernet de 10 Gbps, a atividade da porta nãoserá refletida nos LEDs de atividade.

SAN Volume Controller 2145-CF8 painel de informações dooperadorO painel de informações do operador contém botões e indicadores, como o botãode controle de energia e os LEDs que fornecem informações do sistema.

O Figura 17 mostra o painel de informações do operador para o SAN VolumeController 2145-CF8.

▌1▐ Tampa do botão de energia▌2▐ LED de atividade 2 Ethernet▌3▐ LED de atividade 1 Ethernet▌4▐ LED de informações do sistema▌5▐ LED de erro do sistema

21

1 2 3 4 5

8 7 6

svc00722

Figura 16. SAN Volume Controller 2145-CG8 ou 2145-CF8 painel de informações dooperador

12

34

431 2

6

5

78

svc_bb1gs008

910

Figura 17. SAN Volume Controller 2145-CG8 ou 2145-CF8 painel de informações dooperador

24 SAN Volume Controller: Guia de Resolução de Problemas

Page 43: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌6▐ Trava de liberação▌7▐ Botão localizador e LED▌8▐ Não usado▌9▐ Não usada▌10▐ Botão e LED de Energia

LED de erro do sistemaQuando ele estiver aceso, o LED de erro do sistema indica que ocorreu um erro deplaca-mãe.

Esse LED âmbar acenderá se o hardware detectar um erro irrecuperável querequeira uma nova unidade substituível em campo (FRU). Para ajudar a isolar aFRU com falha, consulte MAP 5800: caminho luminoso para ajudar a isolar a FRUcom falha.

Um LED de erro do sistema também está presente na parte posterior dessesmodelos do SAN Volume Controller:v 2145-CG8v 2145-CF8

LED de atividade da unidade de discoQuando estiver acesa, o LED de atividade da unidade de disco verde indica que odisco está em uso.

Botão de reconfiguraçãoSe um botão de reconfiguração estiver disponível no nó do SAN VolumeController, não o use.

Atenção: Se você usar o botão de reconfiguração, o nó será reiniciadoimediatamente sem os dados do controle do SAN Volume Controller que estãosendo gravados no disco. Ações de serviço são necessárias para tornar o nóoperacional novamente.

Botão Liga/DesligaO botão liga/desliga ativa e desativa a energia principal para o SAN VolumeController.

Para ativar a energia, pressione e solte o botão liga/desliga. Você deve ter umdispositivo com ponta, como uma caneta, para pressionar o botão.

Para desligar a energia, pressione e solte o botão liga/desliga. Para obterinformações adicionais sobre como desligar o nó SAN Volume Controller, consulteMAP 5350: Desligando um Nó SAN Volume Controller.

Atenção: Quando o nó está operacional e você pressiona e libera imediatamente obotão de energia, o SAN Volume Controller grava os dados de controle no discointerno e, então, desliga. Isso pode demorar até cinco minutos. Se você pressionaro botão liga/desliga mas não soltá-lo, o nó é imediatamente desligado sem agravação dos dados de controle do SAN Volume Controller no disco. As ações deserviço são, então, necessárias para tornar o SAN Volume Controller novamenteoperacional. Portanto, durante a operação de desligamento, não pressione e segureo botão liga/desliga por mais de dois segundos.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 25

Page 44: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

LED de EnergiaO LED de energia verde indica o status de energia do sistema.

O LED de energia possui as seguintes propriedades:

ApagadoUma ou mais das seguintes afirmações são verdadeiras:v Nenhuma energia está presente na entrada da fonte de alimentação.v A fonte de alimentação falhou.v O LED falhou.

On O nó do SAN Volume Controller está ligado.

PiscandoO nó do SAN Volume Controller está desligado, mas ainda está conectadoa uma fonte de alimentação.

Nota: Um LED de energia também está presente na parte posterior desses nós doSAN Volume Controller:v 2145-CG8v 2145-CF8

LED de Informação do SistemaQuando o LED de informação do sistema está aceso, ocorreu um evento nãocrítico.

Verifique o painel do sistema de diagnósticos por indicadores luminosos e o log deeventos. Os diagnósticos por indicadores luminosos são descritos em mais detalhesno procedimento de análise de manutenção (MAP) de indicadores luminosos.

LED do LocalizadorO SAN Volume Controller não usa o LED do localizador.

LED de atividade da EthernetUm LED de atividade da Ethernet ao lado de cada porta Ethernet indica que o nódo SAN Volume Controller está se comunicando na rede Ethernet que estáconectada à porta Ethernet.

Os LEDs do painel de informações do operador fazem referência às portasEthernet que são montadas na placa-mãe. Se você instalar a placa Ethernet de 10Gbps em um SAN Volume Controller 2145-CG8, a atividade da porta não serárefletida nos LEDs de atividade.

Indicadores e conectores do painel traseiro do SAN VolumeController

Os indicadores do painel traseiro para o SAN Volume Controller estão localizadosno conjunto do painel traseiro. Os conectores externos estão localizados no SANVolume Controller do nó e o conjunto da fonte de alimentação.

Indicadores do Painel Traseiro do SAN Volume Controller2145-DH8Os indicadores do painel traseiro consistem em LEDs que indicam o status dasportas do Fibre Channel, conexão e atividade da Ethernet, energia, corrente elétricae erros da placa-mãe.

26 SAN Volume Controller: Guia de Resolução de Problemas

Page 45: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A Figura 18 mostra os indicadores de painel traseiro no conjunto do painel traseirodo SAN Volume Controller 2145-DH8.

▌1▐ LED de link Ethernet▌2▐ LED de atividade Ethernet▌3▐ LEDs de energia, localização e erro no sistema▌4▐ LEDs de erro de AC, DC e fonte de alimentação

Conectores do SAN Volume Controller 2145-DH8O SAN Volume Controller 2145-DH8 inclui diversos conectores externos paradados, vídeo e energia.

A Figura 19 mostra os conectores externos no conjunto do painel traseiro do SANVolume Controller 2145-DH8.

▌1▐ Porta 1 Ethernet de 1 Gbps▌2▐ Porta 2 Ethernet de 1 Gbps▌3▐ Porta 3 Ethernet de 1 Gbps▌4▐ Porta do técnico (Ethernet)▌5▐ Fonte de alimentação 2▌6▐ Fonte de alimentação 1▌7▐ USB 6▌8▐ USB 5▌9▐ USB 4▌10▐ USB 3▌11▐ Serial▌12▐ Vídeo▌13▐ Porta sem uso Ethernet

1

2

3

4

5

6

svc0

08

62

31 42

Figura 18. Indicadores do Painel Traseiro do SAN Volume Controller 2145-DH8

1

2

3

4

5

6

svc0

08

59

1 11122 3 4 678910

5

13

Figura 19. Conectores na Parte Traseira do SAN Volume Controller 2145-DH8

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 27

Page 46: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A Figura 20 mostra o tipo do conector que está localizado em cada conjunto defonte de alimentação.

▌1▐ Neutro▌2▐ Aterramento▌3▐ Em tempo real

Nota: Os adaptadores da interface do host opcionais fornece conectores adicionaispara Ethernet de 10Gbps, Fibre Channel ou SAS.

Portas do SAN Volume Controller 2145-DH8 Usadas Durante Procedimentos deServiços:

O SAN Volume Controller 2145-DH8 contém uma série de portas que são usadasdurante os procedimentos de serviços.

A Figura 21 mostra portas que são usadas apenas durante os procedimentos deserviços.

▌1▐ Porta do técnico (Ethernet)▌2▐ USB 3▌3▐ USB 4▌4▐ USB 5▌5▐ USB 6

Durando a operação normal, nenhuma dessas portas é usada. Conecte umdispositivo em qualquer uma dessas portas apenas quando você for orientado afazer isso por um procedimento de serviço ou por um Representante de serviçosIBM.

3

1

2

svc00838

Figura 20. Conector de energia

svc00866

1

2

3

4

5

6

52 3 41

Figura 21. Portas de serviço do SAN Volume Controller 2145-DH8

28 SAN Volume Controller: Guia de Resolução de Problemas

Page 47: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Portas Não Usadas do SAN Volume Controller 2145-DH8:

O SAN Volume Controller 2145-DH8 inclui uma porta que não é usada.

A Figura 22 mostra a porta que não é usada durante procedimentos de serviço ouoperação normal. Essa porta é desativada no software para tornar a porta inativa.

▌1▐ Porta sem uso Ethernet

Indicadores do Painel Traseiro do SAN Volume Controller2145-CG8Os indicadores do painel traseiro consistem em LEDs que indicam o status dasportas do Fibre Channel, conexão e atividade da Ethernet, energia, corrente elétricae erros da placa-mãe.

O Figura 23 mostra os indicadores de painel traseiro no conjunto do painel traseirodo SAN Volume Controller 2145-CG8.

▌1▐ Diodos emissores de luz do Fibre Channel▌2▐ LEDs de link Ethernet▌3▐ LEDs da atividade Ethernet▌4▐ LEDs AC, DC e de erro da fonte de alimentação▌5▐ LEDs de energia, local e erro no sistema

Figura 24 na página 30 mostra os indicadores do painel traseiro no conjunto dopainel traseiro do SAN Volume Controller 2145-CG8 que possui o recurso Ethernetde 10 Gbps.

1

2

3

4

5

6

svc00867

1

Figura 22. Porta sem uso Ethernet do SAN Volume Controller 2145-DH8

1

svc00720

2

3 5

4

Figura 23. Indicadores do Painel Traseiro do SAN Volume Controller 2145-CG8

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 29

Page 48: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ LEDs do link de Ethernet de 10 Gbps. O LED de link âmbar fica acesoquando esta porta está conectada a um comutador Ethernet de 10 Gbps e o linkestá online.▌2▐ LEDs de atividade Ethernet de 10 Gbps. O LED de atividade verde ficaaceso enquanto dados estiverem sendo enviados pelo link.

Conectores do SAN Volume Controller 2145-CG8Os conectores externos que o SAN Volume Controller 2145-CG8 usa incluemquatro portas do Fibre Channel, uma porta serial, duas portas Ethernet e doisconectores de energia. O 2145-CG8 também possui conectores externos para orecurso de Ethernet de 10 Gbps.

Estas figuras mostram os conectores externos no conjunto do painel traseiro doSAN Volume Controller 2145-CG8.

▌1▐ Porta 1 do Fibre Channel▌2▐ Porta 2 do Fibre Channel▌3▐ Porta 3 do Fibre Channel▌4▐ Porta 4 do Fibre Channel▌5▐ Conector do cabo de energia para a fonte de alimentação 1▌6▐ Conector do cabo de energia para a fonte de alimentação 2▌7▐ Conexão serial para o cabo de comunicação UPS▌8▐ Porta 2 Ethernet▌9▐ Porta 1 Ethernet

svc00729

1

2

Figura 24. Indicadores do Painel Traseiro do SAN Volume Controller 2145-CG8 para oRecurso Ethernet de 10 Gbps

svc00732

3 541 2 6

79 8

Figura 25. Conectores na Parte Traseira do SAN Volume Controller 2145-CG8

30 SAN Volume Controller: Guia de Resolução de Problemas

Page 49: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ Porta Ethernet 3 de 10 Gbps▌2▐ Porta Ethernet 4 de 10 GbpsPorta 5 do Fibre Channel (não mostrada)Porta 6 do Fibre Channel (não mostrada)Porta 7 do Fibre Channel (não mostrada)Porta 8 do Fibre Channel (não mostrada)

A Figura 27 mostra o tipo do conector que está localizado em cada conjunto defonte de alimentação. Use estes conectores para conectar o SAN Volume Controller2145-CG8 a dois cabos de energia do fonte de alimentação ininterrupta.

Portas do SAN Volume Controller 2145-CG8 Usadas Durante Procedimentos deServiços:

O SAN Volume Controller 2145-CG8 contém uma série de portas que são usadasdurante os procedimentos de serviços.

A Figura 28 mostra portas que são usadas apenas durante os procedimentos deserviços.

svc00731

21

Figura 26. Portas Ethernet de 10 Gbps na Parte Traseira do SAN Volume Controller2145-CG8

Aterramento

Em tempo real

Neutro(a)

Figura 27. Conector de energia

svc00724

1 2 3

3 2

Figura 28. Portas de Serviço do SAN Volume Controller 2145-CG8

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 31

Page 50: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ Porta de gerenciamento de sistemas▌2▐ Duas portas do monitor, uma na parte frontal e uma na parte traseira▌3▐ Quatro portas USB, duas na parte frontal e duas na parte traseira

Durando a operação normal, nenhuma dessas portas é usada. Conecte umdispositivo em qualquer uma dessas portas apenas quando você for orientado afazer isso por um procedimento de serviço ou por um Representante de serviçosIBM.

Portas Não Usadas do SAN Volume Controller 2145-CG8:

O SAN Volume Controller 2145-CG8 pode conter uma porta que não é usada.

As Figura 29 mostram a porta que não é usada durante os procedimentos deserviços ou uso normal.

▌1▐ Porta Serial-attached SCSI (SAS)

Quando presente, essa porta será desativada no software para tornar a portainativa.

A porta SAS estará presente quando o adaptador SAS de alta velocidade opcionalestiver instalado com uma ou mais unidades flash.

Indicadores do Painel Traseiro do SAN Volume Controller2145-CF8Os indicadores do painel traseiro consistem em LEDs que indicam o status dasportas do Fibre Channel, conexão e atividade da Ethernet, energia, corrente elétricae erros da placa-mãe.

O Figura 30 mostra os indicadores de painel traseiro no conjunto do painel traseirodo SAN Volume Controller 2145-CF8.

▌1▐ LEDs do Fibre Channel▌2▐ LEDs de erro de AC, DC e fonte de alimentação▌3▐ LEDs de energia, localização e erro no sistema

svc00730

1

Figura 29. Porta não usada do SAN Volume Controller 2145-CG8

4 3

1 2

545

svc_00219b_cf8

Figura 30. Indicadores do Painel Traseiro do SAN Volume Controller 2145-CF8

32 SAN Volume Controller: Guia de Resolução de Problemas

Page 51: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌4▐ LEDs de link da Ethernet▌5▐ LEDs de atividade Ethernet

Conectores do SAN Volume Controller 2145-CF8Os conectores externos que o SAN Volume Controller 2145-CF8 usa incluem quatroportas do Fibre Channel, uma porta serial, duas portas Ethernet e dois conectoresde energia.

O Figura 31 mostra os conectores externos no conjunto do painel traseiro do SANVolume Controller 2145-CF8.

▌1▐ Porta 1 do Fibre Channel▌2▐ Porta 2 do Fibre Channel▌3▐ Porta 3 do Fibre Channel▌4▐ Porta 4 do Fibre Channel▌5▐ Conector do cabo de energia para a fonte de alimentação 1▌6▐ Conector do cabo de energia para a fonte de alimentação 2▌7▐ Conexão serial para o cabo de comunicação UPS▌8▐ Porta 2 Ethernet▌9▐ Porta 1 Ethernet

A Figura 32 mostra o tipo do conector que está localizado em cada conjunto defonte de alimentação. Use esses conectores para conectar o SAN Volume Controller2145-CF8 a dois cabos de energia do fonte de alimentação ininterrupta.

Portas do SAN Volume Controller 2145-CF8 Usadas Durante Procedimentos deServiços:

O SAN Volume Controller 2145-CF8 contém uma série de portas que são usadasdurante os procedimentos de serviços.

431 2 65

79

svc_00219_cf8

8

Figura 31. Conectores na Parte Traseira do SAN Volume Controller 2145-CG8 ou 2145-CF8

Aterramento

Em tempo real

Neutro(a)

Figura 32. Conector de energia

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 33

Page 52: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A Figura 33 mostra portas que são usadas apenas durante os procedimentos deserviços.

▌1▐ Porta de gerenciamento de sistemas▌2▐ Duas portas do monitor, uma na parte frontal e uma na parte traseira▌3▐ Quatro portas USB, duas na parte frontal e duas na parte traseira

Durando a operação normal, nenhuma dessas portas é usada. Conecte umdispositivo em qualquer uma dessas portas apenas quando você for orientado afazer isso por um procedimento de serviço ou por um Representante de serviçosIBM.

Portas Não Usadas do SAN Volume Controller 2145-CF8:

O SAN Volume Controller 2145-CF8 pode conter uma porta que não é usada.

As Figura 34 mostram a porta que não é usada durante os procedimentos deserviços ou uso normal.

▌1▐ Porta Serial-attached SCSI (SAS)

Quando presente, essa porta será desativada no software para tornar a portainativa.

A porta SAS estará presente quando o adaptador SAS de alta velocidade opcionalestiver instalado com uma ou mais unidades flash.

LEDs Fibre ChannelOs LEDs do Fibre Channel indicam o status das portas do Fibre Channel.

Dois LEDs são usados para indicar o estado e a velocidade da operação de cadaporta do Fibre Channel. O LED inferior indica o estado do link e da atividade.

svc0

02

27

cf831 2

3

2

Figura 33. Portas de Serviço do SAN Volume Controller 2145-CF8

svc0

02

27

cf8

b

1

Figura 34. Porta não Usada do SAN Volume Controller 2145-CF8

34 SAN Volume Controller: Guia de Resolução de Problemas

Page 53: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 8. Estado e atividade do link para o LED inferior do Fibre Channel

Estado do LED Estado e atividade do link indicado

Apagado Link inativo

Aceso Link ativo, nenhuma E/S

Piscando Link ativo, E/S ativa

Cada porta do Fibre Channel pode operar em uma das três velocidades. O LEDsuperior indica a velocidade do link relativo. A velocidade do link será definidaapenas se o estado do link estiver ativo.

Tabela 9. Velocidade do link para o LED superior do Fibre Channel

Estado do LED Velocidade do link indicada

Apagado LENTO

Aceso RÁPIDO

Piscando MÉDIO

O Tabela 10 mostra as velocidades do link atual para o SAN Volume Controller2145-CF8 e para o SAN Volume Controller 2145-CG8.

Tabela 10. Velocidades do link reais

Velocidade do link Velocidades do link reais

Lento 2 Gbps

Rápido 8 Gbps

Médio 4 Gbps

LED de atividade EthernetO O LED de atividade Ethernet indica que o nó está se comunicando com a redeEthernet conectada à porta Ethernet.

Existe um conjunto de LEDs para cada conector Ethernet. O LED superior é o LEDde link Ethernet. Quando ele estiver aceso, indicará que há uma conexão ativa naporta Ethernet. O LED inferior é o LED de atividade Ethernet. Quando ele piscar,indicará que os dados estão sendo transmitidos ou recebidos entre o servidor e umdispositivo de rede.

LED de link EthernetO LED de link Ethernet indica que há uma conexão ativa na porta Ethernet.

Existe um conjunto de LEDs para cada conector Ethernet. O LED superior é o LEDde link Ethernet. Quando ele estiver aceso, indicará que há uma conexão ativa naporta Ethernet. O LED inferior é o LED de atividade Ethernet. Quando ele piscar,indicará que os dados estão sendo transmitidos ou recebidos entre o servidor e umdispositivo de rede.

LEDs de Energia, Local e Erro no SistemaOs LEDs de energia, local e erro no sistema são localizados na traseira do SANVolume Controller. Estes três LEDs são duplicatas dos mesmos LEDs que sãomostrados na frente do nó.

Os seguintes termos descrevem os LEDs de energia, local e erro no sistema:

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 35

Page 54: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

LED de EnergiaEsta é a parte superior dos três LEDs e indica os estados a seguir:

ApagadoUma ou mais das seguintes afirmações são verdadeiras:v Nenhuma energia está presente na entrada da fonte de

alimentaçãov A fonte de alimentação falhouv O LED falhou

Aceso O SAN Volume Controller está ligado.

PiscandoO SAN Volume Controller está desligado mas ainda está conectadoa uma fonte de alimentação.

LED de LocalEste é o meio dos três LEDs e não é usado pelo SAN Volume Controller.

LED de erro do sistemaEsta é a parte inferior dos três LEDs que indica que ocorreu um erro naplaca-mãe. O sistema de diagnósticos por indicadores luminosos fornecemais informações.

LEDs de CA e CDOs LEDs de CA e CD indicam se o nó está recebendo corrente elétrica.

LED de ACO LED superior indica que a corrente CA está presente no nó.

LED de CDO LED de energia indica que a corrente CA está presente no nó.

LEDs de erro de AC, DC e fonte de alimentação:

Os LEDs de erro de AC, DC e fonte de alimentação indicam se o nó está recebendocorrente elétrica.

O Figura 35 mostra o local dos LEDs de erro de AC, DC e fonte de alimentação doSAN Volume Controller 2145-DH8.

1

2

3

4

5

6

svc00864

3

1

2

Figura 35. LEDs de erro de AC, DC e energia do SAN Volume Controller 2145-DH8

36 SAN Volume Controller: Guia de Resolução de Problemas

Page 55: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Cada uma das duas fontes de alimentação possui seu próprio conjunto de LEDs.

▌1▐ Indica se a corrente alternada (AC) está presente no nó.

▌2▐ Indica se a corrente direta (DC) está presente no nó.

▌3▐ Indica um problema com a fonte de alimentação.

LEDs de CA, CD e de erro da fonte de alimentação no SAN Volume Controller2145-CF8e SAN Volume Controller 2145-CG8:

Os LEDs de CA, CD e de erro de fonte de alimentação indicam se o nó estárecebendo corrente elétrica.

Figura 36 mostra o local dos LEDs de CA, CD e de erro de fonte de alimentação.

Cada uma das duas fontes de alimentação possui seu próprio conjunto de LEDs.

LED de ACO LED superior (▌1▐) no lado esquerdo da fonte de alimentação indica quea corrente CA está presente no nó.

LED de CDO LED do meio (▌2▐) ao lado esquerdo da fonte de alimentação indica quea corrente CD está presente no nó.

LED de erro da fonte de alimentaçãoO LED inferior (▌3▐) ao lado esquerdo da fonte de alimentação, indica umproblema com a fonte de alimentação.

Números de porta do Fibre Channel e nomes das portasuniversais

As portas do Fibre Channel (FC) são identificadas pelo seu número de porta físicae por um nome da porta universal (WWPN).

Os números de porta física identificam os adaptadores Fibre Channel e as conexõesa cabo quando as tarefas de serviço são executadas. Os nomes da porta universal(WWPNs), que identificam exclusivamente os dispositivos na SAN, são usados

svc00542

1

2

3

Figura 36. LEDs de CA, CD e de erro de energia do SAN Volume Controller 2145-CG8 ou2145-CF8

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 37

Page 56: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

para tarefas como configuração do comutador do Fibre Channel. Os WWPNs sãoderivados do nome universal do nó (WWNN) do nó, no qual as portas estãoinstaladas.

Requisitos para o ambiente do SAN Volume ControllerDeterminadas especificações para o site físico do SAN Volume Controller devemser atendidas antes do Representante IBM poder configurar seu ambiente do SANVolume Controller.

Requisitos do Ambiente do SAN Volume Controller 2145-DH8Antes da instalação do SAN Volume Controller 2145-DH8, o ambiente físico deveatender a determinados requisitos. Isso inclui verificar se o espaço adequado estádisponível e se os requisitos para as condições ambientais e de energia sãoatendidos.

Requisitos da Voltagem de Entrada

Certifique-se de que seu ambiente atende os requisitos de voltagem mostrados naTabela 11.

Tabela 11. Requisitos da Voltagem de Entrada

Voltagem Frequência

100-127 / 200-240Vac 50 Hz ou 60 Hz

Requisitos de energia máxima para cada do nó

Certifique-se de que seu ambiente atenda aos requisitos de energia, conformemostrado em Tabela 12.

A energia máxima que é requerida depende do tipo de nó e dos recursos opcionaisque estão instalados.

Tabela 12. Consumo de Energia

Componentes Requisitos de energia

SAN Volume Controller 2145-DH8 200 W típico, máximo de 750 W (200 a 240 VCA, 50/60 Hz)

Nota: Não é possível misturar fontes de alimentação AC e DC; as fontes dealimentação devem corresponder.

Requisitos do ambientesem energia AC redundante

Assegure-se de que o seu ambiente esteja incluído nos seguintes intervalos, se vocênão estiver usando o energia AC redundante.

Se não estiver usando a energia de corrente alternada redundante, certifique-se deque seu ambiente esteja nas faixas mostradas na Tabela 13 na página 39.

38 SAN Volume Controller: Guia de Resolução de Problemas

Page 57: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 13. Especificações Físicas

Ambiente Temperatura AltitudeUmidaderelativa

Ponto máximode condensação

Operando emaltitudesinferiores

5°C a 40°C(41°F a 104°F)

0 a 950 m(0 pés a 3.117pés)

8% a 85% 24°C (75°F)Operando emaltitudessuperiores

5°C a 28°C(41°F a 82°F)

951 m a 3.050 m(3.118 pés a10.000 pés)

Desligado (comenergia deespera)

5°C a 45°C(41°F a 113°F)

0 m a 3.050 m(0 pés a 10.000pés)

8% a 85% 27°C (80,6°F)

Armazenamento 1°C a 60°C(33,8°F a 140,0°F)

0 m a 3.050 m(0 pés a 10.000pés)

5% a 80% 29°C (84,2°F)

Envio -40°C a 60°C(-40°F a 140,0°F)

0 m a 10.700 m(0 pés a34.991 pés)

5% a 100% 29°C (84,2°F)

Nota: Diminua a temperatura máxima do sistema em 1°C para cada aumento de175 m de altitude.

Preparando Seu Ambiente

As tabelas a seguir listam as características físicas dos nó 2145-DH8.

Dimensões e peso

Use os parâmetros mostrados na Tabela 14 para garantir que haja espaço estejadisponível em um rack capaz de suportar o nó.

Tabela 14. Dimensões e peso

Altura Largura Profundidade Peso máximo

86 mm (3,4 pol.) 445 mm (17,5 pol) 746 mm (29,4 pol.) 25 kg (55 lb) a 30 kg(65 lb) dependendoda configuração

Requisitos de Espaço Adicional

Certifique-se de que haja espaço disponível no rack para os requisitos de espaçoadicional ao redor do nó, conforme mostrado na Tabela 15.

Tabela 15. Requisitos de Espaço Adicional

LocalRequisitos de EspaçoAdicional Razão

Lado esquerdo e lado direito Mínimo: 50 mm (2polegadas)

Fluxo do ar de resfriamento

Voltar Mínimo: 100 mm (4polegadas)

Saída de cabo

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 39

Page 58: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Saída máxima de calor de cada nó do 2145-DH8

O nó dissipa a saída máxima de calor fornecida na Tabela 16.

Tabela 16. Saída máxima de calor de cada nó do 2145-DH8

Modelo Saída de calor por nó

2145-DH8 v Configuração mínima: 419.68 Btu por hora(AC 123 watts)

v Configuração máxima: 3480,24 Btu porhora (AC 1020 watts)

Requisitos do Ambiente do SAN Volume Controller 2145-CG8Antes da instalação do SAN Volume Controller 2145-CG8, o ambiente físico deveatender a determinados requisitos. Isso inclui verificar se o espaço adequado estádisponível e se os requisitos para as condições ambientais e de energia sãoatendidos.

Requisitos da Voltagem de Entrada

Certifique-se de que seu ambiente atende os requisitos de voltagem mostrados naTabela 17.

Tabela 17. Requisitos da Voltagem de Entrada

Voltagem Frequência

200 V - 240 V em fase única 50 Hz ou 60 Hz

Atenção:

v Se o fonte de alimentação ininterrupta estiver em cascata a partir de outro fontede alimentação ininterrupta, o fonte de alimentação ininterrupta de origemdeverá ter pelo menos três vezes a capacidade por fase e a distorção harmônicatotal deverá ser menor que 5%.

v O fonte de alimentação ininterrupta também deve ter captura de voltagem deentrada que tem uma taxa de retorno de não mais que 3 Hz por segundo.

Requisitos de energia máxima para cada do nó

Certifique-se de que seu ambiente atenda aos requisitos de energia, conformemostrado em Tabela 18.

A energia máxima que é requerida depende do tipo de nó e dos recursos opcionaisque estão instalados.

Tabela 18. Consumo Máximo de Energia

Componentes Requisitos de energia

SAN Volume Controller 2145-CG8 e 2145UPS-1U

200 W

Para cada comutador de energia de corrente alternada redundante, inclua 20 Wnos requisitos de energia.

Para o adaptador SAS de alta velocidade com uma a quatro unidades de estadosólido, inclua 50 W nos requisitos de energia.

40 SAN Volume Controller: Guia de Resolução de Problemas

Page 59: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Requisitos do disjuntor

O 2145 UPS-1U possui um disjuntor de circuito integrado e não requer proteçãoadicional.

Requisitos do ambientesem energia AC redundante

Se não estiver usando a energia de corrente alternada redundante, certifique-se deque seu ambiente esteja nas faixas mostradas na Tabela 19.

Tabela 19. Requisitos do ambientesem energia AC redundante

Ambiente Temperatura AltitudeUmidaderelativa

Temperaturamáxima debulbo úmido

Operando emaltitudesinferiores

10°C a 35°C(50°F a 95°F)

0 a 914 m(0 a 3000 pés)

8% a 80% semcondensação

23°C (73°F)

Operando emaltitudessuperiores

10°C a 32°C(50°F a 90°F)

914 a 2.133 m(3.000 a 7.000pés)

8% a 80% semcondensação

23°C (73°F)

Desligado 10°C a 43°C(50°F a 109°F)

0 a 2.133 m(0 a 7000 pés)

8% a 80% semcondensação

27°C (81°F)

Armazenamento 1°C a 60°C(34°F a 140°F)

0 a 2.133 m(0 a 7000 pés)

5% a 80% semcondensação

29°C (84°F)

Remessa -20°C a 60°C(-4°F a 140°F)

0 a 10668 m(0 a 34.991 pés)

5% a 100% comcondensação,mas nenhumaprecipitação

29°C (84°F)

Requisitos do ambiente com energia AC redundante

Se estiver usando energia ac redundante, assegure-se que seu ambiente estejadentro das faixas mostradas em Tabela 20.

Tabela 20. Requisitos do ambiente com energia AC redundante

Ambiente Temperatura AltitudeUmidaderelativa

Temperaturamáxima debulbo úmido

Operando emaltitudesinferiores

15°C a 32°C(59°F a 90°F)

0 a 914 m(0 a 3000 pés)

20% a 80% semcondensação

23°C (73°F)

Operando emaltitudessuperiores

15°C a 32°C(59°F a 90°F)

914 a 2.133 m(3.000 a 7.000pés)

20% a 80% semcondensação

23°C (73°F)

Desligado 10°C a 43°C(50°F a 109°F)

0 a 2.133 m(0 a 7000 pés)

20% a 80% semcondensação

27°C (81°F)

Armazenamento 1°C a 60°C(34°F a 140°F)

0 a 2.133 m(0 a 7000 pés)

5% a 80% semcondensação

29°C (84°F)

Remessa -20°C a 60°C(-4°F a 140°F)

0 a 10668 m(0 a 34.991 pés)

5% a 100% comcondensação,mas nenhumaprecipitação

29°C (84°F)

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 41

Page 60: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Preparando Seu Ambiente

As tabelas a seguir listam as características físicas do nó dos gabinetes do SANVolume Controller 2145-CG8.

Dimensões e peso

Use os parâmetros mostrados na Tabela 21 para garantir que haja espaço estejadisponível em um rack capaz de suportar o nó.

Tabela 21. Dimensões e peso

Altura Largura Profundidade Peso máximo

4,3 cm(1,7 polegada)

44 cm(17,3 polegada)

73,7 cm(29 polegada)

15 kg(33 lb)

Requisitos de espaço adicional

Certifique-se de que haja espaço disponível no rack para os requisitos de espaçoadicional ao redor do nó, conforme mostrado no Tabela 22.

Tabela 22. Requisitos de espaço adicional

LocalizaçãoRequisitos de espaçoadicional Motivo

Lado esquerdo e lado direito Mínimo: 50 mm (2polegadas)

Fluxo do ar de resfriamento

Parte traseira Mínimo: 100 mm (4 pol.) Saída de cabo

Saída máxima de calor de cada nó do SAN Volume Controller2145-CG8

O nó dissipa a saída máxima de calor fornecida na Tabela 23.

Tabela 23. Saída máxima de calor de cada nó do SAN Volume Controller 2145-CG8

Modelo Saída de calor por nó

SAN Volume Controller 2145-CG8 160 W (546 Btu por hora)

SAN Volume Controller 2145-CG8 maisunidade flash

210 W (717 Btu por hora)

Saída máxima de calor de cada 2145 UPS-1U

O 2145 UPS-1U dissipa a saída máxima de calor fornecida em Tabela 24.

Tabela 24. Saída máxima de calor de cada 2145 UPS-1U

Modelo Saída de calor por nó

Saída máxima de calor do 2145 UPS-1Udurante operação normal

10 W (34 Btu por hora)

Saída máxima de calor do 2145 UPS-1Udurante operação pela bateria

100 W (341 Btu por hora)

42 SAN Volume Controller: Guia de Resolução de Problemas

Page 61: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Requisitos do Ambiente do SAN Volume Controller 2145-CF8Antes de instalar um nó do SAN Volume Controller 2145-CF8, o seu ambientefísico deve atender a determinados requisitos. Isso inclui verificar se o espaçoadequado está disponível e se os requisitos para as condições ambientais e deenergia são atendidos.

Requisitos da Voltagem de Entrada

Certifique-se de que seu ambiente atende os requisitos de voltagem mostrados naTabela 25.

Tabela 25. Requisitos da Voltagem de Entrada

Voltagem Frequência

200 - 240 V em fase única 50 ou 60 Hz

Atenção:

v Se o fonte de alimentação ininterrupta estiver em cascata a partir de outro fontede alimentação ininterrupta, o fonte de alimentação ininterrupta de origemdeverá ter pelo menos três vezes a capacidade por fase e a distorção harmônicatotal deverá ser menor que 5%.

v O fonte de alimentação ininterrupta também deve ter captura de voltagem deentrada que tem uma taxa de retorno de não mais que 3 Hz por segundo.

Requisitos de energia para cada nó

Assegure-se de que o seu ambiente atende aos seguintes requisitos de energia.

Certifique-se de que seu ambiente atenda aos requisitos de energia, conformemostrado em Tabela 26.

Tabela 26. Requisitos de energia para cada nó

Componentes Requisitos de energia

SAN Volume Controller 2145-CF8nó e 2145UPS-1U da fonte de alimentação

200 W

Notas:

v nós do SAN Volume Controller 2145-CF8 não podem se conectar a todas asrevisões da unidade fonte de alimentação do 2145 UPS-1U. Os nós SAN VolumeController 2145-CF8 exigem a 2145 UPS-1U unidade de fonte de alimentaçãonúmero de peça 31P1318. Esta unidade possui duas tomadas de energia queestão acessíveis. Revisões anteriores do 2145 UPS-1U unidade da fonte dealimentação têm apenas uma tomada de energia que está acessível e não sãoadequadas.

v Para cada comutador de energia de corrente alternada redundante, inclua 20 Wnos requisitos de energia.

v Para cada adaptador SAS de alta velocidade com um a quatro do unidadesflash, inclua 50 W nos requisitos de energia.

Requisitos do disjuntor

O 2145 UPS-1U possui um disjuntor de circuito integrado e não requer proteçãoadicional.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 43

Page 62: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Requisitos do ambiente sem energia AC redundante

Se não estiver usando a energia de corrente alternada redundante, certifique-se deque seu ambiente esteja nas faixas mostradas na Tabela 27.

Tabela 27. Requisitos do ambiente sem energia AC redundante

Ambiente Temperatura AltitudeUmidaderelativa

Temperaturamáxima debulbo úmido

Operando emaltitudesinferiores

10°C a 35°C(50°F a 95°F)

0 a 914 m(0 a 2998 pés)

8% a 80% semcondensação

23°C (73°F)

Operando emaltitudessuperiores

10°C a 32°C(50°F a 90°F)

914 a 2133 m(2998 a 6988 pés)

8% a 80% semcondensação

23°C (73°F)

Desligado 10°C a 43°C(50°F a 110°F)

0 a 2133 m(0 a 6988 pés)

8% a 80% semcondensação

27°C (81°F)

Armazenamento 1°C a 60°C(34°F a 140°F)

0 a 2133 m(0 a 6988 pés)

5% a 80% semcondensação

29°C (84°F)

Remessa -20°C a 60°C(-4°F a 140°F)

0 a 10668 m(0 a 34991 pés)

5% a 100% comcondensação,mas nenhumaprecipitação

29°C (84°F)

Requisitos do ambiente com energia AC redundante

Se estiver usando energia ac redundante, assegure-se que seu ambiente estejadentro das faixas mostradas em Tabela 28.

Tabela 28. Requisitos do ambiente com energia AC redundante

Ambiente Temperatura AltitudeUmidaderelativa

Temperaturamáxima debulbo úmido

Operando emaltitudesinferiores

15°C a 32°C(59°F a 90°F)

0 a 914 m(0 a 2998 pés)

20% a 80% semcondensação

23°C (73°F)

Operando emaltitudessuperiores

15°C a 32°C(59°F a 90°F)

914 a 2133 m(2998 a 6988 pés)

20% a 80% semcondensação

23°C (73°F)

Desligado 10°C a 43°C(50°F a 110°F)

0 a 2133 m(0 a 6988 pés)

20% a 80% semcondensação

27°C (81°F)

Armazenamento 1°C a 60°C(34°F a 140°F)

0 a 2133 m(0 a 6988 pés)

5% a 80% semcondensação

29°C (84°F)

Remessa -20°C a 60°C(-4°F a 140°F)

0 a 10668 m(0 a 34991 pés)

5% a 100% comcondensação,mas nenhumaprecipitação

29°C (84°F)

Preparando Seu Ambiente

As tabelas a seguir listam as características físicas do nó SAN Volume Controller2145-CF8.

44 SAN Volume Controller: Guia de Resolução de Problemas

Page 63: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Dimensões e peso

Use os parâmetros mostrados na Tabela 29 para garantir que haja espaço estejadisponível em um rack capaz de suportar o nó.

Tabela 29. Dimensões e peso

Altura Largura Profundidade Peso máximo

43 mm(1,69 polegada)

440 mm(17,32 polegada)

686 mm(27 polegada)

12,7 kg(28 lb)

Requisitos de espaço adicional

Certifique-se de que haja espaço disponível no rack para os requisitos de espaçoadicional ao redor do nó, conforme mostrado no Tabela 30.

Tabela 30. Requisitos de espaço adicional

LocalizaçãoEspaço adicionalrequisitos Motivo

Lados esquerdo e direito 50 mm (2 pol.) Fluxo do ar de resfriamento

Parte traseira Mínimo: 100 mm (4 pol.) Saída de cabo

Saída de calor de cada nó do SAN Volume Controller 2145-CF8

O nó dissipa a saída máxima de calor fornecida na Tabela 31.

Tabela 31. Saída de calor de cada nó do SAN Volume Controller 2145-CF8

Modelo Saída de calor por nó

SAN Volume Controller 2145-CF8 160 W (546 Btu por hora)

SAN Volume Controller 2145-CF8 e atéquatro unidades flashopcionais

210 W (717 Btu por hora)

Saída máxima de calor do 2145 UPS-1Udurante operação típica

10 W (34 Btu por hora)

Saída máxima de calor do 2145 UPS-1Udurante operação pela bateria

100 W (341 Btu por hora)

Comutador de energia de corrente alternada redundanteO comutador de energia de corrente alternada redundante é um recurso opcionalque torna os nós do SAN Volume Controller resilientes à falha de um únicocircuito de energia. O comutador de energia de corrente alternada redundante nãoé uma substituição de um fonte de alimentação ininterrupta. Você ainda deve usarum fonte de alimentação ininterrupta para cada nó.

Restrição: O Comutador de energia de corrente alternada redundante se aplicasomente aos modelos SAN Volume Controller 2145-CF8 e SAN Volume Controller2145-CG8.

Deve-se conectar o comutador de energia de corrente alternada redundante à doiscircuitos de energia independentes. Um circuito de energia se conecta à porta deentrada de energia principal e o outro circuito de energia se conecta à porta deentrada de energia de backup. Se a energia principal para o nó SAN VolumeController falhar por alguma razão, o comutador de energia de corrente alternada

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 45

|||

Page 64: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

redundante automaticamente usará a fonte de alimentação de backup. Quando aenergia for restaurada, o comutador de energia de corrente alternada redundanteretorna automaticamente para o uso da fonte de alimentação principal.

Coloque o comutador de energia de corrente alternada redundante no mesmo rackque o nó SAN Volume Controller. O comutador de energia de corrente alternadaredundante fica logicamente entre a unidade de distribuição de energia do rack e o2145 UPS-1U.

É possível usar um único comutador de energia de corrente alternada redundantepara fornecer energia para um ou dois nós SAN Volume Controller. Se for usado ocomutador de energia de corrente alternada redundante para fornecer energia paradois nós, os nós devem estar em grupos de E/S diferentes. Se o comutador deenergia de corrente alternada redundante falhar ou requerer manutenção, ambos osnós são desligados. Como os nós estão em dois grupos de E/S diferentes, os hostsnão perdem acesso aos dados do disco de backend.

Para uma máxima resiliência para falhas, use um comutador de energia de correntealternada redundante para fornecer energia para cada nó SAN Volume Controller.

Figura 37 mostra um comutador de energia de corrente alternada redundante.

Deve-se cabear adequadamente as unidades comutador de energia de correntealternada redundante em seu ambiente. Consulte “Cabeamento do comutador deenergia de corrente alternada redundante (Exemplo)” na página 47 para obterinformações de cabeamento.

Requisitos do Ambiente do Energia de corrente alternadaredundante

Assegure-se de que o seu local físico atende os requisitos de instalação para ocomutador de energia de corrente alternada redundante.

O comutador de energia de corrente alternada redundante requer duas fontes dealimentação independentes que são fornecidas por meio de duas unidades dedistribuição de energia montadas no rack (PDUs). As PDUs devem ter tomadasIEC320-C13.

svc0029

7

Figura 37. Foto do comutador de energia de corrente alternada redundante

46 SAN Volume Controller: Guia de Resolução de Problemas

Page 65: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O comutador de energia de corrente alternada redundante é fornecido com duasIEC 320-C19 para cabos de energia C14 para conexão com PDUs do rack. Não hánenhum cabo específico para o país para o comutador de energia de correntealternada redundante.

O cabo de energia entre o comutador de energia de corrente alternada redundantee o 2145 UPS-1U é classificado em 10 A.

Especificações do Comutador de energia de corrente alternadaredundante

As tabelas a seguir listam as características físicas do comutador de energia decorrente alternada redundante.

Dimensões e peso

Assegure-se de que haja espaço disponível em um rack que seja capaz de suportaro comutador de energia de corrente alternada redundante.

Tabela 32. Espaço de rack necessário para o comutador de energia de corrente alternadaredundante

Altura Largura Profundidade Peso máximo

43 mm (1,69polegada)

192 mm (7,56polegadas)

240 mm 2,6 kg (5,72 lb)

Requisitos de espaço adicional

Assegure-se de que o espaço também esteja disponível no rack para as placas demontagem laterais em um dos lados do comutador de energia de correntealternada redundante.

Tabela 33. Espaço de rack necessário para as placas de montagem do lado do comutadorde energia de corrente alternada redundante

Localização Largura Motivo

Lado esquerdo 124 mm (4,89 polegadas) Placa de montagem lateral

Lado direito 124 mm (4,89 polegadas) Placa de montagem lateral

Saída de calor (máxima)

A saída máxima do calor que é dissipado dentro do comutador de energia decorrente alternada redundante é aproximadamente 20 watts (70 Btu por hora).

Cabeamento do comutador de energia de corrente alternadaredundante (Exemplo)

Deve-se cabear adequadamente as unidades comutador de energia de correntealternada redundante em seu ambiente.

Figura 38 na página 48 mostra um exemplo das conexões de fiação principal paraum SAN Volume Controllersistema em cluster com o recurso comutador de energiade corrente alternada redundante. Este exemplo é projetado para mostrarclaramente as conexões de cabo; os componentes não estão posicionados comoestariam em um rack. Figura 39 na página 50 mostra uma instalação típica do rack.O sistema em cluster de quatro nós consiste em dois grupos de E/S:

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 47

Page 66: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Grupo de E/S 0 contém os nós A e Bv Grupo de E/S 1 contém os nós C e D

▌1▐ Grupo de E/S 0▌2▐ SAN Volume Controller Nó A▌3▐ 2145 UPS-1U A▌4▐ SAN Volume Controller Nó B▌5▐ 2145 UPS-1U B▌6▐ Grupo de E/S 1▌7▐ SAN Volume Controller Nó C▌8▐ 2145 UPS-1U C▌9▐SAN Volume Controller Nó D▌10▐ 2145 UPS-1U D▌11▐ Comutador de energia de corrente alternada redundante 1

1

4

2

5

svc00358_cf8

7

8

3

11

10

1314

9

12

6

Figura 38. Um sistema de quatro nós SAN Volume Controller com o comutador de energiade corrente alternada redundante de recurso

48 SAN Volume Controller: Guia de Resolução de Problemas

Page 67: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌12▐ Comutador de energia de corrente alternada redundante 2▌13▐ PDU X do local (tomadas C13)▌14▐ PDU Y do local (tomadas C13)

Os PDUs X e Y do local (▌13▐ e ▌14▐) são ativados a partir de duas fontes deenergia independentes.

Neste exemplo, apenas duas unidades comutador de energia de corrente alternadaredundante são usadas, e cada comutador de energia alimenta um nó em cadagrupo de E/S. Entretanto, para máxima redundância, use um comutador deenergia de corrente alternada redundante para fornecer energia para cada nó nosistema.

Alguns tipos de nó do SAN Volume Controller possuem duas unidades de fontede alimentação. Ambas as fontes de alimentação devem estar conectadas ao mesmo2145 UPS-1U, conforme mostrado pelo nó A e nó B. O SAN Volume Controller2145-CG8 é um exemplo de um nó que possui duas fontes de alimentação.

Figura 39 na página 50 mostra um cluster de 8 nós, com um comutador de energiaac redundante por nó instalado em um rack usando as melhores práticas de local,os cabos entre os componentes são mostrados.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 49

Page 68: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Fonte de Alimentação IninterruptaO fonte de alimentação ininterrupta protege um nó do SAN Volume Controllercontra blackouts, indisponibilidade de energia e oscilações de energia. O fonte dealimentação ininterrupta contém um sensor de energia para monitorar ofornecimento e uma bateria para fornecer energia até que um encerramentoordenado do sistema possa ser executado.

Os modelos do SAN Volume Controller usam o 2145 UPS-1U.

ON

OFF

20

ON

OFF

20

12A Max.

Cir

cu

itB

rea

ke

r

20

A

BR

AN

CH

A

12A Max.

Cir

cu

itB

rea

ke

r

20

A

BR

AN

CH

B

ON

OFF

20

ON

OFF

20

12A Max.

Cir

cu

itB

rea

ke

r

20

A

BR

AN

CH

A

12A Max.

Cir

cu

itB

rea

ke

r

20

A

BR

AN

CH

B

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

AC

DC

AC

DC

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

21

ATT

ENTI

ONCONNECT ONLY IBM SAN VOLUMECONTROLLERS TO THESE OUTLETS.SEE SAN VOLUME CONTROLLER

INSTALLATION GUIDE.

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

AC

DC

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U Filler Panel

1U !ller panel or optional SSPC server

1U Filler Panel

1U !ller panel or optional 1U monitor

SVC #8 IOGroup 3 Node B

SVC #7 IOGroup 3 Node A

SVC #6 IOGroup 2 Node B

SVC #5 IOGroup 2 Node A

SVC #4 IOGroup 1 Node B

SVC #3 IOGroup 1 Node A

SVC #2 IOGroup 0 Node B

SVC #1 IOGroup 0 Node A

8U Reserved for data wiring patch panelor !ller panels

MainInput

BackupInput

Left SideePDU

Right SideePDU s

vc00765

Figura 39. Exemplo de Cabeamento do Rack.

50 SAN Volume Controller: Guia de Resolução de Problemas

Page 69: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2145 UPS-1UUm 2145 UPS-1U é usado exclusivamente para manter dados que estão retidos naRAM dinâmica (DRAM) do SAN Volume Controller no caso de uma perdainesperada de energia externa. Esse uso difere do fonte de alimentação ininterruptatradicional que permite a operação contínua do dispositivo que ele atende quandoa energia é perdida.

Com um 2145 UPS-1U, os dados são salvos no disco interno do nó SAN VolumeController. As unidades dofonte de alimentação ininterrupta são necessárias parafornecer energia aos nós do SAN Volume Controller mesmo quando a fonte deenergia de entrada for considerada ininterrupta.

Nota: O fonte de alimentação ininterrupta mantém comunicações específicas doSAN Volume Controller contínuo com seus nós doSAN Volume Controllerconectados. Um nó do SAN Volume Controller não pode operar sem o fonte dealimentação ininterrupta. O fonte de alimentação ininterrupta deve ser usado deacordo com as diretrizes e os procedimentos documentados e não deve fornecerenergia a nenhum equipamento que não seja um nó do SAN Volume Controller.

Operação do 2145 UPS-1UCada nó do SAN Volume Controller monitora o estado operacional do fonte dealimentação ininterrupta ao qual ele está conectado.

Se o 2145 UPS-1U relata uma perda de energia de entrada, o nó do SAN VolumeControllerinterrompe todas as operações de E/S e efetua o dump do conteúdo desua RAM dinâmica (DRAM) na unidade de disco interna. Quando a energia deentrada para o 2145 UPS-1U for restaurada, o nó do SAN Volume Controller éreiniciado e restaura os conteúdos originais da DRAM a partir dos dados salvos naunidade de disco.

Um nó do SAN Volume Controller não está completamente operacional até que oestado da bateria do 2145 UPS-1U indique que ele tem carga suficiente paraalimentar o nó do SAN Volume Controller o tempo suficiente para salvar toda asua memória na unidade de disco. No caso de uma perda de energia, o 2145UPS-1U tem capacidade suficiente para oSAN Volume Controller salvar toda a suamemória no disco, pelo menos duas vezes. Para um 2145 UPS-1U totalmentecarregado, mesmo após a carga da bateria ter sido usada para alimentar o nó doSAN Volume Controller enquanto ele salva dados da RAM dinâmica (DRAM), acarga de bateria suficiente permanece de forma que o nó do SAN VolumeController possa se tornar totalmente operacional assim que a energia de entrada érestaurada.

Importante: Não encerre um 2145 UPS-1U sem primeiro encerrar o nó do SANVolume Controller que ele suporta. A integridade de dados pode ser comprometidaao pressionar o botão liga/desliga do 2145 UPS-1U quando o nó ainda estáoperando. Entretanto, no caso de uma emergência, é possível encerrarmanualmente o 2145 UPS-1U ao pressionar o botão liga/desliga do 2145 UPS-1Uquando o nó ainda está operando. As ações de serviço devem ser executadas antesque o nó possa retomar as operações normais. Se diversas unidades do fonte dealimentação ininterrupta forem encerradas antes dos nós que elas suportam, osdados podem ser corrompidos.

Conectando os 2145 UPS-1U no SAN Volume ControllerPara fornecer redundância e manutenção simultâneas, deve-se instalar os nós doSAN Volume Controller em pares.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 51

Page 70: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Para conexão com o 2145 UPS-1U, cada SAN Volume Controller de um par deveser conectado a apenas um 2145 UPS-1U.

Nota: Um sistema em cluster não pode conter mais de oito nós do SAN VolumeController. O 2145 UPS-1U deve ser conectado a uma fonte que seja tanto de faseúnica como de 200 a 240 V. O 2145 UPS-1U possui um disjuntor integrado e nãonecessita de proteção externa.

O SAN Volume Controller fornece um pacote configurável de cabos para conexãodo fonte de alimentação ininterrupta com um nó. Este cabo é usado para conectarambas as fontes de alimentação de um nó com o mesmo fonte de alimentaçãoininterrupta.

Cabo de energia dual mais cabo serial:v SAN Volume Controller 2145-CF8v SAN Volume Controller 2145-CG8

O software SAN Volume Controller determina se a voltagem de entrada para ofonte de alimentação ininterrupta está dentro do intervalo e define um intervalo dealarme de voltagem apropriado no fonte de alimentação ininterrupta. O softwarecontinua a verificar novamente a voltagem de entrada a cada poucos minutos. Seela for alterada substancialmente, mas permanecer dentro do intervalo permitido,os limites de alarme serão reajustados.

Nota: O 2145 UPS-1U é equipado com um suporte de retenção de cabo queimpede que o cabo de energia se desencaixe do painel traseiro. Veja adocumentação relacionada para obter mais informações.

2145 UPS-1U controles e indicadoresTodos os controles e indicadores para o 2145 UPS-1U estão localizados no conjuntodo painel frontal.

▌1▐ Indicador de segmento de carregamento 2▌2▐ Indicador de segmento de carregamento 1▌3▐ Indicador de alarme ou serviço▌4▐ Indicador de bateria ligada▌5▐ Indicador de sobrecarga▌6▐ Indicador de ativação▌7▐ Botão Ligar/Desligar▌8▐ Botão de teste e reconfiguração de alarme

+ -CARGA 1CARGA 21yyzvm

6

7

8

1 2 3 4 5

Figura 40. 2145 UPS-1U da montagem do painel frontal

52 SAN Volume Controller: Guia de Resolução de Problemas

Page 71: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Indicador de segmento 2 de carregamento:

O indicador de segmento 2 de carregamento no 2145 UPS-1U fica aceso (verde)quando a energia está disponível para o segmento 2 de carregamento.

Quando o indicador de segmento de carregamento 2 está verde, o 2145 UPS-1Uestá em execução normalmente e a energia está disponível para este segmento.

Indicador de segmento 1 de carregamento:

O indicador de segmento de carga 1 no 2145 UPS-1U não está sendo usadoatualmente pelo SAN Volume Controller.

Nota: Quando o 2145 UPS-1U for configurado pelo SAN Volume Controller, estesegmento de carregamento será desativado. Durante a operação normal, oindicador de segmento 1 de carregamento fica apagado. Uma etiqueta “Não Use”cobre os receptáculos.

Indicador de alarme:

Se o alarme no 2145 UPS-1U estiver piscando em vermelho, a manutenção seránecessária.

Se o alarme estiver ligado, acesse o MAP do 2145 UPS-1U para resolver oproblema.

Indicador de bateria ligada:

O indicador de bateria ligada âmbar fica aceso quando o 2145 UPS-1U está sendoalimentado pela bateria. Isso indica que a fonte de alimentação principal falhou.

Se o indicar de bateria ligada estiver aceso, acesse o2145 UPS-1U MAP pararesolver o problema.

Indicador de sobrecarga:

O indicador de sobrecarga acende quando a capacidade do 2145 UPS-1U éexcedida.

Se o indicador de sobrecarga estiver aceso, acesse MAP 5250: verificação de reparodo 2145 UPS-1U para resolver o problema.

Indicador de ativação:

O indicador de ativação é exibido quando o 2145 UPS-1U está funcionando.

Quando o indicador de ativação estiver um verde contínuo, o 2145 UPS-1U estáativo.

Botão Ligar/Desligar:

O botão ligar/desligar ativa ou desativa a energia para o 2145 UPS-1U.

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 53

Page 72: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Ligando o 2145 UPS-1U

Após conectar o 2145 UPS-1U na tomada, ele permanecerá no modo standby atéque ele seja ligado. Pressione e segure o botão ligar/desligar até que o indicadorde ligado seja iluminado (aproximadamente cinco segundos). Em algumas versõesdo 2145 UPS-1U, pode ser necessário um dispositivo com ponta, como uma chavede fenda, para pressionar o botão ligar/desligar. Um autoteste é iniciadodemorando aproximadamente 10 segundos, tempo durante o qual os indicadoressão ativados e desativados várias vezes. O 2145 UPS-1U, então, entra no modonormal.

Desligando o 2145 UPS-1U

Pressione e segure o botão ligar/desligar até que a luz de ligado seja apagada(aproximadamente cinco segundos). Em algumas versões do 2145 UPS-1U, podeser necessário um dispositivo com ponta, como uma chave de fenda, parapressionar o botão ligar/desligar. Isso coloca o 2145 UPS-1U no modo standby.Então, você deve desconectar o 2145 UPS-1U para desligar a unidade.

Atenção: Não desligue o fonte de alimentação ininterrupta antes de encerrar o nódo SAN Volume Controller ao qual ele está conectado. Sempre siga as instruçõesque são fornecidas no MAP 5350 para executar um encerramento ordenadamentede um nó do SAN Volume Controller.

Botão de teste e de reconfiguração de alarme:

Use o botão de reconfiguração de alarme e teste para iniciar o autoteste.

Para iniciar o autoteste, mantenha pressionado o botão de reconfiguração dealarme e teste por três segundos. Esse botão também reconfigura o alarme.

Conectores e Comutadores do 2145 UPS-1UO 2145 UPS-1U possui conectores externos e switches DIP.

Locais de conectores e comutadores do 2145 UPS-1U

Figura 41 mostra a localização dos conectores e comutadores no 2145 UPS-1U.

▌1▐ Conector de energia principal▌2▐ Porta de comunicação▌3▐ Comutadores DIP▌4▐ Receptáculos do segmento de carregamento 1▌5▐ Receptáculo do segmento de carregamento 2

svc00308

1 2 3 4 5

Figura 41. Conectores e Comutadores do 2145 UPS-1U

54 SAN Volume Controller: Guia de Resolução de Problemas

Page 73: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Comutadores DIP do 2145 UPS-1U

Figura 42 mostra os switches DIP, que podem ser utilizados para configurar osintervalos de voltagem de entrada e saída. Como essa função é executada pelosoftware SAN Volume Controller, os dois comutadores devem ser deixados naposição OFF.

Portas do 2145 UPS-1U não usadas

O 2145 UPS-1U está equipado com portas que não são utilizadas pelo SAN VolumeController e não foram testadas. O uso dessas portas, em conjunto com o SANVolume Controller ou qualquer outro aplicativo que pode ser utilizado com o SANVolume Controller, não é suportado. Figura 43 mostra as portas do 2145 UPS-1Uque não são usadas.

▌1▐ Porta da interface USB▌2▐ Portas de rede▌3▐ Receptáculos de segmento de carregamento

Conector de energia do2145 UPS-1U

Figura 44 mostra o conector de energia para o 2145 UPS-1U.

svc00147

LIGAR

DESLIGAR

1 2

Figura 42. Comutadores DIP do 2145 UPS-1U

Figura 43. Portas não Usadas pelo 2145 UPS-1U

Aterramento

Em tempo real

Neutro(a)

Figura 44. Conector de energia

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 55

Page 74: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Requisitos do Ambiente do Fonte de alimentação ininterruptaUm ambiente do fonte de alimentação ininterrupta requer que determinadasespecificações para o local físico do SAN Volume Controller sejam atendidas.

Ambiente do 2145 UPS-1U

O 2145 UPS-1U suporta modelos SAN Volume Controller 2145-CF8 e SAN VolumeController 2145-CG8. Outros modelos SAN Volume Controller possuem duasbaterias que evitam que elas percam o estado do sistema se a energia for perdida.

Especificações do 2145 UPS-1U

As tabelas a seguir descrevem as características físicas do 2145 UPS-1U.

2145 UPS-1U dimensões e peso

Assegure-se de que haja espaço disponível em um rack capaz de suportar o 2145UPS-1U.

Tabela 34. Espaço de rack necessário para o 2145 UPS-1U

Altura Largura Profundidade Peso máximo

44 mm(1,73 polegada)

439 mm(17,3 polegada)

579 mm(22,8 polegada)

16 kg(35,3 lb)

Nota: O pacote do 2145 UPS-1U, que inclui os trilhos de suporte, pesa 18,8 kg (41,4 lb).

Saída de calor

A unidade do 2145 UPS-1U produz a saída de calor aproximada a seguir.

Tabela 35. Saída de calor do 2145 UPS-1U

ModeloSaída de calor durante aoperação normal

Saída de calor durante aoperação da bateria

2145 UPS-1U 10 W (34 Btu por hora) 150 W (512 Btu por hora)

Definindo os FRUs SAN Volume Controller FRUsO nó SAN Volume Controller, o comutador de energia de corrente alternadaredundante, e o fonte de alimentação ininterrupta consistem cada um em um oumais field-replaceable units (FRUs).

Listagem de peçasNúmeros de peça estão disponíveis para as diferentes partes e field-replaceableunits (FRUs) do SAN Volume Controller, o comutador de energia de correntealternada redundante e a unidade do fonte de alimentação ininterrupta.

SAN Volume Controller suporta vários tipos de nós diferentes. Um rótulo na frentedo nó indica o tipo de nó do SAN Volume Controller , a revisão de hardware (seapropriada) e o número de série.

56 SAN Volume Controller: Guia de Resolução de Problemas

|||

Page 75: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Comutador de energia de corrente alternada redundantepartes

Há um único conjunto de unidade substituível em campo (FRU) para o energia ACredundante de recurso. Ele consiste no comutador e dois cabos de energia deentrada.

O comutador de energia de corrente alternada redundante é um recurso opcionalque torna os nós do SAN Volume Controller resilientes à falha de um únicocircuito de energia. O comutador de energia de corrente alternada redundante nãoé uma substituição de um fonte de alimentação ininterrupta. Você ainda deve usarum fonte de alimentação ininterrupta para cada nó.

Figura 45 mostra o comutador de energia de corrente alternada redundante.

Tabela 36 lista os números de peça para o comutador de energia de corrente

alternada redundante.

Tabela 36. Comutador de energia de corrente alternada redundante

Número de peça Unidades Descrição

31P0896 1 Conjunto de Comutador deenergia de corrente alternadaredundante

svc0029

7

Figura 45. Visualização da FRU do comutador de energia de corrente alternada redundante

Capítulo 2. Apresentando os componentes de hardware do SAN Volume Controller 57

Page 76: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

58 SAN Volume Controller: Guia de Resolução de Problemas

Page 77: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 3. Interfaces com o SAN Volume Controller Usuáriopara Manutenção do seu Sistema

O SAN Volume Controller fornece várias interfaces com o usuário para solucionarproblemas, recuperar ou manter seu sistema. As interfaces fornecem diversosconjuntos de recursos para ajudar a resolver situações encontradas.v Utilize o GUI de gerenciamento para monitorar e manter a configuração de

armazenamento que está associada aos seus sistemas em cluster.v Conclua procedimentos de serviço a partir do assistente de serviço.v Utilize a interface de linha de comandos (CLI) para gerenciar seu sistema. O

painel frontal no nó fornece uma interface de serviço alternativa.

Nota: A tela do painel frontal é substituída por uma porta técnica em algunsmodelos.

Interface do GUI de GerenciamentoO GUI de gerenciamento é uma GUI baseada no navegador para configuração egerenciamento de todos os aspectos de seu sistema. Ele fornece recursos completospara ajudar a resolução de problemas e a corrigir problemas.

Sobre Esta Tarefa

Você utiliza o GUI de gerenciamento para gerenciar e realizar o serviço em seusistema. O painel Monitoramento > Eventos fornece acesso aos problemas quedevem ser corrigidos e os procedimentos de manutenção que o conduzem peloprocesso de correção de problemas.

As informações no painel Eventos podem ser filtradas de três maneiras:

Ação Recomendada (padrão)Mostra apenas as alertas que exigem atenção e têm um procedimento decorreção associado. Os alertas estão listados em ordem de prioridade edevem ser corrigidos de forma sequencial usando os procedimentos decorreção disponíveis. Para cada problema selecionado, é possível:v Executar um procedimento de correção.v Visualizar as propriedades.

Mensagens e alertas não corrigidosExibe apenas os alertas e as mensagens que não estão corrigidos. Para cadaentrada selecionada, é possível:v Executar um procedimento de correção em qualquer alerta com um

código de erro.v Marcar um evento como corrigido.v Filtrar as entradas para mostrá-las por minutos, horas ou datas

específicos(as).v Reconfigurar o filtro de data.v Visualizar as propriedades.

© Copyright IBM Corp. 2003, 2016 59

Page 78: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Mostrar tudoExibe todos os tipos de eventos corrigidos ou não corrigidos. Para cadaentrada selecionada, é possível:v Executar um procedimento de correção em qualquer alerta com um

código de erro.v Marcar um evento como corrigido.v Filtrar as entradas para mostrá-las por minutos, horas ou datas

específicos(as).v Reconfigurar o filtro de data.v Visualizar as propriedades.

Alguns eventos requerem certos números de ocorrências em 25 horas antes deserem exibidos como não corrigidos. Se eles não atingirem esse limite em 25 horas,serão sinalizados como expirados. Eventos de monitoramento estão abaixo dolimite de união e geralmente são temporários.

Também é possível classificar eventos por tempo ou código de erro. Ao classificarpor código de erro, os eventos mais graves, aqueles com números mais baixos, sãoexibidos primeiro. É possível selecionar qualquer listado e selecionar Ações >Propriedades para visualizar detalhes sobre o evento.v Ações Recomendadas. Para cada problema selecionado, é possível:

– Executar um procedimento de correção.– Visualizar as propriedades.

v Log de eventos. Para cada entrada selecionada, é possível:– Executar um procedimento de correção.– Marcar um evento como corrigido.– Filtrar as entradas para mostrá-las por minutos, horas ou datas específicos(as).– Reconfigurar o filtro de data.– Visualizar as propriedades.

Quando Utilizar o GUI de gerenciamentoO GUI de gerenciamento é a principal ferramenta que é utilizada para realizarserviço em seu sistema.

Monitore regularmente o status do sistema utilizando o GUI de gerenciamento. Sesuspeitar de um problema, utilize o GUI de gerenciamento primeiro paradiagnosticar e resolver o problema.

Utilize as visualizações que estão disponíveis no GUI de gerenciamento paraverificar o status do sistema, os dispositivos de hardware, o armazenamento físicoe os volumes disponíveis. O painel Monitoramento > Eventos fornece acesso atodos os problemas existentes no sistema. Use o filtro Ações Recomendadas paraexibir os eventos mais importantes que precisam ser resolvidos.

Se houver um código de erro de serviço para o alerta, é possível executar umprocedimento de correção que o ajuda na resolução do problema. Essesprocedimentos de correção analisam o sistema e fornecem informações adicionaissobre o problema. Eles sugerem ações a serem realizadas e o guiam por meio dasações que automaticamente gerenciam o sistema onde necessário. Finalmente, elesverificam se o problema está resolvido.

60 SAN Volume Controller: Guia de Resolução de Problemas

Page 79: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se houver um erro relatado, utilizar sempre os procedimentos de correção dentrodo GUI de gerenciamento para resolver o problema. Sempre use os procedimentosde correção para problemas na configuração do sistema e falhas de hardware. Osprocedimentos de correção analisam o sistema para assegurar que as alteraçõesnecessárias não deixem os volumes inacessíveis aos hosts. Os procedimentos decorreção automaticamente executam mudanças na configuração que são necessáriaspara retornar o sistema a seu estado otimizado.

Acessando o GUI de gerenciamentoPara visualizar eventos, você deve acessar GUI de gerenciamento.

Sobre Esta Tarefa

É necessário usar um navegador da web suportado. Para obter uma lista denavegadores suportados, consulte o tópico “Requisitos de navegador da web paraacessar a GUI de gerenciamento”.

É possível usar o GUI de gerenciamento para gerenciar seu sistema assim quecriou um sistema em cluster.

Procedimento1. Inicie um navegador da Web suportado e aponte o navegador para o endereço

IP de gerenciamento de seu sistema.O endereço IP de gerenciamento é configurado quando sistema em cluster écriado. Até quatro endereços podem ser configurados para sua utilização. Hádois endereços para acesso IPv4 e dois endereços para acesso IPv6. Quando aconexão for bem-sucedida, você verá um painel de login.

2. Efetue logon utilizando seu nome de usuário e sua senha.3. Quando tiver efetuado logon, selecione Monitoramento > Eventos.4. Assegure-se de que o log de eventos seja filtrado com o uso de Ações

Recomendadas.5. Selecione a ação recomendada e execute o procedimento de correção.6. Continue trabalhando com os alertas na ordem sugerida, se possível.

Resultados

Depois que todos os alertas forem corrigidos, verifique o status de seu sistemapara assegurar que ele esteja operando conforme desejado.

Excluindo um nó de um sistema em cluster usando o GUI degerenciamento

Remova um nó de um sistema se o nó falhou e está sendo substituído por umnovo nó ou se o reparo que foi executado fez com que esse nó não sejareconhecido pelo sistema.

Antes de Iniciar

O cache no nó selecionado será limpo antes do nó ficar offline. Em algumascircunstâncias, como quando o sistema já está comprometido (por exemplo,quando os dois nós no grupo de E/S estão online e os volumes no grupo de E/Sestão comprometidos), o sistema irá assegurar-se de que não ocorra perda de

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 61

Page 80: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

dados como resultado da exclusão do único nó com os dados de cache. Se ocorreruma falha no outro nó no grupo de E/S, a cache será limpo antes do nó serremovido para evitar perda de dados.

Antes de excluir um nó do sistema, registre o número de série do nó, o nomeuniversal do nó (WWNN), todos os nomes das portas universais (WWPNs) e ogrupo de E/S ao qual o nó atualmente faz parte. Se o nó for novamente incluídono sistema em um momento posterior, o registro dessas informações do nó poderáevitar distorção de dados.

Atenção:

v Se você estiver removendo um único nó e o nó restante no grupo de E/S estiveronline, os dados no nó restante entrará no modo de gravação no cache e namemória principal (write-through). Os dados poderão ser expostos a um pontoúnico de falha se o nó restante falhar.

v Se os volumes já estiverem comprometidos antes da remoção de um nó, aredundância para os volumes estará comprometida. A remoção de um nó poderesultar em uma perda de acesso a dados e perda de dados.

v A remoção do último nó no sistema destrói o sistema. Antes de remover oúltimo nó no sistema, assegure-se de que deseja destruir o sistema.

v Ao remover um nó, você removerá toda a redundância do grupo de E/S. Comoresultado falhas novas ou existentes podem causar erros de E/S nos hosts.Podem ocorrer as seguintes falhas:– Erros de configuração do host– Erros de zoneamento– Erros de configuração de software de caminhos múltiplos

v Se você estiver excluindo o último nó em um grupo de E/S e houver volumesdesignados ao grupo de E/S, não será possível remover o nó do sistema se o nóestiver online. Você deverá fazer backup ou migrar todos os dados que desejasalvar antes de remover o nó. Se o nó estiver offline, será possível remover o nó.

v Ao remover o nó de configuração, a função de configuração será movida paraum nó diferente no sistema. Esse processo pode demorar pouco tempo,geralmente, menos de um minuto. O GUI de gerenciamento se reconecta com onovo nó de configuração de modo transparente.

v Se você ligar a energia para o nó removido e ainda estiver conectado à mesmamalha ou zona, ele tentará se juntar novamente ao sistema. O sistema instrui onó para remover a si mesmo do sistema e o nó se tornará um candidato parainclusão nesse sistema ou em outro.

v Se você estiver incluindo esse nó no sistema, assegure-se de incluí-lo no mesmogrupo de E/S ao qual ele era um membro anteriormente. A falha ao fazer issopode resultar na distorção de dados.

Esta tarefa supõe que você já tenha acessado o GUI de gerenciamento.

Sobre Esta Tarefa

Conclua as etapas a seguir para remover um nó de um sistema:

Procedimento1. Selecione Monitoramento > Sistema.2. Clique com o botão direito do mouse no nó a ser removido e selecione

Remover.

62 SAN Volume Controller: Guia de Resolução de Problemas

Page 81: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se o nó que você deseja remover for mostrado como Offline, o nó não estaráparticipando no sistema.Se o nó que você deseja remover for mostrado como Online, a exclusão do nópoderá resultar nos volumes dependentes também ficando offline. Verifique seo nó tem quaisquer volumes dependentes.

3. Para verificar os volumes dependentes para remover o nó, clique com o botãodireito do mouse no nó e selecione Mostrar volumes dependentes.Se quaisquer volumes forem listados, determine por que e se o acesso aosvolumes será necessário enquanto o nó é removido do sistema. Se os volumesforem designados a partir de conjuntos de armazenamentos que contenhamunidades flash localizados no nó, verifique por que o espelho de volume, se eleestiver configurado, não está sincronizado. Também pode haver volumesdependentes porque o nó do parceiro no grupo de E/S está offline. Osproblemas de malha podem também evitar o volume de comunicação com ossistemas de armazenamentos. Resolva esses problemas antes de continuar coma remoção do nó.

4. Clique em Remover.5. Clique em Sim para remover o nó. Antes de um nó ser removido, o sistema

verifica para determinar se há quaisquer volumes que dependem desse nó. Se onó que você selecionou contiver volumes nas situações a seguir, os volumesficarão offline e se tornarão indisponíveis se o nó for removido:v O nó contém o unidades flash e também a única cópia sincronizada de um

volume espelhadov O outro nó no grupo de E/S está offline

Se você selecionar um nó para remover que possua essas dependências, outropainel será exibido confirmando a remoção.

Incluindo um nó em um sistemaÉ possível incluir um nó para o sistema usando a CLI ou GUI de gerenciamento.Um nó pode ser incluído no sistema se o nó tiver falhado anteriormente e estiversendo substituído por um novo nó ou se uma ação de reparação tiver tornado o nóirreconhecível ao sistema. Ao incluir nós, verifique se eles foram incluídos empares para criar um grupo de E/S integral. Incluir um nó no sistema aumenta acapacidade de todo o sistema.

É possível usar a GUI de gerenciamento ou a interface da linha de comandos paraincluir um nó no sistema. Alguns modelos podem requerer o uso do painel frontalpara verificar se o novo nó foi incluído corretamente.

Antes de incluir um nó em um sistema, você deverá certificar-se de que ozoneamento de comutador esteja configurado de forma que o nó que está sendoincluído esteja na mesma zona que todos os outros nós no sistema. Se estiversubstituindo um nó e o comutador estiver zoneado pelo nome da porta universal(WWPN) em vez de pela porta do comutador, certifique-se de que o comutadoresteja configurado de forma que o nó que está sendo incluído esteja no mesmoVSAN ou zona.

Considerações ao incluir um nó em um sistema

Se você estiver incluindo um nó que foi usado anteriormente, dentro de um grupode E/S diferente nesse sistema ou em um sistema diferente, leve em consideraçãoque, se você incluir um nó sem alterar seu nome universal do nó (WWNN), os

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 63

Page 82: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

hosts poderão detectar o nó e usá-lo como se estivesse em seu local antigo. Essaação pode fazer com que os hosts acessem os volumes errados.v Deve-se assegurar de que o tipo de modelo do novo nó seja suportado pelo

nível de software atualmente instalado no sistema. Se o tipo de modelo não forsuportado pelo nível de software, atualize o sistema para um nível de softwareque suporte o tipo de modelo do novo nó.

v Cada nó de um grupo de E/S deve ser conectado a uma fonte de alimentaçãoininterrupta diferente.

v Se estiver incluindo um nó de volta no mesmo grupo de E/S após uma ação deserviço ter exigido que ele fosse excluído do sistema, e se o nó físico não tiversido mudado, nenhum procedimento especial será necessário para incluí-lo devolta no sistema.

v Se você estiver substituindo um nó em um sistema devido a uma falha de nóou uma atualização, deverá mudar o WWNN do novo nó para corresponder aodo nó original antes de você conectar o nó à rede Fibre Channel e incluir o nóno sistema.

v Se você estiver incluindo um nó na SAN novamente, assegure-se de que estejaincluindo o nó no mesmo grupo de E/S do qual ele foi removido. A falha aofazer isso pode resultar na distorção de dados. Você deverá usar as informaçõesque foram registradas quando o nó foi originalmente incluído no sistema. Sevocê não tiver acesso a essas informações, entre em contato com o centro desuporte para obter assistência na inclusão do nó de volta no sistema, para quenão haja distorção de dados.

v Para cada sistema de armazenamento externo, os LUNs apresentados para asportas no novo nó devem ser as mesmas que os LUNs apresentados para os nósque atualmente existem no sistema. Você deverá assegurar-se de que os LUNssejam as mesmas, antes de incluir o novo nó no sistema.

v Se você estiver criando um grupo de E/S no sistema e estiver incluindo umnovo nó, não haverá nenhum procedimento especial porque esse nó nunca foiincluído em um sistema e o WWNN para o nó não existe.

v Se você estiver criando um grupo de E/S no sistema e estiver incluindo umnovo nó que foi incluído em um sistema anteriormente, o sistema host aindapoderá ser configurado para os WWPNs do nó e o nó ainda poderá ser zoneadona malha. Como não é possível alterar o WWNN para o nó, você deveráassegurar-se de que outros componentes em sua malha estejam configuradoscorretamente. Verifique se qualquer host que foi configurado anteriormente parausar o nó foi atualizado corretamente.

v Se o nó que você está incluindo foi substituído anteriormente, para um reparoou atualização do nó, talvez você tenha usado o WWNN desse nó para o nó desubstituição. Assegure-se de que o WWNN desse nó foi atualizado de modo quevocê não possua dois nós com o mesmo WWNN conectado à sua malha.Assegure-se de que o WWNN do nó que você está incluindo não seja 00000. Sefor 00000, entre em contato com seu representante de suporte.

v O novo nó deverá estar executando um nível de software que suportacriptografia.

v Se você estiver incluindo o novo nó em um sistema com uma topologia dosistema HyperSwap ou estendida, deverá atribuir o nó para um site específico.

Considerações ao usar os drivers de dispositivo de caminhosmúltiplosv Os aplicativos nos sistemas host direcionam as operações de E/S para sistemas

de arquivos ou volumes lógicos mapeados pelo sistema operacional para oscaminhos virtuais (vpaths), que são pseudo-objetos de disco suportados pelos

64 SAN Volume Controller: Guia de Resolução de Problemas

||

Page 83: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

drivers de dispositivo de caminhos múltiplos. Os drivers de dispositivo decaminhos múltiplos mantêm uma associação entre um vpath e um volume. Essaassociação usa um identificador (UID) único para o volume e nunca é reusado.O UID permite que os drivers de dispositivo de caminhos múltiplos associem osvpaths diretamente com volumes.

v Os drivers de dispositivo de caminhos múltiplos operam em uma pilha deprotocolo que contém o disco e os drivers de dispositivo do Fibre Channelusados para comunicação com o sistema usando o protocolo SCSI sobre FibreChannel, conforme definido pelo padrão ANSI FCS. O esquema deendereçamento fornecido por esses drivers de dispositivo do SCSI e FibreChannel usa uma combinação de um número de unidade lógica (LUN) de SCSIe o nome universal do nó (WWNN) para o nó e as portas do Fibre Channel.

v Se ocorrer um erro, os procedimentos de recuperação de erro (ERPs) operam emvárias camadas da pilha de protocolo. Alguns desses ERPs fazem com que a E/Sseja reconduzida, usando os mesmos números de WWNN e LUN usadosanteriormente.

v Os drivers de dispositivos de caminhos múltiplos não verificam a associação dovolume com o vpath a cada operação de E/S que ele executa.

Após o novo nó ser zoneado e cabeado corretamente em um sistema existente, serápossível usar o comando addnode ou o assistente Incluir nó na GUI degerenciamento. Para acessar o assistente Incluir Nó, selecione Monitoramento >Sistema. Na imagem, clique no novo nó para ativar o assistente. Conclua oassistente e verifique o novo nó. Se o novo nó não for exibido na imagem, issoindica um problema de cabeamento em potencial. Verifique as informações deinstalação para assegurar-se de que seu nó foi cabeado corretamente.

Para incluir um nó para um sistema usando a interface da linha de comandos,conclua estas etapas:1. Insira este comando para verificar se o nó é detectado na malha:

svcinfo lsnodecandidate

Este exemplo mostra a saída deste comando:# svcinfo lsnodecandidateid panel_name UPS_serial_number UPS_unique_id hardware serial_number product_mtm machine_signature500507680C007B00 KD0N8AM 500507680C007B00 KD0N8AM 2145-DH8 0123-4567-89AB-CDEF

O parâmetro id exibe o WWNN para o nó. Se o nó não for detectado, verifiqueo cabeamento para o nó.

2. Insira este comando para determinar o grupo de E/S no qual o nó deve serincluído:lsiogrp

3. Registre o nome ou ID do primeiro grupo de E/S que possui uma contagem denós igual a zero (0). Você precisará do nome ou ID na próxima etapa. Nota:Você precisará executar essa etapa somente para o primeiro nó que for incluído.O segundo nó do par usa o mesmo número de grupo de E/S.

4. Insira este comando para incluir o nó no sistema:addnode -wwnodename WWNN -iogrp iogrp_name -namenew_name_arg -site site_name

em que WWNN é o WWNN do nó, iogrp_name é o nome do grupo de E/S noqual você deseja incluir o nó e new_name_arg é o nome que deseja designar aonó. Se você não especificar um novo nome do nó, um nome padrão serádesignado; no entanto, é recomendado que você especifique um nome

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 65

Page 84: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

significativo. O site_name especifica o nome do local do site do novo nó. Esteparâmetro somente será requerido se a topologia for um sistema estendido ouHyperSwap.

Nota: A inclusão do nó pode levar uma quantidade de tempo considerável.5. Registre estas informações para referência futura:v Número de série.v Nome universal do nó.v Todos os nomes de porta mundiais.v O nome ou ID do grupo de E/S

Para incluir um nó do SAN Volume Controller 2145-CG8 ou SAN VolumeController 2145-CF8 em um sistema usando a interface da linha de comandos,conclua estas etapas:1. Use o painel frontal do nó, registre o WWNN. O painel frontal mostra apenas

os últimos 5 dígitos do WWNN.2. Insira este comando para verificar se o nó é detectado na malha:

svcinfo lsnodecandidate

Este exemplo mostra a saída deste comando:# svcinfo lsnodecandidateid panel_name UPS_serial_number UPS_unique_id hardware serial_number product_mtm machine_signature500507680100E85F 168167 UPS_Fake_SN 100000000000E85F CG8 78G0123 2145-DH8 0123-4567-89AB-CDEFsvcinfo lsnodecandidate

O parâmetro id exibe o WWNN para o nó. Assegure que os últimos 5 dígitosque são exibidos correspondam ao WWNN no painel frontal. Se o nó não fordetectado, verifique o cabeamento para o nó.

3. Insira este comando para determinar o grupo de E/S no qual o nó deve serincluído:lsiogrp

4. Registre o nome ou ID do primeiro grupo de E/S que possui uma contagem denós igual a zero (0). Você precisará do ID para a próxima etapa. Nota: Vocêprecisará executar essa etapa somente para o primeiro nó que for incluído. Osegundo nó do par usa o mesmo número de grupo de E/S.

5. Insira este comando para incluir o nó no sistema:addnode -wwnodename WWNN -iogrp iogrp_name -name newnodename -site newsitename

Em que WWNN é o WWNN do nó, iogrp_name é o nome ou ID do grupo de E/Sno qual você deseja incluir o nó e newnodename é o nome que você desejadesignar ao nó. Se você não especificar um novo nome do nó, um nome padrãoserá designado; no entanto, é recomendado que você especifique um nomesignificativo. O newsitename especifica o nome do local do site do novo nó. Esteparâmetro somente será requerido se a topologia for um sistema estendido ouHyperSwap.

Nota: A inclusão do nó pode levar uma quantidade de tempo considerável.6. Registre estas informações para referência futura:v Número de série.v Nome universal do nó.v Todos os nomes de porta mundiais.v O nome ou ID do grupo de E/S

66 SAN Volume Controller: Guia de Resolução de Problemas

Page 85: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se um nó mostrar o erro de nó 578 ou 690, o nó estará no estado de serviço.Conclua as etapas a seguir a partir do painel frontal para sair do estado de serviço:1. Pressione e solte o botão para cima ou para baixo até que a opção Ações? seja

exibida.2. Pressione o botão Selecionar.3. Pressione e solte o botão Para Cima ou Para Baixo até que a opção Sair do

Serviço? seja exibida.4. Pressione o botão Selecionar.5. Pressione e solte o botão Esquerda ou Direita até que a opção Confirmar

Saída? seja exibida.6. Pressione o botão Selecionar.

Interface do Assistente de ServiçoA interface do assistente de serviço é uma GUI baseada em navegador usada pararealizar serviços nos nós.

Quando Utilizar o Assistente de ServiçoO principal uso do assistente de serviço é quando um nó está em um estado deserviço. O nó não pode ficar ativo como parte de um sistema enquanto ele estiverno estado de serviço.

Atenção: Conclua as ações de serviço nos nós somente quando orientado a fazerisso pelos procedimentos de correção. Se forem utilizadas inadequadamente, asações de serviço disponíveis por meio do assistente de serviço podem causar aperda de acesso aos dados ou até mesmo perda de dados.

O nó pode estar em um estado de serviço porque ele tem um problema dehardware, tem dados corrompidos ou perdeu seus dados de configuração.

Use o assistente de serviço nas seguintes situações:v Quando não for possível acessar o sistema a partir do GUI de gerenciamento e

não for possível acessar o SAN Volume Controller para executar as açõesrecomendadas

v Quando a ação recomendada direcionar você para o uso do assistente de serviço.

O GUI de gerenciamento funciona apenas quando houver um sistema em clusteronline. Utilize o assistente de serviço se não puder criar um sistema em cluster.

O assistente de serviço fornece sumarizações detalhadas de status e de erro e acapacidade de modificar o nome universal do nó (WWNN) para cada nó.

Também é possível concluir as ações relacionadas ao serviço a seguir:v Coletar logs para criar e fazer o download de um pacote de arquivos a serem

enviados à equipe de suporte.v Remover os dados para o sistema de um nó.v Recuperar um sistema se ele falhar.v Instalar um pacote de software a partir do site de suporte ou resgate o software

a partir de outro nó.v Atualizar de software em nós manualmente versus concluir um procedimento

padrão de atualização.v Alterar o endereço IP do serviço designado à porta Ethernet 1 para o nó atual.

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 67

Page 86: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Instalar uma chave SSH temporária se uma chave não estiver instalada e oacesso à CLI for necessário.

v Reiniciar os serviços utilizados pelo sistema.

Acessando o Assistente de ServiçoO assistente de serviço é um aplicativo da web que ajuda a solucionar problemasem um nó. O assistente de serviço pode ser acessado através de um endereço IP deserviço. No SAN Volume Controller 2145-DH8, é possível conectar-se ao assistentede serviço usando a porta técnica.

Sobre Esta Tarefa

Você ainda deve utilizar um navegador da Web suportado. Para obter uma lista denavegadores suportados, consulte o tópico Requisitos de navegador da web paraacessar a GUI de gerenciamento.

Procedimento

Para iniciar o aplicativo, conclua as etapas a seguir.1. Inicie um navegador da web suportado e aponte o navegador da web para

serviceaddress/service para o nó em que deseja trabalhar.2. Efetue logon no assistente de serviço utilizando a senha de superusuário.

Se você não souber a senha atual do superusuário, tente descobrir. Se você nãopuder descobrir qual é a senha, reconfigure-a.

Resultados

Conclua as ações do assistente de serviço no nó correto.

Interface da linha de comandosUse a interface da linha de comandos (CLI) para gerenciar um sistema comcomandos de tarefa e comandos de informações.

Para obter uma descrição completa dos comandos e de como iniciar uma sessão delinha de comandos de shell seguro, consulte a seção “Interface da linha decomandos” do Centro de Informações do SAN Volume Controller.

Quando usar a interface da linha de comandosA interface da linha de comandos destina-se ao uso por usuários avançados queestão confiantes em usar uma interface da linha de comandos.

Quase toda a flexibilidade oferecida pela CLI está disponível no GUI degerenciamento. Todavia, a CLI não fornece os procedimentos de correçãodisponíveis no GUI de gerenciamento. Assim, utilize os procedimentos de correçãono GUI de gerenciamento para resolver os problemas. Utilize a CLI quando exigiruma definição de configuração que está indisponível no GUI de gerenciamento.

Você também pode achar útil criar scripts de comando que usem comandos dainterface da linha de comandos para monitorar determinadas condições ou paraautomatizar alterações de configuração que você faz regularmente.

68 SAN Volume Controller: Guia de Resolução de Problemas

Page 87: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Acessando a interface da linha de comandos do sistemaSiga as etapas descritas na seção Interface da linha de comandos do KnowledgeCenter do SAN Volume Controller para inicializar e usar uma sessão da CLI.

Interface da Linha de Comandos de ServiçoUse a interface da linha de comandos (CLI) para gerenciar um nó em um gabinetede controle usando os comandos de tarefa e os comandos de informações.

Nota: A interface da linha de comandos de serviço também pode ser acessadausando a porta técnica.

Para obter uma descrição completa dos comandos e como iniciar uma sessão dalinha de comandos SSH, consulte Interface da linha de comandos.

Quando Utilizar a CLI de ServiçoA CLI de serviço é destinada à utilização por usuários avançados que confiam nouso de uma interface da linha de comandos.

Para acessar um nó diretamente, é normalmente mais fácil utilizar o assistente deserviço com sua interface gráfica e recursos amplos de ajuda.

Acessando a CLI de serviçoPara inicializar e usar uma sessão de CLI, Revise as informações nos tópicosreferenciados na seção Informações relacionadas seções abaixo.

unidade flash USBUse um unidade flash USB para ajudar a realizar manutenção em um nó do SANVolume Controller.

Quando uma unidade flash USB é inserida em uma das portas USB em um nóSAN Volume Controller, o software procura um arquivo de controle na unidadeflash USB e executa o comando que é especificado no arquivo. Quando o comandofor concluído, os resultados do comando e as informações de status do nó sãogravados na unidade flash USB.

Quando Utilizar o unidade flash USBA unidade flash USB pode ser usada para funções do serviço.

O uso da unidade flash USB é necessário nas situações a seguir:v Quando não for possível se conectar a uma caixa do nó em um gabinete de

controle usando o assistente de serviço e você desejar ver o status do nó.v Quando você não souber ou não puder usar o endereço IP de serviço para a

caixa do nó no gabinete de controle e deve configurar o endereço.v Quando você tiver esquecido a senha de superusuário e tiver que reconfigurar a

senha.

Usando uma unidade flash USBUse qualquer unidade flash USB que esteja formatada com um sistema de arquivosFAT32 em sua primeira partição.

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 69

Page 88: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Sobre Esta Tarefa

Quando um unidade flash USB é conectado a uma caixa do nó, o código da caixadonó procura um arquivo de texto nomeado satask.txt no diretório-raiz. Se ocódigo localizar o arquivo, ele tentará executar um comando especificado noarquivo. Quando o comando é concluído, um arquivo chamadosatask_result.html é gravado no diretório-raiz do unidade flash USB. Se essearquivo não existir, ele será criado. Se ele existir, os dados serão inseridos no iníciodo arquivo. O arquivo contém os detalhes e os resultados do comando executado eo status e as informações de configuração da caixa do nó. O status e asinformações de configuração correspondem ao detalhe mostrado nos painéis dapágina inicial do assistente de serviço.

O diodo emissor de luz (LED) de falha na caixa do nópisca quando a ação deserviço USB está sendo concluída. Quando o LED de falha para de piscar, é seguroremover a unidade flash USB.

Resultados

O unidade flash USB pode, então, ser conectado a uma estação de trabalho e oarquivo satask_result.html pode ser visualizado em um navegador da web.

Para proteger contra a execução acidental do mesmo comando novamente, oarquivo satask.txt é excluído após ser lido.

Se nenhum arquivo satask.txt for localizado na unidade flash USB, o arquivo deresultado ainda será criado, se necessário, e os dados de status e de configuraçãoserão gravados nele.

Comandos satask.txtSe você estiver criando o arquivo de comando satask.txt usando um editor detexto, o arquivo deverá conter um único comando em uma única linha no arquivo.

Os comandos usados são iguais aos comandos da CLI de serviço, exceto ondeobservado. Nem todos os comandos da CLI de serviço podem ser executados apartir da unidade flash USB. Os comandos satask.txt sempre são executados nonó ao qual a unidade flash USB está conectada.

Comando de reconfiguração de endereço IP de serviço e de senha desuperusuário:

Use este comando para obter acesso de assistente de serviço a uma caixa do nómesmo se o estado atual da caixa do nó é desconhecido. O acesso físico à caixa donó é requerido e é usado para autenticar a ação.

Sintaxe

►► satask chserviceip -serviceip ipv4-gw ipv4 -mask ipv4 -resetpassword

►◄

►► satask chserviceip -serviceip_6 ipv6-gw_6 ipv6 -prefix_6 int

►-resetpassword

►◄

70 SAN Volume Controller: Guia de Resolução de Problemas

Page 89: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

►► satask chserviceip -default-resetpassword

►◄

Paramêtros

-serviceip ipv4O endereço IPv4 para o assistente de serviço.

-gw ipv4O gateway IPv4 para o assistente de serviço.

-mask ipv4A sub-rede IPv4 para o assistente de serviço.

-serviceip_6 ipv6O endereço IPv6 para o assistente de serviço.

-gw_6 ipv6O gateway IPv6 para o assistente de serviço.

-prefix_6 intO prefixo IPv6 para o assistente de serviço.

-resetpasswordConfigura a senha do assistente de serviço para o valor padrão.

Descrição

Este comando reconfigura o endereço IP do assistente de serviço para o valorpadrão. Se a caixa do nó estiver ativa em um sistema, a senha de superusuáriopara o sistema será reconfigurada; caso contrário, a senha de superusuário seráreconfigurada na caixa do nó.

Se a caixa do nó se tornar ativa em um sistema, a senha de superusuário seráreconfigurada para àquela do sistema. É possível configurar o sistema paradesativar a reconfiguração da senha de superusuário. Se essa função fordesativada, essa ação falhará.

Essa ação chama o comando satask chserviceip e o comando sataskresetpassword.

Comando de reconfiguração de senha do assistente de serviço:

Use esse comando quando você não puder efetuar logon no sistema, porqueesqueceu a senha de superusuário e deseja reconfigurá-la.

Sintaxe

►► satask resetpassword ►◄

Paramêtros

Nenhuma.

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 71

Page 90: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Descrição

Esse comando reconfigura a senha do assistente de serviço para o valor padrãopassw0rd. Se a caixa do nó estiver ativa em um sistema, a senha de superusuáriopara o sistema será reconfigurada; caso contrário, a senha de superusuário seráreconfigurada na caixa do nó.

Se a caixa do nó se tornar ativa em um sistema, a senha de superusuário seráreconfigurada para àquela do sistema. É possível configurar o sistema paradesativar a reconfiguração da senha de superusuário. Se essa função fordesativada, a ação falhará.

Esse comando chama o comando satask resetpassword.

Comando snap:

Use o comando snap para coletar informações de diagnóstico a partir da caixa donó e gravar a saída em um unidade flash USB.

Sintaxe

►► satask snap-dump -noimm panel_name

►◄

Paramêtros

-dump(Opcional) Indica o arquivo de dump mais recente na saída.

-noimm(Opcional) Indica se o arquivo /dumps/imm.ffdc não deve ser incluído na saída.

panel_name(Opcional) Indica o nó no qual executar o comando snap.

Descrição

Esse comando move um arquivo de snap para uma unidade flash USB.

Esse comando chama o comando satask snap.

Se coletado, o arquivo IMM FFDC estará presente no archive snap em/dumps/imm.ffdc.<node.dumpname>.<date>.<time>.tgz. O sistema aguarda até cincominutos para que o IMM gere seu FFDC. O status do IMM FFDC está localizadono archive snap em /dumps/imm.ffdc.log. Esses dois arquivos não são deixados nonó.

Um exemplo de chamadasatask snap -dump 111584

A saída resultante:Nenhum feedback

72 SAN Volume Controller: Guia de Resolução de Problemas

Page 91: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Comando de instalação de software:

Use este comando para instalar um pacote específico do atualização na caixa donó.

Sintaxe

►► satask installsoftware -file filename-ignore-pacedccu

►◄

Paramêtros

-file filename(Obrigatório) O filename designa o nome do pacote de atualização.

-ignore | -pacedccu(Opcional) Substitui a verificação de pré-requisito e força a instalação dopacote de atualização.

Descrição

Este comando copia o arquivo do unidade flash USB no diretório atualização nacaixa do nó e, então instala o pacote do atualização.

Esse comando chama o comando satask installsoftware.

Comando de criação de sistema:

Use esse comando para criar um sistema de armazenamento.

Sintaxe

►► satask mkcluster -clusterip ipv4

-gw ipv4 -mask ipv4 -name cluster_name

►◄

►► satask mkcluster -clusterip_6 ipv6

-gw_6 ipv6 -prefix_6 int -name cluster_name

►◄

Paramêtros

-clusterip ipv4(Opcional) O endereço IPv4 para a porta Ethernet 1 no sistema.

-gw ipv4(Opcional) O gateway IPv4 para a porta Ethernet 1 no sistema.

-mask ipv4(Opcional) A sub-rede IPv4 para a porta Ethernet 1 no sistema.

-clusterip_6 ipv6(Opcional) O endereço IPv6 para a porta Ethernet 1 no sistema.

-gw_6 ipv6(Opcional) O gateway IPv6 para a porta Ethernet 1 no sistema.

-prefix_6 int(Opcional) O prefixo IPv6 para a porta Ethernet 1 no sistema.

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 73

Page 92: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

-name cluster_name(Opcional) O nome do novo sistema.

Descrição

Esse comando cria um sistema de armazenamento.

Esse comando chama o comando satask mkcluster.

Alterar o endereço IP do sistema:

Use esse comando para alterar o endereço IP do sistema do sistema dearmazenamento.

É melhor usar a ferramenta de inicialização para criar esse comando no satask.txtjunto com o arquivo clitask.txt associado que altera os endereços IP degerenciamento de módulos de arquivo.

Sintaxe

►► satask setsystemip -systemip ipv4 -gw ipv4 -mask ipv4 -consoleip ipv4 ►◄

Paramêtros

-systemipO endereço IPv4 para a porta Ethernet 1 no sistema.

-gwO gateway IPv4 para a porta Ethernet 1 no sistema.

-maskA sub-rede IPv4 para a porta Ethernet 1 no sistema.

-consolipO endereço IPv4 de gerenciamento do sistema SAN Volume Controller.

Descrição

Esse comando é suportado somente no arquivo satask.txt em uma unidade flashUSB.

Ele chama o comando svctask chsystemip se a unidade flash USB é inserida nacaixa do nó de configuração. Caso contrário, ele pisca o LED de identificaçãoâmbar intermitente da caixa do nó que é o nó de configuração.

Se o LED de identificação âmbar para uma caixa do nó diferente começar a piscarintermitente, mova a unidade flash USB para essa caixa do nó porque ele é o nó deconfiguração.

Quando o LED âmbar é desligado, é possível mover a unidade flash USB para umdos módulos de arquivo para que ele use o arquivo clitask.txt para mudar osendereços IP de gerenciamento do módulo de arquivo.

Deixe a unidade flash USB no módulo de arquivo por, pelo menos, 2 minutosantes de removê-la. Use uma estação de trabalho para verificar os arquivos deresultado clitask_results.txt e satask.txt na unidade flash USB.

74 SAN Volume Controller: Guia de Resolução de Problemas

Page 93: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se a mudança de endereço IP foi bem-sucedida, deve-se executar o comandostartmgtsrv -r para reiniciar o serviço de gerenciamento para que ele não continueexecutando comandos ssh no endereço IP do sistema antigo do sistema dearmazenamento de volume.

Por exemplo, em uma estação de trabalho Linux com acesso à rede para o novoendereço IP de gerenciamento:satask setsystemip -systemip 123.123.123.20 -gw 123.123.123.1 -mask 255.255.255.0-consoleip 123.123.123.10

Agora, é possível acessar a GUI de gerenciamento, que pode ser usada para mudarqualquer outro endereço IP que precisa ser mudado.

O texto a seguir é um exemplo do que pode estar no arquivo clitask.txt:chnwmgt --serviceip1 123.123.123.11 --serviceip2 123.123.123.12--mgtip 123.123.123.10 --gateway 123.123.123.1 --netmask 255.255.255.0 --forcechstoragesystem --ip1 123.123.123.20

O texto a seguir é um exemplo do que pode estar no arquivo satask.txt:satask setsystemip -systemip 123.123.123.20 -gw 123.123.123.1 -mask 255.255.255.0-consoleip 123.123.123.10

Comando de status da consulta:

Use este comando para determinar o estado de serviço atual da caixa do nó.

Sintaxe

►► sainfo getstatus ►◄

Paramêtros

Nenhum.

Descrição

Este comando grava a saída de cada caixa do nó no unidade flash USB.

Esse comando chama o comando sainfo lsservicenodes, o comando sainfolsservicestatus e o comando sainfo lsservicerecommendation.

Porta técnica para acesso do nóUma porta técnica está disponível na parte traseira do SAN Volume Controller2145-DH8 para usar uma conexão direta para suporte de instalação e reparo.

Consulte o “Portas do SAN Volume Controller 2145-DH8 Usadas DuranteProcedimentos de Serviços” na página 28.

As informações sobre como determinar qual porta usar como a porta técnicapodem ser localizadas em Porta técnica.

A porta técnica substitui o monitor do painel frontal e os botões de navegação emmodelos anteriores dos nós SAN Volume Controller. A porta técnica fornece acessodireto para a GUI do assistente de serviço e a interface da linha de comandos(CLI).

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 75

Page 94: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A porta técnica pode ser usada conectando diretamente um computador que tenhaum software de navegação da web e esteja configurado para Protocolo deConfiguração de Host Dinâmico (DHCP) por meio de um cabo Ethernet padrão de1 Gbps.

Se o nó possuir o estado candidato quando o navegador da web for aberto, aferramenta de inicialização será exibida. Caso contrário, a interface do assistente deserviço será exibida.

Importante: Não use a ferramenta de inicialização em um nó, se qualquer outronó no sistema já estiver ativo. Por exemplo, um LED de status do nó é sólido emqualquer nó do sistema.

Para acessar o assistente de serviço por meio da porta técnica quando o status donó for candidato, mude o endereço da página da web a partir de:https:\\service\service\

para o endereço a seguir:https:\\service\service\node\home.action

Como alternativa, recarregue a página da web depois de alterar o status do nópara o serviço. Por exemplo, usando o comando da CLI do serviço a seguir:satask startservice

Consulte as informações a seguir sobre como obter acesso à CLI por meio da portatécnica. Para obter outras formas de acessar a CLI, consulte Capítulo 3, “Interfacescom o SAN Volume Controller Usuário para Manutenção do seu Sistema”, napágina 59.

Para usar a porta técnica, é preciso estar próximo ao nó. A porta técnica nãofuncionará se estiver conectada a um comutador de Ethernet.

Se você tiver o software Secure Shell (SSH) no computador que está conectadodiretamente à porta técnica, poderá usá-lo para acessar a CLI como superusuárioem 192.168.0.1. A senha padrão de superusuário é passw0rd.

Nota: Quando seu computador pessoal for configurado com DHCP, a porta dotécnica usará DHCP para reconfigurar serviços de rede em seu computadorpessoal. O software em seu computador pessoal que estava usando esses serviçospoderá ter problemas de rede enquanto estiver conectado à porta do técnica. Porexemplo, selecionar um link em uma página da web que foi carregada antes devocê conectar-se à porta técnica pode resultar em uma mensagem de erro.

Interface do painel frontalO painel frontal em cada nó possui uma exibição pequena e cinco botões decontrole. Esse painel fornece acesso às informações de status do sistema e do nó eum meio de executar determinadas ações de recuperação e configuração dosistema. Para obter uma descrição detalhada de como usar o painel frontal,consulte Capítulo 6, “Usando o painel frontal do SAN Volume Controller”, napágina 95.

76 SAN Volume Controller: Guia de Resolução de Problemas

Page 95: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Quando usar o painel frontal

Nota: O SAN Volume Controller 2145-DH8 não possui uma exibição de painelfrontal, navegação e botões de seleção. Nesses sistemas, use a porta técnica paraacessar a interface do assistente de serviço.

Use o painel frontal quando você estiver fisicamente próximo ao sistema e forincapaz de acessar uma das interfaces do sistema.

Capítulo 3. Interfaces com o SAN Volume Controller Usuário para Manutenção do seu Sistema 77

Page 96: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

78 SAN Volume Controller: Guia de Resolução de Problemas

Page 97: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 4. Executando ações de recuperação usando a CLIdo SAN Volume Controller

A interface da linha de comandos (CLI) do SAN Volume Controller é uma coletade comandos que você pode usar para gerenciar clusters do SAN VolumeController. Veja a documentação da interface de linha de comandos para osdetalhes específicos sobre os comandos fornecidos aqui.

Validando e reparando cópias de volume espelhado usando a CLIÉ possível usar o comando repairvdiskcopy a partir da interface da linha decomandos (CLI) para validar e reparar cópias de volume espelhado.

Atenção: Execute o comando repairvdiskcopy somente se todas as cópias devolume estiverem sincronizadas.

Ao emitir o comando repairvdiskcopy, use apenas um dos parâmetros -validate,-medium ou -resync. Você deve também especificar o nome ou ID do volume a servalidado e reparado, como a última entrada na linha de comandos. Após a emissãodo comando, nenhuma saída é exibida.

-validateUse esse parâmetro se você desejar somente verificar se as cópias de volumeespelhado são idênticas. Se alguma diferença é localizada, o comando para eregistra um erro, que inclui o endereço de bloco lógico (LBA) e o comprimentoda primeira diferença. É possível usar esse parâmetro, iniciando em um LBAdiferente a cada vez, para contar o número de diferenças em um volume.

-mediumUse esse parâmetro para converter os setores em todas as cópias de volumescujos conteúdos são diferentes nos erros de mídia virtual. Após a conclusão, ocomando registra um erro, que indica o número de diferenças encontradas, onúmero das que foram convertidas em erros de mídia e o número das que nãoforam convertidas. Use essa opção se não tiver certeza de quais são os dadoscorretos, e não desejar que nenhuma versão incorreta dos dados seja usada.

-resyncUse esse parâmetro para sobrescrever o conteúdo da cópia de volume primárioespecificada para a outra cópia de volume. O comando corrige quaisquersetores diferentes, copiando os setores da cópia primária para as cópias queestão sendo comparadas. Após a conclusão, o processo do comando registraum erro, que indica o número de diferenças que foram corrigidas. Use essaação se você tiver certeza de que os dados da cópia de volume primário estãocorretos ou que os aplicativos de host podem manipular os dados incorretos.

-startlba lbaOpcionalmente, use esse parâmetro para especifica o Endereço de Bloco Lógico(LBA) a partir do qual iniciar a validação e o reparo. Se, anteriormente, vocêusou o parâmetro validate, foi registrado um erro com o LBA no qual aprimeira diferença, se houve alguma, foi localizada. Emita novamente ocomando repairvdiskcopy com esse LBA para evitar o reprocessamento dossetores iniciais que foram comparados como idênticos. Continue a emitirnovamente o comando repairvdiskcopy usando esse parâmetro para listartodas as diferenças.

© Copyright IBM Corp. 2003, 2016 79

Page 98: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Emita o comando a seguir para validar e, se necessário, reparar as cópiasespelhadas do volume especificado automaticamente:repairvdiskcopy -resync -startlba 20 vdisk8

Notas:

1. Somente um comando repairvdiskcopy pode ser executado em um volume porvez.

2. Após o início do comando repairvdiskcopy, não é possível usar o comandopara parar o processamento.

3. A cópia primária de um volume espelhado não pode ser alterada enquanto ocomando repairvdiskcopy -resync estiver em execução.

4. Se houver apenas uma cópia espelhada, o comando retornará imediatamentecom um erro.

5. Se a cópia que está sendo comparada ficar off-line, o comando seráinterrompido com um erro. O comando não continua automaticamente depoisque a cópia fica on-line novamente.

6. Nos casos em que uma cópia é legível mas a outra cópia tem um erro de mídia,o processo do comando automaticamente tenta corrigir o erro de mídia,gravando os dados lidos da outra cópia.

7. Se nenhum setor diferente for localizado durante o processamento derepairvdiskcopy, será registrado um erro informativo ao final do processo.

Verificando o progresso da validação e do reparo das cópias devolumes usando a CLI

Use o comando lsrepairvdiskcopyprogress para exibir o progresso da validação edos reparos do volume espelhado. É possível especificar uma cópia de volumeusando o parâmetro -copy id. Para exibir os volumes que possuem duas ou maiscópias com uma tarefa ativa, especifique o comando sem parâmetros; não épossível ter somente uma cópia de volume com uma tarefa ativa.

Para verificar o progresso da validação e do reparo de volumes espelhados, emitao comando a seguir:lsrepairvdiskcopyprogress –delim :

O exemplo a seguir mostra como a saída do comando é exibida:

vdisk_id:vdisk_name:copy id:task:progress:estimated_completion_time0:vdisk0:0:medium:50:0703011200000:vdisk0:1:medium:50:070301120000

Reparando um volume thin-provisioned usando a CLIÉ possível usar o comando repairsevdiskcopy a partir da interface da linha decomandos para reparar os metadados em um volume thin-provisioned.

O comando repairsevdiskcopy automaticamente detecta e repara metadadosdanificados. O comando mantém o volume off-line durante o reparo, mas não evitaque o disco seja movido entre os grupos de E/S.

Se uma operação de reparo for concluída com sucesso e o volume estavaanteriormente off-line porque os metadados estavam corrompidos, o comandocolocará o volume novamente on-line. O único limite no número de operações dereparo simultâneas é o número de cópias de volume na configuração.

80 SAN Volume Controller: Guia de Resolução de Problemas

Page 99: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Ao emitir o comando repairsevdiskcopy, deve-se especificar o nome ou ID dovolume a ser reparado como a última entrada na linha de comandos. Depois deiniciada, a operação de reparo não pode ser pausada ou cancelada; o reparo sópode ser finalizado com a exclusão da cópia.

Atenção: Use esse comando somente para reparar um volume thin-provisionedque tenha relatado metadados corrompidos.

Emita o comando a seguir para reparar os metadados em um volumethin-provisioned:repairsevdiskcopy vdisk8

Após a emissão do comando, nenhuma saída é exibida.

Notas:

1. Como o volume fica off-line para o host, qualquer E/S enviada para o volumedurante o reparo falhará.

2. Quando a operação de reparo é concluída com êxito, o erro de metadadoscorrompidos é marcado como corrigido.

3. Se a operação de reparo falhar, o volume será mantido off-line e um erro seráregistrado.

Verificando o progresso do reparo de um volumethin-provisioned usando a CLI

Emita o comando lsrepairsevdiskcopyprogress para listar o progresso do reparopara cópias de volumes com pouco fornecimento do volume especificado. Se vocênão especificar um volume, o comando listará o progresso do reparo para todas ascópias thin-provisioned no sistema.

Nota: Execute esse comando somente depois de executar o comandorepairsevdiskcopy, que deve-se executar somente conforme requerido pelosprocedimentos de correção recomendados por sua equipe de suporte.

Recuperando volumes off-line usando a CLI (interface da linha decomandos)

Se um nó ou um grupo de E/S falhar, é possível usar a interface da linha decomandos (CLI) para recuperar os volumes off-line.

Sobre Esta Tarefa

Se perdeu os dois nós em um grupo de E/S, você perderá o acesso a todos osvolumes que estão associados ao grupo de E/S. Para recuperar o acesso aosvolumes, você deve executar um dos seguintes procedimentos ... Dependendo dotipo de falha, é possível que você tenha perdido dados que estavam armazenadosem cache para esses volumes e os volumes agora estejam off-line.

Cenário de perda de dados 1

Um nó de um grupo de E/S falhou e o failover foi iniciado no segundo nó.Durante o processo de failover, o segundo nó no grupo de E/S falha antes que osdados no cache de gravação sejam esvaziados para o backend. O primeiro nó éreparado com êxito, mas seus dados protegidos não são da versão mais recente,que está confirmada no armazenamento de dados; portanto, não podem ser

Capítulo 4. Executando ações de recuperação usando a CLI do SAN Volume Controller 81

|

Page 100: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

usados. O segundo nó é reparado ou substituído, mas perdeu seus dadosprotegidos, portanto, o nó tem nenhuma maneira de reconhecer que é parte dosistema.

Conclua as etapas a seguir para recuperar um volume off-line quando um nópossuir dados reforçados de nível inferior e o outro nó tiver perdido os dadosreforçados.

Procedimento1. Recupere o nó e inclua-o de volta no sistema.2. Exclua todos os mapeamentos IBM FlashCopy e relacionamentos de Metro

Mirror ou Global Mirror que utilizem os volumes off-line.3. Execute o comando recovervdisk, recovervdiskbyiogrp ou

recovervdiskbysystem.4. Recrie todos os mapeamentos FlashCopy e relacionamentos de Metro Mirror ou

Global Mirror que utilizem os volumes.

Exemplo

Cenário de perda de dados 2

Ambos os nós do grupo de E/S falharam e foram reparados. Os nós perderamseus dados protegidos e, portanto, não podem ser reconhecidos como parte dosistema.

Conclua as etapas a seguir para recuperar um volume off-line quando os dois nóstiverem perdido seus dados reforçados e não puderem ser reconhecidos pelosistema.1. Exclua todos os mapeamentos FlashCopy e relacionamentos de Metro Mirror

ou Global Mirror que utilizem os volumes off-line.2. Execute o comando recovervdisk, recovervdiskbyiogrp ou

recovervdiskbysystem.3. Recrie todos os mapeamentos FlashCopy e relacionamentos de Metro Mirror ou

Global Mirror que utilizem os volumes.

82 SAN Volume Controller: Guia de Resolução de Problemas

Page 101: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 5. Visualizando os dados vitais do produto

Os dados vitais do produto (VPD) são informações que registram exclusivamentecada elemento no SAN Volume Controller. Os dados são atualizadosautomaticamente pelo sistema quando a configuração é alterada.

Os VPD listam os tipos de informações a seguir:v Valores relacionados ao sistema, tais como a versão de software, espaço nos

conjuntos de armazenamento e espaço alocado para volumes.v Valores relacionados ao nó que incluem o hardware específico que está instalado

em cada nó. Os exemplos incluem o número de peça da FRU para a placa-mãe eo nível de firmware do BIOS que está instalado. O VPD do nó é mantido pelosistema, o que torna possível obter a maior parte dos VPD para os nós que estãodesligados.

Usando diferentes conjuntos de comandos, é possível visualizar o VPD do sistemae o VPD do nó. Também é possível visualizar os VPD através do GUI degerenciamento.

Download dos dados vitais do produto usando o GUI degerenciamento

É possível o download dos dados vitais do produto para um nó do GUI degerenciamento.

Procedimento1. Na GUI de gerenciamento, selecione Monitoramento > Sistema.2. No gráfico dinâmico do sistema, selecione o nó e clique no ícone à direita do

menu Ações para fazer download das informações VPD.

Exibindo os dados vitais do produto usando a CLIÉ possível usar a interface da linha de comandos (CLI) para exibir o sistema SANVolume Controller ou dados vitais do produto (VPD) do nó.

Emita os comandos da CLI a seguir para exibir os VPD:sainfo lsservicestatuslsnodehwlsnodevpd nodenamelssystem system_namelssystemiplsdrive

Exibindo as propriedades de nó usando a CLIÉ possível usar a interface da linha de comandos (CLI) para exibir propriedades donó.

Sobre Esta Tarefa

Para exibir as propriedades do nó:

© Copyright IBM Corp. 2003, 2016 83

Page 102: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Procedimento1. Use o comando lsnode da CLI para exibir uma lista concisa de nós no sistema

em cluster.Emita este comando da CLI para listar os nós do sistema:lsnode -delim :

2. Emita o comando lsnode da CLI e especifique o ID ou nome de nó do nó cujasaída detalhada você deseja receber.O exemplo a seguir é um comando da CLI que você pode usar para listar asaída detalhada para um nó no sistema:lsnode -delim : group1node1

Em que group1node1 é o nome do nó cuja saída detalhada você desejavisualizar.

Exibindo Propriedades do Sistema em Cluster Usando a CLIÉ possível usar a interface da linha de comandos (CLI) para exibir as propriedadespara um sistema em cluster (sistema).

Sobre Esta Tarefa

Estas ações ajudam a exibir informações de propriedade de sistema.

Procedimento

Emita o comando lssystem para exibir as propriedades para um sistema.A seguir, há um exemplo do comando que pode ser emitido:lssystem -delim : build1

em que build1 é o nome do sistema.

84 SAN Volume Controller: Guia de Resolução de Problemas

Page 103: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resultadosid:000002007A00A0FEname:build1location:localpartnership:bandwidth:total_mdisk_capacity:90.7GBspace_in_mdisk_grps:90.7GBspace_allocated_to_vdisks:14.99GBtotal_free_space:75.7GBstatistics_status:onstatistics_frequency:15required_memory:0cluster_locale:en_UStime_zone:522 UTCcode_level:6.1.0.0 (build 47.3.1009031000)FC_port_speed:2Gbconsole_IP:9.71.46.186:443id_alias:000002007A00A0FEgm_link_tolerance:300gm_inter_cluster_delay_simulation:0gm_intra_cluster_delay_simulation:0email_reply:email_contact:email_contact_primary:email_contact_alternate:email_contact_location:email_state:stoppedinventory_mail_interval:0total_vdiskcopy_capacity:15.71GBtotal_used_capacity:13.78GBtotal_overallocation:17total_vdisk_capacity:11.72GBcluster_ntp_IP_address:cluster_isns_IP_address:iscsi_auth_method:noneiscsi_chap_secret:auth_service_configured:noauth_service_enabled:noauth_service_url:auth_service_user_name:auth_service_pwd_set:noauth_service_cert_set:norelationship_bandwidth_limit:25gm_max_host_delay:5tier:generic_ssdtier_capacity:0.00MBtier_free_capacity:0.00MBtier:generic_hddtier_capacity:90.67GBtier_free_capacity:75.34GBemail_contact2:email_contact2_primary:email_contact2_alternate:total_allocated_extent_capacity:16.12GB

Campos para os VPD do nóOs dados vitais do produto (VPD) do nó fornece informações para itens comoplaca-mãe, baterias, processador, ventiladores, módulo de memória, adaptador,dispositivos, software, conjunto do painel frontal, o fonte de alimentaçãoininterrupta, SAS unidade flash e o adaptador de barramento do host (HBA) doSAS.

O Tabela 37 na página 86 mostra os campos visualizados para a placa-mãe.

Capítulo 5. Visualizando os dados vitais do produto 85

Page 104: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 37. Campos para a placa-mãe

Item Nome do campo

Placa-mãe Número de peça

Número de série do sistema

Número de processadores

Número de slots de memória

Número de ventiladores

Número de adaptadores Fibre Channel

Número de dispositivos SCSI, IDE, SATA ouSASNota: O controlador de serviço é umdispositivo.

Número de adaptadores de acelerador decompactação

Número de fontes de alimentação

Número de adaptadores SAS de altavelocidade

Fabricante do BIOS

Versão do BIOS

Data de liberação do BIOS

Fabricante do sistema

Produto do sistema

Fabricante do planar

Número de peça da fonte de alimentação

Número de peça da bateria CMOS

Número de peça do conjunto de cabos deenergia

Firmware do processador de serviços

Número de peça do controlador SAS

O Tabela 38 na página 87 mostra os campos visualizados para as baterias.

86 SAN Volume Controller: Guia de Resolução de Problemas

Page 105: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 38. Campos para as baterias

Item Nome do campo

Baterias Battery_FRU_part

Battery_part_identity

Battery_fault_led

Battery_charging_status

Battery_cycle_count

Battery_power_on_hours

Battery_last_recondition

Battery_midplane_FRU_part

Battery_midplane_part_identity

Battery_midplane_FW_version

Battery_power_cable_FRU_part

Battery_power_sense_cable_FRU_part

Battery_comms_cable_FRU_part

Battery_EPOW_cable_FRU_part

O Tabela 39 mostra os campos visualizados para cada processador instalado.

Tabela 39. Campos para os processadores

Item Nome do campo

Processador Número de peça

Local do processador

Fabricante

Versão

Velocidade

Status

Número de série do processador

O Tabela 40 mostra os campos visualizados para cada ventilador instalado.

Tabela 40. Campos para os ventiladores

Item Nome do campo

Ventilador Número de peça

Localização

O Tabela 41 na página 88 mostra os campos repetidos para cada módulo dememória instalado.

Capítulo 5. Visualizando os dados vitais do produto 87

Page 106: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 41. Campos repetidos para cada módulo de memória instalado

Item Nome do campo

Módulo de memória Número de peça

Local do dispositivo

Local do banco

Tamanho (MB)

Fabricante (se disponível)

Número de série (se disponível)

O Tabela 42 mostra os campos que são repetidos para cada adaptador instalado.

Tabela 42. Campos repetidos para cada adaptador instalado

Item Nome do campo

Adaptador Tipo de adaptador

Número de peça

Números das Portas

Localização

Número de série do dispositivo

Fabricante

Dispositivo

Revisão do adaptador

Revisão do chip

O Tabela 43 mostra os campos repetidos para cada dispositivo instalado.

Tabela 43. Campos repetidos para cada dispositivo SCSI, IDE, SATA e SAS instalado

Item Nome do campo

Dispositivo Número de peça

Barramento

Dispositivo

Modelo

Revisão

Número de Série

Capacidade aproximada

Revisão de hardware

Fabricante

O Tabela 44 na página 89 mostra os campos específicos para o software do nó.

88 SAN Volume Controller: Guia de Resolução de Problemas

Page 107: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 44. Campos específicos para o software do nó

Item Nome do campo

Software Nível de código

Nome do nó

Nome universal do nó

ID

Sequência exclusiva usada em nomes dearquivo de dump para esse nó

O Tabela 45 mostra os campos fornecidos para o conjunto do painel frontal.

Tabela 45. Campos fornecidos para o conjunto do painel frontal

Item Nome do campo

Painel frontal Número de peça

ID do painel frontal

Código de idioma do painel frontal

O Tabela 46 mostra os campos fornecidos para a porta Ethernet.

Tabela 46. Campos fornecidos para a porta Ethernet

Item Nome do campo

Porta Ethernet Número da porta

Status da porta Ethernet

Endereço de Controle de Acesso à Mídia

Velocidades suportadas

O Tabela 47 mostra os campos fornecidos para as fontes de alimentação no nó.

Tabela 47. Campos fornecidos para as fontes de alimentação no nó

Item Nome do campo

Fontes de alimentação Número de peça

Localização

O Tabela 48 na página 90 mostra os campos fornecidos para o conjunto de fonte dealimentação ininterrupta que esteja ativando o nó.

Capítulo 5. Visualizando os dados vitais do produto 89

Page 108: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 48. Campos fornecidos para o conjunto de fonte de alimentação ininterrupta queesteja ativando o nó

Item Nome do campo

Fonte de Alimentação Ininterrupta Número de peça do conjuntoeletroeletrônicos

Número de peça da bateria

Número de peça do conjunto de quadros

Número de peça do cabo de energia deentrada

Número de série da UPS

Tipo de UPS

Número de peça interna da UPS

ID exclusivo da UPS

Firmware principal da UPS

Firmware de comunicação da UPS

O Tabela 49 mostra os campos fornecidos para o adaptador de barramento do host(HBA) SAS.

Tabela 49. Campos fornecidos para o adaptador de barramento do host (HBA) SAS

Item Nome do campo

HBA SAS Número de peça

Números das Portas

Número de série do dispositivo

Fabricante

Dispositivo

Revisão do adaptador

Revisão do chip

O Tabela 50 na página 91 mostra os campos fornecidos para o unidade flash doSAS.

90 SAN Volume Controller: Guia de Resolução de Problemas

Page 109: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 50. Campos fornecidos para o unidade flash do SAS

Item Nome do campo

SSD do SAS Número de peça

Fabricante

Número de série do dispositivo

Modelo

Tipo

UID

Firmware

Slot

Firmware do FPGA

Velocidade

Capacidade

Bandeja de expansão

Tipo de conexão

O Tabela 51 mostra os campos fornecidos para o transceptor do small form factorpluggable (SFP).

Tabela 51. Campos fornecidos para o transceptor do small form factor pluggable (SFP)

Item Nome do campo

Transceptor small form factor pluggable(SFP)

Número de peça

Fabricante

Dispositivo

Número de Série

Velocidades suportadas

Tipo de conector

Tipo de transmissor

Comprimento de Onda

Distância máxima por tipo de cabo

Revisão de hardware

Número da porta

Nome da porta universal

Campos para os VPD do sistemaOs dados vitais do produto (VPD) do sistema fornece diversas informações sobre osistema, incluindo seu ID, nome, local, endereço IP, email de contato, nível decódigo e espaço livre total.

O Tabela 52 na página 92 mostra os campos fornecidos para as propriedades dosistema conforme mostrado pelo GUI de gerenciamento.

Capítulo 5. Visualizando os dados vitais do produto 91

Page 110: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 52. Campos fornecidos para as propriedades do sistema

Item Nome do campo

Geral IDNota: Esse é o identificador exclusivo para o sistema.

Nome

Localização

Fuso Horário

Memória Necessária

Versão de Código Licenciado

Velocidade da porta do canal

Endereços IP1 Porta Ethernet 1 (atributos para o IPv4 e IPv6)

v Endereço IP

v Endereço IP de Serviço

v Máscara de Sub-rede

v Prefixo

v Gateway Padrão

Porta Ethernet 2 (atributos para o IPv4 e IPv6)

v Endereço IP

v Endereço IP de Serviço

v Máscara de Sub-rede

v Prefixo

v Gateway Padrão

Autenticação Remota Autenticação Remota

Endereço da Web

Nome de Usuário

Senha

Certificado SSL

Espaço Capacidade Total de MDisk

Espaço nos Conjuntos de Armazenamento

Espaço Alocado para os Volumes

Espaço Livre Total

Capacidade Total Usada

Alocação Total

Capacidade Total de Cópia do Volume

Capacidade Total do Volume

Estatísticas Status de Estatísticas

Frequência de Estatísticas

Metro e Global Mirror Tolerância do Link

Simulação de Atraso do Intersistema

Simulação de Atraso do Intrassistema

Parceria

Largura da Banda

92 SAN Volume Controller: Guia de Resolução de Problemas

Page 111: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 52. Campos fornecidos para as propriedades do sistema (continuação)

Item Nome do campo

E-mail Servidor de Email do SMTP

Porta do Servidor de Email

Endereço de Email de Resposta

Nome da Pessoa de Contato

Número do Telefone de Contato Principal

Número do Telefone de Contato Alternativo

Local Físico do Erro de Relatório do Sistema

Status de Email

Intervalo de Email de Inventário

iSCSI Endereço do Servidor iSNS

Métodos de Autenticação Suportado

Segredo do CHAP1 Também é possível usar o comando da CLI lssystemip para visualizar esses dados.

Capítulo 5. Visualizando os dados vitais do produto 93

Page 112: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

94 SAN Volume Controller: Guia de Resolução de Problemas

Page 113: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 6. Usando o painel frontal do SAN Volume Controller

O painel frontal do SAN Volume Controller possui um monitor, vários LEDs,botões de navegação e um botão de seleção que é usado ao realizar a manutençãodo nó do SAN Volume Controller.

Figura 46 mostra onde a tela do painel frontal ▌1▐ está localizada no nó do SANVolume Controller.

O SAN Volume Controller 2145-DH8 não possui uma tela no painel frontal, maspossui status de nó, falha de nó e LEDs de status da bateria. Ao invés disso, umaporta técnica está disponível na parte traseira do nó do 2145-DH8 para usar umaconexão direcionada para suporte de instalação e manutenção. A porta técnicasubstitui a tela do painel frontal e fornece acesso direto para a interface gráficacom o usuário e a interface da linha de comandos (CLI) do assistente de serviço.

Indicador de progresso da inicializaçãoProgresso de inicialização é exibido no painel frontal do SAN Volume Controller.

A tela de progresso de inicialização no painel frontal mostra que o nó estáiniciando.

Durante a operação de inicialização, códigos de progresso de inicialização sãoexibidos e a barra de progresso se move para a direita enquanto a operação deinicialização continua.

svc00552

1

R e i n i c i a n d o

R e i n i c i a n d o

Figura 46. Conjunto do Painel Frontal do SAN Volume Controller

I n i c i a l i za n d o 1 3 0

Figura 47. Exemplo de uma Exibição do Progresso da Inicialização

© Copyright IBM Corp. 2003, 2016 95

Page 114: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Falha na inicializaçãoSe a operação de inicialização falhar, o código de inicialização 120 é exibido.

Consulte o tópico "Erro código de referência" onde é possível localizar umadescrição da falha e as etapas apropriadas que você deve concluir para corrigir afalha.

CarregandoO painel frontal indica que a bateria do fonte de alimentação ininterrupta estásendo carregada.

Um nó não será iniciado e se unirá a um cluster se houver energia suficiente nabateria do fonte de alimentação ininterrupta para gerenciar uma falha de energia.Carregando é exibido até que seja seguro iniciar o nó. Isso pode levar até duashoras.

Códigos de errosOs códigos de erro são exibidos na exibição do painel frontal.

O Figura 48 e Figura 49 mostram como os códigos de erro são exibidos no painelfrontal.

Para as descrições dos códigos de erro mostradas na exibição do painel frontal,consulte os tópicos de vários códigos de erros para uma descrição completa dafalha e das ações que você deve executar para corrigir a falha.

C o m fa l h a 1 2 0

C a r re g a n d o

svc00

304

svc00433

Figura 48. Exemplo de um Código de Erro para um Sistema em Cluster

svc00434

Figura 49. Exemplo de um Código de Erro do Nó

96 SAN Volume Controller: Guia de Resolução de Problemas

Page 115: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Inicialização de hardwareA exibição da inicialização de hardware mostrará dados do sistema quando aenergia for aplicada pela primeira vez ao nó, uma vez que o nó procurará parauma unidade de disco para inicialização.

Se essa exibição permanecer ativa por mais de 3 minutos, poderá haver umproblema. A causa pode ser uma falha de hardware ou o software na unidade dedisco rígido pode estar ausente ou danificado.

Solicitação de resgate do nóSe o software for perdido, será possível usar o processo de resgate do nó paracopiar todos os softwares de outro nó.

A exibição da solicitação de resgate de nó mostrada em Figura 50, indica que umsolicitação foi feita para substituir o software nesse nó. O software SAN VolumeController está pré-instalado em todos os nós do SAN Volume Controller. Essesoftware inclui o sistema operacional, o software aplicativo e as publicações doSAN Volume Controller. Normalmente não será necessário substituir o software emum nó, mas se o software estiver perdido por alguma razão (por exemplo, aunidade de disco rígido no nó falhar), será possível copiar todo o software deoutro nó conectado à mesma malha do Fibre Channel. Esse processo é conhecidocomo resgate do nó.

Falha de energiaO nó do SAN Volume Controller usa a energia da bateria do fonte de alimentaçãoininterrupta para encerrar em si.

A exibição de Falha de energia no aplicativo do laptop mostra que o SAN VolumeController está em execução com a energia da bateria porque a energia principalfoi perdida. Todas as operações de E/S foram interrompidas. O nó está salvandoos metadados do sistema e dados de cache do nó na unidade de disco interna.Quando a barra de progresso atingir zero, o nó será desligado.

Nota: Quando a energia de entrada for restaurada para o fonte de alimentaçãoininterrupta, o SAN Volume Controller ligará.

DesligandoA barra de progresso na exibição mostra o progresso da operação de desligamento.

Figura 50. Exibição de Resgate do Nó

Capítulo 6. Usando o painel frontal do SAN Volume Controller 97

Page 116: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Desligando será exibido depois que o botão de energia tiver sido pressionado eenquanto o nó estiver desligando. O desligamento pode levar vários minutos.

A barra de progresso se moverá para a esquerda quando a energia for removida.

RecuperandoO painel frontal indica que a bateria do fonte de alimentação ininterrupta não estátotalmente carregada.

Quando um nó estiver ativo em um sistema, mas a bateria do fonte de alimentaçãoininterrupta não estiver totalmente carregada, Recuperação será exibido. Se aenergia falhar enquanto esta mensagem for exibida, o nó não se reiniciará até queo fonte de alimentação ininterrupta seja carregado a um nível em que ele possasustentar uma segunda falha de energia.

ReiniciandoO painel frontal indicará quando o software em um nó estiver sendo reiniciado.

O software está reiniciando por uma das razões a seguir:v Foi detectado um erro interno.v O botão de energia foi pressionada novamente enquanto o nó estava desligado.

Se você pressionar o botão de energia enquanto está sendo desligado, a exibição dopainel será alterada para indicar que o botão pressionado foi detectado; no entanto,o desligamento de energia continuará até o nó conclua o salvamento dos seusdados. Após os dados serem salvos, o nó será desligado e, em seguida, reiniciaautomaticamente. A barra de progresso se moverá para a direita enquanto o nóestiver reiniciando.

EncerrandoO indicador do painel frontal rastreia as operações de encerramento.

D e s l i g a n d o

R e cu p e ra n d o

svc003

05

R e i n i c i a n d o

98 SAN Volume Controller: Guia de Resolução de Problemas

Page 117: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A exibição Encerrando será mostrada ao emitir um comando shutdown a umsistema em cluster do SAN Volume Controller ou um nó do SAN VolumeController. A barra de progresso continua a mover para a esquerda até que o nóseja desligado.

Quando a operação de encerramento for concluída, o nó será desligado. Aodesligar um nó conectado a um 2145 UPS-1U, apenas o nó será encerrado; o 2145UPS-1U não será encerrado.

Opção Validar WWN?O painel frontal solicitará que você valide o WWNN quando o nome universal donó (WWNN) armazenado no controlador de serviço (o WWNN do painel) nãocorresponder ao WWNN feito backup no disco do SAN Volume Controller (oWWNN de disco).

Geralmente, esse painel será exibido quando o controlador de serviço tiver sidosubstituído. O SAN Volume Controller usa o WWNN armazenado no controladorde serviço. Geralmente, quando o controlador de serviço for substituído, modifiqueo WWNN armazenado nele para corresponder ao WWNN no controlador deserviço que ele substituiu. Ao fazer isso, o nó mantém seu endereço do WWNN enão será necessário modificar as configurações de zoneamento SAN ou de host. OWWNN armazenado no disco é o mesmo que foi armazenado no controlador deserviço antigo.

Depois que ele estiver nesse modo, a exibição do painel frontal não será revertidapara suas exibições normais, como as opções de nó ou cluster (sistema) ou statusoperacional, até que o WWNN seja validado. Navegue a opção Validar WWNN(mostrado emFigura 51) para escolher qual WWNN você deseja usar.

Escolha qual WWNN armazenado deseja que este nó use:1. No painel Validar WWNN?, pressione e solte o botão Selecionar. O Disco

WWNN: o painel é exibido e mostra os cinco últimos dígitos do WWNN queestá armazenado no disco.

En ce r ra n d o

Validar WWNN?

Selecionar

svc00

409

WWNN do disco:

Usar WWNN do disco?

WWNN do painel:

Usar WWNN do painel?

WWNNdo nó:

Selecionar

Figura 51. Navegação Validar navegação

Capítulo 6. Usando o painel frontal do SAN Volume Controller 99

Page 118: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Para visualizar o WWNN que está armazenado no controlador de serviço,pressione e solte o botão direito. O Painel WWNN: o painel é exibido e mostraos cinco últimos números do WWNN que é armazenado no controlador deserviço.

3. Determine qual WWNN você deseja usar.a. Para usar o WWNN que está armazenado no disco:

1) No painel do Disco WWNN: pressione e solte o botão para baixo. Opainel Usar Disco WWNN? é exibido.

2) Pressione e solte o botão Selecionar.b. Para usar o WWNN que está armazenado no controlador de serviço:

1) No Painel WWNN, pressione e solte o botão para baixo. O painel UsarPainel WWNN? é exibido.

2) Pressione e solte o botão Selecionar.

O nó está usando agora o WWNN selecionado. O painel Nó WWNN é exibido emostra os cinco últimos números do WWNN selecionado.

Se nem o WWNN armazenado no painel do controlador de serviço nem o discofor adequado, você deverá aguardar até que o nó seja reiniciado antes que sejapossível alterá-lo. Após o nó ser reiniciado, selecione Alterar WWNN para alterar oWWNN para o valor desejado.

Opção de menu do SAN Volume ControllerDurante operações normais, as opções de menu estarão disponíveis na exibição dopainel frontal do nó do SAN Volume Controller.

As opções de menu permitem que você revise o status operacional do sistema emcluster, nó e das interfaces externas. Elas também fornecem acesso às ferramentas eoperações usadas para atender o nó.

O Figura 52 na página 101 mostra a sequência das opções de menu. Apenas umaopção por vez será mostrada na exibição do painel frontal. Para algumas opções,dados adicionais são exibidos na linha 2. A primeira opção exibida é a opçãoCluster: .

100 SAN Volume Controller: Guia de Resolução de Problemas

Page 119: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Use os botões esquerdo e direito para navegar através dos campos secundáriosassociados a alguns dos campos principais.

Nota: As mensagens podem não ser exibidas totalmente na tela. Você pode verum colchete angular à direita (>) no lado direito da tela de exibição. Se você virum colchete angular à direita, pressione o botão direito para rolar através da tela.Quando não houver mais nenhum texto para ser exibido, será possível mover parao próximo item no menu, pressionando o botão direito.

Da mesma forma, você pode ver um colchete angular à esquerda (<) no ladoesquerdo da tela de exibição. Se você ver um colchete angular à esquerda,

Ethernet L/R L/R L/RPortaEthernet 1:

Velocidade 1: Endereçode Controle de

Acesso à Mídia 1:

L/R L/RPorta

Ethernet 2:Velocidade

2:

Endereçode Controle de

Acesso à Mídia 2:

L/R

Versão: Compilação:Compilaçãodo cluster:

U/D

L/R L/R

Status:WWNNdo nó:

Endereço deserviçoL/R L/R L/R

R/L

U/D

Porta FC 1

EndereçoIPv4 1:

L/R L/R

Cluster:

U/D

Status:Endereçoda porta 1:L/R L/R L/R

Endereçoda porta 2:

Sub-redeIPv4 1:

GatewayIPv4 1:

L/REndereço

IPv6 1:L/R

L/R

PrefixoIPv6 1:

GatewayIPv6

EndereçoIPv4 2:

L/R L/RSub-redeIPv4 2:

GatewayIPv4 2:

L/R EndereçoIPv6 2:

L/R L/RPrefixoIPv6 2:

GatewayIPv6 2:

R/L

R/LS

S

Opções principais Opções secundárias

R/L

svc0

05

60

R/L

EndereçoIPv4

L/R L/RSub-rede

IPv4

GatewayIPv4

L/REndereço

IPv6L/R

PrefixoIPv6

L/RGatewayIPv6 1:

R/L

S

s s

s

s Selecionar mostrará os endereçosIpv4 e IPv6, se disponíveis

x

L

Selecionar conduz ao menu Ações

Selecionar ativa o idioma

Velocidadeda porta

FC 1

Statusda porta

FC 2

Velocidadeda porta

FC 2

Ações

L/R L/R L/R

R/L

Status da portaFC 1

U/D Status da porta

FC 3

Velocidadeda porta

FC 3

Status da portaFC 4

Velocidadeda porta

FC 4

Idioma?

U/D

Inglês? Japonês?L/R L/R

L/R L/R L/R

x

L L

R/L

L/R L/RPorta

Ethernet 3:Velocidade

3:

Endereçode Controle de

Acesso à Mídia 3:

L/R

L/R L/RPorta

Ethernet 4:Velocidade

4:

Endereçode Controle de

Acesso à Mídia 4:

L/R

R/L

U/D

Figura 52. Opções do SAN Volume Controller no Monitor do Painel Frontal

Capítulo 6. Usando o painel frontal do SAN Volume Controller 101

Page 120: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

pressione o botão esquerdo para rolar através da exibição. Quando não houvermais nenhum texto para ser exibido, será possível mover para o item anterior nomenu, pressionando o botão esquerdo.

As opções principais a seguir estão disponíveis:v Clusterv Nóv Versãov Ethernetv Status da Porta do FC 1v Açõesv Idioma

Opções de cluster (sistema)A opção de cluster principal (sistema) no menu pode exibir o nome do cluster ou ocampo pode estar em branco.

A opção de cluster principal (sistema) exibe o nome do sistema que o usuáriodesignou. Se um sistema em cluster estiver no processo de ser criado no nó, enenhum nome de sistema tiver sido designado, um nome temporário baseado noendereço IP do sistema será exibido. Se este nó não estiver designado para umsistema, o campo estará em branco.

Opção de statusO status é indicada no painel frontal.

Este campo estará em branco se o nó não for um membro de um sistema emcluster. Se esse nó for um membro de um sistema em cluster, o campo indicará ostatus operacional do sistema, conforme a seguir:

AtivoIndica que esse nó é um membro ativo do sistema.

InativoIndica que o nó é um membro de um sistema, mas agora não está operacional.Ele não está operacional porque outros nós que estão no sistema não podemser acessados ou porque esse nó foi excluído do sistema.

DegradadoIndica que o sistema está operacional, mas um ou mais nós do membro estãoausentes ou falharam.

Opção Endereço IPv4Um sistema em cluster deve ter um endereço IPv4 ou um endereço IPv6, ouambos, designados à porta Ethernet 1. Também é possível designar um endereçoIPv4 ou um endereço IPv6, ou ambos, à porta Ethernet 2. É possível usar qualquerum dos endereços para acessar o sistema a partir das ferramentas de linha decomandos ou do GUI de gerenciamento.

Esses campos contêm os endereços IPv4 do sistema. Se este nó não for um membrode um sistema ou se o endereço IPv4 não tiver sido designado, esses camposestarão em branco.

102 SAN Volume Controller: Guia de Resolução de Problemas

Page 121: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opções de Sub-rede IPv4:

Os endereços de máscara da sub-rede IPv4 serão configurados quando osendereços IPv4 forem designados ao sistema.

As opções de sub-rede IPv4 exibirão os endereços de máscara de sub-rede quandoo sistema possuir endereços IPv4. Se o nó não for um membro de um sistema ouse os endereços IPv4 não foram designados, este campo estará em branco.

Opções do Gateway IPv4:

Os endereços do gateway IPv4 são definidos quando o sistema é criado.

As opções do gateway IPv4 exibem os endereços do gateway para o sistema. Se onó não for um membro de um sistema ou se os endereços IPv4 não tiverem sidodesignados, este campo estará em branco.

Opções de Endereço IPv6Um sistema em cluster deve ter um endereço IPv4 ou um endereço IPv6, ouambos, designados à porta Ethernet 1. Também é possível designar um endereçoIPv4 ou um endereço IPv6, ou ambos, à porta Ethernet 2. É possível usar qualquerum dos endereços para acessar o sistema a partir das ferramentas de linha decomandos ou do GUI de gerenciamento.

Esses campos contêm os endereços IPv6 do sistema. Se o nó não for um membrode um sistema, ou se o endereço IPv6 não tiver sido designado, esses camposestarão em branco.

Opção Prefixo IPv6:

O prefixo IPv6 será configurado quando um sistema for criado.

A opção de prefixo IPv6 exibe o prefixo da rede do sistema e os endereços IPv6 deserviço. O prefixo tem um valor de 0-127. Se o nó não for um membro de umsistema ou se os endereços IPv6 não tiverem sido designados, uma linha embranco será exibida.

Opção Ipv6 Gateway:

Os endereços do gateway IPv6 são configurados quando o sistema é criado.

Esta opção exibe os endereços do gateway IPv6 para o sistema. Se o nó não for ummembro de um sistema ou se os endereços IPv6 não tiverem sido designados, umalinha em branco será exibida.

Exibindo um endereço IPv6Após ter configurado o endereço IPv6, será possível exibir os endereços IPv6 e osendereços de gateway do IPv6.

O Os endereços IPv6 e os endereços de gateway IPv6 consistem em oito valoreshexadecimais (4 dígitos) que são mostrados em quatro painéis, conforme mostradoem Figura 53 na página 104. Cada painel exibe valores de 4 dígitos que sãoseparados por dois pontos (:), a posição do campo de endereço (como 2/4) dentrodo endereço total e os indicadores de rolagem. Mova entre os painéis de endereçousando o botão esquerdo ou o botão direito.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 103

Page 122: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opções do nóA opção de nó principal exibirá o número de identificação ou o nome do nó se ousuário tiver designado um nome.

Opção de statusO status do nó é indicado no painel frontal. O status pode ser um dos seguintesestados:

Ativo O nó é operacional, designado a um sistema e pronto para concluir asoperações de E/S.

ServiçoHá um erro que está impedindo o nó de operar como parte de um sistema.É seguro desligar o nó neste estado.

CandidatoO nó não está designado para um sistema e não está em serviço. É segurodesligar o nó neste estado.

IniciandoO nó é parte de um sistema e está tentando unir o sistema. Não é possívelconcluir as operações de E/S.

Opção de WWNN do NóA opção WWNN do Nó (nome universal do nó) exibe os últimos cinco dígitoshexadecimais do WWNN que está sendo usado pelo nó. Apenas os últimos cincodígitos de um WWNN variam em um nó. Os primeiros 11 dígitos são sempre50050768010.

Opção de Endereço de ServiçoPressionando selecionar no painel de Endereço de Serviço exibe o endereço IP queestá configurado para acesso ao assistente de serviço e a interface da linha decomandos do serviço.

Opções de versõesA opção de versão exibe a versão do software SAN Volume Controller que estáativo no nó. A versão consiste em quatro campos que são separados por pontosfinais. Os campos são a versão, a liberação, a modificação e o nível de correção,por exemplo, 6.1.0.0.

Opção de Criação

A Construção: o painel exibe o nível do software SAN Volume Controller que estáativo atualmente nesse nó.

opção do Cluster Build

O painel Cluster Build: exibe o nível do software que está atualmente ativo nosistema que esse nó está operando.

svc0

04

17

Figura 53. Visualizando o Endereço IPv6 no Monitor do Painel Frontal

104 SAN Volume Controller: Guia de Resolução de Problemas

Page 123: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opções de EthernetAs opções de Ethernet exibem o estado operacional das portas Ethernet, avelocidade, as informações de duplex e seus endereços de controle de acesso àmídia (MAC).

O painel Ethernet mostra um dos estados a seguir:

Configuração - SimEste nó é o nó de configuração.

Configuração - NãoEste nó não é o nó de configuração.

Nenhum ClusterEste nó não é um membro de um sistema.

Pressione o botão direito para visualizar os detalhes das portas Ethernetindividuais.

Opções da Porta Ethernet

As opções da porta Ethernet, Porta 1 através da Porta 4, exibem o estado dos linkse indicam se há ou não um link ativo com uma rede Ethernet.

Link OnlineUm cabo Ethernet está conectado a esta porta.

Link OfflineNenhum cabo Ethernet está conectado a esta porta ou o link falhou.

Opções de velocidade

As opções de velocidade, Velocidade 1 através da Velocidade 4, exibem asinformações de velocidade e duplex para a porta Ethernet. As informações develocidade podem ser um dos valores a seguir:

10 A velocidade é de 10 Mbps.

100 A velocidade é de 100 Mbps.

1 A velocidade é de 1Gbps.

10 A velocidade é de 10 Gbps.

A informação duplex pode ser um dos valores a seguir:

Full Os dados podem ser enviados e recebidos ao mesmo tempo.

Half Os dados podem ser enviados e recebidos em uma direção por vez.

Opções de Endereço de Controle de Acesso à Mídia

As opções de Endereço de Controle de Acesso à Mídia, Endereço de Controle deAcesso à Mídia 1 através do 4, exibem o endereço de controle de acesso à mídia(MAC) da porta Ethernet.

Opções de porta do Fibre ChannelAs opções de porta do Fibre Channel exibem o status operacional das portas doFibre Channel.

Ativo A porta está operacional e pode acessar o malha do Fibre Channel.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 105

Page 124: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

InativoA porta está operacional, mas não pode acessar a malha do Fibre Channel.Uma das seguintes condições causou este resultado:v O cabo Fibre Channel falhou.v O cabo Fibre Channel não está instalado.v O dispositivo que está na outra extremidade do cabo falhou.

Com falhaA porta não está operacional devido a uma falha de hardware.

Não instaladoEsta porta não está instalada.

Opções de açãoDurante operações normais, as opções de menu de ação estão disponíveis naexibição do painel frontal do nó. Só use as ações do painel frontal quandoorientado a fazer isso por um procedimento de serviço. O uso inadequado podelevar à perda de acesso aos dados ou perda de dados.

Figura 54 na página 108, Figura 55 na página 109 e Figura 56 na página 110mostram a sequência das opções de ações. Nas figuras, as linhas em negritoindicam que o botão de seleção foi pressionado. As linhas mais claras indicar ocaminho de navegação (para cima ou para baixo e para a esquerda ou direita). O Xcom um círculo indica que se o botão de seleção é pressionado, uma ação ocorreusando os dados inseridos.

Apenas uma ação do menu de opção por vez é exibida no monitor do painelfrontal.

Nota: As opções somente serão exibidas no menu se forem válidas para o estadoatual do nó. Consulte Tabela 53 para uma lista de quando as opções são válidas.

As opções a seguir estão disponíveis no menu Ações:

Tabela 53. Quando as opções estão disponíveis

Opção do painel frontal Nome do opcional

Quando a opção estiverdisponível para o estadoatual do nó

Cluster IPv4 Crie um sistema em clustercom um endereço degerenciamento IPv4

Estado de candidato

Cluster IPv6 Crie um sistema em clustercom um endereço degerenciamento IPv6

Estado de candidato

Serviço IPv4 Configure o endereço deserviço IPv4 do nó

Todos os estados

Serviço IPv6 Configure o endereço deserviço IPv6 do nó

Todos os estados

DHCPv4 de serviço Configure um endereço deserviço IPv4 do DHCP

Todos os estados

DHCPv6 de serviço Configure um endereço deserviço IPv6 do DHCP

Todos os estados

Altere o WWNN Altere o WWNN do nó Candidato ou estado deserviço

106 SAN Volume Controller: Guia de Resolução de Problemas

Page 125: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 53. Quando as opções estão disponíveis (continuação)

Opção do painel frontal Nome do opcional

Quando a opção estiverdisponível para o estadoatual do nó

Insira Serviço Insira o estado de serviço Sempre erro 690 não émostrando.

Serviço de Saída Deixe o estado de serviço, sepossível

Sempre erro 690 é mostrado.

Recuperar Cluster Recuperar configuração dosistema

Candidato ou estado deserviço

Remover Cluster Remover estado do sistema Sempre que o nó possuir umestado do sistema em cluster.

Upgrade em Etapas Execute CCU do usuáriocompassado

Nó em serviço sem estadodo sistema em cluster

Configurar Velocidade do FC Configurar velocidade doFibre Channel

Reconfigurar senha Reconfigurar senha Não ativo ou se o comandoresetpassword estiverativado

Nó de Resgate Software do nó de resgate Todos os estados

Capítulo 6. Usando o painel frontal do SAN Volume Controller 107

Page 126: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

AgruparIPv4?

EndereçoIPv4:

Sub-redeIPv4:

GatewayIPv4:

Confirmarcriação? Cancelar?

EndereçoIPv6:

PrefixoIPv6:

GatewayIPv6:

Confirmarcriação?Agrupar

IPv6?

Efetuar serviçono IPv4?

EndereçoIPv4:

Sub-redeIPv4:

GatewayIPv4:

Confirmarendereço? Cancelar?

Efetuar serviçono IPv6?

EndereçoIPv6:

PrefixoIPv6:

GatewayIPv6:

Confirmarendereço?

Cancelar?

Efetuarserviço noDHCPv4?

ConfirmarDHCPv4?

Cancelar?

Efetuarserviço noDHCPv6?

ConfirmarDHCPv6? Cancelar?

AlterarWWNN?

EditarWWNN?

ConfirmarWWNN?

Cancelar?

Cancelar?

svc00657

x

x

x

x

x

x

x

Figura 54. Opções da Parte Superior do Menu Ações no Painel Frontal

108 SAN Volume Controller: Guia de Resolução de Problemas

Page 127: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Inserirserviço?

Confirmarinserção? Cancelar?

Sairdo serviço?

Confirmarsaída? Cancelar?

Recuperarcluster?

Confirmarrecuperação?

Cancelar?

Removercluster?

Confirmarremoção?

Cancelar?

Upgradeem etapas?

Confirmarupgrade?

Cancelar?

x

x

x

x

x

svc00658

Figura 55. Opções da Parte do Meio do Menu Ações no Painel Frontal

Capítulo 6. Usando o painel frontal do SAN Volume Controller 109

Page 128: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Para executar uma ação, navegue para a opção Ações e pressione o botão deseleção. A ação é iniciada. Os parâmetros disponíveis para a ação são exibidos. Useos botões para a esquerda ou para a direita para se mover entre os parâmetros. Aconfiguração atual é exibida na segunda linha de exibição.

Para configurar ou alterar um valor de parâmetro, pressione o botão de seleçãoquando o parâmetro for exibido. O valor é alterado para o modo de edição. Use osbotões para a esquerda ou para a direita para se mover entre subcampos e use osbotões para cima ou para baixo para alterar o valor de um subcampo. Quando ovalor estiver correto, pressione selecionar para sair do modo de edição.

Cada ação também possui um painel de Confirmar? e um de Cancelar? .Pressionar selecionar em Confirmar? painel inicia a ação usando o conjunto devalores do parâmetro atual. Pressionar selecionar em Cancelar? painel retorna parao painel de opção Ação sem alterar o nó.

Nota: As mensagens podem não ser exibidas totalmente na tela. Você pode verum colchete angular à direita (>) no lado direito da tela de exibição. Se você virum colchete angular à direita, pressione o botão direito para rolar através da tela.Quando não houver mais nenhum texto para ser exibido, será possível mover parao próximo item no menu, pressionando o botão direito.

Da mesma forma, você pode ver um colchete angular à esquerda (<) no ladoesquerdo da tela de exibição. Se você ver um colchete angular à esquerda,pressione o botão esquerdo para rolar através da exibição. Quando não houvermais nenhum texto para ser exibido, será possível mover para o item anterior nomenu, pressionando o botão esquerdo.

Sair das ações?

Definirveloci-dade FC?

Editarvelocidade?

Confirmarvelocidade?

Cancelar?

Reconfigurarsenha?

Confirmarreconfiguração?

Cancelar?

Resgatarnó?

Confirmarresgate? Cancelar?

x

x

x

svc00659

Figura 56. Opções da Parte Inferior do Menu Ações no Painel Frontal

110 SAN Volume Controller: Guia de Resolução de Problemas

Page 129: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opções do Cluster IPv4 ou IPv6É possível criar um sistema em cluster das opções de ação do Cluster IPv4 ouIPv6.

A opção Cluster IPv4 ou IPv6 permite criar um sistema em cluster.

No painel frontal, quando você cria um sistema em cluster, é possível configurar oendereço IPv4 ou IPv6 para a porta Ethernet 1. Se necessário, é possível incluirmais endereços IP de gerenciamento usando o GUI de gerenciamento ou ainterface da linha de comandos.

Pressione os botões para cima e para baixo para navegar através dos parâmetrosque estão associados com a opção Cluster. Quando você tiver navegado para oparâmetro desejado, pressione o botão de seleção.

Os parâmetros que estão disponíveis incluem:v IPv4 Addressv IPv4 Subnetv IPv4 Gatewayv IPv4 Confirm Create?v IPv6 Addressv IPv6 Subnetv IPv6 Gatewayv IPv6 Confirm Create?

Se você estiver criando o sistema em cluster com um endereço IPv4, conclua asseguintes etapas:1. Pressione e libere o botão para cima ou para baixo até que Ações? seja exibido.

Pressione e solte o botão Selecionar.2. Pressione e libere o botão para cima ou para baixo até que o Cluster IPv4? seja

exibido. Pressione e solte o botão Selecionar.3. Edite o endereço IPv4, a sub-rede IPv4 e o gateway IPv4.4. Pressione e libere o botão esquerdo ou direito até que IPv4 Confirm Create?

seja exibido.5. Pressione e solte o botão de seleção para confirmar.

Se você estiver criando o sistema em cluster com um endereço IPv6, conclua asseguintes etapas:1. Pressione e libere o botão para cima ou para baixo até que Ações? seja exibido.

Pressione e solte o botão Selecionar.2. Pressione e libere o botão esquerdo ou direito até que Cluster Ipv6? seja

exibido. Pressione e solte o botão Selecionar.3. Edite o endereço IPv6, o prefixo IPv6 e o gateway IPv6.4. Pressione e libere o botão esquerdo ou direito até que IPv6 Confirm Create?

seja exibido.5. Pressione e solte o botão de seleção para confirmar.

Opção Endereço IPv4

Usando o endereço IPv4, é possível configurar o endereço IP para a porta Ethernet1 do sistema em cluster que você irá criar. O sistema pode ter um endereço IPv4

Capítulo 6. Usando o painel frontal do SAN Volume Controller 111

Page 130: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

ou IPv6 ou ambos ao mesmo tempo. É possível configurar o endereço degerenciamento IPv4 ou IPv6 para porta Ethernet 1 a partir do painel frontalquando você estiver criando o sistema. Se necessário, você pode incluir maisendereços IP de gerenciamento a partir da CLI.

Atenção: Quando você configura o endereço IPv4, assegure que você digite oendereço correto. Caso contrário, você pode não ser capaz de acessar o sistemausando as ferramentas de linha de comandos ou o GUI de gerenciamento.

Execute as etapas a seguir para configurar o endereço IPv4:1. Navegue para o painel de Endereço IPv4.2. Pressione o botão Selecionar. O primeiro número do endereço IP é destacado.3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;

pressione o botão para baixo, se desejar diminuir esse valor. Se desejaraumentar rapidamente o valor destacado, mantenha pressionado o botão paracima. Se desejar diminuir rapidamente o valor destacado, mantenhapressionado o botão para baixo.

Nota: Se você desejar desativar a função aumentar ou diminuir rápido,mantenha pressionado o botão para baixo, pressione e solte o botão Selecionare, em seguida, solte o botão para baixo. A desativação da função aumentar oudiminuir rápido dura até a conclusão da criação ou até o recurso ser ativadonovamente. Se o botão para cima ou o botão para baixo for mantidopressionado enquanto a função estiver desativada, o valor aumentará oudiminuirá a uma vez a cada dois segundos. Para ativar novamente a funçãoaumentar ou diminuir rápido, mantenha pressionado o botão para cima,pressione e solte o botão Selecionar e, em seguida, solte o botão para cima.

4. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

5. Repita as etapas 3 e 4 para cada campo de número que deseja configurar.6. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,

pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

Pressione o botão direito para exibir a próxima opção secundária ou pressione obotão esquerdo para exibir as opções anteriores.

Opção de Sub-rede IPv4

Usando esta opção, é possível configurar a máscara de sub-rede IPv4 para a portaEthernet 1.

Atenção: Quando você configura o endereço de máscara de sub-rede IPv4,assegure que você digite o endereço correto. Caso contrário, você pode não sercapaz de acessar o sistema usando as ferramentas de linha de comandos ou o GUIde gerenciamento.

Execute as etapas a seguir para configurar a máscara de sub-rede:1. Navegue para o painel de Sub-rede IPv4.2. Pressione o botão Selecionar. O primeiro número de máscara de sub-rede é

destacado.3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;

pressione o botão para baixo, se desejar diminuir esse valor. Se desejar

112 SAN Volume Controller: Guia de Resolução de Problemas

Page 131: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

aumentar rapidamente o valor destacado, mantenha pressionado o botão paracima. Se desejar diminuir rapidamente o valor destacado, mantenhapressionado o botão para baixo.

Nota: Se você desejar desativar a função aumentar ou diminuir rápido,mantenha pressionado o botão para baixo, pressione e solte o botão Selecionare, em seguida, solte o botão para baixo. A desativação da função aumentar oudiminuir rápido dura até a conclusão da criação ou até o recurso ser ativadonovamente. Se o botão para cima ou o botão para baixo for mantidopressionado enquanto a função estiver desativada, o valor aumentará oudiminuirá a uma vez a cada dois segundos. Para ativar novamente a funçãoaumentar ou diminuir rápido, mantenha pressionado o botão para cima,pressione e solte o botão Selecionar e, em seguida, solte o botão para cima.

4. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

5. Repita as etapas 3 e 4 para cada campo de número que deseja configurar.6. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,

pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

Opção do Gateway IPv4

Usando essa opção, é possível configurar o endereço do gateway IPv4 para a portaEthernet 1.

Atenção: Quando você configurar o endereço do gateway IPv4, assegure quevocê digite o endereço correto. Caso contrário, você pode não ser capaz de acessaro sistema usando as ferramentas de linha de comandos ou o GUI degerenciamento.

Execute as etapas a seguir para configurar o endereço do gateway IPv4:1. Navegue para o painel Gateway IPv4.2. Pressione o botão Selecionar. O primeiro campo de número do endereço de

gateway é realçado.3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;

pressione o botão para baixo, se desejar diminuir esse valor. Se desejaraumentar rapidamente o valor destacado, mantenha pressionado o botão paracima. Se desejar diminuir rapidamente o valor destacado, mantenhapressionado o botão para baixo.

Nota: Se você desejar desativar a função aumentar ou diminuir rápido,mantenha pressionado o botão para baixo, pressione e solte o botão Selecionare, em seguida, solte o botão para baixo. A desativação da função aumentar oudiminuir rápido dura até a conclusão da criação ou até o recurso ser ativadonovamente. Se o botão para cima ou o botão para baixo for mantidopressionado enquanto a função estiver desativada, o valor aumentará oudiminuirá a uma vez a cada dois segundos. Para ativar novamente a funçãoaumentar ou diminuir rápido, mantenha pressionado o botão para cima,pressione e solte o botão Selecionar e, em seguida, solte o botão para cima.

4. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

5. Repita as etapas 3 e 4 para cada campo de número que deseja configurar.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 113

Page 132: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

6. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

Opção IPv4 Confirm Create?

Usando essa opção, é possível iniciar uma operação para criar um sistema com umendereço IPv4.1. Pressione e libere o botão esquerdo ou direito até que IPv4 Confirm Create?

seja exibido.2. Pressione o botão de seleção para iniciar a operação.

Se a operação criar for bem-sucedida, a Senha será exibida na linha 1. A senhaque você poderá usar para acessar o sistema será exibida na linha 2.Certifique-se de registrar a senha imediatamente; isso é obrigatório na primeiratentativa de gerenciar o sistema a partir do GUI de gerenciamento.Atenção: A senha é exibida por apenas 60 segundos ou até que um botão dopainel frontal seja pressionado. O sistema é criado somente após a exibição desenha ser limpa.Se a operação de criação falhar, Create Failed: será exibido na linha 1 da telade exibição do painel frontal. A linha 2 exibe um dos dois códigos de erropossíveis que pode ser usado para isolar a causa da falha.

Opção Endereço IPv6

Usando essa opção, é possível configurar o endereço IPv6 para a porta Ethernet 1do sistema que você irá criar. O sistema pode ter um endereço IPv4 ou IPv6 ouambos ao mesmo tempo. É possível configurar o endereço de gerenciamento IPv4ou IPv6 para porta Ethernet 1 a partir do painel frontal quando você estivercriando o sistema. Se necessário, você pode incluir mais endereços IP degerenciamento a partir da CLI.

Atenção: Quando você configurar o endereço IPv6, assegure que você digite oendereço correto. Caso contrário, você pode não ser capaz de acessar o sistemausando as ferramentas de linha de comandos ou o GUI de gerenciamento.

Para configurar o endereço IPv6:1. A partir da opção Criar Cluster?, pressione o botão Selecionar e, em seguida,

pressione o botão para baixo. A opção Endereço IPv6 é exibida.2. Pressione o botão Selecionar novamente. O primeiro número do endereço IPv6

é destacado. .3. Mova entre os painéis de endereço usando o botão esquerdo ou o botão direito.

Os endereços IPv6 e os endereços de gateway IPv6 consistem em oito valoreshexadecimais (4 dígitos) que são mostrados em quatro painéis

4. É possível alterar cada número no endereço independentemente. Pressione obotão para cima, se desejar aumentar o valor que está destacado; pressione obotão para baixo, se desejar diminuir esse valor.

5. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

6. Repita as etapas 3 e 4 para cada campo de número que deseja configurar.7. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,

pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

114 SAN Volume Controller: Guia de Resolução de Problemas

Page 133: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opção Prefixo IPv6

Usando essa opção, é possível configurar o prefixo IPv6 para a porta Ethernet 1.

Atenção: Quando você configurar o prefixo IPv6, assegure-se de digitar o prefixode rede correto. Caso contrário, talvez você não consiga acessar as ferramentas dacomandos ou o GUI de gerenciamento.

Execute as etapas a seguir para configurar o prefixo IPv6:

Nota: Essa opção é restrita a um valor de 0 – 127.1. Pressione e libere o botão esquerdo ou direito até que o Prefixo IPv6 seja

exibido.2. Pressione o botão Selecionar. O primeiro campo de número de prefixo é

destacado.3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;

pressione o botão para baixo, se desejar diminuir esse valor. Se desejaraumentar rapidamente o valor destacado, mantenha pressionado o botão paracima. Se desejar diminuir rapidamente o valor destacado, mantenhapressionado o botão para baixo.

Nota: Se você desejar desativar a função aumentar ou diminuir rápido,mantenha pressionado o botão para baixo, pressione e solte o botão Selecionare, em seguida, solte o botão para baixo. A desativação da função aumentar oudiminuir rápido dura até a conclusão da criação ou até o recurso ser ativadonovamente. Se o botão para cima ou o botão para baixo for mantidopressionado enquanto a função estiver desativada, o valor aumentará oudiminuirá a uma vez a cada dois segundos. Para ativar novamente a funçãoaumentar ou diminuir rápido, mantenha pressionado o botão para cima,pressione e solte o botão Selecionar e, em seguida, solte o botão para cima.

4. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

Opção Ipv6 Gateway

Usando essa opção, você pode configurar o gateway IPv6 para a porta Ethernet 1.

Atenção: Quando você configurar o endereço de gateway IPv6, assegure-se dedigitar o endereço correto. Caso contrário, você pode não ser capaz de acessar osistema usando as ferramentas de linha de comandos ou o GUI de gerenciamento.

Execute os passos a seguir para configurar o endereço do gateway IPv6:1. Pressione e libere o botão esquerdo ou direito até que IPv6 Gateway seja

exibido.2. Pressione o botão Selecionar. O primeiro número do endereço de gateway é

destacado. Os endereços IPv6 e os endereços de gateway IPv6 consistem emoito valores hexadecimais (4 dígitos) que são mostrados em quatro painéis.

3. É possível alterar cada número no endereço independentemente. Pressione obotão para cima, se desejar aumentar o valor que está destacado; pressione obotão para baixo, se desejar diminuir esse valor.

4. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

5. Repita as etapas 3 e 4 para cada campo de número que deseja configurar.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 115

Page 134: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

6. Pressione o botão Selecionar para confirmar as configurações. Caso contrário,pressione o botão direito para exibir a próxima opção secundária ou pressioneo botão esquerdo para exibir as opções anteriores.

Opção IPv6 Confirm Create?

Usando essa opção, é possível iniciar uma operação para criar um sistema com umendereço IPv6.1. Pressione e libere o botão esquerdo ou direito até que IPv6 Confirm Create?

seja exibido.2. Pressione o botão de seleção para iniciar a operação.

Se a operação criar for bem-sucedida, a Senha será exibida na linha 1. A senhaque você poderá usar para acessar o sistema será exibida na linha 2.Certifique-se de registrar a senha imediatamente; isso é obrigatório na primeiratentativa de gerenciar o sistema a partir do GUI de gerenciamento.Atenção: A senha é exibida por apenas 60 segundos ou até que um botão dopainel frontal seja pressionado. O sistema é criado somente após a exibição desenha ser limpa.Se a operação de criação falhar, Create Failed: será exibido na linha 1 da telade exibição do painel frontal. A linha 2 exibe um dos dois códigos de erropossíveis que pode ser usado para isolar a causa da falha.

Opções de IPv4 ou IPv6 de serviçoÉ possível usar o painel frontal para alterar um endereço IPv4 ou um endereçoIPv6 de serviço.

Opção Endereço IPv4

Os painéis de endereço IPv4 mostram um dos seguintes itens para a porta Ethernetselecionada:v O endereço de serviço ativo se o sistema tiver um endereço IPv4. Este endereço

pode ser configurado ou fixo, ou pode ser um endereço obtido por meio doDHCP.

v DHCP Failed se o endereço de serviço IPv4 estiver configurado para DHCP, maso nó não pôde obter um endereço IP.

v DHCP Configuring se o endereço de serviço IPv4 estiver configurado para DHCPenquanto o nó tentar obter um endereço IP. Esse endereço muda para o endereçoIPv4 automaticamente se um endereço DHCP estiver alocado e ativado.

v Uma linha em branco se o sistema não tiver um endereço IPv4.

Se o endereço de serviço IPv4 não foi configurado corretamente ou um endereçoDHCP não foi alocado, você tem a opção de corrigir o endereço IPv4 a partir destepainel. O endereço IP de serviço deve estar na mesma sub-rede que o endereço IPde gerenciamento.

Para configurar um endereço de serviço IPv4 fixo a partir do painel Endereço IPv4,execute as etapas a seguir:1. Pressione e libere o botão Selecionar para colocar o painel no modo de edição.2. Pressione do botão direito ou o botão esquerdo para mover o campo de

número que deseja configurar.3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;

pressione o botão para baixo, se desejar diminuir esse valor. Se desejar

116 SAN Volume Controller: Guia de Resolução de Problemas

Page 135: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

aumentar rapidamente o valor destacado, mantenha pressionado o botão paracima. Se desejar diminuir rapidamente o valor destacado, mantenhapressionado o botão para baixo.

Nota: Se você desejar desativar a função aumentar ou diminuir rápido,mantenha pressionado o botão para baixo, pressione e solte o botão Selecionare, em seguida, solte o botão para baixo. A desativação da função aumentar oudiminuir rápido dura até a conclusão da criação ou até o recurso ser ativadonovamente. Se o botão para cima ou o botão para baixo for mantidopressionado enquanto a função estiver desativada, o valor aumentará oudiminuirá a uma vez a cada dois segundos. Para ativar novamente a funçãoaumentar ou diminuir rápido, mantenha pressionado o botão para cima,pressione e solte o botão Selecionar e, em seguida, solte o botão para cima.

4. Quando todos os campos estiverem configurados conforme necessário,pressione e libere o botão Selecionar para ativar o novo endereço IPv4.O painel Endereço IPv4: é exibido. O novo endereço IPv4 de serviço não éexibido até que ele se torne ativo. Se o novo endereço não foi exibido após 2minutos, verifique se o endereço selecionado é válido na sub-rede e se ocomutador de Ethernet está funcionando corretamente.

Opção Endereço IPv6

Os painéis Endereço IPv6 mostram uma das condições a seguir para a portaEthernet selecionada:v O endereço de serviço ativo se o sistema tiver um endereço IPv6. Este endereço

pode ser configurado ou fixo, ou pode ser um endereço obtido por meio doDHCP.

v DHCP Failed se o endereço de serviço IPv6 estiver configurado para DHCP, maso nó não pôde obter um endereço IP.

v DHCP Configuring se o endereço de serviço IPv6 estiver configurado para DHCPenquanto o nó tenta obter um endereço IP. Isso muda para o endereço IPv6automaticamente se um endereço DHCP estiver alocado e ativado.

v Uma linha em branco se o sistema não tiver um endereço IPv6.

Se o endereço de serviço IPv6 não foi configurado corretamente ou um endereçoDHCP não foi alocado, você tem a opção de corrigir o endereço IPv6 a partir destepainel. O endereço IP de serviço deve estar na mesma sub-rede que o endereço IPde gerenciamento.

Para definir um endereço de serviço IPv6 fixo a partir do painel Endereço IPv6:,execute as etapas a seguir:1. Pressione e libere o botão Selecionar para colocar o painel no modo de edição.

Quando o painel estiver no modo de edição, o endereço completo ainda serámostrado em quatro painéis como oito valores hexadecimais (quatro dígitos).Dada dígito dos valores hexadecimais é editado independentemente. O dígitoatual é destacado.

2. Pressione do botão direito ou o botão esquerdo para mover o campo denúmero que deseja configurar.

3. Pressione o botão para cima, se desejar aumentar o valor que está destacado;pressione o botão para baixo, se desejar diminuir esse valor.

4. Quando todos os campos forem configurados conforme necessário, pressione elibere o botão Selecionar para ativar o novo endereço IPv6.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 117

Page 136: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O painel Endereço IPv6: é exibido. O novo endereço de serviço IPv6 não éexibido até que ele se torne ativo. Se o novo endereço não foi exibido após 2minutos, verifique se o endereço selecionado é válido na sub-rede e se ocomutador de Ethernet está funcionando corretamente.

Opções do DHCPv4 ou DHCPv6 de serviçoO endereço de serviço ativo para um sistema pode ser um endereço configuradoou fixo ou pode ser um endereço obtido por meio do DHCP.

Se um endereço IP de serviço não existir, você deverá designar um endereço IP deserviço ou usar o Protocolo de Configuração de Host Dinâmico com esta ação.

Para configurar o endereço IPv4 serviço para usar o Protocolo de Configuração deHost Dinâmico, execute as seguintes etapas:1. Pressione e solte o botão para cima ou para baixo até que Atender DHCPv4? seja

exibido.2. Pressione e solte o botão para baixo. Confirmar DHCPv4? é exibido.3. Pressione e solte o botão de seleção para ativar o Protocolo de Configuração de

Host Dinâmico ou é possível pressionar e soltar o botão para cima para mantero endereço existente.

4. Se você ativar o Protocolo de Configuração de Host Dinâmico, DHCPConfiguring é exibido enquanto o nó tenta obter um endereço do Protocolo deConfiguração de Host Dinâmico. Ele altera automaticamente para mostrar oendereço alocado se um endereço do Protocolo de Configuração de HostDinâmico for alocado e ativado ou se alterar para DHCP Failed se um endereçodo Protocolo de Configuração de Host Dinâmico não estiver alocado.

Para configurar o endereço IPv6 de serviço para usar o Protocolo de Configuraçãode Host Dinâmico, execute as seguintes etapas:1. Pressione e solte o botão para cima ou para baixo até que Atender DHCPv6? seja

exibido.2. Pressione e solte o botão para baixo. Confirm DHCPv6? é exibido.3. Pressione e solte o botão de seleção para ativar o Protocolo de Configuração de

Host Dinâmico ou é possível pressionar e soltar o botão para cima para mantero endereço existente.

4. Se você ativar o Protocolo de Configuração de Host Dinâmico, DHCPConfiguring é exibido enquanto o nó tenta obter um endereço do Protocolo deConfiguração de Host Dinâmico. Ele altera automaticamente para mostrar oendereço alocado se um endereço do Protocolo de Configuração de HostDinâmico for alocado e ativado ou se alterar para DHCP Failed se um endereçodo Protocolo de Configuração de Host Dinâmico não estiver alocado.

Nota: Se um roteador IPv6 estiver presente na rede local, SAN VolumeController não diferencia entre um endereço autoconfigurado e um endereço doProtocolo de Configuração de Host Dinâmico. Portanto, SAN VolumeController usa o primeiro endereço que é detectado.

Opção Alterar WWNN?A opção Alterar WWNN? exibe os últimos cinco dígitos hexadecimais do WWNNque está sendo utilizado pelo nó. Apenas os últimos cinco dígitos de um WWNNvariam em um nó. Os primeiros 11 dígitos são sempre 50050768010.

Para editar o WWNN, conclua as seguintes etapas:

118 SAN Volume Controller: Guia de Resolução de Problemas

Page 137: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Importante: Apenas altere o WWNN quando você for instruído a fazer isso porum procedimento de serviço. Nós sempre devem ter um WWNN exclusivo. Sealterar o WWNN, você pode ter de reconfigurar os hosts e o zoneamento da SAN.1. Pressione e solte o botão para cima ou para baixo até que Ações seja exibido.2. Pressione e solte o botão Selecionar.3. Pressione e libere o botão para cima ou para baixo até Alterar WWNN? ser

exibido na linha 1. A linha 2 do visor mostra os cinco últimos números doWWNN que está configurado atualmente. O primeiro número é destacado.

4. Edite o número destacado para corresponder ao número que é necessário. Useos botões para cima e para baixo para aumentar ou diminuir os números. Osnúmeros são quebrados de F a 0 ou de 0 a F. Use os botões para a esquerda epara a direita para mover entre os números.

5. Quando o valor realçado corresponder ao número necessário, pressione e solteo botão Selecionar para ativar a alteração. O painel Nó WWNN: aparece e asegunda linha mostra os cinco últimos caracteres do WWNN alterado.

Opção Inserir Serviço?É possível inserir o estado de serviço a partir da opção Inserir Serviço? O estadode serviço pode ser usado para remover um nó de uma lista de candidatos ou paraevitar que ele seja incluído a um sistema em cluster.

Se o nó estiver ativo, a entrada no estado de serviço poderá causar a interrupçãodos hosts se outras falhas existirem no sistema. Enquanto estiver no estado deserviço, o nó não poderá ser unido ou executado como parte de um sistema emcluster.

Para sair do estado de serviço, assegure-se de que todos os erros sejam resolvidos.É possível sair do estado de serviço usando o Serviço de Saída? opção oureiniciando o nó.

Opção Serviço de Saída?É possível sair do estado de serviço do Serviço de Saída? opção. Esta ação libera onó do estado de serviço.

Se não houver erros não críticos, o nó entrará no estado de candidato. Se possível,o nó se tornará, então, ativo em um sistema em cluster.

Para sair do estado de serviço, assegure-se de que todos os erros sejam resolvidos.É possível sair do estado de serviço usando essa opção ou reiniciando o nó.

Opção Recuperar Cluster?Você pode recuperar todo o sistema em cluster se os dados tiverem sido perdidosde todos os nós usando o Recuperar Cluster? opção.

Execute as ações de serviço nos nós apenas quando orientado pelos procedimentosde serviço. Se usadas inadequadamente, as ações de serviço poderão causar perdade acesso aos dados ou perda de dados.

Para obter informações sobre o procedimento do sistema de recuperação, consulte“Procedimento do Sistema de Recuperação” na página 273.

Opção Remover cluster?A opção Remover Cluster? exclui os dados de estado do sistema do nó.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 119

Page 138: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Use essa opção como a etapa final em desatribuição de um sistema após ou outrosnós terem sido removidos do sistema usando a interface da linha de comandos(CLI) ou GUI de gerenciamento.

Atenção: Use o painel frontal para remover os dados do estado de um únicosistema de nós. Para remover um nó de um sistema de diversos nós, use sempre aCLI ou as opções Remover Nó do GUI de gerenciamento.

Para excluir os dados de estado do nó usando o painel Remover Cluster?:1. Mantenha pressionado o botão para cima.2. Pressione e solte o botão Selecionar.3. Solte o botão para cima.

Após a opção ser executada, o nó mostrará Cluster: sem um nome de sistema. Seessa opção for executada em um nó que ainda é um membro de um sistema, osistema mostrará o erro 1195, Node missing, e o nó será exibido na lista de nós nosistema. Remova o nó usando o GUI de gerenciamento ou a CLI.

Opção Upgrade em Etapas?Use esta opção para controlar o tempo em que os nós individuais são atualizadosdentro de uma atualização do sistema.

Nota: Essa ação pode ser usada apenas quando as seguintes condições existirempara o nó:v O nó está em estado de serviço.v O nó não possui erros.v O nó foi removido do sistema em cluster.

Para obter informações adicionais, consulte o tópico “Fazendo upgrade do softwaremanualmente” no centro de informações.

Opção Definir Velocidade do Fibre Channel?É possível alterar a velocidade das portas Fibre Channel em um SAN VolumeController usando a opção Definir Velocidade do Fibre Channel?

Opção Redefinir senha?A opção Reconfigurar senha? é útil se a senha do superusuário do sistema foiperdida ou esquecida.

Use a opção Reconfigurar senha? se o usuário perdeu a senha do superusuário dosistema ou se o usuário não conseguir acessar o sistema. Se for permitido pelapolítica de segurança da senha do usuário, use essa opção para reconfigurar asenha do superusuário do sistema.

Se sua política de segurança de senha permitir a recuperação de senha, e se o nófor atualmente um membro de um sistema em cluster, a senha do superusuário dosistema será reconfigurada e uma nova senha é exibida por 60 segundos. Se suapolítica de segurança de senha não permitir recuperação de senha ou o nó não forum membro de um sistema, concluir estas etapas não tem efeito.

Se o nó estiver no estado ativo quando a senha for reconfigurada, a reconfiguraçãoaplica-se a todos os nós no sistema. Se o nó estiver no estado candidato ou deserviço quando a senha for reconfigurada, a reconfiguração se aplicará apenas aonó único.

120 SAN Volume Controller: Guia de Resolução de Problemas

Page 139: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Opção Resgatar Nó?É possível iniciar a recuperação automática de software para esse nó usando o Nóde Resgate? opção.

Nota: Outra maneira de resgatar um nó é forçar um resgate do nó quando o nó éinicializado. Ele é o método preferencial. Forçar um resgate do nó quando um nó éinicializado funciona reinicializando o sistema operacional no controlador deserviço e executando um programa que copia todos os softwares do SAN VolumeController de qualquer outro nó que possa ser localizado na malha Fibre Channel.Consulte “Concluindo o resgate do nó quando o nó for inicializado” na página293.

Opção Ações de Saída?Retorne ao menu principal, selecionando as Ações de Saída? opção.

Opção Idioma?É possível alterar o idioma que é exibido no painel frontal.

Antes de Iniciar

O Idioma? a opção permite alterar o idioma que é exibido no menu. Figura 57mostra o Idioma? sequência de opção.

Os idiomas a seguir estão disponíveis:v Inglêsv Japonês

Sobre Esta Tarefa

Para selecionar o idioma que você deseja que seja usado no painel frontal, executeas seguintes etapas:

Procedimento1. Pressione e solte o botão para cima ou para baixo até que Idioma? seja exibido.2. Pressione e solte o botão Selecionar.3. Use os botões da direita e da esquerda para mover para o idioma que você

deseja. Os nomes de idiomas traduzidos são exibidos em seus própriosconjuntos de caracteres. Se você não compreender o idioma que for exibido,aguarde pelo menos 60 segundos para que o menu seja reconfigurado para aopção padrão.

4. Pressione e solte o botão de seleção para selecionar o idioma exibido.

Inglês? Japonês?

Idioma?

Selecionar

svc00410

Figura 57. Navegação navegação

Capítulo 6. Usando o painel frontal do SAN Volume Controller 121

Page 140: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resultados

Se o idioma selecionado usar o alfabeto latino, a exibição do painel frontalmostrará duas linhas. O texto do painel é exibido na primeira linha e os dadosadicionais na segunda.

Se o idioma selecionado não usar o alfabeto latino, a exibição mostrará apenas umalinha por vez para exibir claramente a fonte do caractere. Para esses idiomas, épossível alternar entre o texto do painel e os dados adicionais pressionando esoltando o botão de seleção.

Os dados adicionais estarão indisponíveis quando o painel frontal exibir umaopção de menu, a qual termina com um ponto de interrogação (?). Nesse caso,pressione e solte o botão de seleção para escolher a opção de menu.

Nota: Não é possível selecionar outro idioma quando o nó está exibindo um errode inicialização.

Usando o controle de energia para o nó do SAN Volume ControllerAlguns nós do SAN Volume Controller são alimentados por um fonte dealimentação ininterruptaque está no mesmo rack que os nós. Outros nós possuembaterias internas no lugar, como o SAN Volume Controller 2145-DH8.

O estado de energia do SAN Volume Controller é exibido por um indicador deenergia no painel frontal. Se a bateria do fonte de alimentação ininterrupta nãoestiver suficientemente carregada para ativar o SAN Volume Controller para ficartotalmente operacional, seu estado da carga será exibido na exibição do painelfrontal do nó.

A energia para um SAN Volume Controller é controlada através da GUI degerenciamento ou pelo botão de energia no painel frontal do nó. .

Nota: Nunca desligar o nó removendo o cabo de energia. Você poderá perderdados. Para obter mais informações sobre como desligar o nó, consulte“MAP 5350:Desligando um nó” na página 328

Se o software SAN Volume Controller estiver em execução e você solicitar paradesligar a partir do GUI de gerenciamento, CLI ou o botão de energia, o nóiniciará seu processamento de desligamento. Durante esse tempo, o nó indica oprogresso da operação de desligamento na exibição do painel frontal. Após oprocessamento de desligamento ser concluída, o painel frontal ficará em branco e oindicador de energia do painel frontal piscará. É seguro que você remova o cabode energia da parte traseira do nó. Se o botão de energia no painel frontal forpressionado durante o processamento de desligamento, a exibição do painel frontalserá alterado para indicar que o nó está sendo reiniciado, mas o processo dedesligamento será concluído antes da reinicialização.

Se o software SAN Volume Controller não estiver em execução quando o botão deenergia do painel frontal for pressionado, o nó imediatamente desligará.

Nota: O 2145 UPS-1U não desligará quando o nó for encerrado a partir do botãode energia.

122 SAN Volume Controller: Guia de Resolução de Problemas

Page 141: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se você desligar um nó usando o botão de energia ou por um comando, o nó serácolocado em um estado de desligamento. O SAN Volume Controller permanecenesse estado até que o cabo de energia esteja conectado à parte traseira do nó e obotão de energia seja pressionado.

Durante a sequência de inicialização, o SAN Volume Controller tentará detectar ostatus do fonte de alimentação ininterrupta através do cabo de sinal do fonte dealimentação ininterrupta. Se um fonte de alimentação ininterrupta não fordetectado, o nó irá parar e um erro será mostrado na exibição do painel frontal. Seo fonte de alimentação ininterrupta for detectado, o software irá monitorar oestado operacional do fonte de alimentação ininterrupta. Se nenhum erro do fontede alimentação ininterrupta for relatado e a bateria do fonte de alimentaçãoininterrupta estiver suficientemente carregada, o SAN Volume Controller se tornaráoperacional. Se a bateria do fonte de alimentação ininterrupta não estiversuficientemente carregada, o estado de carga será indicado por uma barra deprogresso na exibição do painel frontal. Quando umfonte de alimentaçãoininterruptafor ligado pela primeira vez, ele poderá demorar até duas horas antesque bateria esteja suficientemente carregada para o nó do SAN Volume Controllerse tornar operacional.

Se a energia de entrada para o fonte de alimentação ininterrupta for perdida, o nóimediatamente irá parar todas as operações de E/S e salvará o conteúdo de suamemória de acesso aleatório dinâmica (DRAM) na unidade de disco interna.Enquanto os dados estão sendo salvos na unidade de disco, uma mensagem Falhade Energia será mostrada no painel frontal e serão acompanhadas de uma barrade progresso decrescente que indicará a quantia de dados restantes que serãosalvos. Após todos os dados serem salvos, o nó será desligado e o indicador deenergia no painel frontal desligará.

Nota: O nó agora está em estado de espera. Se a energia de entrada para aunidade do fonte de alimentação ininterrupta for restaurada, o nó reiniciará. Se abateria do fonte de alimentação ininterrupta foi totalmente descarregada, Chargingserá exibido e o processo de inicialização aguardará que a bateria seja carregada.Quando a bateria estiver suficientemente carregada, Booting será exibido, o nó serátestado e o software carregado. Quando o processo de inicialização for concluído,Recovering será exibido enquanto o fonte de alimentação ininterrupta finaliza suacarga. Enquanto Recovering for exibido, o sistema poderá funcionar normalmente.No entanto, quando a energia for restaurada após uma segunda falha de energia,haverá um atraso (com Charging exibido) antes que o nó possa concluir seuprocesso de inicialização.

Capítulo 6. Usando o painel frontal do SAN Volume Controller 123

Page 142: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

124 SAN Volume Controller: Guia de Resolução de Problemas

Page 143: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 7. Diagnosticando problemas

É possível diagnosticar problemas com o controle e os indicadores, a interface delinhas de comandos (CLI), a GUI de gerenciamento ou a GUI Assistente de Serviço.Os LEDs de diagnóstico nos nós do SAN Volume Controller e nas unidades fontede alimentação ininterrupta também o ajudam a diagnosticar problemas dehardware.

Logs de eventos

Ao entender o log de eventos, é possível executar as tarefas a seguir:v Gerenciar o log de eventosv Visualizar o log de eventosv Descrever os campos no log de eventos

Códigos de erros

Os tópicos a seguir fornecem informações para ajudá-lo a entender e processar oscódigos de erro:v Relatórios de eventosv Entendendo os eventosv Entendendo os códigos de errov Determinando uma falha de inicialização de hardware

Se o nó está mostrando uma mensagem de erro, mensagem de falha ou mensagemde erro do nó e determinou que o problema foi causado por uma falha de softwareou firmware, é possível reiniciar o nó para ver se ele pode resolver o problema.Execute as etapas a seguir para encerrar corretamente e reiniciar o nó:1. Siga as instruções em “MAP 5350: Desligando um nó” na página 328.2. Reinicie apenas um nó a cada vez.3. Não encerre o segundo nó em um grupo de E/S por pelo menos 30 minutos

após encerrar e reiniciar o primeiro nó.

Iniciando a Coleta de Estatísticasé possível iniciar a coleta de estatísticas do cluster do Iniciando a Coleta deEstatísticas painel no GUI de gerenciamento.

Introdução

Para cada intervalo de coleta, o GUI de gerenciamento cria quatro arquivos deestatísticas: um para discos gerenciados (MDisks), chamado Nm_stat; um paravolumes e cópias de volume, chamado Nv_stat; um para nós, chamado Nn_stat; eum para unidades SAS, chamado Nd_stat. Os arquivos são gravados nodiretório /dumps/iostats no nó. Para recuperar os arquivos de estatísticas a partirdos nós não de configuração no nó de configuração, svctask cpdumps comandodeve ser utilizado.

Um máximo de 16 arquivos de cada tipo pode ser criada para o nó. Quando oarquivo 17⌂ for criado, o arquivo mais antigo para o nó é sobrescrito.

© Copyright IBM Corp. 2003, 2016 125

1

Page 144: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Campos

Os seguintes campos estão disponíveis para definição de usuário :

IntervaloEspecifique o intervalo em minutos entre a coleta de estatísticas. Você podeespecificar 1 60 minutes em incrementos de 1 minute.

Tabelas

As seguintes tabelas descrevem as informações relatadas para nós e volumesindividuais.

Tabela 54 descreve a coleta de estatísticas para discos gerenciados, para nósindividuais.

Tabela 54. Estatísticas a coleta para nós individuais

Nome daestatística

Descrição

id Indica o nome do MDisk para o qual as estatísticas se aplicam.

idx Indica o identificador do MDisk para o qual as estatísticas se aplicam.

rb Indica o número acumulativo de blocos de dados que são lidos (desde que onó está em execução).

re Indica o tempo de resposta externo de leitura acumulativa em milissegundospara cada MDisk. O tempo de resposta acumulado para leituras de disco écalculado iniciando um cronômetro quando um SCSI de leitura comando éemitido e parado quando o comando é concluído com êxito. O tempodecorrido é adicionado ao contador acumulativo.

ro Indica o número acumulativo de operações de leitura de MDisk que sãoprocessadas (desde que o nó está em execução).

rq-4 Indica o tempo de resposta em fila de leitura acumulativa em milissegundospara cada MDisk. Essa resposta é medida a partir da fila de comandos aserem enviados para um MDisk devido a profundidade da fila já estar cheia.Este cálculo inclui o tempo decorrido que é efetuada para leitura comandospara conclusão a partir da data de adesão à fila.

wb Indica o número acumulativo de blocos de dados gravados (desde que o nóestá em execução).

we Indica o tempo de resposta externo de gravação acumulativa emmilissegundos para cada MDisk. O tempo de resposta total para gravaçõesde disco é calculado iniciando um cronômetro quando um comando SCSIwrite é emitido e interrompido quando o comando é concluído com êxito. Otempo decorrido é adicionado ao contador acumulativo.

wo Indica o número acumulativo de operações de gravação de MDiskprocessadas (desde que o nó está em execução).

wq Indica o tempo de resposta em fila de gravação acumulativa emmilissegundos para cada MDisk. Esse tempo é medido a partir da fila decomandos a serem enviados a um MDisk porque a profundidade da fila jáestá cheia. Este cálculo inclui o tempo decorrido gasto para de gravaçãocomandos para conclusão a partir da data de adesão à fila.

Tabela 55 na página 127 descreve as informações do VDisk (volume) que sãorelatadas para nós individuais.

126 SAN Volume Controller: Guia de Resolução de Problemas

Page 145: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Nota: arquivos de estatísticas MDisk para nós são gravados no diretório/dumps/iostats no nó individual.

Tabela 55. coleta de estatísticas para os volumes para nós individuais

Nome daestatística

Descrição

id Indica o nome do volume para o qual as estatísticas se aplicam.

idx Indica o volume para o qual as estatísticas se aplicam.

rb Indica o número acumulativo de blocos de dados lidos (desde que o nó estáem execução).

rl Indica o tempo de resposta de leitura acumulativa em milissegundos paracada volume. O tempo de resposta acumulado para leituras de volume écalculado iniciando um cronômetro quando um SCSI de leitura comando érecebida e parado quando o comando é concluído com êxito. O tempodecorrido é adicionado ao contador acumulativo.

rlw Indica o pior tempo de resposta de leitura em microssegundos para cadavolume desde a última vez que as estatísticas foram coletadas. Este valor éreconfigurado para zero depois de cada amostra da coleta de estatísticas.

ro Indica o número acumulativo de operações de leitura de volume processadas(desde que o nó está em execução).

wb Indica o número acumulativo de blocos de dados gravados (desde que o nóestá em execução).

bolachadevore

Indica o tempo de resposta de gravação acumulativo em milissegundos paracada volume. O tempo de resposta acumulativos para gravações do volume écalculado iniciando um cronômetro quando um SCSI de gravação comando érecebida e parado quando o comando é concluído com êxito. O tempodecorrido é adicionado ao contador acumulativo.

wlw Indica o pior tempo de resposta de gravação em microssegundos para cadavolume desde a última vez que as estatísticas foram coletadas. Este valor éreconfigurado para zero depois de cada amostra da coleta de estatísticas.

wo Indica o número acumulativo de operações de gravação de volumeprocessadas (desde que o nó está em execução).

wou Indica o número total de operações de gravação de volume que não estãoalinhadas em um limite de 4K.

xl Indica o tempo de resposta de transferência de dados de leitura e gravaçãoacumulativas em milissegundos para cada volume, desde a última vez que onó foi reconfigurado. Quando essa estatística é visualizado por váriosvolumes e com outras estatísticas, isto poderá indicar se a latência é causadapelo host, malha, ou o SAN Volume Controller.

Tabela 56 descreve as informações de disco virtual relacionadas aosrelacionamentos do Metro Mirror ou do Global Mirror que são relatadas para nósindividuais.

Tabela 56. coleta de estatísticas para volumes que são usados nos relacionamentos doMetro Mirror e do Global Mirror para nós individuais

Nome daestatística

Descrição

gwl Indica a latência de gravação secundárias acumulativo em milissegundos.Esta estatística cumula a latência de gravação secundárias acumulativo paracada volume. Você pode calcular a quantidade de tempo para recuperação deuma falha com base nesta estatística e o gws estatísticas.

Capítulo 7. Diagnosticando problemas 127

Page 146: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 56. coleta de estatísticas para volumes que são usados nos relacionamentos doMetro Mirror e do Global Mirror para nós individuais (continuação)

gwo Indica o número total de gravações de volume de sobreposição. Um degravação de sobreposição é quando o endereço de bloco lógico (LBA)intervalo de pedido de gravação em conflito com outro pedido pendente parao mesmo intervalo de LBA e o pedido de gravação ainda está pendente parao site secundário.

gwot Indica o número total de gravações sobrepostas fixo ou não. Quando todos osnós em todos os clusters estão executando SAN Volume Controller versão4.3.1, isso registra o número total de solicitações de E/S de gravaçãorecebidas pelo recurso Global Mirror no primário que foi sobreposto. Quandotodos os nós no cluster estão executando o SAN Volume Controller versõesanteriores a 4.3.1, esse valor não incremento.

gws Indica o número total de solicitações de gravação emitidas para o sitesecundário.

Tabela 57 descreve as informações da porta que são relatadas para nós individuais

Tabela 57. coleta de estatísticas para portas do nó

Nome daestatística

Descrição

bbcz Indica o tempo total, em microssegundos para o qual a porta tinha dadospara enviar mas foi impedido de fazê-lo pela falta de crédito de buffer docomutador.

cbr Indica o bytes recebidos de controladores.

cbt Indica o bytes transmitidos para controladores de disco.

cer Indica o comandos recebidos a partir de controladores de disco.

este Indica o comando iniciados para controladores de disco.

hbr Indica o bytes recebidos de hosts.

hbt Indica o bytes transmitidos para os hosts.

dela Indica os comandos recebidos dos hosts.

het Indica o comando iniciados para hosts.

cruz Indica o número de CRC que não são válidos.

id Indica o identificador da porta para o nó.

itw Indica o número de contagens de palavra de transmissão que não sãoválidos.

se Indica uma contagem de falha de link.

lnbr Indica o bytes recebidos de outros nós no mesmo cluster.

lnbt Indica o bytes transmitidos para outros nós no mesmo cluster.

lner Indica o comandos recebidos de outros nós no mesmo cluster.

lnet Indica o comando iniciado para outros nós no mesmo cluster.

lsi Indica a conta de perda de sinal.

lsy Indica a contagem de uma perda de sincronização.

pspe Indica a primitiva sequence-erro de contagem de protocolo.

rmbr Indica o bytes recebidos de outros nós no outros clusters.

rmbt Indica o bytes transmitidos para outros nós no outros clusters.

rmer Indica o comandos recebidos de outros nós no outros clusters.

128 SAN Volume Controller: Guia de Resolução de Problemas

Page 147: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 57. coleta de estatísticas para portas do nó (continuação)

rmet Indica o comando iniciado para outros nós no outros clusters.

wwpn Indica o nome de porta mundial para o nó.

Tabela 58 descreve as informações do nó que são relatadas para cada nó.

Tabela 58. Coleção de estatísticas para nós

Nome daestatística

Descrição

cluster_id Indica o nome do cluster.

cluster Indica o nome do cluster.

cpu busy – Indica a média de milissegundos de ocupação principal da CPU totaldesde que o nó foi reconfigurado. Esta estatística relata a quantidade detempo que o processador gastou aguardando por trabalho versus pesquisaenquanto tiver realmente fazendo o trabalho. Esta estatística acumula a partirdo zero.

comp – Indica a média de milissegundos de ocupação principal da CPU totalpara núcleos do processo de compactação desde que o nó foi reconfigurado.

system – Indica a média de milissegundos de ocupação principal da CPUtotal desde que o nó foi reconfigurado. Esta estatística relata a quantidade detempo que o processador gastou aguardando por trabalho versus pesquisaenquanto tiver realmente fazendo o trabalho. Esta estatística acumula a partirdo zero. Estas são as mesmas informações que as fornecidas com a estatísticacpu busy e eventualmente substituirão a estatística cpu busy.

cpu_core id – Indica o ID principal da CPU.

comp - Indica a média de milissegundos de ocupação principal da CPU pornúcleo para núcleos do processo de compactação desde que o nó foireconfigurado.

system – Indica a média de milissegundos de ocupação principal da CPU pornúcleo para núcleos do processo do sistema desde que o nó foireconfigurado.

id Indica o nome do nó.

node_id Indica o identificador exclusivo para o nó.

rb Indica o número de bytes recebidos.

re Indica o recebimento da latência acumulada, excluindo o tempo da fila deentrada. Esta estatística é a latência que é experiente pela camada decomunicação do nó a partir do momento em que um E/S é enfileirada paracache até a hora em que o cache fornece conclusão para ela.

ro Indica o número de mensagens ou dados em massa recebida.

rq-4 Indica a latência receber acumulado, incluindo o tempo da fila de entrada.Esta estatística é a latência a partir do momento em que um comando chegaà camada de comunicação do nó para o momento em que o cache concluir ocomando.

wb Indica o bytes enviados.

we Indica a latência, enviar, excluindo o tempo de fila de saída. Esta estatística éo tempo a partir de quando a camada de comunicação do nó emite umamensagem para o Fibre Channel até que a camada de comunicação do nóreceba a notificação de que a mensagem chegou.

wo Indica o número de mensagens ou dados em massa enviada.

Capítulo 7. Diagnosticando problemas 129

Page 148: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 58. Coleção de estatísticas para nós (continuação)

wq Indica a latência, enviar, incluindo o tempo de fila de saída. Esta estatísticainclui o tempo todo que os dados são enviados. Esse tempo inclui o tempode quando a camada de comunicação do nó recebe uma mensagem eaguarda os recursos, o tempo de enviar a mensagem para o nó remoto e otempo necessário para o nó remoto responder.

Tabela 59 descreve a coleta de estatísticas para volumes.

Tabela 59. Coleta de estatísticas de cache para volumes e cópias de volumes

Estatística AcrônimoEstatísticas paracache de volume

Estatísticas paracache de cópiade volume

Estatísticas parapartição decache de volume

Estatísticas parapartição decache de cópiade volume

Estatísticas parao Cache Geraldo Nó

Estatísticas decache paradiscosgerenciados

Unidades eestado

Lê ios ri Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

ios,acumulativos

ios de gravação omuta Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

ios,acumulativos

ausências de leitura r Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

ocorrências deleitura

está bem Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

flush_throughgravações

ft Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

fast_write gravações fw Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

write_throughgravações

wt Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

ocorrências degravação

o quê Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

As Pré-buscas p Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

número de visitasde pré-busca (dadosde pré-busca quesão lidos)

ph Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

perdas de pré-busca(páginas depré-busca que sãodescartadas semnenhum setor lido)

mp Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

páginas,acumulativas

dados modificados m sim sim setores, capturainstantânea, nãoacumulativo

dados do cache deleitura e gravação

v sim sim capturainstantânea desetores, nãoacumulativo

retransfere-os d Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

setores,acumulativos

Média deutilizadoras

fav Desmarcarcomentário

Desmarcarcomentário

Sim Sim Desmarcarcomentário

Desmarcarcomentário

%, nãoacumulativo

Totalidade Máx. fmx Desmarcarcomentário

Desmarcarcomentário

Sim Sim Desmarcarcomentário

Desmarcarcomentário

%, nãoacumulativo

Totalidade Mín. fmn Desmarcarcomentário

Desmarcarcomentário

Sim Sim Desmarcarcomentário

Desmarcarcomentário

%, nãoacumulativo

Média de Destagede Destino

dtav Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Sim IOs limitados a9999,não-acumulativos

Máximo de Destagede Destino

dtmx Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

ios, não-acumulativos

Min Destage dedestino

dtmn Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

ios, não-acumulativos

Em Média VôoDestage

dfav Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Sim IOs limitados a9999,não-acumulativos

Em Máximo VôoDestage

dfmx Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

ios, não-acumulativos

130 SAN Volume Controller: Guia de Resolução de Problemas

Page 149: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 59. Coleta de estatísticas de cache para volumes e cópias de volumes (continuação)

Estatística AcrônimoEstatísticas paracache de volume

Estatísticas paracache de cópiade volume

Estatísticas parapartição decache de volume

Estatísticas parapartição decache de cópiade volume

Estatísticas parao Cache Geraldo Nó

Estatísticas decache paradiscosgerenciados

Unidades eestado

Mover dados docache In FlightMin

dfmn Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Desmarcarcomentário

ios, não-acumulativos

média de latência dav Sim Sim Sim Sim Sim Sim µs limitados a9999999,não-acumulativos

latência máx. demover dados docache

se ouvires dmx Sim Sim Sim µs limitados a9999999,não-acumulativos

mín. de latência dmn Sim Sim Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

contagem de moverdados do cache

dcn Sim sim Sim Sim Sim Desmarcarcomentário

ios, não-acumulativos

latência média deestágio

sav Sim Sim Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

latência máx. deestágio

smx Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

estágio latência mín. smn Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

contagem de estágio scn Sim sim Desmarcarcomentário

Sim Desmarcarcomentário

ios, não-acumulativos

latência média deleituras prestage

pav Desmarcarcomentário

Sim Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

latência máx.prestage

pmx Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

prestage latênciamín.

pmn Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

µs limitados a9999999,não-acumulativos

contagem deleituras prestage

pcn Desmarcarcomentário

Sim Desmarcarcomentário

Sim Desmarcarcomentário

ios, não-acumulativos

Média de Gravaçãode Cache deutilizadoras

wfav Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Gravação de Cachede Totalidade deMáx.

wfmx Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Gravação de Cachede Totalidade deMín.

wfmn Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Média de Leitura deCache deutilizadoras

rfav Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Cache de Leitura deTotalidade de Máx.

rfmx Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Totalidade de Cachede Leitura Mín.

rfmn Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

%, nãoacumulativo

Porcentagem dePinned

pp Sim Sim Sim Sim Sim Desmarcarcomentário

% de total decapturainstantânea decache, nãoacumulativo

latência média detransferência dedados

tav Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

µs limitados a9999999,não-acumulativos

Latência MédiaBloqueio (Exclusivo)Média

teav Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

µs limitados a9999999,não-acumulativos

Capítulo 7. Diagnosticando problemas 131

Page 150: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 59. Coleta de estatísticas de cache para volumes e cópias de volumes (continuação)

Estatística AcrônimoEstatísticas paracache de volume

Estatísticas paracache de cópiade volume

Estatísticas parapartição decache de volume

Estatísticas parapartição decache de cópiade volume

Estatísticas parao Cache Geraldo Nó

Estatísticas decache paradiscosgerenciados

Unidades eestado

Latência MédiaBloqueio(Compartilhado)Média

tsav Sim Sim Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

µs limitados a9999999,não-acumulativos

Tempo da fila dobloco de controle deE/S de cache

hpt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Tempo da fila dobloco de controle defaixa do cache

ppt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

O Remote FilaTempo Crédito

opt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Não Fila TempoRemote CreditProprietário

Um Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Tempo da Fila deAdministraçãoRemota de Crédito

apt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Cdcb Fila Tempo cpt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Tempo de Fila doBuffer

bpt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Tempo da Fila daFortalecimento

hrpt Desmarcarcomentário

Desmarcarcomentário

Desmarcarcomentário

Sim Desmarcarcomentário

Média de µs,não-acumulativos

Nota: Qualquer estatística com um nome av, mx, mn e cn não é acumulativa. Essasestatísticas reconfiguram cada intervalo de estatísticas. Por exemplo, se a estatísticanão tem um nome av, mx, mn e cn, e ela é um Ios ou contagem, ela será um campocontendo um número total.v O termo páginas significa em unidades de 4096 bytes por página.v O termo setores significa em unidades de 512 bytes por setor.v O termo µs significa microssegundos.v Não acumulativo significa totais desde o intervalo de coleta de estatísticas

anterior.v Captura instantânea significa o valor no final do intervalo de estatísticas (em vez

de uma média no intervalo ou um pico dentro do intervalo).

Tabela 60 descreve a coleta de estatísticas para cache de volume por nósindividuais.

Tabela 60. Coleta de estatísticas para cache de volume por nós individuais. Essa tabeladescreve as informações de cache de volume relatadas para nós individuais.

Nome daestatística

Descrição

cm Indica o número de setores de dados modificados ou sujos que são mantidosno cache.

ctd Indica o número total de movidas de dados do cache de cache que eramgravações iniciadas, enviadas a outros componentes como resultado de umesvaziamento de cache do volume ou de uma operação mover dados docache.

ctds Indica o número total de setores que são gravados para gravações da faixa dacache-iniciado.

132 SAN Volume Controller: Guia de Resolução de Problemas

Page 151: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 60. Coleta de estatísticas para cache de volume por nósindividuais (continuação). Essa tabela descreve as informações de cache de volumerelatadas para nós individuais.

ctp Indica o número de etapas de trilha que são iniciadas pelo cache que sãoleituras prestage.

ctps Indica o número total de setores de que são iniciadas pelo cache.

ctrh Indica o número de faixa total de leitura do cache de ocorrências em prestageou dados não prestage. Por exemplo, uma única leitura que se estende porduas vias onde apenas uma das trilhas obteve um total de ocorrências decache, é contada como uma trilha de leitura do cache de ocorrência.

ctrhp Indica o número de leituras recebeu faixa de outros componentes, tratadoscomo ocorrências do cache em quaisquer dados pré-migrados. Por exemplo,se uma única leitura abrange duas vias onde apenas uma das trilhas obteveum total de ocorrências de cache nos dados pré-migrados, ele será contadocomo uma faixa de leitura para os dados pré-migrados. Uma ocorrência decache que obtém uma ocorrência parcial em prestage e dados não prestageainda contribui para esse valor.

ctrhps Indica o número total de setores que são lidos para leituras de acertos docache de outros componentes que obteve recebidos em quaisquer dadospré-migrados.

ctrhs Indica o número total de setores que são lidos para leituras recebeu a partirde outros componentes que obteve os acertos da cache total em prestage oudados não prestage.

ctr Indica o número total de leituras da trilha recebidas.Por exemplo, se umaúnica leitura ultrapassar duas faixas, ela será contada como duas leiturastotais de faixas.

ctrs Indica o número total de setores que são lidos para leituras recebeu.

ctwft Indica o número de gravações de trilha recebidos a partir de outroscomponentes e processadas no modo de gravação flush.

ctwfts Indica o número total de setores que são gravados para gravações que sãorecebidas de outros componentes e processadas no modo de gravação flush.

ctwfw Indica o número de gravações de trilha recebidos a partir de outroscomponentes e processadas no modo de gravação rápida.

ctwfwsh Indica o rastreio grava em modo de gravação rápida que foram gravados nomodo write-through por causa da falta de memória.

ctwfwshs Indica o rastreio grava em modo de gravação rápida que foram gravados nomeio de gravação devido à falta de memória.

ctwfws Indica o número total de setores que são gravados para gravações que sãorecebidas de outros componentes e processadas no modo de gravação rápida.

ctwh Indica o número de gravações de trilhas recebidas de outros componentes,em que cada setor na faixa obtve uma ocorrência de gravação em dados jáinválidos no cache. Para uma gravação para contar como um total deocorrências de cache, os dados de gravação faixa inteira deve já estarmarcado no cache de gravação como sujo.

ctwhs Indica o número total de setores que são recebidas a partir de outroscomponentes em todos os setores na via obtido uma ocorrência de gravaçãoem dados já inválidos na cache.

ctw Indica o número total de gravações de trilha recebidos. Por exemplo, se umúnico de gravação de duas vias, ele será contado como dois faixa total degravações.

ctws Indica o número total de setores que são gravados para gravações que sãorecebidas dos componentes.

Capítulo 7. Diagnosticando problemas 133

Page 152: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 60. Coleta de estatísticas para cache de volume por nósindividuais (continuação). Essa tabela descreve as informações de cache de volumerelatadas para nós individuais.

ctwwt Indica o número de gravações de trilha recebidas a partir de outroscomponentes e processadas em gravação no modo de gravação.

ctwwts Indica o número total de setores que são gravados para gravações que sãorecebidas de outros componentes e processadas no modo de gravação write.

cv Indica o número de setores de dados de cache de leitura e gravação que sãomantidos no cache.

Tabela 61 descreve as estatísticas XML específicas para uma porta de parceria IP.

Tabela 61. Estatísticas XML para uma porta de parceria IP

Nome daEstatística Descrição

ipbz Indica o tamanho médio (em bytes) dos dados que estão sendo enviados aodriver de parceria de IP desde o último período de coleta de estatísticas.

ipre Indica os bytes retransmitidos para outros nós em outros clusters pelo driverde parceria IP.

iprt Indica o tempo médio de roundtrip, em microssegundos para o link deparceria IP desde o último período de coleta de estatísticas.

iprx Indica os bytes recebidos de outros nós em outros clusters pelo driver deparceria IP.

ipsz Indica o tamanho médio (em bytes) dos dados que estão sendo transmitidospelo driver de parceria de IP desde o último período de coleta de estatísticas.

iptx Indica os bytes transmitidos para outros nós em outros clusters pelo driver deparceria IP.

Ações

As ações a seguir estão disponíveis para o usuário:

112 267 50 14Clique neste botão para alterar a coleta de estatísticas.

CancelarClique nesse botão para sair do painel sem alterar a coleta de estatísticas.

Informações de formatação de Linguagem de Marcação Extensível

A Linguagem de Marcação Extensível é mais complicada agora, como visto nestaLinguagem de Marcação Extensível bruta a partir das estatísticas de volume(Nv_statistics). Observe como os nomes são semelhantes, mas porque eles estão emuma seção diferente da Linguagem de Marcação Extensível, referem-se a uma partediferente do disco virtual.<vdsk idx="0"ctrs="213694394" ctps="0" ctrhs="2416029" ctrhps="0"ctds="152474234" ctwfts="9635" ctwwts="0" ctwfws="152468611"ctwhs="9117" ctws="152478246" ctr="1628296" ctw="3241448"ctp="0" ctrh="123056" ctrhp="0" ctd="1172772"ctwft="200" ctwwt="0" ctwfw="3241248" ctwfwsh="0"ctwfwshs="0" ctwh="538" cm="13768758912876544" cv="13874234719731712"gwot="0" gwo="0" gws="0" gwl="0"

134 SAN Volume Controller: Guia de Resolução de Problemas

Page 153: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

id="Master_iogrp0_1"ro="0" wo="0" rb="0" wb="0"rl="0" wl="0" rlw="0" wlw="0" xl="0">Vdisk/Volume statistics<ca r="0" rh="0" d="0" ft="0"wt="0" fw="0" wh="0" ri="0"wi="0" dav="0" dcn="0" pav="0" pcn="0" teav="0" tsav="0" tav="0"pp="0"/>

<cpy idx="0">

estatísticas de cópia de volume<ca r="0" p="0" rh="0" ph="0"d="0" ft="0" wt="0" fw="0"wh="0" pm="0" ri="0" wi="0"dav="0" dcn="0" sav="0" scn="0"pav="0" pcn="0" teav="0" tsav="0"tav="0" pp="0"/>

</cpy><vdsk>

O <cpy idx="0"> significa que ele está na seção de cópia de volume do discovirtual, considerando que as estatísticas mostradas sob Vdisk/Volume statisticssão de fora da seção cpy idx e, portanto, referem-se a disco virtual/volume.

De forma semelhante, para as estatísticas de cache de volume para nó e partições:<uca><ca dav="18726" dcn="1502531" dmx="749846" dmn="89"sav="20868" scn="2833391" smx="980941" smn="3"pav="0" pcn="0" pmx="0" pmn="0"wfav="0" wfmx="2" wfmn="0"rfav="0" rfmx="1" rfmn="0"pp="0"hpt="0" ppt="0" opt="0" npt="0"apt="0" cpt="0" bpt="0" hrpt="0"/><partition id="0"><ca dav="18726" dcn="1502531" dmx="749846" dmn="89"fav="0" fmx="2" fmn="0"dfav="0" dfmx="0" dfmn="0"dtav="0" dtmx="0" dtmn="0"pp="0"/></partition>

Esse resultado descreve as estatísticas do nó de cache de volume em que<partition id="0"> as estatísticas são descritas para a partição 0.

Substituindo <uca> por <lca> significa que as estatísticas são para a partição 0 docache de cópia de volume.

Relatório de EventosEventos que são detectados são salvos em um log de eventos. Assim que umaentrada é feita neste log de eventos, a condição é analisada. Se qualquer atividadede serviço for requerida, uma notificação será enviada, se você tiver notificações desegurança.

Processo de Relatório de Eventos

Os métodos a seguir são utilizados para notificar e o IBM Support Center de umnovo evento:v O código de erro do sistema mais grave é exibido no painel frontal de cada nó

no sistema.v Se tiver ativado o Protocolo Simples de Gerenciamento de Rede (SNMP), trap

SNMP é enviada a um gerenciador de SNMP configurado pelo cliente.

Capítulo 7. Diagnosticando problemas 135

Page 154: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O gerenciador de SNMP pode ser o IBM Systems Director, se estiver instalado,ou outro gerenciador de SNMP.

v Se ativadas, mensagens de log podem ser encaminhadas em um endereço IP aousar o protocolo syslog.

v Se ativadas, notificações de eventos podem ser encaminhadas por email usandoProtocolo Simples de Transporte de Correio (SMTP).

v Call Home pode ser ativado para que falhas críticas gerem um registro degerenciamento de problemas (PMR) que é, então, enviado diretamente para oIBM Support Center apropriado usando email.

Autoteste inicialAo ligar o SAN Volume Controller, a placa-mãe executará os autotestes. Durante ostestes iniciais, o símbolo de inicialização de hardware será exibido.

Todos os modelos executam uma série de testes para verificar a operação doscomponentes e de algumas da opções que foram instaladas quando as unidadesforem ligadas pela primeira vez. Essa série de testes é chamada de autoteste deativação (POST).

Nota: Alguns nós do SAN Volume Controller não possuem uma exibição do painelfrontal. O LED de status do nó estará desligado até que a inicialização sejaconcluída e o software do SAN Volume Controller carregado.

Se uma falha crítica for detectada durante o POST, o software não será carregado eo LED de erro do sistema no painel de informações do operador estará aceso. Seessa falha ocorrer, use o “MAP 5000: Iniciar” na página 299 para ajudar a isolar acausa da falha.

Quando o software for carregado, testes adicionais acontecerão, o que assegura quetodos os componentes de hardware e software necessários estarão instalados efuncionando corretamente. Durante os testes adicionais, a palavra Inicializaçãoserá exibida no painel frontal junto com um código de progresso de inicialização euma barra de progresso. Se uma falha de teste ocorre, a palavra Falha será exibidano painel frontal.

O controlador de serviço executa verificações internas e é vital para a operação doSAN Volume Controller. Se o LED (verificação) de erro estiver aceso no painelfrontal do controlador de serviço, o monitor do painel frontal poderá não estarfuncionando corretamente e será possível ignorar qualquer mensagem exibida.

O fonte de alimentação ininterrupta também executa testes internos. Se o fonte dealimentação ininterrupta relatar a condição de falha, o SAN Volume Controllerexibirá informações de falha crítica sobre o monitor do painel frontal ou enviaráinformações de falha não crítica para o log de eventos. Se o SAN VolumeController não puder se comunicar com o fonte de alimentação ininterrupta, eleexibirá uma mensagem de erro com falha de inicialização no monitor do painelfrontal. Informações de determinação de problema adicionais podem também serexibidas no painel frontal do fonte de alimentação ininterrupta.

Entendendo os EventosQuando for detectada uma alteração significativa no status, um evento é registradono log de eventos.

136 SAN Volume Controller: Guia de Resolução de Problemas

Page 155: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Dados de Erro

Eventos são classificados como alertas ou mensagens:v Um alerta é registrado quando o evento exige alguma ação. Alguns alertas

possuem um código de erro associado que define a ação de serviço que énecessária. As ações de serviço são automatizadas por meio de procedimentos decorreção. Se o alerta não tiver um código de erro, o alerta representa umamudança inesperada no estado. Essa situação deve ser investigada para ver seela é esperada ou representa uma falha. Investigue um alerta e resolva-o assimque ele for relatado.

v Uma mensagem é registrada quando uma mudança que é esperada é relatada,por exemplo, uma operação IBM FlashCopy é concluída.

Gerenciando o Log de EventosO log de eventos tem um tamanho limitado. Após ele estar cheio, entradas maisnovas substituem as entradas que não são mais necessárias.

Para evitar ter um evento repetido que preencha o log de eventos, alguns registrosno log de eventos se referem a várias ocorrências do mesmo evento. Quando asentradas do log de eventos são reunidas dessa forma, o registro de data e hora daprimeira ocorrência e da última ocorrência do problema é salvo no entrada de log.Uma contagem do número de vezes que a condição de erro ocorreu também ésalva na entrada de log. Outros dados referem-se à última ocorrência do evento.

Visualizando o Log de EventosÉ possível visualizar o log de eventos utilizando o GUI de gerenciamento ou ainterface da linha de comandos (CLI).

Sobre Esta Tarefa

É possível visualizar o log de eventos usando as opções Monitoramento > Eventosna GUI de gerenciamento. O log de eventos contém muitas entradas. É possível,todavia, selecionar apenas o tipo de informações que você necessita.

Também é possível visualizar o log de eventos utilizando a interface da linha decomandos (lseventlog). Consulte o tópico “Interface da linha de comandos” paraobter os detalhes do comando.

Descrevendo os Campos no Log de EventosO log de eventos inclui campos com informações que podem ser usadas paradiagnosticar problemas.

O Tabela 62 descreve alguns dos campos que estão disponíveis para auxiliá-lo adiagnosticar problemas.

Tabela 62. Descrição de Campos de Dados para o Log de Eventos

Campo de dados Descrição

ID de Evento Este número identifica precisamente porque o evento foi registrado.

Descrição Uma descrição simples do evento.

Capítulo 7. Diagnosticando problemas 137

Page 156: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 62. Descrição de Campos de Dados para o Log de Eventos (continuação)

Campo de dados Descrição

Status Indica se o evento requer alguma atenção.

Alerta: se um ícone vermelho com um cruzado for mostrado, siga oprocedimento de correção ou a ação de serviço para resolver o eventoe mudar para o status verde.

Monitoramento: o evento ainda não é de preocupação.

Expirado: o evento não representa mais uma preocupação.

Mensagem: forneça informações úteis sobre a atividade do sistema.

Código de erro Indica que o evento representa um erro no sistema que pode sercorrigido seguindo o procedimento de correção ou a ação de serviçoidentificada pelo código de erro. Nem todos os eventos possuem umcódigo de erro. Eventos diferentes possuem o mesmo código de erro sea mesma ação de serviço for necessária para cada um.

Número desequência

Identifica o evento no sistema.

Contagem deeventos

O número de eventos que são unidos neste registro de log de eventos.

Tipo de objeto O tipo de objeto ao qual o evento está relacionado.

ID de Objeto Identifica exclusivamente o objeto no sistema ao qual o evento estárelacionado.

Nome do objeto O nome do objeto no sistema ao qual o evento está relacionado.

ID de cópia Se o objeto for um volume e o evento se referir a uma cópia específicado volume, esse campo será o número da cópia à qual o evento estárelacionado.

ID do nó derelatório

Geralmente, identifica o nó responsável pelo objeto ao qual o eventoestá relacionado. Para eventos que estão relacionados aos nós,identifica o nó que registrou o evento, que pode ser diferente do nóque é identificado pelo ID do objeto.

Nome do nó derelatório

Geralmente, identifica o nó que contém o objeto ao qual o evento estárelacionado. Para eventos que estão relacionados aos nós, identifica onó que registrou o evento, que pode ser diferente do nó que éidentificado pelo nome do objeto.

Corrigido Onde um alerta é mostrado para uma condição de erro ou de aviso,indica que o usuário marcou o evento como corrigido, concluiu oprocedimento de correção ou que a condição foi resolvidaautomaticamente. Para um evento de mensagem, esse campo pode serusado para reconhecer a mensagem.

Primeiro registrode data e hora

O horário em que este evento de erro foi relatado. Se eventos de umtipo semelhante estiverem sendo reunidos, de modo que um registrode log de eventos represente mais de um evento, este camporepresentará o horário em que o primeiro evento de erro foi registrado.

Último registro dedata e hora

O horário em que a última instância desse evento de erro foiregistrada nesse registro de log de eventos.

Número desequência raiz

Se estiver configurado, será o número de sequência de um evento querepresenta um erro que provavelmente fez com que esse evento fosserelatado. Resolva o evento raiz primeiro.

Dados de controle Dados adicionais que fornecem os detalhes da condição que fizeram oevento ser registrado.

138 SAN Volume Controller: Guia de Resolução de Problemas

Page 157: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Notificações de EventosO sistema pode usar traps do Protocolo Simples de Gerenciamento de Rede(SNMP), mensagens syslog e emails de Call home para notificar você e o centro desuporte quando eventos significantes forem detectados. Qualquer combinaçãodesses métodos de notificação poderá ser usada simultaneamente. Normalmente asnotificações são enviadas imediatamente após o surgimento de um evento. Noentanto, há alguns eventos que podem ocorrer devido a ações de serviço ativo. Seuma ação de serviço recomendada estiver ativa, esses eventos serão notificadosapenas se eles ainda não estiverem corrigidos quando a ação de serviço estiverconcluída.

Para cada evento que o sistema detecta é designado um tipo de notificação deErro, Aviso ou Informação. Ao configurar notificações, especifique para onde asnotificações devem ser enviadas e quais tipos de notificações serão enviados paraesse destinatário.

Tabela 63 descreve os níveis de notificações de eventos.

Tabela 63. Níveis de Notificação

Nível de Notificação Descrição

Erro A notificação de erro é enviada para indicar um problema que deveser corrigido assim que possível.

Essa notificação indica um problema grave com o sistema. Porexemplo, o evento que está sendo reportado pode indicar umaperda de redundância no sistema e é possível que outra falha possaresultar na perda de acesso aos dados. O motivo mais típico peloqual este tipo de notificação é enviado é devido a uma falha dehardware, mas alguns erros de configuração ou erros de fábricatambém são incluídos neste nível de notificação. As notificações deerro podem ser configuradas para serem enviadas como umamensagem call home para seu centro de suporte.

Aviso Uma notificação de aviso é enviada para indicar um problema oucondição inesperada com o sistema. Sempre investigueimediatamente esse tipo de notificação para determinar o efeito queele pode ter em sua operação e fazer as correções necessárias.

Uma notificação de aviso não requer qualquer peça de substituiçãoe, portanto, não deve requerer o envolvimento do seu centro desuporte. A alocação do tipo de notificação Aviso não implica que oevento seja menos grave do que outro que tenha o nível denotificação Erro.

Informações Uma notificação informativa é enviada para indicar que um eventoesperado ocorreu: por exemplo, uma operação do FlashCopy foiconcluída. Nenhuma ação reparatória é necessária quando essasnotificações são enviadas.

Os eventos com o tipo de notificação de Erro ou de Aviso são mostrados comoalertas no log de eventos. Os eventos com informações de tipo de notificação sãomostrados como mensagens.

Traps SNMP

Simple Network Management Protocol (SNMP) é um protocolo padrão para ogerenciamento de redes e troca de mensagens. O sistema pode enviar mensagens

Capítulo 7. Diagnosticando problemas 139

Page 158: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

de SNMP que notificam a equipe sobre um evento. É possível usar um gerenciadorde SNMP para visualizar mensagens de SNMP enviadas pelo sistema. É possívelusar a GUI de gerenciamento ou a interface de linha de comandos para configurare modificar as configurações do SNMP. É possível especificar no máximo seisservidores SNMP.

É possível usar o arquivo Management Information Base (MIB) para SNMP paraconfigurar um programa de gerenciamento de rede para receber mensagens SNMPenviadas pelo sistema. Esse arquivo pode ser usado com mensagens SNMP detodas as versões do software. Mais informações sobre o arquivo MIB para SNMPestão disponíveis neste Web site:

www.ibm.com/storage/support/2145

Procure por e, em seguida, procure por MIB. Acesse os resultados de downloadspara localizar o arquivo Management Information Base (MIB) para SNMP.Clique neste link para localizar as opções de download.

Mensagens Syslog

O protocolo syslog é um protocolo padrão para o encaminhamento de mensagensde log de um emissor para um receptor em uma rede IP. A rede IP pode ser IPv4ou IPv6. O sistema pode enviar mensagens syslog que notificam a equipe sobreum evento. O sistema pode transmitir mensagens syslog no formato expandido ouconciso. É possível usar um gerenciador de syslog para visualizar as mensagenssyslog que o sistema envia. O sistema usa o User Datagram Protocol (UDP) paratransmitir a mensagem syslog. É possível especificar até no máximo seis servidoressyslog.É possível usar o GUI de gerenciamento ou a interface da linha decomandos para configurar e modificar suas configurações de syslog.

O Tabela 64 mostra como os códigos de notificação do SAN Volume Controller sãomapeados para os códigos em nível de segurança do syslog.

Tabela 64. Tipos de notificação do SAN Volume Controller e códigos de nível do syslogcorrespondentes

Tipos de notificação doSAN Volume Controller Código de nível do syslog Descrição

ERRO LOG_ALERT Falha que pode requerer asubstituição do hardwareque precisa de atençãoimediata.

AVISO LOG_ERROR Falha que precisa de atençãoimediata. Substituição dehardware não é esperada.

INFORMATIVO LOG_INFO Mensagem informativausada, por exemplo, quandouma alteração deconfiguração ocorre ou umaoperação for concluída.

TESTE LOG_DEBUG Mensagem de teste

O Tabela 65 na página 141 mostra como os valores do SAN Volume Controller deidentificadores de origem por mensagem definida pelo usuário são mapeados paraos códigos de recurso do syslog.

140 SAN Volume Controller: Guia de Resolução de Problemas

Page 159: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 65. Valores do SAN Volume Controller de identificadores de origem por mensagemdefinida pelo usuário e códigos de recurso do syslog

Valor do SANVolume Controller Valor do syslog

Código de recursodo syslog

Formato demensagens

0 16 LOG_LOCAL0 Integral

1 17 LOG_LOCAL1 Integral

2 18 LOG_LOCAL2 Integral

3 19 LOG_LOCAL3 Integral

4 20 LOG_LOCAL4 Conciso

5 21 LOG_LOCAL5 Conciso

6 22 LOG_LOCAL6 Conciso

7 23 LOG_LOCAL7 Conciso

E-mail Call Home

O recurso Call Home transmite dados operacionais e relacionados a eventos paravocê e para a equipe de serviços por meio de uma conexão do servidor ProtocoloSimples de Transporte de Correio (SMTP) na forma de um e-mail de notificação deeventos. Quando configurada, essa função alerta a equipe de serviços sobre falhasno hardware e problemas ambientais ou de configuração potencialmente graves.

Para enviar um e-mail, você deve configurar pelo menos um servidor SMTP. Épossível especificar até cinco servidores SMTP adicionais para propósitos debackup. O servidor SMTP deve aceitar a retransmissão de e-mail a partir doendereço IP de gerenciamento. É possível, então, usar o GUI de gerenciamento oua interface da linha de comandos para definir as configurações de e-mail, incluindoinformações de contato e destinatários de e-mail. Configure o endereço de respostacomo um endereço de e-mail válido. Envie um e-mail de teste para verificar setodas as conexões e a infraestrutura estão configuradas corretamente. É possíveldesativar a função Call Home a qualquer momento usando o GUI degerenciamento ou a interface da linha de comandos.

Dados enviados com notificações

As notificações podem ser enviadas usando email, SNMP ou syslog. Os dadosenviados para cada tipo de notificação são os mesmos. Eles incluem:v Tipo de registrov Tipo de máquinav Número de série da máquinav ID de Errov Código de errov Versão do softwarev Número de peça da FRUv Nome do cluster (sistema)v ID do nóv Número de sequência de errosv Registro de data e horav Tipo de objetov ID de Objeto

Capítulo 7. Diagnosticando problemas 141

Page 160: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Dados do problema

Os emails contém as seguintes informações adicionais que permitem que o Centrode Suporte entre em contato com você:v Nomes do contato para o primeiro e o segundo contatov Números de telefone de contato para o primeiro e o segundo contatov Números de contato alternativo para o primeiro e o segundo contatov Número do telefone fora do horário comercialv Endereço de email do contatov Local da máquina

Para enviar dados e notificações para a equipe de serviços, use um dos seguintesendereços de e-mail:v Para sistemas localizados na América do Norte, América Latina, América do Sul

ou nas Ilhas do Caribe, use [email protected] Para sistemas que estão localizados em qualquer outro lugar no mundo, use

[email protected]

email de Informações sobre InventárioUm E-mail informações sobre inventário resume os componentes de hardware e aconfiguração de um sistema. A equipe de serviços poderá usar essas informaçõespara entrar em contato com você quando software atualizações relevantesestiverem disponíveis ou quando um problema que possa afetar sua configuraçãofor descoberto. É uma boa prática ativar o relatório inventário.

Como as informações sobre o inventário são enviadas usando uma função dee-mail Call Home, você deve atender aos requisitos da função Call Home e ativar afunção de e-mail Call Home antes de tentar enviar e-mail de informações sobre oinventário. É possível ajustar as informações de contato, ajustar a frequência dee-mail de inventário ou enviar manualmente um e-mail de inventário usando oGUI de gerenciamento ou a interface da linha de comandos.

O inventário que é enviado ao IBM inclui as informações a seguir sobre o sistemaem cluster no qual a função Call Home está ativada. Informações confidenciais,como endereços IP não são incluídas.v Informações sobre licençav Detalhes sobre os seguintes objetos e funções:

Unidadessistemas de armazenamento externosHostsMDisksVolumesTipos de matrizes e níveis de RAIDEasy TierFlashCopyMetro Mirror e Global MirrorHyperSwap

142 SAN Volume Controller: Guia de Resolução de Problemas

Page 161: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

e-mail de exemplo

O Figura 58 mostra um exemplo de um e-mail. Para obter informações detalhadassobre aquilo que está incluído nas informações sobre inventário de Call Home,configure o sistema para enviar um e-mail de inventário para si mesmo.

Entendendo os Códigos de ErroCódigos de erro são gerados pela análise de log de eventos e código deconfiguração do sistema.

Os códigos de erro o ajudam a identificar a causa de um problema, umcomponente com falha e as ações de serviço que podem ser necessárias pararesolver o problema.

Nota: Se mais de um erro ocorrer durante uma operação, o código de erro deprioridade mais alta é exibido no painel frontal. Quanto menor o número para ocódigo de erro, maior a prioridade. Por exemplo, o código de erro 1020 temprioridade mais alta que o código de erro 1370.

Usando as tabelas de código de erroAs tabelas de código de erro listam vários códigos de erro e descrevem as açõesque podem ser tomadas.

Sobre Esta Tarefa

Conclua as etapas a seguir para usar as tabelas de código de erro:

Procedimento1. Localize o código de erro em uma das tabelas. Se não for possível localizar um

código específico em qualquer tabela, chame o IBM Support Center para obterassistência.

2. Leia sobre a ação que você deve concluir para corrigir o problema. Não troqueunidades substituíveis em campo (FRUs) a menos que seja instruído a fazê-lo.

3. Normalmente, troque apenas uma FRU de cada vez, iniciando a partir da partesuperior da lista de FRU para esse código de erro.

# Registro de data e hora = Quinta-feira, 21 de maio, 12h01min06s 2015# Fuso horário = +0100, BST# Organização = IBM UK# Endereço da Máquina = Maybrook Hall# Cidade da Máquina = Manchester# Estado da Máquina = XX# CEP da Máquina = M3 2EG# País da Máquina = GB# Nome do Contato = Mike Programmer# Nome do Contato Alternativo = N/A..(800 lines of more information).

Figura 58. Exemplo de e-mail de informações sobre o inventário

Capítulo 7. Diagnosticando problemas 143

Page 162: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

IDs de EventoO SAN Volume Controller software gera eventos, como eventos informativos eeventos de erro. Um ID de evento ou número está associado ao evento e indica arazão para o evento.

Eventos informativos fornecem informações sobre o status de uma operação. Oseventos informativos são registrados no log de eventos e, dependendo daconfiguração, as notificações de evento informativo podem ser enviadas por meiode email, SNMP ou syslog.

Eventos de erro são gerados quando uma ação de serviço é necessária. Um eventode erro mapeia para um alerta com um código de erro associado. Dependendo daconfiguração, as notificações de evento de erro podem ser enviadas através deemail, SNMP ou syslog.

Eventos informativosOs eventos informativos fornecem informações sobre o status de uma operação.

Os eventos informativos são registrados no log de eventos e, com base no tipo denotificação, podem gerar notificações por meio de e-mail, SNMP ou syslog. Oseventos informativos são diferenciadas de eventos de erros, que são associados acódigos de erros e podem requerer procedimentos de serviço. Para obter uma listade eventos de erros, consulte “IDs de Eventos de Erro e Códigos de Erro” napágina 153.

Eventos informativos podem ser do tipo de notificação I (informação) ou do tipode notificação W (aviso). Um relatório de evento informativo do tipo (W) podeexigir a atenção do usuário. A Tabela 66 fornece uma lista de eventos informativos,o tipo de notificação e a razão para o evento.

Tabela 66. Eventos informativos

ID de EventoTipo deNotificação Descrição

070570 I Proteção de bateria indisponível.

070571 I Proteção de bateria temporariamente indisponível;espera-se que uma bateria esteja disponível em breve.

070572 I Proteção de bateria temporariamente indisponível;espera-se que ambas as baterias estejam disponíveisem breve.

070785 I A capacidade da bateria é reduzida devido adesequilíbrio da célula.

980221 I O log de erro é limpo.

980230 I A chave SSH foi descartada para o usuário de logindo serviço.

980231 I O nome do usuário foi alterado.

980301 I O disco gerenciado degradado ou offline agora estáonline.

980310 I Um conjunto de armazenamento degradado ouoffline agora está online.

980320 I O volume offline agora está online.

980321 W O volume está offline devido ao conjunto dearmazenamento degradado ou offline.

144 SAN Volume Controller: Guia de Resolução de Problemas

Page 163: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 66. Eventos informativos (continuação)

ID de EventoTipo deNotificação Descrição

980330 I Todos os nós podem ver a porta.

980349 I Um nó foi incluído com êxito no cluster (sistema).

980350 I O nó agora é um membro funcional do cluster(sistema)

980351 I Ocorreu um erro de hardware não crítico.

980352 I Tenta automaticamente recuperar a inicialização donó offline

980370 I Ambos os nós no grupo de E/S estão disponíveis.

980371 I Um nó no grupo de E/S está indisponível.

980372 W Ambos os nós no grupo de E/S estão indisponíveis.

980392 I Recuperação do cluster (sistema) concluída.

980435 W Falha ao obter listagem de diretórios a partir do nóremoto.

980440 W Falha ao transferir arquivo do nó remoto.

980445 I A migração foi concluída.

980446 I A exclusão segura está concluída.

980501 W A quantia de virtualização está perto do limite queestá licenciado.

980502 W O recurso FlashCopy está próximo do limite que estálicenciado.

980503 W O recurso Metro Mirror ou Global Mirror estápróximo da quantia que está licenciada.

981002 I Ocorreu uma descoberta Fibre Channel. Hámudanças pendentes na configuração.

981003 I Ocorreu uma descoberta Fibre Channel. As mudançasna configuração estão concluídas.

981004 I Ocorreu uma descoberta Fibre Channel. Não foidetectada nenhuma mudança na configuração.

981007 W O disco gerenciado não está no caminho preferencial.

981009 W A inicialização do disco gerenciado falhou.

981014 W A descoberta da LUN falhou. O cluster (sistema)possui uma conexão com um dispositivo por meiodeste nó, mas este nó não pode descobrir o disco nãogerenciado ou gerenciado que está associado a essaLUN.

981015 W A capacidade da LUN se iguala ou excede o máximo.Apenas parte do disco pode ser acessada.

981020 W O limite de aviso de contagem de erros do discogerenciado foi atendido.

981022 I Disco gerenciado offline eminente, prevenção offlineiniciada

981025 I Download de firmware da unidade concluído comsucesso

981026 I Download de FPGA da unidade concluído comsucesso

Capítulo 7. Diagnosticando problemas 145

Page 164: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 66. Eventos informativos (continuação)

ID de EventoTipo deNotificação Descrição

981027 I Download do firmware da unidade iniciado

981028 I Download do FPGA da unidade iniciado

981029 I Download do firmware da unidade cancelado pelousuário

981101 I Ocorreu uma descoberta SAS. Nenhuma mudança naconfiguração foi detectada.

981102 I Ocorreu uma descoberta SAS. Há mudançaspendentes na configuração.

981103 I Ocorreu uma descoberta SAS. As mudanças naconfiguração foram concluídas.

981104 W A capacidade de LUN se iguala ou excede acapacidade máxima. Apenas os primeiros 1 PB dedisco serão acessados.

981105 I A formatação da unidade foi iniciada.

981106 I A recuperação da unidade foi iniciado.

981110 I Ocorreu uma descoberta de iSCSI; mudanças naconfiguração pendentes.

981111 I Ocorreu uma descoberta de iSCSI; mudanças naconfiguração completas.

981112 I Ocorreu uma descoberta de iSCSI; nenhumamudança na configuração foi detectada.

982003 W Extensões virtuais insuficientes.

982004 W A migração foi suspensa devido a extensões virtuaisou muitos erros de mídia no disco gerenciado defonte.

982007 W A migração foi interrompida.

982009 I A migração está concluída.

982010 W Erro de mídia de E/S de disco copiado.

983001 I A operação FlashCopy é preparada.

983002 I A operação FlashCopy está concluída.

983003 W A operação FlashCopy foi interrompida.

984001 W Primeiros dados do cliente sendo fixado em umconjunto de trabalho do volume.

984002 I Todos os dados do cliente em um conjunto detrabalho do volume foram desafixados agora.

984003 W O modo de cache do conjunto de trabalho do volumeestá no processo de alteração para movimentaçãosíncrona de dados do cache devido ao conjunto detrabalho do volume possuir muitos dados retidos.

984004 I O modo de cache do conjunto de trabalho do volumefoi atualizado para permitir a movimentação síncronade dados do cache devido a dados suficientes docliente terem sido liberados para o conjunto detrabalho do volume.

984506 I A depuração de um IERR foi extraída para o disco.

146 SAN Volume Controller: Guia de Resolução de Problemas

Page 165: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 66. Eventos informativos (continuação)

ID de EventoTipo deNotificação Descrição

984507 I Foi feita uma tentativa de ligar os slots.

984508 I Todos os expansores no conector foramreconfigurados.

984509 I A atualização de firmware do componente foipausada para permitir a conclusão do carregamentoda bateria.

984511 I A atualização para o firmware do componente foipausada devido ao sistema ter sido colocado nomodo de manutenção.

984512 I Uma atualização de firmware do componente énecessária mas foi impedida de executar.

985001 I A cópia de plano de fundo do Metro Mirror ouGlobal Mirror está concluída.

985002 I O Metro Mirror ou Global Mirror está pronto parareiniciar.

985003 W Não é possível localizar o caminho para o disco nocluster remoto (sistema) dentro do período de tempode espera.

986001 W Os dados da cópia de volumes thin-provisioned emum nó estão retidos.

986002 I Todos os dados da cópia de volumesthin-provisioned em um nó estão retidos.

986010 I A importação da cópia de volume com poucofornecimento falhou e o novo volume está offline;faça a atualização do SAN Volume Controllersoftware para a versão requerida ou exclua o volume.

986011 I A importação da cópia de volume thin-provisionedfoi é bem-sucedida.

986020 W Ocorrer um aviso de espaço de cópia de volumethin-provisioned.

986030 I Foi iniciado um reparo de cópia de volumethin-provisioned.

986031 I Um reparo de cópia de volume thin-provisioned foibem-sucedido.

986032 I Foi iniciada uma validação de cópia de volumethin-provisioned.

986033 I Uma validação de cópia de volume thin-provisionedfoi bem-sucedida.

986034 I A importação da cópia de volume virtual compactadafoi bem-sucedida.

986035 W Ocorreu um aviso de espaço de cópia de volumevirtual compactada.

986036 I Reparo da cópia de volume virtual compactadainiciado.

986037 I O reparo da cópia de volume virtual compactada foibem-sucedido.

Capítulo 7. Diagnosticando problemas 147

Page 166: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 66. Eventos informativos (continuação)

ID de EventoTipo deNotificação Descrição

986038 I A cópia de volume virtual compactada possui muitosblocos inválidos.

986201 I Foi reparado um erro de mídia para a cópiaespelhada.

986203 W Um reparo de cópia espelhada, utilizando a opção devalidação, não pode ser concluída.

986204 I Um reparo de disco espelhado está concluído e nãofoi localizada nenhuma diferença.

986205 I Um reparo de disco de espelho está concluído e asdiferenças foram resolvidas.

986206 W Um reparo de disco de espelho está concluído e asdiferenças foram marcadas como erros de mídia.

986207 I O reparo de disco de espelho foi iniciado.

986208 W Um reparo de cópia espelhada, utilizando a opção deerro de mídia, não pode ser concluído.

986209 W Um reparo de cópia espelhada, utilizando a opção deressincronização, não pode ser concluído.

987102 W Nó coldstarted.

987103 W Um desligamento de nó foi solicitado a partir docomutador de energia.

987104 I Portas Fibre Channel adicionais foram conectadas.

987301 W A conexão para um cluster remoto configurado(sistema) foi perdida.

987400 W O nó perdeu inesperadamente a energia, mas agorafoi restaurada para o cluster (sistema).

988022 I A reconstrução para um MDisk da matriz foiiniciada. O desempenho poderá ser afetado; aguardea reconstrução ser concluída.

988023 I A reconstrução para um MDisk da matriz foiconcluída.

988028 I Validação da matriz iniciada.

988029 I Validação da matriz concluída.

988100 W O procedimento de manutenção noturno falhou aoser concluído. Resolva todos os problemas dehardware e configuração que tiver experimentado nocluster (sistema). Se o problema persistir, entre emcontato com seu Representante de serviços IBM paraobter assistência.

988300 W Um MDisk da matriz está offline devido a ele termuitos membros ausentes.

988304 I Uma matriz RAID iniciou a troca de um membro damatriz.

988305 I Uma matriz RAID concluiu a troca de um membroda matriz.

988306 I Uma matriz RAID precisa de ressincronização.

148 SAN Volume Controller: Guia de Resolução de Problemas

Page 167: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 66. Eventos informativos (continuação)

ID de EventoTipo deNotificação Descrição

988307 I Uma unidade com falha foi reposicionada ousubstituída. O sistema configurou o dispositivoautomaticamente.

988308 I A reconstrução do MDisk de matriz distribuída foiiniciada.

988309 I A reconstrução do MDisk de matriz distribuída foiconcluída.

988310 I Um copyback do MDisk de matriz distribuída foiiniciado.

988311 I O copyback do MDisk de matriz distribuída foiconcluída.

988312 I A inicialização do MDisk de matriz distribuída foiiniciada

988313 I A inicialização do MDisk de matriz de distribuída foiconcluída.

988314 I O MDisk de matriz distribuída precisa deressincronização.

989001 W Ocorreu um aviso de espaço do conjunto dearmazenamento.

Relatório de eventos do SCSINós podem notificar seus hosts de eventos para comandos SCSI emitidos.

status SCSI

Alguns eventos são parte da arquitetura SCSI e são tratadas pelo aplicativo host oudrivers de dispositivo sem relatar um evento. Alguns eventos, como eventos deE/S de leitura e gravação e eventos associados à perda de nós ou perda de acessoaos dispositivos de backend, fazem com que a E/S do aplicativo falhe. Para ajudara resolver esses eventos, comandos SCSI são retornados com o status CheckCondition e um identificador de evento 32-bit é incluído com as informações dedetecção. O identificador se refere a um evento específico no log de eventos.

Se o aplicativo host ou driver de dispositivo captura e armazena essas informações,você pode relacionar a falha do aplicativo para o log de eventos.

Tabela 67 descreve o status SCSI e os códigos que são retornados pelos nós.

Tabela 67. status SCSI

Status Código Descrição

Bom 00h O comando foi bem-sucedido.

Condição de verificação 02h O comando falhou e dados de detecção estãodisponíveis.

Condição atendida 04h N/D

Ocupado 08h Uma condição Auto-Contingent Allegiance existee o comando especificado NACA=0.

Intermediário 10h N/D

Capítulo 7. Diagnosticando problemas 149

Page 168: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 67. status SCSI (continuação)

Status Código Descrição

Intermediário - condiçãoatendida

14h N/D

Conflito de reserva 18h Retornado como especificado em SPC2 e SAM-2onde uma reserva ou condição de reservapersistente existe.

Conjunto de tarefascompleto

28h O inicializador tem pelo menos uma tarefaenfileirada para esse LUN nessa porta.

ACA ativo 30h Esse código é relatado como especificado noSAM-2.

Tarefa interrompida 40h Esse código será retornado se TAS estiverconfigurado no controle de modo de página 0Ch.O nó possui uma configuração padrão de TAS=0,que não pode ser alterado; portanto, o nó nãorelata essa status.

SCSI Sense

Nós notificam os hosts de eventos em comandos SCSI. Tabela 68 define as chavesde detecção do SCSI, códigos e qualificadores retornados pelos nós.

Tabela 68. Qualificadores, códigos e chaves do SCSI Sense

Chave CódigoQualificador Definição Descrição

2h 04h 01h Não está pronto. Aunidade lógica está noprocesso de se tornarpronta.

O nó perdeu o sistema de vista enão pode executar operações deE/S. O sense adicional nãopossui informaçõescomplementares.

2h 04h 0Ch Não está pronto. A portade destino está no estadode indisponível.

As seguintes condições sãopossíveis:

v O nó perdeu o sistema devista e não pode executaroperações de E/S. O senseadicional não possuiinformações complementares.

v O nó está em contato com osistema, mas não podeexecutar as operações de E/Spara a unidade lógicaespecificado devido a umaperda de conectividade com ocontrolador de backend oualgum problema algorítmico.Esse sense é retornado para osvolumes offline.

150 SAN Volume Controller: Guia de Resolução de Problemas

Page 169: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 68. Qualificadores, códigos e chaves do SCSI Sense (continuação)

Chave CódigoQualificador Definição Descrição

3h 00h 00h Evento de mídia Esse é apenas retornado para lerou gravar as E/Ss. A E/S sofreuum evento em um LBAespecífico dentro de seu escopo.O local do evento é relatadodentro dos dados de detecção. Adetecção adicional também incluium código de razão que serefere ao evento para a entradade log de eventoscorrespondente. Por exemplo,um evento de controlador RAIDou um evento de mídia migrado.

4h 08h 00h Evento de hardware. Umcomando para falha nacomunicação da unidadelógica ocorreu.

A E/S sofreu um evento queestá associado a um evento deE/S que é retornada por umcontrolador RAID. A detecçãoadicional inclui um código derazão que aponta para os dadosde detecção que são retornadospelo controlador. Esse é apenasretornado para comandos dotipo de E/S. Esse eventotambém é retornado a partir devolumes de destino FlashCopyno estado de preparação epreparado.

5h 25h 00h Pedido inválido. Aunidade lógica não ésuportada.

A unidade lógica não existe ounão está mapeada para oremetente do comando.

Códigos de razão

O código de razão aparece em 20-23 bytes dos dados de detecção. O código derazão fornece o nó com uma entrada de log específica. O campo é um número de32-bits que é apresentado com o byte mais importante em primeiro lugar. Tabela 69lista os códigos de razão e suas definições.

Se o código de razão não estiver listado no Tabela 69, o código fará referência a umevento específico no log de eventos que corresponde ao número de sequência daentrada de log de eventos relevante.

Tabela 69. Códigos de razão

Código de razão(decimal) Descrição

40 O recurso faz parte de um mapeamento de FlashCopyinterrompido.

50 O recurso faz parte de um relacionamento do Metro Mirror ouGlobal Mirror e o LUN secundário no offline.

51 O recurso faz parte de um Metro Mirror ou Global Mirror e o LUNsecundário é somente leitura.

60 O nó está offline.

Capítulo 7. Diagnosticando problemas 151

Page 170: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 69. Códigos de razão (continuação)

Código de razão(decimal) Descrição

71 O recurso não está ligado a nenhum domínio.

72 O recurso está ligado a um domínio que foi recriado.

73 Executando em um nó que foi contratado fora por alguma razãonão atribuível a qualquer caminho que fica offline.

80 Aguarde a conclusão de reparo ou exclua o volume.

81 Aguarde até que a validação seja concluída ou exclua o volume.

82 Um volume thin-provisioned offline fez com que os dados fossemretidos no cache do diretório. Desempenho adequado não pode serobtido para outros volumes thin-provisioned, para que eles tenhamsido colocado offline.

85 O volume foi colocado offline, porque o disco quorum falhou.

86 O comando repairvdiskcopy -medium criou um erro de mídiavirtual onde as cópias se diferenciam.

93 Uma matriz off-RAID-5 ou RAID-6 tem causado dados de gravaçãoem andamento a serem retidos. Bom desempenho não pode seralcançado por outras matrizes e assim foi colocado offline.

94 Um MDisk da matriz que faz parte do volume foi colocado offlineporque o disco quorum falhou.

95 Esse código de razão é usado nos arquivos de dump de bloqueioinválido no MDisk para indicar que a perda de dados foi causadapela paridade de ressincronização com faixas de reconstrução oualguns outros algoritmos RAID devido a falhas múltiplas.

96 Um MDisk da matriz de RAID-6 que faz parte do volume foicolocado offline porque uma tabela de metadados interna estácheia.

Tipos de objetoÉ possível usar o código do objeto do para determinar o tipo de objeto no qual oevento está registrado.

O Tabela 70 lista os códigos de objeto e tipos de objeto correspondentes.

Tabela 70. Tipos de objeto

Código do objeto Tipo de objeto

1 mdisk

2 mdiskgrp

3 volume

4 nó

5 host

7 iogroup

8 fcgrp

9 rcgrp

10 fcmap

11 rcmap

152 SAN Volume Controller: Guia de Resolução de Problemas

Page 171: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 70. Tipos de objeto (continuação)

Código do objeto Tipo de objeto

12 wwpn

13 cluster (system)

16 device

17 SCSI lun

18 quorum

34 Fibre Channel adapter

38 volume copy

39 Syslog server

40 SNMP server

41 Email server

42 User group

44 Cluster (management) IP

46 SAS adapter

IDs de Eventos de Erro e Códigos de ErroCódigos de erro descrevem um procedimento de serviço que deve ser seguido.Cada ID de evento que requer serviço possui um código de erro associado.

Nota: Os procedimentos de serviço que envolvem unidades substituíveis docampo (FRUs) não se aplicam ao produto IBM Spectrum Virtualize, que é baseadoem software. Para obter informações sobre possíveis ações do usuário, relacionadasàs substituições da FRU, consulte a documentação do fabricante do hardware.

Códigos de erro podem ser tipo de notificação E (erro) ou tipo de notificação W(aviso). O Tabela 71 lista os IDs do evento que têm códigos de erroscorrespondentes, e mostra o código de erro, o tipo de notificação e a condição paracada evento. Para obter uma lista de eventos informativos que não possuemcódigos de erros associados, consulte “Eventos informativos” na página 144.

Tabela 71. IDs de Eventos de Erro e Códigos de Erro

ID deEvento

Tipo deNotificação Condição

Códigode erro

009020 E Uma recuperação do sistema foi executada. Todos oscomandos de configuração são bloqueados.

1001

009040 E O log de eventos de erro está cheio. 1002

009052 W As seguintes causas são possíveis:

v O nó está ausente.

v O nó não é mais um membro funcional do sistema.

1196

009053 E O nó esteve ausente por 30 minutos. 1195

009054 E O nó foi encerrado. 1707

009100 W O processo de instalação de software falhou. 2010

009101 W O pacote de instalação de software não pode serentregue a todos os nós.

2010

009150 W Não é possível se conectar ao servidor SMTP (e-mail). 2600

Capítulo 7. Diagnosticando problemas 153

Page 172: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

009151 W Não é possível enviar e-mails através do servidor SMTP(e-mail).

2601

009170 W A capacidade do recurso Cópia remota não estáconfigurada.

3030

009171 W A capacidade do recurso FlashCopy não estáconfigurada.

3031

009172 W O recurso de Virtualização excedeu a quantia licenciada. 3032

009173 W O recurso FlashCopy excedeu a quantia licenciada. 3032

009174 W O limite de licenças do recurso Cópia Remota foiexcedido.

3032

009175 W Uso do volume thin-provisioned não licenciado. 3033

009176 W O valor configurado para a capacidade do recurso devirtualização não é válido.

3029

009177 E Uma licença do recurso FlashCopy de disco físico énecessária.

3035

009178 E Uma licença dos recursos Metro Mirror e Global Mirrorde disco físico é necessária.

3036

009179 E Uma licença do recurso de virtualização é necessária. 3025

009180 E A recuperação automática de nó off-line falhou. 1194

009181 W Não é possível enviar e-mail a nenhum dos servidoresde e-mail configurados.

3081

009182 W O limite da licença do recurso de virtualização externafoi excedido.

3032

009183 W Não é possível se conectar ao servidor LDAP. 2251

009184 W A configuração de LDAP não é válida. 2250

009185 E O limite para a licença do recurso de compactação foiexcedido.

3032

009186 E O limite para a licença do recurso de compactação foiexcedido.

3032

009187 E Não é possível conectar-se ao servidor LDAP que foiconfigurado automaticamente.

2256

009188 E Configuração de LDAP inválida para servidorconfigurado automaticamente.

2255

009189 W Um cronômetro de avaliação do recurso licenciávelatingiu 0. O recurso foi desativado agora.

3082

009190 W Uma avaliação de um recurso licenciável expirará em 5dias.

3083

009191 W Uma avaliação de um recurso licenciável expirará em 10dias.

3084

009192 W Uma avaliação de um recurso licenciável expirará em 15dias.

3085

009193 W Uma avaliação de um recurso licenciável expirará em 45dias.

3086

009194 W O limite de licença do recurso Easy foi excedido. 3032

009195 W O limite de licença do recurso FlashCopy foi excedido. 3032

154 SAN Volume Controller: Guia de Resolução de Problemas

Page 173: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

009196 W O limite de licença do recurso de virtualização externafoi excedido.

3032

009197 W O limite de licença do recurso de cópia remota foiexcedido.

3032

009202 W O certificado SSL do sistema irá expirar nos próximos 30dias.

3130

009203 W O certificado SSL do sistema expirou. 2258

010002 E O nó esgotou as origens de eventos de base. Comoresultado, o nó foi interrompido e saiu do sistema.

2030

010003 W O número de logins de dispositivo foi reduzido. 1630

010006 E Acesso além do fim do disco ou Disco Gerenciadoausente.

2030

010008 E O tamanho de bloco é inválido, a capacidade ou aidentidade da LUN foi alterada durante a inicializaçãodo disco gerenciado.

1660

010010 E O disco gerenciado foi excluído devido ao excesso deerros.

1310

010011 E A porta remota foi excluída para um disco gerenciado eum nó.

1220

010012 E Uma porta local foi excluída. 1210

010013 E O login foi excluído. 1230

010017 E Ocorreu um tempo limite como resultado do excesso detempo de processamento.

1340

010018 E Ocorreu um procedimento de recuperação de erroinesperado.

1370

010019 E Um disco gerenciado está relatando erros excessivos. 1310

010020 E O limite de contagem de erros do disco gerenciado foiexcedido.

1310

010021 W Há muitos dispositivos apresentados para o sistema. 1200

010022 W Há muitos discos gerenciados apresentados para osistema.

1200

010023 W Há também muitas LUNs apresentadas a um nó. 1200

010024 W Há muitas unidades apresentadas para um sistema. 1200

010025 W Ocorreu um erro de mídia de E/S do disco. 1320

010026 W Uma unidade ou MDisk adequado para uso como discoquorum não foi localizado.

1330

010027 W O disco quorum não está disponível. 1335

010028 W Uma configuração de controlador não é suportada. 1625

010029 E Ocorreu uma falha de transporte login. 1360

Capítulo 7. Diagnosticando problemas 155

Page 174: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

010030 E Ocorreu um erro no procedimento de recuperação deerro (ERP) do disco gerenciado. O nó ou controladorrelatou o seguinte:

v Controle

v Chave

v Código

v Qualificador

1370

010031 E Um ou mais MDisks em um controlador está(ão)degradado(s)

1623

010032 W A configuração do controlador limita o failover. 1625

010033 E A configuração do controlador utiliza o modo RDAC eisso não é suportado.

1624

010034 W Configuração do controlador persistente não suportada. 1695

010040 E O dispositivo do sistema do controlador está conectadoapenas ao nó por meio de uma única porta doinicializador.

1627

010041 E O dispositivo do sistema controlador está conectado aonó apenas por meio de uma única porta de destino.

1627

010042 E O dispositivo do sistema controlador é conectado aos nóssomente por meio de uma única porta de destino.

1627

010043 E O dispositivo do sistema controlador é conectado aos nóssomente por meio de metade das portas de destinoesperadas.

1627

010044 E O dispositivo do sistema controlador desconectou todasas portas de destino para os nós.

1627

010045 W O número de caminhos de Dispositivo a partir do sitecontrolador que permitiu nós acessíveis foi reduzido

1630

010055 W Um dispositivo SAS não reconhecido. 1665

010056 E As contagens de erros SAS excederam os limites deaviso.

1216

010057 E Os erros SAS excederam os limites críticos. 1216

010066 W O controlador indica que não suporta o controle dodescritor para LUNs que sejam maiores que 2 TBs.

1625

010067 W Muitos gabinetes foram apresentados para um sistema. 1200

010070 W Muitas portas de destino do controlador foramapresentadas ao sistema.

1200

010071 W Muitas portas de destino foram apresentadas ao sistemaa partir de um único controlador.

1200

010098 W Há muitas unidades apresentadas para um sistema. 1200

010100 W Conexão incorreta detectada para uma porta. 1669

010101 E Excesso de entradas/saídas longas para a unidade. 1215

010102 E Uma unidade é relatada como continuamente lenta comfatores contribuintes.

1215

010103 E Excesso de entradas/saídas longas para a unidade(Unidades Mercury).

1215

156 SAN Volume Controller: Guia de Resolução de Problemas

Page 175: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

010104 E Uma unidade é relatada como continuamente lenta comfatores contribuintes (unidades Mercury).

1215

010106 E Unidade relatando muitos erros t10dif. 1680

010110 W Download de firmware da unidade cancelado por causade mudanças do sistema.

3090

010111 W Download de firmware da unidade cancelado por causade um problema com o download da unidade.

3090

010117 W Um controlador de disco não está acessível a partir deum nó que tem permissão de acesso ao dispositivo pelapolítica de site

1627

010118 W unidades em excesso conectadas ao sistema. 1179

010119 W Erro na integridade de dados da unidade. 1322

010120 W Uma unidade do membro foi forçada a desligar osuporte de informações de proteção.

2035

010121 E Troca de unidade necessária. 1693

010123 W O desempenho do MDisk externo foi mudado. 2115

010124 W Sessão iSCSI excluída. 1230

020001 E Há muitos erros médios no MDisk. 1610

020002 E Um conjunto de armazenamentos está off-line. 1620

020003 W Há extensões virtuais insuficientes. 2030

020007 E MDisk não localizado no arquivo easy_tier_perf.xml. 2110

020008 E Serviços de otimização de armazenamento desativados. 3023

029001 E O MDisk possui bloqueios inválidos. 1840

029002 W O sistema falhou ao criar um bloco inválido porque oMDisk já tem o número máximo de blocos inválidospermitidos.

1226

029003 W O sistema falhou em criar um bloqueio inválido porqueo sistema já possui o número máximo de bloqueiosinválidos permitido.

1225

030000 W A preparação do FlashCopy falhou devido à falha daliberação do cache.

1900

030010 W O FlashCopy foi interrompido devido ao erro indicadonos dados.

1910

030020 W Mapeamentos do FlashCopy não recuperado. 1895

045103 E Uma tentativa de configurar automaticamente umaunidade reposicionada ou substituída falhou.

1686

050001 W O relacionamento do Metro Mirror ou Global Mirror nãopode ser recuperado.

1700

050002 W Um relacionamento ou grupo de consistências do MetroMirror ou Global Mirror existe dentro de um sistema,mas sua parceria foi excluída.

3080

050010 W Um relacionamento do Global Mirror foi interrompidodevido a um erro de E/S persistente.

1920

050011 W Uma cópia remota foi interrompida devido a um erro deE/S persistente.

1915

Capítulo 7. Diagnosticando problemas 157

Page 176: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

050020 W O relacionamento ou grupos de consistências da Cópiaremota perderam a sincronização.

1720

050030 W Há muitas parcerias do sistema. O número de parceriasfoi reduzido.

1710

050031 W Há muitas parcerias do sistema. O sistema foi excluído. 1710

050040 W O processo de cópia em plano de fundo para a cópiaremota foi bloqueado.

1960

050050 E O volume secundário Global Mirror está offline. Orelacionamento fixou dados de gravação congelados paraeste volume.

1925

050060 E O volume secundário do Global Mirror está off-linedevido ao nó do parceiro do grupo de E/S ausente. Orelacionamento fixou dados de gravação congelados paraeste volume, mas o nó que contém os dados necessáriosestão offline atualmente.

1730

050070 E É provável que o desempenho do Global Mirror sejaimpactado. Uma grande quantia de dados retidos paraos volumes offline reduziu o recurso disponível aosdiscos secundários de Global Mirror.

1925

050080 W O volume do HyperSwap perdeu a sincronização entreos sites.

1940

050081 W O grupo de consistências do HyperSwap perdeu asincronização entre sites.

1940

060001 W Uma cópia de volume thin-provisioned está off-linedevido a espaço insuficiente.

1865

060002 E Uma cópia de volume thin-provisioned está off-linedevido a metadados corrompidos.

1862

060003 E Uma cópia de volume thin-provisioned está off-linedevido a um reparo com falha.

1860

060004 W Uma cópia do volume compactado está off-line devido aespaço insuficiente.

1865

060005 E Uma cópia do volume compactado está off-line devido ametadados corrompidos.

1862

060006 E Uma cópia do volume compactado está off-line devido aum reparo com falha.

1860

060007 E Uma cópia do volume compactado possui bloqueiosinválidos.

1850

062001 W O sistema não é capaz de espelhar erros médios. 1950

062002 E O volume espelhado está off-line porque ele não podesincronizar os dados.

1870

062003 W O reparo de um volume espelhado parou devido àsdiferenças.

1600

064001 W Uma porta do host possui mais de quatro logins paraum nó

2016

070000 E Erro de nó não reconhecido. 1083

070510 E O tamanho de memória detectado não corresponde aotamanho de memória esperado.

1022

158 SAN Volume Controller: Guia de Resolução de Problemas

Page 177: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

070511 E Os DIMMs estão instalados incorretamente. 1009

070517 E O WWNN armazenado no controlador de serviço e oWWNN armazenado na unidade não correspondem.

1192

070521 E Não é possível detectar nenhum adaptador FibreChannel.

1016

070522 E O processador da placa-mãe falhou. 1020

070523 E O sistema de arquivos do disco interno do nó estádanificado.

1187

070524 E Não é possível atualizar as configurações do BIOS. 1027

070525 E Não é possível atualizar o firmware do processador deserviços para a placa-mãe.

1020

070528 E A temperatura ambiente é muito alta durante ainicialização do sistema.

1182

070536 E Um dispositivo da placa-mãe violou o limite crítico detemperatura.

1084

070538 E Uma PCI Riser violou o limite crítico de temperatura. 1085

070542 E Um processador falhou. 1024

070543 E Dados não persistentes utilizáveis podem serencontrados nas unidades de inicialização.

1035

070544 E As unidades de inicialização não pertencem a esse nó. 1035

070545 E A unidade de inicialização e a placa-mãe não sãocompatíveis.

1035

070547 E O TPM conectável está ausente ou quebrado 1051

070550 E Não é possível formar o sistema devido à falta derecursos.

1192

070556 E WWNN duplicado detectado na SAN. 1192

070558 E O nó não pode se comunicar com outros nós. 1192

070560 E Falha no cabeamento da bateria. 1108

070561 E Falha no painel traseiro ou no cabeamento da bateria. 1109

070562 E O hardware do nó não atende aos requisitos mínimos. 1183

070564 E Muitas falhas de software. 1188

070565 E A unidade interna do nó está com falha. 1030

070569 E A temperatura da CPU violou o limite crítico. 1093

070574 E O software do nó está danificado. 1187

070576 E Os dados do sistema não podem ser lidos. 1030

070578 E Os dados do sistema não foram salvos quando a energiafoi perdida.

1194

070579 E O subsistema de bateria tem carga insuficiente parasalvar os dados do sistema.

1107

070580 E Não é possível ler o ID do controlador de serviço. 1044

070581 E Falha de bateria do UPS 1181

070582 E Falha de bateria do UPS 1181

Capítulo 7. Diagnosticando problemas 159

Page 178: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

070583 E Falha eletroeletrônica do UPS 1171

070584 E Carga de saída do UPS alta 1166

070585 E Falha eletroeletrônica do UPS 1171

070586 E Falha de energia de entrada CA do UPS 1141

070587 E Tipo incorreto de fonte de alimentação ininterruptadetectado.

1152

070588 E Erro de configuração do UPS 1151

070589 E O limite de temperatura ambiente do UPS foi excedido 1136

070590 E Falha do UPS 1186

070670 W Carga da fonte de alimentação ininterrupta insuficientepara permitir início do nó.

1193

070690 W Nó suspenso em estado de serviço. 1189

070710 E Um adaptador SAS de alta velocidade está ausente 1120

070736 E Um dispositivo da placa-mãe violou o limite de aviso detemperatura.

1084

070737 E Uma fonte de alimentação violou o limite detemperatura.

1212

070738 E Uma PCI Riser violou o limite de aviso de temperatura. 1085

070743 E Unidade de inicialização ausente ou fora desincronização ou com falha.

1213

070744 W Uma unidade de inicialização está no local errado. 1214

070745 W Unidade de inicialização em slot não suportado. 1472

070746 W A conexão com a porta técnica não é válida. 746

070747 W Técnico conectado. 747

070766 E A bateria CMOS falhou. 1670

070775 E A fonte de alimentação tem um problema. 1097

070776 W O cabo principal da fonte de alimentação estádesconectado.

1097

070777 E A fonte de alimentação está ausente. 1097

070779 E A bateria está ausente. 1129

070780 E A bateria falhou. 1130

070781 E A bateria está abaixo da temperatura mínima deoperação.

1476

070782 E A bateria está acima da temperatura máxima deoperação.

1475

070783 E A bateria tem um erro de comunicação. 1109

070784 E A bateria está se aproximando do fim de sua vida útil. 1474

070786 E O VPD da bateria tem um erro na soma de verificação. 1130

070787 E A bateria está em um nível de revisão do hardware nãosuportado pelo nível de código atual.

1473

160 SAN Volume Controller: Guia de Resolução de Problemas

Page 179: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

070572 E Proteção da bateria temporariamente indisponível;espera-se que ambas as baterias estejam disponíveis embreve.

1473

070579 E O subsistema de bateria tem carga insuficiente parasalvar os dados do sistema.

1473

070840 W O hardware detectado não é uma configuração válida. 1198

070841 W O hardware detectado precisa de ativação. 1199

071547 E O TPM conectável está ausente ou quebrado 1051

071747 W Técnico conectado. 747

072005 E A bateria CMOS tem uma falha. 1670

072007 E A bateria CMOS tem uma falha. 1670

072008 E A bateria CMOS tem uma falha. 1032

072101 A placa-mãe tem mais ou menos processadoresdetectados.

1025

072102 A placa-mãe tem mais ou menos processadoresdetectados.

1025

072103 A placa-mãe tem mais ou menos processadoresdetectados.

1032

073003 W As portas Fibre Channel não estão operacionais. 1060

073004 E O adaptador Fibre Channel detectou um erro nobarramento PCI.

1012

073005 E O caminho do sistema possui uma falha. 1550

073006 W A SAN não está corretamente zoneada. Como resultado,mais de 512 portas na SAN efetuaram logon em umaporta do SAN Volume Controller.

1800

073251 E Mais ou menos adaptadores Fibre Channel sãodetectados.

1011

073252 E O adaptador Fibre Channel está com defeito. 1055

073258 E O adaptador Fibre Channel detectou um erro nobarramento PCI.

1013

073261 E Mais ou menos adaptadores Fibre Channel sãodetectados.

1011

073262 E O adaptador Fibre Channel está com defeito. 1055

073268 E O adaptador Fibre Channel detectou um erro nobarramento PCI.

1013

073271 E Mais ou menos adaptadores Fibre Channel sãodetectados.

1011

073272 E O adaptador Fibre Channel está com defeito. 1055

073278 E O adaptador Fibre Channel detectou um erro nobarramento PCI.

1013

073305 W A velocidade do Fibre Channel foi mudada. 1065

073310 E Uma estrutura duplicada do Fibre Channel é detectada. 1203

073402 E O adaptador Fibre Channel tem uma falha. 1032

Capítulo 7. Diagnosticando problemas 161

Page 180: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

073404 E O adaptador Fibre Channel detectou um erro nobarramento PCI.

1032

073512 E O VPD do gabinete está inconsistente. 1008

073522 E O processador de serviço da placa-mãe falhou. 1034

073528 E Temperatura ambiente muito alta durante inicializaçãodo sistema

1098

074001 W O sistema é incapaz de determinar VPD para um FRU. 2040

074002 E O nó fez o warm start após um erro de software. 2030

074003 W Uma conexão com um sistema remoto configurado foiperdida devido a um problema de conectividade.

1715

074004 W Uma conexão com um sistema remoto configurado foiperdida devido a vários pequenos erros.

1716

075011 E O dispositivo de inicialização flash tem uma falha. 1040

075012 E O dispositivo de inicialização flash foi recuperado. 1040

075015 E O controlador de serviço tem uma falha na leitura. 1044

075021 E O dispositivo de inicialização flash tem uma falha. 1040

075022 E O dispositivo de inicialização flash foi recuperado. 1040

075025 E O controlador de serviço tem uma falha na leitura. 1044

075031 E O dispositivo de inicialização flash tem uma falha. 1040

075032 E O dispositivo de inicialização flash foi recuperado. 1040

075035 E Ocorreu uma falha de leitura do controlador de serviço 1044

076001 E O disco interno de um nó falhou. 1030

076002 E O disco rígido está cheio e não pode capturar mais saída. 2030

076401 E Uma das duas unidades de fonte de alimentação no nófalhou.

1096

076402 E Uma das duas unidades de fonte de alimentação no nónão pode ser detectada.

1096

076403 E Uma das duas unidades de fonte de alimentação no nóestá sem energia.

1097

076501 E Um adaptador SAS de alta velocidade está ausente. 1120

076502 E As linhas do PCIe em um adaptador SAS de altavelocidade estão comprometidas.

1121

076503 E Ocorreu um erro de barramento PCI em um adaptadorSAS de alta velocidade.

1121

076504 E Um adaptador SAS de alta velocidade requer umareconfiguração de barramento PCI.

1122

076505 E O adaptador SAS tem uma falha interna. 1121

077105 E O processador de serviços de nó indicou uma falha noventilador.

1089

077106 E O processador de serviços de nó indicou uma falha noventilador.

1089

077107 E O processador de serviços de nó indicou uma falha noventilador.

1089

162 SAN Volume Controller: Guia de Resolução de Problemas

Page 181: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

077161 E O limite de temperatura ambiente do nó foi excedido. 1094

077162 E O processador do nó indicou um aviso de temperatura. 1093

077163 E O processador de serviços de nó ou o limite detemperatura crítico foi excedido.

1092

077165 E O limite de temperatura ambiente do nó foi excedido. 1094

077166 E A temperatura do processador do nó possui um aviso. 1093

077167 E O processador do nó ou o limite de temperatura críticodo ambiente foi excedido.

1092

077171 E A voltagem da placa-mãe está alta. 1101

077172 E A voltagem da placa-mãe está alta. 1101

077173 E A voltagem da placa-mãe está alta. 1101

077174 E A voltagem da placa-mãe está baixa. 1106

077175 E A voltagem da placa-mãe está baixa. 1106

077176 E A voltagem da placa-mãe está baixa. 1106

077178 E A placa de gerenciamento de energia possui uma falhana voltagem.

1110

077185 E O limite de temperatura ambiente do nó foi excedido. 1094

077186 E Limite de aviso de temperatura excedido 1093

077187 E Limite de temperatura crítica excedido 1092

077188 E A voltagem da placa de gerenciamento de energia possuiuma falha.

1110

078001 E Erro no domínio de energia. Ambos os nós no grupo deE/S são alimentados com a mesma fonte de alimentaçãoininterrupta.

1155

079500 W O limite no número de sessões de shell seguro dosistema (SSH) foi atingido.

2500

079501 W Não é possível acessar o servidor de tempo de redeNetwork Time Protocol (NTP).

2700

079503 W Não é possível se conectar ao servidor NTP que foiconfigurado automaticamente.

2702

079504 W As configurações de hardware de nós são diferentes emum grupo de E/S.

1470

079506 I A conexão com a porta técnica não está ativa. 3024

079507 I A conexão com a porta técnica está ativa. 3024

081001 E A interface Ethernet possui uma falha. 1400

082001 E Ocorreu um erro do servidor. 2100

082002 W Ocorreu uma falha no serviço. 2100

083001 E Sistema com falha para se comunicar com a UPS. 1145

083002 E O carregamento de saída da UPS estava inesperadamentealto.

1165

083003 E A bateria atingiu o término de vida. 1190

083004 E A bateria da UPS possui uma falha. 1180

Capítulo 7. Diagnosticando problemas 163

Page 182: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

083005 E O eletroeletrônico da UPS possui uma falha. 1170

083006 E A estrutura da UPS possui uma falha. 1175

083007 E A UPS é sobrecorrente. 1160

083008 E A UPS possui uma falha, mas nenhum FRU específicoestá identificado.

1185

083009 E A UPS detectou uma falha na energia de entrada. 1140

083010 E A UPS possui um erro no cabeamento. 1150

083011 E O limite de temperatura ambiente da UPS foi excedido. 1135

083012 E A temperatura ambiente da UPS está alta. 3000

083013 E O teste de cabos cruzados da UPS é ignorado devido aum erro de software interno de UPS.

3010

083101 E Sistema com falha para se comunicar com a UPS. 1146

083102 E O carregamento de saída da UPS estava inesperadamentealto.

1166

083103 E A bateria atingiu o término de vida. 1191

083104 E A UPS possui uma falha na bateria. 1181

083105 E A UPS possui uma falha de eletroeletrônico. 1171

083107 E A UPS é sobrecorrente. 1161

083108 E A UPS possui uma falha, mas nenhum FRU específicoestá identificado.

1186

083109 E A UPS detectou uma falha na energia de entrada. 1141

083110 E A UPS possui um erro no cabeamento. 1151

083111 E O limite de temperatura ambiente da UPS foi excedido. 1136

083112 E A temperatura ambiente da UPS está alta. 3001

083113 E O teste de cabos cruzados da UPS é ignorado devido aum erro de software interno de UPS.

3011

084000 W Um MDisk da matriz tinha membros desconfigurados eperdeu a redundância.

1689

084100 E Um MDisk da matriz está distorcido devido à perda demetadados.

1240

084200 W O disco gerenciado da matriz obteve um membrosobressalente que não corresponde aos objetivos damatriz.

1692

084201 W Uma matriz tem membros que estão localizados em umgrupo de E/S diferente.

1688

084300 W Um MDisk da matriz não é mais protegido por umnúmero adequado de sobressalentes adequados.

1690

084301 W Não existe nenhuma proteção sobressalente para um oumais discos gerenciados da matriz.

1690

084302 W A matriz distribuída MDisk tem menos áreas dereconstrução disponíveis que o limite.

1690

084500 E Uma MDisk da matriz está off-line. Os metadados paragravações em andamento está em um nó ausente.

1243

164 SAN Volume Controller: Guia de Resolução de Problemas

Page 183: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 71. IDs de Eventos de Erro e Códigos de Erro (continuação)

ID deEvento

Tipo deNotificação Condição

Códigode erro

084400 W Um processo de limpeza em segundo plano encontrouuma inconsistência entre dados e paridade na matriz.

1691

084420 W O MDisk matriz foi forçado a desativar a integridade dedados do hardware marcando as unidades de membro.

2035

084600 E Uma MDisk da matriz está off-line. Os metadados no nóausente contém informações de estado necessárias.

1243

084700 W Tempo de resposta da matriz muito alto. 1750

084701 W O membro do MDisk de matriz distribuída diminui olimite de contagem de gravação excedido.

1750

084800 E O MDisk de matriz distribuída está off-line devido aotempo limite de E/S.

1340

088000 W Uma porta de E/S não pode ser iniciada 1300

088002 W As portas Fibre Channel equivalentes estão relatando queelas estão conectadas a malhas diferentes

3220

Resolvendo um problema com as unidades de inicialização doSAN Volume Controller 2145-DH8

Siga estas etapas de resolução para resolver a maioria dos problemas comunidades de inicialização.

Antes de Iniciar

O número de série do nó (também conhecido como número de série do produto oumáquina) está na etiqueta MT-M SN (etiqueta Tipo-modelo de máquina e númerode série) na frente (lado esquerdo) do nó do 2145-DH8. O número de série do nó égravado na placa-mãe e em cada uma das duas unidades de inicialização duranteo processo de fabricação.

Quando o software SAN Volume Controller é iniciado, ele lê o número de série donó da placa-mãe (usando o número de série do nó para o nome do painel e ocompara com os números de série armazenados nas duas unidades deinicialização.

Erros específicos do nó são produzidos sob as seguintes condições:v Erro fatal do nó 543: Quando nenhum dos números de série que estão

armazenados nos três locais corresponderem. Quando o número de série do nóda placa-mãe precisar corresponder a pelo menos uma das duas unidades deinicialização para o software SAN Volume Controller assumir que o número desérie é bom.

v Erro fatal do nó 545: Se o número de série do nó em cada unidade deinicialização corresponder mas não for o mesmo número de série do nó daplaca-mãe. Neste caso, o número de série na placa-mãe pode estar errado ou onúmero de série do nó nas unidades de inicialização pode estar errado. Forexemplo, a placa-mãe foi alterada ou as unidades de inicialização vem de outronó do 2145-DH8.

v Erro do nó 743: Se o número de série do nó não puder ser lido a partir de umadas duas unidades de inicialização porque essa unidade falhou, está ausente ounão está sincronizada com a outra unidade de inicialização.

Capítulo 7. Diagnosticando problemas 165

Page 184: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Erro do nó 744: Se o formato do número de série do nó de umas das unidadesde inicialização for identificada como pertencendo a um nó do 2145-DH8diferente. Se as unidades de inicialização forem trocadas entre os slots deunidade 1 e 2, o erro do nó 744 será produzido.

v Erro do nó 745: Se uma unidade de inicialização estiver em um slot nãosuportado. Unidades de slot 3-8 não são suportadas pela versão 7.3 do softwaredo SAN Volume Controller.

Sobre Esta Tarefa

Há um evento no painel Eventos de >monitoramento da GUI de gerenciamento seo problema produzir erro do nó 743, 744 ou 745. Execute os procedimentos decorreção para este evento. Caso contrário, conecte à porta técnica para usar aetiqueta MT-M SN no nó para verificar as informações do slot da unidade deinicialização e determinar o problema.

Atenção: Se o slot de unidade tiver Sim na coluna Ativa, o sistema operacionaldependerá daquela unidade. Não remova aquela unidade sem antes desligar o nó.v Não troque as unidades de inicialização entre os slots.v Cada unidade de inicialização tem uma cópia do VPD na placa-mãe.v A atualização do software é para uma unidade de inicialização por vez para

prevenir falhas durante a CCU.

Procedimento

Para resolver um problema com a unidade de inicialização, conclua as etapas aseguir em ordem:1. Remova qualquer unidade que esteja em um slot não suportado. Mova a

unidade para o slot correto se possível.2. Se possível, substitua qualquer unidade que seja exibida como ausente de um

slot. Caso contrário, reposicione a unidade ou substitua com uma unidade doestoque FRU.

3. Mova qualquer unidade que esteja no nó errado de volta ao nó correto.

Nota: Se o número de série do nó não corresponder ao número de série do nóna placa-mãe, um slot de unidade tem um status de wrong_node. É possívelignorar este status se o número de série na etiqueta MT-M SN corresponder aonúmero de série do nó na unidade.

4. Mova qualquer unidade que esteja no slot errado de volta ao slot correto.5. Reposicionar a unidade em qualquer slot que tenha um status de failed. Se o

status permanecer failed, substitua a unidade com uma do estoque FRU.6. Se o slot de unidade tiver um status out of sync e Sim na colunacan_sync,

então:v Use o assistente de serviço da interface gráfica com o usuário para

sincronizar unidades de inicialização, ouv Use o comando da interface de linha de comandos (CLI) satask chbootdrive

-sync.v Se Não for exibido na coluna can_sync, você deverá resolver um outro

problema da unidade de inicialização primeiro.

Substituindo a placa-mãe do 2145-DH8:

166 SAN Volume Controller: Guia de Resolução de Problemas

Page 185: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

7. Substitua a placa-mãe do SAN Volume Controller 2145-DH8.Quando nenhuma das unidades de inicialização tiver software SAN VolumeController utilizável:

Por exemplo, se você substituir ambas as unidades de inicialização do estoque FRUao mesmo tempo, nenhuma das unidades de inicialização tiver software SANVolume Controller utilizável. Se o software SAN Volume Controller não estiver emexecução, os LEDs de status do nó, falha do nó, status da bateria e de falha dabateria permanecerão desligados.8. Se você não puder substituir pelo menos uma das unidades de inicialização

originais por uma unidade que contenha software SAN Volume Controllerutilizável e tem um número de série do nó que corresponde à etiqueta MT-MSN na frente do nó, entre em contato com suporte técnico remoto IBM. Osuporte técnico remoto IBM pode ajudar a instalar o software SAN VolumeController com uma unidade flash USB inicializável.v A instalação USB baseada em campo também repara o número de série do

nó e WWNN armazenado em cada unidade de inicialização, encontrandovalores que são armazenados na placa-mãe durante a fabricação.

v Se o WWNN deste nó foi alterado no passado, é preciso alterar o WWNNnovamente após completar a instalação do software do SAN VolumeController. Por exemplo, se o nó substituiu um nó SAN Volume Controlleranterior, você teria mudado o WWNN para aquele do nó anterior. É possívelrepetir a alteração do WWNN após a instalação do software SAN VolumeController com a GUI do assistente de serviço ou por um comando.

Quando todas as cópias do número de série do nó forem perdidas:

Por exemplo, se você trocar a placa-mãe e as duas unidades de inicialização comestoque FRU ao mesmo tempo, cada cópia do número de série do nó será perdida.9. Se você não puder substituir uma das unidades de inicialização originais ou a

placa-mãe original para que pelo menos uma cópia do número de série originalesteja presente, você não poderá reparar o nó no campo. Você deve devolver onó para a IBM para o reparo.

Resultados

O status de um slot de unidade será não inicializado apenas se o software SANVolume Controller talvez não iniciar a unidade FRU automaticamente. Este statuspode acontecer se o número de série do nó na outra unidade de inicialização nãocorresponder ao número de série do nó na placa-mãe. Se o número de série do nóna outra unidade de inicialização corresponder à etiqueta SN MT-M na frente queestá à esquerda do nó, é possível resgatar a unidade de inicialização nãoinicializada a partir da outra unidade de inicialização com segurança. Use a GUIde assistente de serviço ou o comando satask recuenode para resgatar a unidade.

Determinando uma falha de inicialização de hardwareDurante a inicialização de hardware, você verá mensagens de progresso, se omodelo tiver uma exibição do painel frontal. Se o modelo não tiver um painel deexibição frontal, LEDs indicadores luminosos indicarão uma falha de inicializaçãode hardware.

Antes de Iniciar

A Linha 1 do painel frontal exibe a mensagem Inicializando seguida pelo códigode inicialização. A Linha 2 da exibição mostra um indicador de progresso de

Capítulo 7. Diagnosticando problemas 167

Page 186: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

inicialização. Se o código de inicialização detectar um erro que torna impossívelcontinuar, Falha será exibido. Você pode utilizar o código para isolar a falha.

A figura seguinte mostra um exemplo de uma tela de inicialização de hardware.

Sobre Esta Tarefa

Se a inicialização detecta uma situação em que ele não pode continuar, ela falha. Acausa pode ser que o software na unidade de disco rígido está ausente oudanificado. Se possível, a sequência de inicialização carrega e inicia o softwareSAN Volume Controller. As falhas que são detectados são relatadas como um errode nó.

Execute as etapas a seguir para determinar uma falha de inicialização:

Procedimento1. Verifique se a posição dos DIMMs está correta. Uma configuração de DIMM

incorreta pode impedir que o nó inicialize.2. Tentativa de restaurar o software utilizando o procedimento de resgate do nó.3. Se o resgate do nó falhar, conclua as ações que estão descritas para qualquer

código ou procedimento de resgate de nó com falha.

Referência de código de inicializaçãoOs códigos de inicialização serão exibidos na tela quando um nó estiverinicializando.

Os códigos indicam o progresso da operação de inicialização. A Linha 1 do painelfrontal exibe a mensagem Inicializando seguida pelo código de inicialização. ALinha 2 da exibição mostra um indicador de progresso de inicialização. O Figura 60fornece uma visualização da exibição do progresso da inicialização.

Visão Geral do Código de Erro do NóOs códigos de erro do nó descrevem falhas que estão relacionadas a um nóespecífico. Códigos de resgate do nó são exibidos no painel frontal durante oresgate do nó. Um nó do 2145-DH8não tem uma exibição do painel frontal e nãotem códigos de resgate do nó.

Use a interface gráfica com o usuário do assistente de serviço pela Porta técnicapara visualizar erros do nó que não têm uma exibição do painel frontal como umnó do 2145-DH8.

C o m fa l h a 1 2 0

Figura 59. Exemplo de um Código de Erro de Inicialização

I n i c i a l i za n d o 1 3 0

Figura 60. Exemplo de uma Exibição do Progresso da Inicialização

168 SAN Volume Controller: Guia de Resolução de Problemas

||

Page 187: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Como erros do nó são específicos de um nó, por exemplo, falhas de memória, oserros podem ser relatados apenas naquele nó. No entanto, se o nó puder secomunicar com o nó de configuração, ele será relatado no log de eventos dosistema.

Quando o código de erro nó indica que foi detectado um erro crítico que impedeque o nó de se tornar um membro de um sistema em cluster, o diodo emissor deluz de falha do Nó está ligado para o nó do 2145-DH8 ou a Linha 1 da exibição dopainel frontal contém a mensagem Erro do Nó.

Linha 2 contém o código de erro ou o código de erro e dados adicionais. Em errosque envolvam um nó com mais de uma fonte de alimentação, o código de erro éseguido por dois números. O primeiro número indica a fonte de alimentação quetem um problema (1 ou 2). O segundo número indica o problema que foidetectado.

O Figura 61 fornece um exemplo de um código de erro do nó. Esses dados podemexceder a largura máxima da tela de menu. É possível pressionar a navegação àDireita para rolar a exibição.

Os dados adicionais são exclusivos para qualquer código de erro. Eles fornecem asinformações necessárias para isolar o problema em um ambiente offline. Exemplosde dados adicionais são números de série de disco e códigos de localização deunidade substituível em campo (FRU). Quando esses códigos são exibidos, épossível executar isolamento adicional de falha navegando pelo menu padrão paradeterminar o status do nó e da porta do Fibre Channel.

Há dois tipos de erros de nó: erros de nó críticos e erros de nó não críticos.

Erros críticos

Um erro crítico significa que o nó não pode participar em um sistema em clusteraté que o problema que o está impedindo de se unir a um sistema em cluster sejaresolvido. Esse erro ocorre porque parte do hardware falhou ou o sistema detectaque o software está corrompido. Se um nó tiver um erro de nó crítico, ele está noestado de serviço e o LED de falha no nó está aceso. A exceção é quando o nó nãopode se conectar a recursos suficientes para formar um sistema em cluster. Elemostra um erro de nó crítico mas está no estado de inicialização. Resolva os errosem ordem de prioridade. A faixa de erros que está reservada para erros críticos éde 500 a 699.

Erros não críticos

Um código de erro não crítico é registrado quando há uma falha de hardware oude código que é relacionada a apenas um nó específico. Esses erros não impedem onó de entrar no estado ativo e de se juntar a um sistema em cluster. Se o nó forparte de um sistema em cluster, um alerta descreve a condição de erro. A faixa deerros que está reservada para erros não críticos é de 800 a 899.

Er ro d e n ó :

5 5 0 00 0 1 2 5

Figura 61. Exemplo de um Código de Erro do Nó Exibido

Capítulo 7. Diagnosticando problemas 169

Page 188: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Códigos de resgate do nó

Para iniciar o resgate do nó, pressione os botões para esquerda e para direita e osmantenha pressionados no painel frontal durante um ciclo de ligação. A tela demenu exibe a solicitação de resgate do Nó. Consulte o tópico de solicitação deresgate do nó. O disco rígido é formatado e, se a formatação for concluída semerro, a imagem do software será transferida por download a partir de qualquer nódisponível. Durante a recuperação de nó, a Linha 1 da tela de menu exibe amensagem Inicializando seguida por um dos códigos de resgate de nó. A Linha 2da tela de menu exibe um indicador de progresso de inicialização. O Figura 62exibe um exemplo de um código de resgate de nó exibido.

O código de três dígitos que é mostrado no Figura 62 representa um código deresgate de nó.

Nota: O 2145 UPS-1U não é desligado em seguida a uma falha de resgate do nó.

Visão Geral do Código do Sistema em ClusterOs códigos de erro para a criação de um sistema em cluster são exibidos na tela demenu quando você está usando o painel frontal para criar um novo sistema, mas aoperação de criação falha. Os códigos de recuperação de cluster indicam queocorreu um erro de software crítico que pode distorcer seu sistema. Códigos deerro para sistemas em cluster descrevem erros diferentes de erros de criação erecuperação. Cada tópico de código de erro inclui um número de código de erro,uma descrição, uma ação e prováveis field-replaceable units (FRUs).

Códigos de erro para criação de um sistema em cluster

Figura 63 fornece um exemplo de um código de erro de criação.

A Linha 1 da tela do menu contém a mensagem Falha na Criação. A Linha 2mostra o código de erro e, onde necessário, dados adicionais.

Códigos de erro para recuperação de um sistema em cluster

Você deve executar a análise de problemas de software antes de poder executaroperações adicionais para evitar a possibilidade de distorção de sua configuração.

Figura 64 na página 171 fornece um exemplo de um código de erro de recuperação.

I n i c i a l i za n d o 3 0 0

Figura 62. Exemplo de um Código de Erro de Resgate do Nó

Fa l h a n a c r i a çã o :

7 0 0

Figura 63. Exemplo de uma Criação de Código de Erro para um Sistema em Cluster

170 SAN Volume Controller: Guia de Resolução de Problemas

Page 189: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Códigos de erro para sistema em cluster

Códigos de erro para sistemas em cluster descrevem erros diferentes de erros derecuperação.

Figura 65 fornece um exemplo de um código de erro de sistema em cluster.

Faixa de Códigos de ErroEste tópico mostra a faixa de números para cada classificação de mensagens.

Tabela 72 lista a faixa de números para cada classificação de mensagens.

Tabela 72. Faixa de Números da Classificação de Mensagens

Classificação demensagens Faixa

Códigos de Inicialização 100 a 299

Erros de Nó Erros de resgate do nó 300 a 399

Erros de nó apenas de log 400 a 499

Erros de nó críticos 500 a 699

Erros de nó não críticos 800 a 899

Códigos de erro ao criarum sistema em cluster

700, 710

Códigos de erro aorecuperar um sistema emcluster

920, 990

Códigos de erro para umsistema em cluster

1001 a 3081

100 A inicialização está em execução

Explicação: O nó foi iniciado. Ele está executandodiagnósticos e carregando o código de tempo deexecução.

Resposta do Usuário: Acesse o MAPA de inicializaçãode hardware para resolver o problema.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (47%)

v Cabo do controlador de serviço (47%)

v Conjunto da placa-mãe (6%)

120 Erro de hardware da unidade de disco

Explicação: A unidade de disco interna do nó relatouum erro. O nó não pode iniciar.

Resposta do Usuário: Assegure que a unidade dedisco de inicialização e todo o cabeamento relacionadosestejam adequadamente conectados e, em seguida,troque a FRU para uma nova FRU. Consulte “CausaPossível - unidades substituíveis em campo ou outra”.

Er ro d e n ó :

9 0 1

Figura 64. Exemplo de um Código de Erro de Recuperação

svc0043

3

Figura 65. Exemplo de um Código de Erro para um Sistema em Cluster

100 • 120

Capítulo 7. Diagnosticando problemas 171

Page 190: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Unidade de disco (50%)

v Controladora de disco (30%)

v Painel traseiro do disco (10%)

v Cabo de sinal do disco (8%)

v Cabo de energia do disco (1%)

v Placa-mãe (1%)

130 Verificando o sistema de arquivos dedisco interno

Explicação: O sistema de arquivos na unidade dedisco interna do nó está sendo verificado parainconsistências.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por pelo menos cinco minutos,desligue o nó e, em seguida, ligue o nó. Se o processode inicialização parar novamente neste ponto, execute oprocedimento de resgate do nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma.

132 Atualizando configurações de BIOS donó

Explicação: O sistema descobriu que alterações sãonecessárias para as configurações de BIOS do nó. Essasalterações estão sendo feitas. O nó será reiniciadodepois que as alterações estiverem concluídas.

Resposta do Usuário: Se a barra de progresso ficarinterrompida por mais de 10 minutos, ou se o monitortiver mostrado os códigos 100 e 132 três vezes ou mais,acesse “MAP 5900: Inicialização de hardware” napágina 372 para resolver o problema.

135 Verificando o software

Explicação: A integridade dos pacotes de software donó está sendo verificada.

Resposta do Usuário: Permitir a conclusão doprocesso de verificação.

137 Atualizando o firmware do processadorde serviço da placa-mãe

Explicação: O firmware do processador de serviço donó está sendo atualizado para um novo nível. Esteprocesso pode levar de 90 minutos. Não reinicie o nóenquanto o processo estiver em andamento.

Resposta do Usuário: Deixe o processo de atualizaçãoconcluir.

150 Carregando o código do cluster

Explicação: O SAN Volume Controller o código estiversendo carregado.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por pelo menos 90 segundos,desligue o nó e, em seguida, ligue o nó. Se o processode inicialização parar novamente neste ponto, execute oprocedimento de resgate do nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma.

155 Carregando dados do cluster

Explicação: O estado do cluster e os dados em cachesalvos estão sendo carregados.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por pelo menos 5 minutos, desligueo nó e, em seguida, ligue o nó. Se o processo deinicialização parar novamente neste ponto, execute oprocedimento de resgate do nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma.

160 Atualizando o controlador de serviço

Explicação: O firmware no controlador de serviço estásendo atualizado. Isso pode levar de 30 minutos.

Resposta do Usuário: Quando estiver ocorrendo umresgate de nó, se a barra de progresso tiver sidointerrompida por pelo menos 30 minutes, troque a FRUpor uma nova FRU. Quando não estiver ocorrendo umresgate de nó, se a barra de progresso tiver sidointerrompida por pelo menos 15 minutos, troque a FRUpor uma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (95%)

v Cabo do controlador de serviço (5%)

Todos os modelos 2145 anteriores

v Controlador de Serviço (100%)

168 O comando não pode ser iniciadoporque as credenciais de autenticaçãopara a sessão de SSH atual expiraram.

Explicação: As credenciais de autenticação para asessão de SSH atual expiraram e todas as autorizaçõespara a sessão atual foram revogadas. Um administradordo sistema pode ter limpado o cache de autenticação.

Resposta do Usuário: Inicie uma nova sessão de SSH

130 • 168

172 SAN Volume Controller: Guia de Resolução de Problemas

Page 191: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

e emita novamente o comando.

170 Ocorreu um erro de hardware domódulo flash.

Explicação: Ocorreu um erro de hardware do móduloflash.

Resposta do Usuário: Troque a FRU por uma novaFRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (95%)

v Cabo do controlador de serviço (5%)

Todos os modelos 2145 anteriores

v Controlador de serviço (100%)

182 Verificando a fonte de alimentaçãoininterrupta

Explicação: O nó está verificando se a fonte dealimentação ininterrupta está operando corretamente.

Resposta do Usuário: Deixe o processo de atualizaçãoconcluir.

232 Verificando conexões de fonte dealimentação ininterrupta

Explicação: O nó está verificando se as conexões doscabos de energia e de alimentação com a fonte dealimentação ininterrupta estão corretas.

Resposta do Usuário: Deixe o processo de atualizaçãoconcluir.

300 O 2145 está executando o resgate do nó.

Explicação: O 2145 está executando o resgate do nó.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por pelo menos dois minutos, troquea FRU por uma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (95%)

v Cabo do controlador de serviço (5%)

v Controlador de serviço (100%)

310 O 2145 está executando uma operação deformatação.

Explicação: O 2145 está executando uma operação deformatação.

Resposta do Usuário: Se a barra de progresso tiver

sido interrompida por dois minutos, troque a FRU poruma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Unidade de disco (50%)

v Controladora de disco (30%)

v Painel traseiro do disco (10%)

v Cabo de sinal do disco (8%)

v Cabo de energia do disco (1%)

v Placa-mãe (1%)

v Conjunto da unidade de disco (90%)

v Conjunto do cabo de disco (10%)

320 Uma operação de formato 2145 falhou.

Explicação: Uma operação de formato 2145 falhou.

Resposta do Usuário: Troque a FRU por uma novaFRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Unidade de disco (50%)

v Controladora de disco (30%)

v Painel traseiro do disco (10%)

v Cabo de sinal do disco (8%)

v Cabo de energia do disco (1%)

v Placa-mãe (1%)

v Conjunto da unidade de disco (90%)

v Conjunto do cabo de disco (10%)

330 O 2145 está particionando sua unidadede disco.

Explicação: O 2145 está particionando sua unidade dedisco.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por dois minutos, troque a FRU poruma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Unidade de disco (50%)

v Controladora de disco (30%)

v Painel traseiro do disco (10%)

v Cabo de sinal do disco (8%)

v Cabo de energia do disco (1%)

v Placa-mãe (1%)

v Conjunto da unidade de disco (90%)

v Conjunto do cabo de disco (10%)

170 • 330

Capítulo 7. Diagnosticando problemas 173

Page 192: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Outra:

v Problema de configuração

v Erro de software

340 O 2145 está procurando o nó doador.

Explicação: O 2145 está procurando o nó doador.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por mais de dois minutos, troque aFRU por uma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

v Adaptador Fibre Channel (100%)

345 O 2145 está procurando um nó doadordo qual copiar o software.

Explicação: O nó está procurando um nó doador em 1Gb/s.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por mais de dois minutos, troque aFRU por uma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

v Adaptador Fibre Channel (100%)

350 O 2145 não pode localizar um nódoador.

Explicação: O 2145 não pode localizar um nó doador.

Resposta do Usuário: Se a barra de progresso ficouinterrompida por mais de dois minutos, execute estasetapas:

1. Assegure-se de que todos os cabos Fibre Channelestejam conectados corretamente e seguramente aocluster.

2. Assegure-se de que pelo menos um outro nó estejaoperacional, conectado à mesma rede do FibreChannel e seja um candidato a nó doador. Um nóserá um candidato a nó doador se a versão dosoftware instalada neste nó suportar o tipo demodelo do nó sendo resgatado.

3. Certifique-se de que o zoneamento Fibre Channelpermita uma conexão entre o nó que está sendoresgatado e o candidato a nó doador.

4. Execute os procedimentos de determinação deproblema para a rede.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Problema de rede Fibre Channe

360 O 2145 está carregando software dodador.

Explicação: O 2145 está carregando software do dador.

Resposta do Usuário: Se a barra de progresso tiversido interrompida por pelo menos dois minutos,reinicie o procedimento de resgate do nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

365 Não é possível carregar software dodoador

Explicação: Nenhuma.

Resposta do Usuário: Nenhuma.

370 Instalando o software

Explicação: O 2145 está instalando o software.

Resposta do Usuário:

1. Se esse código for exibido e a barra de progressotiver sido interrompida por pelo menos dezminutos, o processo de instalação de softwarefalhou com um erro de software inesperado.

2. Desligue o 2145 e aguarde 60 segundos.

3. Ligue o 2145. A operação de atualização de softwarecontinua.

4. Relate este problema imediatamente para seuCentro de Suporte de Software.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

500 Gabinete incorreto

Explicação: A caixa de nó salvou as informações docluster, o que indica que a caixa agora está localizadaem um gabinete diferente de onde ela foi utilizadaanteriormente. A utilização da caixa de nó nesse estadopode distorcer os dados mantidos nas unidades dogabinete.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para mover os nós para o localcorreto.

1. Siga o “Procedimento: Obtendo Informações daCaixa de Nó e do Sistema Usando o assistente deserviço” tarefa para revisar a caixa de nó salvou asinformações de local e o status da outra caixa do nóno gabinete (a caixa do parceiro). Determine se ogabinete é parte de um sistema ativo com volumesque contém dados necessários.

2. Se tiver movido acidentalmente a caixa para estegabinete, mova a caixa de volta para seu local

340 • 500

174 SAN Volume Controller: Guia de Resolução de Problemas

Page 193: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

original e coloque a caixa original de volta nestegabinete. Siga o procedimento “Substituindo umacaixa do nó” .

3. Se você tiver movido intencionalmente a caixa denó para este gabinete, deverá verificar se é segurocontinuar ou se você perderá os dados no gabinetedo qual você o removeu. Não continue se o sistemado qual a caixa do nó foi removido estiver offline;em vez disso, retorne a caixa do nó para essesistema.

4. Se você tiver determinado que você pode continuar,siga o “Procedimento: Removendo dados dosistema a partir de uma caixa do nó” tarefa pararemover dados do cluster da caixa do nó.

5. Se o nó do parceiro neste gabinete não estiveronline, ou não estiver presente, você terá queexecutar uma recuperação do sistema. Não crie umnovo sistema, senão perderá todos os dados devolume.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

501 Slot incorreto

Explicação: A caixa de nó salvou as informações docluster, o que indica que a caixa não está localizada nogabinete esperado, mas em um slot diferente de ondeela foi utilizada anteriormente. A utilização da caixa denó nesse estado pode significar que os hosts nãopodem se conectar corretamente.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para relocalizar a caixa do nóno local correto.

1. Siga o “Procedimento: Obtendo Informações daCaixa de Nó e do Sistema Usando o assistente deserviço” tarefa para revisar a caixa de nó salvou asinformações de local e o status da outra caixa do nóno gabinete (a caixa do parceiro). Se a caixa de nótiver sido acidentalmente trocada, a outra caixa denó terá o mesmo erro.

2. Se as caixas tiverem sido trocadas, utilize oprocedimento “Substituindo uma caixa do nó” paratrocar as caixas. O sistema deve iniciar.

3. Se a caixa do parceiro estiver em um estadocandidato, utilize o procedimento de remoção dehardware e de substituição da caixa para trocar ascaixas. O sistema deve iniciar.

4. Se a caixa do parceiro estiver em estado ativo, elaestá executando o cluster neste gabinete e tiversubstituído a utilização original desta caixa. Siga o“Procedimento: Removendo dados do sistema apartir de uma caixa do nó” tarefa para removerdados do cluster desta caixa de nó. A caixa de nóentão se tornará ativa no cluster em seu slot atual.

5. Se a caixa do parceiro estiver em estado de serviço,revise o erro do seu nó para determinar a ação

correta. Geralmente, você corrigirá os errosrelatados no nó do parceiro em ordem deprioridade e revisará a situação novamente apóscada alteração. Se tiver que substituir a caixa doparceiro por uma nova, é necessário mover estacaixa de volta ao local correto ao mesmo tempo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

502 Não existe nenhuma identidade dogabinete e um status a partir do nó doparceiro não pôde ser obtido.

Explicação: O gabinete foi substituído e acomunicação com a outra caixa do nó (nó do parceiro)no gabinete não é possível. O nó do parceiro pode estarausente, desligado ou impossibilitado de inicializar oupode existir uma falha na comunicação interno.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para configurar o gabinete:

1. Siga os procedimentos para resolver um problemaao iniciar o nó do parceiro. Um erro continuaráexistindo porque o gabinete não possui identidade.Se o erro foi alterado, siga o procedimento deserviço para esse erro.

2. Se o parceiro foi iniciado e estiver mostrando umerro local (provavelmente este um), então o link PCIestá provavelmente quebrado. Como o painelintermediário do gabinete foi recentementesubstituído, este é provavelmente o problema.Obtenha um painel intermediário de gabinete desubstituição e substitua-o.

3. Se essa ação não resolver o problema, entre emcontato com o IBM Support Center. Eles trabalharãocom você para assegurar que os dados de estado dosistema não sejam perdidos durante a resolução doproblema.

FRUs de Causa Possíveis ou outra:

v Painel intermediário do gabinete (100%)

503 Tipo de gabinete incorreto

Explicação: A caixa de nó foi movida para umgabinete de expansão. Uma caixa de nó não irá operarneste ambiente. Isso também pode ser relatado quandouma caixa do nó de substituição é instalada pelaprimeira vez.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para relocalizar os nós no localcorreto.

1. Siga o procedimento Obtendo informações da caixado nó e do sistema usando uma unidade flash USBe revise as informações do local salvas da caixa donó para determinar a qual gabinete de controle acaixa do nó pertence.

501 • 503

Capítulo 7. Diagnosticando problemas 175

Page 194: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Siga o procedimento para mover a caixa do nó parao local correto, em seguida, siga o procedimentopara mover a caixa de expansão, que provavelmenteestará naquele local, para o local correto. Se houveruma caixa do nó que esteja no estado ativo no qualessa caixa do nó deve estar, não substitua essa caixado nó por esta.

504 Nenhuma correspondência entre aidentidade do gabinete e o nó doparceiro.

Explicação: Os dados vitais do produto do gabineteindicam que o painel intermediário di gabinete foisubstituído. Esta caixa de nó e a outra caixa de nó nogabinete estavam anteriormente operacional no mesmopainel intermediário do gabinete.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para configurar o gabinete.

1. Esta é uma situação esperada durante oprocedimento de remoção e substituição dehardware para um painel intermediário do gabinetede controle. Continue seguindo o procedimento deremoção e substituição, e configure o novo gabinete.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

505 Nenhuma identidade e parceiro dogabinete e nenhum parceiro possuemdados que não corresponde.

Explicação: Os dados vitais do produto do gabineteindicam que o painel intermediário di gabinete foisubstituído. Esta caixa de nó e a outra caixa de nó nogabinete não vêm do mesmo gabinete original.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para relocalizar os nós no localcorreto.

1. Siga o “Procedimento: Obtendo Informações daCaixa de Nó e do Sistema Usando o assistente deserviço” tarefa para revisar a caixa de nó salvou asinformações de local e o status da outra caixa do nóno gabinete (a caixa do parceiro). Determine se ogabinete é parte de um sistema ativo com volumesque contém dados necessários.

2. Decida o que fazer com a caixa de nó que não veiodo gabinete que está sendo substituído.

a. Se a outra caixa de nó do gabinete que estásendo substituído estiver disponível, utilize osprocedimentos de remoção de hardware esubstituição da caixa para remover a caixaincorreta e substitua-a pela segunda caixa de nóa partir do gabinete que está sendo substituído.Reinicie ambas as caixas. As duas caixas de nósdevem mostrar erro de nó 504 e as ações paraesse erro devem ser seguidas.

b. Se a outra caixa de nó do gabinete que estásendo substituído não estiver disponível,verifique o gabinete da caixa de nó que não veiodo gabinete substituído. Não utilize essa caixanesse gabinete se necessitar que os dados devolume no sistema a partir do qual a caixa denó tiver sido removida e se esse sistema nãoestiver executando com dois nós on-line. Vocêdeve retornar a caixa a seu gabinete original eutilizar uma caixa diferente nesse gabinete.

c. Quando tiver verificado que eles não sãonecessários em outro local, siga o“Procedimento: Removendo dados do sistema apartir de uma caixa do nó” tarefa para removeros dados do cluster da caixa do nó que nãovieram do gabinete que está sendo substituído.

d. Reinicie ambos os nós. erro de nó 506 a serrelatado agora Expect e, em seguida, siga osprocedimentos de serviço para esse erro.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

506 Nenhuma identidade do gabinete enenhum estado de nó no parceiro

Explicação: Os dados vitais do produto do gabineteindicam que o painel intermediário di gabinete foisubstituído. Não há informações de estado do clusterna outra caixa de nó no gabinete (o caixa do parceiro),portanto ambas as caixas de nós do gabinete originalnão foram movidas para esta.

Resposta do Usuário: Sigas os procedimentos deresolução de problemas para relocalizar os nós no localcorreto:

1. Siga o procedimento: Obter informações da caixa donó e do sistema e revisar as informações de locaissalvas da caixa do nó e determinar porque asegunda caixa do nó do gabinete original não foimovida para este gabinete.

2. Se tiver certeza de que esta caixa de nó veio dogabinete que está sendo substituído e a caixa doparceiro original estiver disponível, utilize o“Substituindo uma caixa do nó” procedimento parainstalar a segunda caixa do nó nesse gabinete.Reinicie a caixa de nó. As duas caixas de nó devemmostrar erro de nó 504, e as ações para esse errodevem ser seguidas.

3. Se tiver certeza de que esta caixa de nó veio dogabinete que está sendo substituído e a caixa doparceiro original tiver falhado, continue seguindo oprocedimento de remoção e substituição para umpainel intermediário de gabinete e configure o novogabinete.

Causa Possível - unidades substituíveis em campo ououtra:

504 • 506

176 SAN Volume Controller: Guia de Resolução de Problemas

Page 195: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Nenhuma

507 Nenhuma identidade de gabinete enenhum estado do nó

Explicação: A caixa de nó foi colocada em um painelintermediário de gabinete substituto. A caixa do nótambém é substituta ou teve todo estado de clusterremovido dela.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para relocalizar os nós no localcorreto.

1. Verifique o status do outro nó no gabinete. A menosque ele também mostre o erro 507, verifique oserros no outro nó e siga os procedimentoscorrespondentes para resolver os erros. Elegeralmente mostra o erro do nó 506.

2. Se o outro nó no gabinete também estiver relatando507, o gabinete e ambas as caixas de nós nãopossuem informações de estado. Entre em contatocom o suporte IBM. Eles o ajudarão na configuraçãodos dados vitais do produto do gabinete e naexecução da recuperação do cluster.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

508 Identificador de cluster é diferente entreo gabinete e o nó

Explicação: As informações de local da caixa de nómostram que ela está no gabinete correto, no entanto ogabinete teve um novo sistema em cluster criado neledesde que o nó foi encerrado pela última vez. Portanto,os dados de estado do sistema em cluster armazenadosno nó não são válidos.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para relocalizar corretamenteos nós.

1. Verifique se um novo sistema em cluster foi criadoneste gabinete enquanto esta caixa não estavaoperacional ou se a caixa do nó foi instaladarecentemente no gabinete.

2. Siga o “Procedimento: Obtendo Informações daCaixa de Nó e do Sistema Usando o assistente deserviço” tarefa e verifique a caixa do nó do parceiropara ver se também está reportando o erro do nó508. Se estiver, verifique se as informações dosistema salvas neste e no nó do parceirocorrespondem.

Se as informações do sistema em ambos os nóscorresponderem, siga o “Substituindo um painelintermediário do gabinete de controle”procedimento para alterar o painel intermediário dogabinete.

3. Se esta caixa do nó for a que tiver que ser utilizadaneste gabinete, siga o “Procedimento: Removendo

dados do sistema a partir de uma caixa do nó”tarefa para remover dados do sistema em cluster dacaixa de nó. Ela será então unir o sistema emcluster.

4. Se esta não for a caixa do nó que você pretendeusar, siga o procedimento “Substituindo uma caixado nó” para substituir a caixa do nó por aquela aser destinadas para uso.

Causa Possível - unidades substituíveis em campo ououtra:

v Erro de procedimento de serviço (90%)

v Painel intermediário do gabinete (10%)

509 A identidade do gabinete não pode serlida.

Explicação: A caixa não pôde ler dados vitais doproduto (VPD) do gabinete. A caixa exige esses dadospara poder inicializar corretamente.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Verifique os erros relatados na outra caixa de nóneste gabinete (a caixa do parceiro).

2. Se estiver relatando o mesmo erro, siga oprocedimento de remoção e substituição dehardware para substituir o painel intermediário dogabinete.

3. Se a caixa do parceiro não estiver relatando esteerro, siga o procedimento de remoção e substituiçãode hardware para substituir esta caixa.

Nota: Se um sistema recém-instalado tiver este erro emambas as caixas de nós, os dados que precisam sergravados no gabinete não estarão disponíveis nascaixas; entre em contato com o suporte IBM para obteros WWNNs a serem usados.

Lembre-se: Revise a saída lsservicenodes para saber oque o nó está relatando.Causa Possível - unidades substituíveis em campo ououtra:

v Caixa de nó (50%)

v Painel intermediário do gabinete (50%)

510 O tamanho de memória detectado nãocorresponde ao tamanho de memóriaesperado.

Explicação: A quantidade de memória detectada no nóé menor que a quantidade necessária para que o nóopere como um membro ativo de um sistema. O códigode erro mostra a memória detectada, em MB, seguidopela memória mínima necessária em MB; há uma sériede valores indicando a quantidade de memória em GBdetectada em cada slot de memória.

Dados:

507 • 510

Capítulo 7. Diagnosticando problemas 177

Page 196: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Memória detectada em MB

v Memória mínima necessária em MB

v Memória no slot 1 em GB

v Memória no slot 2 em GB

v ... etc.

Resposta do Usuário: Verifique o tamanho damemória de outro 2145 que está no mesmo cluster. Parao 2145-CF8 e 2145-CG8, se você acabou de substituirum módulo de memória, verifique se o móduloinstalado tenha o tamanho correto e, em seguida, acesseo MAP de indicadores luminosos para isolar qualquermódulo de memória com falha possível.

FRUs de Causa Possíveis ou outra:

v Módulo de memória (100%)

511 O banco de memória 1 do 2145 estáfalhando. Somente para o 2145-DH8, osDIMMS estão instalados incorretamente.

Explicação: O banco de memória 1 do 2145 estáfalhando.

Somente para o 2145-DH8, os DIMMS estão instaladosincorretamente. Isso comprometará o desempenho.

Resposta do Usuário: Somente para o 2145-DH8,encerre o nó e ajuste a colocação do DIMM conforme asinstruções de instalação.

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de memória (100%)

511 O banco de memória 1 do 2145 estáfalhando. Somente para o 2145-DH8, osDIMMS estão instalados incorretamente.

Explicação: O banco de memória 1 do 2145 estáfalhando.

Somente para o 2145-DH8, os DIMMS estão instaladosincorretamente. Isso comprometará o desempenho.

Resposta do Usuário: Somente para o 2145-DH8,encerre o nó e ajuste a colocação do DIMM conforme asinstruções de instalação.

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de memória (100%)

512 Gabinete VPD está inconsistente

Explicação: O VPD do painel intermediário dogabinete não é consistente. O número de peça damáquina não é compatível com o tipo de máquina emodelo. Isso indica que o VPD do gabinete estácorrompido.

Resposta do Usuário:

1. Verifique o site de suporte para uma atualização decódigo.

2. Use os procedimentos de remoção e substituiçãopara substituir o painel intermediário do gabinete.

Causa Possível - unidades substituíveis em campo ououtra:

v Painel intermediário do gabinete (100%)

513 Banco de memória 2 do 2145 está comfalha.

Explicação: Banco de memória 2 do 2145 está comfalha.

Resposta do Usuário: Para o 2145-8G4 e 2145-8A4,acesse o MAP de indicadores luminosos para resolveresse problema.

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de memória (100%)

514 Banco de memória 3 do 2145 está comfalha.

Explicação: Banco de memória 3 do 2145 está comfalha.

Resposta do Usuário: Para o 2145-8G4 e 2145-8A4,acesse o MAP de indicadores luminosos para resolveresse problema.

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de memória (100%)

515 Banco de memória 4 do 2145 está comfalha.

Explicação: Banco de memória 4 do 2145 está comfalha.

Resposta do Usuário: Para o 2145-8G4 e 2145-8A4,acesse o MAP de indicadores luminosos para resolveresse problema.

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de memória (100%)

517 Os WWNNs do controlador de serviço eo disco não correspondem.

Explicação: O nó não pode determinar o WWNN queele deve usar. Isso ocorre por causa do controlador deserviço ou da unidade interna de nós sendosubstituída.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para configurar o WWNN donó.

511 • 517

178 SAN Volume Controller: Guia de Resolução de Problemas

Page 197: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1. Continue seguindo o procedimento de remoção esubstituição de hardware para o controlador deserviço ou o disco.

2. Se você não tiver seguido os procedimentos deremoção e substituição de hardware, determine oWWNN correto. Se não tiver essas informaçõesregistradas, examine a configuração do seucomutador Fibre Channel para ver se ele estálistado lá. Siga os procedimentos para alterar oWWNN de um nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

521 Não é possível detectar um adaptadorFibre Channel

Explicação: O sistema não pode detectar nenhumadaptador Fibre Channel.

Resposta do Usuário: Assegure-se de que umadaptador Fibre Channel esteja instalado. Assegure-sede que o adaptador Fibre Channel esteja encaixadocorretamente na placa riser. Assegure-se de que a placariser esteja encaixada corretamente na placa-mãe. Se oproblema persistir, substitua as FRUs por novas FRUsna ordem mostrada.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Conjunto de adaptador de barramento host de 4portas Fibre Channel (95%)

v Conjunto de placa-mãe (5%)

522 O processador de serviço da placa-mãefalhou.

Explicação: O processador de serviço na placa-mãefalhou.

Resposta do Usuário: Somente para o 2145-DH8:

1. Encerre o nó.

2. Remova o cabo de energia principal.

3. Aguarde as luzes pararem de piscar.

4. Conecte a energia e, em seguida, aguarde o nó serinicializado.

5. Se isso falhar, substitua a placa-mãe.

Troque a FRU por uma nova FRU.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8, 2145-CG8 ou 2145-DH8

v Conjunto de placa-mãe (100%)

523 O sistema de arquivos do disco internoestá danificado

Explicação: Os procedimentos de inicialização do nóencontraram problemas com o sistema de arquivos nodisco interno do nó.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para recarregar o software.

1. Siga o procedimento: Resgatar o código de máquinada caixa do nó de outro nó (resgate do nó).

2. Se o nó de resgate não for bem-sucedido, utilize osprocedimentos de remoção e substituição dehardware.

Causa Possível - unidades substituíveis em campo ououtra:

v Caixa do nó (80%)

v Outro (20%)

524 Não é possível atualizar asconfigurações do BIOS.

Explicação: Não é possível atualizar as configuraçõesdo BIOS.

Resposta do Usuário: Desligue o nós, espere 30segundos e, em seguida, ligue novamente. Se o códigode erro ainda for relatado, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra:

v Placa-mãe (100%)

525 Não é possível atualizar o firmware doprocessador de serviços da placa-mãe.

Explicação: Os procedimentos de inicialização do nóforam incapaz de atualizar a configuração do firmwareda caixa de nó. A atualização pode demorar 90minutos.

Resposta do Usuário:

1. Se a barra de progresso tiver sido interrompida pormais de 90 minutos, desligue e reinicialize o nó. Sea barra de progresso parar novamente neste código,substitua a FRU mostrada.

2. Tente remover os cabos de energia e, em seguida,reiniciar para corrigir o problema, se desligar oureiniciar não funcionarem.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Placa-mãe (100%)

521 • 525

Capítulo 7. Diagnosticando problemas 179

Page 198: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

528 Temperatura ambiente muito altadurante inicialização do sistema

Explicação: A leitura de temperatura ambientedurante os procedimentos de inicialização do nó émuito alto para o nó continuar. O procedimento deinicialização continuará quando a temperatura estiverdentro do intervalo.

Resposta do Usuário: Reduza a temperatura ao redordo sistema.

1. Resolva o problema com a temperatura ambienteverificando e corrigindo:

a. A temperatura da sala e o condicionamento dear.

b. A ventilação em torno do rack.

c. A corrente de ar dentro do rack.

Causa Possível - unidades substituíveis em campo ououtra:

v Problema de ambiente (100%)

530 Um problema com uma das fontes dealimentação do nó foi detectado.

Explicação: O código de erro 530 é seguido por doisnúmeros. O primeiro número é 1 ou 2 para indicar qualfonte de alimentação possui o problema.

O segundo número é um 1, 2 ou 3 para indicar a razão.

1 A fonte de alimentação não foi detectada.

2 A fonte de alimentação falhou.

3 Nenhuma energia de entrada está disponívelpara a fonte de alimentação.

Se o nó for um membro de um cluster, o clusterrelatará o código de erro 1096 ou 1097, dependendo domotivo do erro.

O erro será automaticamente limpo quando o problemafor corrigido.

Resposta do Usuário:

1. Assegure que a fonte de alimentação estejaencaixada corretamente e que o cabo de energiaesteja conectado corretamente no nó e em uma fontede alimentação.

2. Se o erro não for automaticamente marcado comocorrigido depois de dois minutos, observe o statusdos três LEDs na parte traseira da fonte dealimentação. Para o 2145-CG8 ou 2145-CF8, o LEDAC é o LED verde da parte superior, o LED DC é oLED verde do meio e o LED de erro é o LED âmbarda parte inferior.

3. Se o LED de erro da fonte de alimentação estiverapagado e os LEDs de energia de corrente alternadae DC estiverem acesos, esta é a condição normal. Se

o erro não tiver sido automaticamente corrigidodepois de dois minutos, substitua a placa-mãe.

4. Siga a ação especificada para os estados do LEDobservados na lista abaixo.

5. Se o erro não tiver sido automaticamente corrigidodepois de dois minutos, entre em contato comsuporte.

Erro, AC, DC: Ação

ON,ON ou OFF,ON ou OFF:A fonte de alimentaçãopossui uma falha. Substituir a fonte de alimentação.

OFF,OFF,OFF:Não foi detectada alimentação. Assegureque o cabo de energia esteja conectado ao nó e a umafonte de alimentação. Se o LED AC não acender,verifique sua fonte de alimentação. Se você estiverconectado a um UPS-1U 2145 que está mostrando umerro, siga o MAP 5150 2145 UPS-1U. Caso contrário,substitua o cabo de energia. Se o LED AC ainda nãoacender, substitua a fonte de alimentação.

OFF,OFF,ON:A fonte de alimentação possui uma falha.Substituir a fonte de alimentação.

OFF,ON,OFF:Assegure que a fonte de alimentaçãoesteja corretamente instalada. Se o LED DC nãoacender, substitua a fonte de alimentação.

Causa Possível - unidades substituíveis em campo ououtra:

Razão 1: Uma fonte de alimentação não foi detectada.

v Fonte de alimentação (19%)

v Placa-mãe (1%)

v Outra: Fonte de alimentação não está instaladacorretamente (80%)

Razão 2: A fonte de alimentação falhou.

v Fonte de alimentação (90%)

v Conjunto de cabos de energia (5%)

v Placa-mãe (5%)

Razão 3: Não há energia de entrada para a fonte dealimentação.

v Conjunto de cabos de energia (25%)

v Conjunto de UPS-1U (4%)

v Placa-mãe (1%)

v Outra: Fonte de alimentação não está instaladacorretamente (70%)

534 Falha da placa-mãe

Explicação: Há uma condição de erro irrecuperávelem um dispositivo na placa-mãe.

Resposta do Usuário: Para um gabinete de

528 • 534

180 SAN Volume Controller: Guia de Resolução de Problemas

Page 199: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

armazenamento , substitua a caixa e reutilize osadaptadores e ventiladores da interface.

Para um gabinete de controle , consulte os detalhesadicionais fornecidos com o erro para determinar asequência de substituição de peças adequada.

v Trilho de energia A: substitua a CPU 1.

Substitua a fonte de alimentação se OVER SPEC LEDno painel do sistema de diagnósticos por indicadoresluminosos ainda estiver aceso.

v Trilho de energia B: substitua a CPU 2.

Substitua a fonte de alimentação se OVER SPEC LEDno painel do sistema de diagnósticos por indicadoresluminosos ainda estiver aceso.

v Trilho de energia C: Substitua os componentes aseguir até que "Trilho de energia C" não seja maisrelatado:

– DIMMs 1 a 6

– Conjunto da placa riser PCI 1

– Ventilador 1

– Adaptadores opcionais que estão instalados noconjunto da placa riser PCI 1

– Substitua a fonte de alimentação se OVER SPECLED no painel do sistema de diagnósticos porindicadores luminosos ainda estiver aceso.

v Trilho de energia D: Substitua os componentes aseguir até que "Trilho de energia D" não seja maisrelatado:

– DIMMs 7 a 12

– Ventilador 2

– Cabo de energia do adaptador PCI opcional

– Substitua a fonte de alimentação se OVER SPECLED no painel do sistema de diagnósticos porindicadores luminosos ainda estiver aceso.

v Trilho de energia E: Substitua os componentes aseguir até que "Trilho de energia E" não seja maisrelatado:

– DIMMs 13 a 18

– Unidades de disco rígido

– Substitua a fonte de alimentação se OVER SPECLED no painel do sistema de diagnósticos porindicadores luminosos ainda estiver aceso.

v Trilho de energia F: Substitua os componentes aseguir até que "Trilho de energia F" não seja maisrelatado:

– DIMMs 19 a 24

– Ventilador 4

– Adaptadores opcionais que estão instalados noconjunto da placa riser PCI 2

– Conjunto da placa riser PCI 2

– Substitua a fonte de alimentação se OVER SPECLED no painel do sistema de diagnósticos porindicadores luminosos ainda estiver aceso.

v Trilho de energia G: Substitua os componentes aseguir até que "Trilho de energia G" não seja maisrelatado:

– Conjunto do painel traseiro da unidade de discorígido

– Unidades de disco rígido

– Ventilador 3

– Cabo de energia do adaptador PCI opcional

v Trilho de energia H: Substitua os componentes aseguir até que "Trilho de energia H" não seja maisrelatado:

– Adaptadores opcionais que estão instalados noconjunto da placa riser PCI 2

– Cabo de energia do adaptador PCI opcional

Causa Possível - unidades substituíveis em campo ououtra:

v Hardware (100%)

535 O comutador PCIe interno da caixafalhou

Explicação: O comutador PCI Express falhou ou nãopode ser detectado. Nesta situação, a únicaconectividade com a caixa de nó é através das portasEthernet.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

536 A temperatura de um dispositivo naplaca-mãe é maior ou igual ao limitecrítico.

Explicação: A temperatura de um dispositivo naplaca-mãe é maior ou igual ao limite crítico.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Remova a parte superior do case da máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou bloqueiosinternos.

2. Se o erro persistir, substitua a placa-mãe.

FRUs de Causa Possíveis ou outra:

v Nenhuma

538 A temperatura de uma placa riser PCI émaior ou igual ao limite de aviso.

Explicação: A temperatura de uma placa riser PCI émaior ou igual ao limite de aviso.

Resposta do Usuário: Melhore resfriamento.

1. Se o problema persistir, substitua o riser PCI

FRUs de Causa Possíveis ou outra:

535 • 538

Capítulo 7. Diagnosticando problemas 181

Page 200: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Nenhuma

541 Vários Erros de HardwareIndeterminados

Explicação: Foram relatadas múltiplas falhas nohardware nos caminhos de dados dentro do nó e olimite do número de erros aceitáveis dentro de umdeterminado prazo foi atingido. Não foi possível isolaros erros em um único componente.

Após este erro do nó surgir, todas as portas no nó sãodesativadas. O nó é considerado instável e tem opotencial de corromper dados.

Resposta do Usuário:

1. Siga o procedimento para coletar informações desuporte e entre em contato com sua organização desuporte.

2. Um software atualização pode resolver o problema.

3. Substitua o nó.

542 Uma CPU instalada falhou ou foiremovida.

Explicação: Uma CPU instalada falhou ou foiremovida.

Resposta do Usuário: Substitua a CPU.

FRUs de Causa Possíveis ou outra:

v CPU (100%)

543 Nenhum dos números de série dos nósestá armazenado nos três locaiscorrespondentes.

Explicação: Quando o software SAN VolumeController é iniciado, ele lê o número de série do nó naplaca-mãe e compara esse número de série com osnúmeros de série armazenados nas duas unidades deinicialização. Deve haver pelo menos dois números desérie do nó correspondentes pra o software SANVolume Controller para assumir que esse número desérie do nó seja bom.

Resposta do Usuário: Veja a visualização da unidadede inicialização do nó para determinar o que fazer.

1. Substitua as unidades ausentes ou com falha.

2. Coloque qualquer unidade pertencente a um nódiferente de volta ao local no qual ele pertence.

3. Se você pretende usar uma unidade de um nódiferente nesse nó de agora em diante, o erro do nóirá alterar para um erro de nó diferente quando aoutra unidade for substituída.

4. Se você substituiu a placa-mãe, o nome do painelagora será 0000000, e se você substituiu uma dasunidades, o status do slot dessa unidade seráinutilizado. Se o número de série do nó da outraunidade de inicialização corresponder ao rótuloMT-M S/N na parte frontal do nó, execute satask

rescuenode para inicializar a unidade deinicialização. A inicialização da unidade deve levarao erro do nó 545.

FRUs de Causa Possíveis ou outra:

v Nenhuma

544 As unidades de inicialização são deoutros nós.

Explicação: As unidades de inicialização são de outrosnós.

Resposta do Usuário: Verifique uma visualização daunidade de inicialização do nó para determinar o quefazer.

1. Coloque qualquer unidade pertencente a um nódiferente de volta ao local no qual ele pertence.

2. Se você pretende usar uma unidade de um nódiferente nesse nó de agora em diante, o erro do nóirá alterar para um erro de nó diferente quando aoutra unidade for substituída.

3. Veja o código de erro 1035 para obter informaçõesadicionais sobre problemas da unidade deinicialização.

FRUs de Causa Possíveis ou outra:

v Nenhuma

545 Os números de série do nó nas unidadesde inicialização correspondem entre si,mas eles não correspondem ao númerode série do produto na placa-mãe.

Explicação: Os números de série do nó nas unidadesde inicialização correspondem entre si, mas eles nãocorrespondem ao número de série do produto naplaca-mãe.

Resposta do Usuário: Verifique o valor S/N no rótuloMT-M S/N na parte frontal do nó. Veja a visualizaçãoda unidade de inicialização para determinar o númerode série do nó da placa-mãe e o número de série do nóde cada unidade.

1. Substitua as unidades de inicialização pelasunidades de inicialização corretas, se necessário.

2. Configure o número de série da placa-mãe usandoo seguinte comando:

satask chvpd -type <value> -serial <S/N value fromthe MT-M S/N label>

FRUs de Causa Possíveis ou outra:

v Nenhuma

541 • 545

182 SAN Volume Controller: Guia de Resolução de Problemas

Page 201: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

550 Um sistema em cluster não pode serformado devido a falta de recursos desistema em cluster.

Explicação: O nó não pode se tornar ativo em umsistema em cluster porque não consegue conectar-se arecursos suficientes do sistema em cluster. Os recursosde sistema em cluster são os nós no sistema e o discoquorum ativo. O nó precisará ser capaz de conectar-sea uma maioria dos recursos antes desse grupo formarum sistema em cluster on-line. Isso impede que osistema em cluster se divida em duas ou mais partesativas, com ambas as partes executando a E/Sindependentemente.

Os dados suplementares que são exibidos com essecódigo de erro listam os IDs ausentes para os 2145s e ocontrolador de disco quorum. Cada nó ausente élistado por seu ID de nó. Um disco quorum é listadocomo WWWWWWWWWWWWWWWW/LL, em queWWWWWWWWWWWWWWWW é um nomeuniversal de porta (WWPN) na controladora de discoque contém o disco quorum ausente e LL é o Númeroda Unidade Lógica (LUN) do disco quorum ausentenessa controladora.

Se a topologia do sistema for estendida e o número denós operacionais for menor que a metade, o erro de nó550 será exibido. Nesse caso, o recurso Recuperação deDesastre do Site não pode ser usado porque o númerode nós operacionais é menor que o quorum necessáriopara criar o sistema em cluster que usa o recursoRecuperação de Desastre do Site.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir problemas deconectividade entre os nós do cluster e os dispositivosquorum.

1. Verifique os erros do nó que indicam problemascom a conectividade Fibre Channel. Resolva todosos problemas.

2. Assegure-se de que os outros sistemas no clusterestejam ligados e operacionais.

3. Verifique o status da porta do Fibre Channel. Sealguma porta não estiver ativa, execute osprocedimentos de determinação de problemas daporta Fibre Channel.

4. Assegure-se de que as mudanças do zoneamento derede Fibre Channel não restrinjam a comunicaçãoentre os nós ou entre os nós e o disco quorum.

5. Execute os procedimentos de determinação deproblema para a rede.

6. O disco quorum falhou ou não pode ser acessado.Execute os procedimentos de determinação deproblema para a controladora de disco.

551 Um cluster não pode ser formado porcausa de uma falta de recursos decluster.

Explicação: O nó não possui conectividade suficientecom outros nós ou dispositivo de quorum para formarum cluster.

Tente reparar a malha ou dispositivo de quorum paraestabelecer a conectividade. Se um desastre ocorreu eos nós no outro local não puderem ser recuperados,será possível permitir os nós no local que permanecepara formar um sistema usando armazenamento local.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir problemas deconectividade entre os nós do cluster e os dispositivosquorum.

1. Verifique os erros do nó que indicam problemascom a conectividade Fibre Channel. Resolva todosos problemas.

2. Certifique-se de que os outros nós no clusterestejam ligados e operacionais.

3. Usando o SAT GUI ou CLI (sainfo lsservicestatus),exiba o status da porta Fibre Channel. Se algumaporta não estiver ativa, execute os procedimentos dedeterminação de problemas da porta Fibre Channel.

4. Assegure-se de que as mudanças do zoneamento derede Fibre Channel não restrinjam a comunicaçãoentre os nós ou entre os nós e o disco quorum.

5. Execute os procedimentos de determinação deproblema para a rede.

6. O disco quorum falhou ou não pode ser acessado.Execute os procedimentos de determinação deproblema para a controladora de disco.

7. Como último recurso quando os nós no outro ladonão puderem ser recuperados, será possível permitiros nós no local que permanecem para formar umsistema usando o armazenamento de local local:

Para evitar distorção de dados, assegure-se de quetodos os servidores host que estavam acessandoanteriormente o sistema tenham tido todos osvolumes desmontados ou tenham sidoreinicializados. Assegure-se de que os nós no outrolado não estejam operacionais e não possam formarum sistema no futuro.

Após iniciar este comando uma ressincronizaçãocompleta de todos os volumes espelhados éconcluída quando o outro site é recuperado. Éprovável que leve muitas horas ou dias paraconcluir.

Entre em contato com a equipe de suporte IBM seestiver inseguro.

Nota: Antes de continuar, confirme que já tomou asações a seguir - não executar essas ações pode levarà distorção de dados, que não serão detectados pelosistema, mas afetarão aplicativos de host.

550 • 551

Capítulo 7. Diagnosticando problemas 183

Page 202: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

a. Todos os servidores host que anteriormenteacessavam o sistema tiveram todos os volumesdesmontados ou foram reinicializados.

b. Assegure-se de que os nós no outro lado nãoestejam operando como um sistema e que asações foram tomadas para impedi-los de formarum sistema no futuro.

Após essa ações terem sido tomadas, o sataskoverridequorum poderá ser usado para permitir queos nós no site sobrevivente formem um sistema queusa um armazenamento local.

555 Erro do Domínio de Energia.

Explicação: Ambos os 2145s em um grupo de E/S queestão sendo alimentados pela mesma fonte dealimentação ininterrupta. O ID do outro 2145 é exibidocom o código de erro do nó no painel frontal.

Resposta do Usuário: Assegure-se de que aconfiguração esteja correta e de que cada 2145 esteja emum grupo de E/S e conectado a partir de uma fonte dealimentação ininterrupta separada.

556 Um WWNN duplicado foi detectado.

Explicação: O nó detectou outro dispositivo quepossui o mesmo World Wide Node Name (WWNN) narede Fibre Channel. Um WWNN tem 16 dígitoshexadecimais de comprimento. Para um cluster, osprimeiros 11 dígitos são sempre 50050768010. Osúltimos 5 dígitos do WWNN são fornecidos nos dadosadicionais do erro e aparecem no monitor do painelfrontal. As portas Fibre Channel do nó são desativadaspara evitar a interrupção da rede Fibre Channel. Um ouambos os nós com o mesmo WWNN pode mostrar oerro. Devido à maneira como os WWNNs são alocados,um dispositivo com um WWNN duplicado énormalmente outro nó de cluster.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para configurar o WWNN donó:

1. Localize o nó do cluster com o mesmo WWNN donó relatando o erro. O WWNN de um nó do clusterpode ser localizado nos Dados Vitais do Produto(VPD) do nó ou no menu Nó no painel frontal. Onó com o WWNN duplicado precisa não ser partedo mesmo cluster que o nó que relata o erro. Elepode ser remoto a partir do nó que relata o erro emuma parte da malha conectada por meio de um linkintercomutadores. O WWNN do nó estáarmazenado no controlador de serviço, assim aduplicação é mais provavelmente causada pelasubstituição de um controlador de serviço.

2. Se um nó do cluster com um WWNN duplicado forlocalizado, determine se ele ou o nó que relata oerro, possui o WWNN incorreto. Geralmente, é o nóque teve seu controlador de serviço que foirecentemente substituído ou teve seu WWNN

alterado incorretamente. Também considere como aSAN está zoneada quando tomar sua decisão.

3. Determine o WWNN correto para o nó com oWWNN incorreto. Se o controlador de serviço foisubstituído como parte de uma ação de serviço, oWWNN do nó deve ter sido anotado. Se o WWNNcorreto não puder ser determinado, entre emcontato com seu centro de suporte para obterassistência.

4. Use os menus do painel frontal para modificar oWWNN incorreto. Se ele for o nó mostrando o erroque deve ser modificado, isso pode ser feitoimediatamente com segurança. Se ele for um nóativo que deve ser modificado, tome cuidadoporque o nó será reiniciado quando o WWNN foralterado. Se este nó for o único nó operacional emum gabinete, o acesso aos volumes que ele estágerenciando será perdido. Você deve assegurar queos sistemas host estão no estado correto antes dealterar o WWNN.

5. Se o nó que mostra o erro tinha o WWNN correto,ele poderá ser reiniciado usando o botão de controlede energia do painel frontal depois que o nó com oWWNN duplicado for atualizado.

6. Se não puder localizar um nó do cluster com omesmo WWNN do nó mostrando o erro, utilize asferramentas de monitoramento SAN paradeterminar se há outro dispositivo na SAN com omesmo WWNN. Este dispositivo não deve estarusando um WWNN designado a um cluster,portanto você deve seguir os procedimentos deserviço para o dispositivo para alterar seu WWNN.Assim que a duplicata tiver sido removida, reinicieo nó.

558 O nó não pode se comunicar com outrosnós.

Explicação: O sistema não pode ver a malha do FibreChannel ou a velocidade da porta do adaptador FibreChannel pode estar configurada com uma velocidadediferente daquela da malha Fibre Channel.

Resposta do Usuário: Certifique-se de que:

1. O comutador de malha de rede Fibre Channel estejaligado.

2. Pelo menos um cabo Fibre Channel conecta osistema à malha de rede Fibre Channel.

3. A velocidade da porta do adaptador Fibre Channelé igual àquela da malha Fibre Channel.

4. Pelo menos um adaptador Fibre Channel estáinstalado no sistema.

5. Acesse o MAPA Fibre Channel.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

555 • 558

184 SAN Volume Controller: Guia de Resolução de Problemas

Page 203: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

560 Falha no cabeamento da bateria

Explicação: Existe uma falha em um dos cabos queconectam o painel traseiro da bateria ao resto dosistema.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Reposicione o cabo.

2. Se o reposicionamento do cabo não corrigir oproblema, substitua o cabo.

3. Se o reposicionamento do cabo não corrigir oproblema, substitua o painel traseiro da bateria.

561 Falha no painel traseiro ou nocabeamento da bateria

Explicação: O painel traseiro da bateria falou ou oscabos de energia ou LPC que conectam o paineltraseiro da bateria ao resto do sistema não estãoconectados adequadamente.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Verifique os cabos que conectam o painel traseiro dabateria.

2. Reposicione os cabos de energia e do conversor deprotocolo de link.

3. Se o reposicionamento dos cabos não corrigir oproblema, substitua os cabos.

4. Se os cabos estiverem bem conectados, mas oproblema persistir, substitua o painel traseiro dabateria.

5. Realize o procedimento de serviço corretivo descritoem “1108” na página 220.

562 A configuração de hardware dos nós nãoatende aos requisitos mínimos

Explicação: O hardware do nó não está naespecificação mínima para o nó para se tornar ativo emum cluster. Isso pode ser devido a uma falha dehardware, mas também é possível após uma ação deserviço tenha utilizado uma peça de substituiçãoincorreta.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Visualize as informações de VPD do nó para ver sealguma coisa parece inconsistente. Compare o VPDdo nó com falha com o VPD de um nó de trabalhodo mesmo tipo. Preste especial atenção ao número etipo de CPUs e à memória.

2. Substitua todas as partes incorretas.

564 Muitos travamentos de código demáquina ocorreram.

Explicação: O nó foi determinado como instáveldevido a diversas reconfigurações. A causa dasreconfigurações pode ser devido ao sistema terencontrado um estado inesperado ou ter executadoinstruções não válidas. O nó tiver entrado no estado deserviço de forma que os dados de diagnóstico possamser recuperados.

O erro do nó não persiste nas reinicializações do códigoda máquina no nó.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para recarregar o código demáquina:

1. Obtenha um pacote de suporte (snap), incluindodumps, a partir do nó utilizando a GUI degerenciamento ou o assistente de serviço.

2. Se mais de um nó estiver relatando este erro, entreem contato com o suporte técnico IBM para obterassistência. O pacote de suporte a partir de cada nóserá necessário.

3. Verifique o site de suporte para ver se o problema éconhecido e se uma atualização do código demáquina existe para resolver o problema. Atualize ocódigo de máquina do cluster se houver umaresolução disponível. Use o processo de atualizaçãomanual no nó que relatou o erro primeiro.

4. Se o problema continuar sem solução, entre emcontato com o suporte técnico IBM e envie a ele opacote de suporte.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

565 A unidade interna do nó está com falha.

Explicação: Uma unidade interna dentro do nó estárelatando muitos erros. Não é mais seguro confiar naintegridade da unidade. A substituição é recomendada.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Visualize as informações de hardware.

2. Substitua peças (caixa ou disco).

Causa Possível - unidades substituíveis em campo ououtra:

v 2145-CG8 ou 2145-CF8

– Unidade de disco (50%)

– Controladora de disco (30%)

– Painel traseiro do disco (10%)

– Cabo de sinal do disco (8%)

– Cabo de energia do disco (1%)

– Placa-mãe (1%)

560 • 565

Capítulo 7. Diagnosticando problemas 185

Page 204: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

569 No tempo de inicialização: a CPUatingiu uma temperatura maior ou igualao limite de aviso. Durante a execuçãonormal: a CPU atingiu uma temperaturamaior ou igual ao limite crítico.

Explicação: No tempo de inicialização: a CPU atingiuuma temperatura maior ou igual ao limite de aviso.Durante a execução normal: a CPU atingiu umatemperatura maior ou igual ao limite crítico.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Remova a parte superior do case da máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou bloqueiosinternos.

2. Se o problema persistir, substitua o dissipador decalor da CPU.

FRUs de Causa Possíveis ou outra:

v CPU

v Dissipador de calor

570 Proteção da bateria indisponível

Explicação: O nó não pode iniciar porque a proteçãoda bateria não está disponível. Ambas as bateriasnecessitam de intervenção do usuário antes de setornarem disponíveis.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

A ação de serviço apropriada será indicada por um errodo nó não fatal associado. Examine o log de eventospara determinar o erro do nó associado.

571 Proteção da bateria temporariamenteindisponível; espera-se que uma bateriaesteja disponível em breve

Explicação: O nó não pode iniciar porque a proteçãoda bateria não está disponível. É esperado que umabateria se torne disponível em breve sem intervençãodo usuário necessária, mas a outra bateria não setornará disponível.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

A ação de serviço apropriada será indicada por um errodo nó não fatal associado. Examine o log de eventospara determinar o erro do nó associado.

572 Proteção da bateria temporariamenteindisponível; espera-se que ambas asbaterias estejam disponíveis em breve

Explicação: O nó não pode iniciar porque a proteçãoda bateria não está disponível. É esperado que ambasas baterias se tornem disponíveis em breve sem

intervenção do usuário necessária.

Resposta do Usuário: Aguarde a carga da bateriasuficiente para que o gabinete seja iniciado.

573 O código de máquina do nó estáinconsistente.

Explicação: As partes do pacote de código de máquinado nó estão recebendo resultados inesperados. Podeexistir um conjunto inconsistente de subpacotesinstalados ou um subpacote pode estar danificado.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para recarregar o código demáquina.

1. Siga os procedimentos para executar um resgate denó.

2. Se o erro ocorrer novamente, entre em contato como suporte técnico IBM.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

574 O código de máquina do nó estádanificado.

Explicação: Uma falha de soma de verificação indicouque o código de máquina do nó está danificado eprecisa ser reinstalado.

Resposta do Usuário:

1. Se os outros nós estiverem operacionais, execute oresgate do nó; caso contrário, instale novo código demáquina usando o assistente de serviço. As falhasde resgate de nó, assim como o retorno repetidodesse erro de nó após a reinstalação, são sintomasde uma falha de hardware com o nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

576 O estado do cluster e os dados deconfiguração não podem ser lidos.

Explicação: O nó não pôde ler o estado do clustersalvo e os dados de configuração a partir de suaunidade interna devido a um erro de leitura ou demídia.

Resposta do Usuário: Na sequência mostrada, troqueos FRUs por FRUs novos.

Causa Possível - unidades substituíveis em campo ououtra:

v 2145-CG8 ou 2145-CF8

– Unidade de disco (50%)

– Controladora de disco (30%)

– Painel traseiro do disco (10%)

569 • 576

186 SAN Volume Controller: Guia de Resolução de Problemas

Page 205: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

– Cabo de sinal do disco (8%)

– Cabo de energia do disco (1%)

– Placa-mãe (1%)

578 Os dados de estado não foram salvosapós uma perda de energia.

Explicação: Na inicialização, o nó não pôde ler seusdados de estado. Quando isso acontecer, ele espera serautomaticamente incluído de volta em um sistema emcluster. No entanto, se ele não for associado a umsistema em cluster em 60 segundos, esse erro de nóserá gerado. Esse erro é um erro de nó crítico e a açãodo usuário será necessária para que o nó possa setornar um candidato para se associar a um sistema emcluster.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir problemas deconectividade entre os nós do sistema em cluster e osdispositivos quorum.

1. A intervenção manual é necessária depois de o nórelatar este erro.

2. Tente restabelecer o sistema em cluster usandooutros nós. Esta etapa pode envolver a correção deproblemas de hardware em outros nós ou corrigirproblemas de conectividade entre nós.

3. Se você for capaz de restabelecer o sistema emcluster, remova os dados do sistema do nó quemostram o erro 578 para que ele vá para um estadocandidato. Ele será então incluído automaticamentede volta no sistema em cluster.

a. Para remover os dados do sistema do nó, acesseo assistente de serviço, selecione o botão deopções do nó com um 578, clique em Gerenciarsistema e escolha Remover dados do sistema.

b. Ou use o comando da CLI satask leavecluster-force.

Se o nó não for automaticamente incluído de voltano sistema em cluster, anote o nome e o grupo deE/S do nó e, em seguida, exclua o nó daconfiguração do sistema em cluster (se isso aindanão tiver acontecido). Inclua o nó de volta nosistema em cluster usando o mesmo nome e grupode E/S.

4. Se todos os nós possuírem o erro de nó 578 ou 550,siga a resposta do usuário recomendada para o errode nó 550.

5. Tente determinar o que fez os nos encerrarem.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

579 O subsistema de bateria não temcapacidade suficiente para salvar osdados do sistema

Explicação: Não há capacidade suficiente disponível apartir do subsistema de bateria para salvar os dados dosistema em resposta a uma série de falhas de bateria eda unidade de inicialização.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

As ações de serviço apropriadas são indicadas pelasérie de falhas de bateria e da unidade de inicialização.Examine o log de eventos para determinar as falhasassociadas. Corrija as outras falhas.

580 O ID do controlador de serviço nãopôde ser lido.

Explicação: O sistema não pode ler o ID exclusivo apartir do controlador de serviço, portanto, osadaptadores Fibre Channel não podem ser iniciados.

Resposta do Usuário: Na sequência mostrada, troqueas seguintes FRUs por novas FRUs.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (70%)

v Cabo do controlador de serviço (30%)

Controlador de serviço (100%)

Outra:

v Nenhuma

581 Ocorreu um erro de link serial no 2145UPS-1U.

Explicação: Há uma falha no cabo de comunicação, nainterface serial na fonte de alimentação ininterrupta2145 UPS-1U ou no 2145.

Resposta do Usuário: Verifique se o cabo decomunicações está conectado corretamente no 2145 e no2145 UPS-1U. Se o cabo estiver conectado corretamente,substitua as FRUs na ordem mostrada.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Conjunto de cabo de energia 2145 (40%)

v Conjunto do 2145 UPS-1U (30%)

v Placa-mãe do 2145 (30%)

578 • 581

Capítulo 7. Diagnosticando problemas 187

Page 206: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

582 Ocorreu um erro de bateria no 2145UPS-1U.

Explicação: Ocorreu um problema com a bateria dafonte de alimentação ininterrupta do 2145 UPS-1U.

Resposta do Usuário: Troque a FRU por uma novaFRU. Depois de substituir o conjunto de bateria, se oindicador de serviço do 2145 UPS-1U estiver aceso,pressione e mantenha pressionado o botão de Teste do2145 UPS-1U por três segundos para iniciar o autotestee verificar o reparo. Durante o autoteste, os quatroLEDs mais à direita no conjunto do painel frontal do2145 UPS-1U piscam na sequência.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de bateria UPS-1U (50%)

v Conjunto de UPS-1U (50%)

583 Ocorreu um erro de eletroeletrônicos no2145 UPS-1U.

Explicação: Ocorreu um problema eletroeletrônicocom o 2145 UPS-1U.

Resposta do Usuário: Troque a FRU por uma novaFRU.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto do 2145 UPS-1U

584 O 2145 UPS-1U está sobrecarregado.

Explicação: Um problema com sobrecarga de saída foirelatado pela fonte de alimentação ininterrupta 2145UPS-1U. O Indicador se Sobrecarga no painel frontal do2145 UPS-1U acende em vermelho.

Resposta do Usuário:

1. Assegure-se de que apenas um 2145 estejarecebendo energia do 2145 UPS-1U. Assegure-setambém de que nenhum outro dispositivo estejaconectado ao 2145 UPS-1U.

2. Desconecte o 2145 do 2145 UPS-1U. Se o Indicadorde Sobrecarga ainda estiver aceso, no 2145desconectado, substitua o 2145 UPS-1U.

3. Se agora o Indicador de Sobrecarga estiverdesligado, e o nó for um 2145-CG8 ou 2145-CF8, no2145 desconectado, com todas as saídasdesconectadas, determine se ele é uma das duasfontes de alimentação ou o conjunto de cabos deenergia que deve ser substituído. Conecte apenasum cabo de energia na fonte de alimentação e inicieo nó e veja se o erro é relatado. Em seguida, encerreo nó e conecte o outro cabo de energia à fonte dealimentação esquerda, inicie o nó e veja se o erro érepetido. Em seguida, repita os dois testes para afonte de alimentação direita. Se o erro for repetidopara ambos os cabos em uma fonte de alimentação,mas não em outra, substitua a fonte de alimentação

que mostrou o erro; caso contrário, substitua oconjunto de cabos de energia.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabos de energia (45%)

v Conjunto da fonte de alimentação (45%)

v Conjunto de UPS-1U (10%)

586 A fonte de alimentação para o 2145UPS-1U não atende aos requisitos.

Explicação: Nenhuma.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

587 Um tipo incorreto de fonte dealimentação ininterrupta foi detectado.

Explicação: Um tipo incorreto de 2145 UPS-1U foiinstalado.

Resposta do Usuário: Troque o 2145 UPS-1U por umdo tipo correto.

Causa Possível - unidades substituíveis em campo ououtra:

v 2145 UPS-1U (100%)

588 O 2145 UPS-1U não está cabeadocorretamente.

Explicação: Provavelmente o cabo de sinal ou os cabosde energia do 2145 não estão conectados corretamente.O cabo de energia e cabo de sinal podem estarconectados a diferentes conjuntos de 2145 UPS-1U.

Resposta do Usuário:

1. Conecte os cabos corretamente.

2. Reinicie o nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma.

Outra:

v Erro de cabeamento (100%)

589 O limite da temperatura ambiente do2145 UPS-1U foi excedido.

Explicação: O limite da temperatura ambiente para o2145 UPS-1U foi excedido.

Resposta do Usuário: Reduza a temperatura em tornodo sistema:

1. Desligue o 2145 UPS-1U e desconecte-o da fonte dealimentação.

582 • 589

188 SAN Volume Controller: Guia de Resolução de Problemas

Page 207: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Limpe as ventilações e remova quaisquer fontes decalor.

3. Assegure-se de que o fluxo de ar em torno do 2145UPS-1U não esteja restringido.

4. Aguarde pelo menos cinco minutos e, em seguida,reinicie o 2145 UPS-1U. Se o problema permanecer,substitua o conjunto do 2145 UPS-1U.

590 Transições repetitivas do nó no modo deespera do modo normal por causa deerros de nó relacionados ao subsistemade energia.

Explicação: Diversas reinicializações de nó ocorrerampor causa de erros do 2145 UPS-1U, que podem serrelatados em qualquer tipo de nó

Esse erro significa que o nó fez a transição em esperado modo normal por causa de erros de nó relacionadosao subsistema de energia muitas vezes dentro de umcurto período. O excesso do número de vezes édefinido como três e um período curto é definido como1 hora. Esse erro alerta o usuário de que pode haveralgo errado com o subsistema de energia, pois estáclaro que não é normal o nó repetidamente entrar e sairda espera.

Se for esperado que as ações do testador ou engenheirocausem transições muito frequentes de normal paraespera e de volta, esse erro não significa que hajaqualquer falha real com o sistema.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Verifique se a temperatura ambiente está dentro doslimites especificados e se a energia de entrada estáestável.

2. Se um 2145 UPS-1U estiver conectado, verifique seo cabo de sinal do 2145 UPS-1U está presofirmemente nas duas extremidades.

3. Veja no log de eventos do sistema qual o erro donó que está se repetindo.

Nota: A condição é reconfigurada desligando o nó dopainel frontal do nó.

650 A bateria da caixa não é suportada

Explicação: A bateria da caixa mostra dados doproduto que indica que ele não pode ser usado com aversão do código da caixa.

Resposta do Usuário: Isso é resolvido obtendo umabateria que seja suportada pelo nível de código dosistema ou atualizando o nível de código da caixa paraum nível que suporte a bateria.

1. Remova a caixa e sua tampa e verifique se onúmero de peça da FRU da nova bateriacorresponde ao da bateria substituída. Casocontrário, obtenha a peça de FRU correta.

2. Se a caixa tiver acabado de ser substituída, verifiqueo nível de código da caixa do nó do parceiro e useo assistente de serviço para atualização o nível decódigo dessa caixa para o mesmo nível.

Causa Possível - unidades substituíveis em campo ououtra

v bateria da caixa

651 A bateria da caixa está ausente

Explicação: A bateria da caixa não pode ser detectada.

Resposta do Usuário:

1. Use os procedimentos para remover e substituir afim de remover a caixa do nó e sua tampa.

2. Use os procedimentos para remover e substituir afim de instalar uma bateria.

3. Se uma bateria estiver presente, assegure-se de queela esteja totalmente inserida. Substitua a caixa.

4. Se esse erro persistir, use os procedimentos pararemover e substituir a fim de substituir a bateria.

Causa Possível - unidades substituíveis em campo ououtra

v Bateria da caixa

652 A bateria da caixa falhou

Explicação: A bateria da caixa falhou. A bateria podeestar mostrando um estado de erro, pode ter chegadoao final da vida útil ou pode não ter sido carregada.

Dados

Indicadores de número com motivos de falha

v 1—bateria reporta uma falha

v 2-fim da vida útil

v 3—falha ao carregar

Resposta do Usuário:

1. Use os procedimentos para remover e substituir afim de substituir a bateria.

Causa Possível - unidades substituíveis em campo ououtra

v bateria da caixa

653 A temperatura da bateria da caixa estámuito baixa

Explicação: A temperatura da bateria da caixa estáabaixo de sua temperatura de operação mínima

Resposta do Usuário:

v Aguarde enquanto a bateria é aquecida; o erro serálimpo quando a temperatura de trabalho mínima foratingida.

590 • 653

Capítulo 7. Diagnosticando problemas 189

Page 208: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Se o erro persistir por mais de uma hora quando atemperatura ambiente for normal, use osprocedimentos para remover e substituir a fim desubstituir a bateria.

Causa Possível - unidades substituíveis em campo ououtra

v bateria da caixa

654 A temperatura da bateria da caixa estámuito alta.

Explicação: A temperatura da bateria da caixa estáacima de sua temperatura de operação segura.

Resposta do Usuário:

v Se necessário, reduza a temperatura ambiente.

v Aguarde enquanto a bateria é resfriada; o erro serálimpo quando a temperatura de trabalho normal foratingida. Continue verificando o erro reportado, poiso sistema pode determinar que a bateria falhou.

v Se o erro do nó persistir por mais de uma horadepois que a temperatura ambiente retornar aointervalo de operação normal, use os procedimentospara remover e substituir a fim de substituir abateria.

Causa Possível - unidades substituíveis em campo ououtra

v bateria da caixa

655 Falhas nas comunicações da bateria dacaixa.

Explicação: A caixa não pode se comunicar com abateria.

Resposta do Usuário:

v Use os procedimentos para remover e substituir afim de substituir a bateria.

v Se o erro do nó persistir, use os procedimentos pararemover e substituir a fim de substituir a caixa donó.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Bateria da caixa

v Caixa do nó

656 A bateria da caixa tem carga insuficiente

Explicação: A bateria da caixa tem carga insuficientepara salvar o estado da caixa e os dados em cache naunidade interna caso a energia falhe.

Resposta do Usuário:

v Espere até que a bateria esteja carregada; ela nãoprecisa estar totalmente carregada para que o erroseja automaticamente apagado.

Causa Possível - unidades substituíveis em campo ououtra

v nenhum

657 Não há carga da bateria suficiente parasuportar o encerramento normal dogabinete de armazenamento.

Explicação: Energia insuficiente disponível para ogabinete.

Resposta do Usuário: Se uma bateria estiver ausente,estiver com falha ou estiver tendo um erro decomunicação, substitua a bateria.

Se uma bateria estiver com falha, substitua a bateria.

Se uma bateria estiver sendo carregada, este erro devesumir quando a bateria estiver carregada.

Se uma bateria estiver muito quente, o sistema pode seriniciado depois de ter arrefecido.

Se estiver executando em uma fonte de alimentaçãoúnica com energia de entrada baixa (110 V AC), "lowvoltage" será visto nos dados extras. Se este for o caso,a fonte de alimentação com falha ou ausente deverá sersubstituída. Isso ocorrerá somente se uma única fontede alimentação estiver executando com energia deentrada muito baixa.

668 A configuração remota não estádisponível para usuários para o sistemaatual.

Explicação: Nos sistemas atuais, os usuários não podeser configurados como remotos.

Resposta do Usuário: Qualquer usuário definido nosistema deve ser um usuário local. Para criar umusuário remoto, o usuário não deve ser definido nosistema local.

670 A carga da bateria da UPS não ésuficiente para permitir que o nóreinicie.

Explicação: A fonte de alimentação ininterruptaconectada ao nó não tem carga de bateria suficientepara o nó tornar-se ativo com segurança em um cluster.O nó não será iniciado até que exista uma cargasuficiente para armazenar os dados de estado e deconfiguração mantidos na memória do nó se a energiafalhasse. O painel frontal do nó mostrará "carregando".

Resposta do Usuário: Aguarde até que a carga dabateria seja suficiente para o gabinete iniciar:

1. Aguarde até que o nó corrija automaticamente oerro quando houver carga suficiente.

2. Assegure que nenhuma condição de erro estejaindicada na fonte de alimentação ininterrupta.

654 • 670

190 SAN Volume Controller: Guia de Resolução de Problemas

Page 209: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

671 A carga de bateria disponível não ésuficiente para permitir que a caixa denó inicie. Duas baterias estãocarregando.

Explicação: A carga da bateria dentro do gabinete nãoé suficiente para o nó se tornar ativo com segurança emum cluster. O nó não será iniciado até que exista umacarga suficiente para armazenar os dados de estado ede configuração mantidos na memória do nó se aenergia falhasse. Duas baterias estão dentro dogabinete, uma em cada uma das fontes de alimentação.Nenhuma das baterias indica um erro, ambas estãocarregando.

O nó será iniciado automaticamente quando houvercarga suficiente. As baterias não têm que sercompletamente carregadas antes de os nós poderem setornar ativos.

Ambos os nós dentro do gabinete compartilham a cargada bateria, então ambas as caixas de nós relatam esteerro. O assistente de serviço mostra o horário de inícioestimado nos detalhes de hardware da caixa de nó.

Resposta do Usuário: Aguarde o nó corrigirautomaticamente o erro quando houver cargasuficiente.

672 A carga de bateria disponível não ésuficiente para permitir que a caixa denó inicie. Uma bateria está carregando.

Explicação: A carga da bateria dentro do gabinete nãoé suficiente para o nó se tornar ativo com segurança emum cluster. O nó não será iniciado até que exista umacarga suficiente para armazenar os dados de estado ede configuração mantidos na memória do nó se aenergia falhasse. Duas baterias estão dentro dogabinete, uma em cada uma das fontes de alimentação.Apenas uma das baterias está carregando, assim otempo para atingir carga suficiente será estendido.

O nó será iniciado automaticamente quando houvercarga suficiente. As baterias não têm que sercompletamente carregadas antes de os nós poderem setornar ativos.

Ambos os nós dentro do gabinete compartilham a cargada bateria, então ambas as caixas de nós relatam esteerro.

O assistente de serviço mostra o horário de inícioestimado, e o status da bateria, nos detalhes dehardware da caixa de nó.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Resposta do Usuário:

1. Aguarde o nó corrigir automaticamente o erroquando houver carga suficiente.

2. Se possível, determine porque uma bateria não estácarregando. Utilize o status da bateria mostrado nosdetalhes de hardware da caixa de nó e nos LEDsindicadores nas PSUs no gabinete para diagnosticaro problema. Se o problema não puder ser resolvido,aguarde até que o cluster esteja operacional e utilizeas opções de resolução de problemas na GUI degerenciamento para ajudar na resolução doproblema.

Causa Possível - unidades substituíveis em campo ououtra:

v Bateria (33%)

v Fonte de alimentação de controle (33%)

v Cabo de energia (33%)

673 A carga de bateria disponível não ésuficiente para permitir que a caixa denó inicie. Nenhuma bateria estácarregando.

Explicação: Um nó não pode estar no estado ativo seele não tiver energia suficiente de bateria paraarmazenar dados de configuração e de cache damemória para o disco interno após uma falha deenergia. O sistema determinou que ambas as bateriasfalharam ou estão ausentes. O problema com asbaterias deve ser resolvido para permitir que o sistemareinicie.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware:

1. Resolva os problemas em ambas as bateriasseguindo o procedimento para determinar o statusutilizando os LEDs.

2. Se os LEDs não mostrarem uma falha nas fontes dealimentação ou baterias, desligue ambas as fontesde alimentação de no gabinete e remova os cabosde energia. Aguarde 20 segundos e, em seguida,substitua os cabos de energia e restaure a energiapara ambas as fontes de alimentação. Se ambas ascaixas de nós continuarem a relatar este erro,substitua o chassi de gabinete.

Causa Possível - unidades substituíveis em campo ououtra:

v Bateria (33%)

v Fonte de alimentação (33%)

v Cabo de energia (33%)

v Chassi do gabinete (1%)

674 O modo de ciclo de um objeto MetroMirror não pode ser alterado.

Explicação: O modo de ciclo só pode ser configuradopara objetos Global Mirror. Os objetos Metro Mirrornão podem ter um modo de ciclo definido.

Resposta do Usuário: O tipo do objeto deve ser

671 • 674

Capítulo 7. Diagnosticando problemas 191

Page 210: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

configurado como 'global' antes ou durante aconfiguração do modo de ciclo.

690 O nó é mantido no estado de serviço.

Explicação: O nó está em estado de serviço e foiinstruído a permanecer no estado de serviço. Enquantoestiver no estado de serviço, o nó não executará comoparte de um cluster. Um nó não deve estar em estadode serviço por mais do que o necessário enquanto ocluster estiver on-line porque ocorrerá uma perda deredundância. Um nó pode ser configurado parapermanecer no estado de serviço devido a uma ação dousuário do assistente de serviço ou porque o nó foiexcluído do cluster.

Resposta do Usuário: Quando não for mais necessáriomanter o nó no estado de serviço, saia do estado deserviço para permitir que o nó execute:

1. Utilize a ação do assistente de serviço para liberar oestado de serviço.

Causa Possível - unidades substituíveis em campo ououtra:

v nenhum

700 O adaptador Fibre Channel que estavapresente anteriormente não foidetectado.

Explicação: Um adaptador Fibre Channel que estavapresente anteriormente não foi detectado. O adaptadorpode não ter sido instalado corretamente ou pode terfalhado.

Esse erro do nó, em si, não faz com que a caixa do nódeixe de estar ativa no sistema; no entanto, a rede FibreChannel pode estar sendo usada para se comunicarentre as caixas de nós em um sistema em cluster. Épossível que esse erro do nó indique porque o erro donó crítico 550 Um cluster não pode ser formado porcausa de uma falta de recursos de cluster éreportado na caixa do nó.

Dados:

v Local - Um número indicando o local do adaptador.O local indica um slot do adaptador; consulte adescrição da caixa do nó para obter a definição doslocais de slot do adaptador

Resposta do Usuário:

1. Se possível, esse erro do nó não crítico deverá sercorrigido usando o GUI de gerenciamento eexecutando as ações recomendadas para o códigode erro do serviço.

2.

Há diversas possibilidades.

a. Se você tiver removido o adaptadorintencionalmente (possivelmente substituindo-opor um tipo de adaptador diferente), seránecessário seguir as ações recomendadas do GUI

de gerenciamento para marcar a mudança dohardware como intencional.

b. Se as etapas anteriores não tiverem resolvido oproblema, use os procedimentos para remover esubstituir a fim de substituir o adaptador; seisso não corrigir o problema, substitua aplaca-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Fibre Channel

v Placa-mãe

701 Um adaptador Fibre Channel falhou.

Explicação: Um adaptador Fibre Channel falhou.

Esse erro do nó, em si, não faz com que o nó deixe deestar ativo no sistema. No entanto, a rede FibreChannel pode estar sendo usada para se comunicarentre os nós em um sistema em cluster. Portanto, épossível que esse erro do nó indique o motivo peloqual o erro do nó crítico 550 Um cluster não pode serformado por causa de uma falta de recursos decluster é reportado no nó.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Use os procedimentos para remover e substituir afim de substituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Fibre Channel

v Placa-mãe

702 Um adaptador Fibre Channel tem umerro de PCI.

Explicação: Um adaptador Fibre Channel tem um errode PCI.

Este erro do nó, em si, não para o nó de se tornar ativono sistema. No entanto, a rede Fibre Channel podeestar sendo usada para se comunicar entre os nós emum sistema em cluster. Portanto, é possível que esseerro do nó indique o motivo pelo qual o erro do nócrítico 550 Um cluster não pode ser formado porcausa de uma falta de recursos de cluster éreportado no nó.

Dados:

690 • 702

192 SAN Volume Controller: Guia de Resolução de Problemas

Page 211: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Use os procedimentos para remover e substituir afim de substituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Fibre Channel

v Placa-mãe

703 Um adaptador Fibre Channel estádegradado.

Explicação: Um adaptador Fibre Channel estádegradado.

Esse erro do nó, em si, não faz com que o nó deixe deestar ativo no sistema. No entanto, a rede FibreChannel pode estar sendo usada para se comunicarentre os nós em um sistema em cluster. Portanto, épossível que esse erro do nó indique o motivo peloqual o erro do nó crítico 550 Um cluster não pode serformado por causa de uma falta de recursos decluster é reportado no nó.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Use os procedimentos para remover e substituir afim de substituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

FRUS de possível causa ou outra causa:

v Adaptador Fibre Channel

v Placa-mãe

704 Menos portas do Fibre Channel estãooperacionais.

Explicação: Uma porta do Fibre Channel que estavaoperacional anterior não está mais. O link físico estádesativado.

Esse erro do nó, em si, não faz com que o nó deixe deestar ativo no sistema. No entanto, a rede FibreChannel pode estar sendo usada para se comunicar

entre os nós em um sistema em cluster. Portanto, épossível que esse erro do nó indique o motivo peloqual o erro do nó crítico 550 Um cluster não pode serformado por causa de uma falta de recursos decluster é reportado no nó.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse ID éum número decimal.

v É esperado que as portas estejam ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Possibilidades:

v Se a porta tiver sido desconectadaintencionalmente, use a ação recomendada doGUI de gerenciamento para o código de erro doserviço e reconheça a mudança desejada.

v Assegure-se de que o cabo Fibre Channel estejaconectado em ambas as extremidades e não estejadanificado. Se necessário, substitua o cabo.

v Assegure-se de que a porta do comutador ououtro dispositivo ao qual o cabo está conectadoesteja ligado e ativado em um modo compatível.Corrija o problema. A interface de serviço dodispositivo pode indicar o problema.

v Use os procedimentos para remover e substituir afim de substituir o Transceptor SFP no nó 2145 eo Transceptor SFP no comutador ou dispositivoconectado.

v Use os procedimentos para remover e substituir afim de substituir o adaptador.

Causa Possível - unidades substituíveis em campo ououtra causa:

v cabo Fibre Channel

v Transceptor SFP

v Adaptador Fibre Channel

705 Menos portas de E/S do Fibre Channelestão operacionais.

Explicação: Uma ou mais portas de E/S Fibre Channelque anteriormente estavam ativas agora estão inativas.Esta situação continuou por um minuto.

703 • 705

Capítulo 7. Diagnosticando problemas 193

Page 212: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Uma porta de E/S Fibre Channel pode ser estabelecidaem uma porta de plataforma Fibre Channel ou em umaporta de plataforma Ethernet usando o FCoE. Esse erroé esperado caso a porta Fibre Channel ou Ethernetassociada não esteja operacional.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse ID éum número decimal.

v É esperado que as portas estejam ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Siga o procedimento para mapeamento de portas deE/S para portas da plataforma a fim de determinarqual porta da plataforma está fornecendo esta portade E/S.

3. Verifique qualquer erros do nó 704 (porta daplataforma Fibre Channel não operacional) ou 724(porta da plataforma Ethernet não operacional)reportado para a porta da plataforma.

4. Possibilidades:

v Se a porta tiver sido desconectadaintencionalmente, use a ação recomendada doGUI de gerenciamento para o código de erro doserviço e reconheça a mudança desejada.

v Resolva o erro 704 ou 724.

v Se esta for uma conexão FCoE, use asinformações que a visualização fornece sobre oencaminhador Fibre Channel (FCF) parasolucionar problemas na conexão entre a porta eo FCF.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

706 Falha no caminho do sistema em clusterdo Fibre Channel.

Explicação: Uma ou mais portas de entrada/saída(E/S) de Fibre Channel (FC) que antes conseguiam vertodos os nós online necessários não podem mais vê-los.Essa situação continuou por 5 minutos. Esse erro não érelatado, a menos que um nó esteja ativo em umsistema em cluster.

Uma porta de E/S Fibre Channel pode ser estabelecidaem uma porta de plataforma FC ou em uma porta deplataforma Ethernet usando o Fiber Channel overEthernet (FCoE).

Dados:

Três valores numéricos são listados:

v O ID da primeira porta de E/S FC que não possuiconectividade. Esse é um número decimal.

v É esperado que as portas tenham conexão. Esse é umnúmero hexadecimal, e cada posição de bitrepresenta uma porta - com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta tenha conexão com todos os nós online.

v As portas que realmente possuem conexões. Esse éum número hexadecimal; cada posição de bitrepresenta uma porta , com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta tenha conexão com todos os nós online.

Resposta do Usuário:

1. Se possível, esse erro do nó não crítico deverá sercorrigido usando o GUI de gerenciamento eexecutando as ações recomendadas para o códigode erro do serviço.

2. Siga o procedimento: Mapeando portas de E/S paraportas da plataforma a fim de determinar qualporta da plataforma não possui conectividade.

3. Há diversas possibilidades.

v Se a conectividade da porta tiver sidoreconfigurada intencionalmente, use a açãorecomendada do GUI de gerenciamento para ocódigo de erro do serviço e reconheça a mudançadesejada. Você deve ter pelo menos duas portasde E/S com conexões com todos os outros nós.

v Resolva outros erros do nó relacionados a estaporta da plataforma ou porta de E/S.

v Verifique se o zoneamento SAN está correto.

Causa possível: FRUs ou outra causa:

v Nenhuma.

710 O adaptador SAS que estava presenteanteriormente não foi detectado.

Explicação: Um adaptador SAS que estava presenteanteriormente não foi detectado. O adaptador pode nãoter sido instalado corretamente ou pode ter falhado.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

706 • 710

194 SAN Volume Controller: Guia de Resolução de Problemas

Page 213: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Possibilidades:

v Se o adaptador tiver sido removido por acidente,use as ações recomendadas do GUI degerenciamento recommended para o código deerro do serviço, a fim de reconhecer a mudança.

v Use os procedimentos para remover e substituir afim de remover e abrir o nó e verifique se oadaptador está totalmente instalado.

v Se as etapas anteriores não tiverem resolvido oproblema, use os procedimentos para remover esubstituir a fim de substituir o adaptador. Se issonão corrigir o problema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador SAS de alta velocidade

v Placa-mãe

711 Um adaptador SAS falhou.

Explicação: Um adaptador SAS falhou.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Use os procedimentos para remover e substituir afim de substituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador SAS de alta velocidade

v Placa-mãe

712 Um adaptador SAS tem um erro de PCI.

Explicação: Um adaptador SAS tem um erro de PCI.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Substitua o adaptador usando os procedimentospara remover e substituir. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador SAS

v Placa-mãe

713 Um adaptador SAS está degradado.

Explicação: Um adaptador SAS está degradado.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Use os procedimentos para remover e substituir afim de substituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador SAS de alta velocidade

v Placa-mãe

715 Menos portas de host SAS operacionais

Explicação: Uma porta SAS que estava operacionalanteriormente não está mais operacional. O link físicoestá desativado.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse ID éum número decimal.

v É esperado que as portas estejam ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Possibilidades:

v Se a porta tiver sido desconectadaintencionalmente, use a ação recomendada doGUI de gerenciamento para o código de erro doserviço e reconheça a mudança desejada.

711 • 715

Capítulo 7. Diagnosticando problemas 195

Page 214: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Verifique se o cabo SAS está conectado em ambasas extremidades e não está danificado. Senecessário, substitua o cabo.

v Assegure-se de que a porta do comutador ououtro dispositivo ao qual o cabo está conectadoesteja ligado e ativado em um modo compatível.Corrija o problema. A interface de serviço dodispositivo pode indicar o problema.

v Use os procedimentos para remover e substituir afim de substituir o adaptador.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Cabo SAS

v SAS adapter

720 O adaptador Ethernet que estavapresente anteriormente não foidetectado.

Explicação: Um adaptador Ethernet que estavapresente anteriormente não foi detectado. O adaptadorpode não ter sido instalado corretamente ou pode terfalhado.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador. Se o local for 0, o adaptador integrado naplaca-mãe estará sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Se o local do adaptador for 0, use os procedimentospara remover e substituir a fim de substituir aplaca-mãe.

3. Se o local não for 0, há diversas possibilidades:

a. Use os procedimentos para remover e substituira fim de remover e abrir o nó e verifique se oadaptador está totalmente instalado.

b. Se as etapas anteriores não tiverem localizado eresolvido o problema, use os procedimentospara remover e substituir a fim de substituir oadaptador. Se isso não corrigir o problema,substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Ethernet

v Placa-mãe

721 Um adaptador Ethernet falhou.

Explicação: Um adaptador Ethernet falhou.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador. Se o local for 0, o adaptador integrado naplaca-mãe estará sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Se o local do adaptador for 0, use os procedimentospara remover e substituir a fim de substituir aplaca-mãe.

3. Se o local do adaptador não for 0, use osprocedimentos para remover e substituir a fim desubstituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Ethernet

v Placa-mãe

722 Um adaptador Ethernet tem um erro dePCI.

Explicação: Um adaptador Ethernet tem um erro dePCI.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador. Se o local for 0, o adaptador integrado naplaca-mãe estará sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Se o local do adaptador for 0, use os procedimentospara remover e substituir a fim de substituir aplaca-mãe.

3. Se o local do adaptador não for 0, use osprocedimentos para remover e substituir a fim desubstituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Ethernet

v Placa-mãe

720 • 722

196 SAN Volume Controller: Guia de Resolução de Problemas

Page 215: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

723 Um adaptador Ethernet está degradado.

Explicação: Um adaptador Ethernet está degradado.

Dados:

v Um número indicando o local do adaptador. O localindica um slot do adaptador. Consulte a descrição donó para obter a definição dos locais de slot doadaptador. Se o local for 0, o adaptador integrado naplaca-mãe estará sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Se o local do adaptador for 0, use os procedimentospara remover e substituir a fim de substituir aplaca-mãe.

3. Se o local do adaptador não for 0, use osprocedimentos para remover e substituir a fim desubstituir o adaptador. Se isso não corrigir oproblema, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Adaptador Ethernet

v Placa-mãe

724 Menos portas Ethernet ativas.

Explicação: Uma porta Ethernet que estavaoperacional anterior não está mais. O link físico estádesativado.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse éum número decimal.

v É esperado que as portas estejam ativas. Esse é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas. Esse é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Possibilidades:

a. Se a porta tiver sido desconectadaintencionalmente, use a ação recomendada doGUI de gerenciamento recommended para ocódigo de erro do serviço e reconheça amudança desejada.

b. Assegure-se de que o cabo Ethernet estejaconectado em ambas as extremidades e nãoesteja danificado. Se necessário, substitua o cabo.

c. Assegure-se de que a porta do comutador ououtro dispositivo ao qual o cabo está conectadoesteja ligado e ativado em um modo compatível.Corrija o problema. A interface de serviço dodispositivo pode indicar o problema.

d. Se for uma porta de 1 Gbps, use osprocedimentos para remover e substituir a fimde substituir o Transceptor SFP no SAN VolumeController e o Transceptor SFP no comutador oudispositivo conectado.

e. Substitua o adaptador ou a placa-mãe(dependendo do local da porta) usando osprocedimentos para remover e substituir.

Causa Possível - unidades substituíveis em campo ououtra causa:

v cabo Ethernet

v Ethernet Transceptor SFP

v Adaptador Ethernet

v Placa-mãe

730 O adaptador de barramento não foidetectado.

Explicação: O adaptador de barramento que conectanot caixa ao painel intermediário do gabinete não foidetectado.

Esse erro do nó, em si, não faz com que a caixa do nódeixe de estar ativa no sistema. No entanto, obarramento pode estar sendo usado para comunicaçãoentre as caixas de nós em um sistema em cluster.Portanto, é possível que esse erro do nó indique omotivo pelo qual o erro do nó crítico 550 Um clusternão pode ser formado por causa de uma falta derecursos de cluster é reportado na caixa do nó.

Dados:

v Um número indicando o local do adaptador. O local0 indica que o adaptador integrado na placa-mãeestá sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Como o adaptador está localizado na placa-mãe,substitua a caixa do nó usando os procedimentospara remover e substituir.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Caixa do nó

723 • 730

Capítulo 7. Diagnosticando problemas 197

Page 216: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

731 O adaptador de barramento falhou.

Explicação: O adaptador de barramento que conecta acaixa ao painel intermediário do gabinete falhou.

Esse erro do nó, em si, não faz com que a caixa do nódeixe de estar ativa no sistema. No entanto, obarramento pode estar sendo usado para comunicaçãoentre as caixas de nós em um sistema em cluster.Portanto, é possível que esse erro do nó indique omotivo pelo qual o erro do nó crítico 550 Um clusternão pode ser formado por causa de uma falta derecursos de cluster é reportado na caixa do nó.

Dados:

v Um número indicando o local do adaptador. O local0 indica que o adaptador integrado na placa-mãeestá sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Como o adaptador está localizado na placa-mãe,substitua a caixa do nó usando os procedimentospara remover e substituir.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Caixa do nó

732 O adaptador de barramento tem um errode PCI.

Explicação: O adaptador de barramento que conecta acaixa ao painel intermediário do gabinete tem um errode PCI.

Esse erro do nó, em si, não faz com que a caixa do nódeixe de estar ativa no sistema. No entanto, obarramento pode estar sendo usado para comunicaçãoentre as caixas de nó em um sistema em cluster;portanto, é possível que esse erro do nó indique omotivo pelo qual o erro do nó crítico 550 Um clusternão pode ser formado por causa de uma falta derecursos de cluster é reportado na caixa do nó.

Dados:

v Um número indicando o local do adaptador. O local0 indica que o adaptador integrado na placa-mãeestá sendo reportado.

Resposta do Usuário:

1. Se possível, esse erro do nó não crítico deverá sercorrigido usando o GUI de gerenciamento eexecutando as ações recomendadas para o códigode erro do serviço.

2. Como o adaptador está localizado na placa-mãe,substitua a caixa do nó usando os procedimentospara remover e substituir.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Caixa do nó

733 Adaptador de barramento degradado.

Explicação: O adaptador de barramento que conecta acaixa ao painel intermediário do gabinete estádegradado.

Este erro do nó, em si, não para a caixa do nó de setornar ativa no sistema. No entanto, o barramento podeestar sendo usado para comunicação entre as caixas denós em um sistema em cluster. Portanto, é possível queesse erro do nó indique o motivo pelo qual o erro donó crítico 550 Um cluster não pode ser formado porcausa de uma falta de recursos de cluster éreportado na caixa do nó.

Dados:

v Um número indicando o local do adaptador. O local0 indica que o adaptador integrado na placa-mãeestá sendo reportado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Como o adaptador está localizado na placa-mãe,substitua a caixa do nó usando os procedimentospara remover e substituir.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Caixa do nó

734 Menos portas de barramento.

Explicação: Uma ou mais portas de barramento PCIque anteriormente estavam ativas agora estão inativas.Essa condição existiu por mais de um minuto. Ousejam o link entre nós esteve desativado no nível doprotocolo.

Isso pode ser um problema de link, mas maisprovavelmente seja causado pela incapacidadeinesperada do nó do parceiro de responder.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse éum número decimal.

v É esperado que as portas estejam ativas. Esse é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas. Esse é umnúmero hexadecimal. Cada posição de bit representa

731 • 734

198 SAN Volume Controller: Guia de Resolução de Problemas

Page 217: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

uma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, esse erro do nó não crítico deverá sercorrigido usando o GUI de gerenciamento eexecutando as ações recomendadas para o códigode erro do serviço.

2. Siga o procedimento para acessar a caixa de nó einformações do sistema em cluster e determine oestado da caixa do nó do parceiro no gabinete.Corrija os erros reportados na caixa do nó doparceiro.

3. Use os procedimentos para remover e substituir afim de substituir o gabinete.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Caixa do nó

v Painel intermediário do gabinete

736 A temperatura de um dispositivo naplaca-mãe é maior ou igual ao limite deaviso.

Explicação: A temperatura de um dispositivo naplaca-mãe é maior ou igual ao limite de aviso.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Remova a parte superior do case da máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou bloqueiosinternos.

2. Se o problema persistir, substitua a placa-mãe.

FRUs de Causa Possíveis ou outra:

v Placa-mãe

737 A temperatura de uma fonte dealimentação é maior ou igual ao limitede aviso ou crítico.

Explicação: A temperatura de uma fonte dealimentação é maior ou igual ao limite de aviso oucrítico.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Remova a parte superior do case da máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou bloqueiosinternos.

2. Se o problema persistir, substitua a fonte dealimentação.

FRUs de Causa Possíveis ou outra:

v Fonte de alimentação

738 A temperatura de uma placa riser émaior ou igual ao limite de aviso.

Explicação: A temperatura de uma placa riser é maiorou igual ao limite de aviso.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Remova a parte superior do case da máquina everifique se a placa riser 2 do PCI está ausente, seas placas defletoras estão ausentes ou se hábloqueios internos.

2. Verifique todas as placas PCI conectadas ao riseridentificado pelos dados extras para descobrir sealgum está faltando, e substitua se necessário.

3. Se o problema persistir, substitua o PCI riser.

FRUs de Causa Possíveis ou outra:

v Riser PCI

740 O comando falhou por causa de um errode conexão descrito no log de eventos.

Explicação: É perigoso excluir uma porta sas enquantoa topologia é inválida; por isso, o usuário é proibido detentar a fim de evitar qualquer perda potencial deacesso a dados.

Resposta do Usuário: Corrija a topologia e tentenovamente o comando.

741 CPU ausente

Explicação: Uma CPU que estava presenteanteriormente não foi detectada. A CPU pode não estarinstalada corretamente ou ela pode ter falhado.

Resposta do Usuário:

1. Se possível, use a GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro de serviço associado.

2. Selecione uma das seguintes ações:

v Se a remoção da CPU foi intencional, siga asações recomendadas da GUI de gerenciamentopara marcar a mudança de hardware comointencional.

v Se não for possível isolar o problema, use osprocedimentos de remoção e substituição parasubstituir a CPU.

v Substitua a placa-mãe.

743 Uma unidade de inicialização estáoffline, ausente, fora de sincronizaçãoou os dados persistentes não sãoutilizáveis.

Explicação: Uma unidade de inicialização está offline,ausente, fora de sincronização ou os dados persistentesnão são utilizáveis.

736 • 743

Capítulo 7. Diagnosticando problemas 199

Page 218: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resposta do Usuário: Veja a visualização da unidadede inicialização para determinar o problema.

1. Se o status do slot estiver fora de sincronização,ressincronize as unidades de inicializaçãoexecutando o comando satask chbootdrive.

2. Se o status do slot for ausente, coloque a unidadeoriginal de volta nesse slot ou instale uma unidadeFRU.

3. Se o status do slot for falha, substitua a unidade.

FRUs de Causa Possíveis ou outra:

v Unidade de inicialização

744 Uma unidade de inicialização está nolocal errado.

Explicação: Uma unidade de inicialização está no sloterrado ou se origina de outro nó.

Resposta do Usuário: Veja a visualização da unidadede inicialização para determinar o problema.

1. Substitua a unidade de inicialização pela unidadecorreta e coloque esta unidade de volta no nó apartir do qual ela se origina.

2. Sincronize a unidade de inicialização se você optarpor usá-la nesse nó.

FRUs de Causa Possíveis ou outra:

v Nenhuma

745 Uma unidade de inicialização está emum slot não suportado.

Explicação: Uma unidade de inicialização está em umslot não suportado. Isto significa que pelo menos umadas primeiras duas unidades está on-line e pelo menosum slot inválido (3-8) está ocupado.

Resposta do Usuário: Veja a visualização da unidadede inicialização para determinar quais slots inválidosestão ocupados e remova as unidades.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

746 Conexão da porta técnica inválida.

Explicação: O código detectou mais de um endereçode Controle de Acesso à Mídia apesar da conexão oudo Protocolo de Configuração de Host Dinâmico terdistribuído mais de um endereço. O código desse modoacredita que haja um comutador conectado.

Resposta do Usuário:

1. Conecte um cabo da porta técnica a um comutadore conecte 2 ou mais máquinas nesse comutador.Elas devem ter endereços IP no intervalo 192.168.0.1- 192.168.0.30

2. Solicite um lease de Protocolo de Configuração deHost Dinâmico para acionar a detecção.

747 A porta técnica está sendo usada.

Explicação: A porta técnica está ativo e sendo usada

Resposta do Usuário: Nenhuma ação de serviço énecessária. Use a estação de trabalho para configurar onó.

748 A porta técnica é ativada.

Explicação: A porta técnica é ativada inicialmente parafácil configuração e, em seguida, desativada, para que aporta possa ser usada para conexão iSCSI. Quando todaa conectividade com o nó falha, a porta técnica podeser reativada para uso emergencial, mas não devepermanecer ativada. Este evento é para lembrá-lo dedesativar a porta técnica. Enquanto a porta técnicaestiver ativada, não conecte-a à LAN/SAN.

Resposta do Usuário: Conclua a etapa a seguir pararesolver este problema.

1. Desative a porta técnica usando o comando da CLIa seguir:

satask chserviceip -techport disable

FRUs de Causa Possíveis ou outra:

v N/D

750 Acelerador de compactação ausente

Explicação: Um adaptador de compactação que estavapresente anteriormente não foi detectado.

Resposta do Usuário:

1. Use o comando svcinfo lsnodehw para revisar ohardware no nó indicado por esse evento.

2. Se todo o hardware ausente ou mudado estiverconforme o esperado, use o comando chnodehw paraaceitar a configuração do hardware do nó atual.

3. Caso contrário, conclua cada uma das etapas aseguir, uma de cada vez, até que o evento sejamarcado automaticamente como corrigido:

a. Encerre o nó. Assegure que o hardware corretoesteja instalado em seu local correto. Reposicionequalquer hardware que esteja indicado comoausente. Coloque o nó novamente online. Volte àetapa 1.

b. Encerre o nó. Substitua qualquer hardware queesteja indicado como ausente. Coloque o nónovamente online. Volte à etapa 1.

c. Encerre o nó. Substitua a placa-mãe ou a caixa.Coloque o nó novamente online. Volte à etapa 1.

744 • 750

200 SAN Volume Controller: Guia de Resolução de Problemas

Page 219: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

751 Acelerador de compactação com falha

Explicação: Um adaptador de compactação falhou.

Resposta do Usuário:

1. Encerre o nó.

2. Substitua o adaptador no slot indicado pelo log deeventos por um novo adaptador do mesmo tipo.

Nota: Para o Storwize V7000 Gen2, os dois cartõesde compactação compartilham o mesmo local.

3. Coloque o nó novamente online.

4. Se o erro não for corrigido automaticamente,encerre o nó e substitua a placa-mãe ou a caixa, emseguida, coloque o nó on-line novamente.

766 Falha na bateria CMOS.

Explicação: Falha na bateria CMOS.

Resposta do Usuário: Substitua a bateria CMOS.

Causa Possível - unidades substituíveis em campo ououtra:

v Bateria CMOS

768 Aviso de temperatura ambiente.

Explicação: A temperatura ambiente do nó estápróxima ao ponto onde o sistema para de executar E/Se entra em um estado de serviço. Atualmente, o nócontinua a operar.

Dados:

v Uma sequência de texto identificando o sensortérmico que relata o nível de aviso e a temperaturaatual em graus (Celsius).

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Verifique a temperatura da sala e corrija qualquerproblemas de ar condicionado ou ventilação.

3. Verifique a corrente de ar em torno do sistema paracertificar-se de que nenhuma abertura de ventilaçãoesteja bloqueada.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

769 Aviso de temperatura da CPU.

Explicação: A temperatura da CPU no nó está muitopróxima do ponto em que ela para de executar E/S eentra no estado de serviço. Atualmente, o nó continua aoperar. É mais provável que este seja um problema detemperatura ambiente, mas pode ser um problema dehardware.

Dados:

v Uma sequência de texto identificando o sensortérmico que relata o nível de aviso e a temperaturaatual em graus (Celsius).

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Verifique a temperatura da sala e corrija qualquerproblemas de ar condicionado ou ventilação.

3. Verifique a corrente de ar em torno no sistema.Assegure-se de que nenhuma saída de ar estejabloqueada.

4. Assegure-se de que os ventiladores do nó estejamem operação.

5. Se o erro ainda for relatado, substitua a CPU do nó.

Causa Possível - unidades substituíveis em campo ououtra causa:

v CPU

770 Temperatura de encerramento atingida

Explicação: A temperatura do nó chegou ao ponto emque ele deve ser encerrado para proteger oscomponentes eletrônicos e os dados. É mais provávelque este seja um problema na temperatura ambiente,mas pode ser um problema de hardware.

Dados:

v Uma sequência de texto identificando o sensortérmico que relata o nível de aviso e a temperaturaatual em graus (Celsius).

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Verifique a temperatura da sala e corrija qualquerproblemas de ar condicionado ou ventilação.

3. Verifique a corrente de ar em torno do sistema ecertifique-se de que nenhuma abertura de ventilaçãoesteja bloqueada.

Causa Possível - unidades substituíveis em campo ououtra causa:

v CPU

775 Problema na fonte de alimentação.

Explicação: A fonte de alimentação possui umacondição de falha.

Resposta do Usuário: Substituir a fonte dealimentação.

Causa Possível - unidades substituíveis em campo ououtra:

751 • 775

Capítulo 7. Diagnosticando problemas 201

Page 220: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Fonte de alimentação

776 O cabo da fonte de alimentaçãoprincipal está desconectado.

Explicação: O cabo da fonte de alimentação principalnão está conectado.

Resposta do Usuário: Conecte o cabo da fonte dealimentação principal.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

777 Fonte de alimentação ausente.

Explicação: A fonte de alimentação está ausente.

Resposta do Usuário: Instale a fonte de alimentação.

FRUs de Causa Possíveis ou outra:

v Fonte de alimentação

779 Bateria está ausente

Explicação: A bateria não está instalada no sistema.

Resposta do Usuário: Instale a bateria.

É possível ligar o sistema sem a bateria instalada.

FRUs de Causa Possíveis ou outra:

v Bateria (100%)

780 A bateria falhou

Explicação:

1. A bateria falhou.

2. A bateria está além do término da sua vida útil.

3. A bateria falhou em fornecer energia em umaocasião anterior e é, portanto, consideradaimprópria para o seu propósito.

Resposta do Usuário: Substitua a bateria.

FRUs de Causa Possíveis ou outra:

v Bateria (100%)

781 A bateria está abaixo da temperaturamínima de operação

Explicação: A bateria não pode executar a funçãodesejada porque está abaixo da temperatura mínima defuncionamento.

Este erro só será informado se o subsistema de baterianão puder fornecer proteção integral.

Uma incapacidade de carregar não é relatada se a cargacombinada disponível a partir de todas as bateriasinstaladas puder fornecer proteção integral para osatuais níveis de carga.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Aguarde a bateria aquecer.

782 A bateria está acima da temperaturamáxima de operação

Explicação: A bateria não pode executar a funçãodesejada porque está acima da temperatura máxima defuncionamento.

Este erro só será relatado se o subsistema de baterianão puder fornecer proteção integral.

Uma incapacidade de carregar não é relatada se a cargacombinada disponível a partir de todas as bateriasinstaladas puder fornecer proteção integral para osatuais níveis de carga.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Aguarde a bateria esfriar.

783 Erro de comunicação da bateria

Explicação: Uma bateria está instalada, mas ascomunicações através do I2C não estão funcionando.

Isso pode ser uma falha na unidade da bateria ou umafalha no painel traseiro da bateria.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Substitua a bateria. Se o problema persistir, conduza oprocedimento de serviço corretivo descrito em “1109”na página 220.

784 A bateria está perto de terminar

Explicação: A bateria está próxima do término da suavida útil. É necessário substituí-la na primeiraoportunidade conveniente.

Isso pode ser uma falha na unidade da bateria ou umafalha no painel traseiro da bateria.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Substitua a bateria.

785 A capacidade da bateria está reduzidadevido ao desequilíbrio celular

Explicação: Os níveis de carga das células dentro dopacote de baterias estão fora de balanceamento.

Algumas células se tornam totalmente carregadas antesde outras, o que faz com que o carregamento finalizemais cedo, antes que todo o pacote de baterias estejatotalmente carregado.

Terminar a recarga prematuramente reduz efetivamentea capacidade disponível do pacote.

776 • 785

202 SAN Volume Controller: Guia de Resolução de Problemas

Page 221: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O conjunto de circuitos dentro do pacote de bateriascorrige esses erros normalmente, mas pode levardezenas de horas para concluir.

Se esse erro não for corrigido depois de 24 horas ou seo erro voltar a ocorrer depois que se corrige, o erro éprovavelmente indicativo de um problema nas célulasda bateria. Nesse caso, substitua o pacote de baterias.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Aguarde as células se balancearem.

786 Erro de soma de verificação VPD dabateria

Explicação: A soma de verificação nos dados vitais doproduto (VPD) armazenados no EEPROM da bateriaestá incorreta.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Substitua a bateria.

787 A bateria está em um nível de revisãodo hardware não suportado pelo nívelde código atual

Explicação: A bateria instalada atualmente está em umnível de revisão de hardware que não é suportado pelonível de código atual.

Resposta do Usuário: Nenhuma ação de serviçonecessária. Use o console para gerenciar o nó.

Atualize o nível de código para um que suporte abateria instalada atualmente ou substitua a bateria poruma que seja suportada pelo nível de código atual.

803 Adaptador Fibre Channel nãofuncionando

Explicação: Foi detectado um problema no adaptadorFibre Channel do nó.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

818 Impossível recuperar o disco flash docontrolador de serviço.

Explicação: Um erro irrecuperável ocorreu ao acessara memória persistente do controlador de serviço.

Resposta do Usuário:

1. Reinicie o nó e veja se ele se recupera.

2. Substitua as unidades substituíveis em campo(FRUs) na ordem listada.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Controlador de serviço

v Cabo do controlador de serviço

820 O tipo de caixa é incompatível com omodelo de gabinete

Explicação: A caixa de nó detectou que possui umtipo de hardware que não é compatível com o MTM dogabinete de controle, como tipo de caixa de nó 300 emum gabinete de controle com MTM 2076-112.

Essa é uma condição esperada quando um gabinete decontrole está sendo atualizado para um tipo diferentede caixa do nó.

Resposta do Usuário:

1. Verifique se todos as instruões de atualização foramseguidas completamente.

2. Utilize o GUI de gerenciamento para executar asações recomendadas para o código de erro doserviço associado.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

830 Chave de criptografia necessária.

Explicação: É necessário fornecer uma chave decriptografia antes que o sistema possa se tornartotalmente operacional. Esse erro do nó ocorre quandoum sistema com a criptografia ativada é reiniciado semuma chave de criptografia disponível.

Resposta do Usuário: Insira uma unidade flash USBcontendo uma chave válida em uma das caixas do nó.

831 A chave de criptografia não é válida.

Explicação: É necessário fornecer uma chave decriptografia antes que o sistema possa se tornartotalmente operacional. Esse erro do nó ocorre quandoa chave de criptografia identificada é inválida. Umarquivo com o nome correto foi localizado mas a chaveno arquivo está corrompida.

Esse erro do nó será limpo assim que a unidade flashUSB contendo a chave inválida for removida.

Resposta do Usuário: Remova a unidade flash USB daporta.

832 Arquivo de chave de criptografia nãolocalizado.

Explicação: Uma unidade flash USB contendo umachave de criptografia está presente, mas o arquivoesperado não pode ser localizado. Isso pode ocorrer seuma chave para um sistema diferente ou uma chaveantiga para esse sistema tiver sido fornecida.

Além disso, outros arquivos criados pelo usuário quecorresponderem ao formato do nome do arquivo-chave

786 • 832

Capítulo 7. Diagnosticando problemas 203

Page 222: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

podem causar esse erro se a unidade flash USB nãocontiver a chave esperada.

Esse erro do nó será limpo quando a unidade flashUSB identificada tiver sido removida.

Resposta do Usuário: Remova a unidade flash USB daporta.

833 Dispositivo USB não suportado.

Explicação: Um dispositivo não suportado foiconectado a uma porta USB.

Somente unidades flash USB são suportadas e esse errodo nó será levantado se um outro tipo de dispositivoestiver conectado a uma porta USB.

Resposta do Usuário: Remova o dispositivo nãosuportado.

840 Mudança de hardware não suportadodetectada.

Explicação: Foi detectada uma mudança nestaconfiguração de hardware do nó. A nova configuraçãonão é suportada pelo software da caixa do nó. A açãodo usuário é necessária para reparar o hardware ouatualizar o software.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Siga o procedimento para obter informações sobre onó e o sistema em cluster. Uma mudança naconfiguração de hardware é esperada.

3. Se a configuração de hardware for reduzidainesperadamente, certifique-se de que o componentenão tenha sido reposicionado. A substituição dehardware pode ser necessária.

4. Se um novo componente de hardware for mostradocomo não suportado, verifique a versão do softwarerequerida para suportar o componente de hardware.Atualizar o software para uma versão que suporte ohardware.

Se o hardware detectado não corresponder àconfiguração esperada, substitua o componente dehardware que é relatado incorretamente.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Um dos componentes de hardware opcionais poderequerer substituição

841 Mudança de hardware suportadadetectada.

Explicação: Foi detectada uma mudança naconfiguração de hardware do nó. A nova configuraçãoé suportada pelo software do nó. A nova configuração

não fica ativa até que ela seja ativada.

Uma configuração do nó é lembrada apenas enquantoela está ativada em um sistema. Este erro do nó é,portanto, resolvido usando o GUI de gerenciamento.

Resposta do Usuário:

1. Utilize o GUI de gerenciamento para executar asações recomendadas para o código de erro doserviço associado. Use a manutenção direcionadapara aceitar ou rejeitar a nova configuração.

842 Mapeamento da porta de E/S FibreChannel com falha

Explicação: Uma porta Fibre Channel ou FibreChannel over Ethernet está instalada, mas não estáincluída no mapeamento da porta de E/S FibreChannel e, portanto, a porta não pode ser usada paraE/S Fibre Channel. Esse erro surge em uma dassituações a seguir:

v Uma instalação de hardware do nó

v Uma mudança de adaptadores de E/S

v O aplicativo de um mapa da porta Fibre Channelincorreto

Essas tarefas são executadas normalmente porrepresentantes de serviço.

Resposta do Usuário: Seu representante de serviçopode usar o Assistente de Serviço para modificar osmapeamentos da porta de E/S Fibre Channel paraincluir todas as portas instaladas capazes de E/S FibreChannel. O comando a seguir é usado:

satask chvpd -fcportmap

850 A bateria da caixa está atingindo o finalde sua vida útil.

Explicação: A bateria da caixa está atingindo o finalde sua vida útil. Ela deve ser substituída em umasemana depois de o primeiro erro do nó ser relatado.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Substitua a bateria da caixa do nó usando osprocedimentos de remoção e substituição.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Bateria da caixa

860 A malha de rede Fibre Channel é muitogrande.

Explicação: O número de logins de Fibre Channel (FC)feitos no nó excede o limite permitido. O nó continuaoperando, mas só se comunica com os logins feitosantes que o limite fosse atingido. A ordem em que

833 • 860

204 SAN Volume Controller: Guia de Resolução de Problemas

Page 223: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

outros dispositivos efetuam login no nó não pode serdeterminada, portanto a conectividade FC do nó podevariar após cada reinicialização. A conexão pode sercom sistemas de host, outros sistemas dearmazenamento ou com outros nós.

Esse erro pode ser o motivo porque o nó não consegueparticipar de um sistema.

O número de login permitidos por nó é 1024.

Dados:

v Nenhuma

Resposta do Usuário: Esse erro indica um problemacom a configuração da malha Fibre Channel. Éresolvido com a reconfiguração do comutador FC:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Redefina a zona da rede FC de forma que apenas asportas às quais o nó precisa se conectar estejamvisíveis.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

870 Muitas criações do cluster feitas no nó

Explicação: Muitos sistemas SAN Volume Controllerarmazenados em cluster foram criados neste nó. Acontagem do número de sistemas em cluster criados nonó está armazenada no controlador de serviço do nó.

Dados:

v Nenhuma

Resposta do Usuário:

1. Tente criar o sistema em cluster em um nódiferente.

2. Substitua o controlador de serviço usando osprocedimentos de remoção e substituição.

FRUs de Causa Possível ou outra Causa:

v Controlador de serviço

871 Falha ao incrementar o ID do cluster

Explicação: A opção de criação do sistema em clusterfalhou porque o sistema em cluster, que estáarmazenado no controlador de serviço, não pôde seratualizado.

Dados:

v Nenhuma

Resposta do Usuário:

1. Tente criar o sistema em cluster em um nódiferente.

2. Substitua o controlador de serviço usando osprocedimentos de remoção e substituição.

FRUs de Causa Possível ou outra Causa:

v Controlador de serviço

875 Solicitação para agrupamento rejeitada.

Explicação: Um nó candidato não pôde ser incluídono sistema em cluster. O nó contém hardware oufirmware que não é suportado no sistema em cluster.

Dados:

Esse erro de nó e dados extras podem ser visualizadospor meio de sainfo lsservicestatus apenas no nócandidato. Os dados extras listam um conjuntocompleto de códigos de recurso que são requeridospelo nó para execução no sistema em cluster.

Resposta do Usuário:

v Escolha um candidato diferente que seja compatívelcom o sistema em cluster.

v Atualizar o sistema em cluster para o códigosuportado por todos os componentes.

v Não inclua um candidato no sistema em cluster.

v Quando aplicável, remova e substitua o hardwareque está impedindo o candidato de associar-se aosistema em cluster.

FRUs de Causa Possível ou outra causa.

Para obter informações sobre códigos de recursodisponíveis, consulte SAN Volume Controller andStorwize family Characteristic Interoperability Matrixno website de suporte: www.ibm.com/storage/support/2145.

878 Tentativa de recuperação após a perdade dados de estado.

Explicação: Na inicialização, o nó não pode ler seusdados de estado. Ele reporta esse erro ao tentar serincluído de volta no sistema em cluster. Se o nó não forincluído de volta em um sistema em cluster dentro deum período definido, o erro do nó 578 será reportado.

Resposta do Usuário:

1. Deixe tempo para recuperação. Nenhuma açãoadicional é necessária.

2. Continue monitorando caso o código de erro sejaalterado para 578.

888 Muitos logins Fibre Channel entre osnós.

Explicação: O sistema determinou que o usuáriozoneou a malha que este nó de tal forma que este nósrecebeu mais de 16 logins não mascarados provenientesde outro nó ou caixa do nó - este pode ser qualquer nó

870 • 888

Capítulo 7. Diagnosticando problemas 205

Page 224: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

não no modo de serviço ou caixa no cluster local ou emum cluster remoto com uma parceria. Um login nãomascarado é a partir de uma porta cujo bitcorrespondente na máscara de porta FC é '1'. Se o errofor levantado com relação a um nó no cluster local,então, é a máscara de porta FC local que é aplicável. Seo erro for levantado com relação a um nó em umcluster remoto, então, as máscaras de porta FC doparceiros de ambos os clusters é que são aplicáveis.

Mais de 16 logins não é uma configuração suportada,pois a comunicação internó aumenta e pode afetar alargura da banda e o desempenho. Por exemplo, se onó A possui 8 portas e o nó B possui 8 portas em queos nós estão em clusters diferentes, se o nó A possuiuma máscara de porta do FC do parceiro de 00000011 eo nó B possui uma máscara de porta do FC do parceirode 11000000, há 4 logins sem máscara possíveis (1,7 1,82,7 2,8). O zoneamento de malha pode ser usado parareduzir ainda mais esta quantidade, isto é, se o nó B daporta 8 é removido da zona, há apenas 2 (1,7 e 2,7). Acombinação de máscaras e o zoneamento deve deixar16 ou menos logins possíveis.

Nota: Esta contagem inclui logins FC e Fibre Channelover Ethernet (FCoE). A contagem de login não incluiráportas mascaradas.Quando este evento é registrado, o ID do cluster e o IDdo nó do primeiro nó cujos logins excedem este limiteno nó local serão relatados, bem como o WWNN de talnó. Se os logins mudarem, o erro é automaticamente eoutro é registrado, se apropriado (este pode ou nãoescolher o mesmo nó para relatar nos dados de controlese o mesmo nó ainda estiver além do máximopermitido).

Dados

Sequência de texto mostrando

v WWNN do outro nó

v ID do cluster de outro nó

v ID do nó arbitrário de outro nó que está conectado aeste nó. (ID do nó conforme ele aparece no lsnode)

Resposta do Usuário: O erro é resolvido aoreconfigurar o sistema para alterar qual tipo de conexãoé permitido em uma porta ou ao alterar a configuraçãode malha SAN de forma que as portas não estejam namesma zona. Um combinação de ambas as opções podeser usada.

A reconfiguração do sistema é para alterar a máscarade portas Fibre Channel para reduzir quais portaspodem ser usadas para comunicação internó.

A máscara de porta Fibre Channel local deve sermodificada se o ID do cluster relatou correspondênciaspara o ID do cluster do nó que registra o erro.

A máscara da porta do Fibre Channel do parceirodevem ser modificada se o ID do cluster relatado nãocorresponde ao ID do cluster do nó que registra o erro.

A máscara da porta do Fibre Channel pode precisar seralterada para um ou ambos os clusters.

A configuração da malha SAN é definida usando osutilitários de configuração do comutador.

Use o comando lsfabric para visualizar o númeroatual de logins entre os nós.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

Código de erro de serviço

1801

889 Falha ao criar a conexão do IP remota.

Explicação: Apesar de uma solicitação de criar umaconexão de porta de parceria do IP remota, a açãofalhou ou atingiu o tempo limite.

Resposta do Usuário: Corrija o link do IP remoto paraque o tráfego possa fluir corretamente. Uma vez que aconexão estiver estabelecida, o erro será autocorrigido.

920 Não é possível executar a recuperação decluster por causa de uma falta derecursos de cluster.

Explicação: O nó está procurando por um quorum derecursos que também exige a recuperação de cluster.

Resposta do Usuário: Entre em contato com o suportetécnico IBM.

921 Não é possível executar a recuperação decluster por causa de uma falta derecursos de cluster.

Explicação: O nó não tem conectividade suficientecom outros nós ou dispositivo de quorum para formarum cluster. Se um desastre tiver ocorrido e os nós nooutro lado não puderem ser recuperados, será possívelpermitir os nós no site sobrevivente para formar umsistema usando o armazenamento local.

Resposta do Usuário: Repare a malha ou dispositivode quorum para estabelecer a conectividade. Comoúltimo recurso quando os nós no outro lado nãopuderem ser recuperados, será possível permitir os nósno site sobrevivente para formar um sistema usando oarmazenamento de site local conforme descrito abaixo:

Para evitar distorção de dados, assegure-se de quetodos os servidores host que estavam acessandoanteriormente o sistema tenham tido todos os volumesnão montados ou tenham sido reinicializados.Assegure-se de que os nós no outro lado não estejamoperacionais e não possam formar um sistema nofuturo.

Após chamar este comando, uma ressincronização

889 • 921

206 SAN Volume Controller: Guia de Resolução de Problemas

Page 225: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

integral de todos os volumes espelhados será executadaquando o outro site for recuperado. É provável queleve muitas horas ou dias para concluir.

Entre em contato com a equipe de suporte IBM seestiver inseguro.

Nota: Antes de continuar confirmando que já tomou asações a seguir - não executar essas ações pode levar àdistorção de dados que não serão detectados pelosistema, mas afetarão aplicativos de host.

1. Todos os servidores host que estavam acessando osistema anteriormente tiveram todos os volumesnão montados ou foram reinicializados.

2. Assegure-se de que os nós no outro lado nãoestejam operando como um sistema e que as açõesforam tomadas para impedi-los de formar umsistema no futuro.

Após essa ações terem sido tomadas, sataskoverridequorum poderá ser usado para permitir que osnós no site sobrevivente formem um sistema usandoum armazenamento local.

950 Modo de atualização especial.

Explicação: Modo de atualização especial.

Resposta do Usuário: Nenhuma.

990 Falha na validação do cluster.

Explicação: Falha na validação do cluster.

Resposta do Usuário: Entre em contato com o suportetécnico IBM.

1001 Foi executada uma recuperaçãoautomática do cluster.

Explicação: Todos os comandos de configuração docluster estão bloqueados.

Resposta do Usuário: Ligue para seu centro desuporte de software.

Cuidado: É possível desbloquear os comandos deconfiguração por meio da GUI do cluster, mas vocêprimeiro deve consultar seu suporte de software paraevitar danos na configuração do cluster.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1002 Log de eventos cheio.

Explicação: Log de eventos cheio.

Resposta do Usuário: Para corrigir os erros no log deeventos, acesse o MAP de início.

Causa Possível - unidades substituíveis em campo ououtra:

v Erros não corrigidos no log.

1007 Erro de comunicação de caixa para caixa

Explicação: Um erro de comunicação de caixa paracaixa pode aparecer quando uma caixa não puder secomunicar com a outra.

Resposta do Usuário: Recoloque a caixa passiva, e, emseguida, tente encaixar a caixa ativa. Se nenhuma dasopções resolver o alerta, tente substituir o caixa passiva,e, em seguida, a outra caixa.

Uma caixa pode ser seguramente reajustado ousubstituído enquanto o sistema está em produção.Assegure-se de que a outra caixa seja o nó ativo antesde remover essa caixa. É preferível que essa caixa sejaencerrada completamente antes de removê-la, mas issonão é necessário.

1. Recoloque a caixa passiva (um failover não énecessário).

2. Recoloque a segunda caixa (um failover énecessário).

3. Se necessário, substitua a caixa passiva (um failovernão é necessário).

4. Se necessário, substitua a caixa ativa (um failover énecessário).

Se uma nova caixa segundo não estiver disponível,a caixa anteriormente removida pode ser utilizado,já que aparentemente não se encontra em falta.

5. Uma de substituição do gabinete pode sernecessária. Entre em contato com o suporte IBM.

Causa Possível - unidades substituíveis em campo ououtra:

A (95%)

Gabinete (5%)

1009 Os DIMMs estão instaladosincorretamente.

Explicação: Os DIMMs estão instaladosincorretamente.

Resposta do Usuário: Assegure-se de que os DIMMsde memória estejam distribuídos uniformemente entretodos os canais de memória.

1. Encerre o nó.

2. Assegure-se de que os DIMMs de memória estejamdistribuídos uniformemente entre todos os canais dememória.

3. Reinicie o nó.

4. Se o erro persistir, substitua a placa-mãe.

950 • 1009

Capítulo 7. Diagnosticando problemas 207

Page 226: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1011 O adaptador Fibre Channel (4 portas) noslot 1 está ausente.

Explicação: O adaptador Fibre Channel (4 portas) noslot 1 está ausente.

Resposta do Usuário:

1. Na sequência mostrada, troque os FRUs por FRUsnovos.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Adaptador de barramento host Fibre Channel de 4portas (98%)

v Placa-mãe (2%)

1013 Falha no adaptador PCI Fibre Channel(4 portas) no slot 1.

Explicação: Falha no adaptador PCI Fibre Channel (4portas) no slot 1.

Resposta do Usuário:

1. Na sequência mostrada, troque os FRUs por FRUsnovos.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Adaptador de barramento host Fibre Channel de 4portas (98%)

v Placa-mãe (2%)

1014 O adaptador Fibre Channel no slot 1está ausente.

Explicação: O adaptador Fibre Channel no slot 1 estáausente.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v N/D

1015 O adaptador Fibre Channel no slot 2está ausente.

Explicação: O adaptador Fibre Channel no slot 2 estáausente.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRUs com falha por novos FRUs.

2. Verifique o status do nó:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v N/D

1016 O adaptador Fibre Channel (quatroportas) no slot 2 está ausente.

Explicação: O adaptador Fibre Channel de quatroportas no slot PCI 2 está ausente.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

1011 • 1016

208 SAN Volume Controller: Guia de Resolução de Problemas

Page 227: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v Adaptador de barramento de host de Fibre Channel(90%)

v Placa riser PCI (5%)

v Outro (5%)

1017 Erro de barramento PCI do adaptadorFibre Channel no slot 1.

Explicação: O adaptador Fibre Channel no slot PCI 1está com falha com um erro no barramento PCI.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v Adaptador de barramento de host de Fibre Channel(80%)

v Placa riser PCI (10%)

v Outro (10%)

1018 Falha do adaptador Fibre Channel noslot 2 PCI.

Explicação: O adaptador Fibre Channel no slot 2 estácom falha com um PCI com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v Adaptador de barramento de host de Fibre Channelcom porta dual - altura integral (80%)

v Placa riser PCI (10%)

v Outro (10%)

1019 Falha no adaptador Fibre Channel(quatro portas) no slot 2 PCI.

Explicação: O adaptador Fibre Channel de quatroportas no slot 2 está com falha com um PCI com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v Adaptador de barramento de host de Fibre Channel(80%)

v Placa riser PCI Express (10%)

v Outro (10%)

1020 O processador de serviço da placa-mãefalhou.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 522.Consulte os detalhes de erro de nó 522 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 522.

1021 Gabinete incorreto

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 500.Consulte os detalhes de erro de nó 500 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 500.

1022 O tamanho de memória detectado nãocorresponde ao tamanho de memóriaesperado.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 510.Consulte os detalhes de erro de nó 510 para obterinformações adicionais.

1017 • 1022

Capítulo 7. Diagnosticando problemas 209

Page 228: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resposta do Usuário: Consulte o erro de nó 510.

1024 A CPU está quebrada ou ausente.

Explicação: A CPU está quebrada ou ausente.

Resposta do Usuário: Revise o hardware do nóusando o comando svcinfo lsnodehw no nó indicadopor esse evento.

1. Encerre o nó. Substitua a CPU que está quebrada,conforme indicado pelos indicadores luminosos edados do evento.

2. Se o erro persistir, substitua a placa-mãe.

Nota: A remoção intencional não é permitida em umnó do cluster. Para usar o nó com apenas umprocessador, deve-se executar rmnode e depois readd.Caso contrário, encerre o nó e substitua o processadorque foi removido.Causa Possível - unidades substituíveis em campo ououtra:

v CPU (80%)

v Placa-mãe (20%)

1025 Processador ausente

Explicação: O conjunto do sistema está falhando.

Resposta do Usuário:

1. Acesse o MAPA de diagnóstico por indicadoresluminosos e conclua os procedimentos do sistemade diagnósticos por indicadores luminosos.

2. Se o procedimento do sistema de diagnósticos porindicadores luminosos isolar a FRU, marque esteerro como corrigido. Em seguida, acesse o MAPAde verificação de reparo.

3. Se você substituir uma FRU, mas isso não corrigir oproblema, assegure-se de que a FRU esteja instaladacorretamente. Em seguida, vá para a próxima etapa.

4. Substitua a placa-mãe, conforme indicado na listaCausa possível.

5. Verifique o status do nó:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

6. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

2145-CF8 ou 2145-CG8

v As FRUs indicadas pelo sistema de diagnósticos porindicadores luminosos (98%)

v Placa-mãe (2%)

1026 Problema do dispositivo da placa-mãe.

Explicação: Problema do dispositivo da placa-mãe.

Resposta do Usuário: A ação depende dos dadosextras que são fornecidos com o erro do nó e o sistemade diagnósticos por indicadores luminosos.

Causa Possível - unidades substituíveis em campo ououtra:

v Variável

1027 Não é possível atualizar asconfigurações do BIOS.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 524.Consulte os detalhes de erro de nó 524 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 524.

1028 O processador de serviço da placa-mãefalhou.

Explicação: O processador de serviço da placa-mãefalhou.

Resposta do Usuário: Conclua as seguintes etapas:

1. Encerre o nó.

2. Remova o cabo de energia principal.

3. Aguarde que as luzes parem de piscar.

4. Plugue o cabo de energia.

5. Aguarde a inicialização do nó.

6. Se o nó ainda relatar o erro, substitua a placa-mãe.

Causa Possível - unidades substituíveis em campo ououtra:

v Placa-mãe

1029 VPD do gabinete está indisponível ou éinválido.

Explicação: VPD do gabinete está indisponível ou éinválido.

Resposta do Usuário: Sobrescreva os dados vitais doproduto do gabinete ou substitua a placa do interposerde energia.

Causa Possível - unidades substituíveis em campo ououtra:

placa do PIB (10%)

Outra:

Sem unidade substituível em campo (90%)

1024 • 1029

210 SAN Volume Controller: Guia de Resolução de Problemas

Page 229: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1030 O disco interno de um nó falhou.

Explicação: Ocorreu um erro ao tentar ler ou gravardados no disco interno de um dos nós no cluster. Aunidade falhou.

Resposta do Usuário: Determine que disco interno donó falhou usando as informações de nó no erro.Substitua as FRUs na ordem mostrada. Marque o errocomo corrigido.

Causa Possível - unidades substituíveis em campo ououtra:

2072 - Caixa de Nó (100%)

v unidade de disco (50%)

v Controladora de disco (30%)

v Painel traseiro do disco (10%)

v Cabo de sinal do disco (8%)

v Cabo de energia do disco (1%)

v Placa-mãe (1%)

1031 Local da caixa do nó desconhecido.

Explicação: Local da caixa do nó desconhecido.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Liste todas as caixas de gabinete para todos osgabinetes de controle. Procure uma caixa on-lineque não tenha um ID do nó associado a ela. Estacaixa é a que apresenta o problema.

2. Desconecte o cabo SAS da porta 2 da caixaidentificada na etapa 1.

3. Execute o comando lsenclosurecanister e veja sehá um ID do nó presente. Se a etapa 2 corrigir oerro (um ID do nó está presente), então algo falhouem um dos dispositivos conectados.

4. Reconecte os gabinetes de expansão e veja se osistema consegue isolar a falha.

5. Reposicione todas as caixas nesse conector esubstitua a caixa identificada na etapa 1, se a etapa4 não corrigir o erro.

FRUs de Causa Possíveis ou outra:

v Nada (80%)

v A (20%)

1032 Adaptador Fibre Channel nãofuncionando

Explicação: Foi detectado um problema no adaptadorFibre Channel do nó. Esse erro do nó é relatadosomente no SAN Volume Controller 2145-CG8 ou nósmais antigos.

Resposta do Usuário: Siga os procedimentos deresolução de problemas para corrigir o hardware.

1. Se possível, use a GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro de serviço associado.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

1034 Tipo 2 de falha de espaço de slot

Explicação: Há um erro interno da caixa.

Resposta do Usuário: Recoloque a caixa e, emseguida, substitua a caixa se o erro persistir.

Causa Possível - unidades substituíveis em campo ououtra:

A caixa (80%)

Outra:

Não FRU (20%)

1035 Problemas com a unidade deinicialização

Explicação: Problemas com a unidade de inicialização

Resposta do Usuário: Conclua as seguintes etapas:

1. Verifique a visualização da unidade de inicializaçãopara determinar os problemas.

2. Execute os comandos lsnodebootdrive /lsbootdrive para exibir um status de cada slot parausuários e DMPs para diagnosticar e repararproblemas.

3. Se você planeja mover quaisquer unidades, encerreo nó se booted yes for mostrado para essa unidadena visualização da unidade de inicialização(lsbootdrive). Depois de mover as unidades, umerro de nó diferente provavelmente será exibidopara você trabalhar.

4. Se você planeja configurar o número de série daplaca-mãe, consulte satask chvpd.

5. Se houver ainda nenhum dado persistente utilizávelnas unidades de inicialização, entre em contato como Suporte técnico remoto IBM.

Causa Possível - unidades substituíveis em campo ououtra:

v Unidade de sistema

1036 A identidade do gabinete não pode serlida.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 509.Consulte os detalhes de erro do nó 509 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 509.

1030 • 1036

Capítulo 7. Diagnosticando problemas 211

Page 230: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1039 A falha, a substituição da caixanecessária.

Explicação: A falha, a substituição da caixa necessária.

Resposta do Usuário: Substitua a caixa.

Uma caixa pode ser seguramente substituído enquantoo sistema está em produção. Assegure-se de que aoutra caixa seja o nó ativo antes de remover essa caixa.É preferível que esse caixa encerrado completamenteantes de removê-lo, mas isso não é necessário.

Causa possível - unidades substituíveis em campo ououtra:

Adaptador da interface (50%)

SFP (20%)

A (20%)

Cabo do adaptador da interface interno (10%)

1040 Falha do disco de atualização do nó

Explicação: Ocorreu um erro do módulo flash apósum início do sistema bem-sucedido. Nota: O nócontendo o módulo flash não foi rejeitado pelo cluster.

Resposta do Usuário:

1. Substitua as FRUs abaixo na ordem listada

2. Verifique o status do nó. Se todos os nós mostraremum status de Online, marque o erro que acabou deser reparado como “corrigido”. Se algum dos nósnão mostrar um status de online, acesse o MAP deinício. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema com o 2145.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (50%)

v Cabo do controlador de serviço (50%)

1044 Ocorreu uma falha de leitura docontrolador de serviço

Explicação: Ocorreu uma falha de leitura docontrolador de serviço.

Resposta do Usuário:

1. Substitua as FRUs abaixo na ordem listada.

2. Verifique o status do nó. Se todos os nós mostraremum status de On-line, marque o erro que vocêacabou de corrigir como “corrigido”. Se algum nónão mostrar um status de On-line, acesse o MAPAde início. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CG8 ou 2145-CF8

v Controlador de serviço (50%)

v Cabo do controlador de serviço (50%)

1048 Falha inesperada do gabinete.

Explicação: Falha inesperada do gabinete.

Resposta do Usuário: Use a opção de snap inferior naGUI de gerenciamento. Isso executa as funções a seguir:

v Gera novos dumps de gabinete para todos osgabinetes.

v Gera livedump de todos os nós no cluster.

v Executa como svc_snap dumpall.

1. Entre em contato com o suporte IBM para análiseadicional.

FRUs de Causa Possíveis ou outra:

v Nenhuma

1051 TPM conectável com falha ou ausente

Explicação: O Trusted Platform Module (TPM) para osistema não está funcionando.

Resposta do Usuário:

Importante: Confirme se o sistema está em execuçãoem pelo menos um outro nó antes de iniciar essereparo. Cada nó usa seu TPM para armazenar comsegurança as chaves de criptografia em sua unidade deinicialização. Quando o TPM ou a unidade deinicialização de um nó é substituída, o nó perderá suachave de criptografia, e deverá ser capaz de associarum sistema existente para obter as chaves. Se esse erroocorreu no último nó em um sistema, não substitua oTPM, a unidade de inicialização ou o hardware do nóaté que o sistema contenha pelo menos um nó onlinecom chaves válidas.

1. Encerre o nó e remova o hardware do nó.

2. Localize o TPM no hardware do nó e assegure-se deque ele esteja encaixado corretamente.

3. Reinsira o hardware do nó e forneça energia ao nó.

4. Se o erro persistir, substitua o TPM por um dosestoques da FRU.

5. Se o erro persistir, substitua a placa-mãe ou ohardware do nó por um dos estoques da FRU.

Você não precisa devolver o TPM com falha para IBM.

Nota: É improvável que a falha de um TPM possacausar a perda da System Master Key (SMK):

1039 • 1051

212 SAN Volume Controller: Guia de Resolução de Problemas

Page 231: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v A SMK é selada pelo TPM, usando sua chave decriptografia exclusiva, e o resultado é armazenado naunidade de inicialização do sistema.

v A cópia funcional da SMK fica no disco RAM e,portanto, não é afetada por uma falha súbita doTPM.

v Se a falha ocorrer no tempo de inicialização, o nóserá mantido em um estado de erro irrecuperávelporque o TPM é uma FRU.

v A SMK também é espelhada pelos outros nós nosistema. Quando o nó com o TPM de substituiçãoassociar-se ao sistema, ele determinará que nãopossui o SMK, solicita-o, obtém-no e, em seguida, éselado com o novo TPM.

1052 Tipo incorreto de fonte de alimentaçãoininterrupta detectado

Explicação: O cluster está relatando que um nó nãoestá operacional devido a um erro de nó crítico 587.Para obter mais informações, consulte os detalhes doerro de nó 587.

Resposta do Usuário: Consulte o erro de nó 587.

1054 O adaptador Fibre Channel noadaptador do slot 1 está presente, mascom falha.

Explicação: O adaptador Fibre Channel no slot PCI 1está presente, mas com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v Adaptador de barramento de host de Fibre Channel(100%)

1055 O adaptador Fibre Channel (4 portas) noslot 1 está presente mas falhou.

Explicação: O adaptador Fibre Channel (4 portas) noslot 1 está presente mas falhou.

Resposta do Usuário:

1. Troque a FRU por uma nova FRU.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que você

acabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Adaptador de barramento host Fibre Channel de 4portas (100%)

1056 O adaptador Fibre Channel no slot 2está presente, mas está com falha.

Explicação: O adaptador Fibre Channel no slot 2 estápresente, mas está com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v N/D

1057 O adaptador Fibre Channel (quatroportas) no adaptador 2 do slot estápresente, mas está com falha.

Explicação: O adaptador Fibre Channel de quatroportas no slot 2 está presente, mas está com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

1052 • 1057

Capítulo 7. Diagnosticando problemas 213

Page 232: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v N/D

1059 Mapeamento da porta de E/S do FibreChannel com falha

Explicação: Uma porta Fibre Channel ou FibreChannel over Ethernet está instalada, mas não estáincluída no mapeamento da porta de E/S FibreChannel e, portanto, a porta não pode ser usada paraE/S Fibre Channel. Esse erro surge em uma dassituações a seguir:

v Uma instalação de hardware do nó

v Uma mudança de adaptadores de E/S

v O aplicativo de um mapa da porta Fibre Channelincorreto

Essas tarefas são executadas normalmente porrepresentantes de serviço.

Resposta do Usuário: Seu representante de serviçopode usar o Assistente de Serviço para modificar osmapeamentos da porta de E/S Fibre Channel paraincluir todas as portas instaladas capazes de E/S FibreChannel. O comando a seguir é usado:

satask chvpd -fcportmap

1060 Uma ou mais portas do Fibre Channelno 2072 não estão operacionais.

Explicação: Uma ou mais portas do Fibre Channel no2072 não estão operacionais.

Resposta do Usuário:

1. Acesse o MAPA 5600: Fibre Channel para isolar ereparar o problema.

2. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Cabo Fibre Channel (80%)

v Conector SFP (Small Form-factor Pluggable) (5%)

v Adaptador de barramento host Fibre Channel de 4portas (5%)

Outra:

v Malha de rede Fibre Channel (10%)

1061 portas Fibre Channel não estãooperacionais.

Explicação: portas Fibre Channel não estãooperacionais.

Resposta do Usuário: Um porta offline pode termuitas causas e, portanto, é necessário verificar todoseles. Inicie com a possibilidade de mais fácil e menosintrusiva, tais como reconfigurar a porta Fibre Channelou FCoE através do comando da CLI.

Causa Possível - unidades substituíveis em campo ououtra:

Externos (cabo, HBA/CNA, comutador e assim pordiante) (75%)

SFP (10%)

Interface (10%)

Nó (5%)

1065 Um ou mais portas Fibre Channel estãoem execução em velocidade inferior àvelocidade salva anteriormente.

Explicação: As portas Fibre Channel irão operarnormalmente na velocidade mais alta permitida pelocomutador Fibre Channel, mas essa velocidade podeser reduzida se a qualidade do sinal na conexão FibreChannel estiver ruim. O comutador Fibre Channel podeter sido configurado para operar em uma velocidademais baixa pelo usuário ou a qualidade do sinal FibreChannel deteriorou.

Resposta do Usuário:

v Acesse o MAPA 5600: Fibre Channel para resolver oproblema.

Causa Possível - unidades substituíveis em campo ououtra:

2072 - Caixa de Nó (100%)

v Cabo Fibre Channel (50%)

v Conector SFP (Small Form-factor Pluggable) (20%)

v Adaptador de barramento host Fibre Channel de 4portas (5%)

Outra:

v Comutador Fibre Channel, conector SFP ou GBIC(25%)

1067 Tipo 1 de falha de ventilador

Explicação: O ventilador falhou.

Resposta do Usuário: Substitua o ventilador.

Causa Possível - unidades substituíveis em campo ououtra:

Ventilador (100%)

1068 Tipo 2 de falha de ventilador

Explicação: O ventilador está ausente.

Resposta do Usuário: Recoloque o ventilador e, emseguida, substitua o ventilador se recolocar o ventiladornão corrigir o erro.

Nota: Se substituir o ventilador não corrigir o erro,então a caixa precisará ser substituído.

1059 • 1068

214 SAN Volume Controller: Guia de Resolução de Problemas

Page 233: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

Ventilador (80%)

Outra:

Não FRU (20%)

1083 Erro de nó não reconhecido

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 562.Consulte os detalhes de erro de nó 562 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 562.

1084 O dispositivo da placa-mãe excedeu olimite de temperatura.

Explicação: O dispositivo da placa-mãe excedeu olimite de temperatura.

Resposta do Usuário: Conclua as seguintes etapas:

1. Verifique se há bloqueios de fluxo de ar externos.

2. Remova a parte superior da caixa de máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou bloqueiosinternos.

3. Se o problema persistir, siga as instruções de serviçopara substituir a FRU da placa-mãe em questão.

Causa Possível - unidades substituíveis em campo ououtra:

v Variável

1085 A placa PCI Riser excedeu o limite detemperatura.

Explicação: A placa PCI Riser excedeu o limite detemperatura.

Resposta do Usuário: Conclua as seguintes etapas:

1. Verifique o fluxo de ar.

2. Remova a parte superior da caixa de máquina everifique se há placas defletoras ausentes oubloqueios internos.

3. Verifique se há placas PCI com falha e substituaconforme necessário.

4. Se o problema persistir, substitua a FRU da RiserPCI.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1087 Limite de temperatura de encerramentoexcedido

Explicação: Limite de temperatura de encerramentoexcedido.

Resposta do Usuário: Inspecione o gabinete e oambiente do gabinete.

1. Verifique a temperatura ambiente.

2. Certifique-se de que todos os componentes estãoinstalados ou que existem de preenchimento emcada compartimento.

3. Verifique se todos os ventiladores estão instalados efuncionando corretamente.

4. Busque por quaisquer obstruções para fluxo de ar,liberação adequada para entrada de ar fresco e deexaustão de ar.

5. Manipule quaisquer erros específicos de arobstruídos que estão relacionados à unidade, abateria e a unidade de fonte de alimentação.

6. Traga o sistema de volta on-line. Se o sistemaexecutou um encerramento permanente, aalimentação deve ser removida e reaplicada.

Causa Possível - unidades substituíveis em campo ououtra:

Nó (2%)

Bateria (1%)

Unidade de fonte de enrgia (1%)

Drive (1%)

Outra:

Ambiente (95%)

1089 Um ou mais ventiladores estãofalhando.

Explicação: Um ou mais ventiladores estão falhando.

Para o 2145-DH8, um ventilador possui uma condiçãode falha.

Resposta do Usuário:

1. Determine o(s) ventilador(es) com falha a partir doindicador do ventilador na placa-mãe ou do textodos dados do erro no log. O ventilador relatadopara o 2145-CF8 ou o 2145-CG8 corresponde àposição do módulo de ventilador. Cada módulo deventilador contém dois ventiladores.

2. Para o 2145-DH8, pare mecanicamente o ventiladorou remova o ventilador. Se um ventilador nãoestiver instalado, encerre o nó, abra-o e instale oventilador. Se um ventilador estiver instalado,

1083 • 1089

Capítulo 7. Diagnosticando problemas 215

Page 234: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

substitua a FRU do ventilador indicada peloidentificador VENTILADOR que é fornecido nosdados extras.

3. Troque a FRU por uma nova FRU.

4. Acesse o MAP de verificação de reparo.

v Número do ventilador: Posição do módulo deventilador

v 1 ou 2 :1

v 3 ou 4 :2

v 5 ou 6 :3

v 7 ou 8 :4

v 9 ou 10:5

v 11 ou 12:6

Causa Possível - unidades substituíveis em campo ououtra:

v Módulo de ventilador (100%)

1090 Um ou mais ventiladores (40x40x28)estão falhando.

Explicação: Um ou mais ventiladores (40x40x28) estãofalhando.

Resposta do Usuário:

1. Determine os ventiladores com falha a partir doindicador na placa-mãe ou do texto dos dados deerro no log.

2. Verifique se o cabo entre o painel traseiro doventilador e a placa-mãe está conectado:

v Se todos os ventiladores no painel traseiro doventilador estiverem com falha

v Se nenhuma luz do ventilador ficar iluminada

3. Troque a FRU por uma nova FRU.

4. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v N/D

1091 Um ou mais ventiladores (40x40x56)estão falhando.

Explicação: Um ou mais ventiladores (40x40x56) estãofalhando.

Resposta do Usuário:

1. Determine os ventiladores com falha a partir doindicador na placa-mãe ou do texto dos dados deerro no log.

2. Verifique se o cabo entre o painel traseiro doventilador e a placa-mãe está conectado:

v Se todos os ventiladores no painel traseiro doventilador estiverem com falha

v Se nenhuma luz do ventilador ficar iluminada

3. Troque a FRU por uma nova FRU.

4. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

v N/D

1092 O limite de encerramento flexível ourígido de temperatura do 2072 foiexcedido. O 2072 foi automaticamentedesligado.

Explicação: O limite de encerramento flexível ourígido de temperatura do 2072 foi excedido. O 2072 foiautomaticamente desligado.

Resposta do Usuário:

1. Assegure que o ambiente operacional atenda àsespecificações.

2. Assegure que a corrente de ar não esteja obstruída.

3. Assegure que os ventiladores estejam operacionais.

4. Acesse o MAPA do sistema de diagnósticos porindicadores luminosos e execute os procedimentosde diagnóstico por indicadores luminosos.

5. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se algum nónão mostrar um status de “on-line”, acesse o MAPAde início. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

6. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2072 - Caixa de Nó (100%)

v A FRU indicada pelo sistema de diagnósticos porindicadores luminosos (25%)

v Placa-mãe (5%)

Outra:

Ambiente de sistema ou bloqueio de corrente de ar(70%)

1093 Limite de aviso de temperatura excedido

Explicação: O sensor de temperatura interno dosistema relatou que o limite de aviso de temperaturafoi excedido.

Resposta do Usuário:

1. Assegure-se de que a corrente de ar interna do nónão esteja obstruída.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se algum nónão mostrar um status de “on-line”, acesse o MAPA

1090 • 1093

216 SAN Volume Controller: Guia de Resolução de Problemas

Page 235: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

de início. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Somente para o 2145-DH8 e o 2145-CF8:

1. Verifique se há bloqueios de fluxo de ar externos.

2. Remova a parte superior da caixa da máquina everifique se há placas defletoras ausentes,dissipadores de calor danificados ou obstruçõesinternas.

3. Se o problema persistir depois de tomar essasmedidas, substitua a FRU do conjunto de CPU se2145-DH8 ou 2145-CF8.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Módulo de ventilador (20%)

v Placa-mãe (5%)

v A (5%)

Causa Possível - unidades substituíveis em campo ououtra:

2145-DH8 ou 2145-CF8

v Conjunto de CPU (30%)

Outra:

Bloqueio de corrente de ar (70%)

1094 O limite da temperatura ambiente foiexcedido.

Explicação: O limite da temperatura ambiente foiexcedido.

Resposta do Usuário:

1. Verifique se a temperatura da sala está dentro doslimites permitidos.

2. Verifique se há obstruções no fluxo de ar.

3. Marque o erro como corrigido.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Nenhuma

Outra:

Ambiente de sistema (100%)

1095 A temperatura do gabinete passou dolimite crítico.

Explicação: A temperatura do gabinete passou dolimite crítico.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Verifique a temperatura ambiente.

2. Verifique se há impedância para a corrente de ar.

3. Se o gabinete foi encerrado, desligue ambos oscomutadores de energia no gabinete e ligue ambosnovamente.

FRUs de Causa Possíveis ou outra:

v Nenhuma

1096 Uma Unidade de Fonte de Alimentaçãoestá ausente ou falhou.

Explicação: Uma das duas unidades de fonte dealimentação no nó está ausente ou falhou.

NOTA: Este erro é relatado quando uma fonte dealimentação hot swap é removida de um nó ativo,portanto pode ser relatado quando uma fonte dealimentação com falha for removida para substituição.Tanto as condições de ausência quanto de falha relatameste código de erro.

Resposta do Usuário: O código de erro 1096 érelatado quando a fonte de alimentação não pode serdetectado ou relata um erro.

1. Assegure que a fonte de alimentação estejacorretamente encaixada e que o cabo de energiaesteja corretamente conectado tanto ao nó quanto ao2145 UPS-1U.

2. Se o erro não for automaticamente marcado comocorrigido depois de dois minutos, observe o statusdos três LEDs na parte traseira da fonte dealimentação. Para o 2145-CG8 ou 2145-CF8, o LEDAC é o LED verde da parte superior, o LED DC é oLED verde do meio e o LED de erro é o LED âmbarda parte inferior.

3. Se o LED de erro da fonte de alimentação estiverapagado e os LEDs de energia de corrente alternadae DC estiverem acesos, esta é a condição normal. Seo erro não tiver sido automaticamente corrigidodepois de dois minutos, substitua a placa-mãe.

4. Siga a ação especificada para os estados de LEDobservados na tabela a seguir.

5. Se o erro não tiver sido automaticamente corrigidodepois de dois minutos, entre em contato comsuporte.

6. Acesse o MAP de verificação de reparo.

Erro,AC,DC:Ação

1094 • 1096

Capítulo 7. Diagnosticando problemas 217

Page 236: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

ON,ON ou OFF,ON ou OFF:A fonte de alimentaçãopossui uma falha. Substituir a fonte de alimentação.

OFF,OFF,OFF:Não foi detectada alimentação.Assegure-se de que o cabo de energia esteja conectadoao nó e ao 2145 UPS-1U. Se o LED AC não acender,verifique o status do 2145 UPS-1U ao qual a fonte dealimentação está conectada. Siga o MAP 5150 2145UPS-1U se a UPS-1U estiver mostrando falta de energiaou um erro. Caso contrário, substitua o cabo deenergia. Se o LED AC ainda não acender, substitua afonte de alimentação.

OFF,OFF,ON:A fonte de alimentação possui uma falha.Substituir a fonte de alimentação.

OFF,ON,OFF:Assegure que a fonte de alimentaçãoesteja corretamente instalada. Se o LED DC nãoacender, substitua a fonte de alimentação.

Causa Possível - unidades substituíveis em campo ououtra:

PSU com falha:

v Fonte de alimentação (90%)

v Conjunto de cabos de energia (5%)

v Placa-mãe (5%)

PSU ausente:

v Fonte de alimentação (19%)

v Placa-mãe (1%)

v Outra: Fonte de alimentação não instaladacorretamente (80%)

1097 Problema na Unidade da Fonte deAlimentação

Explicação: Uma das unidades da fonte dealimentação no nó está relatando que nenhuma energiaprincipal foi detectada.

Para o 2145-DH8, uma fonte de alimentação possuiuma condição de falha.

Resposta do Usuário:

1. Para o 2145-DH8, substitua a FRU da fonte dealimentação.

Para todos os outros modelos, conclua as etapas aseguir.

2. Assegure-se de que a fonte de alimentação estejaconectada corretamente ao nó e à UPS.

3. Se o erro não for marcado automaticamente comocorrigido após 2 minutos, observe o status dos trêsLEDs na parte traseira da fonte de alimentação.Para o 2145-CG8 ou 2145-CF8, o LED AC é o LEDverde superior. O LED DC é o LED verde do meio eo LED de erro é o LED âmbar inferior.

4. Se o LED de erro da fonte de alimentação estiverdesligado e os LEDs de energia AC e DC estiveremambos ligados, esse estado é a condição normal. Seo erro não for corrigido automaticamente após 2minutos, substitua a placa-mãe.

5. Siga a ação que é especificada para os estados deLED observados na lista a seguir.

6. Se o erro não for corrigido automaticamente após 2minutos, entre em contato com o suporte.

7. Acesse o MAP de verificação de reparo.

Erro,AC,DC:Ação

ON,ON ou OFF,ON ou OFF:A fonte de alimentaçãopossui uma falha. Substituir a fonte de alimentação.

OFF,OFF,OFF:Não foi detectada alimentação.Assegure-se de que o cabo de energia esteja conectadoao nó e à UPS. Se o LED AC não acender, verifique se aUPS está mostrando algum erro. Seguir o MAP 51502145 UPS-1U se a UPS estiver mostrando um erro; casocontrário, substitua o cabo de energia. Se o LED ACainda não acender, substitua a fonte de alimentação.

OFF,OFF,ON:A fonte de alimentação possui uma falha.Substituir a fonte de alimentação.

OFF,ON,OFF:Assegure que a fonte de alimentaçãoesteja corretamente instalada. Se o LED DC nãoacender, substitua a fonte de alimentação.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabos de energia (85%)

v Conjunto de UPS-1U (10%)

v Placa-mãe (5%)

v Para o 2145-DH8: fonte de alimentação (100%)

1098 A temperatura do gabinete passou dolimite de aviso.

Explicação: A temperatura do gabinete passou dolimite de aviso.

Resposta do Usuário: Verifique se há danos oubloqueios no fluxo de ar externo e interno.

1. Verifique a temperatura ambiente.

2. Verifique se há impedância para a corrente de ar.

FRUs de Causa Possíveis ou outra:

v Nenhuma

1099 A temperatura excedeu o limite de aviso

Explicação: A temperatura excedeu o limite de aviso.

Resposta do Usuário: Inspecione o gabinete e oambiente do gabinete.

1097 • 1099

218 SAN Volume Controller: Guia de Resolução de Problemas

Page 237: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1. Verifique a temperatura ambiente.

2. Certifique-se de que todos os componentes estãoinstalados ou que existem de preenchimento emcada compartimento.

3. Verifique se todos os ventiladores estão instalados efuncionando corretamente.

4. Busque por quaisquer obstruções para fluxo de ar,liberação adequada para entrada de ar fresco e deexaustão de ar.

5. Aguarde o componente para arrefecer.

Causa Possível - unidades substituíveis em campo ououtra:

componente de hardware (5%)

Outra:

Ambiente (95%)

1100 Uma das voltagens que é monitorada naplaca-mãe está acima do limiteconfigurado.

Explicação: Uma das voltagens que é monitorada naplaca-mãe está acima do limite configurado.

Resposta do Usuário:

1. Consulte o MAPA do sistema de diagnósticos porindicadores luminosos.

2. Se o MAPA do diagnóstico por indicadoresluminosos não resolver o problema, substitua oconjunto de quadros.

3. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

4. Acesse o MAP de verificação de reparo.

1101 Uma das voltagens que é monitorada naplaca-mãe está acima do limiteconfigurado.

Explicação: Uma das voltagens que é monitorada naplaca-mãe está acima do limite configurado.

Resposta do Usuário:

1. Consulte o MAPA do sistema de diagnósticos porindicadores luminosos.

2. Se o MAPA do sistema de diagnósticos porindicadores luminosos não resolver o problema,substitua o conjunto da placa-mãe.

3. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nó

não mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v FRUs do MAPA de diagnóstico por indicadoresluminosos (98%)

v Placa-mãe (2%)

1105 Uma das voltagens que é monitorada naplaca-mãe está abaixo do limiteconfigurado.

Explicação: Uma das voltagens que é monitorada naplaca-mãe está abaixo do limite configurado.

Resposta do Usuário:

1. Verifique as conexões de cabo.

2. Consulte o MAPA do sistema de diagnósticos porindicadores luminosos.

3. Se o MAPA do diagnóstico por indicadoresluminosos não resolver o problema, substitua oconjunto de quadros.

4. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

5. Acesse o MAP de verificação de reparo.

1106 Uma das voltagens que é monitorada naplaca-mãe está abaixo do limiteconfigurado.

Explicação: Uma das voltagens que é monitorada naplaca-mãe está abaixo do limite configurado.

Resposta do Usuário:

1. Verifique as conexões de cabo.

2. Consulte o MAPA do sistema de diagnósticos porindicadores luminosos.

3. Se o MAPA do sistema de diagnósticos porindicadores luminosos não resolver o problema,substitua o conjunto da placa-mãe.

4. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

5. Acesse o MAP de verificação de reparo.

1100 • 1106

Capítulo 7. Diagnosticando problemas 219

Page 238: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

v FRUs do MAPA de diagnóstico por indicadoresluminosos (98%)

v Placa-mãe (2%)

1107 O subsistema de bateria não temcapacidade suficiente para salvar osdados do sistema devido a múltiplasfalhas.

Explicação: Essa mensagem será uma indicação deoutros problemas a resolver antes que o sistema possarecarregar as baterias com sucesso.

Resposta do Usuário: Nenhuma ação de serviço énecessária para esse erro, mas os outros erros precisamser corrigidos. Verifique outras indicações para ver seas baterias podem ser recarregadas sem seremcolocadas em uso.

1108 Cabeamento do painel traseiro debateria com falha ou possível paineltraseiro de bateria requer substituição.

Explicação: O cabeamento com falha ou um paineltraseiro com falha está impedindo a comunicaçãointegral do sistema e o controle das baterias.

Resposta do Usuário: Verifique o cabeamento para opainel traseiro da bateria, assegurando que todos osconectores estejam acoplados adequadamente.

Quatro cabos de sinal (EPOW, LPC, PWR_SENSE &LED) e um cabo de energia (que usa 12 fios de calibregrande vermelhos e 12 pretos) estão envolvidos:

v O cabo EPOW corre para um conector de 20 pinosna frente do planar do sistema, que é a borda maispróxima dos compartimentos da unidade, perto dolado esquerdo.

Para verificar se este conector está acopladoadequadamente, é necessário remover a placadefletora de corrente de ar de plástico, que levanta.

Uma série de fios corre do mesmo conector para opainel traseiro do disco localizado à esquerda dopainel traseiro da bateria.

v O cabo LPC corre em um pequeno adaptador que éinstalado na parte traseira do planar do sistema entredois compartimentos do PCI Express. É útil removero compartimento do adaptador esquerdo ao verificarse esses conectores estão acoplados corretamente.

v O cabo PWR_SENSE corre em um conector de 24pinos atrás do planar do sistema entre as PSUs e ocompartimento do adaptador esquerdo. Verifique asconexões de ambos: um conector fêmea (para oplanar do sistema) e um conector macho (para oconector a partir da unidade da fonte de alimentaçãoda parte superior). Novamente, pode ser útil

remover o compartimento do adaptador esquerdopara verificar se esses conectores estão acopladoscorretamente.

v O cabo de energia corre no planar do sistema entreas PSUs e o compartimento do adaptador esquerdo.Ele está localizado na frente do conectorPWR_SENSE. Esse cabo tem ambos: um conectorfêmea que se conecta ao planar do sistema e umconector macho que se acopla com o conector apartir da unidade da fonte de alimentação da partesuperior. Devido ao volume desse cabo, deve-setomar cuidado para não desarranjar as conexõesPWR_SENSE ao desconectá-lo no espaço entre asPSUs e o compartimento do adaptador esquerdo.

v O cabo LED é executado em um PCB pequeno nopainel frontal. A única consequência desse cabo nãoser acoplado corretamente é que os diodos emissoresde luz não funcionam.

Se não houver nenhum problema, substitua o paineltraseiro da bateria conforme descrito na ação de serviçopara “1109”.

Você não substitui nenhuma bateria nesse momento.

Para verificar se o painel traseiro da bateria funcionaapós substituí-lo, verifique se o erro do nó estácorrigido.

FRUs de Causa Possíveis ou outra:

v Painel traseiro da bateria (50%)

1109 A bateria ou possivelmente o paineltraseiro da bateria requer substituição.

Explicação: A bateria ou possivelmente o paineltraseiro da bateria requer substituição.

Resposta do Usuário: Conclua as seguintes etapas:

1. Substitua a bateria do compartimento de unidade.

2. Verifique se o erro do nó está corrigido. Se nãoestiver, substitua o painel traseiro da bateria.

3. Para verificar se o novo painel traseiro da bateriafunciona corretamente, verifique se o erro do nóestá corrigido.

Causa Possível - unidades substituíveis em campo ououtra:

v Bateria do compartimento de unidade (95%)

v Painel traseiro da bateria (5%)

1110 A placa de gerenciamento de energiadetectou uma voltagem que está forados limites configurados.

Explicação: A placa de gerenciamento de energiadetectou uma voltagem que está fora dos limitesconfigurados.

1107 • 1110

220 SAN Volume Controller: Guia de Resolução de Problemas

Page 239: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

2145-CG8 ou 2145-CF8

v Unidade de fonte de alimentação (50%)

v Placa-mãe (50%)

1111 As baterias possuem carga insuficiente.

Explicação: A mensagem de carga insuficiente podemaparecer por várias razões, tais como a bateria estácarregando, a bateria está ausente ou falhou; há umerro de comunicação, ou ocorreu um evento detemperatura excessiva.

Resposta do Usuário: Este erro do nó pode sercorrigido pelo correção de cada um dos problemassubjacentes da bateria.

1. Se uma bateria estiver ausente, substitua a bateria.

2. Se uma bateria estiver com falha, substitua abateria.

3. Se uma bateria estiver sendo carregada, este errodeve sumir quando a bateria estiver carregada.

4. Se a bateria está tendo um erro de comunicação(erro comm), tente recolocar a bateria conformedescrito no procedimento de substituição. Se oreposicionamento da bateria não corrigir oproblema, substitua a bateria.

5. Se uma bateria estiver muito quente, o sistema podeser iniciado depois de ter arrefecido.

Inspecione a bateria para danos depois de umevento de superaquecimento.

Causa possível - unidades substituíveis em campo ououtra:

Se ambas as baterias tiverem erros, a carga da bateriapode estar em andamento. (Sem unidade substituívelem campo)

Se ambas as baterias tiverem erros que não foremresolvidos depois de um tempo suficiente para carregar,a carga da bateria pode estar danificada, como por umaunidade substituível em campo do painel traseiro dabateria com problemas.

Erros de comunicação são muitas vezes corrigíveisreposicionando-se a bateria ou permitindo que atemperatura da bateria esfrie sem a necessidade desubstituir a bateria. (Sem unidade substituível emcampo)

Se uma bateria estiver ausente ou com falha, a soluçãoé substituir a unidade substituível em campo dabateria.

Bateria (50%)

Outra:

Sem unidade substituível em campo (50%)

1112 A bateria do gabinete está ausente.

Explicação: A bateria do gabinete está ausente.

Resposta do Usuário: Instale uma bateria no slotausente. Se a bateria estiver presente no slot, recoloquea bateria.

Atenção: Não reposicione uma bateria a menos que aoutra bateria tiver carga suficiente, ou perda de dadospoderá ocorrer.

Causa Possível - unidades substituíveis em campo ououtra:

Bateria (95%)

Outra:

Não FRU (5%)

1114 gabinete 1 de falha da bateria

Explicação: gabinete 1 de falha da bateria.

Resposta do Usuário: Substitua a bateria.

Causa Possível - unidades substituíveis em campo ououtra:

Bateria (100%)

1115 Tipo 4 de falha da Bateria do gabinete

Explicação: Tipo 4 de falha da bateria do gabinete.

Resposta do Usuário: Reposicione a bateria. Substituaa bateria se o erro persistir.

Nota: Não reposicione uma bateria a menos que aoutra bateria tiver carga suficiente, ou perda de dadospoderá ocorrer.Causa Possível - unidades substituíveis em campo ououtra:

Bateria (95%)

1111 • 1115

Capítulo 7. Diagnosticando problemas 221

Page 240: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Outra:

conexão inválida (5%)

1120 Um adaptador SAS de alta velocidadeestá ausente

Explicação: Este nó detectou que um adaptador SASde alta velocidade que foi previamente instalado nãoestá mais presente.

Resposta do Usuário: Se o adaptador SAS de altavelocidade tiver sido intencionalmente removido,marque o erro como “corrigido.”

Caso contrário, o adaptador SAS de alta velocidadefalhou e deve ser substituído. Na sequência mostrada,troque os FRUs por FRUs novos.

Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

1. Adaptador SAS de alta velocidade (90%)

2. Placa-mãe (10%)

1121 Um adaptador SAS de alta velocidadefalhou.

Explicação: Uma falha foi detectada em um adaptadorSAS de alta velocidade.

Resposta do Usuário: Na sequência mostrada, troqueos FRUs por FRUs novos.

Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

1. Adaptador SAS de alta velocidade (90%)

2. Placa-mãe (10%)

1122 Ocorreu um erro do adaptador SAS dealta velocidade.

Explicação: O adaptador SAS de alta velocidadedetectou um erro de barramento PCI e requer serviçoantes de poder ser reiniciado. A falha do adaptadorSAS de alta velocidade fez com que todas as unidadesflash que estavam sendo acessadas por meio desseadaptador para desligar.

Resposta do Usuário: Se esta for a primeira vez queeste erro ocorreu neste nó, conclua as seguintes etapas:

1. Desligue o nó.

2. Reposicione o adaptador SAS de alta velocidade.

3. Ligue o nó.

4. Envie a tarefa lsmdisk e assegure que todas asunidade flash discos gerenciados que estãolocalizados neste nó possuem um status de On-line.

Se a sequência de ações acima não resolver o problemaou o erro ocorrer novamente no mesmo nó, conclua asseguintes etapas:

1. Na sequência mostrada, troque os FRUs por FRUsnovos.

2. Envie a tarefa lsmdisk e assegure que todas asunidade flash discos gerenciados que estãolocalizados neste nó possuem um status de On-line.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

1. Adaptador SAS de alta velocidade (90%)

2. Placa-mãe (10%)

1124 Tipo 1 de falha da Unidade de Fonte deAlimentação

Explicação: Uma falha foi detectada em uma unidadede fonte de alimentação (PSU).

Resposta do Usuário: Substitua a PSU.

Atenção: Para evitar a perda de dados e de estado donó, use o comando satask startservice para colocar onó no estado de serviço para que ele não processe maisE/S. Em seguida, é possível remover e substituir aunidade de fonte de alimentação superior (PSU 2). Essaprecaução é devido a uma limitação na configuração dafonte de alimentação. Depois que a ação de serviçoestiver concluída, execute o comando sataskstopservice para permitir que o nó se una novamenteao sistema.

Causa Possível - unidades substituíveis em campo ououtra:

PSU (100%)

1125 Tipo 1 de falha da Unidade de Fonte deAlimentação

Explicação: A unidade de fonte de alimentação (PSU)não é suportada.

Resposta do Usuário: Substitua a PSU com umaversão suportada.

Atenção: Para evitar a perda de dados e de estado donó, use o comando satask startservice para colocar onó no estado de serviço para que ele não processe maisE/S. Em seguida, é possível remover e substituir aunidade de fonte de alimentação superior (PSU 2). Essaprecaução é devido a uma limitação na configuração dafonte de alimentação. Depois que a ação de serviçoestiver concluída, execute o comando sataskstopservice para permitir que o nó se una novamenteao sistema.

1120 • 1125

222 SAN Volume Controller: Guia de Resolução de Problemas

Page 241: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

PSU (100%)

1126 Tipo 2 de falha da Unidade de Fonte deAlimentação

Explicação: Existe uma falha na unidade de fonte dealimentação (PSU).

Resposta do Usuário:

1. Recoloque a PSU no gabinete.

Atenção: Para evitar a perda de dados e de estadodo nó, use o comando satask startservice paracolocar o nó no estado de serviço para que ele nãoprocesse mais E/S. Em seguida, é possível removere substituir a unidade de fonte de alimentaçãosuperior (PSU 2). Essa precaução é devido a umalimitação na configuração da fonte de alimentação.Depois que a ação de serviço estiver concluída,execute o comando satask stopservice parapermitir que o nó se una novamente ao sistema.

2. Se a falha não for resolvida, substitua a PSU.

Causa Possível - unidades substituíveis em campo ououtra:

1. Nenhuma Parte (30%)

2. PSU (70%)

1128 A Unidade de Fonte de Alimentaçãoestá ausente

Explicação: A unidade de fonte de alimentação (PSU)não está encaixada no gabinete ou nenhuma PSU estáinstalada.

Resposta do Usuário:

1. Se a PSU não estiver instalado, instale um PSU.

2. Se a PSU estiver instalada, recoloque-a PSU nogabinete.

Atenção: Para evitar a perda de dados e de estado donó, use o comando satask startservice para colocar onó no estado de serviço para que ele não processe maisE/S. Em seguida, é possível remover e substituir aunidade de fonte de alimentação superior (PSU 2). Essaprecaução é devido a uma limitação na configuração dafonte de alimentação. Depois que a ação de serviçoestiver concluída, execute o comando sataskstopservice para permitir que o nó se una novamenteao sistema.

Causa Possível - unidades substituíveis em campo ououtra:

1. Nenhuma Parte (5%)

2. PSU (95%)

Recoloque a unidade de fonte de alimentação nogabinete.

Causa Possível - unidades substituíveis em campo ououtra:

fonte de alimentação (100%)

1129 A bateria do nó está ausente.

Explicação: Instale novas baterias para permitir ao nóse unir a um sistema em cluster.

Resposta do Usuário: Instale uma bateria no slot debateria 1 (à esquerda na frente) e no slot de bateria 2 (àdireita). Deixe o nó operando enquanto inclui asbaterias.

Alinhe cada bateria de modo que os trilhos da guia nogabinete se encaixem nos slots do trilho da guia nabateria. Empurre a bateria firmemente para dentro docompartimento da bateria até que pare. O came nafrente da bateria permanece fechado durante essainstalação.

Para verificar se a nova bateria funciona corretamente,verifique se o erro do nó está corrigido. Após o nó seunir a um sistema em cluster, use o comandolsnodebattery para visualizar informações sobre abateria.

FRUs de Causa Possíveis ou outra:

v Bateria (100%)

1130 A bateria do nó requer substituição.

Explicação: Quando uma bateria precisar sersubstituída, você receberá essa mensagem. A respostaadequada é para instalar novas baterias.

Resposta do Usuário: A bateria 1 está à esquerda (nafrente) e a bateria 2 está à direita. Remova a bateriaantiga desencaixando e puxando para baixo a alça docame para elevar a bateria o suficiente para puxar abateria do gabinete.

Este procedimento de serviço é recomendado para umabateria com falha ou offline. Para evitar a perda dedados de uma bateria que esteja online, executesvctask chnodebattery-remove-battery battery_IDnode_ID. Executando o comando quando for seguroremover a bateria.

Instale novas baterias no slot de bateria 1 e 2. Deixe onó executando enquanto inclui as baterias.

Alinhe cada bateria de modo que os trilhos da guia nogabinete se encaixem nos slots do trilho da guia nabateria. Empurre a bateria firmemente para dentro docompartimento da bateria até que pare. O came nafrente da bateria permanece fechado durante essainstalação.

Para verificar se a nova bateria funciona corretamente,verifique se o erro do nó está corrigido. Após o nó se

1126 • 1130

Capítulo 7. Diagnosticando problemas 223

Page 242: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

unir a um sistema em cluster, use o comandolsnodebattery para visualizar informações sobre abateria.

1131 Condicionamento da bateria énecessário, mas não é possível.

Explicação: Condicionamento da bateria é necessário,mas não é possível.

Uma causa possível desse erro é que orecondicionamento da bateria não pode ocorrer em umnó em cluster se o nó do parceiro não estiver online.

Resposta do Usuário: Este erro pode ser corrigido emseu próprio. Para se o nó do parceiro ficar online, orecondicionamento é iniciado.

Causa Possível - unidades substituíveis em campo ououtra:

Outra:

Aguarde ou endereço de outros erros.

1133 Um WWNN duplicado foi detectado.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 556.Consulte os detalhes de erro de nó 556 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 556.

1135 O limite de temperatura ambiente doUPS foi excedido

Explicação: A UPS do sistema relatou um ambienteacima da temperatura. A UPS é alternada para o modoBypass para ser resfriada.

Resposta do Usuário:

1. Desligue os nós que estão conectados à UPS.

2. Desligue a UPS e, em seguida, desconecte a UPS dafonte de alimentação principal

3. Assegure-se de que as ventilações de ar da UPS nãoestejam obstruídas.

4. Assegure-se de que o fluxo de ar em torno da UPSnão está restrito.

5. Aguarde pelo menos cinco minutos e, em seguida,reinicie a UPS. Se o problema permanecer, verifiquea temperatura ambiente. Corrija o problema. Casocontrário, troque a FRU por uma nova FRU.

6. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema com a UPS.

7. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Unidade eletroeletrônica do 2145 UPS (50%)

Outra:

A temperatura ambiente do sistema está fora daespecificação (50%)

1136 O limite de temperatura ambiente doUPS foi excedido

Explicação: A UPS do sistema relatou um ambienteacima da temperatura.

Resposta do Usuário:

1. Desligue o nó conectado à UPS.

2. Desligue a UPS e, em seguida, desconecte a UPS dafonte de alimentação principal

3. Assegure-se de que as ventilações de ar da UPS nãoestejam obstruídas.

4. Assegure-se de que o fluxo de ar em torno da UPSnão está restrito.

5. Aguarde pelo menos cinco minutos e, em seguida,reinicie a UPS. Se o problema permanecer, verifiquea temperatura ambiente. Corrija o problema. Casocontrário, troque a FRU por uma nova FRU.

6. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

7. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto do 2145 UPS-1U (50%)

Outra:

A temperatura ambiente do sistema está fora daespecificação (50%)

1138 energia de entrada da unidade de fontede alimentação com falha.

Explicação: Energia de entrada da Unidade da Fontede Alimentação com falha.

Resposta do Usuário: Verifique o cabo de alimentação.

1. Verifique se o cabo de alimentação está conectado.

2. Verifique se a energia muro é bom.

3. Substitua o cabo de energia.

4. Substitua a unidade de fonte de alimentação.

1131 • 1138

224 SAN Volume Controller: Guia de Resolução de Problemas

Page 243: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

cabo de alimentação (20%)

PSU (5%)

Outra:

Não FRU (75%)

1140 Falha de energia de entrada CA do UPS

Explicação: A UPS relatou que tem um problema coma energia de corrente alternada de entrada.

Resposta do Usuário:

1. Verifique a energia AC de entrada, esteja ela ausenteou fora da especificação. Corrija se necessário. Casocontrário, troque a FRU por uma nova FRU.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Cabo de energia de entrada da UPS (10%)

v Conjunto eletroeletrônico (10%)

Outra:

v A energia AC de entrada está ausente (40%)

v A energia AC de entrada não está na especificação(40%)

1141 Falha de energia de entrada CA do UPS

Explicação: A UPS relatou que tem um problema coma energia de corrente alternada de entrada.

Resposta do Usuário:

1. Verifique a energia AC de entrada, esteja ela ausenteou fora da especificação. Corrija se necessário. Casocontrário, troque a FRU por uma nova FRU.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Cabo de energia de entrada da UPS (10%)

v Conjunto da UPS (10%)

Outra:

v A energia AC de entrada está ausente (40%)

v A energia AC de entrada não está na especificação(40%)

1145 Falha na comunicação do UPS

Explicação: A conexão de sinal entre o sistema e suaUPS está falhando.

Resposta do Usuário:

1. Se outros nós que estão usando essa UPS estiveremrelatando esse erro, troque a UPS por uma nova.

2. Se somente este nó estiver relatando o problema,verifique o cabo de sinal e troque as FRUs porFRUs novas na sequência mostrada.

3. Verifique o status do nó:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar a esta etapa, entre em contatocom o centro de suporte para resolver oproblema.

4. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

2145-CF8 ou 2145-CG8

N/D

1146 Falha na comunicação do UPS

Explicação: A conexão de sinal entre um nó e seu UPSestá com falha.

Resposta do Usuário:

1. Na sequência mostrada no log, substitua qualquerFRU com falha com novos FRUs.

2. Verifique o nó do status:

v Se todos os nós mostrarem um status de on-line,marque o erro como corrigido.

v Se algum nó não mostrar um status de on-line,acesse o MAPA de início.

v Se você retornar para esta etapa, entre em contatocom o centro de suporte para resolver o problemacom o nó.

3. Acesse o MAP de verificação de reparo.

Causa possível, FRUs ou outro:

1140 • 1146

Capítulo 7. Diagnosticando problemas 225

Page 244: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2145-CF8 ou 2145-CG8

v Conjunto de cabos de energia (40%)

v Conjunto do 2145 UPS-1U (30%)

v Placa-mãe (30%)

1150 Erro de configuração do UPS

Explicação: Os dados que o sistema recebeu da UPSsugerem que o cabo de energia da UPS, o cabo de sinalou ambos, não estão conectados corretamente.

Resposta do Usuário:

1. Conecte os cabos corretamente. Consulte o guia deinstalação do produto.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Erro de configuração

1151 Erro de configuração do UPS

Explicação: Os dados que o sistema recebeu da UPSsugerem que o cabo de energia da UPS, o cabo de sinalou ambos, não estão conectados corretamente.

Resposta do Usuário:

1. Conecte os cabos corretamente. Consulte seu guiade instalação do produto.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Erro de configuração

1152 Erro de configuração do UPS

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 587.Consulte os detalhes de erro de nó 587 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 587.

1155 Ocorreu um erro de domínio de energia.

Explicação: Ambos os 2145s de um par sãoalimentados pela mesma fonte de alimentaçãoininterrupta.

Resposta do Usuário:

1. Liste os 2145s do cluster e verifique se os 2145s nomesmo grupo de E/S são conectados a uma fontede alimentação ininterrupta diferente.

2. Conecte um dos 2145s conforme identificado naetapa 1 a uma fonte de alimentação ininterruptadiferente.

3. Marque o erro que você acabou de reparar como“corrigido”.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Erro de configuração

1160 Sobrecorrente de saída do UPS

Explicação: A UPS relata que muita energia está sendoextraída dela. O LED de aviso de sobrecarga deenergia, que está acima dos indicadores de nível decarga na UPS, será aceso.

Resposta do Usuário:

1. Determine a UPS que está relatando o erro a partirdos dados do evento de erro. Execute as seguintesetapas apenas nesta UPS.

2. Verifique se a UPS ainda está relatando o erro. Se oLED de aviso de sobrecarga de energia não estivermais ativo, acesse a etapa 6.

3. Assegure-se de que somente os sistemasapropriados estejam recebendo energia da UPS.Assegure-se de que não haja comutadores oucontroladores de disco conectados à UPS.

4. Remova cada energia de entrada conectada, umapor vez, até que a sobrecarga de saída sejaremovida.

5. Troque as FRUs por novas FRUs na sequênciamostrada, no sistema sobrecorrente.

6. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nó

1150 • 1160

226 SAN Volume Controller: Guia de Resolução de Problemas

Page 245: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

não mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

7. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabos de energia (50%)

v Conjunto da fonte de alimentação (40%)

v Conjunto eletroeletrônico da UPS (10%)

1161 Sobrecorrente de saída do UPS

Explicação: A carga de saída na UPS excede asespecificações, conforme relatado pelos bits de alarmeda UPS.

Resposta do Usuário:

1. Assegure-se de que somente os sistemasapropriados estejam recebendo energia da UPS.Além disso, assegure-se de que nenhum outrodispositivo esteja conectado à UPS.

2. Troque, na sequência mostrada, as FRUs por FRUsnovas. Se o Indicador de Sobrecarga ainda estiveraceso, com todas as saídas desconectadas, substituaa UPS.

3. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabos de energia (50%)

v Conjunto da fonte de alimentação (40%)

v Conjunto da UPS (10%)

1165 Carga de saída do UPS alta

Explicação: A carga de saída da UPS estáinesperadamente alta. Possivelmente, a saída da UPSestá conectada a um dispositivo extra incompatível.

Resposta do Usuário:

1. Assegure-se de que somente os sistemasapropriados estejam recebendo energia da UPS.Assegure-se de que não haja comutadores oucontroladores de disco conectados à UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “online”, o problema não existe mais.Marque o erro que acabou de ser reparado como“corrigido” e acesse o MAP de verificação dereparo.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Nenhuma

Outra:

v Erro de configuração

1166 Carga de saída do UPS alta

Explicação: Possivelmente, a saída da fonte dealimentação ininterrupta está conectada a umdispositivo incompatível.

Resposta do Usuário:

1. Assegure-se de que não haja outros dispositivos queestejam conectados à UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com o 2145 UPS-1U.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto da UPS (5%)

Outra:

v Erro de configuração (95%)

1170 Falha eletroeletrônica do UPS

Explicação: Falha eletrônica da UPS, relatada pelosbits de alarme da UPS.

Resposta do Usuário:

1. Substitua o conjunto eletroeletrônico da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto eletroeletrônico da UPS (100%)

1161 • 1170

Capítulo 7. Diagnosticando problemas 227

Page 246: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1171 Falha eletroeletrônica do UPS

Explicação: Falha eletrônica da UPS, relatada pelosbits de alarme da UPS.

Resposta do Usuário:

1. Substitua o conjunto da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto da UPS (100%)

1175 Ocorreu um problema com a falha doquadro da fonte de alimentaçãoininterrupta (relatada pelos bits dealarme da fonte de alimentaçãoininterrupta).

Explicação: Ocorreu um problema com a falha doquadro da fonte de alimentação ininterrupta (relatadapelos bits de alarme da fonte de alimentaçãoininterrupta).

Resposta do Usuário:

1. Substitua o conjunto da fonte de alimentaçãoininterrupta.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto da fonte de alimentação ininterrupta (100%)

1179 unidades em excesso conectadas aosistema.

Explicação: O cluster suporta somente um númerofixo de unidades. Uma unidade foi incluída que torna onúmero de unidades maior que o número total deunidades suportadas por cluster.

Resposta do Usuário:

1. Desconecte quaisquer gabinetes não gerenciadosexcessiva do sistema.

2. Removendo a gerenciar quaisquer unidades off-lineque não estão presentes no sistema.

3. Identifique unidades não utilizadas e removê-losdos gabinetes.

4. Identifique as matrizes de unidades que não sãomais necessárias.

5. Remova as matrizes e remover as unidades dogabinete, se estiverem presentes.

6. Quando houver menos de 1056 unidades nosistema, considere a capacidade do sistema dereengenharia para migrar dados de matrizesmatrizes pequenas, grandes, em seguida,removendo a matrizes pequenas e as unidades quelhes formado. Considere a necessidade para umsistema adicional Storwize em sua solução SAN.

1180 Falha de bateria do UPS

Explicação: Falha da bateria da UPS, relatada pelosbits de alarme da UPS.

Resposta do Usuário:

1. Substitua o conjunto das baterias da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto de baterias da UPS (100%)

1181 Falha de bateria do UPS

Explicação: Falha da bateria da UPS, relatada pelosbits de alarme da UPS.

Resposta do Usuário:

1. Substitua o conjunto das baterias da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto de baterias da UPS (100%)

1171 • 1181

228 SAN Volume Controller: Guia de Resolução de Problemas

Page 247: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1182 Temperatura ambiente muito altadurante inicialização do sistema

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 528.Consulte os detalhes de erro de nó 528 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 528.

1183 A configuração de hardware dos nós nãoatende aos requisitos mínimos.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 562.Consulte os detalhes de erro de nó 562 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 562.

1185 Falha do UPS

Explicação: Falha da UPS, sem unidade específicaidentificada, relatada pelos bits de alarme da UPS.

Resposta do Usuário:

1. Na sequência mostrada, troque as FRU por novasFRU.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto eletroeletrônico do 2145 UPS (60%)

v Conjunto de baterias do 2145 UPS (20%)

v Conjunto do 2145 UPS (20%)

1186 Falha do UPS

Explicação: Ocorreu um problema na UPS, sem FRUespecífica identificada, conforme relatado pelos bits dealarme da UPS.

Resposta do Usuário:

1. Na sequência mostrada, troque as FRU por novasFRU.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto da UPS (100%)

1187 O software do nó está inconsistente oudanificado

Explicação: O cluster está relatando que um nó nãoestá operacional por causa dos erros do nó críticos 523,573 e 574. Consulte os detalhes dos erros do nó 523,573 e 574 para obter mais informações.

Resposta do Usuário: Consulte os erros do nó 523, 573e 574.

1188 Ocorreram muitos travamentos desoftware.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 564.Consulte os detalhes de erro de nó 564 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 564.

1189 O nó é mantido no estado de serviço.

Explicação: O cluster está relatando que um nó nãoestá operacional por causa do erro de nó crítico 690.Consulte os detalhes de erro de nó 690 para obterinformações adicionais.

Resposta do Usuário: Consulte o erro de nó 690.

1190 Bateria do UPS no fim da vida útil

Explicação: A bateria da UPS atingiu seu término devida.

Resposta do Usuário:

1. Substitua o conjunto das baterias da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o centro de suporte para resolver oproblema.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto de baterias da UPS (100%)

1182 • 1190

Capítulo 7. Diagnosticando problemas 229

Page 248: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1191 Bateria do UPS no fim da vida útil

Explicação: A bateria da UPS atingiu seu término devida.

Resposta do Usuário:

1. Substitua o conjunto das baterias da UPS.

2. Verifique o status do nó. Se todos os nós mostraremum status de “on-line”, marque o erro que vocêacabou de corrigir como “corrigido”. Se qualquer nónão mostrar um status de “on-line”, acesse o iniciarMAP. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com fonte de alimentação ininterrupta.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

Conjunto de baterias da UPS (100%)

1192 Erro de nó inesperado

Explicação: Um nó está ausente do cluster. O erro queele está relatando não é reconhecido pelo sistema.

Resposta do Usuário: Localize o nó que está noestado de serviço e utilize o assistente de serviço paradeterminar por que ele não está ativo.

1193 Carga insuficiente da fonte dealimentação ininterrupta

Explicação: O cluster está relatando que um nó nãoestá operacional devido ao erro do nó crítico 587,indicando que um tipo incorreto de UPS foi instalado.

Resposta do Usuário: Troque o UPS por um do tipocorreto.

1194 A recuperação automática de nó off-linefalhou.

Explicação: O cluster tem um nó off-line e determinouque um dos nós candidatos corresponde àscaracterísticas do nó off-line. O cluster tentou masfalhou ao incluir o nó de volta no cluster. O clustertentou mas parou de tentar incluir automaticamente onó de volta no cluster.

Se um nó tiver dados de estado incompletos, elepermanecerá off-line após seu início. Isso ocorrerá se onó tiver uma perda de energia ou uma falha dehardware que impediu de concluir a gravação de todosos dados de estado no disco. O nó relata um erro de nó578 quando está nesse estado.

Se tiverem sido feitas três tentativas de incluirautomaticamente um nó candidato correspondente emum cluster, mas o nó não tiver retornado ao estadoon-line por 24 horas, o cluster para de tentar incluirautomaticamente o nó e registra o código de erro 1194

“Falha de recuperação automática do nó off-line”.

Dois cenários possíveis quando este evento de erro éregistrado são:

1. O nó falhou sem salvar todos os seus dados deestado. O nó foi reiniciado, possivelmente depois deum reparo, e mostra o erro de nó 578 e é um nó decandidato para junção do cluster. O cluster tentaincluir o nó no cluster mas não é bem-sucedido.Depois de 15 minutos, o cluster faz uma segundatentativa de incluir o nó no cluster e novamente nãoobtém êxito. Depois de 15 minutos, o cluster fazuma terceira tentativa de incluir o nó no cluster enovamente não obtém êxito. Após outros 15minutos, o cluster registra o código de erro 1194. Onó nunca ficou on-line durante a tentativa deincluí-lo no cluster.

2. O nó falhou sem salvar todos os seus dados deestado. O nó foi reiniciado, possivelmente depois deum reparo, e mostra o erro de nó 578 e é um nó decandidato para junção do cluster. O cluster tentaincluir o nó no cluster e é bem-sucedido, e o nó ficaon-line. Dentro de 24 horas, o nó falha novamentesem salvar seus dados de estado. O nó reinicia emostra o erro de nó 578 e é um nó candidato parajunção do cluster. O cluster novamente tenta incluiro nó no cluster, é bem-sucedido e o nó se tornaon-line. No entanto, o nó falha novamente dentrodo período de 24 horas. O cluster novamente tentauma terceira vez incluir o nó no cluster, ébem-sucedido e o nó se torna on-line. No entanto, onó falha novamente dentro do período de 24 horas.Após outros 15 minutos, o cluster registra o códigode erro 1194.

Uma combinação destes cenários também é possível.

Nota: Se o nó for removido manualmente do cluster, acontagem de tentativas de recuperação automática éreconfigurada para zero.

Resposta do Usuário:

1. Se o nó ficou continuamente on-line no cluster pormais de 24 horas, marque o erro como corrigido eacesse o MAP de Verificação de Reparo.

2. Determine o histórico de eventos para este nólocalizando eventos para este nome de nó no log deeventos. Observe que o ID do nó será alterado,assim corresponda o WWNN com o nome do nó.Além disso, verifique os registros de serviço.Especificamente, observe as entradas indicando umde três eventos: 1) o nó está ausente do cluster (errode cluster 1195 evento 009052), 2) uma tentativa derecuperar automaticamente o nó off-line estáiniciando (evento 980352), 3) o nó foi incluído nocluster (evento 980349).

3. Se o nó não tiver sido incluído no cluster desde oinício do processo de recuperação, provavelmentehá um problema de hardware. O disco interno donó pode estar falhando de uma maneira em que

1191 • 1194

230 SAN Volume Controller: Guia de Resolução de Problemas

Page 249: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

não é possível modificar seu nível de software paracorresponder ao nível de software do cluster. Seainda não tiver determinado a causa-raiz doproblema, é possível tentar remover manualmente onó a partir do cluster e incluir o nó de volta nocluster. Monitore continuamente o status dos nós nocluster enquanto o cluster está tentando incluir onó. Nota: Se o tipo de nó não for suportado pelaversão do software do cluster, o nó não aparecerácomo um nó candidato. Portanto, o hardwareincompatível não é uma causa-raiz potencial desseerro.

4. Se o nó tiver sido incluído no cluster, mas falhounovamente antes dele ter ficado on-line por 24horas, investigue a causa-raiz da falha. Se nenhumevento no log de eventos indicar a razão da falhado nó, colete dumps e entre em contato com osuporte técnico IBM para obter assistência.

5. Quando tiver corrigido o problema com o nó, vocêdeve utilizar o console do cluster ou a interface dalinha de comandos para remover manualmente o nódo cluster e incluir o nó no cluster.

6. Marque o erro como corrigido e acesse o MAP deverificação.

Causa Possível - unidades substituíveis em campo ououtra:

Nenhuma, embora a investigação possa indicar umafalha de hardware.

1195 Nó ausente.

Explicação: É possível resolver esse problemareparando a falha no 3700 ausente.

Resposta do Usuário:

1. Se não for óbvio qual nó no cluster falhou, verifiqueo status dos nós e localize o 3700 com um statusoffline.

2. Acesse o MAP de Início e execute o reparo no nócom falha.

3. Quando o reparo for concluído, esse erro seráautomaticamente marcado como corrigido.

4. Verifique o status do nó. Se todos os nós mostraremum status “on-line”, mas o erro no log não tiversido marcado como corrigido, marque o erromanualmente que você acabou de reparar como“corrigido”. Se qualquer nó não mostrar um statusde “on-line”, acesse o iniciar MAP. Se você retornarpara essa etapa, entre em contato com o seu centrode suporte para resolver o problema com o 3700.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1198 O hardware detectado não é umaconfiguração válida.

Explicação: Foi feita uma mudança de hardware nessenó que não é suportada por seu software. Umcomponente de hardware falhou ou o upgrade do nófoi feito incorretamente.

Resposta do Usuário: Conclua as seguintes etapas:

1. Se necessáro, desligue o nó para manutenção.

2. Se o novo hardware estiver instalado corretamente,mas estiver listado como uma configuraçãoinválida, atualize o software para um nível quesuporte o novo hardware. Use a GUI degerenciamento para instalar esse nível se necessário.

3. Se você fez upgrade do software para fazer ohardware funcionar, há um novo evento após oupgrade solicitando para ativar o novo hardware.

FRUs de Causa Possíveis ou outra:

v Nenhuma

1200 A configuração não é válida. Muitosdispositivos MDisks ou destinosestavam presentes no sistema.

Explicação: A configuração não é válida. Muitosdispositivos MDisks ou destinos estavam presentes nosistema.

Resposta do Usuário:

1. Remova os dispositivos indesejados da malha derede Fibre Channel.

2. Inicie uma operação de descoberta de cluster paralocalizar dispositivos/discos por meio da reanáliseda rede Fibre Channel.

3. Lista todos os discos gerenciados conectados.Verifique com o cliente se a configuração está deacordo com o esperado. Marque o erro que vocêacabou de reparar como corrigido.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha da malha de rede Fibre Channel (100%)

1201 Uma unidade de atualização requer umarecuperação.

Explicação: A unidade flas identificada por este erroprecisa ser redescoberta.

Resposta do Usuário: Para recuperar essa unidadeflash, envie o seguinte comando: chdrive -taskrecover drive_id em que drive_id é a identidade da

1195 • 1201

Capítulo 7. Diagnosticando problemas 231

Page 250: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

unidade que precisa ser recuperada.

1202 Uma unidade flash está ausente daconfiguração.

Explicação: A unidade flash off-line identificada poreste erro deve ser reparada.

Resposta do Usuário: Na GUI de gerenciamento,clique em Resolução de Problemas > AçõesRecomendadas para executar a ação recomendada paraesse erro. Caso contrário, use MAP 6000 para substituira unidade.

1203 Uma duplicata de quadro Fibre Channelfoi recebida.

Explicação: Uma duplicata de quadro Fibre Channelnunca deve ser detectada. O recebimento de umaduplicata de quadro Fibre Channel indica que há umproblema com a malha Fibre Channel. Outros errosrelacionados à malha Fibre Channel podem ser gerados.

Resposta do Usuário:

1. Utilize os WWPNs de transmissão e recebimentoindicados nos dados de erro para determinar aseção da malha Fibre Channel que gerou o quadroduplicado. Procure pela causa do problemautilizando as ferramentas de monitoramento demalha. O quadro duplicado pode ser causado porum erro de design na topologia da malha, por umerro de configuração ou por uma falha de softwareou hardware em um dos componentes da malhaFibre Channel, incluindo links intercomutadores.

2. Quando estiver satisfeito com a correção doproblema, marque o erro que você acabou dereparar como “corrigido”.

3. Acesse MAP 5700: Verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabo Fibre Channel (1%)

v Adaptador Fibre Channel (1%)

Outra:

v Falha da malha de rede Fibre Channel (98%)

1210 Uma porta Fibre Channel local foiexcluída.

Explicação: Uma porta Fibre Channel local foiexcluída.

Resposta do Usuário:

1. Falhas de reparo na ordem mostrada.

2. Verifique o status dos controladores de disco. Setodas as controladoras de disco mostrarem umstatus “bom”, marque o erro que você acabou dereparar como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto de cabo Fibre Channel (75%)

v Conector SFP (Small Form-factor Pluggable) (10%)

v Adaptador Fibre Channel (5%)

Outra:

v Falha da malha de rede Fibre Channel (10%)

1212 A fonte de alimentação excedeu o limitede temperatura.

Explicação: A fonte de alimentação excedeu o limitede temperatura.

Resposta do Usuário: Conclua as seguintes etapas:

1. Verifique o fluxo de ar. Remova a parte superior dacaixa de máquina e verifique se há placas defletorasausentes ou bloqueios internos.

2. Se o problema persistir, substitua a fonte dealimentação.

Causa Possível - unidades substituíveis em campo ououtra:

v Fonte de alimentação

1213 Unidade de inicialização ausente, forade sincronização, ou com falha.

Explicação: Unidade de inicialização ausente, fora desincronização, ou com falha.

Resposta do Usuário: Conclua as seguintes etapas:

1. Veja a visualização da unidade de inicialização paradeterminar unidade ausente, com falha ou fora desincronização.

2. Insira uma unidade ausente.

3. Substitua uma unidade com falha.

4. Sincronizar uma unidade fora de sincronizaçãoexecutando os comandos svctask chnodebootdrive-sync e/ou satask chbootdrive -sync.

Causa Possível - unidades substituíveis em campo ououtra:

v Unidade de sistema

1214 A unidade de inicialização está no sloterrado.

Explicação: A unidade de inicialização está no sloterrado.

Resposta do Usuário: Conclua as seguintes etapas:

1. Examine uma visualização da unidade deinicialização para determinar qual unidade está noslot errado, a qual nó e slot ela pertence e qualunidade deve estar nesse slot.

1202 • 1214

232 SAN Volume Controller: Guia de Resolução de Problemas

Page 251: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Troque a unidade para o correto, mas encerre o nóprimeiro se booted yes for mostrado para essaunidade na visualização da unidade deinicialização.

3. Se desejar usar a unidade nesse nó, sincronize asunidades de inicialização executando os comandossvctask chnodebootdrive -sync e/ou sataskchbootdrive -sync.

4. O erro do nó é removido, ou um novo erro do nó éexibido para você trabalhar.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1215 Uma unidade flash está falhando.

Explicação: A unidade de atualização detectou falhasque indicam que a unidade provavelmente falhará embreve. A unidade deve ser substituída. O log deeventos do cluster identificará um ID de unidade paraa unidade flash que causou o erro.

Resposta do Usuário: Na GUI de gerenciamento,clique em Resolução de Problemas > AçõesRecomendadas para executar a ação recomendada paraesse erro. Se isso não resolver o problema, entre emcontato com seu próximo nível de suporte.

1216 Os erros SAS excederam os limites.

Explicação: O cluster experimentou um grandenúmero de erros de comunicação SAS, que indica umcomponente SAS com falha que deve ser substituído.

Resposta do Usuário: Na sequência mostrada, troqueos FRUs por FRUs novos.

Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

1. Cabo SAS (70%)

2. Adaptador SAS de alta velocidade (20%)

3. Painel traseiro da unidade SAS (5%)

4. unidade flash (5%)

1217 Uma unidade flash excedeu o limite deaviso de temperatura.

Explicação: A unidade de atualização identificada poreste erro relatou que sua temperatura é maior que olimite de aviso.

Resposta do Usuário: Execute as etapas para reduzir atemperatura da unidade.

1. Determine a temperatura da sala e a reduza se estaação for adequada.

2. Substitua todos os ventiladores com falha.

3. Assegure que não haja obstruções ao fluxo de arpara o nó.

4. Marque o erro como corrigido. Se o erro ocorrernovamente, entre em contato com o suporte dehardware para investigação adicional.

Causa Possível - unidades substituíveis em campo ououtra:

v unidade de Flash (10%)

Outra:

v Ambiente de sistema ou bloqueio da corrente de ar(90%)

1220 Uma porta Fibre Channel remota foiexcluída.

Explicação: Uma porta Fibre Channel remota foiexcluída.

Resposta do Usuário:

1. Visualize o log de eventos. Observe o ID do MDiskassociado ao código de erro.

2. A partir do MDisk, determine o ID da controladorade disco com falha.

3. Consulte a documentação de serviço para acontroladora de disco e a rede Fibre Channel pararesolver o problema relatado.

4. Após a unidade de disco ser reparada, inicie umaoperação de descoberta de cluster para recuperar aporta Fibre Channel excluída por meio de um novoexame da rede Fibre Channel.

5. Para restaurar o status on-line do MDisk, inclua odisco gerenciado que você anotou na etapa 1.

6. Verifique o status das controladoras de disco. Setodas as controladoras de disco mostrarem umstatus “bom”, marque o erro que você acabou dereparar como “corrigido”.

7. Se todas as controladoras de disco não mostraremum status bom, entre em contato com seu centro desuporte para resolver o problema com acontroladora de disco.

8. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha do gabinete/controladora (50%)

v Malha de rede Fibre Channel (50%)

1215 • 1220

Capítulo 7. Diagnosticando problemas 233

Page 252: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1230 Um login foi excluído.

Explicação: Uma porta para conexão de malha daporta ou login, entre o nó do cluster e umacontroladora ou outro cluster tinha erros em excesso. Ologin foi excluído e não será usado para operações deE/S.

Resposta do Usuário: Determine o sistema remoto,que pode ser um controlador ou um cluster. Verifique olog de eventos para outros erros 1230. Assegure quetodos os erros de alta prioridade sejam corrigidos.

Este evento de erro é geralmente causado por umproblema de malha. Se possível, utilize o comutador demalha ou outras ferramentas de diagnóstico de malhapara determinar qual link ou porta está relatando oserros. Se houver eventos de erro para links a partirdeste nó para um número de controladores ou clustersdiferentes, então ele é provavelmente o nó para o linkdo comutador que está causando os erros. A menos quehaja outras indicações contrárias, primeiro substitua ocabo entre o comutador e o sistema remoto.

1. A partir da análise da malha, determine a FRU quemais provavelmente esteja causando o erro. Se estaFRU tiver sido substituída recentemente naresolução de um erro 1230, escolha a próxima FRUmais provável que não tenha sido substituídarecentemente. Troque a FRU por uma nova FRU.

2. Marque o erro como corrigido. Se a substituição daFRU não tiver corrigido o problema, o erro seráregistrada novamente. No entanto, dependendo dagravidade do problema, o erro pode não serregistrado novamente imediatamente.

3. Inicie uma operação de descoberta de cluster pararecuperar o login pela reanálise da rede FibreChannel.

4. Verifique o status do controladora de disco oucluster remoto. Se o status não for “bom”, acesse oMAP de Início.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Cabo Fibre Channel, comutador para porta remota,(30%)

v Comutador ou conector ou adaptador SFP dedispositivo remoto, (30%)

v Cabo Fibre Channel, porta local para comutador,(30%)

v Conector SFP do cluster, (9%)

v Adaptador Fibre Channel do cluster, (1%)

Nota: As primeiras duas FRUs não são FRUs de cluster.

1260 Tipo 2 de falha de cabo SAS.

Explicação: Tipo 2 de falha de cabo SAS.

Resposta do Usuário: Conclua as seguintes etapas:

Nota: Após cada ação, verifique se as portas da caixaem ambas as extremidades do cabo foram excluídas. Seas portas foram excluídas, ative-as emitindo o comandoa seguir:

chenclosurecanister -excludesasport no -port X

1. Reconfigure essa caixa e a caixa de envio de dados.

A caixa de envio de dados é identificada em dadosde controle como enclosureid2, faultobjectlocation2...

2. Reposicione o cabo entre as duas portas que sãoidentificadas nos dados de controle.

3. Substitua o cabo entre as duas portas que sãoidentificadas nos dados de controle.

4. Substitua essa caixa.

5. Substitua a outra caixa (enclosureid2).

FRUs de Causa Possíveis ou outra:

v Cabo SAS

v Caixa

1298 Um nó encontrou um erro naatualização.

Explicação: Um ou mais nós causaram falha naatualização.

Resposta do Usuário: Marque lsupdate para o nó quefalhou e continue resolvendo problemas com o códigode erro fornecido.

1300 Problema de configuração da porta deE/S

Explicação: Uma porta que foi configurada paraVirtualização de ID da Porta N (NPIV) está off-line.

Resposta do Usuário: Conclua ambos osprocedimentos a seguir:

1. Verifique a configuração do comutador paraassegurar que a NPIV esteja ativada e que os limitesde recursos sejam suficientes.

2. Execute o comando detectmdisks e aguarde 30segundos após a conclusão da descoberta para verse o evento se corrige sozinho.

3. Se o evento não se corrigir sozinho, entre emcontato com o Suporte do IBM.

1310 Um disco gerenciado está relatandoerros excessivos.

Explicação: Um disco gerenciado está relatando errosexcessivos.

Resposta do Usuário:

1230 • 1310

234 SAN Volume Controller: Guia de Resolução de Problemas

Page 253: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1. Repare o gabinete/controladora com falha.

2. Verifique o status do disco gerenciado. Se todos osdiscos gerenciados mostrarem um status de“on-line”, marque o erro que você acabou dereparar como “corrigido”. Se algum discogerenciado mostrar um status “excluído”, inclua osdiscos gerenciados excluídos e, em seguida, marqueo erro como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha do gabinete/controladora (100%)

1311 Uma unidade flash está off-line devidoao excesso de erros.

Explicação: A unidade que está relatando errosexcessivos foi colocada no estado off-line.

Resposta do Usuário: Na GUI de gerenciamento,clique em Resolução de Problemas > AçõesRecomendadas para executar a ação recomendada paraesse erro. Se isso não resolver o problema, entre emcontato com seu próximo nível de suporte.

1320 Ocorreu um erro de mídia de E/S dodisco.

Explicação: Ocorreu um erro de mídia de E/S dodisco.

Resposta do Usuário:

1. Verifique se o volume contra o qual o erro érelatado está espelhado. Se estiver, verifique se háum erro “Ocorreu um erro de volume Espelhado1870 off-line devido a um erro de leitura dehardware” relacionado a este volume no log deeventos. Além disso, verifique se uma das cópiasespelhadas está sincronizando. Se todos esses testesforem true, então você deverá excluir a cópia dovolume que não está sincronizada a partir dovolume. Verifique se o volume está on-line antes decontinuar com as seguintes ações. Aguarde até queo erro de mídia seja corrigido antes de tentar recriaro espelho do volume.

2. Se o erro de mídia tiver sido detectado por umaleitura a partir de um host, peça ao cliente pararegravar os dados incorretos no endereço de blocológico (LBA) do bloco que é relatado nos dados decontrole do barramento SCSI dos sistemas host. Seum bloco individual não puder ser recuperado, seránecessário restaurar o volume do backup. Se essetiver ocorrido durante uma migração, o sistemahost não perceberá o erro até que o dispositivo dedestino seja acessado.

3. Se o erro de mídia tiver sido detectado durante umasincronização de volume espelhada, o bloco podenão ser utilizado para dados do host. O erro demídia ainda deve ser corrigido antes de o espelhopoder ser estabelecido. Pode ser possível corrigir obloco que está com erro utilizando o controlador dedisco ou as ferramentas do host. Caso contrário,será necessário utilizar as ferramentas do host paracopiar o conteúdo do volume que está sendoutilizado para um novo volume. Dependendo dascircunstâncias, esse novo volume pode ser mantidoe espelhado, ou o volume original pode serreparado e os dados copiados de volta novamente.

4. Verifique o status do disco gerenciado. Se todos osdiscos gerenciados mostrarem um status de“on-line”, marque o erro que você acabou dereparar como “corrigido”. Se algum discogerenciado não mostrar um status “on-line”, acesseo MAP de início. Se você retornar a esta etapa, entreem contato com o seu centro de suporte pararesolver o problema com a controladora de disco.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha do gabinete/controladora (100%)

1322 Incompatibilidade de informações deproteção de dados.

Explicação: Esse erro ocorre quando algo tiverinterrompido as informações de proteção em comandosde leitura ou gravação.

Resposta do Usuário:

1. Determine se existe uma única ou várias unidadesregistrando o erro. Como a camada de transporteSAS pode causar vários erros de unidade, énecessário corrigir outros erros de hardwareprimeiro.

2. Verifique os erros de hardware de prioridade maisalta relacionados. Corrija os erros de prioridademais alta antes de continuar.

3. Use lseventlog para determinar se mais de umaunidade com esse erro foi registrada nas últimas 24horas. Se sim, entre em contato com o suporte IBM.

4. Se somente uma única unidade com esse erro tiversido registrada, o sistema está monitorando ofuncionamento da unidade e falhará se o RAID forusado para corrigir muitos erros desse tipo.

1311 • 1322

Capítulo 7. Diagnosticando problemas 235

Page 254: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1328 Chave de criptografia necessária.

Explicação: É necessário fornecer uma chave decriptografia antes que o sistema possa se tornartotalmente operacional. Esse erro ocorre quando umsistema com a criptografia ativada é reiniciado semuma chave de criptografia disponível.

Resposta do Usuário: Insira uma unidade flash USBcontendo uma chave válida em uma das caixas do nó.

1330 Um disco gerenciado (MDisk) ou umaunidade adequado(a) para utilizaçãocomo um disco quorum não foilocalizado(a).

Explicação: Um disco quorum é necessário para ativarum tie-break quando algum membro do cluster estiverausente. Geralmente são definidos três discos quorum.Por padrão, o cluster automaticamente aloca os discosquorum quando os discos gerenciados são criados.Todavia, existe a opção de designar manualmente osdiscos quorum. Esse erro é relatado quando há discosgerenciados ou discos de modo de imagem, mas nãodiscos quorum.

Para se tornar um disco quorum:

v O MDisk deve ser acessível por todos os nós nocluster.

v O MDisk deve ser gerenciado, ou seja, ele deve serum membro de um conjunto de armazenamentos.

v O MDisk deve ter extensões livres.

v O MDisk deve ser associado a um controlador queestá ativada para o suporte de quorum. Se ocontrolador tiver diversos WWNNs, todos oscomponentes do controlador devem estar ativadospara suporte de quorum.

Um disco quorum pode não estar disponível por causade uma falha da rede Fibre Channel ou de umproblema de zoneamento de comutador Fibre Channel.

Resposta do Usuário:

1. Resolva todos os problemas da rede Fibre Channelconhecidos.

2. Peça ao cliente para confirmar que MDisks foramincluídos nos conjuntos de armazenamento e quaisdesses MDisks possuem extensões livres e estão emum controlador que esteja ativado para uso comoum provedor de discos quorum. Assegure quequalquer controlador com diversos WWNNs tenhatodos os seus componentes ativados para fornecerdiscos quorum. Crie um MDisk adequado ou, sepossível, ative o suporte de quorum emcontroladores aos quais os MDisks existentesestejam associados. Se pelo menos um discogerenciado mostrar um modo gerenciado e possuirum índice de quorum diferente de zero, marque oerro que você acabou de reparar como “corrigido”.

3. Se o cliente não puder fazer as alteraçõesadequadas, peça assistência ao seu centro desuporte de software.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Erro de configuração (100%)

1335 Disco quorum não disponível.

Explicação: Disco quorum não disponível.

Resposta do Usuário:

1. Visualize a entrada do log de eventos paraidentificar o disco gerenciado (MDisk) que estásendo utilizado como um disco quorum, que nãoestá mais disponível.

2. Execute os procedimentos de determinação deproblemas e de reparo da controladora de discopara o MDisk identificado na etapa 1.

3. Inclua os MDisks no cluster.

4. Verifique o status do disco gerenciado. Se o discogerenciado identificado na etapa 1 mostrar umstatus “on-line”, marque o erro que você acabou dereparar como “corrigido”. Se o disco gerenciado nãomostrar um status “on-line”, acesse o MAP deinício. Se você retornar a esta etapa, entre emcontato com o seu centro de suporte para resolver oproblema com a controladora de disco.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha do gabinete/controladora (100%)

1340 Um disco gerenciado atingiu o tempolimite.

Explicação: Este erro foi relatado porque foi detectadoum grande número de condições de tempo limite dodisco. O problema é provavelmente causado por umafalha de algum outro componente na SAN.

Resposta do Usuário:

1. Repare os problemas em todos osgabinetes/controladores e comutadores na mesmaSAN que este cluster 2145.

2. Se forem encontrados problemas, marque esse errocomo “corrigido”.

1328 • 1340

236 SAN Volume Controller: Guia de Resolução de Problemas

Page 255: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3. Se não for encontrada nenhuma falha do comutadorou da controladora de disco, faça um dump do logde eventos e ligue para seu centro de suporte dehardware.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha do gabinete/controlador

v Comutador Fibre Channel

1350 Portas IB não estão operacionais.

Explicação: Portas IB não estão operacionais.

Resposta do Usuário: Um porta offline pode termuitas causas e, portanto, é necessário verificar todoseles. Inicie com a possibilidade de mais fácil e menosintrusivas.

1. Reconfigure a porta IB com o comando da CLI.

2. Se a porta IB está conectada a um comutador,verifique a configuração do comutador paraproblemas.

3. Reassente o cabo do IB no lado B e o ladoHBA/switch.

4. Execute um segundo cabo IB temporários parasubstituir a atual para verificar uma falha do cabo.

5. Se o sistema estiver em produção, planeje umtempo de inatividade para manutenção antes decontinuar com a próxima etapa. Outras portas serãoafetadas.

6. Reconfigure o adaptador da interface IB; reconfigureo nó; reinicialize o sistema.

Causa Possível - unidades substituíveis em campo ououtra:

Os (cabo, HCA, comutador, e assim por diante) (85%)

Interface (10%)

Nó (5%)

1360 Ocorreu um erro de transporte SAN.

Explicação: Este erro foi relatado porque o 2145executou procedimentos de recuperação de erro emresposta aos erros de transporte do componente daSAN associado. O problema é provavelmente causadopor uma falha de um componente na SAN.

Resposta do Usuário:

1. Visualize a entrada do log de eventos paradeterminar o nó que registrou o problema.Determine o nó ou controlador 2145 contra o qual oproblema foi registrado.

2. Execute os procedimentos de determinação deproblema e reparo do comutador Fibre Channelpara os comutadores conectados ao nó oucontrolador 2145.

3. Execute os procedimentos de determinação deproblema e reparo de cabeamento Fibre Channelpara os cabos conectados ao nó ou controlador 2145.

4. Se algum problema tiver sido encontrado eresolvido nas etapas 2 e 3, marque esse erro como“corrigido”.

5. Se as falhas de comutador ou cabo não foramencontrados nas etapas 2 e 3, faça um dump do logde eventos. Ligue para seu centro de suporte dehardware.

6. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Comutador Fibre Channel

v Cabeamento Fibre Channel

1370 Ocorreu um erro no procedimento derecuperação de erro (ERP) do discogerenciado.

Explicação: Este erro foi relatado porque um grandenúmero de procedimentos de recuperação de erros dedisco foram executados pela controladora de disco. Oproblema é provavelmente causado por uma falha dealgum outro componente na SAN.

Resposta do Usuário:

1. Visualize a entrada do log de eventos e determine odisco gerenciado que estava sendo acessado quandoo problema foi detectado.

2. Execute os procedimentos de determinação deproblemas e de reparo da controladora de discopara o MDisk determinado na etapa 1.

3. Execute os procedimentos de determinação deproblema e reparo para os comutadores fibrechannel conectados ao 2145 e quaisquer outroscomponentes de rede Fibre Channel.

4. Se algum problema tiver sido encontrado eresolvido nas etapas 2 e 3, marque esse erro como“corrigido”.

5. Se não for localizada nenhuma falha de comutadorou cabo nas etapas 2 e 3, faça um dump do log deeventos. Ligue para seu centro de suporte dehardware.

6. Acesse o MAP de verificação de reparo.

1350 • 1370

Capítulo 7. Diagnosticando problemas 237

Page 256: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha do gabinete/controlador

v Comutador Fibre Channel

1400 Falha da porta Ethernet

Explicação: O sistema não pode detectar uma conexãoEthernet.

Resposta do Usuário:

1. Acesse o MAP Ethernet.

2. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

2145-CF8 ou 2145-CG8

v Cabo Ethernet (25%)

v Placa-mãe (25%)

Outra:

v O cabo Ethernet está desconectado ou danificado(25%)

v Falha do hub Ethernet (25%)

1403 Porta externa não operacional.

Explicação: Se esse erro ocorre quando uma portaestava inicialmente online e subsequentemente ficouoffline, isso indica que:

v o servidor, HBA, CNA ou comutador foi desligado.

v há um problema físico.

Se esse erro ocorre durante uma configuração inicial oudurante uma mudança de configuração, é maisprovável que seja um problema de configuração do queum problema físico.

Resposta do Usuário:

1. Reconfigure a porta por meio do comando da CLIManutenção. Se agora a porta estiver online, o DMPestá completo.

2. Se a porta estiver conectada a um comutador,verifique o comutador para certificar-se de que aporta não esteja desativada. Verifique adocumentação de resolução de problemas dofornecedor do comutador para outraspossibilidades. Se agora a porta estiver online, oDMP está completo.

3. Reposicione o cabo. Isso inclui conectar o cabo e oSFP, se ainda não tiver sido feito. Se agora a portaestiver online, o DMP está completo.

4. Reposicione os SFPs (módulos óticos) hot swap. Seagora a porta estiver online, o DMP está completo.

5. Tente usar um novo cabo.

6. Tente usar um novo SFP.

7. Tente usar uma nova porta no comutador.

Nota: Continuar a partir daqui afetará outras portasconectadas no adaptador.

8. Reconfigure o adaptador.

9. Reconfigure o nó.

1450 Menos portas de E/S do Fibre Channelestão operacionais.

Explicação: Uma ou mais portas de E/S Fibre Channelque anteriormente estavam ativas agora estão inativas.Esta situação continuou por um minuto.

Uma porta de E/S Fibre Channel pode ser estabelecidaem uma porta de plataforma Fibre Channel ou em umaporta de plataforma Ethernet usando o FCoE. Esse erroé esperado caso a porta Fibre Channel ou Ethernetassociada não esteja operacional.

Dados:

Três valores numéricos são listados:

v O ID da primeira porta inativa inesperada. Esse ID éum número decimal.

v É esperado que as portas estejam ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se for esperadoque a porta esteja ativa.

v As portas estão, na realidade, ativas, o que é umnúmero hexadecimal. Cada posição de bit representauma porta, com o último bit significanterepresentando a porta 1. O bit é 1 se a porta estiverativa.

Resposta do Usuário:

1. Se possível, utilize o GUI de gerenciamento paraexecutar as ações recomendadas para o código deerro do serviço associado.

2. Siga o procedimento para mapeamento de portas deE/S para portas da plataforma a fim de determinarqual porta da plataforma está fornecendo esta portade E/S.

3. Verifique qualquer erros do nó 704 (porta daplataforma Fibre Channel não operacional) ou 724(porta da plataforma Ethernet não operacional)reportado para a porta da plataforma.

4. Possibilidades:

v Se a porta tiver sido desconectadaintencionalmente, use a ação recomendada doGUI de gerenciamento para o código de erro doserviço e reconheça a mudança desejada.

v Resolva o erro 704 ou 724.

1400 • 1450

238 SAN Volume Controller: Guia de Resolução de Problemas

Page 257: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Se esta for uma conexão FCoE, use asinformações que a visualização fornece sobre oencaminhador Fibre Channel (FCF) parasolucionar problemas na conexão entre a porta eo FCF.

Causa Possível - unidades substituíveis em campo ououtra causa:

v Nenhuma

1471 placa de Interface é suportado.

Explicação: O adaptador da interface não é suportado.

Resposta do Usuário: Substitua o adaptador dainterface errado pelo tipo correto.

Causa Possível - unidades substituíveis em campo ououtra:

Adaptador da interface (100%)

1472 A unidade de inicialização está em umslot não suportado.

Explicação: A unidade de inicialização está em umslot não suportado.

Resposta do Usuário: Conclua as seguintes etapas:

1. Verifique a visualização da unidade de inicializaçãopara determinar qual unidade está em um slot nãosuportado.

2. Mova a unidade novamente para seu nó e slotcorreto, mas encerre o nó primeiro se booted yesfor mostrado para essa unidade na visualização daunidade de inicialização.

3. O erro do nó é removido, ou um novo erro do nó éexibido para você trabalhar.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1473 A bateria instalada está em um nível derevisão do hardware que não ésuportado pelo nível de código atual.

Explicação: A bateria instalada está em um nível derevisão do hardware que não é suportado pelo nível decódigo atual.

Resposta do Usuário: Para substituir a bateria poruma que seja suportada pelo nível de código atual, sigaas ações de serviço para “1130” na página 223. Paraatualizar o nível de código para um que suporte abateria instalada atualmente, execute uma atualizaçãodo código de modo de serviço. Instale sempre a versãomais recente do software de sistema para evitarproblemas com atualizações compatibilidade decomponentes.

FRUs de Causa Possíveis ou outra:

v Bateria (50%)

1474 A bateria está se aproximando dotérmino da vida útil.

Explicação: Quando a bateria se aproxima do fim dasua vida útil, você deverá substituí-la, se pretendepreservar a capacidade de energia de failover para asbaterias.

Resposta do Usuário: Substitua a bateria seguindoeste procedimento o mais cedo possível.

Se o nó estiver em um sistema em cluster, assegure-sede que a bateria não esteja sendo usada para fornecerproteção de dados antes de removê-la. Emita ocomando chnodebattery -remove -battery battery_IDnode_ID para estabelecer a falta de reliance na bateria.

Se o comando retornar com um erro “O comandofalhou porque a bateria especificada estáoffline”(BATTERY_OFFLINE), substitua a bateriaimediatamente.

Se o comando retornar com um erro “O comandofalhou porque a bateria especificada não éredundante”(BATTERY_NOT_REDUNDANT), nãoremova a bateria de confiança. A remoção da bateriacompromete a proteção de dados.

Nesse caso, sem outros erros relacionados à bateria, useo comando chnodebattery-remove-battery battery_IDnode_ID periodicamente para forçar o sistema aremover dependência da bateria. O sistema sempreremove dependências em de uma hora (TBC).

Alternativamente, remova o nó do sistema em cluster.Uma vez o nó estando independente, será possívelsubstituir sua bateria imediatamente. Se o nó não fizerparte do cluster, a bateria estiver offline ou o comandochnodebattery retornar sem erro, execute a ação deserviço para “1130” na página 223.

FRUs de Causa Possíveis ou outra:

v Bateria (100%)

1475 A bateria está muito quente.

Explicação: A bateria está muito quente.

Resposta do Usuário: A bateria pode demorar paraesfriar se a temperatura ambiente estiver alta. Vocêdeverá aguardar a bateria esfriar antes que ela possaretornar à sua operação normal.

Se o erro do nó 768 for relatado, repare-o também.

1476 A bateria está muito fria.

Explicação: Você deverá aguardar a bateria aquecerantes de retornar à sua operação normal.

Resposta do Usuário: A bateria poderá demorar parase aquecer se a temperatura ambiente estiver baixa. Seo erro do nó 768 for relatado, repare-o também.

1471 • 1476

Capítulo 7. Diagnosticando problemas 239

Page 258: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Caso contrário, aguarde a bateria se aquecer.

1550 Um caminho de cluster falhou.

Explicação: Uma das portas Fibre Channel não podese comunicar com todas as outras portas no cluster.

Resposta do Usuário:

1. Verifique se há um zoneamento de comutadorincorreto.

2. Repare a falha na malha de rede Fibre Channel.

3. Verifique o status das portas do nó que não foramexcluídas via máscara da portal local do sistema. Seo status das portas de nó for mostrado como ativo,marque o erro que você reparou como “corrigido”.Se alguma porta de nó não mostrar um status ativo,acesse o MAP de início. Se você retornar a estaetapa, entre em contato com o centro de suportepara resolver o problema.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha da malha de rede Fibre Channel (100%)

1570 Disco quorum configurado nocontrolador que tem o quorumdesativado

Explicação: Este erro pode ocorrer com umcontrolador de armazenamento que pode ser acessadopor meio de diversos WWNNs e tenha umaconfiguração padrão de não permitir discos quorum.Quando esses controladores são detectados por umcluster, apesar da criação de diversas definições decontrolador de componente, o cluster reconhece quetodos os controladores de componentes pertencem aomesmo sistema de armazenamento. Para ativar acriação de um disco quorum nesse sistema dearmazenamento, todos os componentes do controladordevem ser configurados para permitir o quorum.

Uma alteração na configuração da SAN, ou para umsistema de armazenamento com diversos WWNNs,pode resultar no cluster descobrindo novoscontroladores de componente para o sistema dearmazenamento. Esses componentes assumirão a tomarpadrão para permitir o quorum. Este erro é relatado sehouver um disco quorum associado ao controlador e aconfiguração padrão não permitir o quorum.

Resposta do Usuário:

v Determine se deveria existir um disco quorum nestesistema de armazenamento. Assegure que ocontrolador suporta quorum antes de você permitirdiscos quorum em algum controlador de disco. É

possível verificar o Web site de suportewww.ibm.com/storage/support/2145 para obterinformações adicionais.

v Se um disco quorum for obrigatório neste sistema dearmazenamento, permita o quorum no componentedo controlador que está relatado no erro. Se o discoquorum não estiver neste sistema dearmazenamento, mova-o para outro local.

v Marque o erro como “corrigido”.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha da malha de rede Fibre Channel (100%)

1600 Reparo de disco espelhado paradodevido às diferenças.

Explicação: Durante o reparo de um volumeespelhado, dois discos de cópia foram localizados paraconter dados diferentes para o mesmo endereço debloco lógico (LBA). A opção de validação foi utilizada,assim o processo de reparo foi parado.

Operações de leitura para os LBAs que diferem podemretornar os dados de uma das cópias do volume.Portanto, é importante não utilizar o volume a menosque tenha certeza de que os aplicativos host não leia osLBAs que são diferentes ou possa gerenciar os dadosdiferentes que potencialmente podem ser retornados.

Resposta do Usuário: Execute uma das seguintesações:

v Continue o reparo começando com o próximo LBAapós a diferença para ver quantas diferenças existempara o volume espelhado todo. Isso pode ajudá-lo adecidir quais das seguintes ações executar.

v Escolha um disco primário e execute as diferenças deressincronização de reparo.

v Execute um reparo e crie erros de mídia para asdiferenças.

v Restaure todo o volume ou parte dele a partir de umbackup.

v Decida qual disco possui dados corretos e, emseguida, exclua a cópia que seja diferente e a recriepermitindo que ela seja sincronizada.

Em seguida, marque o erro como “corrigido”.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1550 • 1600

240 SAN Volume Controller: Guia de Resolução de Problemas

Page 259: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1610 Existem muitos erros de mídia copiadosem um disco gerenciado.

Explicação: O cluster mantém uma tabela de erro demídia virtual para cada MDisk. Esta tabela é uma listade endereços de blocos lógicos no disco gerenciado quecontêm dados que não são válidos e não podem serlidos. A tabela de erros de mídia virtual possui umcomprimento fixo. Este evento de erro indica que osistema tentou incluir uma entrada na tabela, mas atentativa falhou porque a tabela já está cheia.

Há duas circunstâncias que irão fazer com que umaentrada seja incluída na tabela de erro de mídia virtual:

1. Operações de sincronização de volume FlashCopy,de migração de dados e espelhado copiam dados deuma extensão de disco gerenciado para outra. Se aextensão de origem contém um erro de mídiavirtual ou o controlador RAID relatar um erro demídia real, o sistema criará um erro de mídiavirtual correspondente na extensão de destino.

2. O processo de validação e reparo do volumeespelhado tem a opção de criar erros de mídiavirtual em setores que não correspondem a todas ascópias de volumes. Normalmente são esperadasmuito poucas (ou nenhuma) diferenças. No entanto,se as cópias tiverem sido marcadas comosincronizadas inadequadamente, então, um grandenúmero de erros de mídia virtual poderiam sercriados.

Resposta do Usuário: Assegure que todos os erros deprioridade mais alta estejam resolvidos antes de tentarresolver este erro.

Determine se ocorreu um número excessivo de erros demídia virtual por causa de uma operação de validaçãoe reparo de disco espelhado que criou os erros paradiferenças ou se os erros foram criados devido a umaoperação de cópia. Siga a opção correspondentemostrada abaixo.

1. Se ocorreram erros de mídia virtual por causa deuma operação de validação e reparo de discoespelhado que criou os erros de mídia paradiferenças, então também assegure que as cópias devolume tenham sido completamente sincronizadasantes do início da operação. Se as cópias tiveremsido sincronizados, apenas alguns poucos erros demídia virtual devem ser criados pela operação devalidação e reparo. Nesse caso, pode ser possívelregravar apenas os dados que não eram consistentesnas cópias utilizando o processo de recuperação dedados local. Se as cópias não tiverem sidosincronizadas, é provável que agora haja um grandenúmero de erros de mídia em todas as cópias devolume. Mesmo se os erros de mídia virtual foremesperados apenas para blocos que nunca foramgravados, é importante limpar os erros de mídiavirtual para evitar a inibição de outras operações.Para recuperar os dados para todos esses erros demídia virtual, é provável que o volume terá que ser

recuperado a partir de um backup utilizando umprocesso que regrave todos os setores do volume.

2. Se os erros de mídia virtual tiverem sido criadospor uma operação de cópia, a melhor prática écorrigir todos os erros de mídia no volume deorigem e não propagar os erros de mídia na cópiado volume. A correção de erros de prioridade maisalta no log de eventos teria corrigido o erro demídia no volume de origem. Depois da correçãodos erros de mídia, você deve executar a operaçãode cópia novamente para limpar os erros de mídiavirtual do volume de destino. Pode ser necessáriorepetir uma sequência de operações de cópia setiverem sido feitas cópias de erros de mídia jácopiados.

Uma alternativa que não trata a causa-raiz é excluirvolumes no disco gerenciado de destino que possuemos erros de mídia virtual. Esta exclusão de volumereduz o número de entradas de erro de mídia virtualna tabela de MDisks. A migração do volume para umdisco gerenciado diferente também exclui entradas natabela de MDisks, mas criará mais entradas na tabelade MDisks do MDisk para o qual o volume foimigrado.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1620 Um conjunto de armazenamentos estáoff-line.

Explicação: Um conjunto de armazenamentos estáoff-line.

Resposta do Usuário:

1. Repare as falhas na ordem mostrada.

2. Inicie uma operação de descoberta de cluster parareanalisar a rede Fibre Channel.

3. Verifique o status do disco gerenciado (MDisk). Setodos os MDisks mostrarem um status “on-line”,marque o erro que você acabou de reparar como“corrigido”. Se algum MDisk não mostrar um status“on-line”, acesse o MAP de início. Se você retornara esta etapa, entre em contato com o seu centro desuporte para resolver o problema com acontroladora de disco.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha da malha da rede Fibre Channel (50%)

v Falha do gabinete/controladora (50%)

1610 • 1620

Capítulo 7. Diagnosticando problemas 241

Page 260: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1623 Um ou mais MDisks em um controladorestá(ão) degradado(s)

Explicação: No mínimo um MDisk em um controladorestá degradado porque o MDisk não estão disponívelpor meio de um ou mais nós. O MDisk está disponívelpor meio de pelo menos um nó. O acesso aos dadospode ser perdido se ocorrer outra falha.

Em um sistema configurado corretamente, cada nóacessa todos os MDisks em um controlador por meiode todas as portas do controlador.

Esse erro é registrado apenas uma vez por controlador.Pode haver mais de um MDisk neste controlador quefoi incorretamente configurado, mas o erro é registradoapenas para um MDisk.

Para impedir que esse erro seja registrado devido aatividades de manutenção de malha de curto prazo,essa condição de erro deve ter existido por uma horaantes do erro ser registrado.

Resposta do Usuário:

1. Determine que MDisks estão degradados. Procurepor MDisks com uma contagem de caminho menordo que o número de nós. Não utilize apenas ostatus do MDisk porque outros erros tambémpodem resultar em MDisks degradados.

2. Assegure que o controlador esteja zoneadocorretamente com todos os nós.

3. Assegure que a unidade lógica esteja mapeada paratodos os nós.

4. Assegure que a unidade lógica esteja mapeada paratodos os nós usando o mesmo LUN.

5. Execute o console ou comando da CLI paradescobrir os MDisks e assegurar que o comandoseja concluído.

6. Marque o erro que você acabou de corrigir como“corrigido”. Quando o erro for marcado como“corrigido”, a disponibilidade do MDisk docontrolador será testada e o erro registradonovamente de forma imediata se o erro persistirpara todos os MDisks. É possível que o novo errorelate um MDisk diferente.

7. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha da malha da rede Fibre Channel (50%)

v Falha do gabinete/controladora (50%)

1624 A configuração do controlador temmodo RDAC não suportado.

Explicação: O cluster detectou que uma configuraçãoda controladora de disco da série IBM DS não ésuportada pelo cluster. A controladora de disco estáoperando em modo RDAC. A controladora de discopode parecer estar operando com o cluster. Todavia, aconfiguração não é suportada porque sabe-se que elanão funciona com o cluster.

Resposta do Usuário:

1. Usando o console da série IBM DS, assegure que otipo de host esteja configurado como 'IBM TS SANVCE' e que a opção AVT esteja ativada. As opçõesAVT e RDAC são mutuamente exclusivas.

2. Marque o erro que você acabou de corrigir como“corrigido”. Se o problema não tiver sido corrigido,ele será registrado novamente. Isso pode levaralguns minutos.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha do gabinete/controlador

1625 Configuração da controladora de discoincorreta.

Explicação: Ao executar uma descoberta de MDisk, ocluster detectou que uma configuração de controladorade disco não é suportada pelo cluster. A controladorade disco pode parecer estar operando com o cluster. Noentanto, a configuração detectada pode potencialmentecausar problemas e não deverá ser utilizada. Aconfiguração não suportada é mostrada nos dados doevento.

Resposta do Usuário:

1. Utilize os dados do evento para determinar asalterações necessárias na controladora de disco ereconfigurar a controladora de disco para utilizaruma configuração suportada.

2. Marque o erro que você acabou de corrigir como“corrigido”. Se o problema não tiver sido corrigido,ele será registrado novamente pela descoberta dodisco gerenciado que é executada automaticamenteneste momento. Isso pode levar alguns minutos.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Falha do gabinete/controlador

1623 • 1625

242 SAN Volume Controller: Guia de Resolução de Problemas

Page 261: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1627 O cluster possui redundânciainsuficiente em sua conectividade docontrolador.

Explicação: O cluster detectou que ele não temredundância suficiente em suas conexões para ascontroladores de disco. Isso significa que outra falha naSAN pode resultar em perda de acesso para os dadosdo aplicativo. O ambiente SAN do cluster deve terconexões redundantes para cada controladora de disco.Essa redundância permite a operação continuadaquando houver uma falha em um dos componentes daSAN.

Para fornecer a redundância recomendada, um clusterdeve ser configurado para que:

v cada nó possa acessar cada controladora de disco pormeio de duas ou mais portas diferentes doinicializador no nó.

v cada nó possa acessar cada controladora de disco pormeio de duas ou mais portas diferentes de destinodo controlador. Nota: Algumas controladoras dedisco fornecem apenas uma única porta de destino.

v cada nó possa acessar cada porta de destino docontrolador de disco por meio de pelo menos umaporta do inicializador no nó.

Se não houver erros de prioridade mais alta sendorelatados, este erro geralmente indica um problemacom o design de SAN, um problema com ozoneamento SAN ou um problema com a controladorade disco.

Se houver erros de prioridade mais alta não corrigidosque se relacionem com à SAN ou às controladoras dedisco, esses erros devem ser corrigidos antes daresolução deste erro porque eles podem indicar a razãoda falta de redundância. Os códigos de erro que devemser corrigidos primeiro são:

v 1210 Porta FC Local excluída

v 1230 O login foi excluído

Nota: Este erro pode ser relatado se a ação necessária,para reanalisar novos MDisks na rede Fibre Channel,não tiver sido executada após uma reconfiguraçãodeliberada de uma controladora de disco ou depois daredefinição da zona SAN.

O código de erro 1627 é relatado para um número deIDs de erro diferentes. O ID de erro indica a área emque haja uma falta de redundância. Os dados relatadosem uma entrada de log de eventos indicam onde acondição foi localizada.

O significado dos IDs de erro é mostrado abaixo. Paracada ID de erro, é fornecida a razão mais provável paraa condição. Se o problema não for localizado nas áreassugeridas, verifique a configuração e o estado de todos

os componentes da SAN (comutadores, controladores,discos, cabos e clusters) para determinar onde há umúnico ponto de falha.

010040 Uma controladora de disco está disponívelapenas a partir de uma única porta de nó.

v Um nó detectou que ele possui apenas uma conexãocom a controladora de disco exatamente por meio deuma porta do inicializador e mais de uma porta doinicializador está operacional.

v Os dados de erro indicam o WWNN do dispositivo eo WWPN da porta conectada.

v Um problema de zoneamento ou uma falha dohardware de conexão Fibre Channel pode causar essacondição.

010041 Uma controladora de disco está disponível apartir de uma única porta no controlador.

v Um nó que detectou que está conectado exatamentea apenas uma porta de destino em uma controladorade disco, e mais de uma conexão de porta de destinoé esperada.

v Os dados de erro indicam o WWPN da porta dacontroladora de disco que está conectado.

v Um problema de zoneamento ou uma falha dohardware de conexão Fibre Channel pode causar essacondição.

010042 Apenas uma única porta em uma controladorade disco está acessível a partir de cada nó no cluster.

v Apenas uma única porta em uma controladora dedisco está acessível a cada nó quando houverdiversas portas na controladora que podem serconectadas.

v Os dados de erro indicam o WWPN da porta dacontroladora de disco que está conectado.

v Um problema de zoneamento ou uma falha dohardware de conexão Fibre Channel pode causar essacondição.

010043 Uma controladora de disco está acessível apenaspor meio de metade, ou menos, das portas das portasda controladora configuradas anteriormente.

v Apesar da possibilidade de ainda existirem diversasportas acessíveis na controladora de disco, umcomponente de hardware da controladora pode terfalhado ou uma das malhas SAN falhou de formaque a configuração do sistema operacional foireduzida a um único ponto de falha.

v Os dados de erro indicam uma porta no controladorde disco que ainda está conectado, e também lista asportas da controladora que são esperadas mas quenão estão conectadas.

v Um problema da controladora de disco, umproblema de hardware do comutador, um problemade zoneamento ou uma falha do cabo poderá causaressa condição.

1627

Capítulo 7. Diagnosticando problemas 243

Page 262: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

010044 Uma controladora de disco não está acessível apartir de um nó.

v Um nó detectou que não possui acesso a umacontroladora de disco. A controladora ainda estáacessível a partir do nó do parceiro no grupo de E/S,assim seus dados ainda estão acessíveis aosaplicativos de host.

v Os dados de erro indicam o WWPN da controladorade disco ausente.

v Um problema de zoneamento ou um erro decabeamento pode causar essa condição.

010117 Um controlador de disco não está acessível apartir de um nó com permissão para acessar odispositivo pela política de site

v Um controlador de disco não está acessível a partirde um nó com permissão para acessar o dispositivopela política de site. Se um controlador de disco tivervários WWNNs, o controlador de disco ainda poderáestar acessível para o nó por meio de um dos outrosWWNNs.

v Os dados de erro indicam o WWNN do controladorde disco inacessível.

v Um problema de zoneamento ou uma falha dehardware de conexão fibre channel pode causar essacondição.

Resposta do Usuário:

1. Verifique o ID de erro e os dados para obter umadescrição mais detalhada do erro.

2. Determine se houve uma alteração intencional nozoneamento da SAN ou em uma configuração decontroladora de disco que reduza o acesso docluster à controladora de disco indicada. Se a açãotiver ocorrido, continue com a etapa 8.

3. Utilize a GUI ou o comando da CLI lsfabric paraassegurar que todos os WWPNs da controlador dedisco sejam relatados como esperado.

4. Assegure que todos os WWPNs do controlador dedisco estejam adequadamente zoneados para usopelo cluster.

5. Verifique se há algum erro não corrigido nascontroladoras de disco.

6. Assegure que todos os cabos Fibre Channelestejam conectados às portas corretas em cadaextremidade.

7. Verifique se há falhas nos cabos e conectores FibreChannel.

8. Quando tiver resolvido os problemas, utilize a GUIou o comando da CLI detectmdisk para reanalisaralterações nos MDisks na rede Fibre Channel.Nota: Não tente detectar MDisks a menos quetenha certeza de que todos os problemas tenhamsido corrigidos. A detecção prematura de MDiskspode mascarar um problema.

9. Marque o erro que você acabou de corrigir comocorrigido. O cluster irá revalidar a redundância erelatar outro erro se ainda não houver redundânciasuficiente.

10. Acesse MAP 5700: Verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1630 O número de logins de dispositivo foireduzido.

Explicação: O número de conexões de malha de portaa porta, ou logins, entre o nó e um controlador dearmazenamento diminuiu. Esta situação pode sercausada por um problema na SAN ou por umareconfiguração deliberada da SAN.

O código de erro 1630 é relatado para um número deIDs de erro diferentes. O ID do erro indicacaracterísticas mais específicas sobre o problema. Osdados relatados em uma entrada de log de eventosindicam onde a condição foi localizada.

010045 Número de caminhos do Dispositivo do site docontrolador permitiu que nós acessíveis fossemreduzidos

v O controlador agora possui menos logins a partir dosite do controlador que os nós acessíveis alocadospara o controlador de armazenamento.

v Os dados do erro indicam o WWNN ou endereço IPdo controlador de disco e a contagem de caminhoatual de cada nó.

v Uma falha do controlador ou uma falha de malha derede Fibre Channel pode causar esta condição.

Resposta do Usuário:

1. Verifique o erro no log de eventos do cluster paraidentificar o ID do objeto associado ao erro.

2. Verifique a disponibilidade do dispositivo com falhautilizando a seguinte linha de comandos:lscontroller object_I. Se o comando falhar com amensagem “CMMVC6014E O comando falhouporque o objeto solicitado está indisponível ou nãoexiste”, peça ao cliente se este dispositivo tiver sidoremovido do sistema.

v Se “sim”, marque o erro como corrigido no logde eventos do cluster e continue com o MAP deverificação de reparo.

v Se “não” ou se o comando listar detalhes docontrolador com falha, continue na próximaetapa.

3. Verifique se o dispositivo recuperou aconectividade. Se não tiver recuperado, verifique aconexão do cabo com a porta do dispositivo remoto.

4. Se todas as tentativas de efetuar login em umaporta de dispositivo remoto tiverem falhado e nãofor possível solucionar o problema por meio da

1630

244 SAN Volume Controller: Guia de Resolução de Problemas

Page 263: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

alteração dos cabos, verifique a condição da portado dispositivo remoto e a condição do dispositivoremoto.

5. Inicie uma operação de descoberta de cluster parareanalisar a rede Fibre Channel.

6. Verifique o status das controladoras de disco. Setodas as controladoras de disco mostrarem umstatus “bom”, marque o erro que você acabou dereparar como “corrigido”. Se algum doscontroladores de disco não mostrar o status “bom”,acesse o MAP de início. Se você retornar a estaetapa, entre em contato com o seu centro de suportepara resolver o problema com a controladora dedisco.

7. Acesse o MAP de verificação de reparo.

FRUs de Causa Possíveis ou outra:

v Nenhuma

Outra:

v Falha da malha da rede Fibre Channel (50%)

v Falha do gabinete/controladora (50%)

1660 A inicialização do disco gerenciadofalhou.

Explicação: A inicialização do disco gerenciado falhou.

Resposta do Usuário:

1. Visualize a entrada do log de eventos e identifiqueo disco gerenciado (MDisk) que estava sendoacessado quando o problema foi detectado.

2. Execute os procedimentos de determinação deproblemas e de reparo da controladora de discopara o MDisk identificado na etapa 1.

3. Inclua o MDisk no cluster.

4. Verifique o status do disco gerenciado. Se todos osdiscos gerenciados mostrarem um status de“on-line”, marque o erro que você acabou dereparar como “corrigido”. Se algum discogerenciado não mostrar um status “on-line”, acesseo MAP de início. Se você retornar a esta etapa, entreem contato com o seu centro de suporte pararesolver o problema com a controladora de disco.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Falha do gabinete/controladora (100%)

1670 A bateria CMOS na placa-mãe dofalhou.

Explicação: A bateria CMOS na placa-mãe do falhou.

Resposta do Usuário: Substitua o nó até a unidadesubstituível em campo estar disponível.

Causa Possível - unidades substituíveis em campo ououtra:

Bateria da CMOS (100%)

1680 Tipo 1 de falha de unidade

Explicação: Tipo 1 de falha de unidade

Resposta do Usuário: Substitua a unidade.

Causa Possível - unidades substituíveis em campo ououtra:

Drive (95%)

A (3%)

Midplane (2%)

1684 Unidade está ausente.

Explicação: Unidade está ausente.

Resposta do Usuário: Instale a unidade ausente. Aunidade é geralmente uma unidade de dados queanteriormente fazia parte da matriz.

Causa Possível - unidades substituíveis em campo ououtra:

Unidade (100%)

1686 Tipo 3 de falha de unidade.

Explicação: Tipo 3 de falha de unidade.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Reposicione a unidade.

2. Substitua a unidade.

3. Substitua a caixa, conforme identificado nos dadosde controle.

4. Substitua o gabinete.

Nota: A remoção da exclusão no slot de unidadeacontecerá automaticamente, mas apenas após este erroter sido marcado como corrigido.FRUs de Causa Possíveis ou outra:

v Unidade (46%)

v Caixa (46%)

v Gabinete (8%)

1660 • 1686

Capítulo 7. Diagnosticando problemas 245

Page 264: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1689 A matriz MDisk perdeu a redundância.

Explicação: A matriz MDisk perdeu a redundância. Osistema RAID 5 está ausente de uma unidade de dados.

Resposta do Usuário: Substitua a unidade ausente oufalhou.

Causa Possível - unidades substituíveis em campo ououtra:

Unidades foi removido ou falhou (100%)

1690 Não existe nenhuma proteçãosobressalente para um ou mais discosgerenciados da matriz.

Explicação: O conjunto sobressalente do sistema nãopode fornecer imediatamente um sobressalente dequalquer adequação para uma ou mais matrizes.

Resposta do Usuário:

1. Configure uma matriz, mas nenhum sobressalente.

2. Configure muitas matrizes e um únicosobressalente. Faça esse sobressalente ser consumidoou altere o seu uso.

Para uma matriz distribuída, as unidades não usadasou candidatas são convertidas em membros de matriz.

1. Decodifique/explique o número de áreas dereconstrução disponíveis e o conjunto de limites.

2. Verifique erros de alta prioridade não corrigidos.

3. Verifique unidades não usadas e candidatascompatíveis para a matriz distribuída. Execute ocomando lsarraymembergoals para determinar acompatibilidade da unidade usando informações detech_type, capacidade e rpm.

v Ofereça para incluir as unidades na matriz.Permita que até o número de membros da matrizausentes sejam incluídos.

v Verifique novamente se os membros da matrizforam incluídos.

4. Se nenhuma unidade estiver disponível, explique seas unidades precisam ser incluídas para restaurar onúmero desejado de áreas de reconstrução.

v Se o limite for maior que o número de áreas dereconstrução disponíveis e o limite for maior que1, ofereça a redução do limite do número deunidades disponíveis.

1691 Um processo de limpeza em segundoplano encontrou uma inconsistênciaentre dados e paridade na matriz.

Explicação: A matriz tem pelo menos um avanço emque dados e paridade não correspondem. O RAIDencontrou uma inconsistência entre os dadosarmazenados nas unidades e as informações deparidade. Isso pode significar que os dados ou asinformações de paridade foram corrompidos.

Resposta do Usuário: Siga o procedimento demanutenção orientado para matrizes inconsistentes.

1692 O disco gerenciado da matriz obteve ummembro sobressalente que nãocorresponde aos objetivos da matriz.

Explicação:

1. Um membro do disco gerenciado da matriz possuitecnologia ou capacidade que não correspondeexatamente com os objetivos estabelecidos damatriz.

2. A matriz é configurada para desejarcorrespondências de locais e o local da unidade nãocorresponde a todos os objetivos de locais.

Resposta do Usuário: O erro se corrigiráautomaticamente assim que a reconstrução ou a trocafor enfileirada. Ele não espera até que a matriz mostrebalanced = exact (que indica que todos os membrospreenchidos possuem correspondência de capacidadeexata e correspondência de local exata).

1693 Troca de unidade necessária.

Explicação: Troca de unidade necessária.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Troque a unidade com falha.

FRUs de Causa Possíveis ou outra:

v Unidade (100%)

1695 Configuração da controladora de discopersistente não suportada.

Explicação: Uma configuração de controladora dedisco que pode impedir o failover para o clusterpersistiu por mais de quatro horas. O problema foioriginalmente registrado por meio de um evento010032, código de erro de serviço 1625.

Resposta do Usuário:

1. Corrija qualquer erro de prioridade mais alta. Emparticular, siga as ações de serviço para corrigir oerro 1625 indicado por esse evento raiz do erro.Esse erro será marcado como “corrigido” quando oevento raiz for marcado como “corrigido”.

2. Se o evento raiz não puder ser localizado, ou estivermarcado como “corrigido”, execute uma descobertade MDisks e marque esse erro como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

1689 • 1695

246 SAN Volume Controller: Guia de Resolução de Problemas

Page 265: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Falha do gabinete/controlador

1700 Relacionamento da cópia remota nãorecuperado

Explicação: Esse erro pode ser relatado após a ação derecuperação para uma falha do sistema em cluster ouuma falha completa do grupo de E/S. O erro é relatadoporque alguns relacionamentos da cópia remota, cujosdados de controle são armazenados pelo grupo de E/S,não puderam ser recuperados.

Resposta do Usuário: Para corrigir esse erro, énecessário excluir todos os relacionamentos que nãopuderam ser recuperados e, em seguida, recriar osrelacionamentos.

1. Observe o índice do grupo de E/S em relação aoqual o erro está registrado.

2. Liste todos os relacionamentos que possuem umvolume principal ou auxiliar nesse grupo de E/S.Use a visualização de volume para determinar quaisvolumes no grupo de E/S você observou quepossuem um relacionamento que está definido.

3. Observe os detalhes dos relacionamentos que estãolistados de modo que eles possam ser recriados.

Se o grupo de E/S afetado tiver relacionamentosativos-ativos que estejam em um grupo deconsistência, execute o comando chrcrelationship-noconsistgrp rc_rel_name para cadarelacionamento ativo-ativo que não tenha sidorecuperado. Em seguida, use o comandolsrcrelatioship no caso de as etiquetas de volumeserem alteradas e para ver o valor dos atributosprincipais.

4. Exclua todos os relacionamentos que estão listadosna etapa 2, exceto qualquer relacionamentoativo-ativo que tenha aplicativos host que usem ovolume auxiliar por meio do ID exclusivo dovolume principal. (ou seja, o valor do atributoprimário é auxiliar na saída do lsrcrelationship).

Para relacionamentos ativo/ativo que possuem ovalor de atributo primário de auxiliar, use ocomando da CLI rmvolumecopy (que também excluio relacionamento). Por exemplo, rmvolumecopymaster_volume_id/name.

Nota: O erro é marcado automaticamente como“corrigido” após o último relacionamento no grupode E/S ser excluído. Os novos relacionamentos nãodevem ser criados até que o erro seja corrigido.

5. Recrie todos os relacionamentos que você excluiuusando os detalhes observados na etapa 3.

Nota: Para relacionamentos do Metro Mirror e doGlobal Mirror, será possível excluir umrelacionamento do sistema principal ou auxiliar; noentanto, deve-se recriar o relacionamento no sistemaprincipal. Portanto, pode ser necessário ir paraoutro sistema para concluir esta ação de serviço.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1710 Há muitas parcerias de cluster. Onúmero de parcerias de cluster foireduzido.

Explicação: Um cluster pode ter uma parceria decluster de um metro mirror e de espelho global comum ou mais outros clusters. Os conjuntos de parceriaconsistem em clusters que estão em parceria diretaentre si ou estão em parceria indireta com uma parceriacom o mesmo cluster intermediário. A topologia doconjunto de parceria não é fixa. A topologia pode seruma estrela, um loop, uma cadeia ou uma malha. Onúmero máximo suportado de clusters em um conjuntode parceria é quatro. Um cluster é um membro de umconjunto de parceria se possuir uma parceria com outrocluster no conjunto, independentemente dessa parceriapossuir grupos de consistência ou relacionamentosdefinidos.

Esses são os exemplos de conjuntos válidos de parceriapara cinco clusters exclusivos rotulados A, B, C, D e Eem que uma parceria é indicada por um traço entredois nomes de cluster:

v A-B, A-C, A-D. E não possui parcerias definidas e,dessa forma, não é um membro do conjunto.

v A-B, A-D, B-C, C-D. E não possui parcerias definidase, dessa forma, não é um membro do conjunto.

v A-B, B-C, C-D. E não possui parcerias definidas e,dessa forma, não é um membro do conjunto.

v A-B, A-C, A-D, B-C, B-D, C-D. E não possui parceriasdefinidas e, dessa forma, não é um membro doconjunto.

v A-B, A-C, B-C, D-E. Há dois conjuntos de parceria.Um contém os clusters A, B e C. O outro contém osclusters D e E.

Esses são os exemplos de configurações nãosuportadas, porque o número de clusters no conjunto écinco, que excede o máximo suportado de quatroclusters:

v A-B, A-C, A-D, A-E.

v A-B, A-D, B-C, C-D, C-E.

v A-B, B-C, C-D, D-E.

O cluster impede que você crie uma nova parceria deMetro Mirror e Global Mirror se um conjunto deparceria resultante excedeu o máximo de quatroclusters. No entanto, se você restaurar um linkquebrado entre dois clusters que têm uma parceria, onúmero de clusters no conjunto pode exceder a quatro.Se isso ocorrer, as parcerias de cluster de metro mirrore de espelho global são excluídas do conjunto até queapenas quatro clusters permaneçam no conjunto. Uma

1700 • 1710

Capítulo 7. Diagnosticando problemas 247

Page 266: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

parceria de cluster excluída de um conjunto tem todasas suas parcerias de cluster de Metro Mirror e GlobalMirror excluídas.

O ID de evento 0x050030 é relatado se o cluster estiverretido no conjunto de parceria. O ID de evento0x050031 é relatado se o cluster for excluído doconjunto de parceria. Todos os clusters que estavam noconjunto de parceria relatam o erro 1710.

Todos os relacionamentos de Metro Mirror e de GlobalMirror interclusters que envolvam um cluster excluídoperderão a conectividade. Se algum dessesrelacionamentos estiver no estadoconsistent_synchronized e receberem uma E/S degravação, eles irão parar com o código de erro 1720.

Resposta do Usuário: Para corrigir este erro, énecessário excluir todos os relacionamentos que nãopuderam ser recuperados e, em seguida, recrie osrelacionamentos.

1. Determine quais clusters ainda estão conectados eos membros do conjunto de parceria, e quaisclusters foram excluídos.

2. Determine os relacionamentos do Metro Mirror e doGlobal Mirror que existem nesses clusters.

3. Determine qual dos relacionamentos de MetroMirror e de Global Mirror que deseja manter, o quedetermina quais parcerias de cluster deseja manter.Assegure que o(s) conjunto(s) de parceria queresulte(m) da configuração das parcerias de clusterque deseja que não contenha mais de quatroclusters em cada conjunto. NOTA: O conjunto deparceria reduzido criado pelo cluster pode nãoconter os clusters que você deseja no conjunto.

4. Remova todos os relacionamentos de Metro Mirrore de Global Mirror que não deseja manter.

5. Remova todos os relacionamentos de cluster deMetro Mirror e Global Mirror que não desejamanter.

6. Reinicie todos os relacionamentos e grupos deconsistência que foram interrompidos.

7. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1720 Metro Mirror (Remote Copy) - Orelacionamento foi interrompido e asincronização foi perdida, por motivodiferente de um erro de E/S persistente(LSYNC)

Explicação: Um relacionamento de cópia remota ouum grupo de consistências precisa ser reiniciado. Emuma operação Metro Mirror (cópia remota) ou GlobalMirror, o relacionamento parou e perdeu a

sincronização, por uma razão diferente de um erro deE/S persistente.

Resposta do Usuário: O administrador deve examinaro estado do sistema para validar que tudo está onlinepara permitir que uma reinicialização funcione.Examinar o estado do sistema também requer averificação das máscaras de porta Fibre Channel (FC)parceiras em ambos os clusters.

1. Se a máscara da porta FC parceira foi alteradarecentemente, verifique se a máscara correta foiselecionada.

2. Execute as etapas necessárias para manter umvolume secundário consistente, se desejado.

3. O administrador deve emitir um comando start.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1740 chave de criptografia Recovery nãodisponível.

Explicação: A chave de criptografia Recovery não estádisponível.

Resposta do Usuário: Faça a chave de criptografia derecuperação disponíveis.

1. Se a chave não está disponível:

v Instalar uma Unidade USB com a chave decriptografia.

v Certifique-se de arquivo correto está na unidadeUSB.

2. Se a chave não é válido:

v Use uma unidade USB com uma chave válidapara este MTMS. A chave não tem um CRCválido.

Causa Possível - unidades substituíveis em campo ououtra:

Não FRU

1741 O módulo Flash está previsto parafalhar.

Explicação: O módulo Flash está previsto para falhardevido ao baixo funcionamento (ID de evento 085023)ou devido a um problema de criptografia (ID de evento085158). Em ambos os casos, a unidade deve sersubstituída.

Resposta do Usuário: Uma unidade de substituiçãodo mesmo tamanho é necessária para corrigir esse erro.

Se existirem quaisquer eventos de matriz mais altos,corrija-os primeiro.

Se não existir nenhum outro evento de matriz,

1720 • 1741

248 SAN Volume Controller: Guia de Resolução de Problemas

Page 267: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

substitua a unidade. Se a matriz for RAID5, substitua eformate a unidade.

Se a matriz for RAID0, corrigir esse problema resultaráem uma perda de todos os dados. Se os dados foremnecessários, faça o seguinte:

1. Faça backup de todos os dados da matriz.

2. Substitua as unidades usando o formatorecoverarray.

3. Restaure os dados da matriz.

Se os dados da matriz não forem necessários, substituaa(s) unidade(s) usando o formato recoverarray.

1750 Tempo de resposta da matriz muito alto.

Explicação: Uma série de causas podem levar a umtempo de resposta da matriz mais alto que o normal.

Resposta do Usuário:

1. Corrija os erros de prioridade mais alta primeiro.

2. Corrija qualquer outro erro conhecido.

3. Altere a matriz no modo de redundância utilizandoa interface charray.

Causa Possível - unidades substituíveis em campo ououtra:

Problemas de ambiente ou de configuração:

Configuração de volume 30%

Unidade lenta 30%

Gabinete 20%

Porta SAS 20%

1780 As mudanças na chave de criptografianão foram confirmadas.

Explicação: Mudanças foram feitas na chave decriptografia, mas as mudanças pendentes não foramconfirmadas. Um procedimento de manutenção direto(DMP) foi ativado para cancelar as mudanças.

Resposta do Usuário: Pressione Avançar para cancelaras mudanças da chave pendentes. Ative a GUI parareiniciar a operação.

1800 A SAN foi incorretamente zoneada.

Explicação: Isto resultou em mais de 512 outras portasna SAN efetuando registro em uma porta de um nó2145.

Resposta do Usuário:

1. Peça ao usuário para reconfigurar a SAN.

2. Marque o erro como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Erro de configuração do comutador Fibre Channel

v Comutador Fibre Channel

1801 Um nó recebeu muitos logins do FibreChannel de outro nó.

Explicação: Esse evento foi registrado porque o nórecebeu mais de dezesseis logins do Fibre Channelprovenientes de outro nó. Isso indica que a rede deárea de armazenamento do Fibre Channel que conectaos dois nós não está configurada corretamente.

Dados:

v Nenhuma

Resposta do Usuário: Altere o zoneamento e/oumáscara da porta do fibre channel de modo que nãomais do que 16 logins são possíveis entre um par denós.

Veja Erro do Nó Não Crítico do “888” na página 205para obter detalhes.

Use o comando lsfabric para visualizar o númeroatual de logins entre os nós.

FRUs de Causa Possíveis ou outra causa:

v Nenhuma

1802 as configurações de rede Fibre Channel

Explicação: as configurações de rede Fibre Channel

Resposta do Usuário: Siga estas etapas de resoluçãode problemas para reduzir o número de hosts que sãoconectados à porta:

1. Aumente a granularidade do zoneamento decomutador para reduzir logins de postas de hostdesnecessários.

2. Altere o zoneamento do comutador para espalhar aportas do host através de outras portas disponíveis.

3. Utilizar interfaces com mais portas, se não estiverno máximo.

4. fora de escala utilizando outro gabinete deFlashSystem.

Causa Possível - unidades substituíveis em campo ououtra:

Não FRU

1750 • 1802

Capítulo 7. Diagnosticando problemas 249

Page 268: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1804 Configurações de rede de IB

Explicação: Configurações de rede de IB

Resposta do Usuário: Siga estas etapas de resoluçãode problemas para reduzir o número de hosts que sãoconectados à porta:

1. Aumente a granularidade do zoneamento decomutador para reduzir logins de postas de hostdesnecessários.

2. Altere o zoneamento do comutador para espalhar aportas do host através de outras portas disponíveis.

3. Utilizar interfaces com mais portas, se não estiverno máximo.

4. fora de escala utilizando outro gabinete deFlashSystem.

Causa Possível - unidades substituíveis em campo ououtra:

Não FRU

1840 O disco gerenciado tem blocosinválidos.

Explicação: Estes erros de mídia "virtual" que sãocriados ao copiar um volume no qual a origem possuierros de mídia. Durante movimentações ou aduplicação de dados, como durante uma cópia flash,será feita uma tentativa para mover os erros de mídiavirtual; para conseguir isso, os erros de mídia virtualchamados “blocos inválidos” são criados. Depois queum bloco inválido foi criado, não será feita nenhumatentativa de ler os dados subjacentes, já que não hágarantia de que os dados antigos ainda existam umavez que o “inválido bloco” é criado. Portanto, épossível ter “blocos inválidos”, e, portanto, erros demídia, relatados em um volume de destino, sem errosde mídia realmente existindo no armazenamentosubjacente. Os registros de “bloco inválido” sãoremovidos quando os dados são sobrescritos por umhost.

Nota: Em um controlador externo, este erro poderesultar apenas de um erro de mídia copiado.

Resposta do Usuário:

1. O centro de suporte irá direcionar o usuário pararestaurar os dados nos volumes afetados.

2. Quando os dados do volume tiverem sidorestaurados ou o usuário escolheu não restaurar osdados, marque o erro como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1850 A cópia de volume compactada possuiblocos inválidos

Explicação: Uma operação de recuperação do sistemafoi executada, mas os dados em um ou mais volumesnão foram recuperados; isso normalmente é causadopor uma combinação de falhas de hardware. Se dadosque contêm um erro de mídia forem copiados oumigrados para outro volume, blocos inválidos serãoregistrados. Se um host tentar ler os dados em qualqueruma das regiões de bloco inválido, a leitura falharácom um erro de mídia.

Resposta do Usuário:

1. O centro de suporte irá direcionar o usuário pararestaurar os dados nos volumes afetados.

2. Quando os dados do volume tiverem sidorestaurados ou o usuário escolheu não restaurar osdados, marque o erro como “corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1860 Cópia do volume thin-provisionedoff-line devido à falha de reparo.

Explicação: A tentativa de reparar os metadados deum volume thin-provisioned que descreve o conteúdodo disco falhou devido a problemas com a cópia debackup mantida automaticamente desses dados. Osdados do evento de erro descrevem o problema.

Resposta do Usuário: Excluir o volume thinprovisioned e reconstruir uma nova a partir de umbackup ou cópia espelhada. Marque o erro como“corrigido”. Além disso, marque o erro 1862 originalcomo “corrigido”.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1862 Cópia do volume thin-provisionedoff-line devido a metadados distorcidos.

Explicação: Um volume thin-provisioned foi colocadono estado off-line porque existe uma inconsistência nosmetadados do cluster que descreve o conteúdo dodisco. Isso pode ocorrer devido à corrupção dos dadosno disco físico (por exemplo, erro de mídia ou de faltade comparação de dados), a perda de metadados emcache (por causa de uma recuperação do cluster) oupor causa de um erro de software. Os dados de eventofornecem informações sobre a razão.

O cluster mantém cópias dos metadados e é possívelreparar o volume thin-provisioned utilizando essesdados.

Resposta do Usuário: O cluster é capaz de reparar a

1804 • 1862

250 SAN Volume Controller: Guia de Resolução de Problemas

Page 269: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

inconsistência em algumas circunstâncias. Execute aopção de reparo do volume para iniciar o processo dereparo. Este processo de reparo, no entanto, pode levaralgum tempo. Em algumas situações, pode ser maisadequado excluir o volume thin-provisioned ereconstruir um novo a partir de um backup ou cópiaespelhada.

Se o procedimento de reparo for executado e concluído,esse erro é automaticamente marcado como“corrigido”. Caso contrário, outro evento de erro(código de erro 1860) é registrada para indicar que aação de reparo falhou.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1864 Violação da limitação de tamanho dovolume compactado, diagnósticonecessário

Explicação: O sistema indica que a capacidade virtualou real de pelo menos um volume compactado excedeseus limites.

Resposta do Usuário: Para obter informações sobrecomo lidar com esse problema, consultewww.ibm.com/support/docview.wss?uid=ssg1S1005731.

1865 Cópia do volume thin-provisionedoff-line devido a espaço insuficiente.

Explicação: Um volume thin-provisioned foi colocadono estado off-line porque existe uma capacidade realalocada insuficiente disponível no volume para oespaço utilizado para aumentar ainda mais. Se ovolume thin-provisioned tiver a expansão automáticaativada, o conjunto de armazenamento no qual ele estátambém não possui espaço livre.

Resposta do Usuário: A ação de serviço diferedependendo se a expansão automática da cópia dovolume thin-provisioned está ou não ativada. Os dadosdo evento de erro indicam se a expansão automáticaestá ativada ou não.

Se a expansão automática da cópia do volume estiverativada, execute uma ou mais das seguintes ações.Quando você tiver executado todas as ações quepretender executar, marque o erro como “corrigido”. Acópia do volume retornará então ao estado on-line.

v Determine por que o espaço livre do conjunto dearmazenamento foi esgotado. Qualquer uma dascópias de volumes thin-provisioned, com a expansãoautomática ativada, neste conjunto dearmazenamento pode ter expandido em uma taxainesperada. Isso pode indicar um erro de aplicativo.Novas cópias do volume podem ter sido criadas no(ou migrado para o) conjunto de armazenamento.

v Aumente a capacidade do conjunto dearmazenamento que está associada à cópia devolumes thin-provisioned incluindo mais MDisks noconjunto de armazenamentos.

v Forneça alguma capacidade livre no conjunto dearmazenamento reduzindo o espaço utilizado. Cópiasde volumes que não são mais necessárias podem serexcluídas, o tamanho das cópias de volume pode serreduzido ou as cópias de volume podem sermigradas para um conjunto de armazenamentodiferente.

v Migre a cópia do volume thin-provisioned para umconjunto de armazenamento que tenha capacidadenão utilizada suficiente.

v Considere a redução do valor do limite de aviso doconjunto de armazenamento para dar mais tempopara alocar espaço extra.

Se a expansão automática da cópia do volume nãoestiver ativada, execute uma ou mais das seguintesações. Nesse caso, o erro será automaticamentemarcado como “corrigido” e a cópia do volumeretornará ao estado on-line quando o espaço estiverdisponível.

v Determine por que o espaço utilizado da cópia dovolume thin-provisioned cresceu na taxa que elepossui. Pode haver um erro de aplicativo.

v Aumente a capacidade real da cópia do volume.

v Ative a expansão automática para a cópia do volumethin-provisioned.

v Considere a redução do valor do limite de aviso dacópia do volume thin-provisioned para dar maistempo para alocar mais espaço real.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1870 Volume espelhado off-line devido a umerro de leitura de hardware.

Explicação: Durante a tentativa de manter o espelhodo volume, um erro de leitura de hardware ocorreu emtodas as cópias de volume sincronizadas.

As cópias de volume podem ser inconsistentes, assim ovolume agora está off-line.

Resposta do Usuário:

v Corrija todos os erros de prioridade mais alta. Emparticular, corrija todos os erros de leitura que foremlistados nos dados de controle. Esse evento de erroserá automaticamente marcado como corrigidoquando o evento raiz for marcado como “corrigido”.

v Se não puder corrigir o erro raiz, mas os erros deleitura em algumas das cópias de volumes tiveremsido corrigidos, marque esse erro como “corrigido”

1864 • 1870

Capítulo 7. Diagnosticando problemas 251

Page 270: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

para executar sem o espelho. É possível então excluira cópia de volume que não pode ler dados e recriá-laem diferentes MDisks.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1895 Mapeamentos de FlashCopy nãorecuperados

Explicação: Este erro pode ser relatado após a ação derecuperação para uma falha do cluster ou uma falhacompleta do grupo de E/S. O erro é relatado porquealgumas FlashCopies, cujos dados de controle sãoarmazenados pelo grupo de E/S, estavam ativas nomomento da falha e o estado atual do mapeamento nãopôde ser recuperado.

Resposta do Usuário: Para corrigir este erro, énecessário excluir todos os mapeamentos de FlashCopyno grupo de E/S que falharam.

1. Observe o índice do grupo de E/S em relação aoqual o erro está registrado.

2. Liste todos os mapeamentos de FlashCopy queestão utilizando este grupo de E/S para seusbitmaps. Você deve obter a visualização detalhadade cada ID de FlashCopy possível. Observe que osIDs dos mapeamentos cuja IO_group_idcorresponda ao ID do grupo de E/S em relação aoqual esse erro é registrado.

3. Observe os detalhes dos mapeamentos FlashCopyque estão listados para que eles possam serrecriados.

4. Exclua todos os mapeamentos FlashCopy listados.Nota: O erro será automaticamente marcado como“corrigido” depois do último mapeamento no grupode E/S ser excluído. Novos mapeamentos nãopodem ser criados até que o erro seja corrigido.

5. Utilizando os detalhes observados na etapa 3, recrietodos os mapeamentos de FlashCopy que acabou deexcluir.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1900 Um comando FlashCopy PrepararAcionador falhou devido a uma falha deesvaziamento de cache.

Explicação: Um comando FlashCopy PrepararAcionador falhou devido a uma falha de esvaziamentode cache.

Resposta do Usuário:

1. Corrija os erros de prioridade mais alta e, emseguida, tente o comando Preparar Acionadornovamente.

2. Marque o erro que você acabou de corrigir como“corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Erro de esvaziamento de cache (100%)

1910 Uma tarefa de mapeamento deFlashCopy foi interrompida por causado erro indicado nos dados de controle.

Explicação: Uma FlashCopy interrompida pode afetaro status de outros volumes no mesmo grupo de E/S. Éaconselhada a preparação das operações FlashCopyinterrompidas o mais rapidamente possível.

Resposta do Usuário:

1. Corrija os erros de prioridade mais alta e, emseguida, prepare e inicie a tarefa de FlashCopynovamente.

2. Marque o erro que você acabou de corrigir como“corrigido”.

3. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1920 Erro persistente de espelho global emetro mirror.

Explicação: Este erro pode ser causado por umproblema no cluster principal, um problema no clustersecundário ou um problema no link intersistêmico. Oproblema pode ser uma falha de um componente, umcomponente se tornando indisponível ou uma reduçãode desempenho por causa de uma ação de serviço oupode ser que o desempenho de um componente tenhacaído até um nível em que o relacionamentos de MetroMirror ou de Espelho Global não possa ser mantido.Alternativamente, o erro pode ser causado por umaalteração nos requisitos de desempenho dos aplicativosutilizando o metro mirror ou o espelho global.

Esse erro é relatado no cluster principal quando orelacionamento de cópia não progrediu suficientementedurante um período de tempo. Portanto, se orelacionamento for reiniciado antes que todos osproblemas sejam corrigidos, o erro poderá ser relatadonovamente quando o próximo período de tempoexpirar (o período padrão é de cinco minutos).

Esse erro também pode ser relatado porque o clusterprincipal encontrou erros de leitura.

É possível que precise consultar as informações dos

1895 • 1920

252 SAN Volume Controller: Guia de Resolução de Problemas

Page 271: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

recursos dos Serviços de Cópia na documentação deinstalação e configuração do software enquantodiagnostica este erro.

Resposta do Usuário:

1. Se o erro 1920 tiver ocorrido anteriormente nometro mirror ou no espelho global entre osmesmos clusters e todas as seguintes ações tiveremsido tentadas, entre em contato com seu centro desuporte do produto para solucionar o problema.

2. Em ambos os clusters, verifique a máscara daporta fc para assegurar que há conectividadesuficiente. Se a máscara da porta fc do parceiro foialterada recentemente, assegure-se de que amáscara esteja correta.

3. No cluster principal relatando o erro, corrija todosos erros de prioridade mais alta.

4. No cluster secundário, revise os logs demanutenção para determinar se o cluster estavaoperando com capacidade reduzida no momentoem que o erro foi relatado. A capacidade reduzidapode ser devido a um upgrade de software, umamanutenção de hardware para um nó, manutençãopara um sistema de disco de backend ou umamanutenção para a SAN.

5. No cluster secundário, corrija todos os erros quenão estão corrigidos.

6. No link intercluster, revise os registros de cadacomponente de link para localizar todos osincidentes que poderiam causar a redução dacapacidade no momento do erro. Assegure-se deque os problemas sejam corrigidos.

7. Se um motivo para o erro foi localizado ecorrigido, acesse a Ação 11.

8. No cluster principal que relata o erro, examine asestatísticas usando uma ferramenta demonitoramento de produtividade da SAN econfirme se todos os requisitos de Metro Mirror eGlobal Mirror descritos na documentação deplanejamento são atendidos. Assegure que todas asalterações nos aplicativos utilizando Metro Mirrorou Global Mirror tenham sido consideradas.Resolva todos os problemas.

9. No cluster secundário, examine as estatísticasusando uma ferramenta de monitoramento deprodutividade da SAN e confirme se todos osrequisitos de Metro Mirror e Global Mirrordescritos na instalação do software e nadocumentação da configuração são atendidos.Resolva todos os problemas.

10. No link intercluster, examine o desempenho decada componente utilizando uma ferramenta demonitoramento de produtividade da SANadequada para assegurar que eles estejamoperando conforme o esperado. Resolva todos osproblemas.

11. Marque o erro como “corrigido” e reinicie orelacionamento de Metro Mirror ou de GlobalMirror.

Ao reiniciar o relacionamento de Metro Mirror ou deGlobal Mirror haverá um período inicial durante o qualo Metro Mirror ou Global Mirror executará uma cópiaem segundo plano para ressincronizar os dados dovolume nos clusters principal e secundário. Duranteesse período, os dados nos volumes auxiliares de MetroMirror ou Global Mirror no cluster secundário sãoinconsistentes e os volumes não podem ser utilizadoscomo discos de backup por seus aplicativos.

Nota: Para assegurar que o sistema tenha capacidadede manusear o carregamento da cópia de plano defundo, você pode querer atrasar a reinicialização dorelacionamento de Metro Mirror ou de Global Mirroraté que haja um período tranquilo em que o clustersecundário e a malha SAN (incluindo o linkintercluster) tenham a capacidade necessária. Se acapacidade necessária não estiver disponível, você podeexperimentar outro erro 1920 e o relacionamento deMetro Mirror ou de Global Mirror será interrompidoem um estado inconsistente.

Nota: Se o relacionamento de Metro Mirror ou deGlobal Mirror tiver sido interrompido em um estadoconsistente (“interrompido consistentemente”) épossível utilizar os dados nos volumes auxiliares deMetro Mirror ou Global Mirror no cluster secundáriocomo discos de backup para seus aplicativos. Épossível que queira iniciar uma FlashCopy de seusdiscos auxiliares Metro Mirror ou Global Mirror nosistema secundário antes de reiniciar o relacionamentode Metro Mirror ou de Global Mirror. Isso significamanter a imagem atual e consistente até o momento emque o relacionamento de Metro Mirror ou de GlobalMirror estar novamente sincronizado e em um estadoconsistente.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

v Problema no cluster principal ou na malha SAN(10%)

v Configuração do cluster principal ou da malha SAN(10%)

v Problema no cluster secundário ou na malha SAN(15%)

v Configuração do cluster secundário ou da malhaSAN (25%)

v Problema de link intercluster (15%)

v Configuração de link intercluster (25%)

1925 Dados em cache não podem ser movidosdo cache.

Explicação: O diagnóstico do problema é necessário.

Resposta do Usuário:

1925

Capítulo 7. Diagnosticando problemas 253

Page 272: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

1. Execute o procedimento de manutenção direcionadopara corrigir todos os erros de uma prioridade maisalta. Isso permitirá que os dados em cache possamser movidos do cache e que o evento originadorseja marcado como corrigido.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1930 Migração suspensa.

Explicação: Migração suspensa.

Resposta do Usuário:

1. Assegure que todos os códigos de erro de umaprioridade mais alta já tenham sido corrigidos.

2. Peça ao cliente para assegurar que todos osconjuntos de armazenamento que sejam o destinode operações de migração suspensas possuamextensões livres disponíveis.

3. Marque este erro como “corrigido”. Isso faz comque a operação de migração seja reiniciada. Se areinicialização falhar, um novo erro será registrado.

4. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

1940 O volume ou grupo de consistências doHyperSwap perdeu a sincronizaçãoentre os sites.

Explicação: O volume ou grupo de consistências doHyperSwap perdeu a sincronização entre os sites.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Verifique o log de eventos para obter quaisquererros sem correção de prioridade mais alta.

2. Os volumes do HyperSwap serão sincronizadosnovamente de forma automática quando oproblema subjacente tiver sido resolvido.

FRUs de Causa Possíveis ou outra:

v N/D

1950 Não é possível espelhar o erro de mídia.

Explicação: Durante a sincronização de uma cópia devolume espelhado foi necessário duplicar o registro deum erro de mídia na cópia de volume, criando um errode mídia virtual. Cada disco gerenciado possui umatabela de erros médios virtuais. O erro médio virtualnão pôde ser criado porque a tabela está cheia. A cópiado volume está em um estado inconsistente e foicolocada off-line.

Resposta do Usuário: Três abordagens diferentespodem ser assumidas para resolver este problema: 1) acópia do volume de origem pode ser corrigido paraque não contenha erros de mídia, 2) o número de errosde mídia virtual no disco gerenciado de destino podeser reduzido ou 3) a cópia do volume de destino podeser movida para um disco gerenciado com maisentradas de erro de mídia virtual livres.

O disco gerenciado com uma tabela de erro de mídiacheia pode ser determinado a partir dos dados doevento raiz.

Abordagem 1) - Este é o procedimento preferidoporque ele restaura a cópia do volume de origem paraum estado onde todos os dados podem ser lidos.Utilize os procedimentos de serviço normais paracorrigir um erro de mídia (regrave o bloco ou volume apartir do backup ou gere novamente os dadosutilizando procedimentos locais).

Abordagem 2) - Este método pode ser utilizado se amaioria dos erros de mídia virtual no disco gerenciadode destino não se relacionar à cópia de volume.Determine onde estão os erros de mídia virtualutilizando o log de eventos e regrave o bloco ouvolume a partir do backup.

Abordagem 3) - Exclua a cópia de volume off-line ecriar uma nova forçando a utilização de MDisksdiferentes no conjunto de armazenamento ou utilizandoum conjunto de armazenamento completamentediferente.

Siga sua(s) opção(ões) de seleção e, em seguida,marque o erro como “corrigido”.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

2008 Um downgrade de software falhou.

Explicação: Alterações na configuração de clusterestão restritas até o downgrade ser concluído. Oprocesso de downgrade do cluster aguarda pelaintervenção do usuário quando este erro é registrado.

Resposta do Usuário: A ação necessária pararecuperar a partir de um downgrade paralisadodepende do estado atual do cluster que está sendosubmetido ao downgrade. Entre em contato com oSuporte IBM para obter um plano de ação para resolveresse problema.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Software do sistema (100%)

1930 • 2008

254 SAN Volume Controller: Guia de Resolução de Problemas

Page 273: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2010 Uma atualização de software falhou.

Explicação: Mudanças na configuração de cluster estãorestritas até que a atualização seja concluída ouretrocedida. O processo de atualização de cluster esperaa intervenção do usuário quando esse erro é registrado.

Resposta do Usuário: A ação necessária pararecuperar-se de uma atualização paralisada depende doestado atual do cluster que está sendo atualizado. Entreem contato com o suporte técnico IBM para obter umplano de ação para resolver esse problema.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Software do sistema (100%)

2016 Uma porta do host possui mais dequatro logins para um nó

Explicação: Mais de 4 logins foram feitos em pelomenos uma porta do host ou WWPN em pelo menosum nó. A rede pode não estar zoneada corretamente.

Resposta do Usuário: Conclua as etapas a seguir. Se,em qualquer ponto, for necessária assistência adicional,entre em contato com seu representante de suporte deserviço.

1. Crie uma lista dos hosts, WWPNs e nós comproblema:

a. Execute o comando svcinfo lsfabric e analise asaída em um formato legível por humano.

b. Filtre por tipo=host.

c. Classifique por WWPN, em seguida, por nó.

d. Para qualquer combinação de WWPN e nó quemostra mais de 4 logins:

1) Obtenha a máscara da porta do host a partirdo campo de máscara da visualizaçãodetalhada de lshost.

2) Ignore qualquer linha na qual o campolocal_port não corresponde ao bit apropriadona máscara da porta do host.

3) Anote quaisquer hosts que ainda mostremmais de 4 logins após a máscara da porta dohost ser aplicada.

2. Corrija o problema mudando o zoneamento oumudando a máscara da porta do host.

3. O evento será corrigido automaticamente quandotodas as portas do host tiverem contagens de loginiguais a 4 ou menos em cada nó.

2020 Link de Cópia Remota de IPindisponível.

Explicação: Link de Cópia Remota de IP indisponível.

Resposta do Usuário: Corrija o link do IP remoto paraque o tráfego possa fluir corretamente. Uma vez que aconexão estiver estabelecida, o erro será autocorrigido.

2021 Endereço IP de cluster de parceiroinalcançável.

Explicação: Endereço IP de cluster de parceiroinalcançável.

Resposta do Usuário:

1. Verifique o endereço IP do sistema remoto que estáformando a parceria.

2. Verifique se o endereço IP do cluster remoto estáalcançável pelo cluster local. A seguir, o que podeser feito para verificar a acessibilidade:

a. Use svctask para efetuar ping do endereço IPremoto. Se o ping funcionar, pode haver umbloco no tráfego da porta específica que precisaser aberta na rede. Se o ping não funcionar, nãopoderá haver rota entre o sistema. Verifique aconfiguração de gateway do IP no SAN VolumeController nós e a configuração da rede IP.

b. Verifique a configuração dos roteadores e dofirewall para assegurar que a porta TCP/IP 3620usada para a replicação do IP não estejabloqueada.

c. Use o comando ssh a partir de outro sistemapara tentar estabelecer uma sessão com endereçoIP do cluster remoto problemático paraconfirmar que o cluster remoto é operacional.

2022 Não é possível autenticar com o clusterparceiro.

Explicação: Não é possível autenticar com o clusterparceiro.

Resposta do Usuário: Verifique se o conjunto dosegredo do CHAP da parceria que usa as CLIsmkippartnership ou chpartnership correspondem aoconjunto do segredo do CHAP remoto que usa a CLIchsystem. Se não corresponderem, use os comandosapropriados para configurar os segredos do CHAPcorretos.

2023 ID de cluster inesperado para o clusterde parceiro.

Explicação: ID de cluster inesperado para o cluster deparceiro.

Resposta do Usuário: Após excluir todos osrelacionamentos e grupo de consistências, remova aparceria.

Este é um erro irrecuperável quando um dos sites

2010 • 2023

Capítulo 7. Diagnosticando problemas 255

Page 274: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

passou por uma recuperação T3 e perdeu todas asinformações da parceria. Entre em contato com osuporte IBM.

2030 Erro de software.

Explicação: O software foi reiniciado devido a umproblema no cluster, em um sistema de disco ou namalha do Fibre Channel.

Resposta do Usuário:

1. Colete o(s) arquivo(s) de dump do softwaregerado(s) no momento em que o erro foi registradono cluster.

2. Entre em contato com o centro de suporte doproduto para investigar e resolver o problema.

3. Assegure que o software esteja no nível maisrecente no cluster e nos sistemas de disco.

4. Utilize as ferramentas de monitoramento SANdisponíveis para verificar quaisquer problemas namalha.

5. Marque o erro que você acabou de corrigir como“corrigido”.

6. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Seu centro de suporte pode indicar uma FRU combase em sua análise de problemas (2%)

Outra:

v Software (48%)

v Software do gabinete/controlador (25%)

v Comutador Fibre Channel ou configuração docomutador (25%)

2035 A unidade desativou o suporte àsinformações de proteção.

Explicação: Uma matriz foi interrompida no processode estabelecer as informações de proteção deintegridade de dados em um ou mais de seus membrospor gravações iniciais ou gravações de reconstrução.

Para assegurar que a matriz seja utilizável, o sistemadesligou a proteção de dados de hardware para aunidade do membro.

Resposta do Usuário: Se muitas ou todas as unidadesdo membro em uma matriz tiverem registrado esse erroe existir armazenamento suficiente no conjunto paramigrar as extensões alocadas, a estratégia mais simplesé excluir a matriz e recriá-la assim que a ação deserviço da unidade tiver sido realizada.

Se um pequeno número de unidades for afetado, émais simples remover essas unidades da matriz e fazera manutenção delas individualmente. Essa opção não épossível se a matriz estiver sincronizando atualmenteapós a recuperação.

2040 Uma atualização de software énecessária.

Explicação: O software não pode determinar o VPDpara uma FRU. Provavelmente, uma nova FRU foiinstalada e o software não reconhece essa FRU.

Resposta do Usuário:

1. Se uma FRU tiver sido substituída, assegure que apeça de substituição correta foi utilizada. O VPD donó indica que a peça não foi reconhecida.

2. Assegure que o software de cluster esteja no nívelmais recente.

3. Salve os dados de dump com o dump deconfiguração e dump de dados registrados.

4. Entre em contato com o centro de suporte doproduto para resolver o problema.

5. Marque o erro que você acabou de corrigir como“corrigido”.

6. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Software do sistema (100%)

2055 Reinicialização do sistema necessária.

Explicação: Reinicialização do sistema necessária.

Resposta do Usuário: A atualização do software nãofoi concluída. Reinicialize o sistema.

O sistema não ficará disponível para o gerenciamentode sistemas e de Entrada/Saída durante areconfiguração do sistema.

2060 Descarga manual de baterias necessária.

Explicação: Descarga manual de baterias necessária.

Resposta do Usuário: Use chenclosureslot -battery-slot 1 -recondition on para causar a calibração dabateria.

2070 Uma unidade foi detectada em umgabinete que não suporta essa unidade.

Explicação: Uma unidade foi detectada em umgabinete que não suporta essa unidade.

Resposta do Usuário: Remova a unidade. Se oresultado for um número inválido de unidades,substitua a unidade por uma unidade válida.

Causa Possível - unidades substituíveis em campo ououtra:

Unidade (100%)

2030 • 2070

256 SAN Volume Controller: Guia de Resolução de Problemas

Page 275: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2100 Ocorreu um erro de software.

Explicação: Um dos componentes de software doservidor V3700 (sshd, crond ou httpd) falhou e relatouum erro.

Resposta do Usuário:

1. Assegure que o software esteja no nível maisrecente no cluster.

2. Salve os dados de dump com o dump deconfiguração e dump de dados registrados.

3. Entre em contato com o centro de suporte doproduto para resolver o problema.

4. Marque o erro que você acabou de corrigir como“corrigido”.

5. Acesse o MAP de verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

Outra:

Software V3700 (100%)

2115 Desempenho de MDisk externo alterado

Explicação: O sistema identificou uma mudança nacategoria de desempenho de um MDisk externo. Umdispositivo de armazenamento no sistema externo podeter sido substituído por um dispositivo que tenhacaracterísticas de desempenho diferentes em relação aooriginal. O ID do MDisk é registrado no evento (de 5 a8 bytes dos dados de status). Pode ser necessárioreconfigurar a camada do MDisk para que o EasyTierfaça melhor uso do armazenamento.

Resposta do Usuário: Execute o procedimento decorreção para este evento, que o ajuda com as tarefas aseguir:

1. Execute a tarefa Detectar MDisks, para que osistema determine a categoria de desempenho atualde cada Mdisk. Quando a tarefa de detecção estiverconcluída, se o desempenho for revertido, o eventoserá automaticamente marcado como corrigido.

2. Se o evento não for corrigido automaticamente, serápossível alterar a camada do MDisk para a camadarecomendada mostrada nas propriedades do evento.A camada recomendada é registrada no evento (de9 a 13 bytes dos dados de status. Um valor de 10hexadecimal indica camada flash, um valor de 20hexadecimal indica camada corporativa).

3. Se você escolher não alterar a configuração dacamada, marque o evento como corrigido.

2258 O certificado SSL do sistema expirou.

Explicação: O certificado SSL do sistema expirou.

As conexões na GUI, no assistente de serviço e noCIMOM provavelmente gerenciam as exceções desegurança.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Acesse a CLI usando ssh.

2. Verifique se a hora e data do sistema estão corretas.Se estiver incorreto, poderá causar uma marcaçãoincorreta no certificado como expirado.

3. Crie um novo certificado do sistema autoassinadoou crie uma solicitação de certificado. Obtenha umaassinatura de sua autoridade de certificação einstale a solicitação assinada.

Nota: Se levar um tempo para obter o certificadoassinado, também será possível criar um certificadoauto-assinado para usar enquanto aguarda pelaassinatura do seu certificado.

FRUs de Causa Possíveis ou outra:

v N/D

2259 O modo de compatibilidade do StorwizeV7000 Gen1 já pode ser desativado nestesistema.

Explicação: Nenhuma outra caixa do Storwize V7000Gen1 está conectada ao sistema.

Resposta do Usuário:

v Se quiser desativar o modo de compatibilidade doStorwize V7000 Gen1, insira o comando a seguir:

chsystem -gen1compatibilitymode no

v Se quiser manter o modo de compatibilidade doStorwize V7000 Gen1, é possível reconectar caixas doStorwize V7000 Gen1 ao cluster.

2500 Foi atingido um limite de sessão deshell seguro (SSH) para o cluster.

Explicação: Sessões de shell seguro (SSH) sãoutilizadas por aplicativos que gerenciam o cluster. Umexemplo desses aplicativos é a interface da linha decomandos (CLI). Um aplicativo deve inicialmenteefetuar login no cluster para criar uma sessão SSH. Ocluster impõe um limite no número de sessões SSH quepodem ser abertas por vez. Esse erro indica que olimite no número de sessões SSH foi atingido e que nãopodem ser aceitos mais logins até que uma sessão atualefetue logout.

O limite no número de sessões SSH geralmente éatingido porque diversos usuários abriram uma sessãoSSH, mas esqueceram de fechar a sessão SSH quandodeixaram de utilizar o aplicativo.

2100 • 2500

Capítulo 7. Diagnosticando problemas 257

Page 276: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resposta do Usuário:

v Como esse erro indica um problema com o númerode sessões que estão tentando acesso externo aocluster, determine a razão para muitas sessões SSHterem sido abertas.

v Execute o Procedimento de Correção para este errono painel em Gerenciamento de Resolução deProblemas da GUI > Ações Recomendadas paravisualizar e gerenciar as sessões SSH abertas.

2550 Chave de criptografia na unidade flashUSB removida

Explicação: A unidade flash USB em um nó ou umaporta específica foi removida. Essa unidade flash USBcontinha uma chave de criptografia válida para osistema. A remoção desautorizada pode comprometer asegurança dos dados.

Resposta do Usuário: Se seus dados foramcomprometidos, execute uma operação derechaveamento imediatamente.

2555 Erro de chave de criptografia na unidadeflash USB.

Explicação: É necessário fornecer uma chave decriptografia antes que o sistema possa se tornartotalmente operacional. Esse erro ocorre quando achave de criptografia identificada é inválida. Umarquivo com o nome correto foi localizado mas a chaveno arquivo está corrompida.

Resposta do Usuário: Remova a unidade flash USB daporta.

2600 O cluster não pode enviar um e-mail.

Explicação: O cluster tentou enviar um e-mail emresposta a um evento, mas não houve confirmação deque ele foi recebido com êxito pelo servidor de correioSMTP. A falha pode ter ocorrido porque o cluster nãopôde se conectar ao servidor SMTP configurado, oe-mail pode ter sido rejeitado pelo servidor ou pode terocorrido um tempo limite. O servidor SMTP pode nãoestar executando ou pode não estar corretamenteconfigurado, ou o cluster pode não estar corretamenteconfigurado. Este erro não é registrado pela função deteste de e-mail porque ela responde imediatamente comum código de resultado.

Resposta do Usuário:

v Assegure que o servidor de e-mail SMTP esteja ativo.

v Assegure que o endereço TCP/IP do servidor SMTPe a porta estejam corretamente definidos naconfiguração de e-mail do cluster.

v Enviar um e-mail de teste e valide que a mudançatenha corrigido o problema.

v Marque o erro que você acabou de corrigir comocorrigido.

v Acesse MAP 5700: Verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

2601 Erro detectado durante o envio de ume-mail.

Explicação: Ocorreu um erro enquanto o cluster estavatentando enviar um e-mail em resposta a um evento. Ocluster não pode determinar se o e-mail foi enviado etentará enviá-lo novamente. O problema pode ser como servidor SMTP ou com a configuração de e-mail docluster. O problema também pode ser causado por umfailover do nó de configuração. Este erro não éregistrado pela função de teste de e-mail porque elaresponde imediatamente com um código de resultado.

Resposta do Usuário:

v Se houver erros de prioridade mais alta nãocorrigidos no log, corrija esses erros primeiro.

v Assegure que o servidor de e-mail SMTP esteja ativo.

v Assegure que o endereço TCP/IP do servidor SMTPe a porta estejam corretamente definidos naconfiguração de e-mail do cluster.

v Enviar um e-mail de teste e valide que a mudançatenha corrigido o problema.

v Marque o erro que você acabou de corrigir comocorrigido.

v Acesse MAP 5700: Verificação de reparo.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

2700 Não é possível acessar o servidor dehorário de rede NTP

Explicação: O tempo do cluster não pode sersincronizado com o servidor de tempo de rede NTPconfigurado.

Resposta do Usuário: Existem três causas principaispara examinar:

v A configuração do servidor de horário de rede (NTP)está incorreto. Assegure-se de que o endereço IPconfigurado corresponda ao do servidor de tempo derede NTP.

v O servidor de tempo de rede NTP não estáoperacional. Verifique o status do servidor de tempode rede NTP.

v A rede TCP/IP não está configurada corretamente.Verifique a configuração dos roteadores, gateways efirewalls. Assegure-se de que o cluster possa acessaro servidor de tempo de rede NTP e de que oprotocolo NTP seja permitido.

2550 • 2700

258 SAN Volume Controller: Guia de Resolução de Problemas

Page 277: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O erro será corrigido automaticamente quando ocluster estiver pronto para sincronizar seu tempo com oservidor de tempo de rede NTP.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

2702 Verifique as definições de configuraçãodo servidor NTP no CMM

Explicação: O nó está configurado para definirautomaticamente o horário usando um servidor NTPno CMM. Não é possível se conectar ao servidor NTPdurante a autenticação. A configuração do servidorNTP não pode ser alterado no S-ITE. No CMM, háconfigurações NTP alteráveis. No entanto, essasconfigurações definem como o CMM obtém o horário ea data – o servidor CMM NTP interno que é usadopelo S-ITE não pode ser alterado ou configurado. Esseevento é levantado somente quando é feita umatentativa de usar o servidor - uma vez a cada meiahora.

Nota: As definições de configuração do NTP sãorelidas a partir do CMM antes de cada conexão.A razão para um erro de conexão pode ser devido aoseguinte:

v todas as portas Ethernet adequadas estão offline

v o hardware CMM não está operacional

v o CMM está ativo, mas o servidor CMM NTP estáoffline.

A razão para um erro de autenticação pode ser devidoao seguinte:

v os valores de autenticação fornecidos eram inválidos

v o servidor NTP rejeitou a chave de autenticaçãofornecida para o nó pelo CMM.

Se a porta NTP for um valor não suportado, um errode porta poderá ser exibido. Atualmente, somente aporta 123 é suportada. Somente o nó de configuraçãoatual tenta a ressincronização com o servidor.

Resposta do Usuário:

1. Certifique-se de que o CMM esteja operacional,efetuando login no e confirmando seu horário.

2. Verifique se o endereço IP no log de eventos podeser submetido a ping a partir do nó.

3. Se houver um erro, tente reinicializar o CMM.

3000 Temperatura ambiente da UPS alta

Explicação: O sensor de temperatura na UPS estárelatando uma temperatura que está próxima do limiteoperacional da unidade. Se a temperatura continuaraumentando, a UPS será desligada por motivo desegurança. Provavelmente, o sensor está relatando umatemperatura excessivamente alta porque o ambiente no

qual a UPS está operando é muito quente.

Resposta do Usuário:

1. Assegure-se de que a temperatura ambiente da salaesteja dentro dos limites permitidos.

2. Assegure-se de que as ventilações de ar na partefrontal e traseira da UPS não estejam obstruídas.

3. Assegure-se de que os outros dispositivos nomesmo rack não estejam superaquecendo.

4. Quando estiver satisfeito com a resolução da causado superaquecimento, marque o erro como“corrigido”.

3001 Temperatura ambiente da UPS alta

Explicação: O sensor de temperatura na UPS estárelatando uma temperatura que está próxima do limiteoperacional da unidade. Se a temperatura continuaraumentando, a UPS será desligada por motivo desegurança. Provavelmente, o sensor está relatando umatemperatura excessivamente alta porque o ambiente noqual a UPS está operando é muito quente.

Resposta do Usuário:

1. Assegure-se de que a temperatura ambiente da salaesteja dentro dos limites permitidos.

2. Assegure-se de que as ventilações de ar na partefrontal e traseira da UPS não estejam obstruídas.

3. Assegure-se de que os outros dispositivos nomesmo rack não estejam superaquecendo.

4. Quando estiver satisfeito com a resolução da causado superaquecimento, marque o erro como“corrigido”.

3010 Foi detectado um erro de software dafonte de alimentação ininterruptainterna.

Explicação: Alguns dos testes que são executadosdurante a inicialização do nó não foram concluídosporque alguns dos dados relatados pela fonte dealimentação ininterrupta durante a inicialização do nósão inconsistentes devido a um erro de software nafonte de alimentação ininterrupta. O nó determinouque a fonte de alimentação ininterrupta estáfuncionando suficientemente para o nó continuar asoperações. A operação do cluster não é afetado por esseerro. Esse erro geralmente é resolvido desligando eligando a fonte de alimentação ininterrupta.

Resposta do Usuário:

1. Desligue e ligue novamente a fonte de alimentaçãoininterrupta em um momento conveniente. Um oudois nós conectados à fonte de alimentaçãoininterrupta deve(m) ser desligado(s) antes dodesligamento da fonte de alimentação ininterrupta.Depois de os nós serem desligados, aguarde 5minutos para a fonte de alimentação ininterruptaentrar no modo de espera (LED AC verdepiscando). Se isto não ocorrer automaticamente,

2702 • 3010

Capítulo 7. Diagnosticando problemas 259

Page 278: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

verifique o cabeamento para confirmar que todos osnós alimentados por essa fonte de alimentaçãoininterrupta tenham sido desligados. Remova ocabo de entrada de energia da fonte de alimentaçãoininterrupta e aguarde pelo menos 2 minutos para afonte de alimentação ininterrupta para limpar seuestado interno. Reconecte o cabo de entrada dafonte de alimentação ininterrupta. Pressione o botãoON da fonte de alimentação ininterrupta. Ligue osnós conectados a essa fonte de alimentaçãoininterrupta.

2. Se o erro for relatado novamente depois dos nósserem reiniciados, substitua o conjuntoeletroeletrônico do 2145 UPS.

Causa Possível - unidades substituíveis em campo ououtra:

v Conjunto eletroeletrônico do 2145 UPS (5%)

Outra:

v Erro temporário do 2145 UPS (95%)

3024 A conexão de porta técnica inválida

Explicação: O código detectou mais de um endereçoMAC por meio da conexão, ou o DHCP forneceu maisde um endereço. O código desse modo acredita quehaja um comutador conectado.

Resposta do Usuário:

1. Remova o cabo da porta técnica.

2. (Opcional) Desative adaptadores de rede adicionaisno laptop para o qual ele está conectado ao.

3. Verifique se o DHCP estiver ativado no adaptadorde rede.

4. Se isso não foi possível, configure manualmente oendereço IP para 192.168.0.2

5. Conecte um cabo Ethernet padrão entre o adaptadorde rede e a porta técnica.

6. Se isto ainda não funcionar, reinicialize o nó e repitaas etapas acima.

7. Este evento será auto-correção depois que nenhumaconexão ou uma conexão válida foi detectada.

3025 Uma licença do recurso de virtualizaçãoé necessária.

Explicação: O cluster não possui licença do recurso devirtualização registrado. Você deve ter uma licença dorecurso de virtualização do Entry Edition Physical Diskou uma licença do recurso de virtualização deCapacidade abrange o cluster.

O cluster continuará operando, mas pode violar ascondições da licença.

Resposta do Usuário:

v Se não tiver uma licença do recurso de virtualizaçãoválida e suficiente para este cluster, entre em contato

com o representante de vendas IBM, organize umalicença e altere as configurações da licença para ocluster para registrar a licença.

v O erro será automaticamente corrigido quando asituação for resolvida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3029 A capacidade do recurso de virtualizaçãonão é válida.

Explicação: A configuração para a quantia de espaçoque pode ser virtualizado não é válida. O valor deveser um número inteiro de terabytes.

Este evento de erro é criado quando um cluster foratualizado a partir de uma versão anterior à 4.3.0 paraa versão 4.3.0 ou posterior. Antes da versão 4.3.0 ovalor de capacidade do recurso de virtualização era emgigabytes e, portanto, pode ser definido para umafração de um terabyte. Com a versão 4.3.0 e posterior, acapacidade licenciada para o recurso de virtualizaçãodeve ser um número inteiro de terabytes.

Resposta do Usuário:

v Revise as condições de licença para o recurso devirtualização. Se houver um cluster, altere asconfigurações de licença para o cluster corresponderà capacidade que está licenciada. Se a sua licençacobrir mais de um cluster, divida um número inteirode terabytes para cada cluster. É possível ter quealterar a capacidade de virtualização que estádefinida no outros clusters para assegurar que asoma das capacidades para todos os clusters nãoexceda a capacidade licenciada.

v É possível visualizar os dados do evento ou o log dorecurso para assegurar que a capacidade licenciadaseja suficiente para o espaço que está realmentesendo utilizado. Entre em contato com orepresentante de vendas IBM se quiser alterar acapacidade da licença.

v Este erro será ser corrigido automaticamente quandouma configuração válida for inserida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3030 Capacidade dos recursos de espelhoglobal e metro mirror não configurada.

Explicação: Os recursos de Global e Metro Mirrorestão configurados como Ligados para o sistema, mas acapacidade não foi configurada.

Resposta do Usuário: Execute uma das seguintesações:

3024 • 3030

260 SAN Volume Controller: Guia de Resolução de Problemas

Page 279: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Mude as configurações de licença do Global e MetroMirror para o sistema para a capacidade licenciadado Global e Metro Mirror ou, se a licença se aplicar amais de um sistema, para a parte da licença alocadapara esse sistema. Configure a capacidade licenciadade espelho global e metro mirror para zero se nãoestiver mais sendo utilizada.

v Visualize os dados do evento ou o log do recursopara assegurar que a capacidade licenciada deespelho global e metro mirror seja suficiente para oespaço que está realmente sendo utilizado. Entre emcontato com o representante de vendas IBM se quiseralterar a capacidade licenciada de espelho global emetro mirror.

v O erro será automaticamente corrigido quando umaconfiguração válida for inserida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3031 Capacidade do recurso FlashCopy nãoconfigurada.

Explicação: O recurso FlashCopy está configuradocomo Ligado para o sistema, mas a capacidade não foiconfigurada.

Resposta do Usuário: Execute uma das seguintesações:

v Mude as configurações de licença de FlashCopy parao sistema ou para a capacidade licenciada deFlashCopy ou, se a licença se aplicar a mais de umsistema, para a parte da licença alocada a essesistema. Configure a capacidade licenciada deFlashCopy para zero se não estiver mais sendoutilizada.

v Visualize os dados do evento ou o log do recursopara assegurar que a capacidade licenciada deFlashCopy seja suficiente para o espaço que estárealmente sendo utilizado. Entre em contato com orepresentante de vendas IBM se quiser alterar acapacidade licenciada de FlashCopy.

v O erro será automaticamente corrigido quando umaconfiguração válida for inserida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3032 Limite de licença de recurso excedido.

Explicação: A quantia de espaço que está licenciadapara um recurso de cluster está sendo excedida.

O recurso que está sendo excedido pode ser:

v Recurso de virtualização - identificador de evento009172

v Recurso FlashCopy - identificador de evento 009173

v Recurso de espelho global e metro mirror -identificador de evento 009174

O cluster continuará operando, mas pode violar ascondições da licença.

Resposta do Usuário:

v Determine que limite de licença do recurso foiexcedido. Isso pode ser:

v Recurso de virtualização - identificador de evento009172

v Recurso FlashCopy - identificador de evento 009173

v Recurso de espelho global e metro mirror -identificador de evento 009174

v Assegure que a capacidade de recurso relatada pelocluster tenha sido definida para corresponder aotamanho da licença ou, se a licença se aplicar a maisde um cluster, à parte da licença que está alocada aesse cluster.

v Decida se deseja aumentar a capacidade do recursoou reduzir o espaço que está sendo utilizado poresse recurso.

v Para aumentar a capacidade do recurso, entre emcontato com o representante de vendas IBM eorganize uma maior capacidade de licença. Altere asconfigurações da licença para o cluster paraconfigurar a nova capacidade licenciada.Alternativamente, se a licença se aplicar a mais deum cluster, modifique como a capacidade licenciadaé dividida entre os clusters. Atualize cada clusterpara que a soma da capacidade licenciada para todosos clusters não exceda a capacidade licenciada para alocalização.

v Para reduzir a quantia de espaço em discovirtualizado, exclua alguns dos discos gerenciados ouvolumes de modo de imagem. O tamanho davirtualização utilizada é a soma das capacidades detodos os discos gerenciados e discos de modo deimagem.

v Para reduzir a capacidade de FlashCopy, excluaalguns mapeamentos FlashCopy. O tamanho deFlashCopy utilizado é a soma de todos os volumesque sejam o volume de origem de um mapeamentoFlashCopy.

v Para reduzir a capacidade de espelho global e metromirror, exclua alguns relacionamentos de espelhoglobal ou metro mirror. O tamanho de espelho globale metro mirror é a soma das capacidades de todos osvolumes que estão em um relacionamento de MetroMirror ou de Global Mirror. Ambos os volumesprincipal e auxiliar são considerados.

v O erro será automaticamente corrigido quando acapacidade licenciada for maior que a capacidadeque está sendo utilizado.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3031 • 3032

Capítulo 7. Diagnosticando problemas 261

Page 280: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3035 Licença para recurso FlashCopy emDisco Físico requerida

Explicação: O cluster Entry Edition tem algunsmapeamentos de FlashCopy definidos. Há, no entanto,nenhuma licença FlashCopy de Disco Físico registradano cluster. O cluster continuará operando, mas podeviolar as condições da licença.

Resposta do Usuário:

v Verifique se você tem uma licença FlashCopy doEntry Edition Physical Disk para este cluster quevocê não registrou no cluster. Atualize a configuraçãode licença do cluster se tiver uma licença.

v Decida se deseja continuar continuar utilizando orecurso FlashCopy ou não.

v Se desejar utilizar o recurso FlashCopy, entre emcontato com seu representante de vendas IBM,organize uma licença e altere as configurações delicença para o cluster para registrar a licença.

v Se não quiser utilizar o recurso FlashCopy, você deveexcluir todos os mapeamentos FlashCopy.

v O erro será automaticamente corrigido quando asituação for resolvida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3036 Licença para recurso Global e metromirror em Disco Físico requerida

Explicação: O cluster Entry Edition tem algunsrelacionamentos de espelho global ou metro mirrordefinidos. Não há, todavia, nenhuma licença de espelhoglobal e metro mirror em Disco Físico registrada nocluster. O cluster continuará operando, mas pode violaras condições da licença.

Resposta do Usuário:

v Verifique se há uma licença de espelho global emetro mirror do Entry Edition Physical Disk paraeste cluster registrado no cluster. Atualize aconfiguração de licença do cluster se tiver umalicença.

v Decida se deseja continuar a utilizar os recursosespelho global ou metro mirror ou não.

v Se desejar utilizar o recurso espelho global ou metromirror, entre em contato com seu representante devendas IBM, organize uma licença e altere asconfigurações de licença para o cluster para registrara licença.

v Se não desejar utilizar tanto o recurso espelho globalquanto metro mirror, você deve excluir todos osrelacionamentos de espelho global e metro mirror.

v O erro será automaticamente corrigido quando asituação for resolvida.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3080 Relacionamento ou grupo deconsistências de Global ou metro mirrorcom parceria excluída

Explicação: Existe um relacionamento de espelhoglobal e metro mirror ou um grupo de consistênciascom um cluster cuja parceria foi excluída.

Essa configuração não é suportada e o problema deveser resolvido.

Resposta do Usuário: O problema pode ser resolvidopela exclusão de todos os relacionamentos de espelhoglobal ou metro mirror ou grupos de consistências queexistam com um cluster cuja parceria foi excluída, oupela recriação de todas as parcerias que eles estavamutilizando.

O erro será automaticamente corrigido quando asituação for resolvida.

1. Liste todos os relacionamentos de espelho global oumetro mirror e observe aqueles em que o nome docluster principal ou o nome do cluster auxiliar estáem branco. Para cada um desses relacionamentos,observe também o ID do cluster do cluster remoto.

2. Liste todos os grupos de consistências de espelhoglobal ou metro mirror e observe aqueles em que onome do cluster principal ou o nome do clusterauxiliar está em branco. Para cada um dessesgrupos de consistências, observe também o ID docluster do cluster remoto.

3. Determine quantos IDs de cluster exclusivos docluster remoto existem entre todos osrelacionamentos de espelho global e metro mirror eos grupos de consistências você identificou nas duasprimeiras etapas. Para cada um desses clustersremotos, decida se deseja restabelecer a parceriacom esse cluster. Assegure que o número total deparcerias que deseja ter com clusters remotos nãoexceda o limite do cluster. Se você restabelecer umaparceria, não precisará excluir os relacionamentosdo Global Mirror e Metro Mirror e os grupos deconsistências que utilizam a parceria.

4. Restabeleça todas as parcerias selecionadas.

5. Exclua todos os relacionamentos de espelho global emetro mirror e os grupos de consistências listadosnas duas primeiras etapas cuja parceria de clusterremoto não tenha sido restabelecida.

6. Verifique se o erro foi marcado como corrigido pelosistema. Se não tiver sido, retorne à primeira etapae determine quais relacionamentos de espelhoglobal ou metro mirror ou grupos de consistênciasainda estão causando o problema.

Causa Possível - unidades substituíveis em campo ououtra:

3035 • 3080

262 SAN Volume Controller: Guia de Resolução de Problemas

Page 281: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Nenhuma

3081 Não é possível enviar e-mail a nenhumdos servidores de e-mail configurados.

Explicação: O sistema não pôde se conectar a nenhumdos servidores de e-mail SMTP ou a transmissão dee-mail falhou. Um máximo de seis servidores de e-mailpodem ser configurados. O evento de erro 2600 ou 2601é gerado quando se descobre que um servidor dee-mail individual não está funcionando. Esse erroindica que foi descoberto que todos os servidores dee-mail não estão funcionando.

Resposta do Usuário:

v Verifique o log de eventos para todos os erros 2600 e2601 não resolvidos e corrija esses problemas.

v Se este erro ainda não tiver sido automaticamentemarcado como corrigido, marque este erro comocorrigido.

v Execute a função de verificação de e-mail para testarse um servidor de e-mail está operandocorretamente.

Causa Possível - unidades substituíveis em campo ououtra:

v Nenhuma

3090 Download do firmware da unidadecancelado pelo usuário ou pelo sistema,diagnóstico do problema necessário.

Explicação: O download do firmware da unidade foicancelado pelo usuário ou é necessário o diagnósticodo sistema e do problema.

Resposta do Usuário: Se você cancelou o downloadusando applydrivesoftware -cancel, esse erro seráesperado.

Se você alterou o estado de qualquer unidade duranteo download, esse erro será esperado; entretanto, vocêterá que executar novamente o applydrivesoftwarepara assegurar que todo o firmware da unidade tenhasido atualizado.

Caso contrário:

1. Verifique os estados da unidade usando lsdrive,em particular, observe as unidade que apresentamstatus=degraded, offline ou use=failed.

2. Verifique os estados do nó usando lsnode oulsnodecanister, e confirme se todos os nós estãoonline.

3. Use lsdependentvdisks -drive <drive_id> paraverificar os vdisks que dependem de unidadesespecíficas.

4. Se a unidade for um membro de uma matrizRAID0, considere se deseja introduzir redundânciaadicional para proteger os dados nessa unidade.

5. Se a unidade não for um membro de uma matrizRAID0, corrija todos os erros no log de eventosrelacionados à matriz.

6. Considere usar a opção -force. Com a atualizaçãode qualquer unidade de software há um risco daunidade ficar inutilizável. Use a opção -forcesomente se você aceitar esse risco.

7. Emita novamente o comando applydrivesoftware.

Nota: O comando lsdriveupgradeprogress pode serusado para verificar o progresso do comandoapplydrivesoftware à medida que cada unidade éatualizada.

3124 Nenhum dispositivo de quorum ativolocalizado.

Explicação: Um dispositivo de quorum deve estarativo para evitar uma indisponibilidade de E/S se o nófalhar.

Resposta do Usuário: Use o comando lsquorum paraverificar se um dispositivo de quorum está ativo. Ocampo ativo campo deve ter um valor de sim. Senenhum dispositivo de quorum estiver ativo, concluauma das ações a seguir:

v No HyperSwap ou nos sistemas estendidos,implemente um novo aplicativo de quorum IP oucrie um terceiro site de quorum do Fibre Channel.

v Em sistemas regulares, crie algum armazenamentogerenciado ou implemente um novo aplicativo dequorum IP.

3130 O certificado SSL do sistema expira nospróximos 30 dias.

Explicação: O certificado SSL do sistema expira nospróximos 30 dias.

O certificado SSL do sistema usado para autenticar asconexões na GUI, no assistente de serviço e no CIMOMestá prestes a expirar.

Resposta do Usuário: Conclua as etapas a seguir pararesolver este problema.

1. Se você estiver usando um certificadoauto-assinado, então gere um novo certificadoauto-assinado.

2. Se você estiver usando um certificado assinado poruma autoridade de certificado, gere uma novasolicitação de certificado e obtenha a assinaturadeste certificado através da sua autoridade decertificação. O certificado existente pode continuar aser usado até a data de validade, para fornecertempo para obter uma nova solicitação decertificado assinada e instalada.

FRUs de Causa Possíveis ou outra:

v N/D

3081 • 3130

Capítulo 7. Diagnosticando problemas 263

Page 282: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3220 Portas equivalentes podem estar emmalhas diferentes

Explicação: Os World Wide Names (WWNs) de malhaincompatível foram detectados.

Resposta do Usuário: Conclua as seguintes etapas:

1. Execute o comando lsportfc para obter o WorldWide Name (WWN) de malha de cada porta.

2. Liste todas as portas em parceria (ou seja, todas asportas para as quais o ID da porta da plataforma éo mesmo, e o nó está no mesmo grupo de E/S) quepossuem WWNs de malha incompatível.

3. Verifique se as portas listadas estão na mesmamalha.

4. Reconecte, se necessário. Para obter informaçõessobre requisitos de conexão, consulte"Considerações de zoneamento para Virtualizaçãode ID da Porta N" na documentação do produto.Depois que todas as portas estiverem na mesmamalha, o evento se corrigirá.

5. Esse erro pode ser exibido por engano. Se vocêconfirmar que todas as portas restantes estão namesma malha, apesar das incompatibilidadesaparentes que permanecem, marque o evento comocorrigido.

Procedimento: determinação de problema da SANÉ possível resolver problemas no SAN Volume Controller e sua conexão com arede de área de armazenamento (SAN).

Sobre Esta Tarefa

Falhas da SAN podem fazer com que os volumes do SAN Volume Controllerfiquem inacessíveis aos sistemas host. Podem ocorrer falhas causadas poralterações na configuração da SAN ou por falhas de hardware em componentes daSAN.

A lista a seguir identifica alguns dos hardware que podem causar falhas:v Energia, ventilador ou resfriamentov Circuitos integrados específicos do aplicativov Transceptor small form-factor pluggable (SFP) instaladov Cabos de fibra ótica

Se os procedimentos de análise de manutenção ou os códigos de erro enviaramvocê aqui, complete as seguintes etapas:

Procedimento1. Se o cliente alterou a configuração da rede de área de armazenamento

alterando as conexões de cabo Fibre Channel ou o zoneamento de comutador,verifique se as alterações estavam corretas e, se necessário, reverta aquelasalterações.

2. Verifique se a energia está ligada em todos os comutadores e controladores dearmazenamento que o sistema SAN Volume Controller usa e se eles não estãorelatando nenhuma falha de hardware. Se forem encontrados problemas,resolva-os antes de continuar.

3. Verifique se os cabos Fibre Channel que conectam os sistemas para os sistemasaos comutadores estão firmemente conectados.

4. Se o cliente estiver executando uma ferramenta de gerenciamento da rede deárea de armazenamento, você pode utilizar essa ferramenta para visualizar atopologia da rede de área de armazenamento e isolar o componente com falha.

3220

264 SAN Volume Controller: Guia de Resolução de Problemas

Page 283: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resolvendo um problema com clientes SSL/TLSAlterar o nível de segurança do sistema pode fazer com que a interface da web, osclientes CIM e outros clientes SSL/TLS parem de funcionar. Se quaisquer clientespararem de funcionar, conclua o procedimento a seguir.

Procedimento1. Aguarde 5 minutos e tente novamente. Os clientes ainda podem precisar

aguardar que os serviços sejam reiniciados.2. Confirme se a implementação SSL/TLS do cliente (por exemplo, o navegador

da web ou a ferramenta de gerenciamento CIM) está atualizada e suporta onível de segurança que está sendo impingido. Se necessário, reverta para umnível de segurança SSL/TLS mais fraco no SAN Volume Controller e veja seessa ação resolve o problema.

3. Se o problema for no navegador, verifique a mensagem de erro exata relatadapelo navegador.Se a mensagem de erro for erro de cifra, erro de SSL, erro de TLS ou errode handshake, o erro significa que há um problema com a conexão segura.Nesse caso, confirme se o navegador está atualizado. Todos os navegadoressuportados (Internet Explorer, Firefox, Firefox ESR e Chrome) suportam TLS 1.2na versão mais recente.Se houver somente uma tela em branco, é provável que o serviço da webprecise ser reiniciado ou exista um problema não relacionado ao nível desegurança.

Procedimento: fazendo com que unidades suportem informações deproteção

É possível usar este procedimento para migrar unidades e matrizes para selecionaro suporte para informações de proteção.

Sobre Esta Tarefa

As unidades não podem ser iniciadas usando informações de proteção parasolicitações de E/S on demand. Elas devem ser validadas como tendo um formatocorreto e suporte geral para a função dentro do código. O SAN Volume Controlleré capaz de validar o formato e o suporte geral quando o objeto de unidade édescoberto pela primeira vez pelo sistema. O requisito para validação do sistemasignifica que não existe unidade que pode usar informações de proteção em umaatualização da versão 730, independentemente do uso na configuração. O sistemapode rejeitar uma solicitação para tornar uma unidade uma candidata se a mídianão estiver formatada corretamente para uso com informações de proteção. Oprocesso para começar a usar informações de proteção em uma unidade existente éusar a interface de sistema (GUI/CLI) e envolve a remoção do gerenciamento e aredescoberta da unidade para permitir que o software readquira as característicasda unidade.

A visualização lsdrive contém o campo protection_enabled que mostra se umaunidade está usando informações de proteção. Unidades e matrizes que existemem uma atualização para a versão 740 não adquirem automaticamente o suportepara informações de proteção. Todas as unidades recém-descobertas neste nível decódigo suportam informações de proteção. Se o sistema tiver capacidade

Capítulo 7. Diagnosticando problemas 265

Page 284: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

sobressalente, a migração poderá continuar um MDisk por vez. Caso contrário, amigração para usar informações de proteção em unidades deverá continuarunidade por unidade.

Para migrar um MDisk usando a capacidade de armazenamento sobressalente,conclua o procedimento a seguir.

Procedimento1. Migre dados do MDisk. A migração de dados pode ser realizada pela migração

de MDisk como parte da exclusão do MDisk (rmmdisk, lsmigrate) dentro deum conjunto de armazenamentos. Também é possível usar o espelhamento devolume para criar uma cópia espelhada de sincronização de cada volume emoutro conjunto (addvdiskcopy). Quando ele for copiado (lsvdisksyncprogress),exclua as cópias de volumes originais (rmvdiskcopy) e, em seguida, exclua oMDisk (rmmdisk) que não possui dados.

2. Siga as instruções na etapa 5 para todas as unidades que agora serãocandidatas quando o MDisk for excluído (consulte lsmigrate).

3. Recrie a matriz usando a interface do sistema quando todos os membrosantigos adotarem informações de proteção.

4. Conclua as etapas a seguir para adotar as informações de proteção em umaunidade individual se a unidade for um membro.a. Execute o comando charraymember para ejetar a unidade da matriz (seja

imediatamente com perda de redundância ou depois de uma troca).b. Quando a unidade não for mais um membro, siga as instruções na etapa 5

para candidatas ou sobressalentes.c. Repita para o próximo membro.

5. Conclua as etapas a seguir se a unidade for um sobressalente ou candidato:a. Use a GUI de gerenciamento para deixar a unidade offline.b. Quando a unidade estiver offline, use as interfaces do sistema para alterar o

uso da unidade para não usada.c. O sistema readquire a unidade e a coloca novamente online, possivelmente

alterando o ID da unidade.d. Use a interface do sistema para alterar o uso da unidade para candidata e,

em seguida, se necessário, para sobressalente.e. Insira lsdrive driveID e verifique se o campo protection_enabled é yes.

Essa unidade pode agora ser usada em uma matriz.

Resolvendo um problema com novos gabinetes de expansãoDetermine por que um gabinete de expansão instalado recentemente não foidetectado pelo sistema.

Ao instalar um novo gabinete de expansão , siga o assistente Incluir Gabinete doGUI de gerenciamento. Selecione Monitoramento > Sistema. No menu Ações,selecione Incluir gabinetes.

Se o gabinete de expansão não for detectado, conclua as verificações a seguir:v Verifique o status dos LEDs na parte traseira do gabinete de expansão. Pelo

menos uma unidade da fonte de alimentação deve estar ligada sem exibição defalhas. Pelo menos uma caixa deve estar ativa, sem nenhum LED de falha aceso.O SAN Volume Controller 2145-24F tem dois LEDs por porta Serial-attachedSCSI (SAS): um LED verde de status de link e um LED âmbar de falha. O LED

266 SAN Volume Controller: Guia de Resolução de Problemas

Page 285: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

de status de link das portas que estão em uso fica aceso enquanto o LED defalha fica apagado. Para obter detalhes sobre o status do LED, consulte PortasSAS e indicadores de caixa de expansão do SAN Volume Controller 2145-24F.

v Verifique se o cabeamento do SAS para o gabinete de expansão está instaladocorretamente. Para revisar os requisitos, consulte Conectando os gabinetes deexpansão SAS opcionais.

Falhas do Link de Fibre Channel e Ethernet de 10GPode ser necessário substituir o Transceptor small form-factor pluggable (SFP)quando ocorre uma falha em um único link Fibre Channel ou Ethernet 10G(aplicável para link Ethernet 10G ativado para personalidade Fibre Channel overEthernet).

Antes de Iniciar

Os itens a seguir podem indicar que um único link Fibre Channel ou Ethernet 10Gfalhou:v O status da porta do Fibre Channel no painel frontal do nóv Os diodos emissores de luz (LEDs) de status do Fibre Channel na parte traseira

do nóv Um erro que indica que uma porta única falhou (703, 723).

Sobre Esta Tarefa

Use somente Transceptores SFP 10 Gb suportado pelo IBM com o SAN VolumeController 2145-DH8. Usar outro Transceptores SFP pode levar ao comportamentodo sistema inesperado. O DAC de cobre não é suportado por estas portas de 10Gb. A substituição do Transceptor SFP em uma porta do adaptador Ethernet de 10Gbps é governada pelas regras a seguir:v Um Transceptor SFP de 10 Gb existente substituído com um novo Transceptor

SFP de 10 Gb: A porta do adaptador Ethernet de 10 Gbps detecta um novoTransceptor SFP e se torna operacional imediatamente.

v Se a porta do adaptador Ethernet de 10 Gbps detecta um novo Transceptor SFPe se torna operacional imediatamente, a porta possui um Transceptor SFP corretodesde a última reinicialização e é substituída pelo Transceptor SFP de 10 Gbcorreto. Esta situação pode ocorrer com um Transceptor SFP incompatível (SFPde 8 Gb ou SFP de 4 Gb) que é inserido na porta do adaptador Ethernet de 10Gbps.– O nó requer uma reinicialização para detectar o novo Transceptor SFP. O

novo Transceptor SFP será operacional somente após a reinicialização(nenhum DMP é produzido).

v A porta do adaptador Ethernet de 10 Gbps não contém nenhum TransceptorSFP desde a última reincialização e o Transceptor SFP de 10 Gb correto éinstalado:– A reinicialização do sistema para detectar o novo Transceptor SFP.

Procedimento

Tente cada uma destas ações, na ordem a seguir, até que a falha seja corrigida.1. Assegure que o cabo Fibre Channel ou Ethernet de 10G esteja seguramente

conectado em cada extremidade.2. Substitua o cabo Fibre Channel ou Ethernet 10G.

Capítulo 7. Diagnosticando problemas 267

Page 286: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3. Substitua o Transceptor SFP para a porta com falha no nó.

Nota: Os nós do SAN Volume Controller são suportados por ambos osTransceptores SFP de ondas longas e Transceptores SFP de ondas curtas. Vocêdeve substituir um Transceptor SFP pelo mesmo tipo de Transceptor SFP. Se oTransceptor SFP a ser substituído for um Transceptor SFP de onda longa, porexemplo, você deve fornecer um substituto adequado. A remoção doTransceptor SFP errado poderá resultar em perda de acesso aos dados.

4. Substitua o adaptador Fibre Channel ou o adaptador Fibre Channel sobreEthernet no nó.

Problemas de link do host iSCSI Ethernete você estiver tendo problemas para conectar aos hosts Ethernet, seu problemapode estar relacionado à rede, ao sistema SAN Volume Controller ou ao host.

Nota: O SAN Volume Controller e o IP de host devem estar na mesma VLAN. Ohost e os nós do SAN Volume Controller não devem ter a mesma sub-rede emVLANs diferentes.

Para problemas de rede, é possível tentar qualquer uma das ações a seguir:v Teste a sua conectividade entre o host e as portas do SAN Volume Controller.v Tente efetuar ping do sistema SAN Volume Controller a partir do host.v Solicitar ao administrador da rede Ethernet verificar as configurações do firewall

e do roteador.v Verifique se a máscara de sub-rede e o gateway são corretos para a configuração

do host do SAN Volume Controller.

Usando os problemas do GUI de gerenciamento for SAN Volume Controller, épossível tentar qualquer uma das ações a seguir:v Visualize os endereços IP da porta do nó configurados.v Visualize a lista de volumes que estão mapeados para um host para assegurar

que os mapeamentos de host do volume estejam corretos.v Verifique se o volume está online.

Para problemas de host, é possível tentar qualquer uma das ações a seguir:v Verifique se o nome qualificado de iSCSI (IQN) do host está configurado

corretamente.v Use os utilitários do sistema operacional (como o gerenciador de dispositivos do

Windows) para verificar se o driver de dispositivo está instalado, carregado eoperando corretamente.

v Se você configurou a VLAN, verifique se as configurações estão corretas.Assegure-se de que a porta Ethernet do host, o endereço IP das portas EthernetSAN Volume Controller e a porta do comutador estejam no mesmo VLAN ID.Assegure-se de que em cada VLAN, uma sub-rede diferente é usada. Aconfiguração da mesma sub-rede em VLAN IDs diferentes pode causar problemasde conectividade de rede.

Problemas com link de host do Fibre Channel over EthernetOs problemas para conectar os hosts do Fibre Channel over Ethernet podem estarrelacionado à rede, ao sistema SAN Volume Controller ou ao host.

268 SAN Volume Controller: Guia de Resolução de Problemas

Page 287: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Antes de Iniciar

Se o código de erro 705 for exibido no nó, isso significa que a porta de E/S do FCestará inativa. O Fibre Channel over Ethernet usa o Fibre Channel como umprotocolo e Ethernet como uma interconexão.

Nota: No que se refere a uma porta ativada do Fibre Channel over Ethernet: oencaminhador de Fibre Channel (FCF) não é visto ou o recurso do Fibre Channelover Ethernet não está configurado no comutador.v Verifique se o recurso do Fibre Channel over Ethernet está ativado no FCF.v Verifique as propriedades da porta remota (porta do comutador) no FCF.

Se estiver conectando o host através de um Comutador do Converged EnhancedEthernet (CEE):v Teste sua conectividade entre o host e o comutador do CEE.v Peça ao administrador da rede Ethernet para verificar as configurações de

firewall e roteador.

Execute lsfabric e verifique se o host é visto como uma porta remota na saída. Seo host não for visto, na ordem:v Verifique se o SAN Volume Controller e o host recebe um ID do Fibre Channel

(FCID) no FCF. Se não for possível verificar, verifique a configuração da VLAN.v Verifique se o SAN Volume Controller e a porta do host fazem parte de uma

zona e se a zona está em vigor atualmente.v Verifique se os volumes foram mapeados para o host e estão online. Para obter

mais informações, consulte lshostvdiskmap e lsvdisk na descrição no Centro deInformações do SAN Volume Controller.

O que Fazer Depois

Se o problema não for resolvido, verifique o estado do adaptador de host.v Descarregue e carregue o driver de dispositivov Use os utilitários do sistema operacional (por exemplo, Windows Device

Manager) para verificar se o driver de dispositivo está instalado, carregado eoperando corretamente.

Manutenção de Sistemas de ArmazenamentoOs sistemas de armazenamento suportados para conexão com o sistema SANVolume Controller são projetados com componentes redundantes e caminhos deacesso para ativar a manutenção simultânea. Os hosts têm acesso contínuo aos seusdados durante a falha do componente e a substituição.

As categorias a seguir representam os tipos de ações de serviço para os sistemas dearmazenamento:v atualização do código do controladorv Substituição de unidade substituível (FRU)

atualização do código do controlador

Assegure-se de que você esteja familiarizado com as diretrizes a seguir paraatualizando o código do controlador:

Capítulo 7. Diagnosticando problemas 269

Page 288: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Verifique se o sistema suporta a manutenção simultânea para o sistema dearmazenamento.

v Deixe o sistema de armazenamento coordenar todo o processo de atualização.v Se não for possível permitir que o sistema de armazenamento coordene todo o

processo inteiro do atualização, conclua as etapas a seguir:1. Reduza a carga de trabalho do sistema de armazenamento em 50%.2. Use as ferramentas de configuração para o sistema de armazenamento para

executar failover manual sobre todas as unidades lógicas (LUs) a partir docontrolador que você deseja atualização.

3. Atualizar o código do controlador.4. Reinicie o controlador.5. Realize o failback manual das ULs para seu controlador original.6. Repita para todos os controladores.

Substituição da FRU

Assegure de estar familiarizado com as seguintes diretrizes para substituição deFRUs:v Se o componente que você quer substituir estiver diretamente no caminho de

dados do lado do host (por exemplo, cabo, porta do Fibre Channel oucontrolador), desative os caminhos de dados externos para preparar aatualização. Para desativar os caminhos de dados externos, desconecte oudesative as portas apropriadas no comutador de malha. Os ERPs do sistemaroteiam novamente o acesso por meio do caminho alternativo.

v Se o componente que deseja substituir estiver no caminho de dados interno (porexemplo, cabo ou unidade) e não tiver falhado completamente, assegure-se defazer o backup dos dados antes de tentar substituir o componente.

v Se o componente que você deseja substituir não estiver no caminho de dados,por exemplo, as unidades, ventiladores ou baterias do fonte de alimentaçãoininterrupta, geralmente, o componente terá dupla redundância e poderá sersubstituído sem etapas adicionais.

270 SAN Volume Controller: Guia de Resolução de Problemas

Page 289: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 8. Recuperação de desastre

Use estas soluções de recuperação de desastre para HyperSwap, Metro Mirror,Global Mirror e Sistema Estendido, no qual o acesso ao armazenamento ainda épossível após a falha de um site.

HyperSwap

O acesso ao volume ativo-ativo é sempre fornecido enquanto houver uma cópiaconsistente atualizada. Se houver uma cópia consistente desatualizada, não haveráum failover automático para ele, nem será fornecido a ele acesso somente leitura.Use o comando stoprcrelationship-access ou stoprcconsistgrp-access paratorná-lo acessível. O relacionamento está, neste caso, no estado Inativo. Depois deativar o acesso com o comando stoprcrelationship-access oustoprcconsistgrp-access, use o comando startrcrelationship -primary<master/aux> ou startrcconsistgrp -primary <master/aux> para fazer com que orelacionamento deixe o estado Inativo e continue a replicação HyperSwap. Se vocêexecutou anteriormente overridequorum, o comando startrcrelationship oustartrcconsistgrp falhará.

Quando continuar a replicação HyperSwap, considere se deseja continuar usando acópia consistente desatualizada ou reverter para a cópia atualizada. Para identificarse o volume principal ou auxiliar possui acesso, verifique o campo primary que émostrado pelo comando lsrcrelationship ou lsrcconsistgrp. Para continuarusando a cópia desatualizada, forneça esse valor como o argumento para oparâmetro -primary do comando startrcrelationship ou startrcconsistgrp. Parareverter para a cópia atualizada, especifique o valor oposto como o argumentopara o parâmetro -primary. Por exemplo, se master for mostrado no campoprimário de lsrcconsistgrp para um grupo de consistências ativo-ativo no estadoInativo, para reverter para a cópia atualizada, use startrcconsistgrp -primary aux.

Metro Mirror e Global Mirror

Nota: O uso inapropriado desses procedimentos pode permitir que sistemas hostfaçam modificações independentes nas cópias de dados primárias e secundárias. Ousuário é responsável por assegurar-se de que nenhum sistema host continue ausar a cópia primária dos dados antes de permitir o acesso à cópia secundária.

Em uma configuração do Metro Mirror ou Global Mirror, um sistema éconfigurado em cada site. Os relacionamentos são configurados entre os sistemaspara espelhar dados de armazenamento no site primário para o armazenamento nosite secundário. Se ocorrer uma indisponibilidade no site secundário, o siteprimário continuará a operação sem nenhuma intervenção. Se ocorrer umaindisponibilidade no site primário, então será necessário ativar o acesso aoarmazenamento no site secundário.

Use o comando stoprcrelationship-access ou stoprcconsistgrp-access paraativar o acesso ao armazenamento no site secundário.

Sistema estendido

Em uma configuração de sistema estendido (anteriormente site dividido), umsistema é configurado com metade dos nós em cada site e um dispositivo de

© Copyright IBM Corp. 2003, 2016 271

Page 290: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

quorum em um terceiro local. Se ocorrer uma indisponibilidade no site, os outrosnós no outro site acessarão o dispositivo de quorum e continuarão a operação semnenhuma intervenção. Se a conectividade entre os dois sites for perdida, então o nóque acessar o dispositivo de quorum primeiro continuará a operação. Parapropósitos de recuperação de desastre um usuário pode desejar ativar o acesso aoarmazenamento no site que perdeu a competição para acessar o dispositivo dequorum.

Use o comando satask overridequorum para ativar o acesso ao armazenamento nosite secundário. Esse recurso estará disponível somente se o sistema foiconfigurado pela designação de sites para os nós e os controladores dearmazenamento e a alteração da topologia do sistema a ser estendido.

Importante: Se o usuário executou a recuperação de desastre em um site e, emseguida, ligou os sites com falha restantes (que continha o nó de configuração nomomento do desastre), então o próprio cluster se afirmará como designado. Esseprocedimento iria iniciar um segundo cluster idêntico em paralelo, o que podecausar a distorção de dados. O usuário deve seguir essas etapas:Exemplo

1. Remova a conectividade dos nós do site que estão experimentando aindisponibilidade

2. Ligue ou recupere esses nós3. Execute comando satask leavecluster-force ou svctask rmnode para todos os

nós no cluster4. Traga os nós para o estado candidato, e então5. Conecte-os ao site no qual o recurso de recuperação de desastre do site foi

executado.

Outras configurações

Para recuperar o acesso ao armazenamento em outras configurações, use o“Procedimento do Sistema de Recuperação” na página 273.

272 SAN Volume Controller: Guia de Resolução de Problemas

Page 291: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 9. Procedimentos de recuperação

Este tópico descreve estes procedimentos de recuperação: recuperar um sistema efazer backup e restaurar uma configuração do sistema. Este tópico também contéminformações sobre a execução de resgates de nós.

Procedimento do Sistema de RecuperaçãoO procedimento de recuperação do sistema recupera o sistema inteiro se o estadodo sistema for perdido de todos os nós. O procedimento recria o sistema usando osdados de configuração salvos. Os dados de configuração salvos estão no discoquorum ativo e no arquivo de backup de configuração XML mais recente. Arecuperação pode não ser capaz de restaurar todos os dados de volume. Esseprocedimento também é conhecido como recuperação de 3 Camadas (T3).

CUIDADO:Se o sistema encontra um estado em que:

v Nenhum nó está ativo

Não tente iniciar um resgate do nó (que o usuário pode iniciar usando opainel frontal do SAN Volume Controller, a GUI do assistente de serviço ou ocomando da CLI de serviço satask rescuenode). PARE e entre em contato como IBM® Remote Technical Support. O início desse procedimento derecuperação T3 do sistema enquanto estiver nesse estado específico poderesultar na perda dos arquivos de backup de configuração XML.

© Copyright IBM Corp. 2003, 2016 273

Page 292: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Atenção:

v Execute as ações de serviço somente quando orientado pelos procedimentos decorreção. Se usadas inadequadamente, as ações de serviço poderão causar perdade acesso aos dados ou até mesmo perda de dados. Antes de tentar recuperarum sistema, investigue a causa da falha e tente resolver esses problemas usandooutros procedimentos de correção. Leia e entenda todas as instruções antes deconcluir qualquer ação.

v O procedimento de recuperação poderá levar algumas horas, se o sistema usardispositivos de grande capacidade como dispositivos de quorum.

Não tente o procedimento de recuperação do sistema a menos que as condições aseguir sejam atendidas:v Todas as condições foram atendidas em “Quando Executar o Procedimento de

Recuperação do Sistema” na página 275.v Todos os erros de hardware foram corrigidos. Consulte o “Corrigir Erros de

Hardware” na página 275v Todos os nós possuem o status de candidato. Caso contrário, veja a etapa 1.v Todos os nós devem estar no mesmo nível de código que o sistema tinha antes

da falha. Se quaisquer nós foram modificados ou substituídos, use o assistentede serviço para verificar os níveis de código e, quando necessário, reinstale onível de código para que ele corresponda ao nível que está em execução nosoutros nó no sistema. Para obter informações adicionais, consulte “Removendoas informações do sistema para nós com código de erro 550 ou código de erro578 usando o assistente de serviço” na página 277.

O procedimento de recuperação do sistema é uma das várias tarefas que devem serconcluídas. A lista a seguir é uma visão geral das tarefas e a ordem na qual elasdevem ser concluídas:1. Preparação para recuperação do sistema

a. Revise as informações relacionadas a quando executar o procedimento derecuperação do sistema.

b. Corrija os erros de hardware e certifique-se de que todos os nós no sistemasejam mostrados no assistente de serviço ou na saída de sainfolsservicenodes.

c. Remova as informações do sistema para os nós com código de erro 550 oucódigo de erro 578 usando o assistente de serviço, mas somente se aresposta do usuário recomendada para esses erros do nó já foi seguida.

d. Para Volumes Virtuais (VVols), encerre os serviços para qualquer instânciado Spectrum Control Base que esteja se conectando ao sistema. Use ocomando do Spectrum Control Base service ibm_spectrum_control stop.

2. Executar a recuperação do sistema. Após preparar o sistema para recuperação eatender a todas as condições prévias, execute a recuperação do sistema.

Nota: Execute o procedimento em um sistema em uma malha por vez. Nãoexecute o procedimento em diferentes nós no mesmo sistema. Essa restriçãotambém se aplica a sistemas remotos.

3. Concluir as ações para tornar o ambiente operacional.v Recuperar os volumes offline usando a CLI.v Verificação do sistema, por exemplo, para assegurar que todos os volumes

mapeados possam acessar o host.

274 SAN Volume Controller: Guia de Resolução de Problemas

Page 293: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Quando Executar o Procedimento de Recuperação do SistemaTente um procedimento de recuperação somente depois de uma investigaçãocompleta e meticulosa da causa da falha do sistema. Tente resolver esses problemasutilizando outros procedimentos de serviço.

Atenção: Se você sofrer falhas a qualquer momento durante a execução doprocedimento do sistema de recuperação, ligue para o suporte técnico remoto IBM.Não tente executar ações de recuperação, pois essas ações podem impedir que osuporte restaure o sistema para um status operacional.

Determinadas condições devem ser atendidas antes da execução do procedimentode recuperação. Utilize os seguintes itens para ajudá-lo a determinar quandoexecutar o procedimento de recuperação:1. Todos os gabinetes e sistemas de armazenamento externos estão ativados e

podem se comunicar entre si.2. Verifique se todos os nós no sistema são mostrados na ferramenta do assistente

de serviço ou usando o comando de serviço: sainfo lsservicenodes. Investiguese há nós ausentes.

3. Verifique se nenhum nó no sistema está ativo e se o IP de gerenciamento não éacessível. Se nenhum nó tiver o status ativo, não será necessário recuperar osistema.

4. Resolva todos os erros de hardware nos nós de modo que somente os erros denós 578 ou 550 estejam presentes. Se este não for o caso, acesse “Corrigir Errosde Hardware”.

5. Assegure-se de que todo armazenamento de backend administrado pelosistema esteja presente antes de executar o procedimento de recuperação dosistema.

6. Se algum nó tiver sido substituído, assegure-se de que o WWNN do nó desubstituição corresponda ao do nó substituído e de que nenhum dado dosistema anterior permaneça nesse nó.

Corrigir Erros de HardwareAntes de executar um procedimento de recuperação do sistema, é importanteidentificar e corrigir a causa raiz dos problemas de hardware.

Identificar e corrigir a causa raiz pode ajudar a recuperar um sistema, se essasforem falhas que estão causando a falha do sistema. A seguir estão problemascomuns que podem ser facilmente resolvidos:v O nó foi desligado ou os cabos de energia foram desconectados.v Uma 2145 UPS-1U pode ter falhado e encerrado um ou mais nós devido à falha.

Em geral, essa causa pode não acontecer devido à redundância fornecida pelasegunda 2145 UPS-1U.

v Verifique o status de cada nó que é membro do sistema. Resolva todos os erros.– Todos os nós devem relatar um erro de nó 578 ou nenhum nome de cluster

será mostrado na tela Cluster:. Esses códigos de erro indicam que o sistemaperdeu seus dados de configuração. Se quaisquer nós relatarem algo diferentedesses códigos de erro, não execute uma recuperação. É possível encontrarsituações onde nós que não são de configuração relatem erros de nó, comoum erro de nó 550. O erro 550 também pode indicar que um nó não pode seunir a um sistema.

Capítulo 9. Procedimentos de recuperação 275

Page 294: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Nota: Se algum dos botões no painel frontal tiver sido pressionado após essesdois códigos de erro serem relatados, o relatório para o nó retorna ao erro denó 578. A alteração no relatório acontecer após aproximadamente 60segundos. Além disso, se o nó tiver sido reinicializado ou se tiverem sidotomadas ações de serviço de hardware, talvez o nó não mostre nenhum nomede cluster na tela Cluster:.

– Se algum nó mostrar Erro de Nó: 550, registre os dados a partir da segundalinha do visor. Se o último caractere na segunda linha do visor for >, utilize obotão para direita para rolar a tela para a direita.- Além de Erro de Nó: 550, a segunda linha do visor pode mostrar uma lista

de IDs do painel frontal do nó (sete dígitos) que são separados por espaços.A lista também pode mostrar o ID de WWPN/LUN (16 dígitoshexadecimais seguidos por uma barra e um número decimal).

- Se os dados de erro contiverem algum ID do painel frontal, assegure que onó referido pelo ID do painel frontal esteja mostrando Erro de Nó 578:. Seele não estiver relatando o erro de nó 578, assegure que os dois nós possamse comunicar entre si. Verifique a conectividade da SAN e reinicie um dosdois nós pressionando o botão de energia do painel frontal duas vezes.

- Se os dados de erro contiverem um ID de WWPN/LUN, verifique aconectividade da SAN entre este nó e esse WWPN. Verifique o sistema dearmazenamento para assegurar que a LUN referenciada esteja online. Apósa verificação, reinicie o nó pressionando o botão de energia no painelfrontal duas vezes.

Nota: Se depois de resolver todos esses cenários, metade ou mais da metadedos nós estiverem relatando Erro de Nó: 578, é adequado executar oprocedimento de recuperação.

– Para todos os nós que relatem um erro de nó 550, verifique se todo ohardware ausente que for identificado por esses erros estão alimentados econectados sem falhas.

– Se não puder reiniciar o sistema, e se algum nó diferente do nó atual estiverrelatando o erro de nó 550 ou 578, você deverá remover os dados do sistemadesses nós. Essa ação reconhece a perda de dados e coloca os nós no estadocandidato necessário.

Removendo informações do sistema em cluster para nós comcódigo de erro 550 ou 578 usando o painel frontal

O procedimento de recuperação para os sistemas em cluster só funcionará quandotodos os nós estiverem no status de candidato. Se houver nós que exibem o códigode erro 550 ou 578, você deverá remover seus dados de sistema.

Sobre Esta Tarefa

Para remover informações do sistema em cluster de um nó com um erro 550 ou578, siga este procedimento do painel frontal:

Procedimento1. Pressione e solte o botão para cima ou para baixo até que a opção do menu

Ações seja exibida.2. Pressione e solte o botão selecionar.3. Pressione e solte o botão para cima ou para baixo até que a opção Remover

Cluster? seja exibida.4. Pressione e solte o botão selecionar.

276 SAN Volume Controller: Guia de Resolução de Problemas

Page 295: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

5. O nó exibe Confirmar Remoção?.6. Pressione e solte o botão selecionar.7. O nó exibe Cluster:.

Resultados

Quando todos os nós mostrarem Cluster: na linha superior e em branco nasegunda linha, os nós estarão no status de candidato. O erro 550 ou 578 foiremovido. Agora é possível executar o procedimento de recuperação.

Removendo as informações do sistema para nós com códigode erro 550 ou código de erro 578 usando o assistente deserviço

O procedimento de recuperação de sistema funciona somente quando todos os nósestão no status candidato. Se houver nós que exibam o código de erro 550 ou ocódigo de erro 578, você deverá remover seus dados.

Sobre Esta Tarefa

Antes de executar esta tarefa, assegure-se de que você leu as informações deintrodução no procedimento do sistema de recuperação geral.

Para remover informações do sistema de um nó com um erro 550 ou 578, siga esteprocedimento utilizando o assistente de serviço:

Procedimento1. Aponte seu navegador para o endereço IP de serviço de um dos nós como, por

exemplo, https://node_service_ip_address/service/.Se você não souber o endereço IP ou se ele não tiver sido configurado,configure o endereço de serviço de uma das maneiras a seguir:v Nos nós SAN Volume Controller modelos 2145-CG8 e 2145-CF8, use o menu

do painel frontal para configurar um endereço de serviço no nó.v Nos nós SAN Volume Controller 2145-DH8, use a porta técnica para se

conectar ao assistente de serviço e configurar um endereço de serviço no nó.2. Efetue logon no assistente de serviço.3. Selecione Gerenciar Sistema.4. Clique em Remover Dados do Sistema.5. Confirme se deseja remover os dados do sistema quando solicitado.6. Remova os dados de sistema para outros nós que exibam um erro 550 ou 578.

Todos os nós anteriormente nesse sistema devem ter um status de nó deCandidato e não devem ter nenhum erro listado com relação a eles.

7. Resolva quaisquer erros de hardware até que a condição de erro de todos osnós no sistema seja Nenhum.

8. Assegure-se de que todos os nós no sistema exibam um status de candidato.

Resultados

Quando todos os nós exibem um status de candidato e todas as condições de errosão Nenhum, é possível executar o procedimento de recuperação.

Capítulo 9. Procedimentos de recuperação 277

Page 296: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Concluindo o procedimento de recuperação para os sistemasem cluster usando o painel frontal

Inicie a recuperação quando todos os nós que eram membros do sistema estiveremonline e no status de candidato. Se houver quaisquer nós que exibam o código deerro 550 ou 578, remova seus dados do sistema para colocá-los no status decandidato. Não execute o procedimento de recuperação em nós diferentes nomesmo sistema; esta restrição inclui sistemas em cluster remoto.

Sobre Esta Tarefa

Atenção: Esta ação de serviço terá sérias implicações se não for concluídaadequadamente. Se a qualquer momento um erro for encontrado não coberto poreste procedimento, pare e chame o Suporte IBM.

Qualquer uma das categorias a seguir de mensagens podem ser exibidas:v T3 bem-sucedido

Os volumes estão online. Use as verificações finais para tornar o ambienteoperacional; consulte “O Que Verificar Após a Execução da Recuperação doSistema” na página 282.

v T3 incompleto

Um ou mais volume(s) está(ão) offline, porque havia dados de gravação rápidano cache. As ações adicionais são necessárias para tornar os volumes online;consulte “Recuperando a partir de volumes offline usando a CLI” na página 281para obter detalhes (especificamente, consulte a tarefa relativas à recuperaçãodos VDisks offline usando a interface da linha de comandos (CLI)).

v T3 com falha

Ligue para o Suporte IBM. Não tente mais nenhuma ação.

Inicie o procedimento de recuperação de qualquer nó no sistema; o nó não deve terparticipado de nenhum outro sistema. Para receber resultados ideais para manter aordem de grupo de E/S, execute a recuperação de um nó que estava no grupo deE/S 0.

Nota: Cada estágio individual do procedimento de recuperação pode levar umtempo significativo para ser concluído, dependendo da configuração específica.

Procedimento1. Clique no botão para cima ou para baixo até que a opção do menu Ações seja

exibida; em seguida, clique em Selecionar.2. Clique no botão para cima ou para baixo até que a opção Recuperar Cluster?

seja exibida, e, em seguida, clique em Selecionar; o nó exibe ConfirmarRecuperar?.

3. Clique em Selecionar; o nó exibe Recuperação.Após um curto atraso, a segunda linha exibe uma sequência de mensagens deprogresso indicando as ações que estão ocorrendo; por exemplo, Localizandoqdisks. Os arquivos de backup são digitalizados para localizar os dados debackup de configuração mais recentes.Após o arquivo e a recuperação de dados de quorum ser concluída, o nóexibirá Dados T3: na linha superior.

4. Verifique a data e hora na segunda linha da exibição. O registro de data e horamostrado é a data e a hora da última atualização do quorum e deverá ter

278 SAN Volume Controller: Guia de Resolução de Problemas

Page 297: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

menos de 30 minutos antes da falha. O formato do registro de data e hora éYYYYMMDD hh:mm, em que YYYY é o ano, MM é o mês, DD é o dia, hh é ahora e mm é o minuto.Atenção: Se o registro de data e hora não for inferior a 30 minutos antes dafalha, ligue para o suporte IBM.

5. Após verificar se o registro de data e hora está correto, pressione e segure aSETA PARA CIMA e clique em Selecionar.O nó exibe Arquivo de backup na linha superior.

6. Verifique a data e hora na segunda linha da exibição. O registro de data e horamostrado é a data e a hora do último backup da configuração e deverá termenos que 24 horas antes da falha. O formato do registro de data e hora éYYYYMMDD hh:mm, em que YYYY é o ano, MM é o mês, DD é o dia, hh é ahora e mm é o minuto.Atenção: Se o registro de data e hora não for inferior a 24 horas antes dafalha, ligue para o suporte IBM.

Nota: Alterações feitas após a hora desse backup de configuração poderão nãoser restauradas.

7. Após verificar se o registro de data e hora está correto, pressione e segure aSETA PARA CIMA e clique em Selecionar.O nó exibe Restaurar. Após um curto atraso, a segunda linha exibirá umasequencia de mensagens de progresso indicando as ações que estão ocorrendo;em seguida, o software no nó será reiniciado.O nó exibe Cluster na linha superior e um endereço IP de gerenciamento nasegunda linha. Após alguns momentos, o nó exibirá Concluindo T3 .

Nota: Quaisquer erros do sistema registrados neste momento podem substituirtemporariamente a exibição; ignore a mensagem: Erro de Cluster: 3025. Apósum curto atraso, a segunda linha exibirá uma sequência de mensagens deprogresso indicando as ações que estão ocorrendo.Quando cada nó for incluído no sistema, a exibição mostrará o Cluster: nalinha superior e o nome do cluster (sistema) na segunda linha.Atenção: Após o último nó ser incluído no sistema, haverá um atraso curtopara permitir que o sistema se estabilize. Não tente usar o sistema. Arecuperação ainda está em andamento. Assim que a recuperação estiverconcluída, o nó exibirá T3 Bem-sucedido na linha superior.

8. Clique em Selecionar para retornar o nó para a exibição normal.

Resultados

A recuperação será concluída quando o nó exibir T3 Bem-sucedido. Verifique se oambiente está operacional concluindo as verificações fornecidas em “O QueVerificar Após a Execução da Recuperação do Sistema” na página 282.

Executando Recuperação do Sistema Usando o Assistente deServiço

Inicie a recuperação quando todos os nós que eram membros do sistema estiveremonline e no status de candidato. Se algum nó exibir o código de erro 550 ou 578,remova as informações do sistema para colocá-los no status de candidato. Nãoexecute o procedimento de recuperação em diferentes nós no mesmo sistema; estarestrição inclui sistemas remotos.

Capítulo 9. Procedimentos de recuperação 279

Page 298: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Antes de Iniciar

Nota: Assegure-se de que o navegador da web não esteja bloqueando janelaspop-up. Se estiver, as janelas de progresso não poderão ser abertas.

Antes de iniciar este procedimento, leia as informações introdutórias doprocedimento do sistema de recuperação; consulte “Procedimento do Sistema deRecuperação” na página 273.

Sobre Esta Tarefa

Atenção: Esta ação de serviço tem sérias implicações se não concluídaadequadamente. Se a qualquer momento for encontrado um erro não abordado poreste procedimento, pare e ligue para o centro de suporte.

Execute a recuperação de qualquer nó no sistema; os nós não devem terparticipados de nenhum outro sistema.

Se o sistema tiver criptografia, execute a recuperação a partir de qualquer nó nosistema que tenha um conector USB inserido que contenha a chave de criptografia.

Nota: Cada estágio individual do procedimento de recuperação pode levar algumtempo significativo para concluir, dependendo da configuração específica.

Procedimento1. Aponte o navegador para o endereço IP de serviço de um dos nós.

Se você não souber o endereço IP ou se ele não tiver sido configurado,configure o endereço de serviço de uma das maneiras a seguir:v Nos nós SAN Volume Controller modelos 2145-CG8 e 2145-CF8, use o menu

do painel frontal para configurar um endereço de serviço no nó.v Nos nós SAN Volume Controller 2145-DH8, use a porta técnica para se

conectar ao assistente de serviço e configurar um endereço de serviço no nó.2. Efetue logon no assistente de serviço.3. Selecione Recuperar Sistema na navegação.4. Siga as instruções on-line para concluir o procedimento de recuperação.

a. Verifique a data e hora do último horário quorum. O registro de data e horadeve ser inferior a 30 minutos antes da falha. O formato do registro de datae hora é YYYYMMDD hh:mm, em que YYYY é o ano, MM é o mês, DD é odia, hh é a hora e mm é o minuto.Atenção: Se o registro de data e hora não for inferior a 30 minutos antesda falha, ligue para o centro de suporte.

b. Verifique a data e hora da última data de backup. O registro de data e horadeve ser inferior a 24 horas antes da falha. O formato do registro de data ehora é YYYYMMDD hh:mm, em que YYYY é o ano, MM é o mês, DD é odia, hh é a hora e mm é o minuto.Atenção: Se o registro de data e hora não for inferior a 24 horas antes dafalha, ligue para o centro de suporte.Mudanças feitas após a hora dessa data de backup podem não serrestauradas.

280 SAN Volume Controller: Guia de Resolução de Problemas

||

Page 299: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Resultados

Qualquer uma das categorias de mensagens a seguir pode ser exibida:v T3 successful

Os volumes voltam a ficar on-line. Use as verificações finais para fazer com queseu ambiente funcione novamente.

v Recuperação T3 concluída com erros

Recuperação T3 concluída com erros: Um ou mais volumes estão offline, porquehavia dados de gravação rápida no cache. Para tornar os volumes online,consulte “Recuperando a partir de volumes offline usando a CLI” para obterdetalhes.

v T3 failed

Ligue para o centro de suporte. Não tente mais nenhuma ação.

Verifique se o ambiente está operacional concluindo as verificações que sãofornecidas em “O Que Verificar Após a Execução da Recuperação do Sistema” napágina 282.

Se algum erro for registrado no log de erros após o procedimento de recuperaçãodo sistema ser concluído, use os procedimentos de correção para resolver esseserros, principalmente os erros que estão relacionados às matrizes offline.

Se a recuperação for concluída com volumes off-line, acesse “Recuperando a partirde volumes offline usando a CLI”.

Recuperando a partir de volumes offline usando a CLISe um procedimento de recuperação de Camada 3 for concluído com volumesoffline, é provável que os dados que estavam no cache de gravação das caixas donó tenham sido perdidos durante a falha que fez com que todas as caixas do nóperdessem o estado do cluster do sistema de armazenamento de blocos. É possívelusar a interface da linha de comandos (CLI) para reconhecer que houve dadosperdidos do cache de gravação e retornar o volume de volta para online paratentar lidar com a perda de dados.

Sobre Esta Tarefa

Se você tiver executado o procedimento de recuperação, mas houver volumesoffline, será possível concluir as etapas a seguir para colocar os volumes onlinenovamente. Todos os volumes que estão offline e não são volumes de thinprovisioning (ou compactados) encontram-se offline devido à perda de dados docache de gravação durante o evento que resultou na perda do estado do clusterpor todas as caixas do nó. Não é possível recuperar os dados perdidos do cache degravação. Esses volumes podem precisar de etapas adicionais após o volume tersido colocado online de volta.

Nota: Se você encontrar erros no log de erro após a execução do procedimento derecuperação que estejam relacionados com as matrizes offline, use osprocedimentos de correção para resolver erros da matriz offline antes de corrigir oserros do volume offline.

Capítulo 9. Procedimentos de recuperação 281

Page 300: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Exemplo

Conclua as etapas a seguir para recuperar um volume offline após o procedimentode recuperação ter sido concluído:1. Exclua todos os mapeamentos de função do IBM FlashCopy e relacionamentos

Metro Mirror ou Global Mirror que usam volumes offline.2. Execute o comando recovervdisk, recovervdiskbyiogrp ou

recovervdiskbysystem. (Isso apenas colocará o volume online novamente paraque seja possível tentar lidar com a perda de dados.)

3. Consulte “O Que Verificar Após a Execução da Recuperação do Sistema” parasaber o que fazer com volumes que foram corrompidos pela perda de dados docache de gravação.

4. Recrie todos os mapeamentos FlashCopy e relacionamentos Metro Mirror ouGlobal Mirror que usam os volumes.

O Que Verificar Após a Execução da Recuperação do SistemaDiversas tarefas devem ser concluídas antes de usar o sistema.

O procedimento de recuperação recria o antigo sistema a partir de dados dequorum. Entretanto, algumas coisas não podem ser restauradas, como dados emcache ou dados do sistema que gerencia a E/S em andamento. Essa última perdade dados de estado afeta as matrizes RAID que gerenciam o armazenamentointerno. O mapa detalhado sobre onde os dados estão fora de sincronização foiperdido, o que significa que todas as informações de paridade precisam serrestauradas e que os pares espelhados precisam ser sincronizados novamente.Normalmente, isso resulta em uso de dados antigos ou obsoletos; portanto, apenasas gravações em andamento são afetadas. Contudo, se a matriz perdeu aredundância (como sincronização ou status RAID degradado ou crítico) antes doerro que exige a recuperação do sistema, a situação é mais grave. Nessa situação, énecessário verificar o armazenamento interno:v As matrizes de paridade provavelmente estarão sendo sincronizadas para

restaurar a paridade; elas não têm redundância quando essa operação continua.v Como não há redundância nesse processo, blocos inválidos podem ter sido

criados onde os dados não são acessíveis.v As matrizes de paridade poderiam ser marcadas como corrompidas. Isso indica

que a extensão dos dados perdidos é mais ampla do que a E/S em andamento e,para colocar a matriz online, a perda de dados deve ser reconhecida.

v As matrizes RAID-6 que estavam realmente comprometidas antes darecuperação do sistema podem requerer uma restauração integral a partir dobackup. Por esse motivo, é importante ter, no mínimo, uma correspondência decapacidade sobressalente disponível.

Esteja ciente destas diferenças com relação à configuração recuperada:v Mapeamentos FlashCopy são restaurados como “idle_or_copied” com progresso

de 0%. Ambos os volumes devem ter sido restaurados para seus grupos de E/Soriginal.

v O ID de gerenciamento é diferente. Todos os scripts ou programas associadosque se referem ao ID do sistema de gerenciamento do sistema em cluster(sistema) devem ser alterados.

v Todos os mapeamentos FlashCopy que não estavam no estado “idle_or_copied”com 100% de progresso no ponto de desastre têm dados inconsistentes nos seusdiscos de destino. Esses mapeamentos devem ser reiniciados.

282 SAN Volume Controller: Guia de Resolução de Problemas

Page 301: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Parcerias e relacionamentos de cópia remota intersistemas não são restaurados edevem ser recriados manualmente.

v Os grupos de consistências não são restaurados e devem ser recriadosmanualmente.

v Relacionamentos de cópia remota intrasistemas são restaurados se todas asdependências foram restauradas com êxito para seus grupos de E/S original.

v Se o hardware foi substituído antes da recuperação, o certificado SSL poderá nãoser restaurado. Se ele não for restaurado, um novo certificado autoassinado serágerado com uma validade de 30 dias. Siga o Directed Maintenance Procedures(DMP) para obter uma resolução permanente.

v O fuso horário do sistema pode não ter sido restaurado.v Quaisquer volumes secundários Global Mirror no sistema recuperado podem ter

dados inconsistentes se houve E/S de replicação do volume primário em cacheno sistema secundário no ponto de desastre. Uma sincronização total énecessária ao recriar e reiniciar esses relacionamentos de cópia remota.

v Imediatamente após a execução do processo de recuperação T3, discoscompactados não conhecem o valor correto de sua capacidade usada. Os discosinicialmente configuram a capacidade como a capacidade real inteira. Quando aE/S continua, a capacidade é reduzida para o valor correto.Comportamento semelhante ocorre quando você usa a opção -autoexpand emvdisks. A capacidade real de um disco pode aumentar ligeiramente, causadapelo mesmo tipo de comportamento que afeta os vdisks. Novamente, acapacidade reduzida conforme a E/S para o disco é retomada.

Antes de usar os volumes, conclua as tarefas a seguir:v Inicie os sistemas host.v Ações manuais podem ser necessárias nos hosts para acioná-los para varrer

dispositivos novamente. É possível concluir essa tarefa ao desconectar ereconectar os cabos Fibre Channel em cada porta do adaptador de barramentode host (HBA).

v Verifique se todos os volumes mapeados podem ser acessados pelos hosts.v Execute verificações de consistência do sistema de arquivos.

Nota: Todos os dados que estavam no cache de gravação do SAN VolumeController no momento da falha serão perdidos.

v Execute verificações de consistência do aplicativo.

Para Volumes Virtuais (VVols), conclua as tarefas a seguir.v Depois de confirmar que o T3 foi concluído com êxito, reinicie os serviços do

Spectrum Control Base (SCB). Use o comando service ibm_spectrum_controlstart do Spectrum Control Base.

v Atualize as informações do sistema de armazenamento na GUI do SCB paragarantir que os sistemas estejam em sincronização após a recuperação.– Para concluir essa tarefa, efetue login na GUI do SCB.– Passe o mouse sobre o sistema de armazenamento afetado, selecione o

ativador do menu e, então, selecione Atualizar. Essa etapa preenchenovamente o sistema.

– Repita essa etapa para todas as instâncias do Spectrum Control Base.v Varra novamente os provedores a partir do vSphere Web Client.

– Selecione vCSA > Gerenciar > Provedores de Armazenamento > selecioneVP Ativo > Ícone Varrer novamente.

Capítulo 9. Procedimentos de recuperação 283

Page 302: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Para Volumes Virtuais (VVols), também esteja ciente das informações a seguir.

Mapeamentos de FlashCopy não são restaurados para VVols. As implicações são asseguintes.v Os mapeamentos que descrevem os relacionamentos de captura instantânea da

VM são perdidos. No entanto, os Volumes Virtuais que estão associados a essascapturas instantâneas ainda existem e as capturas instantâneas ainda podemaparecer no Web client do vSphere. Esse resultado pode ter complicações nasolução de backup do VMware.– Não tente reverter para capturas instantâneas.– Use o Web client do vSphere para excluir quaisquer capturas instantâneas

para VMs em um armazenamento de dados VVol para liberar espaço emdisco que estiver sendo usado desnecessariamente.

v Os destinos de qualquer relacionamento FlashCopy de 'clone' pendente poderãonão funcionar conforme esperado (mesmo que o vSphere Web Client tenharecentemente relatado operações de clone como concluídas). Para quaisquerVMs, que são destinos de operações de clone recentes, conclua as seguintestarefas.– Execute as verificações de integridade de dados conforme recomendado para

volumes convencionais.– Se os clones não funcionarem conforme esperado ou se mostrar sinais de

dados corrompidos, obtenha um clone atualizado da VM de origem paragarantir que a integridade de dados seja mantida.

Fazendo Backup e Restaurando a Configuração do SistemaÉ possível fazer backup e restaurar os dados de configuração para o sistemadepois que as tarefas preliminares estiverem concluídas.

Os dados de configuração para o sistema fornecem informações sobre seu sistemae os objetos que estão definidos nele. As funções de backup e restauração docomando svcconfig podem fazer backup e restaurar apenas os dados deconfiguração para o sistema SAN Volume Controller. Você deve fazer regularmenteo backup de seus dados do aplicativo usando os métodos de backup apropriados.

É possível manter seus dados de configuração para o sistema concluindo asseguintes tarefas:v Fazendo backup dos dados de configuraçãov Restaurando os dados de configuraçãov Excluindo arquivos de dados de configuração de backup indesejados

Antes de fazer backup de seus dados de configuração, os seguintes pré-requisitosdevem ser atendidos:v Nenhuma operação que altere a configuração para o sistema pode estar em

execução enquanto o comando de backup estiver em execução.v Nenhum nome de objeto pode começar com um caractere sublinhado (_).

Nota:

v Os nomes de objeto padrão para controladores, grupos de E/S e discosgerenciados (MDisks) não são restaurados corretamente se o ID do objeto fordiferente do que está registrado no arquivo de dados de configuração atual.

284 SAN Volume Controller: Guia de Resolução de Problemas

Page 303: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Todos os outros objetos com nomes padrão são renomeadas durante o processode restauração. Os novos nomes aparecem no formato name_r em que name é onome do objeto em seu sistema.

v Conexões com iSCSI Mdisks para fins de migração não são restaurados.

Antes de restaurar seus dados de configuração, os seguintes pré-requisitos devemser atendidos:v Ter a função Administrador de Segurança associada ao seu nome de usuário e

sua senha.v Ter uma cópia de seus arquivos de configuração de cluster de backup em um

servidor que esteja acessível ao sistema.v Ter uma cópia de backup de seus dados do aplicativo que esteja pronta para ser

carregada em seu sistema após a operação de restauração de configuração estarconcluída.

v Conhecer as configurações atuais de licença para seu sistema.v Você não removeu nenhum hardware desde o último backup de sua

configuração do sistema. Se tiver substituído um nó com falha, o novo nó deveutilizar o mesmo nome universal do nó (WWNN) que o nó com falhasubstituído.

Nota: É possível incluir novo hardware, mas você não deve remover nenhumhardware porque a remoção pode fazer o processo de restauração falhar.

v Nenhuma mudança de zoneamento foi feita na malha Fibre Channel que evitariaa comunicação entre o SAN Volume Controller e qualquer controlador dearmazenamento que esteja presente na configuração.

v Você tem pelo menos 3 unidades flash USB, se a criptografia foi ativada nosistema quando a sua configuração teve backup feito. As unidades flash USB sãousadas para geração de novas chaves como parte do processo de restauração oupara restaurar a criptografia manualmente se o sistema tiver menos de 3 portasUSB.

Use as etapas a seguir para determinar como obter uma recuperação de T4 ideal:v Abra o arquivo svc.config.backup.xml (ou svc.config.cron.xml) apropriado com

um editor de texto ou navegador adequado e navegue até a seção do nó doarquivo.

v Para cada entrada de nó, anote o valor das propriedades a seguir: IO_group_idand panel_name.

v Use o comando da CLI sainfo lsservicenodes e os dados para determinar quaisnós anteriormente pertecentes em cada grupo de E/S.

A restauração da configuração do sistema deve ser executada por um dos nóslocalizados anteriormente no grupo de E/S zero. Por exemplo, propertyname="IO_group_id" value="0" . Os nós restantes devem ser incluídos, conformenecessário, na ordem apropriada com base no IO_group_id anterior de seus nós.

O SAN Volume Controller analisa o arquivo de dados de configuração de backup eo sistema para verificar se os nós do sistema controlador de disco necessários estãodisponíveis.

Antes de começar, a recuperação de hardware deve ser concluída. O hardware aseguir deve estar operacional: hosts, SAN Volume Controller nós, unidades flashinternas e gabinetes de expansão (se aplicáveis), a rede Ethernet, a malha SAN equaisquer sistemas de armazenamento externos (se aplicáveis).

Capítulo 9. Procedimentos de recuperação 285

1

Page 304: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Fazendo Backup da Configuração do Sistema Utilizando a CLIÉ possível fazer backup dos dados de configuração de dados utilizando a interfaceda linha de comandos (CLI).

Antes de Iniciar

Antes de fazer backup de seus dados de configuração, os seguintes pré-requisitosdevem ser atendidos:v Operações não independentes que alterem a configuração podem estar em

execução enquanto o comando backup estiver em execução.v Nenhum nome de objeto pode começar com um caractere sublinhado (_).

Sobre Esta Tarefa

O recurso de backup do comando da CLI svcconfig é projetado para fazer backupde informações sobre sua configuração do sistema, como volumes informações deMetro Mirror locais, informações de Global Mirror locais, conjuntos dearmazenamento e nós. Todos os outros dados gravados nos volumes não passampor backup. Todo aplicativo que usa os volumes no sistema como armazenamento,deve usar os métodos de backup apropriados para fazer backup de seus dados deaplicativo.

É necessário fazer backup de seus dados de configuração e de seus dados deaplicativo regularmente para evitar a perda de dados, como após quaisquermudanças significativas na configuração do sistema.

Nota: O sistema cria automaticamente um backup dos dados de configuraçãotodos os dias às 1 h. Este backup é conhecido como um backup cron e é gravadoem /dumps/svc.config.cron.xml_serial# no nó de configuração.

Use estas instruções para gerar um backup manual a qualquer momento. Se umafalha grave ocorrer, tanto a configuração do sistema quanto os dados do aplicativopoderão ser perdidos. É possível usar o backup dos dados de configuração pararestaurar a configuração do sistema de acordo com o estado exato em que estavaantes da falha. Em alguns casos, é possível recuperar automaticamente os dados doaplicativo. Esse backup pode ser tentado com o Recover System Procedure,também conhecido como procedimento de Camada 3 (T3). Para restaurar aconfiguração do sistema sem tentar recuperar os dados do aplicativo, use oprocedimento Restaurando a Configuração do Sistema, também conhecido comorecuperação de Camada 4 (T4). Os dois procedimentos requerem um backuprecente dos dados de configuração.

Conclua as etapas a seguir para fazer backup de seus dados de configuração:

Procedimento1. Use seu método de backup preferencial para fazer backup de todos os dados

do aplicativo que você armazenou em seus volumes.2. Emita o seguinte comando da CLI para fazer backup da sua configuração:

backup do svcconfig

A saída a seguir é um exemplo das mensagens que podem ser exibidas duranteo processo de backup:

286 SAN Volume Controller: Guia de Resolução de Problemas

Page 305: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

CMMVC6112W io_grp io_grp1 possui um nome padrãoCMMVC6112W io_grp io_grp2 possui um nome padrãoCMMVC6112W mdisk mdisk14 ...CMMVC6112W node node1 ...CMMVC6112W node node2 .......................................................

O comando da CLI svcconfig backup cria três arquivos que forneceminformações sobre o processo de backup e a configuração. Esses arquivos sãocriados no diretório /dumps da caixa do nó de configuração.Tabela 73 descreve os três arquivos que são criados pelo processo de backup:

Tabela 73. Arquivos criados pelo processo de backup

Nome do arquivo Descrição

svc.config.backup.xml_<serial#> Contém seus dados de configuração.

svc.config.backup.sh_<serial#> Contém os nomes dos comandos que foramemitidos para criar o backup do sistema.

svc.config.backup.log_<serial#> Contém detalhes sobre o backup, incluindoqualquer erro ou aviso relatado.

3. Verifique se o comando svcconfig backup foi concluído com sucesso e examinea saída de comando em busca de avisos ou erros. A saída a seguir é umexemplo da mensagem que é exibida quando o processo de backup forbem-sucedido:

CMMVC6155I Processamento de SVCCONFIG concluído com sucesso

Em caso de falha no processo, resolva os erros e execute o comandonovamente.

4. Mantenha as cópias de backup dos arquivos fora do sistema para protegê-loscontra uma falha de hardware do sistema. Copie os arquivos de backup fora dosistema para um local seguro; use a linha de comandos da GUI degerenciamento ou do SmartCloud Provisioning. Por exemplo:pscp -unsafe superuser@cluster_ip:/dumps/svc.config.backup.*/offclusterstorage/

O cluster_ip é o endereço IP ou nome DNS do sistema e offclusterstorage é olocal em que você deseja armazenar os arquivos de backup.

Dica: Para manter o acesso controlado para seus dados de configuração, copieos arquivos de backup para um local que seja protegido por senha.

Restaurando a Configuração do SistemaUtilize esse procedimento nas situações a seguir: apenas em caso de falha noprocedimento Recuperar ou se os dados armazenados nos volumes não foremnecessários. Esse procedimento também é conhecido como recuperação da Camada4 (T4). Para obter instruções sobre o procedimento de recuperação, consulte“Procedimento do Sistema de Recuperação” na página 273.

Antes de Iniciar

Este procedimento de restauração de configuração é projetado para restaurarinformações sobre a sua configuração, como volumes, local do informações doMetro Mirror, informações do Global Mirror local, conjuntos de armazenamentos e

Capítulo 9. Procedimentos de recuperação 287

Page 306: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

nós. Os dados que você gravou nos volumes não são restaurados. Para restaurar osdados nos volumes, você deve restaurar os dados do aplicativo a partir dequalquer aplicativo que utilize os volumes no sistema em cluster comoarmazenamento separadamente. Portanto, você deve ter um backup desses dadosantes de seguir o processo de recuperação de configuração.

Se a criptografia foi ativada no sistema quando a sua configuração teve backupfeito, então, pelo menos 3 unidades flash USB precisam estar presentes nas portasUSB do nó da do para a restauração de configuração funcionar. As unidades flashUSB não precisam conter nenhuma chave. Eles destinam-se à geração de novaschaves como parte do processo de restauração.

Sobre Esta Tarefa

Você deve fazer regularmente o backup de seus dados de configuração e seusdados de aplicativo para evitar a perda de dados. Se um sistema for perdido apósa ocorrência de uma falha grave, tanto a configuração do sistema quanto dosdados do aplicativo será perdida. Deve-se restaurar o sistema para o estado exatoanterior à falha e, em seguida, recuperar os dados do aplicativo.

Durante o processo de restauração, os nós e o gabinete de armazenamento serãorestaurados para o sistema e, em seguida, os MDisks a matriz serão recriados econfigurados. Se houver vários gabinetes de armazenamento envolvidos, asmatrizes e os MDisks serão restaurados nos gabinetes adequados com base nos IDsde gabinete.

Importante:

v Há duas fases durante o processo de restauração: preparação e execução. Vocênão deve alterar a malha ou o sistema entre essas duas fases.

v Para um sistema SAN Volume Controller que contém nós com mais de quatroportas do Fibre Channel, as configurações localfcportmask e partnerfcportmaskdo sistema são reaplicadas manualmente antes da restauração dos dados.Consulte a etapa 8 na página 290.

v Para um SAN Volume Controller com unidades flash interno (incluindo nós queestão conectados a gabinetes de expansão), todos os nós devem ser incluídos nosistema antes de você restaurar os dados. Consulte a etapa 9 na página 290.

v Para sistemas SAN Volume Controller que contêm nós que estão conectados acontroladores externos virtualizados por iSCSI, todos os nós precisam serincluídos no sistema antes de restaurar seus dados. Além disso, as configuraçõesdo sistema cfgportip e as portas de armazenamento iSCSI precisam serreaplicadas manualmente antes da restauração dos seus dados. Consulte a etapa10 na página 290.

v Para ambientes do Volumes virtuais do VMware vSphere (às vezes chamados deVVols), após uma restauração T4, algumas das etapas da configuração doVolumes virtuais já estão concluídas: metadatavdisk criado, grupo de usuários eusuário criado, hosts adminlun criados. No entanto, o usuário precisa concluir asduas últimas etapas da configuração manualmente (criar um contêiner dearmazenamento no IBM Spectrum Control Base Edition e criar máquinas virtuaisno VMware vCenter). Veja Configurando o Volumes virtuais.

Se você não entender as instruções para executar os comandos da CLI, consulte asinformações de referência da interface da linha de comandos.

Para restaurar seus dados de configuração, siga estas etapas:

288 SAN Volume Controller: Guia de Resolução de Problemas

||||||

|||||||

Page 307: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Procedimento1. Verifique se todos os nós estão disponíveis como nós candidatos antes de

executar este procedimento de recuperação. Você deve remover os erros 550ou 578 para colocar o nó no estado de candidato.

2. Crie um sistema. Se possível, utilize o nó que estava originalmente no grupode E/S 0.v Para sistemas SAN Volume Controller 2145-DH8, use a porta técnica.v Para todos os outros modelos anteriores, use o painel frontal.

3. Em um navegador suportado, digite o endereço IP que foi utilizado parainicializar o sistema e a senha do superusuário padrão (passw0rd).

4. Emita o seguinte comando da CLI para assegurar que apenas o nó deconfiguração esteja on-line:lsnode

A saída a seguir é um exemplo do que é exibido:id name status IO_group_id IO_group_name config_node1 nodel online 0 io_grp0 yes

5. Usando a interface da linha de comandos, emita o seguinte comando paraefetuar logon no sistema:plink -i ssh_private_key_file superuser@cluster_ip

Em que ssh_private_key_file é o nome do arquivo de chave privado SSH para osuperusuário e cluster_ip é o endereço IP ou nome DNS do sistema para oqual você deseja restaurar a configuração.

Nota: Como a chave do host RSA alterada, uma mensagem de aviso pode serexibida quando você se conectar ao sistema utilizando o SSH.

6. Identifique o arquivo de backup de configuração a partir do qual você desejarestaurar.O arquivo pode ser uma cópia local do arquivo XML de configuração quevocê salvou quando você submetidos a backup da configuração ou umarquivo atualizado em um dos nós.O backup dos dados de configuração é automaticamente feito diariamente às01:00 da hora do sistema no nó de configuração.Faça download e verifique os arquivos de backup de configuração de todos osnós que estavam anteriormente no sistema a fim de identificar aquele quecontém o backup completo mais recentea. Na GUI de gerenciamento, clique em Configurações > Suporte.b. Clique em Mostrar listagem de log integral.c. Para cada nó (caixa) no sistema, conclua as etapas a seguir:

1) Selecione o nó em qual operar na caixa de seleção na parte superior databela.

2) Localize todos os arquivos com nomes que correspondem ao padrãosvc.config.*.xml*.

3) Clique duas vezes nos arquivos para transferi-los por download emseu computador.

d. Se um arquivo de configuração recente não estiver presente neste nó,configure os endereços IP do serviço para outros nós e conecte-se aoassistente de serviço para procurar por arquivos de configuração emoutros nós. Para obter informações adicionais, veja o tópico Opções deIPv4 de serviço ou de IPv6 de serviço em “Opções de IPv4 ou IPv6 deserviço” na página 116.

Capítulo 9. Procedimentos de recuperação 289

Page 308: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Os arquivos XML contêm uma data e um horário que podem ser usados paraidentificar o backup mais recente. Depois de identificar o arquivo XML debackup que deve ser utilizado ao restaurar o sistema, renomeie o arquivo parasvc.config.backup.xml.

7. Copie no sistema o arquivo de backup XML a partir do qual deseja restaurar.pscp full_path_to_identified_svc.config.filesuperuser@cluster_ip:/tmp/svc.config.backup.xml

8. Se o sistema contiver nós com um adaptador de interface de 10 GB ou umsegundo adaptador de interface Fibre Channel que esteja instalado e asconfigurações localfcportmask e partnerfcportmask não padrão foramconfiguradas anteriormente, reconfigure manualmente essas configuraçõesantes de restaurar os dados.

9. Se o sistema usa uma topologia estendida ou HyperSwap com nós localizadosem dois locais ou se o sistema contiver quaisquer nós com unidades flashinternas (incluindo nós que estão conectados a gabinetes de expansão), os nósdevem ser incluídos no sistema agora. Para incluir esses nós, determine onome do painel, o nome do nó e os grupos de E/S de quaisquer desses nós apartir do arquivo de backup da configuração. Para incluir os nós no sistema,execute o comando a seguir:svctask addnode -panelname panel_name -iogrp iogrp_name_or_id -name node_name

Em que panel_name é o nome que é exibido no painel, iogrp_name_or_id é onome ou ID do grupo de E/S no qual deseja incluir este nó e node_name é onome do nó.

10. Se o sistema contiver controladores de armazenamento iSCSI, agora elesprecisam ser detectados manualmente. Os nós que estão conectados a essescontroladores, os endereços IP da porta iSCSI e as portas de armazenamentoiSCSI precisam ser incluídos no sistema antes da restauração dos dados.a. Para incluir esses nós, determine o nome do painel, o nome do nó e os

grupos de E/S de quaisquer desses nós a partir do arquivo de backup daconfiguração. Para incluir os nós no sistema, execute o comando a seguir:svctask addnode -panelname panel_name -iogrp iogrp_name_or_id -name node_name

Em que panel_name é o nome que é exibido no painel, iogrp_name_or_id é onome ou ID do grupo de E/S no qual deseja incluir este nó e node_name éo nome do nó.

b. Para restaurar os endereços IP da porta iSCSI, utilize o comandocfgportip.1) Para restaurar o endereço IPv4, determine id (port_id), node_id,

node_name, IP_address, mask, gateway, host (0/1 significa não/sim),remote_copy (0/1 significa não/sim) e storage (0/1 significa não/sim)no arquivo de backup de configuração e execute o comando a seguir:svctask cfgportip -node node_name_or_id -ipipv4_address -gw ipv4_gw -hostyes | no -remotecopyyes | no -storageyes | no port_id

Em que node_name_or_id é o nome ou id do nó, ipv4_address é oendereço do protocolo da versão IP v4 da porta e ipv4_gw é o endereçodo gateway IPv4 para a porta.

2) Para restaurar o endereço IPv6, determine id (port_id), node_id,node_name, IP_address_6, mask, gateway_6, prefix_6, host_6 (0/1significa não/sim), remote_copy_6 (0/1 significa não/sim) e storage_6(0/1 significa não/sim) no arquivo de backup da configuração eexecute o comando a seguir:

290 SAN Volume Controller: Guia de Resolução de Problemas

||||

|||

|

|||

||

||||||||||||

|||||

Page 309: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

svctask cfgportip -node node_name_or_id -ip_6ipv6_address -gw_6 ipv6_gw -prefix_6prefix -host_6 yes | no -remotecopy_6yes | no -storage_6yes | no port_id

Em que node_name_or_id é o nome ou id do nó, ipv6_address é oendereço do protocolo da versão IP v6 da porta, ipv6_gw é o endereçodo gateway IPv6 para a porta e prefix é o prefixo IPv6.

Conclua as etapas b.i e b.ii para todas as portas IP (configuradasanteriormente) nas seções node_ethernet_portip_ip do arquivo deconfiguração de backup.

c. Em seguida, detecte e inclua os candidatos da porta de armazenamentoiSCSI usando os comandos detectiscsistorageportcandidate eaddiscsistorageport. Certifique-se de detectar as portas dearmazenamento iSCSI e as inclua exatamente na mesma ordem em que sãoexibidas no arquivo de backup de configuração. Se não seguir a ordemcorreta, poderá ocorrer uma falha T4. A etapa c.i precisa ser seguida pelasetapas c.ii e c.iii. Essas etapas precisam ser repetidas para todas as sessõesiSCSI listadas no arquivo de configuração de backup na mesma ordem.1) Para detectar as portas de armazenamento iSCSI, determine

src_port_id, IO_group_id (opcional, não é necessário se o valor for 255),target_ipv4/target_ipv6 (o ip de destino que não está em branco énecessário), iscsi_user_name (não é necessário se estiver em branco),iscsi_chap_secret (não é necessário se estiver em branco) e site (não énecessário se estiver em branco) no arquivo de backup de configuraçãoe execute o comando a seguir:svctaskdetectiscsistorageportcandidate-srcportid src_port_id-iogrp IO_group_id-targetip/targetip6target_ipv4/target_ipv6-username iscsi_user_name-chapsecret iscsi_chap_secret-site site_id_or_name

Em que src_port_id é o ID da porta Ethernet de origem da portaconfigurada, IO_group_id é o ID ou nome do grupo de E/S que estásendo detectado, target_ipv4/target_ipv6 é o endereço IPv4/IPv6 docontrolador iSCSI de destino IPv4/IPv6, iscsi_user_name é o nome dousuário do controlador de destino que está sendo detectado,iscsi_chap_secret é o segredo do CHAP do controlador de destino queestá sendo detectado site_id_or_name é o ID ou nome do siteespecificado que está sendo detectado.

2) Corresponda o target_iscsiname descoberto com o target_iscsiname paraessa sessão específica no arquivo de configuração de backupexecutando o comando lsiscsistorageportcandidate e use o índicecorrespondente para incluir portas de armazenamento iSCSI na etapac.iii.Execute o comando svcinfo lsiscsistorageportcandidate e determineo campo de ID da linha cujo target_iscsiname corresponde aotarget_iscsiname do arquivo de backup de configuração. Este é ocandidate_id que deve ser utilizado na etapa c.iii.

3) Para incluir a porta de armazenamento iSCSI, determine IO_group_id(opcional, não é necessário se o valor for 255), site (não é necessário seestiver em branco), iscsi_user_name (não é necessário se estiver embranco no arquivo de backup) e iscsi_chap_secret (não é necessário seestiver em branco) no arquivo de backup de configuração, forneça otarget_iscsiname_index correspondido na etapa c.ii e execute o comandoa seguir:

Capítulo 9. Procedimentos de recuperação 291

||||||||

|||

||||||||

||||||||||||||||||||||||

|||||

||||

|||||||

Page 310: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

addiscsistorageport-iogrp iogrp_id-username iscsi_user_name-chapsecret iscsi_chap_secret-site site_id_or_namecandidate_id

Em que iogrp_id é o ID ou nome do grupo de E/S incluído,iscsi_user_name é o nome do usuário do controlador de destino que estásendo incluído, iscsi_chap_secret é o segredo do CHAP do controladorde destino que está sendo incluído e site_id_or_name especificou o IDou nome do site que está sendo incluído.

4) Se a configuração for um cluster HyperSwap ou estendido, o nome elocal do controlador precisarão ser restaurados. Para restaurar o nomee local do controlador, determine controller_name e controller site_id apartir do arquivo XML de backup correspondendo o campointer_WWPN com o controlador iSCSI recém-incluído e, em seguida,execute o comando a seguir:chcontroller -namecontroller_name -sitesite_id/name controller_id/name

Em que controller_name é o nome do controlador a partir do arquivoXML de backup, site_id/name é o ID/nome do local do controladoriSCSI a partir do arquivo XML de backup e controller_id/name é o ID ounome atual do controlador.

11. Emita o seguinte comando da CLI para comparar a configuração atual com oarquivo de dados de configuração de backup:svcconfig restore -prepare

Este comando da CLI cria um arquivo de log no diretório /tmp do nó deconfiguração. O nome do arquivo de log é svc.config.restore.prepare.log.

Nota: Leva até um minuto para cada lote 256-MDisk ser descoberto. Se vocêreceber a mensagem de erro CMMVC6200W para um MDisk depois de inserir essecomando, todos os discos gerenciados (MDisks) podem não ser descobertoainda. Deixe um tempo adequado transcorrer e tente o comando svcconfigrestore -prepare novamente.

12. Emita o seguinte comando para copiar o arquivo de log em outro servidorque esteja acessível no sistema:pscp superuser@cluster_ip:/tmp/svc.config.restore.prepare.logfull_path_for_where_to_copy_log_files

13. Abra o arquivo de log a partir do servidor onde a cópia agora estáarmazenada.

14. Verifique se há erros no arquivo de log.v Se você localizar erros, corrija a condição que causou os erros e emita o

comando novamente. Você deve corrigir todos os erros antes de prosseguirpara a etapa 15.

v Se precisar de assistência, entre em contato com o IBM Support Center.15. Emita o seguinte comando da CLI para restaurar a configuração:

svcconfig restore -execute

Este comando da CLI cria um arquivo de log no diretório /tmp do nó deconfiguração. O nome do arquivo de log é svc.config.restore.execute.log.

16. Emita o seguinte comando para copiar o arquivo de log em outro servidorque esteja acessível no sistema:

292 SAN Volume Controller: Guia de Resolução de Problemas

||||||

|||||

||||||

|||

||||

||

|

||

|||||

||

||

||

|

|||

|

|

|

||

||

Page 311: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

pscp superuser@cluster_ip:/tmp/svc.config.restore.execute.logfull_path_for_where_to_copy_log_files

17. Abra o arquivo de log a partir do servidor onde a cópia agora estáarmazenada.

18. Verifique o arquivo de log para assegurar que não ocorreram erros ou avisos.

Nota: Você pode receber um aviso que indica que um recurso licenciado nãoestá ativado. Esta mensagem significa que após o processo de recuperação, asconfigurações da licença atual não correspondem às configurações de licençaanterior. O processo de recuperação continua normalmente e é possível inseriras configurações de licença corretas no GUI de gerenciamento posteriormente.Quando você efetuar login na CLI novamente sobre SSH, você verá esta saída:

IBM_2145:your_cluster_name:superuser>

O que Fazer Depois

É possível remover todos os arquivos de backup e restauração de configuraçãoindesejados do diretório /tmp em sua configuração emitindo o seguinte comandoda CLI:svcconfig clear -all

Excluindo Arquivos de Configuração de Backup Utilizando aCLI

É possível utilizar a interface da linha de comandos (CLI) para excluir arquivos deconfiguração de backup.

Sobre Esta Tarefa

Conclua as etapas a seguir para excluir os arquivos de configuração de backup:

Procedimento1. Emita o seguinte comando para efetuar logon no sistema:

plink -i ssh_private_key_file superuser@cluster_ip

em que ssh_private_key_file é o nome do arquivo-chave privado SSH para osuperusuário e cluster_ip é o endereço IP ou nome DNS do sistema em cluster apartir do qual deseja excluir a configuração.

2. Emita o seguinte comando da CLI para apagar todos os arquivos que estãoarmazenados no diretório /tmp:svcconfig clear -all

Concluindo o resgate do nó quando o nó for inicializadoNo SAN Volume Controller 2145-CG8 ou 2145-CF8, se for necessário substituir aunidade de disco rígido ou se o software na unidade de disco rígido estivercorrompido, você poderá usar o procedimento de resgate do nó para reinstalar osoftware em toda a malha do Fibre Channel a partir de seu nó do parceiro nomesmo grupo de E/S.

Capítulo 9. Procedimentos de recuperação 293

||

||

|

|||||

|

|||

|

|||

|

|

|

||

|

|

|

|

|

|||

||

|

||

|||||

Page 312: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Antes de Iniciar

Da mesma forma, se você tiver substituído o controlador de serviço, use oprocedimento de resgate do nó para assegurar que o controlador de serviço tem osoftware correto.

Sobre Esta Tarefa

Atenção: Se o controlador de serviço e a unidade de disco foram substituídosrecentemente como parte da mesma operação de reparo, o resgate do nó falhará.

Resgate do nó funciona inicializando o sistema operacional do controlador deserviço e executando um programa que copia todos os softwares do SAN VolumeController de qualquer outro nó que pode ser localizado na malha Fibre Channel.

Atenção: Ao executar operações de resgate do nó, execute somente uma operaçãode resgate do nó na mesma rede de área de armazenamento, a qualquer momento.Aguarde até que uma operação de resgate do nó seja concluída antes de iniciaroutra.

Execute as seguintes etapas para concluir o resgate do nó:

Procedimento1. Assegure-se de que os cabos Fibre Channel estejam conectados.2. Assegure-se de que pelo menos um outro nó seja conectado à malha Fibre

Channel.3. Assegure-se de que o zoneamento da rede de área de armazenamento permita

uma conexão entre pelo menos uma porta deste nó e uma porta de outro nó.Será melhor se várias portas puderem se conectar. Isso é especialmenteimportante se o zoneamento for por nome da porta universal (WWPN) e sevocê estiver usando um novo controlador de serviço. Neste caso, pode sernecessário usar as ferramentas de monitoramento da rede de área dearmazenamento para determinar os nomes da porta universal do nó. Se vocêprecisar alterar o zoneamento, lembre-se de configurá-lo de volta quando oprocedimento de serviço estiver concluído.

4. Desligue o nó.5. Pressione e libere o botões esquerdo e direito no painel frontal.6. Pressione o botão ligar/desligar.7. Continue segurando os botões da esquerda e da direita até que o símbolo de

solicitação de resgate do nó seja exibido no painel frontal (Figura 66).

Resultados

O símbolo de solicitação de resgate do nó é exibido no painel frontal até que o nócomece a inicialização do controlador de serviço. Se o símbolo de solicitação deresgate do nó exibir por mais de dois minutos, acesse a inicialização de hardwareMAP para resolver o problema. Quando o resgate do nó for iniciado, a exibição deserviço mostra o progresso ou a falha da operação de resgate do nó.

Figura 66. Exibição de Resgate do Nó

294 SAN Volume Controller: Guia de Resolução de Problemas

Page 313: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Nota: Se o nó recuperado era parte de um sistema em cluster, o nó agora estáoffline. Exclua o nó offline do sistema e, em seguida, inclua o nó de volta nosistema. Se a recuperação do nó foi usada para recuperar um nó que falhoudurante um processo de atualização de software, não será possível incluir o nó devolta no sistema até que o processo de atualização de código seja concluído. Issopode levar até quatro horas para um sistema em cluster de oito nós.

Capítulo 9. Procedimentos de recuperação 295

Page 314: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

296 SAN Volume Controller: Guia de Resolução de Problemas

Page 315: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 10. Entendendo os Erros de Mídia e os BlocosInválidos

Um sistema de armazenamento retorna uma resposta de erro de mídia para umhost quando ele não é capaz de ler com sucesso um bloco. A resposta do SANVolume Controller para uma leitura de host segue este comportamento.

A virtualização de volume que é fornecida estende o prazo quando um erro demídia é retornado para um host. Devido a esta diferença para sistemas nãovirtualizados, o sistema do SAN Volume Controller usa o termo bloqueios inválidosem vez de erros médios.

O sistema aloca volumes a partir das extensões que estão nos discos gerenciados(MDisks). O MDisk pode ser um volume em um controlador de armazenamentoexterno ou uma matriz RAID que é criada a partir das unidades internas. Nos doiscasos, dependendo do nível do RAID usado, normalmente existe proteção comrelação a um erro de leitura em uma única unidade. Entretanto, ainda é possívelobter um erro de mídia em uma solicitação de leitura se diversas unidades tiveremerros ou se as unidades estiverem reconstruindo ou estiverem offline devido aoutros problemas.

O sistema fornece recursos de migração para mover um volume de um conjuntosubjacente de armazenamento físico para outro ou para replicar um volume queusa FlashCopy ou Metro Mirror ou Global Mirror. Em todos esses casos, o volumemigrado ou o volume replicado retorna um erro de mídia para o host quando oendereço de bloco lógico no volume original é lido. O sistema mantém as tabelasde blocos inválidos para registrar onde estão os endereços de bloco lógico que nãopodem ser lidos. Essas tabelas estão associadas com os MDisks que estãofornecendo o armazenamento para os volumes.

O comando dumpmdiskbadblocks e o comando dumpallmdiskbadblocks estãodisponíveis para consultar a localização dos blocos inválidos.

Importante: O dumpmdiskbadblocks gera como saída apenas os erros de mídiavirtual que foram criados, mas não uma lista dos erros de mídia reais em MDisksou unidades.

É possível que as tabelas que são usadas para registrar as localizações de blocoinválido possam estar cheias. A tabela pode estar preenchida em um MDisk ou nosistema como um todo. Se uma tabela estiver cheia, a migração ou replicação queestava criando o bloco inválido falha porque não foi possível criar uma imagemexata do volume de origem.

O sistema cria alertas no log de eventos para as seguintes situações:v Quando ele detecta erros de mídia e cria um bloco inválidov Quando as tabelas de bloco inválido estão cheias

Tabela 74 na página 298 lista os código de erro de bloco inválido.

© Copyright IBM Corp. 2003, 2016 297

Page 316: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 74. Erros de Bloco Inválido

Código de erro Descrição

1840 O disco gerenciado tem blocos inválidos. Emum controlador externo, pode ser somenteum erro de mídia copiado.

1226 O sistema falhou ao criar um bloco inválidoporque o MDisk já tem o número máximode blocos inválidos permitidos.

1225 O sistema falhou ao criar um bloco inválidoporque o sistema já tem o número máximode blocos inválidos permitidos.

As ações recomendadas para esses alertas guiam você na correção da situação.

Limpe os blocos inválidos desalocando a extensão do disco de volume por meio daexclusão do volume ou da emissão de E/S de gravação para o bloco. É uma boaprática corrigir os blocos inválidos assim que eles são detectados. Esta ação evitaque o bloco inválido seja propagado quando o volume é replicado ou migrado. Épossível, entretanto, que o bloco inválido esteja na parte do volume que não éusada pelo aplicativo. Por exemplo, ele pode estar na parte de um banco de dadosque não foi inicializado. Esses blocos inválidos são corrigidos quando o aplicativograva dados nessas áreas. Antes de a correção ocorrer, os registros de blocoinválido continuam a ocupar o espaço de bloco inválido disponível.

298 SAN Volume Controller: Guia de Resolução de Problemas

Page 317: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 11. Usando os procedimentos de análise demanutenção

Os procedimentos de análise de manutenção (MAPs) informam como analisar umafalha que ocorre com um nó do SAN Volume Controller.

Sobre Esta Tarefa

Os nós do SAN Volume Controller devem ser configurados em pares para que sejapossível desempenhar a manutenção simultânea.

Ao efetuar o serviço em um nó, outro nó manterá a rede de área dearmazenamento (SAN) operacional. Com a manutenção simultânea, será possívelremover, substituir e testar todas as unidades substituíveis em campo (FRUs) emum nó enquanto a SAN e os sistemas host estão ligados e fazendo um trabalhoprodutivo.

Nota: A menos que exista uma razão específica, não remova a energia dos doisnós, a menos que seja instruído a fazer isso. Quando necessário remover a energia,consulte “MAP 5350: Desligando um nó” na página 328.

Procedimentov Para isolar as FRUs no nó com falha, conclua as ações e responda as perguntas

fornecidas nesses procedimentos de análise de manutenção (MAPs).v Quando instruído para trocar duas ou mais FRUs na sequência:

1. Troque a primeira FRU na lista por uma nova.2. Verifique se o problema está resolvido.3. Se o problema persistir:

a. Reinstale a FRU original.b. Troque a próxima FRU na lista por uma nova.

4. Repita as etapas 2 e 3 até que o problema seja resolvido ou todas as FRUsrelacionadas tiverem sido trocadas.

5. Execute a próxima ação indicada pelo MAP.6. Se você estiver usando um ou mais MAPs devido a um código de erro do

sistema, marque o erro como corrigido no log de eventos após o reparo, masantes de verificar o reparo.

Nota: Inicie todos os procedimentos de determinação de problemas e osprocedimentos de reparo com o “MAP 5000: Iniciar”.

MAP 5000: IniciarMAP 5000: início é um ponto de entrada para os procedimentos de análise demanutenção (MAPs) para o sistema SAN Volume Controller.

Antes de Iniciar

Nota: A interface do assistente de serviço deverá ser usada se não houver tela dopainel frontal, por exemplo, no SAN Volume Controller 2145-DH8.

© Copyright IBM Corp. 2003, 2016 299

Page 318: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Esse MAP se aplica a todos os modelos do SAN Volume Controller. Certifique-sede que sabe qual modelo está usando antes de iniciar este procedimento. Paradeterminar com qual modelo você está trabalhando, procure o rótulo que identificao tipo de modelo na frente do nó.

Você pode ser enviado aqui por uma das razões a seguir:v Os procedimentos de correção que você enviou para cáv Ocorreu um problema durante a instalação do sistema SAN Volume Controllerv Outro MAP trouxe você até aquiv Um usuário observou um problema que não foi detectado pelo sistema

Os nós SAN Volume Controller são configurados em pares. Enquanto repara umnó, você pode acessar todo o armazenamento gerenciado pelo par a partir de outronó. Com a manutenção simultânea, é possível remover, substituir e testar todas asFRUs em um sistema SAN Volume Controller enquanto a SAN e os sistemas hostssão ligados e fazem o trabalho produtivo.

Notas:

v A menos que exista uma razão específica, não remova a energia dos dois nós, amenos que seja instruído a fazer isso.

v Se uma ação nestes procedimentos envolve a remoção ou substituição de umapeça, utilize o procedimento aplicável.

v Se o problema persistir após você executar as ações neste procedimento, retorneà etapa 1 do MAPA para tentar corrigir o problema novamente.

Procedimento1. De onde você enviou para cá um procedimento de correção?

NÃO Acesse a etapa 2

SIM Acesse a etapa 6 na página 3012. (na etapa 1)

Acessar o GUI de gerenciamento. Consulte o “Acessando o GUI degerenciamento” na página 61

3. (na etapa 2)O GUI de gerenciamento inicia?

NÃO Vá para a etapa 6 na página 301.

SIM Vá para a etapa 4.4. (na etapa 3)

A janela Bem-vindo é exibida?

NÃO Vá para a etapa 6 na página 301.

SIM Vá para a etapa 5.5. (na etapa 4)

Efetue login no GUI de gerenciamento. Use o ID do usuário e a senha que éfornecido pelo usuário.Acesse a página Eventos.

300 SAN Volume Controller: Guia de Resolução de Problemas

Page 319: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Inicie o procedimento de correção da ação recomendada.Os procedimentos de correção encontraram um erro que deve ser corrigido?

NÃO Vá para a etapa 6.

SIM Siga os procedimentos de correção.6. (nas etapas 1 na página 300, 3 na página 300, 4 na página 300 e 5 na página

300)O indicador de energia no painel frontal está desligado? Verifique se o LEDde energia no painel de informações do operador está desligado.

NÃO Vá para a etapa 7.

SIM Tente ligar os nós. Consulte “Usando o controle de energia para o nódo SAN Volume Controller” na página 122.

Nota: A unidade fonte de alimentação ininterrupta que forneceenergia para o nó também pode ser desligada. O fonte de alimentaçãoininterrupta deve ser ligado antes que o nó seja ligado.

O SAN Volume Controller 2145-DH8 não possui uma unidade externado fonte de alimentação ininterrupta. Em vez disso, esse sistema temmódulos de bateria em seu painel frontal.Se os nós estiverem ativados, acesse a etapa 7; caso contrário, acesse oPower MAP apropriado: “MAP 5050: Energia do 2145-CG8 e2145-CF8” na página 313 ou“MAP 5040: energia SAN VolumeController 2145-DH8” na página 308.

7. (na etapa 6)O painel frontal do nó mostra um erro de hardware?

NÃO Vá para a etapa 8.

SIM O controlador de serviço para o sistema SAN Volume Controllerfalhou. (O SAN Volume Controller 2145-DH8 não possui umcontrolador de serviço.)a. Verifique se o controlador de serviço que está indicando um erro

está instalado corretamente. Se estiver, substitua o controlador deserviço.

b. Acesse “MAP 5700: Verificação de reparo” na página 349.8. (na etapa 7)

O LED de erro do painel de informações do operador (▌1▐ no Figura 67 napágina 302 ou ▌4▐ no Figura 68 na página 302 ou ▌7▐ no Figura 69 na página303)está iluminado ou piscando? Ou, o LED do log de verificação (▌6▐ noFigura 69 na página 303) está iluminado ou piscando?

Capítulo 11. Usando os procedimentos de análise de manutenção 301

Page 320: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O Figura 68 mostra o painel de informações do operador para o SAN VolumeController 2145-SV1.

O Figura 69 na página 303 mostra o painel de informações do operador para oSAN Volume Controller 2145-DH8.

svc00923

1

2145-CF8

2145-CG8

Figura 67. LED de Erro nos Modelos do SAN Volume Controller

sv100002

1 2 3 4 5

▌1▐ Botão de controle de energia e LED ligado

▌2▐ LED de identificação

▌3▐ LED de status do nó

▌4▐ LED de falha do nó

▌5▐ LED de status da bateria

Figura 68. SAN Volume Controller 2145-SV1 painel de informações do operador

302 SAN Volume Controller: Guia de Resolução de Problemas

Page 321: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Vá para a etapa 9.

SIM Acesse “MAP 5800: indicadores luminosos” na página 350.9. (na etapa 8 na página 301)

A tela de inicialização de hardware que você vê no Figura 70exibida no nó?O (SAN Volume Controller 2145-DH8 não possui uma tela no painel frontal.Para esse modelo do 2145-DH8, o LED de status do nó, o LED de falha e oLED de status da bateria que você vê no Figura 71 na página 304 estãotodos apagados?)

NÃO Vá para a etapa 11.

SIM Vá para a etapa 10.10. (na etapa 9)

A tela de inicialização de hardware que você vê no Figura 70 é exibida pormais de 3 minutos? No 2145-DH8, o LED de status do nó, o LED de falha eo LED de status da bateria que você vê no Figura 71 na página 304permanecem apagados por mais de 3 minutos?

NÃO Vá para a etapa 11.

SIM No 2145-DH8, acesse a etapa 23 na página 308. Caso contrário:a. Acesse “MAP 5900: Inicialização de hardware” na página 372.b. Acesse “MAP 5700: Verificação de reparo” na página 349.

11. (na etapa 9)

1 2 3 4

5 6 7

svc00824

1 2 3 4

▌1▐ Botão de controle de energia e LED ligado

▌2▐ Ícone da Ethernet

▌3▐ Botão e LED do localizador do sistema

▌4▐ Trava de liberação para o painel de sistema de diagnósticos por indicadoresluminosos

▌5▐ LEDs de atividade da Ethernet

▌6▐ LED do log de verificação

▌7▐ LED de erro no sistema

Nota: Se o nó possuir mais de 4 portas Ethernet, a atividade para as portas 5 e acima não éindicada pelos LEDs de atividade Ethernet no painel de informações do operador.

Figura 69. SAN Volume Controller 2145-DH8 painel de informações do operador

Figura 70. Exibição de Inicialização de Hardware

Capítulo 11. Usando os procedimentos de análise de manutenção 303

Page 322: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A Falha exibida na linha superior domonitor do painel frontal do nó? Ou, oLED de falha do nó (▌8▐ em Figura 71) no painel frontal de um SANVolume Controller 2145-DH8 está aceso?

Figura 71 exibe o LED de falha do nó.

NÃO Vá para a etapa 12.

SIM Conclua estas etapas:a. Se o nó possui um tela do painel frontal, observe o código de falha

e vá para “Referência de código de inicialização” na página168para acompanhar as ações de reparo.

b. Acesse a interface do assistente de serviço através da “Portatécnica para acesso do nó” na página 75 e siga a recomendação deserviço apresentada.

c. Acesse “MAP 5700: Verificação de reparo” na página 349.12. (na etapa 11 na página 303)

A mensagem Inicializando é exibida na linha superior do monitor dopainel frontal do nó?

NÃO Vá para a etapa 14 na página 305.

SIM Vá para a etapa 13.13. (na etapa 12)

Uma barra de progresso e um código de inicialização são exibidos. Se a barrade progresso não avança para mais de 3 minutos, o progresso é paralisado.A barra de progresso foi paralisada?

NÃO Vá para a etapa 14 na página 305.

SIM

a. Observe o código de falha e vá para “Referência de código deinicialização” na página 168 para completar as ações de reparo.

b. Acesse “MAP 5700: Verificação de reparo” na página 349.

SAN Volume Controller

1 3 4 5 6 7 8

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

+ -2

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

+ -1

1 2 3 4

2

4 5

1

2

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

10

3

svc00800

6

12

+--

7

8

9

11

6

▌7▐ LED de status do nó

▌8▐ LED de falha do nó

▌9▐ LED de status da bateria

Figura 71. Painel Frontal do SAN Volume Controller 2145-DH8

304 SAN Volume Controller: Guia de Resolução de Problemas

Page 323: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

14. (a partir da etapa 12 na página 304 e a etapa 13 na página 304)Se você pressionou qualquer um dos botões de navegação no painel frontal,espere por 60 segundos para assegurar que a exibição seja alternada para suaexibição padrão.O Erro de Nó é exibido na linha superior do monitor do painel frontal donó?

Ou, o LED de falha do nó, que fica no meio dos 3 LEDs de status no painelfrontal de um SAN Volume Controller 2145-DH8, está aceso? Figura 71 napágina 304 exibe o LED de falha do nó.

NÃO Vá para a etapa 15.

SIM Conclua estas etapas:a. Observe o código de falha e vá para “Visão Geral do Código de

Erro do Nó” na página 168 para completar as ações de reparo.b. Se o nó não tiver uma tela do painel frontal, acessea interface do

assistente de serviço através da “Porta técnica para acesso do nó”na página 75 e siga a recomendação de serviço apresentada.

c. Acesse “MAP 5700: Verificação de reparo” na página 349.15. (na etapa 14)

O Erro de Cluster é exibido na linha superior do monitor do painel frontaldo nó?

NÃO Vá para a etapa 16.

SIM Foi detectado um erro de cluster. Esse código de erro é exibido emtodos os nós operacionais no sistema. Os procedimentos de correçãonormalmente reparam esse tipo de erro. Siga estas etapas:a. Vá para “Visão Geral do Código do Sistema em Cluster” na página

170 para completar as ações de reparo.b. Acesse “MAP 5700: Verificação de reparo” na página 349.

16. (na etapa 15)A mensagem Desligando, Reiniciando, Encerrando, ou Falha de energia éexibida na linha superior do monitor do painel frontal?

NÃO Vá para a etapa 18 na página 306.

SIM A barra de progresso se move a cada poucos segundos. Aguarde aconclusão da operação e, em seguida, retorne para a etapa 1 na página300 deste MAP. Se a barra de progresso não se mover por 3 minutos,pressione energia e vá para a etapa 17.

17. (na etapa 16)A alimentação do nó foi desligada?

NÃO Conclua as seguintes etapas:a. Remova o cabo de alimentação da parte traseira da caixa.b. Aguarde 60 segundos.c. Substitua o cabo de alimentação.d. Se o nó não ligar, pressione energia para ligar o nó e, em seguida,

retorne para a etapa 1 na página 300 deste MAP.

SIM Conclua as seguintes etapas:a. Aguarde 60 segundos.b. Clique em energia para ligar o nó e, em seguida, retorne para a

etapa 1 na página 300 deste MAP.

Capítulo 11. Usando os procedimentos de análise de manutenção 305

Page 324: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Nota: O 2145 UPS-1U será desligado apenas quando seu botãoliga/desliga for pressionado, a energia de entrada tiver sido perdidapor mais de cinco minutos ou o nó do SAN Volume Controller o tiverencerrado após uma perda de energia de entrada relatada.

18. (na etapa 17 na página 305)A mensagem Carregando ou Recuperação é exibida na linha superior domonitor do painel frontal do nó?

NÃO Vá para a etapa 19.

SIM

v Se Carregando for exibido, a bateria do fonte de alimentaçãoininterrupta ainda não está carregada o suficiente para suportar onó. Se Carregando estiver exibido por mais de 2 horas, vá para“MAP 5150: 2145 UPS-1U” na página 317.

v Se Recuperação for exibido, a bateria do fonte de alimentaçãoininterrupta ainda não está carregada o suficiente para ser capaz desuportar o nó imediatamente após uma falha na fonte dealimentação. No entanto, se Recovering for exibido, o nó pode serutilizado normalmente.

v Se Recuperação for exibido por mais de 2 horas, acesse “MAP 5150:2145 UPS-1U” na página 317.

19. (na etapa 18)Validar WWNN? é exibido no monitor do painel frontal do nó?

NÃO Vá para a etapa 20 na página 307.

SIM O nó está indicando que seu WWNN pode precisar de alteração. O nóentra neste modo quando o controlador de serviço do nó ou o disco étrocado, mas os procedimentos de serviço não foram seguidas.

Nota: Não valide o WWNN até que você leia as informações a seguirpara garantir que você escolha o valor correto. Se você escolher umvalor incorreto, poderá descobrir que o zoneamento SAN para o nótambém não está correto e mais de um nó está utilizando o mesmoWWNN. Portanto, é importante estabelecer o WWNN correto antes decontinuar.a. Determine qual WWNN você deseja usar.v Se o controlador de serviço foi substituído, o valor correto é

provavelmente o WWNN que está armazenado no disco (oWWNN de disco).

v Se o disco foi substituído, talvez como parte de umprocedimento de substituição do quadro, mas não foireinicializado, o valor correto é provavelmente o WWNN queestá armazenado no controlador de serviço (o WWNN depainel).

b. Selecione o WWNN armazenado que você deseja que este nó use:v Para usar o WWNN que está armazenado no disco:

1) No painel Validar WWNN?, pressione e solte o botãoSelecionar. O Disco WWNN: o painel é exibido e mostra oscinco últimos dígitos do WWNN que está armazenado nodisco.

2) No painel do Disco WWNN: pressione e solte o botão parabaixo. O painel Usar Disco WWNN? é exibido.

306 SAN Volume Controller: Guia de Resolução de Problemas

Page 325: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3) Pressione e solte o botão Selecionar.v Para usar o WWNN que está armazenado no controlador de

serviço:1) No painel Validar WWNN?, pressione e solte o botão

Selecionar. O painel WWNN de disco: é exibido.2) No painel WWNN de disco: pressione e solte o botão direito.

O Painel WWNN: o painel é exibido e mostra os cincoúltimos números do WWNN que é armazenado nocontrolador de serviço.

3) No Painel WWNN, pressione e solte o botão para baixo. Opainel Usar Painel WWNN? é exibido.

4) Pressione e solte o botão Selecionar.c. Depois de configurar o WWNN, verifique o monitor do painel

frontal:v Se o painel Nó WWNN for exibido no painel frontal, o nó está

usando agora o WWNN selecionado. O painel Nó WWNNmostra os cinco últimos números do WWNN selecionado.

v Se o painel frontal mostrar Cluster, mas não mostrar um nomedo sistema, você deverá usar o procedimento de recuperaçãopara um sistema em cluster para excluir o nó do sistema eincluir o nó de volta no sistema.

20. (a partir da etapa 19 na página 306)Existe um nó que não é um membro de um sistema em cluster? É possíveldetectar se um nó não é um membro de um sistema porque o LED de statusdo nó está desligado ou piscando para o SAN Volume Controller 2145-DH8ou verificando o menu do painel frontal. Se Cluster: for exibido, masnenhum nome do sistema for mostrado, o nó não é um membro de umsistema. Se a fonte de idioma atual permite uma exibição de duas linhas, onome estará na segunda linha do monitor do painel frontal. Caso contrário,você pode pressionar o botão selecionar para exibir o nome.)

NÃO Vá para a etapa 21.

SIM O nó não é um membro de um sistema. O nó pode ter sido excluídodurante um procedimento de manutenção e não foi adicionado devolta ao sistema. Certifique-se de que cada grupo de E/S no sistemacontém dois nós. Se um grupo de E/S possui apenas um nó, inclua onó de volta para esse sistema. Em seguida, assegure que o nó sejarestaurado para o mesmo grupo de E/S do qual ele foi excluído.

21. (na etapa 20)O monitor do painel frontal é ilegível?

NÃO Vá para a etapa 22.

SIM Conclua as seguintes etapas:a. Verifique o idioma. A exibição pode ser configurada para outro

idioma.b. Se o idioma estiver configurado corretamente, vá para “MAP 5400:

Painel frontal” na página 334.22. (a partir da etapa 21)

Nenhum erro foi detectado pelo sistema SAN Volume Controller. Se vocêsuspeitar que o problema relatado pelo cliente é um problema de hardware,siga estas tarefas:

Capítulo 11. Usando os procedimentos de análise de manutenção 307

Page 326: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

a. Conclua os procedimentos de Determinação de problemas em seussistemas host, controladores de disco e comutadores de Fibre Channel.

b. Peça assistência ao suporte técnico remoto IBM.23. (na etapa 10 na página 303)

Posso acessar a interface do assistente de serviço por meio do endereço IPde serviço ou da porta do técnico do 2145-DH8 ou usar uma unidade flashUSB para obter o satask_results.html?

NÃO O software SAN Volume Controller pode não estar executando.Conecte um teclado USB e um monitor VGA ao 2145-DH8 para ver seo nó está com a inicialização travada.

SIM Vá para a etapa 24.24. (na etapa 23)

O erro de nó 561 pode ser visto?

NÃO Siga a ação recomendada para qualquer erro de nó que possa servisto.

SIM Talvez o software SAN Volume Controller não possa se comunicarcom o painel traseiro da bateria.

Verifique as conexões entre a placa do sistema e o painel traseiro dabateria. Então, siga a ação recomendada para o erro de nó 561.

Resultados

Se você suspeitar que o problema é de software, consulte “Atualizando adocumentação” do sistema para obter detalhes sobre como atualização todo o seuambiente SAN Volume Controller.

Se o problema não for corrigido, colete informações de diagnóstico e entre emcontato com Suporte técnico remotoIBM.

MAP 5040: energia SAN Volume Controller 2145-DH8Pode ser necessário resolver problemas que estão associados à energia no SANVolume Controller 2145-DH8.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Problemas de energia podem ser associados a qualquer um dos seguintes motivos:v Ocorreu um problema durante a instalação de um nó do SAN Volume Controllerv O comutador de energia falhou ao ligar o nóv O comutador de energia falhou ao desligar o nóv Outro MAP trouxe você até aqui

Procedimento1. Você está aqui porque o nó não está ligado?

NÃO Vá para a etapa 10 na página 312.

SIM Vá para a etapa 2 na página 309.

308 SAN Volume Controller: Guia de Resolução de Problemas

Page 327: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. (na etapa 1 na página 308)O LED de energia no painel de informações do operador estácontinuamente aceso? O Figura 72 mostra o local do LED de energia ▌1▐ nopainel de informações do operador.

NÃO Vá para a etapa 3.

SIM O nó está ligado corretamente. Reavalie os sintomas e retorne paraMAP 5000: Iniciar ou acesse MAP 5700: Reparar verificação paraverificar a operação correta.

3. (na etapa 2)O LED de energia no painel de informações do operador está piscandoaproximadamente quatro vezes por segundo?

NÃO Vá para a etapa 4.

SIM O nó está desligado e não está pronto para ser ativado. Aguarde atéque o LED de energia pisque a uma taxa de uma vez por segundo e,em seguida, acesse a etapa 5 na página 310.

Se este comportamento persistir por mais de 3 minutos, execute oseguinte procedimento:a. Remova toda a energia de entrada do nó doSAN Volume

Controller removendo a fonte de alimentação da parte traseira donó. Consulte “Removendo uma fonte de alimentação do SANVolume Controller 2145-DH8” quando você estiver removendo oscabos de energia do nó.

b. Aguarde 1 minuto e, em seguida, verifique se todos os LEDs deenergia no nó são apagados.

c. Reinsira a fonte de alimentação.d. Aguarde o intervalo entre as piscadas do LED de energia reduzir a

uma piscada por segundo. Vá para a etapa 5 na página 310.e. Se o LED de energia ficar piscando em um intervalo de quatro

vezes por segundo pela segunda vez, substitua as peças naseguinte sequência:v Placa-mãe

Verifique o reparo continuando com o MAP 5700: Reparar verificação.4. (na etapa 3)

O LED de energia no painel de informações do operador está piscando umavez por segundo?

5 6 7

1 2 3 4

ifs00064

▌1▐ Botão Ligar/Desligar LED de energia (verde)

Figura 72. LED de Energia no SAN Volume Controller 2145-DH8

Capítulo 11. Usando os procedimentos de análise de manutenção 309

Page 328: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

SIM O nó está em modo de espera. A energia de entrada está presente. Vápara a etapa 5.

NÃO Vá para a etapa 6.5. (na etapa 3 na página 309 e 4 na página 309)

Pressione Energia no painel de informações do operador do nó.O LED de Energia no painel de informações do operador está acendendoum verde sólido?

NÃO Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades.

Se o nó ainda falhar para ligar, substitua as peças na seguintesequência:a. Conjunto de Painel de informações do operadorb. Placa-mãe

Verifique o reparo continuando com o MAP 5700: Reparar verificação.

SIM O LED de energia no painel de informações do operador mostra que onó foi ligado com êxito. Verifique a operação correta continuando como MAP 5700: Reparar verificação.

6. (na etapa 4 na página 309)O LED de energia do painel traseiro está ligado ou piscando?Figura 73mostra o local do LED de energia ▌1▐ no SAN Volume Controller 2145-DH8.

NÃO Vá para a etapa 7.

SIM O painel de informações do operador está com falha.

Verifique se o cabo do painel de informações do operador estáencaixado na placa-mãe.

Se o nó ainda falhar para ligar, substitua as peças na seguintesequência:a. Conjunto de Painel de informações do operadorb. Placa-mãe

7. (na etapa 6)

4 1

2

54

5

svc0

0574

Figura 73. Indicador de LED de energia no painel traseiro do SAN Volume Controller 2145-DH8

310 SAN Volume Controller: Guia de Resolução de Problemas

Page 329: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Os indicadores do LED de corrente alternada na parte traseira dos conjuntosda fonte de alimentação estão acesos? Figura 74 mostra o local do LED decorrente alternada ▌1▐, o LED de corrente direta ▌2▐ e o LED de erro dealimentação de energia ▌3▐ na parte traseira do conjunto da fonte dealimentação localizada no painel traseiro do SAN Volume Controller2145-DH8.

NÃO Verifique se o cabo ou os cabos de energia de entrada estãofirmemente conectados em ambas as extremidades e não mostramsinais de dano, substitua os cabos danificados. Se o nó ainda falharpara ligar, substitua as partes especificadas que são baseadas no tipode modelo do SAN Volume Controller.

Substitua as peças do SAN Volume Controller 2145-DH8 na seguintesequência:a. Fonte de alimentação de 750 W

SIM Vá para a etapa 8.8. (na etapa 7 na página 310)

svc00794

AC

DC

AC

DC

LED AC (verde)

LED DC (verde)

LED de erro da fonte dealimentação (amarelo)

3

1

2

Figura 74. Corrente alternada, corrente direta e indicadores do LED de energia no painel traseiro do SAN VolumeController 2145-DH8

Capítulo 11. Usando os procedimentos de análise de manutenção 311

Page 330: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O LED de erro da fonte de alimentação na parte traseira da fonte dealimentação do SAN Volume Controller 2145-DH8 está aceso? Figura 74 napágina 311 mostra o local dos LEDs de erro da fonte de alimentação ▌3▐.

SIM Substitua a unidade de fonte de alimentação.

NÃO Acesse a etapa 99. (na etapa 8 na página 311)

Os indicadores de LED de corrente direta na parte traseira dos conjuntos defonte de alimentação estão acesos?

NÃO Substitua as peças do SAN Volume Controller 2145-DH8 na seguintesequência:a. Fonte de alimentação de 750 Wb. Placa-mãe

SIM Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades. Se o nó aindafalhar para ligar, substitua as peças na seguinte sequência:a. Painel de informações do operadorb. Cabo, sinalc. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

10. (na etapa 1 na página 308)O nó não desliga imediatamente quando o botão de energia é pressionado.Quando o nó estiver completamente inicializado, ele se desliga sob o controlesoftware doSAN Volume Controller. A operação de desligamento pode levaraté 5 minutos para ser concluída.O LED de energia no painel de informações do operador está piscandoaproximadamente quatro vezes por segundo?

NÃO Vá para a etapa 11.

SIM Aguarde o nó desligar. Se o nó falhar ao desligar após 5 minutos,acesse a etapa 11.

11. (na etapa 10)Atenção: Desligar o nó por qualquer meio diferente de usar o GUI degerenciamento pode causar a perda de dados no cache do nó. Se você estiverexecutando a manutenção simultânea, esse nó deve ser excluído do sistemaantes de prosseguir. Peça ao cliente para excluir o nó do sistema agora. Se elesforem incapazes de excluir o nó, entre em contato com o seu centro de suportepara obter assistência antes de prosseguir.O nó não pode ser desligado devido a uma falha de software ou por umafalha de hardware. Pressione e segure o botão de energia. O nó pode desligardentro de 5 segundos.O nó desligou?

NÃO Determine se você está usando um sistema operacional ACPI(Advanced Configuration and Power Interface) ou um sistemaoperacional não ACPI.

Se você estiver usando um sistema operacional não ACPI, execute asetapas a seguir:

Pressione Ctrl+Alt+Delete.

312 SAN Volume Controller: Guia de Resolução de Problemas

Page 331: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Desligue o servidor mantendo pressionado Power por 5segundos.

Reinicialize o servidor.

Se o servidor falhar o autoteste inicial e se pressionar Powernão funcionar, desconecte o cabo de energia por 20 segundos

Reconecte o cabo de energia e reinicie o servidor.

Se o problema persistir ou se você estiver usando um sistemaoperacional que reconhece ACPI, suspeite da placa-mãe.

Acesse a etapa 12

SIM Vá para a etapa 12.12. (na etapa 11 na página 312)

Pressione o botão de energia para ligar o nó.O nó ligou e inicializou corretamente?

NÃO Acesse “MAP 5000: Iniciar” na página 299 para resolver o problema.

SIM Vá para a etapa 13.13. (na etapa 12)

O nó provavelmente sofreu uma falha de software. Dados de dump dememória podem ser capturados que ajuda a resolver o problema. Ligue para ocentro de suporte para obter assistência.

MAP 5050: Energia do 2145-CG8 e 2145-CF8Este tópico ajuda a resolver problemas de energia que ocorreram nos modelos SANVolume Controller2145-CG8e 2145-CF8.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido trazido até aqui por uma das razões a seguir:v Ocorreu um problema durante a instalação de um nó do SAN Volume Controllerv O comutador de energia falhou ao ligar o nóv O comutador de energia falhou ao desligar nóv Outro MAP trouxe você até aqui

Sobre Esta Tarefa

Execute as etapas a seguir:

Procedimento1. Você está aqui porque o nó não está ligado?

NÃO Vá para a etapa 11 na página 317.

SIM Vá para a etapa 2.2. (na etapa 1)

O LED de energia no painel de informações do operador estácontinuamente aceso? Figura 75 na página 314 mostra o local do LED de

Capítulo 11. Usando os procedimentos de análise de manutenção 313

Page 332: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

energia ▌1▐ no painel de informações do operador.

NÃO Vá para a etapa 3.

SIM O nó está ligado corretamente. Reavalie os sintomas e retorne para“MAP 5000: Iniciar” na página 299 ou acesse “MAP 5700: Verificaçãode reparo” na página 349 para verificar a operação correta.

3. (na etapa 2 na página 313)O LED de energia no painel de informações do operador está piscandoaproximadamente quatro vezes por segundo?

NÃO Vá para a etapa 4.

SIM O nó está desligado e não está pronto para ser ativado. Aguarde atéque o LED de energia pisque a uma taxa de aproximadamente umavez por segundo, e, em seguida, acesse a etapa 5 na página 315.

Se este comportamento persistir por mais de três minutos, execute oseguinte procedimento:a. Remova toda a energia de entrada do nó doSAN Volume

Controller removendo os suportes de retenção de alimentação e oscabos de energia da parte traseira do nó. Consulte “Removendo ossuportes de retenção do cabo” para ver como remover os suportesde retenção do cabo ao remover os cabos de energia do nó.

b. Aguarde um minuto e, em seguida, verifique se todos os LEDs deenergia no nó serão apagados.

c. Reinsira os cabos de energia e os suportes de retenção dealimentação.

d. Aguarde o intervalo entre as piscadas do LED de energia reduzir auma piscada por segundo. Vá para a etapa 5 na página 315.

e. Se o LED de energia ficar piscando em um intervalo de quatrovezes por segundo pela segunda vez, substitua as peças naseguinte sequência:v Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

4. (na etapa 3)O LED de energia nopainel de informações do operador está piscandoaproximadamente uma vez por segundo?

SIM O nó está em modo de espera. A energia de entrada está presente. Vápara a etapa 5 na página 315.

NÃO Vá para a etapa 6 na página 315.

svc00715_new

1

2145-CF82145-CG8

Figura 75. LED de energia nos modelos SAN Volume Controller 2145-CG8 ou 2145-CF8painel de informações do operador

314 SAN Volume Controller: Guia de Resolução de Problemas

Page 333: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

5. (na etapa 3 na página 314 e 4 na página 314)Pressione o botão de energia no painel de informações do operador do nó.O LED de Energia no painel de informações do operador está acendendoum verde sólido?

NÃO Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades.

Se você estiver trabalhando em um SAN Volume Controller 2145-CG8ou 2145-CF8 e o nó ainda falhar para ligar, substitua as peças naseguinte sequência:a. Conjunto de Painel de informações do operadorb. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM O indicador de energia no painel de informações do operador mostraque o nó foi ligado com êxito. Continue com “MAP 5700: Verificaçãode reparo” na página 349 para verificar a operação correta.

6. (na etapa 4 na página 314)O LED de energia do painel posterior está aceso ou piscando? O Figura 76mostra o local do LED de energia ▌1▐ no 2145-CF8 ou o 2145-CG8.

NÃO Vá para a etapa 7.

SIM O painel de informações do operador está com falha.

Verifique se o cabo do painel de informações do operador estáencaixado na placa-mãe.

Se você estiver trabalhando em um SAN Volume Controller 2145-CG8ou 2145-CF8 e o nó ainda falhar para ligar, substitua as peças naseguinte sequência:a. Conjunto de Painel de informações do operadorb. Placa-mãe

7. (na etapa 6)Localize o 2145 UPS-1U (2145 UPS-1U) que está conectado a este nó.

4 1

2

54

5

svc00574

Figura 76. Indicador do LED de Energia no Painel Traseiro do SAN Volume Controller2145-CG8 ou 2145-CF8

Capítulo 11. Usando os procedimentos de análise de manutenção 315

Page 334: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

O 2145 UPS-1U que fornece energia para esse nó está ligado e seu indicadorde segmento de carga 2 está verde sólido?

NÃO Acesse “MAP 5150: 2145 UPS-1U” na página 317.

SIM Vá para a etapa 8.8. (na etapa 7 na página 315)

Os indicadores do LED de corrente alternada na parte traseira dos conjuntosda fonte de alimentação estão acesos? Figura 77 mostra o local do LED decorrente alternada ▌1▐ e o LED de corrente direta ▌2▐ na parte traseira doconjunto da fonte de alimentação localizada no painel traseiro do 2145-CF8 oudo 2145-CG8.

NÃO Verifique se o cabo ou os cabos de alimentação de entrada estãofirmemente conectados em ambas as extremidades e não mostramsinais de danos; caso contrário, se o cabo ou os cabos estiverem comdefeito ou danificados, substitua-os. Se o nó ainda falhar para ligar,substitua as partes especificadas com base no tipo de modelo doSANVolume Controller.

Substitua as peças do SAN Volume Controller 2145-CG8 ou 2145-CF8na seguinte sequência:a. Fonte de alimentação 675W

SIM Acesse a etapa 9 para modelosSAN Volume Controller 2145-CG8 ou2145-CF8.

Acesse a etapa 10 para todos os outros modelos.9. (na etapa 8)

O LED de erro da fonte de alimentação na parte traseira dos conjuntos dafonte de alimentação do SAN Volume Controller 2145-CG8 ou 2145-CF8 estáaceso? O Figura 76 na página 315 mostra o local do LED de energia ▌1▐ no2145-CF8 ou o 2145-CG8.

SIM Substitua a unidade de fonte de alimentação.

NÃO Acesse a etapa 1010. (na etapa 8 ou 9)

Os indicadores de LED de corrente direta na parte traseira dos conjuntos defonte de alimentação estão acesos?

NÃO Substitua as peças do SAN Volume Controller 2145-CG8 ou 2145-CF8na seguinte sequência:a. Fonte de alimentação 675Wb. Placa-mãe

SIM Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades. Se o nó aindafalhar para ligar, substitua as peças na seguinte sequência:

svc00571

1

2

3

Figura 77. Indicador de LED de Energia e Indicadores de corrente alternada e correntecontínua no Painel Traseiro do SAN Volume Controller 2145-CG8 ou 2145-CF8

316 SAN Volume Controller: Guia de Resolução de Problemas

Page 335: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

a. Painel de informações do operadorb. Cabo, sinal, painel frontalc. Placa-mãe (se o nó for um SAN Volume Controller 2145-CG8ou

um SAN Volume Controller 2145-CF8)

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

11. (na etapa 1 na página 313)O nó não desligará imediatamente quando o botão ligar/desligar estiverpressionado. Quando o nó estiver totalmente inicializado, o desligamento daenergia será executado sob o controle do software do SAN Volume Controller.A operação de desligamento pode demorar até cinco minutos para serconcluída.Desligando está exibido no painel frontal?

NÃO Vá para a etapa 12.

SIM Aguarde o nó desligar. Se o nó falhar ao desligar após 5 minutos,acesse a etapa 12.

12. (na etapa 11)Atenção: Desligar o nó por qualquer meio diferente de usar o GUI degerenciamento pode causar a perda de dados no cache do nó. Se você estiverexecutando a manutenção simultânea, esse nó deve ser excluído do sistemaantes de prosseguir. Peça ao cliente para excluir o nó do sistema agora. Se elesforem incapazes de excluir o nó, entre em contato com o seu centro de suportepara obter assistência antes de prosseguir.O nó não pode ser desligado devido a uma falha de software ou por umafalha de hardware. Pressione e segure o botão de energia. O nó deve desligardentro de cinco segundos.O nó desligou?

NÃO Desligue o 2145 UPS-1U que está conectado a esse nó.

Atenção: Assegure de desligar o 2145 UPS-1U correto. Se necessário,rastreie os cabos de volta até o conjunto do 2145 UPS-1U. Desligar o2145 UPS-1U errado pode causar perda de dados do cliente.

Vá para a etapa 13.

SIM Vá para a etapa 13.13. (na etapa 12)

Se necessário, ligue o 2145 UPS-1U que está conectado a esse nó e, emseguida, pressione o botão ligar/desligar para ligar o nó.O nó ligou e inicializou corretamente?

NÃO Acesse “MAP 5000: Iniciar” na página 299 para resolver o problema.

SIM Vá para a etapa 14.14. (na etapa 13)

O nó provavelmente sofreu uma falha de software. Os dados de dump podemter sido capturados que ajudarão a resolver o problema. Ligue para o centrode suporte para obter assistência.

MAP 5150: 2145 UPS-1UMAP 5150: O 2145 UPS-1U ajuda a resolver problemas que ocorreram nos sistemas2145 UPS-1U que são usados em um SAN Volume Controller.

Capítulo 11. Usando os procedimentos de análise de manutenção 317

Page 336: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido enviado para cá por uma das razões a seguir:v Os procedimentos de determinação de problema do sistema o enviou aquiv Ocorreu um problema durante a instalação de um SAN Volume Controllerv Outro MAP trouxe você até aquiv Um cliente observou um problema que não foi detectado pelos procedimentos

de determinação de problema do sistema.

Dica: Se o 2145 UPS-1U parecer não funcionar, assegure-se de que o cabo deenergia esteja conectado ou reposicione-o.

Sobre Esta Tarefa

Figura 78 mostra uma ilustração da parte frontal do painel do 2145 UPS-1U.

▌1▐ Indicador de segmento de carregamento 2▌2▐ Indicador de segmento de carregamento 1▌3▐ Alarme▌4▐ Indicador de bateria ligada▌5▐ Indicador de sobrecarga▌6▐ Indicador de ativação▌7▐ Botão ligar/desligar▌8▐ Botão de teste e reconfiguração de alarme

Tabela 75 na página 319 identifica quais LEDs de status e de erro que são exibidosno conjunto do painel frontal do 2145 UPS-1U se relacionam com as condições deerro especificadas. Ele também lista o comportamento do buzz de alerta do fontede alimentação ininterrupta.

+ -CARGA 1CARGA 2

1yyzvm

6

7

8

1 2 3 4 5

Figura 78. 2145 UPS-1U da montagem do painel frontal

318 SAN Volume Controller: Guia de Resolução de Problemas

Page 337: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 75. Indicadores de erro do 2145 UPS-1U

[1] Carregamento 2

[2] Carregamento1 [3] Alarme [4] Bateria

[5]Sobrecarga [6] Ligado Buzzer Condição de erro

Verde(consulteNota 1)

Verde (consulteNota 3 )

Sem erros; o 2145UPS-1U foiconfigurado pelo SANVolume Controller

Verde Âmbar(consulteNota 2)

Verde Sem erros; o 2145UPS-1U ainda não foiconfigurado pelo SANVolume Controller

Verde Ligado oudesligado

Âmbar Verde Sinaissonoros por

doissegundos eentão para

A energia AC estáacima ou abaixo dolimite. O fonte dealimentaçãoininterrupta foialternado para o modode bateria.

Vermelhopiscando

Âmbarpiscando

Vermelhopiscando

Verdepiscando

Três sinaissonoros acada dezsegundos

Subtensão da bateria

Verde Ligado oudesligado

Vermelhopiscando

Verdepiscando

Sólidoaceso

Sobretensão da bateria

Vermelhopiscando

Âmbarpiscando

Verdepiscando

Sólidoaceso

A onda de saída seráanormal quando ocarregador estiveraberto no modo debateria

Vermelhopiscando

Âmbarpiscando

Sólidoaceso

A onda de saída deenergia AC está soblimite baixo ou acimado limite alto no modode bateria

Verde Ligado oudesligado

Âmbar Sinaissonoros por

quatrosegundos eentão para

Bateria ligada (semenergia AC)

Verde Ligado oudesligado

Âmbarpiscando

Sinaissonoros por

doissegundos eentão para

Bateria baixa (semenergia AC)

Verde Ligado oudesligado

Vermelho Verde Sinaissonoros por

umsegundo eentão para

Sobrecarga enquantoonline

Âmbar Vermelho Sinaissonoros por

umsegundo eentão para

Sobrecarga enquantona bateria

Capítulo 11. Usando os procedimentos de análise de manutenção 319

Page 338: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 75. Indicadores de erro do 2145 UPS-1U (continuação)

[1] Carregamento 2

[2] Carregamento1 [3] Alarme [4] Bateria

[5]Sobrecarga [6] Ligado Buzzer Condição de erro

Ligado oudesligado

Ligado oudesligado

Vermelhopiscando

Verde Sólidoaceso

Falha do ventilador

Ligado oudesligado

Ligado oudesligado

Vermelhopiscando

Âmbar Sólidoaceso

Teste de bateria comfalha

Vermelhopiscando

Vermelho Sólidoaceso

Tempo limite desobrecarga

Vermelhopiscando

Âmbar Verde Sólidoaceso

Temperatura acima dolimite

Vermelhopiscando

Âmbar Vermelho Verde Saída de curto circuito

Notas:

1. O LED verde de Carregamento2 ([1]) indica que a energia está sendo fornecida para o par direito de tomadas deenergia AC conforme visto na parte traseira do 2145 UPS-1U.

2. O LED âmbar de Carregamento1 ([2]) indica que a energia está sendo fornecida para o par esquerdo de tomadasde energia AC conforme visto na parte traseira do 2145 UPS-1U. Essas tomadas não são usadas pelo SANVolume Controller.

Este LED pode estar iluminado durante as sequências de inicialização, mas ele geralmente é apagado pelo nó doSAN Volume Controller que está conectado ao 2145 UPS-1U.

3. Uma célula em branco indica que a luz ou buzzer está desligado.

Procedimento1. O indicador de ligado do 2145 UPS-1U que está conectado ao SAN Volume

Controller com falha está desligado?

NÃO Vá para a etapa 3 na página 321.

SIM Vá para a etapa 2.2. (na etapa 1)

Existem outras unidades 2145 UPS-1U mostrando o indicador de ligado comodesligado?

NÃO O 2145 UPS-1U pode estar em modo de espera. Isso pode acontecerporque o botão ligar/desligar neste 2145 UPS-1U foi pressionado, aenergia de entrada está ausente por mais de cinco minutos, ou porqueo SAN Volume Controller desligou seguindo uma perda de energia deentrada relatada. Pressione e segure o botão ligar/desligar até que oindicador de ligado do 2145 UPS-1U seja iluminado (aproximadamentecinco segundos). Em algumas versões do 2145 UPS-1U, é necessário umdispositivo com ponta, como uma chave de fenda, para pressionar obotão ligar/desligar.

Vá para a etapa 3 na página 321.

SIM A energia principal está ausente da instalação ou um comutador deenergia de corrente alternada redundante falhou. Se as 2145 UPS-1Uunidades estiverem conectadas a um comutador de energia de correntealternada redundante, acesse “MAP 5320: Energia de corrente alternadaredundante” na página 324. Caso contrário, conclua estas etapas:a. Restaure a energia principal para instalação.b. Verifique o reparo continuando com o “MAP 5250: Verificação de

reparo do 2145 UPS-1U” na página 323.

320 SAN Volume Controller: Guia de Resolução de Problemas

Page 339: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

3. (na etapa 1 na página 320 e 2 na página 320)Os indicadores de segmentos de carregamento 2 e de ligado do2145UPS-1Uestão iluminados com verde sólido, com os indicadores de sobrecarga,de bateria ligada e de serviço desligados?

NÃO Vá para a etapa 4.

SIM O 2145 UPS-1U não mostra mais uma falha. Verifique o reparocontinuando com o “MAP 5250: Verificação de reparo do 2145 UPS-1U”na página 323.

4. (na etapa 3)O indicador de bateria ligada do 2145 UPS-1Uestá iluminado de amarelo(sólido ou piscando), com os indicadores de serviço e de sobrecarga dodesligados?

NÃO Vá para a etapa 5.

SIM A fonte de alimentação de entrada desse 2145 UPS-1U não estáfuncionando ou não está conectada corretamente, ou o 2145 UPS-1Uestá recebendo energia de entrada que pode estar instável ou fora dointervalo de voltagem especificada ou frequência. (A voltagem deve serentre 200 V e 240 V e a frequência deve ser 50 Hz ou 60 Hz). O SANVolume Controller ajusta automaticamente o intervalo de voltagem do2145 UPS-1U. Se a voltagem de entrada foi alterada recentemente, acondição de alarme pode estar presente até que o SAN VolumeController tenha ajustado a configuração de alarme. Ligue o SANVolume Controller que está conectado ao 2145 UPS-1U. Se o SANVolume Controller iniciar o indicador de bateria ligada deve desligardentro de cinco minutos. Se o SAN Volume Controller desligarnovamente ou se a condição persistir por pelo menos cinco minutos,faça o seguinte:a. Verifique o protetor de circuito de entrada no painel traseiro do

2145 UPS-1U e pressione-o, se ele estiver aberto.b. Se a energia AC redundante for usada para o 2145 UPS-1U,

verifique a voltagem e a frequência no receptáculo de saída docomutador de energia de corrente alternada redundante conectado aeste 2145 UPS-1U. Se não houver energia, acesse “MAP 5340:verificação de energia de corrente alternada redundante” na página326. Se a energia não estiver dentro da especificação, peça ao clientepara resolver o problema. Se a energia AC redundante não forusada para este fonte de alimentação ininterrupta, verifique atomada de energia do local para o 2145 UPS-1U ornecendo energiapara esse SAN Volume Controller. Verifique a conexão, voltagem efrequência. Se a energia não estiver dentro da especificação, peça aocliente para resolver o problema.

c. Se a energia de entrada estiver dentro da especificação e o protetorde circuito de entrada estiver estável, substitua o field-replaceableunits (FRUs) na seguinte sequência:1) Cabo de energia do 2145 UPS-1U2) 2145 UPS-1U

d. Verifique o reparo continuando com o “MAP 5250: Verificação dereparo do 2145 UPS-1U” na página 323.

5. (na etapa 4)O indicador de sobrecarga do 2145 UPS-1U está iluminado em vermelhosólido?

Capítulo 11. Usando os procedimentos de análise de manutenção 321

Page 340: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Vá para a etapa 6.

SIM O requisito de saída de energia do 2145 UPS-1U excedeu a capacidadedo 2145 UPS-1U.a. Verifique que apenas um nó do SAN Volume Controller está

conectado ao 2145 UPS-1U.b. Verifique se nenhum outro carregamento está conectado ao 2145

UPS-1U.c. Depois de assegurar que o carregamento de saída está correto,

desligue o 2145 UPS-1U pressionando o botão ligar/desligar até queo indicador de ligado apague. Em seguida, desconecte a energia deentrada do 2145 UPS-1U. Aguarde pelo menos cinco segundos atéque todos os LEDs sejam desligados e reinicie o 2145 UPS-1Ureconectando a energia de entrada e pressionando o botãoligar/desligar até que o indicador de ligado do 2145 UPS-1U sejailuminado (aproximadamente cinco segundos). Em algumas versõesdo 2145 UPS-1U, é necessário um dispositivo com ponta, como umachave de fenda, para pressionar o botão ligar/desligar.

d. Se a condição persistir, substitua o 2145 UPS-1U.

Nota: Se a condição recorrer, substitua a fonte de alimentação ou asfontes de alimentação no nó.

e. Verifique o reparo continuando com o “MAP 5250: Verificação dereparo do 2145 UPS-1U” na página 323.

6. (na etapa 5 na página 321)O indicador de serviço do 2145 UPS-1U está iluminado com vermelhopiscando e o indicador de bateria ligada está iluminado com amarelo sólido,com os indicadores de ligado e de sobrecarrega desligados?

NÃO Vá para a etapa 7.

SIM A bateria do 2145 UPS-1U pode estar completamente descarregada oucom falha.a. Verifique se o 2145 UPS-1U foi conectado a uma tomada de energia

por pelo menos duas horas para carregar a bateria. Após carregar abateria, mantenha pressionado o botão de reconfiguração de alarmeou de teste por três segundos; e em seguida, verifique o indicadorde serviço.

b. Se o indicador de serviço ainda estiver piscando, substitua o 2145UPS-1U.

c. Verifique o reparo continuando com o “MAP 5250: Verificação dereparo do 2145 UPS-1U” na página 323.

7. (na etapa 6)O indicador de serviço do 2145 UPS-1Uestá iluminado com vermelhopiscando, o indicador de bateria está iluminado de amarelo sólido e aativação está iluminada de verde sólido, com o indicador de sobrecargadesligado?

NÃO Vá para a etapa 8 na página 323.

SIM A temperatura interna do 2145 UPS-1U é muito alta.a. Desligue o 2145 UPS-1U pressionando o botão ligar/desligar até

que o indicador de ligado se apague. Em seguida, desconecte o 2145UPS-1U. Limpe as ventilações na parte frontal e posterior do 2145

322 SAN Volume Controller: Guia de Resolução de Problemas

Page 341: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

UPS-1U. Remova quaisquer fontes de calor. Assegure-se de que acorrente de ar ao redor do 2145 UPS-1U não seja restrita.

b. Aguarde pelo menos cinco minutos e reinicie o 2145 UPS-1Ureconectando a energia de entrada e pressionando o botãoligar/desligar até que o indicador de ligado do 2145 UPS-1U sejailuminado (aproximadamente cinco segundos).

c. Se a condição persistir, substitua o 2145 UPS-1U.d. Verifique o reparo continuando com o “MAP 5250: Verificação de

reparo do 2145 UPS-1U”.8. (na etapa 7 na página 322)

Os indicadores de ligado, de sobrecarga, de bateria ligada e de serviço do2145 UPS-1U, estão iluminados e piscando?

NÃO O 2145 UPS-1U possui uma falha interna.a. Substitua o 2145 UPS-1U.b. Verifique o reparo continuando com o “MAP 5250: Verificação de

reparo do 2145 UPS-1U”.

SIM A bateria do 2145 UPS-1U pode estar completamente descarregada oucom falha.a. Verifique se o 2145 UPS-1U foi conectado a uma tomada de energia

por pelo menos duas horas para carregar a bateria. Após carregar abateria, mantenha pressionado o botão de reconfiguração de alarmeou de teste por três segundos; e em seguida, verifique o indicadorde serviço.

b. Se o indicador de serviço ainda estiver piscando, substitua o 2145UPS-1U.

c. Verifique o reparo continuando com o “MAP 5250: Verificação dereparo do 2145 UPS-1U”.

MAP 5250: Verificação de reparo do 2145 UPS-1UMAP 5250: A verificação de reparo do 2145 UPS-1U o ajuda a verificar se asunidades substituíveis em campo (FRUs) que foram trocadas por novas FRUs, ouações de reparo que foram feitas, resolveram todos os problemas no SAN VolumeController 2145 UPS-1U.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido enviado aqui porque executou um reparo e deseja confirmarque não existem outros problemas na máquina.

Sobre Esta Tarefa

Execute as etapas a seguir:

Procedimento1. Os indicadores de ligado e segmento de carga 2 do2145 UPS-1Ureparado

estão iluminados de ver sólido, com os indicadores de sobrecarga, de serviçoe de bateria ligada desligados?

Capítulo 11. Usando os procedimentos de análise de manutenção 323

Page 342: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Continue com “MAP 5000: Iniciar” na página 299.

SIM Vá para a etapa 2.2. (na etapa 1 na página 323)

O nó do SAN Volume Controller desenvolvido com esse 2145 UPS-1U estáligado?

NÃO Pressione ligar no nó do SAN Volume Controller que está conectado aeste 2145 UPS-1U e está desligado. Vá para a etapa 3.

SIM Vá para a etapa 3.3. (na etapa 2)

O nó que está conectado a este 2145 UPS-1U ainda não está ligado oumostrando códigos de erro na exibição do painel frontal?

NÃO Vá para a etapa 4.

SIM Continue com “MAP 5000: Iniciar” na página 299.4. (na etapa 3)

O nó do SAN Volume Controller que está conectado a este 2145 UPS-1Umostra “Carregando” na exibição do painel frontal?

NÃO Vá para a etapa 5.

SIM Aguarde a conclusão de exibição “Carregando” (isso pode demorar atéduas horas). Vá para a etapa 5.

5. (na etapa 4)Pressione e segure o botão testar/reconfigurar alarme no 2145 UPS-1U reparadopor três segundos para iniciar um autoteste. Durante o teste, indicadoresindividuais iluminam à medida que várias partes do 2145 UPS-1U sãoverificadas.Os indicadores de sobrecarga, de bateria ligada e de serviço do 2145 UPS-1Upermanecem ligados?

NÃO Verificação de reparo do 2145 UPS-1U foi concluída com êxito.Continue com “MAP 5700: Verificação de reparo” na página 349.

SIM Continue com “MAP 5000: Iniciar” na página 299.

MAP 5320: Energia de corrente alternada redundanteMAP 5320: energia de corrente alternada redundante o ajuda a resolver problemasque ocorreram no comutadores de energia de corrente alternada redundante usadono sistema. Use este MAP quando um 2145 UPS-1U que está conectado a umcomutador de energia de corrente alternada redundante não parece ter energia deentrada.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido trazido até aqui por uma das razões a seguir:v Ocorreu um problema durante a instalação do sistema.v “MAP 5150: 2145 UPS-1U” na página 317 o enviou para cá.

324 SAN Volume Controller: Guia de Resolução de Problemas

Page 343: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Sobre Esta Tarefa

Execute as etapas a seguir para resolver problemas que ocorreram em quaisquercomutador de energia de corrente alternada redundante:

Procedimento1. Um ou dois 2145 UPS-1Us podem ser conectados ao comutador de energia de

corrente alternada redundante. O indicador de ativação em qualquer 2145UPS-1U conectado está ligado?

NÃO Vá para a etapa 3.

SIM O comutador de energia de corrente alternada redundante está ligado.Vá para a etapa 2.

2. (na etapa 1)Meça a voltagem no comutador de energia de corrente alternada redundantesoquete de saída conectado ao 2145 UPS-1U que não esteja mostrando ligado.CUIDADO:Assegure-se de não remover o cabo de energia de quaisquer unidades fontede alimentação ininterrupta ligadas

Há energia no soquete de saída?

NÃO Um comutador de energia de corrente alternada redundante de saídaestá trabalhando enquanto o outro não está. Substitua o comutador deenergia de corrente alternada redundante.

CUIDADO:Pode ser necessário desligar um nó operacional para substituir oconjunto docomutador de energia de corrente alternada redundante.Se este for o caso, consulte com o cliente para determinar um tempoadequado para executar a substituição. Consulte o “MAP 5350:Desligando um nó” na página 328. Depois de substituir o comutadorde energia de corrente alternada redundante, continue com o “MAP5340: verificação de energia de corrente alternada redundante” napágina 326.

SIM O comutador de energia de corrente alternada redundante estáfuncionando. Há um problema com o cabo de alimentação do 2145UPS-1U ou o 2145 UPS-1U. Retorne ao procedimento que chamou esteMAP e continue a partir de onde você estava dentro desseprocedimento. Ela o ajudará a analisar o problema com o cabo dealimentação do 2145 UPS-1U ou o 2145 UPS-1U.

3. (na etapa 1)Nenhuma das saídas do comutador de energia de corrente alternadaredundante usadas parece ter energia.Há dois cabos de energia de entrada para o comutadores de energia decorrente alternada redundante corretamente conectados ao comutador deenergia de corrente alternada redundante e a circuitos de energia diferente?

NÃO Conecte os cabos corretamente. Acesse “MAP 5340: verificação deenergia de corrente alternada redundante” na página 326.

SIM Verifique se há energia principal em ambas as unidades de distribuiçãode energia do local que estão fornecendo energia para esse comutadorde energia de corrente alternada redundante. Vá para a etapa 4.

4. (na etapa 3)

Capítulo 11. Usando os procedimentos de análise de manutenção 325

Page 344: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Há energia disponível em uma ou mais das unidades de distribuição de energiado local que estão fornecendo energia para esse comutador de energia decorrente alternada redundante?

NÃO Solicite que o cliente corrija os circuitos principais. Retorne aoprocedimento que chamou este MAP e continue a partir de onde vocêestava dentro desse procedimento.

SIM O comutador de energia de corrente alternada redundante deve operarnessa situação. Substitua o conjunto do comutador de energia decorrente alternada redundante. Depois de substituir o comutador deenergia de corrente alternada redundante, continue com o “MAP 5340:verificação de energia de corrente alternada redundante”.

MAP 5340: verificação de energia de corrente alternada redundanteMAP 5340: a verificação de energia de corrente alternada redundante ajuda averificar se um comutador de energia de corrente alternada redundante estáfuncionando corretamente.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido enviado aqui porque você substituiu um comutador de energiade corrente alternada redundante ou corrigiu o cabeamento de um comutador deenergia de corrente alternada redundante. Também é possível usar este MAP seachar que um comutador de energia de corrente alternada redundante pode nãoestar funcionando corretamente, porque ela está conectada a nós que perderampoder quando apenas um circuito de alimentação de energia ac perdeu energia.

Neste MAP, será solicitada a confirmação que há energia disponível nos soquetes 1e 2 do comutador de energia de corrente alternada redundante. Se o comutador deenergia de corrente alternada redundante for conectado a nós que não estãoligados, use um medidor de voltagem para confirmar que a energia estádisponível.

Se o comutador de energia de corrente alternada redundante está ligando os nósque estão ligados (para os nós serem operacionais), tome algumas precauções antesde continuar com esses testes. Embora não seja necessário desligar os nós pararealizar o teste, os nós serão desligados se o comutador de energia de correntealternada redundante não estiver funcionando corretamente.

Sobre Esta Tarefa

Para cada um dos nós ligado na conectado ao comutador de energia de correntealternada redundante, execute as etapas a seguir:1. Use o GUI de gerenciamento ou a interface da linha de comandos (CLI) para

confirmar que o outro nó no mesmo grupo de E/S que este nó está online.2. Use o GUI de gerenciamento ou a CLI para confirmar que todos os discos

virtuais conectados a este grupo de E/S estão online.3. Verifique os cabos de saída do comutador de energia de corrente alternada

redundante para confirmar que o comutador de energia de corrente alternadaredundante não está conectado a dois nós no mesmo grupo de E/S.

326 SAN Volume Controller: Guia de Resolução de Problemas

Page 345: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Se qualquer um desses testes falhar, corrija quaisquer falhas antes de continuarcom este MAP. Se a verificação estiver sendo executada usando nós ligados,entenda que a energia não estará mais disponível se o seguinte for verdadeiro:v O indicador de bateria ligada no 2145 UPS-1U que conecta o comutador de

energia de corrente alternada redundante ao nó acender por mais de cincosegundos.

v O SAN Volume Controller da exibição do nó mostra Falha de Energia.

Quando as instruções disserem “remover a energia,” é possível desligar a energiase o local unidade de distribuição de energia possuir saídas que sãoindividualmente alternadas; caso contrário, remova o comutador de energia decorrente alternada redundantecabo de energia especificado da tomadaunidade dedistribuição de energia do local.

Execute as etapas a seguir:

Procedimento1. Os dois locaisunidade de distribuição de energias estão fornecendo energia

para o comutador de energia de corrente alternada redundante conectado acircuitos de alimentação diferentes?

NÃO Corrija o problema e, em seguida, retorne a este MAP.

SIM Vá para a etapa 2.2. (na etapa 1)

Ambos dos unidade de distribuição de energias estão fornecendo energia parao comutador de energia de corrente alternada redundante ligado?

NÃO Corrija o problema e, em seguida, retorne ao início desse MAP.

SIM Vá para a etapa 3.3. (na etapa 2)

Os dois cabos que conectam o localunidade de distribuição de energias aocomutador de energia de corrente alternada redundante estão conectados?

NÃO Corrija o problema e, em seguida, retorne ao início desse MAP.

SIM Vá para a etapa 4.4. (na etapa 3)

Há energia nocomutador de energia de corrente alternada redundante soquetede saída 2?

NÃO Vá para a etapa 8 na página 328.

SIM Vá para a etapa 5.5. (na etapa 4)

Há energia no soquete de saída 1 docomutador de energia de correntealternada redundante?

NÃO Vá para a etapa 8 na página 328.

SIM Vá para a etapa 6.6. (na etapa 5)

Remova a energia do Cabo de energia principal para o comutador de energiade corrente alternada redundante. Há energia no soquete de saída 1docomutador de energia de corrente alternada redundante?

NÃO Vá para a etapa 8 na página 328.

Capítulo 11. Usando os procedimentos de análise de manutenção 327

Page 346: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

SIM Vá para a etapa 7.7. (na etapa 6 na página 327)

Reconecte o cabo de energia principal. Remova a energia do Cabo de energiade backup para o comutador de energia de corrente alternada redundante. Háenergia no soquete de saída 1 docomutador de energia de corrente alternadaredundante?

NÃO Vá para a etapa 8.

SIM Reconecte o Cabo de energia de backup. A verificação de energia acredundante foi concluída com êxito. Continue com “MAP 5700:Verificação de reparo” na página 349.

8. (nas etapas 4 na página 327, 5 na página 327, 6 na página 327 e 7)O comutador de energia de corrente alternada redundante não funcionouconforme esperado. Substitua o conjunto do comutador de energia de correntealternada redundante. Retorne ao início desse MAP.

Resultados

MAP 5350: Desligando um nóMAP 5350: Desligar um nó ajuda você a desligar um único nó para executar umaação de serviço sem interromper o acesso de host aos volumes.

Antes de Iniciar

Se a solução estiver configurada corretamente, a desativação de um único nó nãointerromperá a operação normal de um sistema SAN Volume Controller. Umsistema possui nós em pares chamados de grupos de E/S. Um grupo de E/Scontinua a manusear E/S para os discos que ele gerencia tendo somente um úniconó ligado. No entanto, o desempenho diminui e a resiliência para erro é reduzida.

Tome cuidado ao desligar um nó SAN Volume Controller para não impactar osistema mais do que o necessário. Se os procedimentos descritos aqui não foremseguidos, os seus hosts de aplicativos podem perder acesso aos seus dados ou elespodem, no pior caso, perder dados.

É possível usar os seguintes métodos preferenciais para desligar um nó que sejaum membro de um sistema e não offline:1. Use a opção Desligar no GUI de gerenciamento ou na interface do assistente de

serviço.2. Use o comando da CLI stopsystem -node name.

É preferível usar o GUI de gerenciamento ou a interface da linha de comandos(CLI) para desligar um nó, pois esses métodos fornecem uma transferênciacontrolada para o nó do parceiro e fornecem melhor resiliência para outras falhasno sistema.

Só se um nó estiver offline ou não é um membro de um sistema deve-se desligar osistema usando o botão de energia.

Sobre Esta Tarefa

Para reduzir ao mínimo a interrupção ao desligar um nó, todas as condições aseguir devem ocorrer:

328 SAN Volume Controller: Guia de Resolução de Problemas

Page 347: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v O outro nó no grupo do E/S está ligado e ativo no sistema.v O outro nó no grupo de E/S possui conexões SAN Fibre Channel para todos os

hosts e controladores de disco gerenciado pelo grupo de E/S.v Todos os volumes manipulados por este grupo de E/S estão online.v Os caminhos múltiplos do host estão online para o outro nó no grupo de E/S.

Em algumas circunstâncias, o motivo do desligamento do nó pode tornar essascondições impossíveis. Por exemplo, se você substituir um adaptador FibreChannel com falha, os volumes não mostrarão um status online. Use seujulgamento para decidir se é seguro continuar quando uma condição não foratendida. Sempre verifique com o administrador do sistema antes de prosseguircom um desligamento que você sabe que interromperá o acesso de E/S, uma vezque o administrador do sistema poderá preferir aguardar por um momento maisoportuno ou suspender aplicativos host.

Para assegurar uma reinicialização suave, um nó deve salvar estruturas de dadosque ele não pode recriar em seu local, a unidade interna de disco. A quantidade dedados que o nó salva no disco local pode ser grande, portanto, essa operação podelevar vários minutos. Não tente interromper o desligamento controlado.

Atenção: As seguintes ações não permitem que o nó salve dados em seu discolocal. Portanto, não desligue um nó usando um dos métodos a seguir:v Removendo o cabo de energia entre o nó e o fonte de alimentação ininterrupta.

Geralmente o fonte de alimentação ininterrupta fornece energia suficiente parapermitir a gravação em disco local no caso de uma falha de energia, masobviamente é incapaz de fornecer energia neste caso.

v Mantendo o botão power pressionado no nó (a menos que ele seja um SANVolume Controller 2145-SV1).Ao pressionar e soltar o botão de energia, o nó indicará isso para o softwareassim o nó poderá gravar seus dados para o disco local antes que o nó desligue.Quando você mantém pressionado o botão de energia, o hardware interpretaisto como uma indicação de desligamento de emergência e desligaimediatamente. O hardware não salva os dados em um disco local antes dedesligar. O desligamento de emergência ocorre aproximadamente quatrosegundos após pressionar e manter pressionado o botão de energia.

v Pressionar o botão reconfigurar no painel do sistema de diagnósticos porindicadores luminosos.

Importante: Se você desativar um nó do SAN Volume Controller 2145-DH8 e nãopuder ativá-lo novamente no mesmo dia, siga estas etapas para evitar que asbaterias sejam descarregadas muito enquanto o nó estiver conectado à energia masnão ativado:1. Puxe ambas as baterias para fora do nó. Mantenha-as fora até que você esteja

pronto para ligar o nó.2. Empurre as baterias para dentro antes de pressionar o botão de energia para

ligar o nó.

Se você desconectar a energia de um nó do SAN Volume Controller 2145-DH8 enão puder reconectar a energia novamente dentro das próximas 24 horas, sigaessas etapas para evitar que as baterias sejam descarregadas muito enquanto o nónão estiver conectado à enegia:1. Depois que os dois cabos de energia forem desconectados, retire as duas

baterias do nó. Essa etapa desliga completamente o painel traseiro da bateria.

Capítulo 11. Usando os procedimentos de análise de manutenção 329

Page 348: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

2. Coloque as baterias novamente.

Usando o GUI de gerenciamento para desligar um sistemaUse o GUI de gerenciamento para desligar um sistema.

Procedimento

Para usar o GUI de gerenciamento para desligar um sistema, conclua as etapas aseguir:1. Ative o GUI de gerenciamento para o sistema de que está sendo feita

manutenção.2. Selecione Monitoramento > Sistema.

Se os nós para desligar são mostrados como Offline, os nós não estãoparticipando no sistema. Em tais circunstâncias, use o botão de energia nos nósoffline para desligar os nós.Se os nós para desligar são mostrados como Online, desligar os nós poderesultar em seus volumes dependentes também ficarem offline:a. Selecione o nó e clique em Mostrar volumes dependentes.b. Confirme se o status de cada volume no grupo de E/S está Online. Pode ser

necessário para visualizar mais de uma página.Se quaisquer volumes forem Comprometidos, apenas um nó na E/S estáprocessando solicitações de E/S para esse volume. Se esse nó estádesligado, ele causa impacto em todos os hosts que estão enviandosolicitações de E/S para o volume comprometido.Se algum volume for comprometido e você acredita que isso pode serporque o nó do parceiro no grupo de E/S foi desligado recentemente,aguarde até que a atualização da tela mostra todos os volumes online.Todos os volumes devem estar online dentro de 30 minutos do nó doparceiro que ser desligado.

Nota: Depois de aguardar por 30 minutos, se tiver um volumecomprometido e todos os nós e MDisks associados estiverem online, entreem contato com o suporte para obter assistência.Assegure-se de que todos os volumes que são usados pelos hosts estãoonline antes de continuar.

c. Se possível, verificar se todos os hosts que acessam volumes gerenciadospor este grupo de E/S são capazes de failover, para usar caminhos que sãofornecidos pelo outro nó no grupo.Execute esta verificação usando o software do driver de dispositivo decaminhos múltiplos do sistema host. Os comandos para usar diferem,dependendo do driver de dispositivo de caminhos múltiplos que está sendousado.Se for usado o Driver de Dispositivo do Subsistema de Caminhos Múltiplos(SDD) do Sistema de Armazenamento, o comando para caminhos deconsulta é datapath query device.Pode demorar algum tempo para os drivers de dispositivo de caminhosmúltiplos redescobrir caminhos após um nó ser ligado. Se não for possívelverificar o host para o qual todos os caminhos, ambos os nós no grupo deE/S, estão disponíveis, não desligue um nó durante 30 minutos após o nódo parceiro ter sido ligado ou você poderá perder o acesso ao volume.

d. Se decidir que ele está bom, continue o desligamento do nó, selecione o nóa ser desligado e clique em Desligar Sistema.

330 SAN Volume Controller: Guia de Resolução de Problemas

Page 349: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

e. Clique em OK. Se o nó selecionado for o último nó restante que forneceacesso a um volume, por exemplo, um nó que contém unidades flash comvolumes não espelhados, o painel Encerrando um Nó-Força é exibido comuma lista de volumes que ficarão offline se o nó for encerrado.

f. Verifique se nenhum aplicativo do host acessa os volumes que ficarãooffline. Continue com o encerramento somente se a perda de acesso a estesvolumes for aceitável. Para continuar com o encerramento do nó, clique emForçar Encerramento.

O que Fazer Depois

Durante o encerramento, o nó salva suas estruturas de dados em seu disco local emove todos os dados de gravação mantidos em cache para os discos de SAN. Esteprocessamento pode levar vários minutos.

No final desse processamento, o sistema é desligado.

Usando a CLI do SAN Volume Controller para desligar um nóUse a interface da linha de comandos (CLI) para desligar um nó.

Procedimento1. Emita o comando lsnode da CLI para exibir uma lista de nós no sistema e suas

propriedades. Localize o nó para encerrar e anote o nome de seu grupo de E/S.Confirme se o outro nó no grupo de E/S está online.lsnode -delim :

id:name:UPS_serial_number:WWNN:status:IO_group_id: IO_group_name:config_node:UPS_unique_id1:group1node1:10L3ASH:500507680100002C:online:0:io_grp0:yes:202378101C0D18D82:group1node2:10L3ANF:5005076801000009:online:0:io_grp0:no:202378101C0D17963:group2node1:10L3ASH:5005076801000001:online:1:io_grp1:no:202378101C0D18D84:group2node2:10L3ANF:50050768010000F4:online:1:io_grp1:no:202378101C0D1796

Se o nó para desligar é mostrado como Offline, o nó não está participando nosistema e não está processando solicitações de E/S. Em tais circunstâncias, useo botão de energia no nó para desligar o nó.Se o nó para desligar for mostrado como Online, mas o outro nó no grupo deE/S não estiver online, desligar o nó impacta todos os hosts que estãoenviando solicitações de E/S para os volumes que são gerenciados pelo grupode E/S. Assegure-se que outro nó no grupo de E/S esteja online antes decontinuar.

2. Emita o comando lsdependentvdisks da CLI para listar os volumes que sãodependentes do status de um determinado nó.lsdependentvdisks group1node1

vdisk_id vdisk_name0 vdisk01 vdisk1

Se o nó ficar offline ou for removido do sistema, os volumes dependentestambém ficarão offline. Antes de deixar um nó offline ou removê-lo do sistema,é possível usar o comando para assegurar-se de não perder o acesso a nenhumvolume.

3. Se for decidido que ele está pode continuar desligando o nó, emita o comandostopsystem -node <name> da CLI para desligar o nó. Use o parâmetro -nodepara evitar desligar o sistema como um todo:

Capítulo 11. Usando os procedimentos de análise de manutenção 331

Page 350: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

stopsystem –node group1node1Tem certeza de que deseja continuar com o encerramento? sim

Nota: Para desligar o nó mesmo havendo volumes dependentes, adicione oparâmetro -force ao comando stopsystem. O parâmetro force força acontinuação do comando, embora os volumes dependentes do nó fiquemoffline. Use o parâmetro force com cuidado. O acesso aos dados nos volumesdependentes do nó será perdido.Durante o encerramento, o nó salva suas estruturas de dados em seu discolocal e move todos os dados de gravação mantidos no cache para os discos deSAN, que pode levar vários minutos.No fim deste processo, o nó é desligado.

Usando o botão de controle de energia do SAN VolumeController

Não use o botão de controle de energia para desligar um nó a menos que seja umaemergência ou outro procedimento o direcione a fazer isso.

Antes de Iniciar

Com esse método, não é possível verificar o status do sistema a partir do painelfrontal, portanto, é impossível saber se o desligamento é suscetível a provocarperturbações excessivas ao sistema. Em vez disso, use o GUI de gerenciamento ouos comandos da CLI, descritos nos tópicos anteriores para desligar um nó ativo.

Sobre Esta Tarefa

Se precisar usar este método, observe no Figura 79 e no Figura 80 na página 333que cada tipo de modelo possui um botão de controle de energia ▌1▐ na frente.

Figura 79. Botão de controle de energia nos modelos SAN Volume Controller 2145-CF8,2145-CG8 e 2145-DH8

332 SAN Volume Controller: Guia de Resolução de Problemas

Page 351: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v ▌1▐ Botão de controle de energia e LED ligadov ▌2▐ LED de identificaçãov ▌3▐ LED de status do nóv ▌4▐ LED de falha do nóv ▌5▐ LED de status da bateria

Ao determinar que é seguro fazer isso, pressione e solte imediatamente o botão deenergia. Em modelos diferentes do 2145-DH8 e do 2145-SV1, a exibição do painelfrontal muda para exibir Desligando e exibe uma barra de progresso.

Nota: O 2145-DH8 e o 2145-SV1 não possuem uma exibição de painel frontal, maso LED de status ▌2▐, ▌3▐, ▌4▐ e ▌5▐ no Figura 80 todos desligados e o LED deativação ▌1▐ muda de ligado para piscando.

O 2145-CG8 ou o 2145-CF8 requer que a tampa do botão de energia seja removidaantes de ser possível pressionar o botão de energia.

Se o botão de energia for pressionado por muito tempo, o nó é desligadoimediatamente e não pode gravar todos os dados em seu disco local. É necessárioum procedimento de serviço estendido para reiniciar o nó, o que envolve aexclusão do nó do sistema antes de ele ser incluído novamente.

O gráfico a seguir mostra como Desligando é exibido no painel frontal:

Resultados

O nó salva suas estruturas de dados no disco enquanto ele está desligando. Oprocesso de desligamento pode demorar até 5 minutos.

Quando um nó é desligado usando o botão power (ou devido a uma falha deenergia), o nó do parceiro em seu grupo de E/S para imediatamente usando seucache para novos dados de gravação e remove o estágio de qualquer dado degravação já em seu cache para os discos conectados por SAN.

O tempo que a remoção do estágio demora depende da velocidade e da utilizaçãodos controladores de disco. O tempo para conclusão é menor do que 15 minutos,mas pode ser mais longo. Se os dados estiverem esperando para serem gravadosem um disco que esteja off-line, a remoção do estágio não poderá ser concluída.

sv100002

1 2 3 4 5

Figura 80. Botão de controle de energia e luzes de LED no modelo SAN Volume Controller 2145-SV1

D e s l i g a n d o

Capítulo 11. Usando os procedimentos de análise de manutenção 333

|

||||

|

|

|

|

|||

Page 352: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Um nó que desliga e reinicia enquanto seu nó do parceiro continua a processarE/S pode não ser capaz de se tornar um membro ativo do grupo de E/Simediatamente. O nó deve aguardar até que o nó do parceiro conclua o seumovimento de dados do cache.

Se o nó do parceiro é desligado durante este período, o acesso ao armazenamentoSAN que é gerenciado por este grupo de E/S é perdido. Se um dos nós no grupode E/S é incapaz de servir qualquer E/S, por exemplo, porque o nó do parceiro nogrupo de E/S ainda está limpando seu cache de gravação, os volumes que sãogerenciados por esse grupo de E/S têm um status de Degradado.

MAP 5400: Painel frontalMAP 5400: Painel frontal ajuda a resolver problemas que tenham ocorrido nopainel frontal.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Esse MAP se aplica a todos os modelos do SAN Volume Controller. Certifique-sede que sabe qual modelo está usando antes de iniciar este procedimento. Paradeterminar com qual modelo você está trabalhando, procure o rótulo que identificao tipo de modelo na frente do nó.

Você pode ter sido enviado aqui porque:v Ocorreu um problema durante a instalação de um sistema SAN Volume

Controller, o teste de exibição do painel frontal falhou ou o número de nócorreto falhou ao ser exibido

v Outro MAP trouxe você até aqui

Sobre Esta Tarefa

Execute as etapas a seguir:

Procedimento1. O LED de energia no painel de informações do operador está aceso e

mostrando um verde sólido?

NÃO Continue com o MAP de energia. Consulte “MAP 5050: Energia do2145-CG8 e 2145-CF8” na página 313.

SIM Vá para a etapa 2.2. (na etapa 1)

A luz de erro do controlador de serviço ▌1▐ que você vê no Figura 81 napágina 335 está acesa e mostrando um âmbar sólido?

334 SAN Volume Controller: Guia de Resolução de Problemas

Page 353: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Inicie os testes do painel frontal pressionando e segurando o botãoSelecionar por cinco segundos. Vá para a etapa 3.

Atenção: Não inicie este teste até que o nó seja ligado por pelo menosdois minutos. Você pode receber resultados inesperados.

SIM O controlador de serviço do SAN Volume Controller falhou.v Substitua o controlador de serviço.v Verifique o reparo continuando com o “MAP 5700: Verificação de

reparo” na página 349.3. (na etapa 2 na página 334)

A luz de verificação do painel frontal acende e o teste de exibição de todos osbits de exibição é ligado por 3 segundos e, em seguida, desligado por 3segundos e, em seguida, uma linha vertical viaja da esquerda para a direita,seguida por uma linha horizontal que viaja de cima para baixo. O teste seencerra com a exibição de teste do comutador de um único retângulo no centroda tela.As luzes do painel frontal e da tela operam conforme descrito?

NÃO O painel frontal do SAN Volume Controller falhou seu teste deexibição.v Substitua o controlador de serviço.v Verifique o reparo continuando com o “MAP 5700: Verificação de

reparo” na página 349.

SIM Vá para a etapa 4.4. (na etapa 3)

Figura 82 na página 336 fornece quatro exemplos do que a exibição do painelfrontal mostra antes de você pressionar qualquer botão e, em seguida, quandovocê pressionar o botão para cima, os botões para a esquerda e direita e obotão Selecionar. Para executar o teste de comutador do painel frontal,pressione qualquer botão em qualquer sequência ou qualquer combinação. Atela indica quais botões você pressionou.

svc0056

1

1

Figura 81. Luz de Erro do Controlador de Serviço do SAN Volume Controller

Capítulo 11. Usando os procedimentos de análise de manutenção 335

Page 354: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Em vez disso, verifique cada comutador. O painel de serviços comuta e exibeoperação conforme descrito em Figura 82?

NÃO O painel frontal do SAN Volume Controller falhou seu teste decomutação.v Substitua o controlador de serviço.v Verifique o reparo continuando com o “MAP 5700: Verificação de

reparo” na página 349.

SIM Mantenha pressionado o botão Selecionar por cinco segundos para sairdo teste. Vá para a etapa 5.

5. O monitor do painel frontal está agora mostrando Cluster:?

NÃO Continue com “MAP 5000: Iniciar” na página 299.

SIM Continue pressionando e soltando o botão para baixo até que Nó sejaexibido na linha 1 da tela do menu. Vá para a etapa 6.

6. (na etapa 5)Este procedimento de análise de manutenção está sendo usado como parte dainstalação de um novo nó?

NÃO Testes de painel frontal foram concluídos sem falhas localizadas.Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Vá para a etapa 7.7. (na etapa 6)

O número do nó que é exibido na linha 2 da tela de menu é igual ao númerodo nó impresso no painel frontal do nó?

NÃO Número do nó armazenado no eletroeletrônico do painel frontal não éo mesmo que aquele impresso no painel frontal.v Substitua o controlador de serviço.v Verifique o reparo continuando com o “MAP 5700: Verificação de

reparo” na página 349.

SIM Testes de painel frontal foram concluídos sem falhas localizadas.Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

Não há botões pressionados (somente borda)

Botão Para Cima pressionado

Botões Para Esquerda e Para Direita pressionados

Botão Selecionar pressionado

23njij

Figura 82. Monitor do Painel Frontal quando os Botões de Comando São Pressionados

336 SAN Volume Controller: Guia de Resolução de Problemas

Page 355: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

MAP 5500: EthernetMAP 5500: a Ethernet ajuda a resolver problemas que ocorreram nas conexõesEthernet do SAN Volume Controller.

Antes de Iniciar

Nota: A GUI do assistente de serviço deverá ser usada se não houver nenhumaexibição do painel frontal, por exemplo, no SAN Volume Controller 2145-DH8.

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Se você encontrar problemas com o recurso Ethernet de 10 Gbps no SAN VolumeController 2145-CG8 ou SAN Volume Controller 2145-DH8, consulte “MAP 5550:porta do adaptador ativada individualmente da Ethernet e Fibre Channel overEthernet de 10G” na página 340.

Você pode ter sido trazido até aqui por uma das razões a seguir:v Ocorreu um problema durante a instalação de um sistema SAN Volume

Controller e as verificações de Ethernet falharamv Outro MAP trouxe você até aquiv O cliente precisa de acesso imediato ao sistema usando um nó de configuração

alternativo. Consulte o “Definindo um nó de configuração alternativo” napágina 340

Sobre Esta Tarefa

Execute as etapas a seguir:

Procedimento1. O painel frontal de qualquer nó no sistema está exibindo Erro de Nó com o

código de erro 805?

SIM Vá para a etapa 6 na página 338.

NÃO Vá para a etapa 2.2. O erro do relatório de sistema 1400 está no painel frontal ou no log de

eventos?

SIM Vá para a etapa 4.

NÃO Vá para a etapa 3.3. Você está tendo problemas de desempenho da Ethernet?

SIM Vá para a etapa 9 na página 339.

NÃO Vá para a etapa 10 na página 339.4. (na etapa 2) Em todos os nós são executados as ações a seguir:

a. Pressione o botão para baixo até que a linha superior da exibição mostreEthernet.

b. Pressione para a direita até que a linha superior seja exibida PortaEthernet 1.

c. Se a segunda linha da exibição mostrar link offline, registre essa portacomo aquela que requer correção.

Capítulo 11. Usando os procedimentos de análise de manutenção 337

Page 356: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

d. Se o sistema estiver configurado com dois cabos Ethernet por nó, pressioneo botão direito até que a linha superior da exibição que mostrará PortaEthernet 2 e repita a etapa anterior.

e. Vá para a etapa 5.5. (na etapa 4 na página 337) Quaisquer portas Ethernet que tenham cabos

conectados a eles estão relatando link offline?

SIM Vá para a etapa 6.

NÃO Vá para a etapa 10 na página 339.6. (na etapa 5) Os nós do SAN Volume Controller possuem um ou dois cabos

conectados?

Um Vá para a etapa 7.

Dois Vá para a etapa 8 na página 339.7. (na etapa 6) Execute as ações a seguir:

a. Plugue o cabo Ethernet desse nó na porta Ethernet 2 de um nó diferente,conforme mostrado em Figura 83 e Figura 84.

b. Se a luz do link Ethernet estiver iluminada quando o cabo for plugado naporta Ethernet 2 de outro nó, substitua a placa-mãe do nó original.

▌1▐SAN Volume Controller 2145-CG8 LED de link Ethernet porta 2(superior direito)▌2▐SAN Volume Controller 2145-CF8 LED de link Ethernet porta 2(superior direito)

▌2▐ Porta 2 Ethernet de 1 Gbpsc. Se a luz de link Ethernet não iluminar, verifique o comutador Ethernet ou

a porta e o cabo do hub para resolver o problema.d. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”

na página 349.

svc00718

2 3 41

Figura 83. LED do link da Ethernet da porta 2 no painel traseiro do SAN Volume Controller

1

2

3

4

5

6

svc0

08

61

31 2

Figura 84. Portas Ethernet na parte traseira do SAN Volume Controller 2145-DH8

338 SAN Volume Controller: Guia de Resolução de Problemas

Page 357: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

8. (na etapa 5 na página 338 ou na etapa 6 na página 338) Execute as ações aseguir:

a. Plugue o cabo Ethernet desse nó em outro dispositivo, por exemplo, oSSPC.

b. Se a luz do link Ethernet estiver iluminada quando o cabo for plugado aoutro dispositivo Ethernet, substitua a placa-mãe do nó original.

c. Se a luz de link Ethernet não iluminar, verifique a porta e o cabo docomutador/hub Ethernet para resolver o problema.

d. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”na página 349.

9. (na etapa 3 na página 337) Execute as ações a seguir:

a. Verifique todos os painéis de Porta de velocidade 1 e Porta de velocidade2 para as configurações de velocidade e duplex. O formato é:<Velocidade>/<Duplex>.1) Pressione o botão para baixo até que a linha superior da exibição

mostre Ethernet.2) Pressione o botão direito até que a linha superior exiba Velocidade 1.3) Se a segunda linha da exibição mostrar link offline, registre essa

porta como aquela que requer correção.4) Se o sistema estiver configurado com dois cabos Ethernet por nó,

pressione o botão direito até que a linha superior da exibição mostreVelocidade 2 e repita a etapa anterior.

b. Verifique se a porta do SAN Volume Controller foi negociada navelocidade mais alta disponível no comutador. Todos os nós que possuemportas de rede Ethernet gigabit.

c. Se a configuração Duplex for half, execute as etapas a seguir:1) Haverá um problema conhecido com a Ethernet gigabit quando um

lado do link estiver configurado como uma velocidade e um duplexfixo e o outro lado estiver configurado como autonegociar. O problemapode fazer com que o lado fixo do link execute em full duplex e o ladonegociado do link execute em half duplex. A incompatibilidade deduplex pode causar degradação de desempenho da Ethernetsignificativa.

2) Se o comutador estiver configurado como full duplex, configure-o paraautonegociar para evitar que o problema descrito anteriormente.

3) Se o comutador estiver configurado como half duplex, configure-o paraautonegociar para permitir que o link execute a maior largura de bandadisponível no link full duplex.

d. Se nenhum dos itens acima for verdadeiro, ligue para o centro de suportepara obter assistência.

10. (a partir da etapa 2 na página 337)Uma falha relatada anteriormente com a interface Ethernet não está maispresente. Um problema com a Ethernet pode ter sido corrigido ou pode haverum problema intermitente. Verifique com o cliente para determinar se ainterface Ethernet não foi desconectada intencionalmente. Também verifique senão há nenhum histórico recente de problemas de Ethernet corrigidos comoutros componentes da rede Ethernet.A falha Ethernet está explicada pelas verificações anteriores?

NÃO Pode haver um erro de Ethernet intermitente. Execute estas etapas nasequência a seguir até que o problema seja resolvido:

Capítulo 11. Usando os procedimentos de análise de manutenção 339

Page 358: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

a. Use o procedimento de determinação de problema do hub daEthernet para verificar e resolver um problema de conexão de redeEthernet. Se você resolver um problema, continue com o “MAP5700: Verificação de reparo” na página 349.

b. Determine se problemas de conexão Ethernet semelhantesocorreram recentemente nesse nó. Se eles ocorreram, substitua aplaca-mãe.

c. Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

Definindo um nó de configuração alternativoUma situação poderá surgir quando o cliente precisar de acesso imediato aosistema usando um nó de configuração alternativo.

Sobre Esta Tarefa

Se todas as conexões Ethernet para o nó de configuração tiverem falhado, osistema será incapaz de relatar as condições de falha e o GUI de gerenciamentoserá incapaz de acessar o sistema para executar tarefas de serviço ouadministrativas. Se este for o caso e o cliente precisar de acesso imediato aosistema, será possível fazer com que o sistema use um nó de configuraçãoalternativo usando a GUI do assistente de serviço. O assistente de serviço éacessada por meio da porta técnica..

Nota: Se o sistema não tiver nenhuma exibição do painel frontal como no SANVolume Controller 2145-DH8, use a GUI de assistente de serviço. O assistente deserviço é acessada por meio da porta técnica.

Se apenas um nó estiver exibindo Erro do Nó 805 no painel frontal, execute asetapas a seguir:

Procedimento1. Pressione e solte o botão de energia no nó que está exibindo Erro de Nó 805.2. Quando Desligando for exibido na tela do painel frontal, pressione o botão de

energia novamente.3. Reiniciando será exibido.

Resultados

O sistema selecionará um novo nó de configuração. O GUI de gerenciamento estáapto a acessar o sistema novamente.

MAP 5550: porta do adaptador ativada individualmente da Ethernet eFibre Channel over Ethernet de 10G

MAP 5550: Ethernet de 10G ajuda a resolver problemas que ocorrem em um SANVolume Controller 2145-CG8 ou SAN Volume Controller 2145-DH8 com capacidadeEthernet de 10G e Fibre Channel over Ethernet ativada individualmente.

340 SAN Volume Controller: Guia de Resolução de Problemas

Page 359: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Antes de Iniciar

Nota: A GUI do assistente de serviço poderá ser usada se não houver nenhumaexibição no painel frontal, por exemplo no SAN Volume Controller 2145-DH8.

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Esse MAP se aplica aos modelos do SAN Volume Controller 2145-CG8 e SANVolume Controller 2145-DH8 com o recurso Ethernet de 10G instalado. Assegure-sede que você saiba qual modelo estará sendo usado antes de iniciar esseprocedimento. Para determinar com qual modelo você está trabalhando, procure aetiqueta que identifica o tipo de modelo na frente do nó. Verifique se o adaptadorEthernet de 10G está instalado e que um cabo ótico esteja conectado a cada porta.O Figura 26 na página 31 mostra o painel traseiro do 2145-CG8 com as portasEthernet de 10G.

Se você tiver um problema com o código de erro 805, acesse “MAP 5500: Ethernet”na página 337.

Se você tiver um problema com o código de erro 703 ou 723, acesse “Falhas doLink de Fibre Channel e Ethernet de 10G” na página 267.

Você pode ser enviado aqui por uma das razões a seguir:v Ocorreu um problema durante a instalação de um sistema SAN Volume

Controller e as verificações de Ethernet falharamv Outro MAP trouxe você até aqui

Sobre Esta Tarefa

Execute as etapas a seguir:

Procedimento1. O erro de nó 720 ou 721 é exibido no painel frontal do nó afetado ou o

código de erro de serviço 1072 é mostrado no log de eventos?

SIM Vá para a etapa 11 na página 343.

NÃO Vá para a etapa 2.2. (na etapa 1) Execute as ações a seguir no painel frontal do nó afetado:

a. Pressione e solte o botão para cima ou para baixo até que Ethernet sejamostrado.

b. Pressione e solte o botão esquerdo ou direito até que a Porta Ethernet 3seja mostrada.

A porta Ethernet 3 foi localizada?

Não Acesse a etapa 11 na página 343

Sim Acesse a etapa 33. (na etapa 2) Execute as ações a seguir no painel frontal do nó afetado:

a. Pressione e solte o botão para cima ou para baixo até que Ethernet sejamostrado.

b. Pressione e solte o botão para cima ou para baixo até que Porta Ethernet3 seja mostrada.

Capítulo 11. Usando os procedimentos de análise de manutenção 341

Page 360: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

c. Registre se a segunda linha da exibição mostra Link offline, Link onlineou Não configurado.

d. Pressione e solte o botão para cima ou para baixo até que Porta Ethernet4 seja mostrada.

e. Registre se a segunda linha da exibição mostra Link offline, Link onlineou Não configurado.

f. Vá para a etapa 4.4. (na etapa 3 na página 341) Qual era o estado das portas Ethernet de 10G que

foram vistas na etapa 3 na página 341?

As duas portas mostram Link onlineO link de 10G agora está funcionando. Verifique o reparo continuandocom o “MAP 5700: Verificação de reparo” na página 349.

Uma ou mais portas mostram Link offlineVá para a etapa 5.

Uma ou mais portas mostram Não configuradoPara obter informações sobre a configuração da porta, consulte adescrição do comando da CLI cfgportip no Centro de Informaçõespara iSCSI do SAN Volume Controller.

Para obter informações sobre o Fibre Channel over Ethernet, consultea descrição do comando da CLI cfgportip no Centro de Informaçõesdo SAN Volume Controller. Esse comando fornece propriedades deconexão e status para ajudar a determinar se o Fibre Channel overEthernet é uma peça de uma VLAN configurada corretamente.

5. (na etapa 4) O LED do link Ethernet de 10G âmbar está desligado para aporta offline?

SIM Acesse a etapa 6

NÃO O link físico está operacional. O problema pode estar na configuraçãodo sistema. Consulte o tópico de configuração “Detalhes deconfiguração do iSCSI” e “Detalhes de configuração do Fibre Channelover Ethernet” no Centro de Informações do SAN Volume Controller.

6. (na etapa 5) Execute as ações a seguir:

a. Verifique se as portas Ethernet de 10G estão conectadas a uma malhaEthernet de 10G.

b. Verifique se a malha Ethernet de 10G está configurada.c. Retire o Transceptor small form-factor pluggable (SFP) e plugue-o

novamente.d. Puxe para fora o cabo ótico e plugue-o novamentee. Limpe os contatos com uma pequena explosão de ar, se disponível.f. Vá para a etapa 7.

7. (na etapa 6) O LED de link âmbar acendeu?

SIM O link físico está operacional. Verifique o reparo continuando com o“MAP 5700: Verificação de reparo” na página 349.

NÃO Vá para a etapa 8.8. (na etapa 7) Troque o SFPs de 10G na porta 3 e 4, mas mantenha os cabos

óticos conectados à mesma porta.O LED de link âmbar está na outra porta fora agora?

SIM Vá para a etapa 10 na página 343.

342 SAN Volume Controller: Guia de Resolução de Problemas

Page 361: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Vá para a etapa 9.9. (na etapa 8 na página 342) Troque os cabos óticos Ethernet de 10G na porta 3

e 4.Observe como o LED de link âmbar se altera. Troque os cabos novamente.O LED de link âmbar na outra porta desligou?

SIM Verifique o link óptico e a malha Ethernet de 10G conectados à portaque agora possui o LED âmbar desligado. O problema está associadoao cabo. O problema é no cabo ótico ou no comutador Ethernet.Verifique se o comutador Ethernet mostra que a porta estáoperacional. Se ele não mostrar que a porta está operacional, substituao cabo ótico. Verifique o reparo continuando com o “MAP 5700:Verificação de reparo” na página 349.

NÃO Vá para a etapa 11.10. (na etapa 8 na página 342) Execute as ações a seguir:

a. Substitua o SFP que agora possui o LED de link âmbar desligado.b. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”

na página 349.11. (nas etapas 1 na página 341, 2 na página 341e 9) Você já removeu e substituiu

o adaptador Ethernet de 10G ?

SIM Vá para a etapa 12.

NÃO Execute as seguintes ações:a. Remova e substitua o adaptador Ethernet de 10G.b. Verifique o reparo continuando com o “MAP 5700: Verificação de

reparo” na página 349.12. (nas etapas 11) Substitua o adaptador Ethernet de 10G por um novo.

a. Substitua o adaptador Ethernet de 10G.b. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”

na página 349.

MAP 5600: Fibre ChannelMAP 5600: Fibre Channel ajuda a resolver problemas que ocorrem nas portas doFibre Channel no SAN Volume Controller.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Esse MAP se aplica a todos os modelos do SAN Volume Controller. Certifique-sede que sabe qual modelo está usando antes de iniciar este procedimento. Paradeterminar com qual modelo você está trabalhando, procure o rótulo que identificao tipo de modelo na frente do nó.

Nota: Use a interface gráfica com o usuário do assistente de serviço se não houverexibição do painel frontal, por exemplo no SAN Volume Controller 2145-DH8, emque a interface gráfica com o usuário do assistente de serviço pode ser acessadapor meio da porta Técnica.

Você pode ser enviado aqui por uma das razões a seguir:

Capítulo 11. Usando os procedimentos de análise de manutenção 343

Page 362: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Ocorreu um problema durante a instalação de um sistema SAN VolumeController e as verificações do Fibre Channel falharam

v Outro MAP trouxe você até aqui

Sobre Esta Tarefa

Conclua as etapas a seguir para resolver problemas causados pelas portas do FibreChannel:

Procedimento1. Você está tentando resolver um problema de velocidade da porta Fibre

Channel?

NÃO Vá para a etapa 2.

SIM Vá para a etapa 11 na página 348.2. (da da etapa 1) Exibir o status da porta 1 do Fibre Channel na exibição do

painel frontal ou na GUI do assistente de serviço. Para obter informaçõesadicionais, consulte Capítulo 6, “Usando o painel frontal do SAN VolumeController”, na página 95.O painel frontal de exibição ou a GUI de assistente de serviço no SANVolume Controller está mostrando a porta 1 do Fibre Channel ativa?

NÃO Uma porta do Fibre Channel não está funcionando corretamente.Verifique o status da porta na segunda linha do painel frontal deexibição ou na GUI de assistente de serviço.v Inativo: A porta está operacional, mas não pode acessar a malha do

Fibre Channel. O adaptador Fibre Channel não está configuradocorretamente; o Fibre Channel Transceptor small form-factorpluggable (SFP) falhou; o cabo Fibre Channel que falhou ou nãoestá instalado; ou o dispositivo na outra extremidade do cabofalhou. Faça uma observação da porta 1. Vá para a etapa 7 napágina 347.

v Com falha: A porta não está operacional por causa de uma falha dehardware. Faça uma observação da porta 1. Vá para a etapa 9 napágina 347.

v Não instalado: Esta porta não está instalada. Faça uma observaçãoda porta 1. Vá para a etapa 10 na página 348.

SIM Pressione e solte o botão direito para exibir a porta 2 do FibreChannel. Acesse 3.

3. (na etapa 2)O painel frontal de exibição ou a GUI de assistente de serviço no SANVolume Controller está mostrando a porta 2 do Fibre Channel ativa?

NÃO Uma porta do Fibre Channel não está funcionando corretamente.Verifique o status da porta.v Inativo: A porta está operacional, mas não pode acessar a malha do

Fibre Channel. O adaptador Fibre Channel não está configuradocorretamente; o Fibre Channel Transceptor small form-factorpluggable (SFP) falhou; o cabo Fibre Channel que falhou ou nãoestá instalado; ou o dispositivo na outra extremidade do cabofalhou. Faça uma observação da porta 2. Vá para a etapa 7 napágina 347.

344 SAN Volume Controller: Guia de Resolução de Problemas

Page 363: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Com falha: A porta não está operacional por causa de uma falha dehardware. Faça uma observação da porta 2. Vá para a etapa 9 napágina 347.

v Não instalado: Esta porta não está instalada. Faça uma observaçãoda porta 2. Vá para a etapa 10 na página 348.

SIM Pressione e solte o botão direito para exibir a porta 3 do FibreChannel. Acesse 4.

4. (na etapa 3 na página 344)O painel frontal de exibição ou a GUI de assistente de serviço no SANVolume Controller está mostrando a porta 3 do Fibre Channel ativa?

NÃO Uma porta do Fibre Channel não está funcionando corretamente.Verifique o status da porta.v Inativo: A porta está operacional, mas não pode acessar a malha do

Fibre Channel. O adaptador Fibre Channel não está configuradocorretamente; o Fibre Channel Transceptor small form-factorpluggable (SFP) falhou; o cabo Fibre Channel que falhou ou nãoestá instalado; ou o dispositivo na outra extremidade do cabofalhou. Faça uma observação da porta 3. Vá para a etapa 7 napágina 347.

v Com falha: A porta não está operacional por causa de uma falha dehardware. Faça uma observação da porta 3. Vá para a etapa 9 napágina 347.

v Não instalado: Esta porta não está instalada. Faça uma observaçãoda porta 3. Vá para a etapa 10 na página 348.

SIM Pressione e solte o botão direito para exibir a porta 4 do FibreChannel. Acesse 5.

5. (na etapa 4)O painel frontal de exibição ou a GUI de assistente de serviço no SANVolume Controller está mostrando a porta 4 do Fibre Channel ativa?

NÃO Uma porta do Fibre Channel não está funcionando corretamente.Verifique o status da porta.v Inativo: A porta está operacional, mas não pode acessar a malha do

Fibre Channel. O adaptador Fibre Channel não está configuradocorretamente; o Fibre Channel Transceptor small form-factorpluggable (SFP) falhou; o cabo Fibre Channel que falhou ou nãoestá instalado; ou o dispositivo na outra extremidade do cabofalhou. Faça uma observação da porta 4. Vá para a etapa 7 napágina 347.

v Com falha: A porta não está operacional por causa de uma falha dehardware. Faça uma observação da porta 4. Vá para a etapa 8 napágina 347.

v Não instalado: Esta porta não está instalada. Faça uma observaçãoda porta 4. Vá para a etapa 10 na página 348.

SIM Se houver mais de quatro portas do Fibre Channel no nó, repita aetapa 5 para cada porta do Fibre Channel adicional que usar oassistente de serviço.

Vá para a etapa 6.6. (na etapa 5)

Capítulo 11. Usando os procedimentos de análise de manutenção 345

Page 364: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Uma falha relatada anteriormente com a porta do Fibre Channel não está maissendo exibida. Um problema com a malha do Fibre Channel da SAN pode tersido corrigido ou pode haver um problema intermitente.Verifique com o cliente se quaisquer portas do Fibre Channel estãodesconectadas ou se qualquer componente da malha do Fibre Channel daSAN falhou e foi corrigido recentemente.A falha da porta do Fibre Channel está explicada pelas verificaçõesanteriores?

NÃO Pode haver um erro do Fibre Channel intermitente.a. Use o procedimento de determinação de problema da SAN para

verificar e resolver quaisquer problemas de conexão da malha doFibre Channel. Se você resolver um problema, continue com o“MAP 5700: Verificação de reparo” na página 349.

b. Verifique se erros semelhantes do Fibre Channel que ocorreramrecentemente na mesma porta nesse nó do SAN Volume Controller.Se eles ocorreram, substitua o cabo Fibre Channel, a menos que elejá tenha sido substituído.

c. Substitua o Transceptor SFP Fibre Channel, a menos que ele játenha sido substituído.

Nota: Os nós do SAN Volume Controller são suportados porambos os Transceptores SFP de ondas longas e Transceptores SFPde ondas curtas. Você deve substituir um Transceptor SFP pelomesmo tipo de Transceptor SFP. Se o Transceptor SFP a sersubstituído for um Transceptor SFP de onda longa, por exemplo,você deve fornecer um substituto adequado. A remoção doTransceptor SFP errado poderá resultar em perda de acesso aosdados. Consulte a documentação “Removendo e substituindo otransceptor SFP do Fibre Channel em um nó do SAN VolumeController ” para descobrir como substituir um transceptor SFP.

d. Substitua o conjunto de adaptadores Fibre Channel mostrado emTabela 76.

Tabela 76. Conjuntos de Fibre Channel

Nó Conjunto de adaptadores

Porta 1, 2, 3 ou 4 (slot 1) do SAN VolumeController 2145-CG8

HBA do Fibre Channel de quatro portas

Porta 5, 6, 7 ou 8 (slot 2) do SAN VolumeController 2145-CG8

HBA do Fibre Channel de quatro portas

Porta 1, 2, 3 ou 4 do SAN Volume Controller2145-CF8

HBA do Fibre Channel de quatro portas

Porta 1, 2, 3 ou 4 (slot 1 obrigatório; oprimeiro adaptador FC) do SAN VolumeController 2145-DH8

Adaptador Fibre Channel de quatro portas

Porta 5, 6, 7 ou 8 (slot 2 opcional; o segundoadaptador FC) do SAN Volume Controller2145-DH8

Adaptador Fibre Channel de quatro portas

Porta 9, 10, 11 ou 12 (slot 5 opcional; oterceiro adaptador Fibre Channel)SANVolume Controller 2145-DH8

Adaptador Fibre Channel de quatro portas

e. Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

346 SAN Volume Controller: Guia de Resolução de Problemas

Page 365: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

SIM Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

7. (nas etapas 2 na página 344, 3 na página 344, 4 na página 345 e 5 na página345)A porta observada no SAN Volume Controller está mostrando um status deinativo. Para alguns modelos, esse status inativo poderá ocorrer quando avelocidade do Fibre Channel não estiver configurado corretamente.

8. (na etapa 7)A porta observada no SAN Volume Controller exibe um status de inativo. Se aporta observada ainda exibir um status de inativo, substitua as partesassociadas à porta observada até que o problema seja corrigido na seguinteordem:a. Os cabos Fibre Channel do SAN Volume Controller para a rede Fibre

Channel.b. As conexões de malha do Fibre Channel com falha, particularmente o

Transceptor SFP no comutador de Fibre Channel. Use o procedimento dedeterminação de problema da SAN para resolver qualquer problema deconexão da malha do Fibre Channel.

c. SAN Volume Controller Transceptor SFP Fibre Channel.

Nota: Os nós do SAN Volume Controller são suportados com os SFPs deondas longas e de ondas curtas. Você deve substituir um SFP com omesmo tipo de Transceptor SFP que você está substituindo. Se oTransceptor SFP a ser substituído for um Transceptor SFP de onda longa,por exemplo, você deve fornecer um substituto adequado. A remoção doTransceptor SFP errado poderá resultar em perda de acesso aos dados.Consulte a documentação “Removendo e substituindo o transceptor SFPdo Fibre Channel em um nó do SAN Volume Controller ” para descobrircomo substituir um transceptor SFP.

d. Substitua o conjunto de adaptadores Fibre Channel mostrado em Tabela 76na página 346.

e. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”na página 349.

9. (nas etapas 2 na página 344, 3 na página 344, 4 na página 345 e 5 na página345)A porta observada no SAN Volume Controller exibe um status de falha.Verifique se os cabos Fibre Channel que conectam os nós do SAN VolumeController aos comutadores estão firmemente conectados. Substitua as peçasassociados à porta observada até que o problema seja corrigido na seguinteordem:a. Transceptor SFP Fibre Channel.

Nota: Os nós do SAN Volume Controller são suportados por ambos osTransceptores SFP de ondas longas e Transceptores SFP de ondas curtas.Você deve substituir um Transceptor SFP pelo mesmo tipo de TransceptorSFP. Se o Transceptor SFP a ser substituído for um Transceptor SFP deonda longa, por exemplo, você deve fornecer um substituto adequado. Aremoção do Transceptor SFP errado poderá resultar em perda de acessoaos dados. Consulte a documentação “Removendo e substituindo otransceptor SFP do Fibre Channel em um nó do SAN Volume Controller ”para descobrir como substituir um transceptor SFP.

b. Substitua o conjunto de adaptadores Fibre Channel mostrado em Tabela 76na página 346.

Capítulo 11. Usando os procedimentos de análise de manutenção 347

Page 366: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

c. Verifique o reparo continuando com o “MAP 5700: Verificação de reparo”na página 349.

10. (nas etapas 2 na página 344, 3 na página 344, 4 na página 345 e 5 na página345)A porta indicada no SAN Volume Controller exibe um status de não instalado.Se você substituiu o adaptador Fibre Channel, certifique-se de que ele estejainstalado corretamente. Se você substituiu qualquer outro componente daplaca-mãe, certifique-se de que o adaptador Fibre Channel não foi perturbado.A falha do adaptador Fibre Channel está explicada por verificaçõesanteriores?

NÃO

a. Substitua o conjunto de adaptadores Fibre Channelmostrado emTabela 76 na página 346.

b. Se o problema não for corrigido, substitua o hardware de conexãoFibre Channel na ordem mostrada em Tabela 77.

Tabela 77. SAN Volume ControllerHardware de conexão do adaptador Fibre Channel

Nó Hardware de conexão do adaptador

Porta 1, 2, 3 ou 4 (slot 1) do SAN VolumeController 2145-CG8

1. FC PCI Express® com o conjunto dasplacas riser 1

2. Placa-mãe

Porta 5, 6, 7 ou 8 (slot 2) do SAN VolumeController 2145-CG8

1. FC PCI Express® com o conjunto dasplacas riser 2

2. Placa-mãe

Porta 1-8 do SAN Volume Controller2145-DH8

1. Conjunto das placas riser 1 do PCIExpress®

2. Placa-mãe

Porta 9-12 do SAN Volume Controller2145-DH8

1. Conjunto das placas riser 2 do PCIExpress®

2. Placa-mãe

c. Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

11. (na etapa 1 na página 344)Se a velocidade operacional estiver em uma velocidade operacional inferiorsuportada pelo comutador, isso indica que um alto número de erros de linkestão sendo detectados.Para exibir a velocidade atual do link, consulte http://www-01.ibm.com/support/knowledgecenter/STPVGU_7.6.0/com.ibm.storage.svc.console.760.doc/svc_svcdetfibrenetspeed_23eeaf.htmlA porta operacional é inferior à velocidade esperada?

NÃO Repita a verificação com as outras portas do Fibre Channel até que aporta com falha seja localizada. Se nenhuma porta com falha forlocalizada, o problema não existirá mais. Verifique o reparocontinuando com o “MAP 5700: Verificação de reparo” na página 349.

SIM Execute as etapas a seguir:

348 SAN Volume Controller: Guia de Resolução de Problemas

Page 367: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

a. Verifique o roteamento do cabo Fibre Channel para assegurar-se deque não haja nenhum dano e que a rota do cabo não contenhanenhuma inflexão firme (não menos do que um raio de 3polegadas). Roteie novamente ou substitua o cabo Fibre Channel.

b. Remova o cabo Fibre Channel por dois segundos e, em seguida,reinsira-o para forçar o adaptador Fibre Channel a renegociar suavelocidade operacional.

c. Verifique novamente a velocidade da porta do Fibre Channel. Seagora estiver correta, o problema será resolvido. Caso contrário, oproblema pode ser causado por uma das condições a seguir:v HBA do Fibre Channel de quatro portasv SAN Volume Controller Transceptor SFPv Conversor de interface gigabit do comutador de Fibre Channel

(GBIC) ou o Transceptor SFPv Comutador de Fibre Channel

Verifique novamente a velocidade após alterar qualquercomponente até que o problema seja resolvido e, em seguida,verifique o reparo continuando com o “MAP 5700: Verificação dereparo”.

MAP 5700: Verificação de reparoMAP 5700: Verificação de reparo ajuda a verificar se o field-replaceable units(FRUs), trocado por novas FRUs, ou ações de reparo que foram feitas resolveramtodos os problemas no SAN Volume Controller.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ter sido enviado aqui porque executou uma reparação e desejaconfirmar que não existe nenhum outro problema na máquina.

Procedimento1. Existem LEDs de Energia em todos os nós? Para obter maiores informações

sobre esse LED, consulte “LED de Energia” na página 26.

NÃO Acesse “MAP 5000: Iniciar” na página 299.

SIM Vá para a etapa 2.2. (na etapa 1)

Todos os nós estão exibindo Cluster: ou o LED de status do nó está aceso?

NÃO Acesse “MAP 5000: Iniciar” na página 299.

SIM Vá para a etapa 3.3. (na etapa 2)

Usando o aplicativo do SAN Volume Controller para o sistema que vocêacabou de reparar, verifique o status de todos os discos gerenciados (MDisks)configurados.Todos os MDisks possuem um status de online?

NÃO Se algum dos MDisks possuir um status de offline, repare os MDisks.

Capítulo 11. Usando os procedimentos de análise de manutenção 349

Page 368: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Use o procedimento de determinação de problema do controlador dedisco para reparar as falhas do MDisk antes de retornar a esse MAP.

Se todos os MDisks possuírem um status de degraded paths oudegraded ports, repare qualquer rede de área de armazenamento(SAN) e falhas de MDisk antes de retornar a esse MAP.

Se todos os MDisks mostrarem um status de excluded, inclua MDisksantes de retornar a esse MAP.

Acesse “MAP 5000: Iniciar” na página 299.

SIM Vá para a etapa 4.4. (na etapa 3 na página 349)

Usando o aplicativo do SAN Volume Controller para o sistema que acabou dereparar, verifique o status de todos os volumes configurados. Todos osvolumes possuem um status de online?

NÃO Vá para a etapa 5.

SIM Vá para a etapa 6.5. (na etapa 4)

Seguindo um reparo do SAN Volume Controller, vários volumes mostrarão umstatus de offline. Volumes serão mantidos offline, se o SAN Volume Controllernão puder confirmar a integridade dos dados. Os volumes podem ser o destinode uma cópia não concluída, ou os dados gravados em cache que não foramgravados de volta no disco podem ter sido perdidos. Determine porque ovolume está offline. Se o volume foi o destino de uma cópia não concluída, serápossível iniciar a cópia novamente. Caso contrário, os dados de gravaçãopodem não ter sido gravados no disco e, portanto seu estado não poderá serverificado. Os procedimentos do site determinarão como os dados serãorestaurados para um estado conhecido.Para colocar o volume online, você deve mover todos os discos offline para ogrupo de E/S de recuperação e, em seguida, movê-los de volta para um grupode E/S ativo.Acesse “MAP 5000: Iniciar” na página 299.

6. (na etapa 4)O SAN Volume Controller foi reparado com sucesso.

MAP 5800: indicadores luminososMAP 5800: indicadores luminosos ajudam a resolver problemas de hardware emum SAN Volume Controller que estão impedindo o nó de inicializar.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Você pode ser enviado aqui devido às seguintes situações:v O LED de Erro no painel de informações do operador estiver aceso ou piscandov Outro MAP o enviou para cá:

– “Indicadores luminosos para o SAN Volume Controller 2145-DH8” na página351

350 SAN Volume Controller: Guia de Resolução de Problemas

Page 369: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

– “Indicadores luminosos para o SAN Volume Controller 2145-CG8” na página360

– “Indicadores luminosos para o SAN Volume Controller 2145-CF8” na página366

Indicadores luminosos para o SAN Volume Controller2145-DH8

O sistema de diagnósticos por indicadores luminosos é um sistema de LEDs naparte superior do painel de informações do operador do nó do SAN VolumeController 2145-DH8, que leva você para o componente com falha.

Sobre Esta Tarefa

Quando um erro ocorre, os LEDs são acesos junto à parte frontal do painel deinformações do operador, do painel do sistema de diagnósticos por indicadoresluminosos e, em seguida, no componente com falha. Visualizando os LEDs emuma determinada ordem, você muitas vezes identifica a origem do erro.

Os LEDs que estão acesos para indicar um erro permanecem acesos quando oservidor for desligado, se o nó estiver conectado em uma fonte de alimentaçãooperacional.

Certifique-se de que o nó esteja ligado e, em seguida, resolva todos os erros dehardware que são indicados pelo LED de Erro e pelos LEDs de indicadoresluminosos:

Procedimento1. O LED de erro do Sistema ▌7▐, mostrado no Figura 85, no SAN Volume

Controller 2145-DH8 painel de informações do operador está aceso oupiscando?

▌1▐ Botão e LED de Controle de energia.▌2▐ LED de Ethernet.▌3▐ Botão e LED de Localizador.▌4▐ Trava de liberação.▌5▐ LEDs de atividade de Ethernet.▌6▐ LED de log de verificação▌7▐ LED de erro do sistema.

NÃO Reavalie os seus sintomas e volte para “MAP 5000: Iniciar” na página299.

5 6 7

1 2 3 4

ifs00064

Figura 85. SAN Volume Controller 2145-DH8 painel de informações do operador

Capítulo 11. Usando os procedimentos de análise de manutenção 351

Page 370: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

SIM Vá para a etapa 2.2. (na etapa 1 na página 351)

Pressione a trava de liberação, conforme mostrado no Figura 86, e abra o paineldo sistema de diagnósticos por indicadores luminosos, que é mostrado noFigura 87.

Tem um ou mais LEDs no painel do sistema de diagnósticos por indicadoresluminosos acesos ou piscando?

NÃO Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades. Se o LED de erroainda estiver aceso, mas nenhum LED estiver aceso no painel dosistema de diagnósticos por indicadores luminosos, substitua as peçasna seguinte sequência:a. Painel de informações do operador

Trava de liberação

LEDs do sistemade diagnósticos por indicadoresluminosos

Painel de informaçõesdo operador

Figura 86. Pressione a trava de liberação

Sistema de diagnósticos por indicadores luminosos

Lembrete

Reconfigurar

Código doponto deverificação

Figura 87. SAN Volume Controller 2145-DH8

352 SAN Volume Controller: Guia de Resolução de Problemas

Page 371: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

b. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Consulte Tabela 78 na página 354 e conclua a ação especificada paraLEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 359. Algumas ações exigem quevocê observe o estado dos LEDs na placa-mãe. O Figura 88 na página354 mostra o local dos LEDs da placa-mãe. Os LEDs do ventiladorestão localizados ao lado de cada VENTILADOR. Para visualizar osLEDs, conclua as seguintes ações:a. Desligue o nó enquanto assegura que seus dados estejam

espelhados e sincronizados.b. Identifique e rotule todos os cabos conectados ao nó para que

possam ser recolocados na mesma porta. Remova o nó do rack ecoloque-o em uma superfície plana e antiestática. Para obterinformações adicionais, consulte “Removendo o nó de um rack”.

c. Remova a tampa superior.d. Consulte Tabela 78 na página 354 e conclua a ação especificada para

LEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 359.

Capítulo 11. Usando os procedimentos de análise de manutenção 353

Page 372: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos.

LED Descrição Ação

O LED dolog deerros oudo log deverificação

painel deinformaçõesdooperador

Ocorreu um erro e não pode ser isolado semconcluir determinados procedimentos.

1. Conecte a tela VGA e o teclado USB.

2. Verifique o log de evento do sistema IMM2 e olog de erro no sistema para obter informaçõessobre o erro.

3. Salve o log, se necessário, e limpe o logposteriormente.

LED deerro dosistema

painel deinformaçõesdooperador

Ocorreu um erro. 1. Verifique os LEDs do sistema de diagnósticospor indicadores luminosos e siga as instruções.

2. Verifique o log de evento do sistema IMM2 e olog de erro no sistema para obter informaçõessobre o erro.

3. Salve o log, se necessário, e limpe o logposteriormente.

LEDde erro do sistema LED do localizador LED de energia

LED de erro da placaEthernet de 10 G

LED de pulsaçãodo IMM2

LED de pulsaçãode gerenciamento do gabinete

LED de energiaem espera

LED de erroda bateria

LED de errodo ventilador 4

LED de errodo ventilador 3

LED de errodo microprocessador 2

LED de errodo ventilador 2

LED de errodo ventilador 1

LED de errodo microprocessador 1

LED de erroda placa-mãe

LEDs de erro de19 a 24 da DIMM(embaixo das travas)

LEDs de erro de1 a 6 da DIMM(embaixo das travas)

LEDs de erro de7 a 18 da DIMM(embaixo das travas)

Figura 88. LEDs da placa-mãe do sistema SAN Volume Controller 2145-DH8.

354 SAN Volume Controller: Guia de Resolução de Problemas

Page 373: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos. (continuação)

LED Descrição Ação

PS Quando somente o LED da fonte de alimentaçãoestiver aceso, tem uma fonte de alimentação comfalha.

O sistema pode detectar um erro de fonte dealimentação. Conclua as seguintes etapas paracorrigir o problema:

1. Verifique a fonte de alimentação com um LEDamarelo aceso.

2. Certifique-se de que as fontes de alimentaçãoestejam corretamente posicionadas econectadas em uma tomada de correntealternada boa.

3. Remova uma fonte de energia para isolar afonte de alimentação com falha.

4. Certifique-se de que ambas as fontes dealimentação instaladas no servidor sejam damesma voltagem de entrada de correntealternada.

5. Substitua a fonte de alimentação defeituosa.

PS + CONFIG

Quando os LEDs PS e CONFIG estiverem acesos, aconfiguração da fonte de alimentação não seráválida.

Se o PS LED e o CONFIG LED estiverem acesos, osistema registrará um erro de configuração deenergia inválido. Certifique-se de que ambas asfontes de alimentação instaladas no nó sejam damesma classificação ou voltagem.

OVERSPEC

O consumo do sistema atinge o ponto de proteçãopara corrente excessiva da fonte de alimentação ouas fontes de alimentação estão danificadas.

1. Se o erro de Trilho de Energia (A, B, C, D, E, F,G e H) não foi detectado, conclua as etapas aseguir:

a. Use o utilitário IBM Power Configuratorpara determinar o consumo de energiaatual do sistema. Para obter maisinformações e para fazer download doutilitário, acesse http://www.ibm.com/systems/bladecenter/ /resources/powerconfig.html.

b. Substitua a fonte de alimentação defeituosa.

2. Se o erro de Trilho de energia (A, B, C, D, E, F,G e H) também foi detectado, siga as açõeslistadas em MAP 5040: Energia.

Capítulo 11. Usando os procedimentos de análise de manutenção 355

Page 374: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos. (continuação)

LED Descrição Ação

PCI Ocorreu um erro em um barramento PCI ou naplaca-mãe. Outro LED está aceso próximo a umslot PCI com falha.

1. Verifique os LEDs da placa riser, o LED de errodo ServeRAID e o LED de erro do adaptadorde rede de porta dual para identificar ocomponente que causou o erro.

2. Verifique o log de erro no sistema para obterinformações sobre o erro.

3. Se você não puder isolar o componente comfalha usando os LEDs e as informações no logde erros do sistema, remova um componentepor vez. Em seguida, reinicie o servidor apóscada componente ser removido.

4. Substitua os seguintes componentes, na ordemque é mostrada, reiniciando o servidor a cadavez:

v Placas riser PCI

v Adaptador ServeRAID

v Adaptador de rede

v (Somente técnico treinado) Placa-mãe.

5. Se a falha permanecer, entre em contato comseu Representante de serviços IBM.

NMI Uma interrupção não mascarável ocorreu ou obotão NMI foi pressionado.

1. Verifique o log de erro no sistema para obterinformações sobre o erro.

2. Reinicialize o servidor.

356 SAN Volume Controller: Guia de Resolução de Problemas

Page 375: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos. (continuação)

LED Descrição Ação

CONFIGURAR

FONTE DE ALIMENTAÇÃO + CONFIG Ocorreuum erro de configuração de energia inválido.

Se o LED CONFIG e o LED PS estiverem acesos, osistema registrará um erro de configuração deenergia inválido. Certifique-se de que ambas asfontes de alimentação instaladas no servidorestejam na mesma classificação ou voltagem.

CONFIG + CPU Ocorreu um erro de configuraçãode hardware.

Se o LED CONFIG e o LED CPU estiverem acesos,conclua as etapas a seguir para corrigir oproblema:

1. Verifique os microprocessadores que foraminstalados para garantir que eles sejamcompatíveis uns com os outros.

2. (Somente técnico treinado) Substitua omicroprocessador incompatível.

3. Verifique os logs de erro do sistema para obterinformações sobre o erro. Substitua qualquercomponente que for identificado no log deerro.

CONFIG + MEM Ocorreu um erro deconfiguração de hardware.

Se o LED CONFIG e o LED MEM estiveremacesos, verifique o log de eventos do sistema noutilitário de Configuração ou as mensagens deerro do IMM2.

CONFIG + PCI Ocorreu um erro de configuraçãode hardware.

Se o LED de CONFIG e o LED PCI estiveremacesos, verifique os logs de erro no sistema paraobter informações sobre o erro. Substitua qualquercomponente que for identificado no log de erro.

CONFIG + HDD Ocorreu um erro na unidade dedisco.

Se o LED de CONFIG e o LED da unidade dedisco rígido estiverem acesos, verifique os logs deerro no sistema para obter informações sobre oerro. Substitua qualquer componente que foridentificado no log de erro.

LINK Reservado.

Capítulo 11. Usando os procedimentos de análise de manutenção 357

Page 376: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos. (continuação)

LED Descrição Ação

CPU Quando somente o LED da CPU estiver aceso, ummicroprocessador falhou. Quando ambos os LEDsCPU e CONFIG estiverem acesos, a configuraçãodo microprocessador estará inválida.

1. Se o LED CONFIG não estiver aceso, ocorreuuma falha do microprocessador, portanto,conclua as seguintes etapas:

a. (Somente técnico treinado) Assegure-se deque o microprocessador com falha e seudissipador de calor, que estão indicados porum LED aceso na placa-mãe, estejaminstalados corretamente.

b. (Apenas para técnico treinado) Substitua omicroprocessador com falha.

c. Para obter mais informações, entre emcontato com seu Representante de serviçosIBM.

2. Se o LED CONFIG e o LED CPU estiveremacesos, o sistema registrará um erro deconfiguração de microprocessador inválido.Conclua as seguintes etapas para corrigir oproblema:

a. Verifique os microprocessadores instaladosrecentemente para assegurar que eles sejamcompatíveis uns com os outros.

b. (Somente técnico treinado) Substituaqualquer microprocessador incompatível.

c. Verifique os logs de erro do sistema paraobter informações sobre o erro. Substituaqualquer componente que for identificadono log de erro.

MEM Quando somente o LED de MEM estiver aceso,um erro de memória ocorreu

Nota: Nota: Cada vez que você instalar ouremover uma DIMM, você deve desconectar o nóda fonte de alimentação; e, em seguida, aguardar10 segundos antes de reiniciar o servidor. Se oLED CONFIG não estiver aceso, o sistema podedetectar um erro de memória. Conclua asseguintes etapas para corrigir o problema:

1. Atualize o firmware do nó.

2. Reposicione ou troque as DIMMs com o LEDaceso.

3. Verifique o log de eventos do sistema no SetupUtility ou mensagens de erro IMM.

4. Substitua o DIMM falho.

MEM + CONFIG

Quando os LEDs MEM e CONFIG LEDs estiveremacesos, a configuração de memória não será válida.

Se o LED de MEM e o LED de CONFIG estiveremacesos, verifique o log de eventos do sistema noutilitário de Configuração ou as mensagens deerro do módulo de gerenciamento integrado 2.

358 SAN Volume Controller: Guia de Resolução de Problemas

Page 377: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 78. LED do painel de diagnósticos. (continuação)

LED Descrição Ação

TEMP O sistema ou a temperatura do componente dosistema excedeu o nível limite. Um ventilador comfalha pode fazer com que o LED TEMP se acenda.

1. Certifique-se de que o dissipador de caloresteja corretamente ajustado.

2. Determine se um ventilador falhou e substituao ventilador, se necessário.

3. Certifique-se de que a temperatura ambientenão esteja muito alta Consulte os requisitos doambiente para obter informações detemperatura do servidor.

4. Certifique-se de que as ventilações de ar nãoestejam bloqueadas.

5. Assegure-se de que o dissipador de calor ou oventilador no adaptador ou qualquer outroadaptador de rede esteja posicionadocorretamente. Se o ventilador falhou,substitua-o.

6. Para obter mais informações, entre em contatocom seu Representante de serviços IBM.

FAN Um ventilador falhou, está funcionando muitolentamente ou foi removido. O LED TEMPtambém pode ser aceso.

1. Verifique se o nó está instalado com oadaptador de rede de porta dual. Se sim,certifique-se de que o nó seja compilado com aconfiguração com quatro ventiladoresinstalados.

2. Reposicione o ventilador com falha, que éindicado por um LED aceso perto do conectordo ventilador na placa-mãe.

3. Substitua o ventilador com falha.

BOARD Ocorreu um erro na placa-mãe ou na bateria dosistema.

1. Verifique os LEDs na placa-mãe paraidentificar o componente que causou o erro. OLED BOARD pode acender devido a um dosseguintes motivos:

v Bateria

v Placa-mãe (Somente técnico treinado)

2. Verifique o log de erro no sistema para obterinformações sobre o erro.

3. Substitua o componente com falha.

HDD Uma unidade de disco rígido que falhou ou estáausente.

1. Verifique os LEDs nas unidades de disco rígidopara a unidade com um LED de status aceso ereajuste a unidade de disco rígido.

2. Reconecte o painel traseiro da unidade dedisco rígido.

3. Se o erro continuar, substitua os seguintescomponentes um por vez, na ordem que estálistada, reiniciando o servidor a cada vez:

a. Substitua a unidade de disco rígido.

b. Substitua o painel traseiro da unidade dedisco rígido.

4. Se o problema persistir, entre em contato comseu Representante de serviços IBM.

3. Continue com “MAP 5700: Verificação de reparo” na página 349 para verificar aoperação correta.

Capítulo 11. Usando os procedimentos de análise de manutenção 359

Page 378: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Indicadores luminosos para o SAN Volume Controller2145-CG8

Use os LEDs de diagnósticos que estão na placa-mãe para resolver problemas dehardware com o nó do SAN Volume Controller 2145-CG8.

Sobre Esta Tarefa

Assegure-se de que o nó esteja ligado e, em seguida, resolva quaisquer erros dehardware indicados pelo LED de Erro e pelos LEDs de indicadores luminosos:

Procedimento1. O LED de Erro, mostrado no Figura 89, no SAN Volume Controller 2145-CG8

painel de informações do operador está aceso ou piscando?

▌1▐ LED de erro do sistema.▌2▐ Trava de liberação.

NÃO Reavalie os seus sintomas e volte para “MAP 5000: Iniciar” na página299.

SIM Vá para a etapa 2.2. (na etapa 1)

Pressione a trava de liberação e abra o painel do sistema de diagnósticos porindicadores luminosos, que é mostrado no Figura 90 na página 361.Tem um ou mais LEDs no painel do sistema de diagnósticos por indicadoresluminosos acesos ou piscando?

21

1

svc00721

2

Figura 89. SAN Volume Controller 2145-CG8 ou 2145-CF8 painel de informações do operador

360 SAN Volume Controller: Guia de Resolução de Problemas

Page 379: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

NÃO Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades. Se o LED de erroainda estiver aceso, mas nenhum LED estiver aceso no painel dosistema de diagnósticos por indicadores luminosos, substitua as peçasna seguinte sequência:a. Painel de informações do operadorb. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Consulte Tabela 79 na página 363 e conclua a ação especificada paraLEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 366. Algumas ações exigem quevocê observe o estado dos LEDs na placa-mãe. O Figura 91 na página362 mostra o local dos LEDs da placa-mãe. Os LEDs do ventiladorestão localizados ao lado de cada VENTILADOR. Para visualizar osLEDs, conclua as seguintes ações:a. Desligue o nó enquanto assegura que seus dados estejam

espelhados e sincronizados.Para obter mais informações, consulte“MAP 5350: Desligando um nó” na página 328.

b. Identifique e rotule todos os cabos conectados ao nó para quepossam ser recolocados na mesma porta. Remova o nó do rack ecoloque-o em uma superfície plana e antiestática. Para obterinformações adicionais, consulte “Removendo o nó de um rack”.

c. Remova a tampa superior.d. Consulte Tabela 79 na página 363 e conclua a ação especificada para

LEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 366.

Sistema de diagnósticos por indicadores luminosos

SOBRECARGA LOG LINK PS PCI SP

VENTILADOR TEMP MEM NMI

LEMBRETE

CPU VRM(módulodo reguladorde voltagem)

DASD(dispositivo dearmazenamentode acesso direto)

RAID BRDCNFG

RECONFIGURAR

Figura 90. Painel do sistema de diagnósticos por indicadores luminosos do SAN Volume Controller 2145-CG8 ou2145-CF8

Capítulo 11. Usando os procedimentos de análise de manutenção 361

Page 380: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ LED da bateria.▌2▐ LED da pulsação do IMM.▌3▐ LED de pulsação de gerenciamento do gabinete.▌4▐ LEDs de erro do DIMM 10-18.▌5▐ LED de erro do microprocessador 1.▌6▐ LEDs de erro do DIMM 1-9.▌7▐ LED de erro do ventilador um.▌8▐ LED de erro do ventilador dois.▌9▐ LED de erro do ventilador três.▌10▐ LED de erro do ventilador quatro.

1

10

2 3

4

5

6

7

8911121314

20

19

18

17

16

15

21

22

23

svc00713

Figura 91. Painel de Diagnósticos dos LEDs da Placa-mãe do SAN Volume Controller 2145-CG8

362 SAN Volume Controller: Guia de Resolução de Problemas

Page 381: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌11▐ LED de erro do ventilador cinco.▌12▐ LED de erro do ventilador seis.▌13▐ LED ausente da placa riser SAS RAID.▌14▐ LED de erro de 240 VA.▌15▐ LED de erro do canal de energia A.▌16▐ LED de erro do canal de energia B.▌17▐ LED de erro do canal de energia C.▌18▐ LED de erro do canal de energia D.▌19▐ LED de erro do canal de energia E.▌20▐ LED de erro do canal de energia AUX.▌21▐ LED de erro da placa-mãe.▌22▐ LED de erro de microprocessador 2.▌23▐ LED ausente do Riser 2.

Tabela 79. Ações prescritas do LED do painel de diagnósticos

LED do painel dediagnóstico Ação

OVER SPEC As fontes de alimentação estão usando mais energia do que sua classificação máxima. Se oLED OVER SPEC estiver aceso, um ou mais dos seis LEDs de erro do canal de 12 V tambémestará aceso. Os LEDs de erro do canal de 12 V (A, B, C, D, E ou AUX) estão na placa-mãe.Conclua as ações a seguir para resolver o problema:

1. Desligue o nó, puxe o nó para frente no rack e remova a tampa. Não desconecte a energiado nó.

2. Verifique o LED de erro do canal de 12 V aceso na placa-mãe e remova os componenteslistados para esse LED:

v LED A: ventiladores, unidade de disco, qualquer unidades flash, ou painel traseiro dedisco

v LED B: Adaptador e riser Fibre Channel, toda a memória

v LED C: controlador de disco, toda a memória

v LED D: microprocessador

v LED E: Adaptador e riser SAS de alta velocidade, se instalado

v LED AUX: Adaptador Fibre Channel e adaptador SAS de alta velocidade, se instalado

3. Reinicie o nó para ver se o problema continua.

4. Reinstale cada dispositivo um por vez que você removeu para os problemas do LED. Inicieo nó a cada vez, para isolar o dispositivo com defeito.

5. Substitua qualquer dispositivo com falha.

6. Se nenhum dispositivo foi isolado e se o LED C ou D estiver aceso, desligue o nó e removao microprocessador. Você precisa de lenços embebidos em álcool e graxa térmica parasubstituir o microprocessador. Ligue o servidor pela comutação do bloco de comutador 3(SW3) bit 6. Reinicie o servidor. Se o problema for resolvido, substitua o microprocessador;caso contrário, reinstale o microprocessador. Em qualquer caso, comute o bloco decomutador 3 (SW3) bit 6 de volta à sua posição original.

7. Se nenhum dispositivo foi isolado e se o LED AUX estiver aceso, desligue o nó e removapainel de informações do operador. Ligue o servidor pela comutação do bloco decomutador 3 (SW3) bit 6. Reinicie o servidor. Reinicialize o servidor. Se o problema foiresolvido, substitua o painel de informações do operador; caso contrário, reinstale o painelde informações do operador. Em qualquer caso, comute o bloco de comutador 3 (SW3) bit6 de volta à sua posição original.

8. Se nenhum dispositivo com falha for isolado, substitua a placa-mãe.

Capítulo 11. Usando os procedimentos de análise de manutenção 363

Page 382: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 79. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

LOG Ocorreu um erro. Conecte um teclado e um monitor. Verifique o logo de evento do sistemaIMM e o log de evento do sistema para obter informações sobre o erro. Substitua quaisquercomponentes identificados nos logs de evento.

LINK Esse LED não é usado no SAN Volume Controller 2145-CG8. Substitua a placa-mãe.

PS Fonte de alimentação 1 ou fonte de alimentação 2 falhou. Conclua as ações a seguir pararesolver o problema:

1. Verifique a fonte de alimentação que está com um LED âmbar aceso.

2. Certifique-se de que as fontes de alimentação estejam completamente encaixadas.

3. Remova a fonte de alimentação 1 para isolar a fonte de alimentação com falha.

4. Substitua a fonte de alimentação defeituosa.

PCI Ocorreu um erro em um barramento PCI ou na placa-mãe. Outro LED está aceso próximo aum slot PCI com falha. Conclua as ações a seguir para resolver o problema:

1. Identifique o adaptador com defeito verificando os LEDs nos slots PCI.

2. Se o PCI no slot 1 estiver mostrando um erro, substitua o conjunto de adaptadores FibreChannel com quatro portas.

3. Se o PCI no slot 2 estiver mostrando um erro, substitua o conjunto de adaptadores SAS dealta velocidade.

4. Se o erro não for resolvido, substitua a placa-mãe.

SP Um erro do processador de serviço foi detectado. Conclua as ações a seguir para resolver oproblema:

1. Remova a energia do nó. Reconecte o servidor à energia e reinicie o nó.

2. Se o problema permanecer, substitua a placa-mãe.

FAN Um ventilador falhou, está funcionando muito lentamente ou foi removido. Um ventiladorcom falha também pode fazer com que o LED de TEMP seja aceso. Conclua as ações a seguirpara resolver o problema:

1. Reposicione o ventilador com falha, que é indicado por um LED aceso perto do conectordo ventilador na placa-mãe.

2. Se o problema persistir, substitua o ventilador com defeito.

TEMP A temperatura do sistema excedeu o nível limite. Um ventilador com falha pode fazer comque o LED TEMP se acenda. Conclua as ações a seguir para resolver o problema:

1. Certifique-se de que o dissipador de calor esteja corretamente ajustado.

2. Determine se um ventilador falhou e substitua-o.

3. Verifique se a temperatura ambiente está dentro das especificações de operação normais.

4. Certifique-se de que o fluxo de ar dentro e ao redor do SAN Volume Controller 2145-CG8não esteja obstruído.

MEM Uma configuração de memória ou um erro de memória que não é válido. Tanto o LED deMEM e quanto o LED de CNFG podem estar acesos. Conclua as ações a seguir para resolver oproblema:

1. Verifique se todas as DIMMs de memória estão instaladas corretamente.

2. Se os LEDs de erro de memória estiverem acesos, substitua o módulo de memóriaindicado.

3. Se o LED de MEM e o LED de CNFG estiverem acesos, ajuste a memória para que os slots2, 3, 5, 6, 7 e 8 da DIMM sejam os únicos usados.

NMI Uma interrupção não mascarada ocorreu ou o botão NMI foi pressionado. Esta situaçãonormalmente não ocorre. Se o botão NMI no painel de diagnósticos por indicadores luminososfoi pressionado por engano, reinicie o nó. Caso contrário, ligue para o seu centro de suporte.

364 SAN Volume Controller: Guia de Resolução de Problemas

Page 383: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 79. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

CNFG Ocorreu um erro de configuração de hardware. Se o LED do MEM também estiver aceso,conclua as ações mostradas para o LED do MEM. Se o LED da CPU LED estiver aceso,verifique se o microprocessador está instalado na CPU 2. Se uma CPU estiver instalada,remova-a.. A configuração não é suportada. Se nenhum outro LED de indicadores luminososestiver aceso, substitua as unidades substituíveis em campo na ordem que é mostrada até queo problema seja resolvido:

1. Painel de informações do operador

2. Cabo do Painel de informações do operador

3. Placa-mãe

CPU Um microprocessador que falhou ou uma configuração do microprocessador não é válida.Tanto o LED da CPU quanto o LED de CNFG podem ser acesos. Complete as seguintes ações:

1. Verifique os LEDs de erro da placa-mãe.

2. Se o LED de erro da CPU 1 estiver aceso, verifique se o microprocessador está instaladocorretamente.

3. Se o erro persistir, substitua o microprocessador.

4. Se o erro persistir, substitua a placa-mãe.

VRM (módulo doregulador devoltagem)

Esse LED não é usado no SAN Volume Controller 2145-CG8.

DASD (dispositivode armazenamentode acesso direto)

Uma unidade de disco que falhou ou está ausente. Um SAN Volume Controller 2145-CG8 deveter sua unidade de disco rígido do sistema que está instalada no slot da unidade 4. Até quatrounidades flash podem ser instalados nos slots de unidade de 0 a 3.

Se um Unidade flash for deliberadamente removido de um slot, o LED de erro do sistema e ocontorno claro do LED do painel de diagnósticos do dispositivo de armazenamento de acessodireto. O erro será mantido mesmo se o Unidade flash for substituído em um slot diferente. Seum Unidade flash for removido ou movido, limpe o erro concluindo este procedimento:

1. Desligue o nó usando o MAP 5350.

2. Remova ambos os cabos de energia.

3. Substitua ambos os cabos de energia.

4. Reinicie o nó.

Resolva quaisquer erros do nó ou do sistema que se relacionam ao unidades flash ou aunidade de disco do sistema.

Se um erro ainda for mostrado, desligue o nó e recoloque todas as unidades.

Se o erro continuar, substitua os seguintes componentes na ordem listada:

1. A unidade de disco do sistema

2. O painel traseiro da unidade de disco

RAID Esse LED não é usado no SAN Volume Controller 2145-CG8.

Capítulo 11. Usando os procedimentos de análise de manutenção 365

Page 384: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 79. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

BRD Ocorreu um erro na placa-mãe. Conclua as ações a seguir para resolver o problema:

1. Verifique os LEDs na placa-mãe para identificar o componente que causou o erro. O LEDde BRD pode ser aceso por causa de qualquer uma das seguintes razões:

v Bateria.

v Faltando o conjunto da placa riser PCI. Deve haver uma placa riser no slot PCI 2, mesmoque outro adaptador não esteja presente.

v Regulador de voltagem com falha.

2. Substitua quaisquer componentes de substituição com falha ou ausentes, tal como a bateriaou o conjunto da placa riser PCI.

3. Se um regulador de voltagem falhar, substitua a placa-mãe.

3. Continue com “MAP 5700: Verificação de reparo” na página 349 para verificar aoperação correta.

Indicadores luminosos para o SAN Volume Controller2145-CF8

Use os LEDs de diagnósticos que estão na placa-mãe para resolver problemas dehardware com o nó do SAN Volume Controller 2145-CF8.

Sobre Esta Tarefa

Assegure-se de que o nó esteja ligado e, em seguida, resolva quaisquer erros dehardware indicados pelo LED de Erro e pelos LEDs de indicadores luminosos:

Procedimento1. O LED de Erro, mostrado no Figura 92, no SAN Volume Controller 2145-CF8

painel de informações do operador está aceso ou piscando?

▌5▐ LED de erro do sistema.▌6▐ Trava de liberação.

NÃO Reavalie os seus sintomas e volte para “MAP 5000: Iniciar” na página299.

SIM Vá para a etapa 2.2. (na etapa 1)

Pressione a trava de liberação e abra o painel do sistema de diagnósticos porindicadores luminosos, que é mostrado no Figura 93 na página 367.

12

34

431 2

6

5

78

svc_bb1gs008

910

Figura 92. SAN Volume Controller 2145-CG8 ou 2145-CF8 painel de informações do operador

366 SAN Volume Controller: Guia de Resolução de Problemas

Page 385: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tem um ou mais LEDs no painel do sistema de diagnósticos por indicadoresluminosos acesos ou piscando?

NÃO Verifique se o cabo do painel de informações do operador estácorretamente encaixado em ambas as extremidades. Se o LED de erroainda estiver aceso, mas nenhum LED estiver aceso no painel dosistema de diagnósticos por indicadores luminosos, substitua as peçasna seguinte sequência:a. Painel de informações do operadorb. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Consulte Tabela 80 na página 369 e conclua a ação especificada paraLEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 372. Algumas ações exigem quevocê observe o estado dos LEDs na placa-mãe. O Figura 94 na página368 mostra o local dos LEDs da placa-mãe. Os LEDs do ventiladorestão localizados ao lado de cada VENTILADOR. Para visualizar osLEDs, conclua as seguintes ações:a. Desligue o nó enquanto assegura que seus dados estejam

espelhados e sincronizados.Para obter mais informações, consulte“MAP 5350: Desligando um nó” na página 328.

b. Identifique e rotule todos os cabos conectados ao nó para quepossam ser recolocados na mesma porta. Remova o nó do rack ecoloque-o em uma superfície plana e antiestática. Para obterinformações adicionais, consulte “Removendo o nó de um rack”.

c. Remova a tampa superior.d. Consulte Tabela 80 na página 369 e conclua a ação especificada para

LEDs do sistema de diagnósticos por indicadores luminosos. Emseguida, acesse a etapa 3 na página 372.

Sistema de diagnósticos por indicadores luminosos

SOBRECARGA LOG LINK PS PCI SP

VENTILADOR TEMP MEM NMI

LEMBRETE

CPU VRM(módulodo reguladorde voltagem)

DASD(dispositivo dearmazenamentode acesso direto)

RAID BRDCNFG

RECONFIGURAR

Figura 93. Painel do sistema de diagnósticos por indicadores luminosos do SAN Volume Controller 2145-CG8 ou2145-CF8

Capítulo 11. Usando os procedimentos de análise de manutenção 367

Page 386: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌1▐ LED da placa riser do slot PCI 2 ausente.▌2▐ LED de pulsação de gerenciamento do gabinete.▌3▐ LED da bateria.▌4▐ LED da pulsação do IMM.▌5▐ LED da placa riser do slot PCI 1 ausente.▌6▐ LED de erro do sistema.▌7▐ LED de erro do microprocessador 1.▌8▐ LEDs de erro do DIMM 1-8.▌9▐ LED de erro do ventilador um.▌10▐ LED de erro do ventilador dois.▌11▐ LED de erro do ventilador três.▌12▐ LED de erro do ventilador quatro.▌13▐ LED de erro do ventilador cinco.▌14▐ LED de erro do ventilador seis.▌15▐ LED de erro de 240 VA.▌16▐ LED de erro do canal de energia A.

7

5

6

8

9

10111314

3 4

15

1216

19

18

20

21

23

24

17

22

1 2

Figura 94. Painel de Diagnósticos dos LEDs da Placa-mãe do SAN Volume Controller 2145-CF8

368 SAN Volume Controller: Guia de Resolução de Problemas

Page 387: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

▌17▐ LED de erro do canal de energia B.▌18▐ LED de erro do canal de energia C.▌19▐ LED de erro do canal de energia D.▌20▐ LED de erro do canal de energia E.▌21▐ LED de erro do canal de energia AUX.▌22▐ LED de erro de SAS/SATA RAID.▌23▐ LED de erro de microprocessador 2.▌24▐ LEDs de erro do DIMM 9-16.

Tabela 80. Ações prescritas do LED do painel de diagnósticos

LED do painel dediagnóstico Ação

OVER SPEC As fontes de alimentação estão usando mais energia do que sua classificação máxima. Se oLED OVER SPEC estiver aceso, um ou mais dos seis LEDs de erro do canal de 12 V tambémestará aceso. Os LEDs de erro do canal de 12 V (A, B, C, D, E ou AUX) estão na placa-mãe.Conclua as ações a seguir para resolver o problema:

1. Desligue o nó, puxe o nó para frente no rack e remova a tampa. Não desconecte a energiado nó.

2. Verifique se o LED de erro do canal de 12 V está aceso na placa-mãe. Remova oscomponentes listados para esse LED:

v LED A: ventiladores, unidade de disco, qualquer unidades flash, ou painel traseiro dedisco

v LED B: Adaptador e riser Fibre Channel, toda a memória

v LED C: controlador de disco, toda a memória

v LED D: microprocessador

v LED E: Adaptador e riser SAS de alta velocidade, se instalado

v LED AUX: Adaptador Fibre Channel e adaptador SAS de alta velocidade, se instalado

3. Reinicie o nó para ver se o problema continua.

4. Reinstale cada dispositivo um por vez que você removeu para os problemas do LED. Inicieo nó a cada vez, para isolar o dispositivo com defeito.

5. Substitua qualquer dispositivo com falha.

6. Se nenhum dispositivo foi isolado e se o LED C ou D estiver aceso, desligue o nó e removao microprocessador. Você precisa de lenços embebidos em álcool e graxa térmica parasubstituir o microprocessador. Ligue o servidor pela comutação do bloco de comutador 3(SW3) bit 6. Reinicie o servidor. Reinicialize o servidor. Se o problema for resolvido,substitua o microprocessador; caso contrário, reinstale o microprocessador. Em qualquercaso, comute o bloco de comutador 3 (SW3) bit 6 de volta à sua posição original.

7. Se nenhum dispositivo foi isolado e se o LED AUX estiver aceso, desligue o nó e removapainel de informações do operador. Ligue o servidor pela comutação do bloco decomutador 3 (SW3) bit 6. Reinicie o servidor. Reinicialize o servidor. Se o problema foiresolvido, substitua o painel de informações do operador; caso contrário, reinstale o painelde informações do operador. Em qualquer caso, comute o bloco de comutador 3 (SW3) bit6 de volta à sua posição original.

8. Se nenhum dispositivo com falha for isolado, substitua a placa-mãe.

LOG Ocorreu um erro. Conecte um teclado e um monitor. Verifique o logo de evento do sistemaIMM e o log de evento do sistema para obter informações sobre o erro. Substitua quaisquercomponentes identificados nos logs de evento.

LINK Esse LED não é usado no SAN Volume Controller 2145-CF8. Substitua a placa-mãe.

Capítulo 11. Usando os procedimentos de análise de manutenção 369

Page 388: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 80. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

PS Fonte de alimentação 1 ou fonte de alimentação 2 falhou. Conclua as ações a seguir pararesolver o problema:

1. Verifique a fonte de alimentação que possui um LED âmbar aceso.

2. Certifique-se de que as fontes de alimentação estejam completamente encaixadas.

3. Remova uma fonte de energia para isolar a fonte de alimentação com falha.

4. Substitua a fonte de alimentação defeituosa.

PCI Ocorreu um erro em um barramento PCI ou na placa-mãe. Outro LED está aceso próximo aum slot PCI com falha. Conclua as ações a seguir para resolver o problema:

1. Identifique o adaptador com defeito verificando os LEDs nos slots PCI.

2. Se o LED do slot PCI 1 estiver aceso, substitua o conjunto de adaptadores Fibre Channelcom quatro portas.

3. Se o LED do slot PCI 2 estiver aceso, substitua o conjunto de adaptadores SAS de altavelocidade.

4. Se o erro não for resolvido, substitua a placa-mãe.

SP Um erro do processador de serviço foi detectado. Conclua as ações a seguir para resolver oproblema:

1. Remova a energia do nó. Reconecte o servidor à energia e reinicie o nó.

2. Se o problema permanecer, substitua a placa-mãe.

FAN Um ventilador está com falha, está funcionando muito lentamente ou foi removido. Umventilador com falha também pode fazer com que o LED de TEMP seja aceso. Conclua asações a seguir para resolver o problema:

1. Reposicione o ventilador com falha, que é indicado por um LED aceso perto do conectordo ventilador na placa-mãe.

2. Se o problema persistir, substitua o ventilador com defeito.

TEMP A temperatura do sistema excedeu o nível limite. Um ventilador com falha pode fazer comque o LED TEMP se acenda. Conclua as ações a seguir para resolver o problema:

1. Certifique-se de que o dissipador de calor esteja corretamente ajustado.

2. Determine se um ventilador falhou. Em caso positivo, substitua-o.

3. Verifique se a temperatura ambiente está dentro das especificações de operação normais.

4. Certifique-se de que o fluxo de ar dentro e ao redor do SAN Volume Controller 2145-CF8não esteja obstruído.

MEM Uma configuração de memória ou um erro de memória que não é válido. Tanto o LED deMEM e quanto o LED de CNFG podem estar acesos. Conclua as ações a seguir para resolver oproblema:

1. Verifique se todas as DIMMs de memória estão instaladas corretamente.

2. Se os LEDs de erro de memória estiverem acesos, substitua o módulo de memóriaindicado.

3. Se o LED de MEM e o LED de CNFG estiverem acesos, ajuste a memória para que os slots2, 3, 5, 6, 7 e 8 da DIMM sejam os únicos usados.

NMI Uma interrupção não mascarada ocorreu ou o botão NMI foi pressionado. Esta situaçãonormalmente não ocorre. Se o botão NMI no painel de diagnósticos por indicadores luminososfoi pressionado por engano, reinicie o nó. Caso contrário, ligue para o seu centro de suporte.

370 SAN Volume Controller: Guia de Resolução de Problemas

Page 389: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 80. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

CNFG Ocorreu um erro de configuração de hardware. Se o LED de MEM também estiver aceso, sigaas ações que são mostradas para o LED de MEM. Se o LED da CPU LED estiver aceso,verifique se o microprocessador está instalado na CPU 2. Se uma CPU estiver instalada,remova-a.. A configuração não é suportada. Se nenhum outro LED de indicadores luminososestiver aceso, substitua as unidades substituíveis em campo na ordem que é mostrada até queo problema seja resolvido:

1. Painel de informações do operador

2. Cabo do Painel de informações do operador

3. Placa-mãe

CPU Um microprocessador que está com falha ou uma configuração de microprocessador não éválido. Tanto o LED da CPU quanto o LED de CNFG podem ser acesos. Complete as seguintesações:

1. Verifique os LEDs de erro da placa-mãe.

2. Se o LED de erro da CPU 1 estiver aceso, verifique se o microprocessador está instaladocorretamente.

3. Se o erro persistir, substitua o microprocessador.

4. Se o erro persistir, substitua a placa-mãe.

VRM (módulo doregulador devoltagem)

Esse LED não é usado no SAN Volume Controller 2145-CF8.

DASD (dispositivode armazenamentode acesso direto)

Uma unidade de disco que está com falha ou está ausente. Um SAN Volume Controller2145-CF8 deve ter sua unidade de disco rígido do sistema que está instalada no slot daunidade 4. Até quatro unidades flash podem ser instalados nos slots de unidade de 0 a 3.

Se um Unidade flash estiver deliberadamente removido de um slot, o LED de erro do sistemae o contorno claro do LED do painel de diagnósticos do dispositivo de armazenamento deacesso direto. O erro será mantido mesmo se o Unidade flash for substituído em um slotdiferente. Se um Unidade flash for removido ou movido, limpe o erro concluindo esteprocedimento:

1. Desligue o nó usando o MAP 5350.

2. Remova ambos os cabos de energia.

3. Substitua ambos os cabos de energia.

4. Reinicie o nó.

Resolva quaisquer erros do nó ou do sistema que se relacionam ao unidades flash ou aunidade de disco do sistema.

Se um erro ainda for mostrado, desligue o nó e recoloque todas as unidades.

Se o erro continuar, substitua os seguintes componentes na ordem listada:

1. A unidade de disco do sistema

2. O painel traseiro da unidade de disco

RAID Esse LED não é usado no SAN Volume Controller 2145-CF8.

Capítulo 11. Usando os procedimentos de análise de manutenção 371

Page 390: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Tabela 80. Ações prescritas do LED do painel de diagnósticos (continuação)

LED do painel dediagnóstico Ação

BRD Ocorreu um erro na placa-mãe. Conclua as ações a seguir para resolver o problema:

1. Verifique os LEDs na placa-mãe para identificar o componente que causou o erro. O LEDde BRD pode ser aceso por causa de qualquer uma das seguintes razões:

v Bateria

v Faltando o conjunto da placa riser PCI. Deve haver uma placa riser no slot PCI 2, mesmoque outro adaptador não esteja presente.

v Falha no regulador de voltagem

2. Substitua quaisquer componentes de substituição com falha ou ausentes, tal como a bateriaou o conjunto da placa riser PCI.

3. Se um regulador de voltagem falhar, substitua a placa-mãe.

3. Continue com “MAP 5700: Verificação de reparo” na página 349 para verificar aoperação correta.

MAP 5900: Inicialização de hardwareMAP 5900: A inicialização de hardware ajuda a resolver problemas que estãoimpedindo o nó de iniciar sua sequência de inicialização.

Antes de Iniciar

Nota: Use a interface gráfica com o usuário do assistente de serviço se não houvertela no painel frontal, por exemplo no SAN Volume Controller 2145-DH8.

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Este procedimento de análise de manutenção se aplica a todos os modelos do SANVolume Controller. No entanto, alguns modelos não possuem uma exibição depainel frontal; use a GUI do assistente de serviço se o nó não tiver uma exibiçãodo painel frontal. Assegure-se de que você saiba qual modelo estará sendo usadoantes de iniciar esse procedimento. Para determinar com qual modelo você estátrabalhando, procure a etiqueta que identifica o tipo de modelo na frente do nó.

Você pode ter sido trazido até aqui por uma das razões a seguir:v A tela de inicialização de hardware, mostrada no Figura 95, é exibida

continuamente.

v A tela de resgate do nó, mostrada no Figura 96 na página 373, é exibidacontinuamente.

Figura 95. Exibição de Inicialização de Hardware

372 SAN Volume Controller: Guia de Resolução de Problemas

Page 391: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v O progresso da inicialização é interrompido e um erro é exibido no painelfrontal

v Outro MAP trouxe você até aquiv O LED de status do nó, LED de falha do nó e LED de status da bateria

permaneceram desligados

Sobre Esta Tarefa

Execute as etapas a seguir para permitir que o nó para inicie sua sequência deinicialização:

Procedimento1. O LED de Erro no painel de informações do operadorestá aceso ou piscando?

NÃO Vá para a etapa 2.

SIM Acesse “MAP 5800: indicadores luminosos” na página 350 para resolvero problema.

2. (Na etapa 1)Se você tiver acabado de instalar o nó do SAN Volume Controller ou queacabou de substituir uma unidade substituível de campo (FRU) dentro do nó,execute as seguintes etapas:

a. Identifique e rotule todos os cabos conectados ao nó para que possam serrecolocados na mesma porta. Remova o nó do rack e coloque-o em umasuperfície plana e antiestática. Consulte o Removendo o nó de uma informaçãodo rack para descobrir como executar o procedimento.

b. Remova a tampa superior. Consulte a informação “Removendo a tampasuperior” para descobrir como executar o procedimento.

c. Se você acabou de substituir uma FRU, assegure-se de que a FRU estejaposicionada corretamente e de que todas as conexões com a FRU estejamseguras.

d. Assegure-se de que todos os módulos de memória estejam corretamenteinstalados e que as travas estejam totalmente fechadas. Consulte ainformação Substituindo os módulos de memória (DIMM) para descobrir comoexecutar o procedimento.

e. Assegure-se que os adaptadores Fibre Channel estejam corretamenteinstalados. Consulte a informação Substituindo o conjunto de adaptadores FibreChannel para descobrir como executar o procedimento.

f. Assegure-se de que a unidade de disco e seus conectores estejamcorretamente instalados. Consulte a informação Substituindo a unidade de discopara descobrir como executar o procedimento.

g. Assegure-se de que o controlador de serviço esteja instalado corretamente.Consulte a informação Substituindo o controlador de serviço para descobrircomo executar o procedimento.

h. Substitua a tampa superior. Consulte a informação Substituindo a tampasuperior para descobrir como executar o procedimento.

Figura 96. Exibição de Resgate do Nó

Capítulo 11. Usando os procedimentos de análise de manutenção 373

Page 392: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

i. Coloque o nó no rack. Consulte a informação Substituindo o nó em um rackpara descobrir como executar o procedimento.

j. Ligue o nó.A operação de inicialização ainda é interrompida?

NÃO Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Vá para a etapa 3.3. (na etapa 2 na página 373)

Verifique se o sistema BIOS está relatando quaisquer erros. Você deve conectarum monitor VGA e um teclado USB para ver a saída de BIOS. O cliente deveser capaz de fornecer um monitor e um teclado adequado.a. Desligue o nó enquanto assegura que seus dados estejam espelhados e

sincronizados.Consulte “MAP 5350: Desligando um nó” na página 328.b. Conecte o teclado ▌1▐ e o monitor ▌2▐. Figura 97 mostra o local das portas

de teclado e de monitor no 2145-CF8. Figura 98 mostra o local das portas deteclado e de monitor no 2145-CG8. Conecte à porta VGA e uma porta USBna frente ou na traseira de um 2145-DH8.

2

svc005

72

1

Figura 97. Portas do Teclado e do Monitor no SAN Volume Controller 2145-CF8

svc00723

2

1

Figura 98. Portas do Teclado e do Monitor no SAN Volume Controller 2145-CG8

374 SAN Volume Controller: Guia de Resolução de Problemas

Page 393: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

c. Ligue o nó.d. Olhe a tela VGA.v Se a sequência do autoteste indicar um erro ou se o programa

Configuration/Setup Utility do sistema BIOS indicar um erro durante ainicialização, você precisará resolver o erro.

v Se isso indicar um erro com um item de hardware específico, desligue onó e remova-o do rack. Assegure-se que o item especificado esteja

SAN Volume Controller

1 3 4 5 6 7 8

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

aaaa

+ -2

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaa

+ -1

1 2 3 4

2

4 5

1

2

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

10

3

svc00800

6

12

+--

7

8

9

11

6

▌3▐ Portas USB 1 e 2

▌4▐ Porta de vídeo

Figura 99. Portas do teclado e do monitor no SAN Volume Controller 2145-DH8, frontal

1

2

3

4

5

6

svc00859

1 11122 3 4 678910

5

13

▌7▐ Porta USB 6

▌8▐ Porta USB 5

▌9▐ Porta USB 4

▌10▐ Portas USB 3

▌11▐ Porta serial

▌12▐ Porta de vídeo

Figura 100. Portas do teclado e do monitor no SAN Volume Controller 2145-DH8, traseira

Capítulo 11. Usando os procedimentos de análise de manutenção 375

Page 394: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

instalado corretamente, substitua o nó no rack e, em seguida, reinicie onó. Se o erro ainda for relatado, substitua o item especificado.

v Se um erro de configuração for relatado, execute a opção do programaConfiguration/Setup Utility para reconfigurar o sistema BIOS para suasconfigurações (de fábrica) padrão.

v Se nenhuma imagem de inicialização puder ser encontrada no nódo2145-DH8, contate o suporte técnico Remoto IBM para ajuda, que podechegar a instalar o software a partir de uma unidade flash USB.

e. Desligue o nó e remova o teclado e o monitor.f. Ligue o nó.

A operação de inicialização ainda é interrompida?

NÃO Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Vá para a etapa 4.4. (na etapa 3 na página 374)

a. Desligue o nó enquanto assegura que seus dados estejam espelhados esincronizados.Consulte “MAP 5350: Desligando um nó” na página 328.

b. Identifique e rotule todos os cabos conectados ao nó para que possam serrecolocados na mesma porta. Remova o nó do rack e coloque-o em umasuperfície plana e antiestática. Consulte o Removendo o nó de uma informaçãodo rack para descobrir como executar o procedimento.

c. Remova a tampa superior. Consulte a informação Removendo a tampa superiorpara descobrir como executar o procedimento.

d. Remova alguns dos módulos de memória:v No SAN Volume Controller 2145-DH8, remova os módulos de memória

nos slots 1, 4, 9 e 12, além dos slots 13, 16, 21 e 24 se houver um segundomicroprocessador ajustado.

e. Remova todos os adaptadores instalados.f. Remova a unidade de disco, a menos que seja um 2145-DH8, que pode

somente ser inicializado a partir de unidades de inicialização.g. Substitua a tampa superior. Consulte a informação Substituindo a tampa

superior para descobrir como executar o procedimento.h. Coloque o nó no rack. Consulte a informação Substituindo o nó em um rack

para descobrir como executar o procedimento.i. Ligue o nó.

5. A operação de inicialização ainda é interrompida com a exibição deinicialização (executa a ação NO) ou possui a operação de inicializaçãoavançada (executa a ação YES)?

Nota: Com as unidades substituíveis em campo removidas, a inicialização seráinterrompida com um código de falha de inicialização diferente.

NÃO Acesse a etapa 6 para substituir as unidades substituíveis em campo,uma de cada vez, até que a unidade substituível em campo com falhaseja isolada.

SIM Acesse a etapa 7 na página 3776. (Na etapa 5)

Remova todo o hardware, exceto o hardware que é necessário para ligar.Continue a incluir nas unidades substituíveis em campo um por vez e liguetoda vez até que a falha original seja introduzida.

376 SAN Volume Controller: Guia de Resolução de Problemas

Page 395: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

A operação de inicialização ainda é interrompida?

NÃO Verifique o reparo continuando com o “MAP 5700: Verificação dereparo” na página 349.

SIM Vá para a etapa 7.7. (nas etapas 4 na página 376 e 6 na página 376)

a. Desligue o nó. Consulte “MAP 5350: Desligando um nó” na página 328 paraobter informações adicionais.

b. Identifique e rotule todos os cabos conectados ao nó para que possam serrecolocados na mesma porta. Remova o nó do rack e coloque-o em umasuperfície plana e antiestática. Consulte a informação Removendo o nó em umrack para descobrir como executar o procedimento.

c. Remova a tampa superior. Consulte a informação Removendo a tampa superiorpara descobrir como executar o procedimento.

d. Substitua o adaptador e a unidade de disco.e. Substitua os módulos de memória:v No SAN Volume Controller 2145-DH8, remova os módulos de memória

nos slots 1, 4, 9 e 12, além dos slots 13, 16, 21 e 24 se houver um segundomicroprocessador ajustado.

f. Substitua a tampa superior. Consulte a informação Substituindo a tampasuperior para descobrir como executar o procedimento.

g. Coloque o nó no rack. Consulte a informação Substituindo o nó em um rackpara descobrir como executar o procedimento.

h. Ligue o nó.A operação de inicialização ainda está pendente na tela de inicialização(execute a ação NO) ou a tela progrediu além da tela inicial de inicializaçãoavançado (execute a ação YES)?

NÃO Trocar os módulos de memória com falha por novas unidadessubstituíveis em campo e verificar o reparo continuando com “MAP5700: Verificação de reparo” na página 349.

SIM Substitua as peças na seguinte sequência:v Para o SAN Volume Controller 2145-CG8 ou 2145-CF8:

a. Controlador de serviçob. Placa-mãe

Verifique o reparo continuando com o “MAP 5700: Verificação de reparo” napágina 349.

MAP 6000: Substitua a SSD offlineMAP 6000: Esse procedimento substitui um unidade flash que falhou enquantoainda era um membro de um conjunto de armazenamentos.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Este mapa se aplica aos modelos com unidades flash internas. Assegure-se de quevocê saiba qual modelo estará sendo usado antes de iniciar esse procedimento.Para determinar com qual modelo você está trabalhando, procure o rótulo que

Capítulo 11. Usando os procedimentos de análise de manutenção 377

Page 396: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

identifica o tipo de modelo na frente do nó.

Sobre Esta Tarefa

Use este MAP para determinar quais MAPs detalhados serão usados parasubstituir uma SSD offline.

Atenção: Se a propriedade use da unidade for member e a unidade precisar sersubstituída, entre em contato com o suporte IBM antes de realizar qualquer ação.

Procedimento

Você está usando uma SSD em uma matriz RAID 0 e usando espelhamento devolume para fornecer redundância?

Sim Acesse “MAP 6001: Substitua a SSD offline em uma matriz RAID 0”.

Não Acesse “MAP 6002: Substitua a unidade de estado sólido offline na matrizRAID 1 ou na matriz RAID 10” na página 380.

MAP 6001: Substitua a SSD offline em uma matriz RAID 0MAP 6001: Esse procedimento substitui um unidade flash que falhou enquantoainda é um membro de um conjunto de armazenamento.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Este mapa se aplica aos modelos com unidades flash internas. Assegure-se de quevocê saiba qual modelo estará sendo usado antes de iniciar esse procedimento.Para determinar com qual modelo você está trabalhando, procure o rótulo queidentifica o tipo de modelo na frente do nó.

Atenção:

1. Faça backup da sua configuração do SAN Volume Controller antes de começarestas etapas.

2. Se a propriedade use da unidade for member e a unidade precisar sersubstituída, entre em contato com o suporte IBM antes de realizar qualqueração.

Sobre Esta Tarefa

Execute as etapas a seguir apenas se uma unidade em uma matriz RAID 0(dividida) falhou:

Procedimento1. Registre as propriedades de todas as cópias de volumes, MDisks e os

conjuntos de armazenamentos que são dependentes na unidade que falhou.a. Identifique o ID de unidade e o número de sequência de erro com o

status igual a offline e use igual a failed usando o comando da CLIlsdrive.

b. Revise o motivo offline usando o comando da CLI lsevent <seq_no>.

378 SAN Volume Controller: Guia de Resolução de Problemas

Page 397: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

c. Obtenha informações detalhadas sobre a unidade ou unidades offlineusando o comando da CLI lsdrive <drive_id>.

d. Registre o mdisk_id, mdisk_name, node_id, node_name e slot_id para cadaunidade offline.

e. Obtenha os conjuntos de armazenamentos das unidades com falha usandoo comando da CLI lsmdisk <mdisk_id> para cada MDisk que foiidentificado na subetapa 1c.Continue com as etapas a seguir, substituindo todas as unidades com falhaem um dos conjuntos de armazenamento. Anote o nó, slot e o ID dasunidades selecionadas.

f. Determine todos os discos gerenciados no conjunto de armazenamentousando o comando da CLI lsmdisk -filtervalue mdisk_grp_id=<grp id>.

g. Identifique quais MDisks são internos (ctrl_type igual a 4) e quais contêmSSDs (ctrl_type igual a 6).

h. Localize os volumes com extensões no conjunto de armazenamentosusando o comando da CLI lsmdiskmember <mdisk_id> para cada discogerenciado localizado na subetapa 1f.É provável que os mesmos volumes serão retornados para cada MDisk.

i. Registre todas as propriedades em cada volume listado na etapa 1h usandoo comando da CLI lsvdisk <vdisk_id>. Para cada verificação de volume,se existirem cópias de volume online, indicam que ele é espelhado. Useestas informações na etapa 9 na página 380.

j. Obtenha uma lista de todas as unidades em cada MDisk interno noconjunto de armazenamentos usando o comando da CLI lsdrive-filtervalue mdisk_id=<mdisk_id>. Use estas informações na etapa 8 napágina 380.

k. Registre todas as propriedades do conjunto de armazenamento usando ocomando da CLI lsmdisk <mdisk_id>. Use estas informações na etapa 8 napágina 380.

l. Registre todas as propriedades do conjunto de armazenamentos usando ocomando da CLI lsmdisk <mdisk_id>. Use estas informações na etapa 7 napágina 380.

Nota: Se um volume listado tiver uma cópia espelhada, online e emsincronização, será possível recuperar os dados do volume copiados a partirda cópia. Todos os dados nos volumes não espelhados serão perdidos eprecisarão ser restaurados a partir do backup.

2. Exclua o conjunto de armazenamentos usando o comando da CLI rmmdiskgrp-force <mdiskgrp id>.Todos os MDisks e as cópias de volume no conjunto de armazenamentostambém são excluídos. Se qualquer uma das cópias de volume foram asúltimas cópias de sincronização de um volume, todas as cópias que não estãoem sincronização também são excluídas, mesmo se elas não estiverem noconjunto de armazenamentos.

3. Usando o ID de unidade que você gravou na subetapa 1e, configure apropriedade use da unidade para unused usando o comando chdrive.chdrive -use unused <id of offline drive>

A unidade é removida da lista de unidades.4. Siga as instruções físicas para substituir ou remover uma unidade. Consulte o

“Substituindo uma documentação do SAN Volume Controller 2145-CG8unidade flash” ou “Removendo uma documentação do SAN VolumeController 2145-CG8 unidade flash” para descobrir como executar osprocedimentos.

5. Um objeto de unidade novo é criado com o atributo use configurado paraunused. Esta ação pode levar vários minutos.

Capítulo 11. Usando os procedimentos de análise de manutenção 379

Page 398: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Obtenha o ID da nova unidade usando o comando da CLI lsdrive.6. Altere a propriedade use para a nova unidade para candidate.

chdrive -use candidate <drive id of new drive>

7. Crie um novo conjunto de armazenamento com as mesmas propriedades queo conjunto de armazenamentos excluído. Use as propriedades que vocêregistrou na subetapa 1l.mkmdiskgrp -name <mdiskgrp name as before> -ext <extent size as before>

8. Crie novamente todos os MDisks que estavam anteriormente no conjunto dearmazenamentos usando as informações das etapas 1j e 1k.v Para MDisks internos RAID 0, use este comando:

mkarray -level raid0 -drive <list of drive IDs> -name<mdisk_name> <mdiskgrp id or name>

em que -name <mdisk_name> é opcional, mas é possível usar o parâmetropara fazer a nova matriz ter o mesmo nome de disco gerenciado conforme amatriz antiga.

v Para discos gerenciados externos, use o comando da CLI addmdisk.v Para MDisks que não são RAID 0, use o comando da CLI mkarray.

9. Para todos os volumes que tinham cópias online, em sincronização, e devolume espelhado antes do MDisk ser excluído, inclua uma cópia de volumenova no novo conjunto de armazenamentos para restaurar a redundânciausando o seguinte comando:addvdiskcopy -mdiskgrp <mdiskgrp id> -vtype striped -easytier<on or off as before> <vdisk_id>

10. Para quaisquer volumes que não tinham uma cópia espelhada online e emsincronização, crie o volume novamente e restaure os dados a partir dobackup ou use outros métodos.

11. Marque o erro da unidade como fixo usando o número de sequência de erroda etapa 1b.cherrstate -sequencenumber <error_sequence_number>

MAP 6002: Substitua a unidade de estado sólido offline namatriz RAID 1 ou na matriz RAID 10

MAP 6002: Esse procedimento substitui um unidade flash que falhou enquantoainda é um membro de um conjunto de armazenamento.

Antes de Iniciar

Se você não estiver familiarizado com esses procedimentos de análise demanutenção (MAPs), primeiro leia o Capítulo 11, “Usando os procedimentos deanálise de manutenção”, na página 299.

Este mapa se aplica aos modelos com unidades flash internas. Assegure-se de quevocê saiba qual modelo estará sendo usado antes de iniciar esse procedimento.Para determinar com qual modelo você está trabalhando, procure o rótulo queidentifica o tipo de modelo na frente do nó.

380 SAN Volume Controller: Guia de Resolução de Problemas

Page 399: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Atenção:

1. Faça backup da sua configuração do SAN Volume Controller antes de começarestas etapas.

2. Se a propriedade use da unidade for member e a unidade precisar sersubstituída, entre em contato com o suporte IBM antes de realizar qualqueração.

Sobre Esta Tarefa

Execute as seguintes etapas se uma unidade falhar em uma matriz RAID 1 ouRAID 10:

Procedimento1. Certifique-se de que a propriedade use da unidade não é member.

Use o comando da CLI lsdrive para determinar o uso.2. Registre os valores de propriedade da unidade do node ID e o slot ID para uso

na etapa 4. Estes valores identificam qual unidade física deve ser removida.3. Registre o número de sequência de erros para usar na etapa 11.4. Use o ID da unidade que você registrou na etapa 2 para configurar a

propriedade do atributo use da unidade para unused com o comando chdrive.chdrive -use failed <id of offline drive>chdrive -use unused <id of offline drive>

A unidade é removida da lista de unidades.5. Siga as instruções físicas para substituir ou remover uma unidade. Consulte o

“Substituindo uma documentação do SAN Volume Controller 2145-CG8unidade flash” ou “Removendo uma documentação do SAN VolumeController 2145-CG8 unidade flash” para descobrir como executar osprocedimentos.

6. Um novo objeto de unidade é criado com o conjunto de propriedades de usoconfigurado como unused.

7. Altere a propriedade use da unidade para candidate.chdrive -use candidate <id of new drive>

8. Altere a propriedade use da unidade para spare.chdrive -use spare <id of new drive>

v Se estiver usando unidades sobressalentes, execute uma troca de membro.Mova dados do sobressalente para o novo dispositivo inserido.

v Se você não tiver um sobressalente, quando marcar o objeto da unidadecomo spare, a matriz inicia a construção no dispositivo inseridorecentemente.

9. Se o sobressalente não for uma correspondência perfeita para a unidadesubstituída, a matriz será considerada desequilibrada, e o código de erro 1692será registrado no log de erros.

10. Siga o procedimento de correção para concluir o procedimento.11. Marque o erro da unidade como corrigido usando o número de sequência de

erro a partir da etapa 3.cherrstate -sequencenumber <error_sequence_number>

Capítulo 11. Usando os procedimentos de análise de manutenção 381

Page 400: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

382 SAN Volume Controller: Guia de Resolução de Problemas

Page 401: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Capítulo 12. Análise e ajuste de desempenho iSCSI

Este procedimento fornece uma solução para problemas de desempenho de hostInternet Small Computer Systems Interface (iSCSI) enquanto conectado a umsistema SAN Volume Controller e sua conectividade com a comutação de rede.

Sobre Esta Tarefa

Alguns dos atributos e parâmetros de host que podem afetar o desempenho iSCSI:v ACK Atrasado do Protocolo de Controle de Transmissões (TCP)v Quadro gigante Ethernetv Gargalo ou alocação excessiva de redev Equilíbrio de login de sessão iSCSIv Configuração de Priority Flow Control (PFC) e alocação da largura da banda

para iSCSI na rede

Procedimento1. Desative o recurso de confirmação atrasado de TCP.

Para desativar este recurso, consulte a documentação do SO/da plataforma.v VMWare: http://kb.vmware.com/selfservice/microsites/microsite.dov Windows: http://support.microsoft.com/kb/823764A assinatura primária deste problema: o desempenho de leitura ésignificativamente inferior ao desempenho de gravação. A confirmação atrasadado Protocolo de Controle de Transmissões (TCP) é uma técnica usada poralgumas implementações do TCP em um esforço para melhorar o desempenhoda rede. Entretanto, neste cenário onde o número de E/S pendente é 1, atécnica pode reduzir significativamente o desempenho de E/S.Em essência, diversas respostas do ACK podem ser combinadas em uma únicaresposta, reduzindo a sobrecarga do protocolo. Conforme descrito na RFC 1122,um host pode atrasar o envio de uma resposta do ACK em até 500 ms. Alémdisso, com um fluxo de segmentos recebidos de tamanho integral, as respostasdo ACK devem ser enviadas para cada segundo segmento.

Importante: O host deve ser reinicializado para que estas configuraçõestenham efeito. Algumas plataformas (por exemplo, distribuições Linux padrão)não fornecem uma maneira de desativar este recurso. No entanto, o problemafoi resolvido com a liberação da versão 7.1 e nenhuma mudança deconfiguração do host é necessária para gerenciar o comportamento doTcpDelayedAck.

2. Ative o quadro gigante para iSCSI.Quadros gigantes são quadros Ethernet com um tamanho superior a 1500 bytes.O parâmetro de unidade máxima de transmissão (MTU) é usado para medir otamanho dos quadros gigantes.O SAN Volume Controller suporta MTU de 9000 bytes. Consulte o comando daCLI cfgportip para ativar o quadro gigante. Esse comando é disruptivo umavez que o link é invertido e a operação de E/S por meio dessa porta pausa.A rede deve suportar quadros gigantes de ponta a ponta para ser efetivo;verifique isto ao enviar um pacote de ping a ser entreguem sem fragmentação.Por exemplo:

© Copyright IBM Corp. 2003, 2016 383

Page 402: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Windows:ping -t <iscsi target ip> -S <iscsi initiator ip> -f -l <new mtu size - packet overhead (usually 36, might differ)>

O comando a seguir é um exemplo de um comando usado para verificar seuma MTU de 9000 bytes está configurada corretamente em um sistemaWindows 7:ping -t -S 192.168.1.117 192.168.1.217 -f -l 8964

A saída a seguir é um exemplo de uma resposta bem-sucedida:192.168.1.217: bytes=8964 time=1ms TTL=52

v Linux:ping -l <source iscsi initatior ip> -s <new mtu size> -M do <iscsi target ip>

v ESXi:ping <iscsi target ip> -I <source iscsi initiator ip> -s <new mtu size - 28> -d

3. Verifique a estatística da porta do comutador em que as portas doinicializador/de destino estão conectadas para garantir que os descartes dopacote não sejam altos.Revise a arquitetura de rede para evitar quaisquer gargalos e alocaçõesexcessivas. A rede precisa ser equilibrada para evitar qualquer descarte depacote; o descarte de pacote reduz significativamente o desempenho doarmazenamento. Envolva o suporte de rede para corrigir quaisquer problemas.

4. Otimize e utilize todas as portas iSCSI.Para otimizar a utilização de recurso do SAN Volume Controller, todas asportas iSCSI devem ser usadas.v Cada porta é designada a uma CPU, e o equilibrar o login, é possível

maximizar a utilização da CPU e alcançar melhor desempenho. Idealmente,configure as sub-redes de maneira igual ao número de portas iSCSI no nóSAN Volume Controller. Configure cada porta de um nó com um IP em umasub-rede diferente e mantenha-a igual para outros nós. O exemplo a seguirexibe uma configuração ideal:

Node 1Port 1: 192.168.1.11Port 2: 192.168.2.21Port 3: 192.168.3.31

Node 2:Port 1: 192.168.1.12Port 2: 192.168.2.22Port 3: 192.168.3.33

v Evite situações nas quais 50 hosts efetuam login na porta 1 e somente cincohosts efetuam login na porta 2.

v Use a criação de sub-redes apropriada para alcançar um equilíbrio entre onúmero de sessões e a redundância.

5. Solucione problemas com configurações de PFC.Não é necessário ativar o PFC no sistema SAN Volume Controller. O SANVolume Controller lê o pacote data center bridging exchange (DCBx) e ativa oPFC para iSCSI automaticamente se estiver ativado no comutador. Na saída decomando lsportip, os campos lossless_iscsi e lossless_iscsi6 mostram[on/off] dependendo se o PFC estiver ativado ou não para iSCSI no sistema.Se os campos lossless_iscsi e lossless_iscsi6 estiverem mostrando off, issopode ser devido a uma das razões a seguir:a. A VLAN não está configurada para esse IP. Faça as verificações a seguir:

384 SAN Volume Controller: Guia de Resolução de Problemas

Page 403: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

v Para o tipo de endereço IP IPv4, verifique o campo vlan na saídalsportip. Ele não deve estar em branco.

v Para o tipo de endereço IP IPv6, verifique o campo vlan_6 na saídalsportip. Ele não deve estar em branco.

v Se os campos vlan e vlan_6 estiverem em branco, configure a VLANpara o tipo de IP usando Configurando a VLAN para iSCSI.

b. O sinalizador do host não está configurado para esse IP. Faça as verificaçõesa seguir:v Para o tipo de endereço IP IPv4, verifique o campo host na saída

lsportip. Ele deve ser yes.v Para o tipo de endereço IP IPv6, verifique o campo host_6 na saída

lsportip. Ele deve ser yes.v Se os campos host e host_6 não forem yes, configure o sinalizador do

host para o tipo de IP usando o comando da CLI cfgportip.c. O PFC não está configurado corretamente no comutador.

Se a VLAN estiver configurada corretamente e o sinalizador do hosttambém estiver configurado, mas o campo lossless_iscsi oulossless_iscsi6 ainda estiver mostrando off, algumas configurações docomutador podem estar ausentes ou incorretas.Verifique as configurações a seguir no comutador:v A tag de prioridade está configurada para o tráfego iSCSI.v O PFC está ativado para a tag de prioridade que é designada ao iSCSI

CoS.v O DCBx está ativado no comutador.Verifique também a documentação apropriada:v Consulte a documentação para ativar o PFC em seu comutador específico.v Consulte a documentação para ativar o PFC nos hosts Red Hat Enterprise

Linux (RHEL) e Windows específicos para a sua configuração.6. Assegure-se de que a largura da banda adequada seja fornecida ao iSCSI na

rede.É possível dividir a largura da banda entre os vários tipos de tráfego. Éimportante designar a largura da banda adequada para um bom desempenho.Para designar a largura da banda para tráfego iSCSI, é necessário primeiroativar o controle de fluxo de prioridade para iSCSI.

Capítulo 12. Análise e ajuste de desempenho iSCSI 385

Page 404: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

386 SAN Volume Controller: Guia de Resolução de Problemas

Page 405: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Apêndice A. Recursos de Acessibilidade do SAN VolumeController

Os recursos de acessibilidade ajudam os usuários que apresentam algumadeficiência, como mobilidade restrita ou visão limitada, a usar os produtos detecnologia da informação com êxito.

Recursos de Acessibilidade

Esses são os principais recursos de acessibilidade para o SAN Volume Controller:v É possível utilizar o software de leitor de tela e um sintetizador de voz digital

para ouvir o que é exibido na tela. Documentos HTML foram testados usando oJAWS versão 15.0.

v Este produto usa as chaves de navegação do Windows padrão.v As interfaces são geralmente usadas por leitores de tela.v As chaves podem ser discernidas por toque, mas não são ativadas apenas pelo

toque.v Dispositivos, portas e conectores padrão de mercado.v Você pode conectar dispositivos alternativos de entrada e saída.

A documentação online SAN Volume Controller e suas publicações relacionadassão ativadas para acessibilidade. Os recursos de acessibilidade da documentaçãoonline estão descritos em Visualizando Informações no Centro de Informações.

Navegação pelo Teclado

É possível usar teclas ou combinações de teclas para executar operações e iniciarações de menu que também podem ser realizadas por meio de ações do mouse. Épossível navegar pela documentação online do SAN Volume Controller a partir doteclado usando as teclas de atalho de seu navegador ou software de leitor de tela.Consulte a Ajuda do seu navegador ou software de leitor de tela para obter umalista de teclas de atalho suportadas.

IBM e Acessibilidade

Consulte o IBM Human Ability and Accessibility Center para saber mais sobre ocompromisso da IBM com a acessibilidade.

© Copyright IBM Corp. 2003, 2016 387

Page 406: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

388 SAN Volume Controller: Guia de Resolução de Problemas

Page 407: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Apêndice B. Onde localizar a Declaração de Garantia Limitada

A Declaração de Garantia Limitada está disponível no formato de cópia impressa eno centro de informações do SAN Volume Controller.

A Declaração de Garantia Limitada é enviada (na formato de cópia impressa) comseu produto. Ela também pode ser solicitada junto à IBM (consulte Tabela 2 napágina xii para obter o número de peça).

© Copyright IBM Corp. 2003, 2016 389

Page 408: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

390 SAN Volume Controller: Guia de Resolução de Problemas

Page 409: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Avisos

Estas informações foram desenvolvidas para produtos e serviços oferecidos nosEUA. Este material pode estar disponível na IBM em outros idiomas. No entanto,pode ser necessário possuir uma cópia do produto ou da versão do produto nesseidioma a fim de acessá-lo.

A IBM pode não oferecer os produtos, serviços ou recursos mencionados nestedocumento em outros países. Consulte um representante IBM local para obterinformações sobre produtos e serviços disponíveis atualmente em sua área.Qualquer referência a produtos, programas ou serviços IBM não significa queapenas produtos, programas ou serviços IBM possam ser utilizados. Qualquerproduto, programa ou serviço funcionalmente equivalente, que não infrinjanenhum direito de propriedade intelectual da IBM, poderá ser utilizado emsubstituição a este produto, programa ou serviço. No entanto, a avaliação everificação da operação de qualquer produto, programa, ou serviço não IBM sãode inteira responsabilidade do usuário.

A IBM pode ter patentes ou solicitações de patentes pendentes relativas a assuntostratados nesta publicação. O fornecimento desta publicação não garante ao Clientenenhum direito sobre tais patentes. Pedidos de licenças devem ser enviados, porescrito, para:

Gerência de Relações Comerciais e Industriais daIBM BrasilAv. Pasteur, 138-146BotafogoRio de Janeiro, RJCEP 22290-240

Para consulta sobre licença relacionada às informações de DBCS (Conjunto deCaracteres de Byte Duplo), entre em contato com o Departamento de PropriedadeIntelectual da IBM em seu país ou envie pedidos de licença, por escrito, para:

Intellectual Property LicensingLegal and Intellectual Property LawIBM Japan, Ltd.19-21, Nihonbashi-Hakozakicho, Chuo-kuTokyo 103-8510, Japan

A INTERNATIONAL BUSINESS MACHINES CORPORATION FORNECE ESTAPUBLICAÇÃO "NO ESTADO EM QUE SE ENCONTRA", SEM GARANTIA DENENHUM TIPO, SEJA EXPRESSA OU IMPLÍCITA, INCLUINDO, MAS NÃO SELIMITANDO ÀS, GARANTIAS IMPLÍCITAS DE NÃO-VIOLAÇÃO,COMERCIALIZAÇÃO OU ADEQUAÇÃO PARA UM DETERMINADOPROPÓSITO. Alguns países não permitem a exclusão de garantias expressas ouimplícitas em determinadas transações, portanto esta disposição pode não seaplicar ao Cliente.

Esta publicação pode conter imprecisões técnicas ou erros tipográficos. São feitasalterações periódicas nas informações aqui contidas; tais alterações serão

© Copyright IBM Corp. 2003, 2016 391

Page 410: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

incorporadas em futuras edições desta publicação. A IBM pode, a qualquermomento, aperfeiçoar e/ou alterar os produtos e/ou programas descritos nestapublicação, sem aviso prévio.

Quaisquer referências nestas informações a websites não IBM são fornecidasapenas por conveniência e não representam de forma alguma um endosso a esseswebsites. Os materiais desses Web sites não fazem parte dos materiais desseproduto IBM e a utilização desses Web sites é de inteira responsabilidade doCliente.

A IBM pode usar ou distribuir todas as informações fornecidas da forma que julgarapropriada, sem incorrer em qualquer obrigação para o Cliente.

Licenciados deste programa que desejam obter informações sobre este assunto comobjetivo de permitir: (i) a troca de informações entre programas criadosindependentemente e outros programas (incluindo este) e (ii) a utilização mútuadas informações trocadas, devem entrar em contato com Gerência de RelaçõesComerciais e Industriais da IBM Brasil:

Gerência de Relações Comerciais e Industriais daIBM BrasilAv. Pasteur, 138-146BotafogoRio de Janeiro, RJCEP 22290-240

Tais informações podem estar disponíveis, sujeitas a termos e condiçõesapropriadas, incluindo, em alguns casos, o pagamento de uma taxa.

O programa licenciado descrito nesta publicação e todo o material licenciadodisponível são fornecidos pela IBM sob os termos do Contrato com o Cliente IBM,do Contrato de Licença de Programa Internacional IBM ou de qualquer outrocontrato equivalente.

Os dados de desempenho discutidos aqui são apresentados como derivados sob ascondições de operação específicas. O resultado real pode variar.

As informações relativas a produtos não IBM foram obtidas junto aos fornecedoresdos respectivos produtos, de seus anúncios publicados ou de outras fontesdisponíveis publicamente. A IBM não testou esses produtos e não pode confirmar aprecisão da compatibilidade de desempenho ou qualquer outra reivindicaçãorelacionada a produtos não IBM. As dúvidas sobre os recursos de produtos nãoIBM devem ser encaminhadas diretamente aos seus fornecedores.

Declarações em relação a direção ou intento futuro da IBM estão sujeitas amudança ou retirada sem prévio aviso e representam objetivos e metas apenas.

Todos os preços IBM mostrados são preços de varejo sugeridos pela IBM, sãoatuais e estão sujeitos a mudanças sem aviso prévio. Os preços do revendedorpodem variar.

Estas informações foram projetadas apenas com o propósito de planejamento. Asinformações aqui contidas estão sujeitas a alterações antes que os produtosdescritos estejam disponíveis.

392 SAN Volume Controller: Guia de Resolução de Problemas

Page 411: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Esta publicação contém exemplos de dados e relatórios utilizados em operaçõesdiárias de negócios. Para ilustrá-los da forma mais completa possível, os exemplosincluem nomes de pessoas, empresas, marcas e produtos. Todos estes nomes sãofictícios e qualquer semelhança com nomes e endereços utilizados por umaempresa real é mera coincidência.

LICENÇA DE COPYRIGHT:

Estas informações contêm programas de aplicativos de exemplo na linguagemfonte, ilustrando as técnicas de programação em diversas plataformas operacionais.O Cliente pode copiar, modificar e distribuir estes programas de exemplo sem anecessidade de pagar à IBM, com objetivos de desenvolvimento, utilização,marketing ou distribuição de programas aplicativos em conformidade com ainterface de programação de aplicativo para a plataforma operacional para a qualos programas de exemplo são criados. Esses exemplos não foram testadoscompletamente em todas as condições. Portanto, a IBM não pode garantir ouimplicar a confiabilidade, manutenção ou função destes programas. Os programasde amostra são fornecidos "NO ESTADO EM QUE SE ENCONTRAM", semnenhum tipo de garantia. A IBM não é responsável por nenhum dano decorrentedo uso dos programas de amostra.

Se estas informações estiverem sendo exibidas em cópia eletrônica, as fotografias eilustrações coloridas podem não aparecer.

Marcas RegistradasIBM, o logotipo IBM e ibm.com são marcas ou marcas registradas da InternationalBusiness Machines Corp., registradas em vários países no mundo todo. Outrosnomes de produtos e serviços podem ser marcas registradas da IBM ou de outrasempresas. Uma lista atual das marcas registradas IBM está disponível na Web emCopyright and trademark information em www.ibm.com/legal/copytrade.shtml.

Adobe, o logotipo Adobe, PostScript e o logotipos PostScript são marcasregistradas ou marcas comerciais da Adobe Systems Incorporated nos EstadosUnidos e/ou em outros países.

Linux e o logotipo Linux são uma marca registrada da Linus Torvalds nos EstadosUnidos e/ou em outros países.

Microsoft, Windows e o logotipo Windows são marcas registradas da MicrosoftCorporation nos Estados Unidos e/ou em outros países.

Outros nomes de produtos e serviços podem ser marcas registradas da IBM ou deoutras empresas.

Declaração de HomologaçãoEste produto pode não estar certificado no seu país para a conexão por qualquermeio às interfaces das redes públicas de telecomunicações. Pode ser necessáriacertificação adicional, por lei, antes de fazer uma conexão desse tipo. Entre emcontato com um representante ou revendedor IBM para quaisquer questões.

Avisos de Emissão EletrônicaEsta seção contém avisos de emissão eletrônica ou declarações dos Estados Unidose de outros países.

Avisos 393

Page 412: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Declaração do FCC (Federal Communications Commission)Isso explica a instrução da Federal Communications Commission (FCC).

Este equipamento foi testado e aprovado segundo os critérios estabelecidos paradispositivos digitais da Classe A, em conformidade com a Parte 15 das Normas daFCC. Esses critérios têm como finalidade garantir um nível de proteção adequadocontra interferências prejudiciais, quando o equipamento estiver em funcionamentoem um ambiente comercial. Este equipamento gera, usa e pode emitir energia defrequência de rádio e, se não instalado e usado de acordo com o manual deinstruções, pode provocar interferência prejudicial em comunicações por rádio. Aoperação deste equipamento em uma área residencial provavelmente causainterferência prejudicial, caso em que o usuário será solicitado a corrigir ainterferência por conta própria.

Para atender aos critérios de emissão estabelecidos pela FCC, deve-se utilizar cabose conectores apropriadamente encapados e aterrados, em conformidade com opadrão IEEE 1284-1994. A IBM não é responsável por qualquer interferência derádio ou televisão causada pelo uso de cabos e conectores diferentes dosrecomendados, ou por mudanças ou modificações não autorizadas nesteequipamento. Mudanças ou modificações não autorizadas podem anular aautorização do usuário para operar o equipamento.

Este dispositivo está em conformidade com a Parte 15 das Normas da FCC. Aoperação está sujeita às duas seguintes condições: (1) este dispositivo talvez nãocause interferência prejudicial e (2) este dispositivo deve aceitar qualquerinterferência recebida, incluindo a interferência que pode causar uma operaçãoindesejada.

Declaração de Conformidade do Segmento de Mercado doCanadá

Este equipamento digital Classe A está em conformidade com o ICES-003canadense.

Cet appareil numérique de la classe A est conform à la norme NMB-003 duCanada.

Declaração Classe A para Austrália e Nova ZelândiaAtenção: Este é um produto de Classe A. Em ambiente doméstico este produtopode causar interferência na radiorrecepção, caso em que o usuário pode sersolicitado a tomar medidas adequadas.

Diretiva De Compatibilidade Eletromagnética Da UniãoEuropeia

Este produto está em conformidade com os requisitos de proteção do CouncilDirective 2004/108/EC da União Europeia (UE) na aproximação das leis dosEstados Membros relativas à compatibilidade eletromagnética. A IBM não podeaceitar a responsabilidade por qualquer negligência em atender às exigências deproteção resultante de uma modificação não recomendada do produto, incluindo oajuste de placas opcionais não IBM.

394 SAN Volume Controller: Guia de Resolução de Problemas

Page 413: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Atenção: Este é um produto Classe A EN 55022. Em ambiente doméstico esteproduto pode causar interferência na radiorrecepção, caso em que o usuário podeser solicitado a tomar medidas adequadas.

Fabricante Responsável:

International Business Machines Corp.New Orchard RoadArmonk, New York 10504914-499-1900

Contato com a comunidade Europeia:

IBM Deutschland GmbHTechnical Regulations, Department M372IBM-Allee 1, 71139 Ehningen, GermanyTelefone: +49 (0) 800 225 5423 or +49 (0) 180 331 3233Email: [email protected]

Diretriz de Compatibilidade Eletromagnética da AlemanhaDeutschsprachiger EU Hinweis: Hinweis fur Geräte der Klasse A EU-Richtliniezur Elektromagnetischen Verträglichkeit

Dieses Produkt entspricht den Schutzanforderungen der EU-Richtlinie2004/108/EG zur Angleichung der Rechtsvorschriften uber die elektromagnetischeVerträglichkeit in den EU-Mitgliedsstaaten und hält die Grenzwerte der EN 55022Klasse A ein.

Um dieses sicherzustellen, sind die Geräte wie in den Handbüchern beschrieben zuinstallieren und zu betreiben. Des Weiteren dürfen auch nur von der IBMempfohlene Kabel angeschlossen werden. IBM übernimmt keine Verantwortung fürdie Einhaltung der Schutzanforderungen, wenn das Produkt ohne Zustimmung derIBM verändert bzw. wenn Erweiterungskomponenten von Fremdherstellern ohneEmpfehlung der IBM gesteckt/eingebaut werden.

EN 55022 Klasse A Geräte müssen mit folgendem Warnhinweis versehen werden:

“Warnung: Dieses ist eine Einrichtung der Klasse A. Diese Einrichtung kann imWohnbereich Funk-Störungen verursachen; in diesem Fall kann vom Betreiberverlangt werden, angemessene Mabnahmen zu ergreifen und dafüraufzukommen.”

Deutschland: Einhaltung des Gesetzes über die elektromagnetischeVerträglichkeit von Geräten

Dieses Produkt entspricht dem “Gesetz über die elektromagnetische Verträglichkeitvon Geräten (EMVG).” Dies ist die Umsetzung der EU-Richtlinie 2004/108/EG inder Bundesrepublik Deutschland.

Zulassungsbescheinigung laut dem Deutschen Gesetz über dieelektromagnetische Verträglichkeit von Geräten (EMVG) (bzw. der EMC EGRichtlinie 2004/108/EG) für Geräte der Klasse A

Dieses Gerät ist berechtigt, in übereinstimmung mit dem Deutschen EMVG dasEG-Konformitätszeichen - CE - zu führen.

Avisos 395

Page 414: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Verantwortlich für die Einhaltung der EMV Vorschriften ist der Hersteller:

International Business Machines Corp.New Orchard RoadArmonk,New York 10504Tel: 914-499-1900

Der verantwortliche Ansprechpartner des Herstellers in der EU ist:

IBM Deutschland GmbHTechnical Regulations, Abteilung M372IBM-Allee 1, 71139 Ehningen, GermanyTelefone: +49 (0) 800 225 5423 or +49 (0) 180 331 3233Email: [email protected]

Generelle Informationen:

Das Gerät erfüllt die Schutzanforderungen nach EN 55024 und EN 55022 KlasseA.

Instrução Classe A da República Popular da China

Declaração de Conformidade Classe A para Taiwan

Informações de Contato de TaiwanEste tópico contém as informações de contato para serviços do produto em Taiwan.IBM Taiwan Product Service Contact Information:IBM Taiwan Corporation3F, No 7, Song Ren Rd., Taipei TaiwanTel: 0800-016-888

396 SAN Volume Controller: Guia de Resolução de Problemas

Page 415: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Declaração Classe A do Conselho VCCI do JapãoIsso explica a instrução Japan Voluntary Control Council for Interference (VCCI).

Instrução da Japan Electronics and Information TechnologyIndustries Association

Essa instrução explica a conformidade de voltagem do produto Japan JIS C61000-3-2.

Essa instrução explica a instrução Japan Electronics and Information TechnologyIndustries Association (JEITA) para produtos menores ou igual a 20 A por fase.

Essa instrução explica a instrução JEITA para produtos maiores que 20 A, faseúnica.

Essa instrução explica a instrução JEITA para produtos maiores que 20 A por fase,três fases.

f2c0

07

90

Avisos 397

Page 416: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Instrução Classe A da Korean Communications CommissionEste documento explica a instrução da Korean Communications Commission(KCC).

Instrução de Classe A de Interferência Eletromagnética daRússia

Esta instrução explica a instrução de Interferência Eletromagnética (EMI) da Rússia.

rusem

i

398 SAN Volume Controller: Guia de Resolução de Problemas

Page 417: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

Índice Remissivo

Numéricos2145-DH8

características do produto 38dimensões e peso 39especificações 38nós

saída de calor 40pesos e dimensões 39requisitos 38requisitos da voltagem de entrada 38requisitos de energia para cada

nó 38requisitos de espaço adicional 39saída de calor do nó 40temperatura do ar sem energia ac

redundante 38umidade sem energia ac

redundante 382145 UPS-1U

alarme 53ambiente 56botão de teste e de reconfiguração de

alarme 54botão ligar/desligar 54conectores 54conexão 52controles e indicadores no painel

frontal 52descrição das peças 54disjuntores 54indicador de ativação 53indicador de bateria ligada 53Indicador de segmento 1 de

carregamento 53Indicador de segmento 2 de

carregamento 53indicador de serviço 53indicador de sobrecarga 53MAP

5150: 2145 UPS-1U 3185250: Verificação de reparo 323

nóssaída de calor 42

operação 51portas não usadas 54saída de calor do nó 42switches DIP 54

Aacessando

assistente de serviço 68CLI de serviço 69CLI do cluster (sistema) 69GUI de gerenciamento 61publicações 387

acessibilidade 387taxa de repetição

botões para cima e parabaixo 387

acessibilidade (continuação)taxa de repetição dos botões para

cima e para baixo 120ações

reconfigurar endereço IP deserviço 70

reconfigurar senha desuperusuário 70

Ações de Saídaopção 121

ajuda xvarquivos de configuração do sistema

excluindoutilizando a CLI 293

restaurando 287arquivos de log

visualizando 137assistência técnica xvassistente de serviço

acessando 68interface 67quando usar 67

autoteste, ligado 136aviso de emissão eletrônica da

Communications Commission(FCC) 394

aviso de emissão eletrônica da FCC(Federal CommunicationsCommission) 394

Aviso de emissão eletrônica doCanadá 394

aviso de emissão eletrônica japonês 397avisos de emissão eletrônica

Alemanha 395Coreano 398Deutschsprachiger EU Hinweis 395Federal Communications Commission

(FCC) 394Nova Zelândia 394República Popular da China 396Segmento de Mercado do

Canada 394Taiwan 396União Europeia (UE) 394Voluntary Control Council for

Interference (VCCI) japonês 397

Bbateria

Carregando, exibição do painelfrontal 96

energia 97Biblioteca do SAN Volume Controller

publicações relacionadas xiiblocos inválidos 297botão de reconfiguração 25botão de teste e de reconfiguração de

alarme 54botão ligar/desligar 54botões, navegação 21

Ccaixas do nó

configuração 12Call Home 139, 142campos

cache do processador 85descrição para os dados vitais do

produto do nó 85descrição para os dados vitais do

produto do sistema 91device 85Fibre Channel adapter 85fonte de alimentação ininterrupta 85log de eventos 137módulo de memória 85painel frontal 85placa-mãe 85processador 85sistema 91software 85

características físicas2145 UPS-1U 56comutador de energia de corrente

alternada redundante 46SAN Volume Controller 2145-CF8

conectores 33portas de serviços 34portas não usadas 34

SAN Volume Controller 2145-CG8conectores 30portas de serviços 31portas não usadas 32

SAN Volume Controller 2145-DH8conectores 27portas de serviços 28portas não usadas 29

carregando 96catálogo 56chave USB

quando usar 69usando 70

classificação de mensagens 171CLI

comandos de serviço 69comandos do sistema 68quando usar 68

CLI de serviçoacessando 69quando usar 69

CLI do cluster (sistema)acessando 69

códigoserro do nó

crítico 168não crítico 168

resgate do nó 168códigos de erro 153

entendimento 143exibição do painel frontal 96

códigos de objeto 152comando de criação de cluster 73

© Copyright IBM Corp. 2003, 2016 399

Page 418: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

comando de instalação de software 73comando de status da consulta 75comando snap 72comandos

backup do svcconfig 286criação de cluster 73instalação de software 73reconfiguração de senha do assistente

de serviço 71satask.txt 70snap 72status da consulta 75svcconfig restore 287

Comandos CLIlssystem

exibindo propriedades do sistemaem cluster 84

comandos de serviçoCLI 69criação de cluster 73instalação de software 73reconfiguração de senha do assistente

de serviço 71reconfigurar endereço IP de

serviço 70reconfigurar senha de

superusuário 70snap 72

comandos do sistemaCLI 68

comentários, enviando xvcomo enviar

comentários xvcompreendendo

códigos de resgate do nó 168comutador de energia ac,

cabeamento 47comutador de energia de corrente

alternada redundantecabeamento 47conjunto 57especificações 46exemplos 47MAP 324, 326números de peças 57preparação do ambiente 46problemas 324verificando 326visão geral 45

comutadores2145 UPS-1U 54energia ac redundante 45

conectores2145 UPS-1U 54SAN Volume Controller 2145-CF8 33SAN Volume Controller 2145-CG8 30SAN Volume Controller

2145-DH8 27conexão

2145 UPS-1U 52configuração

failover do nó 13Configurar Velocidade do FC

opção 120conjunto do painel traseiro

SAN Volume Controller 2145-CF8conectores 33

conjunto do painel traseiro (continuação)SAN Volume Controller 2145-CF8

(continuação)indicadores 32

SAN Volume Controller 2145-CG8conectores 30indicadores 29

SAN Volume Controller 2145-DH8conectores 27indicadores 27

controlador de serviçosubstituindo

validar WWNN 99controles e indicadores no painel frontal

2145 UPS-1Ualarme 53botão de teste e de reconfiguração

de alarme 54botão ligar/desligar 54ilustração 52indicador de ativação 53indicador de bateria ligada 53Indicador de segmento 1 de

carregamento 53Indicador de segmento 2 de

carregamento 53indicador de sobrecarga 53

indicadores de statuscarregando 96códigos de erro 96desligando 98encerrando 99falha de energia 97falha na inicialização 96inicialização de hardware 97opções de menu 100opções do menu de ação 106progresso da inicialização 95recuperando 98reiniciando 98solicitação de resgate do nó 97

LED de erro 22monitor do painel frontal 21SAN Volume Controller

botão selecionar 22botões de navegação 21LED de status do nó 21

SAN Volume Controller 2145-CF8ilustração 20painel de informações do

operador 24SAN Volume Controller 2145-CG8

ilustração 20painel de informações do

operador 23SAN Volume Controller 2145-DH8

ilustração 17painel de informações do

operador 23cópias de volumes

validando 79correção

erros 275criação de cluster

opção de ação 111criar sistema em cluster

códigos de erro 170

críticoerros do nó 168

Ddados vitais do produto (VPD)

entendendo os campos para o nó 85entendendo os campos para o

sistema 91exibindo 83visão geral 83visualizando

nós 83declaração de conformidade de emissão

eletrônica da Alemanha 395declaração de emissão eletrônica

coreana 398declaração de emissão eletrônica da Nova

Zelândia 394Declaração de Garantia Limitada, Onde

localizar a 389declaração de homologação 393Declaração do EMC, República Popular

da China 396desligar 328determinação

problema da SAN 264determinando

falha de inicialização dehardware 167

Deutschsprachiger EU Hinweis 395DHCPv4 de serviço

opção 118DHCPv6 de serviço

opção 118diagnosticando problemas

através de códigos de erro 125através de logs de eventos 125com o SAN Volume Controller 125

disjuntores2145 UPS-1U 54requisitos

SAN Volume Controller2145-CF8 43

SAN Volume Controller2145-CG8 41

documentaçãomelhoria xv

Eemails

Call Homeinformações sobre o

inventário 142notificações de eventos 141

informações sobre o inventário 142encerrando

exibição do painel frontal 99endereçamento

nó de configuração 13endereço

MAC 105Endereço de Controle de Acesso à

Mídia 105

400 SAN Volume Controller: Guia de Resolução de Problemas

Page 419: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

endereço de controle de acesso à mídia(MAC) 105

endereço de serviçoopções 116Recuperar Cluster? 116

Endereço de Serviçoopção 104

endereço IPcluster 103cluster (system) 102IPv6 103serviço 116sistema 103

Endereço IPv4 102energia

Apagadooperação 98

botão 25comutador, falha 308, 313controles 122falha 97fonte de alimentação

ininterrupta 122requisitos

2145-DH8 38SAN Volume Controller

2145-CF8 43SAN Volume Controller

2145-CG8 40restaurado 97

entendimentocampos para os dados vitais do

produto do nó 85campos para os dados vitais do

produto do sistema 91códigos de erro 143, 170códigos de recuperação de sistema em

cluster 170log de eventos 137

errogabinete de expansão 266não detectado 266

erro de detecçãolocal de expansão 266

erros 265logs

descrevendo os campos 137entendimento 137eventos de erro 137gerenciando 137visualizando 137

nó 168erros de mídia 297especificações

comutador de energia de correntealternada redundante 46

Ethernet 383falhas de link 13, 337LED de atividade 26, 35LED do link 35MAP 5500 337portas 105

Ethernet de 10 Gbpsfalhas de link 341MAP 5550 341

Ethernet de 10G 267, 341

eventosrelatório 135

eventos de erro 137eventos informativos 144excluindo

arquivos de configuração do sistemautilizando a CLI 293

nós 61exemplos

cabeamento do comutador de energiade corrente alternadaredundante 47

clusters na malha SAN 15exibição do painel frontal

solicitação de resgate do nó 294exibição no painel frontal

DHCPv4 de serviço 118DHCPv6 de serviço 118Endereço de Serviço 104Endereço IPv6 103indicadores de status

carregando 96códigos de erro 96desligando 98encerrando 99falha de energia 97falha na inicialização 96inicialização de hardware 97opções de menu 100opções do menu de ação 106progresso da inicialização 95recuperando 98reiniciando 98solicitação de resgate do nó 97

Opção Ações de Saída 121Opção Alterar WWNN 118Opção de Resgate do Nó 121Opção de Serviços de Saída 119Opção Definir Velocidade do Fibre

Channel 120opção Inserir Serviço? 119Opção Upgrade em Etapas 120Recuperar Cluster 119validar WWNN? 99versão 104visão geral 21WWNN do nó 104

exibindoEndereço IPv6 103

exibindo dados vitais do produto 83

Ffailover, nó de configuração 13faixa de números 171falhas de link

Fibre Channel 267fazendo backup

arquivos de configuração dosistema 286

feedback do leitor, enviando xvFibre Channel

falhas de link 267LEDs 34MAP 343números de portas 37opção de menu da porta 105

Fibre Channel (continuação)Transceptor SFP 267

fonte de alimentação ininterrupta2145 UPS-1U

ambiente 56controles e indicadores 52operação 51visão geral 51

operação 51preparando ambiente 56procedimento de análise de

manutenção do painel frontal 334visão geral 50

Ggabinete de expansão

erro de detecção 266gateway

opção de menu 103opção de nó 113, 115

gerenciandolog de eventos 137

GUI de gerenciamentoacessando 61encerrar nó 328

Hhardware

componentes 17falha 97falha de inicialização 167inicializar 97, 372nó 17

Iidentificação

nome 104número 104rótulo, nó 22

IDs de evento 144IDs de eventos de erro 153incluindo

nós 63Indicador de segmento 1 de

carregamento 53Indicador de segmento 2 de

carregamento 53indicador de sobrecarga 53Indicadores do painel traseiro do

SAN Volume Controller 2145-CF8 32SAN Volume Controller 2145-CG8 29SAN Volume Controller

2145-DH8 27indicadores e controles no painel frontal

2145 UPS-1Ualarme 53botão de teste e de reconfiguração

de alarme 54botão ligar/desligar 54ilustração 52indicador de ativação 53indicador de bateria ligada 53

Índice Remissivo 401

Page 420: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

indicadores e controles no painel frontal(continuação)

2145 UPS-1U (continuação)Indicador de segmento 1 de

carregamento 53Indicador de segmento 2 de

carregamento 53indicador de sobrecarga 53

indicadores de statuscarregando 96códigos de erro 96desligando 98encerrando 99falha de energia 97falha na inicialização 96inicialização de hardware 97opções de menu 100opções do menu de ação 106progresso da inicialização 95recuperando 98reiniciando 98solicitação de resgate do nó 97

LED de erro 22SAN Volume Controller

botão selecionar 22botões de navegação 21LED de status do nó 21

SAN Volume Controller 2145-CF8ilustração 20painel de informações do

operador 24SAN Volume Controller 2145-CG8

ilustração 20painel de informações do

operador 23SAN Volume Controller 2145-DH8

ilustração 17painel de informações do

operador 23indicadores luminosos do MAP 350indicadores no painel traseiro 35

EthernetLED de atividade 26, 35LED do link 35

LED de erro da fonte dealimentação 36, 37

LEDs ac e dc 37LEDs de AC e DC 36LEDs de energia, local e erro no

sistema 35LEDs do Fibre Channel 34placa Ethernet de 10 Gbps 26SAN Volume Controller 2145-CG8

LED de atividade Ethernet 26informação, sistema

LED 26informações de ajuda xvinformações de contato

Taiwan 396informações de proteção 265informações relacionadas xiiinformações sobre o inventário

emails 142notificações de eventos 139

inicializarcódigos, entendendo 168com falha 96

inicializar (continuação)indicador de progresso 95

iniciandorecuperação de T3 278recuperação do sistema 280recuperação do sistema em

cluster 278Iniciar MAP 299Inserir Serviço?

opção 119instâncias e classes de objetos 152interface

painel frontal 77interface GUI de gerenciamento

quando usar 60IPv6

endereço 103opção de menu de gateway 103opção do menu de máscara de

prefixo 103iSCSI 383

problemas de link 268, 269

KKnowledge Center xii

LLED de atividade da unidade de

disco 25LED de energia 26LED de erro 22LED de erro da fonte de alimentação 36,

37LED de erro do sistema 25LED de falha da bateria 19LED de falha do nó 18LED de status da bateria 19LED de status do nó 18, 21LED do localizador 26LEDs

ac e dc 36, 37AC e DC 36atividade da unidade de disco 25diagnósticos 350energia 26, 35erro da fonte de alimentação 36, 37erro no sistema 25, 35Ethernet

atividade 26, 35link 35

Fibre Channel 34Indicadores do painel traseiro do 27,

29, 32informação do sistema 26local 26, 35SAN Volume Controller 2145-CF8 32SAN Volume Controller 2145-CG8 29SAN Volume Controller

2145-DH8 27LEDs ac e dc 36, 37LEDs de AC e DC 36

Mmalha

visão geral da SAN 15MAP

5000: Iniciar 2995040: Energia SAN Volume Controller

2145-DH8 3085050: Energia do SAN Volume

Controller 2145-CG8 e do2145-CF8 313

5150: 2145 UPS-1U 3185250: Verificação de reparo do 2145

UPS-1U 3235320: Energia de corrente alternada

redundante 3245340: Verificação de energia ac

redundante 3265400: Painel Frontal 3345500: Ethernet 3375550: Ethernet de 10 Gbps 3415600: Fibre Channel 3435700: Verificação de reparo 3495800: Indicadores luminosos 3505900: Inicialização de hardware 3726000: Substitua a unidade de estado

sólido offline 3776001 Substitua a SSD offline em uma

matriz RAID 0 3786002: Substitua a SSD offline em uma

matriz RAID 1 ou RAID 10 380desligar nó 328

MAP de Energia do 2145-CG8 e2145-CF8 313

MAP de energia do SAN VolumeController 2145-DH8 308

MAP de verificação de reparo 349MAPs (procedimentos de análise de

manutenção)2145 UPS-1U 318desligar 328energia

SAN Volume Controller2145-CF8 313

SAN Volume Controller2145-CG8 313

SAN Volume Controller2145-DH8 308

energia ac redundante 326energia de corrente alternada

redundante 324Ethernet 337Ethernet de 10 Gbps 341Falha na SSD 377, 378, 380Fibre Channel 343indicadores luminosos 350inicial 299inicialização de hardware 372painel frontal 334usando 299verificação de reparo 349Verificação de reparo do 2145

UPS-1U 323marcas registradas 393máscara de sub-rede

opção de nó 112mensagens syslog 139migrar 265

402 SAN Volume Controller: Guia de Resolução de Problemas

Page 421: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

migrar unidades 265

Nnão crítico

erros do nó 168não usado

LED de local 35Portas do 2145 UPS-1U 54

Nível de segurança 265nó

criação de cluster 111falha de software 308, 313opções

criar cluster? 111Endereço IPv4 111Endereço IPv6 114gateway 115gateway IPv4 113IPv4 confirm create? 114IPv6 Confirm Create? 116máscara de sub-rede 112Máscara de sub-rede IPv4 112Prefixo IPv6 115Remover cluster? 120status 104

solicitação de resgate 97nó de configuração 13Nó de Resgate

opção 121nó do SAN Volume Controller 2145-CG8

recursos 11nomes de portas universais (WWPNs)

descrição 37nomes universais do nó

alteração 118escolher 99exibição 104nó, exibição do painel frontal 104,

118validar, exibição do painel frontal 99

nósconfiguração 12

endereçamento 13failover 13

dados em cache, salvando 97excluindo 61failover 13falha na unidade de disco rígido 97fazendo download

dados vitais do produto 83incluindo 63opções

principais 104removendo 61resgate

concluindo 294rótulo de identificação 22visualizando

detalhes gerais 83nós de resgate

concluindo 294notificações

enviando 139Informações de call home 142informações sobre o inventário 142

notificações de eventosemail de informações sobre

inventário 142visão geral 139

número de série 22números de peças

comutador de energia de correntealternada redundante 57

FRUs 56

Oopção de menu reconfigurar senha 120

reconfigurar a senha 120Recuperar Cluster? 120

opções de açãonó

criação de cluster 111opções de menu

clustersEndereço IPv6 103opções 102reconfigurar senha 120status 102

EthernetEndereço de Controle de Acesso à

Mídia 105portas 105speed 105

exibição do painel frontal 100gateway IPv4 103gateway IPv6 103Navegação 121nó

opções 104status 104

Porta 1 do Fibre Channel através daporta 4 105

Prefixo IPv6 103SAN Volume Controller

ativo 102degraded 102inativo 102

sequência 100sistema

gateway 103Prefixo IPv6 103status 104

sistema em clusterEndereço IPv4 102gateway IPv4 103Sub-rede IPv4 103

sistemas em clusterEndereço IPv6 103

opções de seleção do menu deidioma 121

opções do menu de açãoexibição do painel frontal 106sequência 106

operações de E/S, interrompido 97

Ppainel

frontal 21

painel (continuação)informações do operador

SAN Volume Controller2145-CF8 24

SAN Volume Controller2145-CG8 23

SAN Volume Controller2145-DH8 23

nome 22parte traseira

SAN Volume Controller2145-CF8 32

SAN Volume Controller2145-CG8 29

SAN Volume Controller2145-DH8 27

painel de informações do operadorbotão de reconfiguração 25botão liga/desliga 25LED de atividade da unidade de

disco 25LED de energia 26LED de erro do sistema 25LED de informação do sistema 26LED do localizador 26SAN Volume Controller 2145-CF8 24SAN Volume Controller 2145-CG8 23SAN Volume Controller

2145-DH8 23painel frontal

2145 UPS-1U 52botões e indicadores 95carregando 122desligando o SAN Volume

Controller 122exibição 21falha de energia 122ID 22inicializando 122interface 77opções de menu 100

Endereço IPv4 102Endereço IPv6 103Ethernet 105Navegação 121nó 104Porta 1 do Fibre Channel através

da porta 4 105versão 104

opções do menu de ação 106recuperando 122SAN Volume Controller 95

partescatálogo 56listando 56

placa Ethernet de 10 GbpsLED de atividade 26

porta técnicausando 75

portasEthernet 26, 35não usado

2145 UPS-1U 54nomes de portas, universais 37números de portas, Fibre Channel 37SAN Volume Controller 2145-CF8 33SAN Volume Controller 2145-CG8 30

Índice Remissivo 403

Page 422: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

portas (continuação)SAN Volume Controller

2145-DH8 27portas de serviços

SAN Volume Controller 2145-CF8 34SAN Volume Controller 2145-CG8 31SAN Volume Controller

2145-DH8 28portas não usadas

2145 UPS-1U 54SAN Volume Controller 2145-CF8 34SAN Volume Controller 2145-CG8 32SAN Volume Controller

2145-DH8 29POST (autoteste de ativação) 136preparando

Ambiente do fonte de alimentaçãoininterrupta 56

Ambiente do SAN VolumeController 38

problemas de linkiSCSI 268, 269

procedimentos de análise de manutenção(MAPs)

2145 UPS-1U 318energia

SAN Volume Controller2145-CG8 313

SAN Volume Controller2145-DH8 308

Ethernet 337Ethernet de 10 Gbps 341Falha na SSD 377, 378, 380Fibre Channel 343indicadores luminosos 350inicial 299inicialização de hardware 372painel frontal 334verificação de reparo 349visão geral 299

Protocolo de Resolução de Endereço(ARP) 13

publicaçõesacessando 387

Qquadro gigante 383quando usar

assistente de serviço 67chave USB 69CLI 68CLI de serviço 69interface GUI de gerenciamento 60

Rreconfiguração de senha do assistente de

serviço 71reconfigurando senhas 120reconfigurar endereço IP de serviço 70reconfigurar senha de superusuário 70recuperação

sistemaquando utilizar 275

recuperação (continuação)sistemas

iniciando 280Recuperação de desastre

Cluster Estendido 271Espelho Global 271Metro Mirror 271Sistema Estendido 271

recuperação de T3iniciando 278o que verificar 282quando utilizar 275removendo

erros 550 276, 277erros 578 276, 277

restauraçãosistema em cluster 273

recuperandoexibição do painel frontal 98volumes off-line

usando a CLI 81volumes offline

utilizando a CLI 281Recuperar Cluster

opção 119Recuperar Cluster?

acessibilidade 387botões 21criação de cluster 111Navegação 121recuperar cluster 120

rede da área de armazenamento (SAN)visão geral da malha 15

rede de área de armazenamento (SAN)determinação de problema 264

Rede de área de armazenamento (SAN)determinação de problema 264visão geral da malha 15

relatórioeventos 135

removendoerros 550 276, 277erros 578 276, 277nó de um cluster 120nós 61

reparandovolume thin-provisioned 80

República Popular da China, declaraçãode emissão eletrônica 396

requisitos2145-DH8 382145 UPS-1U 51disjuntores 41, 43elétrico 40, 43elétricos 38energia 38, 40, 43SAN Volume Controller 2145-CF8 43SAN Volume Controller 2145-CG8 40voltagem ac 38, 40, 41, 43, 44

requisitos de espaço2145-DH8 39SAN Volume Controller 2145-CF8 45SAN Volume Controller 2145-CG8 42

resgate do nócódigos 168

resolução de problemasemail de notificação de eventos 139,

142falhas da SAN 264usando logs de erro 96usando o painel frontal 95

restauraçãosistema 273, 282

resumo de mudanças xvii

SSAN Volume Controller

2145 UPS-1U 52autoteste de ativação 136componentes de hardware 17controle de energia 122hardware 1monitor do painel frontal 95nó 17opções de ação

criação de cluster 111opções de menu

Navegação 121nó 104

preparando ambiente 38properties 83software

visão geral 1visão geral 1

SAN Volume Controller 2145-CF8características do produto 43conectores 33controles e indicadores no painel

frontal 20dimensões e peso 45especificações 43Indicadores do painel traseiro do 32indicadores e controles no painel

frontal 20indicadores luminosos do MAP 366MAP 5800: indicadores

luminosos 366nós

saída de calor 45painel de informações do

operador 24peso e dimensões 45portas 33portas de serviços 34portas não usadas 34requisitos 43requisitos da voltagem de entrada 43requisitos de energia para cada

nó 43requisitos de espaço adicional 45requisitos do disjuntor 43saída de calor do nó 45temperatura com energia ac

redundante 44temperatura do ar sem energia ac

redundante 44umidade com energia ac

redundante 44umidade sem energia ac

redundante 44

404 SAN Volume Controller: Guia de Resolução de Problemas

Page 423: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

SAN Volume Controller 2145-CG8características do produto 40conectores 30controles e indicadores no painel

frontal 20dimensões e peso 42especificações 40Indicadores do painel traseiro do 29indicadores e controles no painel

frontal 20indicadores luminosos do MAP 360MAP 5800: indicadores

luminosos 360nós

saída de calor 42painel de informações do

operador 23pesos e dimensões 42portas 30portas de serviços 31portas não usadas 32requisitos 40requisitos da voltagem de entrada 40requisitos de energia para cada

nó 40requisitos de espaço adicional 42requisitos do disjuntor 41saída de calor do nó 42temperatura com energia ac

redundante 41temperatura do ar sem energia ac

redundante 41umidade com energia ac

redundante 41umidade sem energia ac

redundante 41SAN Volume Controller 2145-DH8

conectores 27controles e indicadores no painel

frontal 17Indicadores do painel traseiro do 27indicadores e controles no painel

frontal 17indicadores luminosos do MAP 351MAP 5800: indicadores

luminosos 351painel de informações do

operador 23portas 27portas de serviços 28portas não usadas 29unidade de inicialização 165

satask.txtcomandos 70

senhasreconfigurando 120

serviçoações, fonte de alimentação

ininterrupta 51Serviço de Saída

opção 119sistema

backup do arquivo de configuraçãoutilizando a CLI 286

diagnosticar falhas 104Endereço IPv6 103

sistema (continuação)restaurando arquivos de configuração

do sistema 287sistema em cluster

recuperação de T3 282restauração 282

sistemasadicionando nós 63

sistemas de armazenamentomanutenção 269restauração 273

sistemas em clustercódigos de erro 170códigos de recuperação 170E-mail Call Home 139, 142endereço IP

nó de configuração 13Endereço IPv4 102Endereço IPv6 103excluindo nós 61Failover de IP 13metadados, salvando 97opções 102properties 84recuperação de T3 275removendo nós 61restauração 275visão geral 12

sobre este documentoenviando comentários xv

softwarefalha, MAP 5050 308, 313versão

exibição 104visão geral 1

speedPorta do Fibre Channel 105

statusativo 102degraded 102inativo 102operacional 102, 104

status ativo 102status comprometido 102status inativo 102sub-rede

opção de menu 103

TTaiwan

aviso de emissão eletrônica 396informações de contato 396

TCP 383teclados

recursos de acessibilidade 387teclas de atalho

teclado 387tipos de objeto 152Traps SNMP 139

UUnião Europeia (UE), declaração de

conformidade da Diretiva EMC 394

unidade de inicializaçãoSAN Volume Controller

2145-DH8 165unidades 265Upgrade em Etapas

opção 120usando 69

assistente de serviço 67chave USB 70CLI 79GUI de gerenciamento 59interfaces da GUI 59porta técnica 75tabelas de código de erro 143

Vvalidando

cópias de volumes 79velocidade da porta

Fibre Channel 105visão geral

comutador de energia de correntealternada redundante 45

dados vitais do produto 83malha SAN 15produto 1

visualizandolog de eventos 137

volumesrecuperação de off-line

usando a CLI 81recuperando de offline

utilizando a CLI 281VPD (dados vitais do produto)

entendendo os campos para o nó 85entendendo os campos para o

sistema 91exibindo 83visão geral 83

Wwebsites xiv

Índice Remissivo 405

Page 424: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

406 SAN Volume Controller: Guia de Resolução de Problemas

Page 425: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha
Page 426: SAN Volume Controller: Guia de Resolução de Problemas · email de Informações sobr e Inventário .... . 142 Entendendo os Códigos de Err o ..... . 143 ... Determinando uma falha

IBM®

Impresso no Brasil

GC27-2284-11