Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de...

1
DIAGNÓSTICO POR IMAGEM DIAGNÓSTICO POR IMAGEM MELHORA DO NÍVEL DE SERVIÇO EM RADIOLOGIA COM USO DE FERRAMENTAS DE MONITORAÇÃO AUTOMÁTICA DE PROCESSOS EM TI: EXPERIÊNCIAS COM O USO DO NAGIOS ® E CACTI ® PERSONA P.L., JULIO T., CRUZ L.B., FELIX M.M., DANIEL M.M., ROSEMBERG L.A., FUNARI M.B.G., WOLOSKER N. - DEPARTAMENTO DE IMAGEM DO HOSPITAL ISRAELITA ALBERT EINSTEIN CENÁRIO/EXPERIÊNCIA HIAE INTRODUÇÃO INTRODUÇÃO REFERÊNCIAS BIBLIOGRÁFICAS REFERÊNCIAS BIBLIOGRÁFICAS CONCLUSÃO CONCLUSÃO A equipe de Administradores dos Sistemas RIS e PACS do HIAE está disciplinada a focar sua atuação preventiva e corretiva nos dados coletados destas ferramentas mediante um painel (dashboard) criado para monitoração, em tempo real, dos parâmetros de missão crítica dos sistemas RIS e PACS, o que proporcionou um acompanhamento pró-ativo dos problemas e um aumento na disponibilidade das aplicações, antecipando prováveis atuações. Aqui compartilhamos nossa experiência em monitoramento ativo das soluções e serviços de missão crítica nos sistemas RIS e PACS do Hospital Israelita Albert Einstein usando as ferramentas NAGIOS e CACTI. Esta monitoração combinada foi adotada em nível corporativo em 2011 e devido sua capacidade de gerenciamento descentralizado, foi introduzida inicialmente no departamento de Diagnóstico por Imagem no controle dos sistemas e redes RIS e PACS. Desde então, mantemos uma monitoração ativa nos servidores e nodes dos sistemas RIS e PACS dos seguintes serviços: taxa de ocupação de discos, listener de rede e banco de dados, consumo de memória RAM, consumo de processadores, verificação de portas e interfaces, demais serviços inerentes à aplicação e ao banco de dados, taxas (picos e médias) de inbound e outbound, etc. Atualmente utilizamos a solução Nagios v.3.5.0 que roda em uma arquitetura de servidores virtualizados em RedHat Enterprise Linux 5, 12 vCPU e 8GB de Memória RAM. Neste momento contamos com uma monitoração ativa de 7476 serviços de missão crítica em 2277 hosts (servidores, switches, DASHBOARD RIS/PACS COMPLETO NAGIOS – lista expandida dos servidores RIS/PACS cujos serviços são monitorados pela solução. CACTI – vista expandida dos servidores RIS/PACS cuja rede e nível de acesso são monitorados pela solução. Alerta automático encaminhado pelo Nagios à caixa de correio eletrônico do Administrador do Sistema, informando a parada imotivada de um serviço de integração RIS/HIS. Vista expandida dos serviços monitorados num dos servidores de Banco de Dados da solução RIS. Alerta identificado no Nagios e isolado no servidor correspondente. Este alerta indica num primeiro momento (WARNING) que foi atingida a “marca d’água” de controle, ajustada no sistema para determinar a capacidade de armazenamento de imagens ainda disponível nos discos da aplicação. Por meio deste alerta, foi possível verificar e corrigir uma tarefa diária automática de autodelete de imagens programada na aplicação, evitando uma parada de sistema e indisponibilidade aos usuários. Exemplo de monitoração do nível de acesso a um dos servidores do sistema PACS em três dias contínuos. Por este gráfico é possível identificar picos de utilização de rede e atuar preventivamente em possíveis rearranjos. Derivações possíveis de desenvolvimento em “php”, com distinção de criticidade por cores, com apontamentos para as ferramentas Nagios e Cacti e em utilização pela equipe do “Network Operation Center” do HIAE. EXEMPLOS DE TELAS DE ALERTAS WIKIPÉDIA – A enciclopédia livre - < http://pt.wikipedia.org/wiki/Nagios >, < http://pt.wikipedia.org/wiki/Cacti > acesso em 28/03/2014 Toland C, Meenan C, Warnock M, Nagy P. Proactively monitoring departmental clinical IT systems with an open source availability system. J Digit Imaging. 2007;20(Suppl 1):119–124. doi: 10.1007/s10278-007-9063-2. Sweeney R. Monitoring your Enterprise PACS with Nagios®, Cacti and Smokeping – Whitepaper (11/03/04) Nagios é um serviço de monitoração ativo de rede desenhado em código OPEN SOURCE com o intuito de informar gestores, gerentes e administradores de sistemas, em tempo real, eventuais problemas nos seus sistemas e redes. É possível monitorar tanto hosts quanto serviços, para que sejam gerados alertas quando ocorrerem problemas e também quando os problemas forem resolvidos. Através das suas telas de monitoração, os profissionais que trabalham com operações de TI podem obter insights sobre a saúde de toda a rede da organização através de uma visão centralizada. Dentre várias possibilidades de monitoração possíveis com o Nagios, destacamos: Capacidade de monitoração dos serviços de rede (SMTP, POP3, HTTP, NNTP, ICMP, SNMP); Capacidade de monitoração dos recursos computacionais (carga do processador, uso de disco, logs do sistema); Capacidade de notificar quando um serviço ou equipamento apresenta problemas e quando o problema é resolvido (via email, pager, SMS ou qualquer outro meio definido pelo usuário por plugin); Capacidade de definir tratadores de eventos que executam tarefas em situações pré-determinadas ou para a resolução pró-ativa de problemas; Excelente interface web para visualização do atual status da rede, notificações, histórico de problemas, arquivos de log, etc. Já o Cacti é também uma ferramenta OPEN SOURCE para administração de rede que recolhe e exibe informações sobre o estado de uma rede de computadores através de gráficos. Permite o monitoramento e gerenciamento de redes simples até redes complexas, com centenas de dispositivos. Desenvolvido para ser flexível de modo a se adaptar facilmente a diversas necessidades, monitora o estado de elementos de rede e programas, bem como largura de banda utilizada e uso de CPU.

description

Trabalho apresentado na Jornada Paulista de Radiologia 2014 Comitê de TI Departamento de Imagem Hospital Israelita Albert Einstein

Transcript of Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de...

Page 1: Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®

DIAGNÓSTICO POR IMAGEMDIAGNÓSTICO POR IMAGEM

MELHORA DO NÍVEL DE SERVIÇO EM RADIOLOGIA COM USO DE FERRAMENTAS DE MONITORAÇÃO AUTOMÁTICA DE PROCESSOS EM TI: EXPERIÊNCIAS COM O USO DO NAGIOS®  E CACTI®

PERSONA P.L., JULIO T., CRUZ L.B., FELIX M.M., DANIEL M.M., ROSEMBERG L.A., FUNARI M.B.G., WOLOSKER N. - DEPARTAMENTO DE IMAGEM DO HOSPITAL ISRAELITA ALBERT EINSTEIN

CENÁRIO/EXPERIÊNCIA HIAE

INTRODUÇÃOINTRODUÇÃO

REFERÊNCIAS BIBLIOGRÁFICASREFERÊNCIAS BIBLIOGRÁFICAS

CONCLUSÃOCONCLUSÃO

A equipe de Administradores dos Sistemas RIS e PACS do HIAE está disciplinada a focar sua atuação preventiva e corretiva nos dados coletados destas ferramentas mediante um painel (dashboard) criado para monitoração, em tempo real, dos parâmetros de missão crítica dos sistemas RIS e PACS, o que proporcionou um acompanhamento pró-ativo dos problemas e um aumento na disponibilidade das aplicações, antecipando prováveis atuações.

Aqui compartilhamos nossa experiência em monitoramento ativo das soluções e serviços de missão crítica nos sistemas RIS e PACS do Hospital Israelita Albert Einstein usando as ferramentas NAGIOS e CACTI.

Esta monitoração combinada foi adotada em nível corporativo em 2011 e devido sua capacidade de gerenciamento descentralizado, foi introduzida inicialmente no departamento de Diagnóstico por Imagem no controle dos sistemas e redes RIS e PACS.

Desde então, mantemos uma monitoração ativa nos servidores e nodes dos sistemas RIS e PACS dos seguintes serviços: taxa de ocupação de discos, listener de rede e banco de dados, consumo de memória RAM, consumo de processadores, verificação de portas e interfaces, demais serviços inerentes à aplicação e ao banco de dados, taxas (picos e médias) de inbound e outbound, etc.

Atualmente utilizamos a solução Nagios v.3.5.0 que roda em uma arquitetura de servidores virtualizados em RedHat Enterprise Linux 5, 12 vCPU e 8GB de Memória RAM. Neste momento contamos com uma monitoração ativa de 7476 serviços de missão crítica em 2277 hosts (servidores, switches, câmeras, etc.) em nível corporativo. Nas soluções RIS e PACS, são 467 serviços ativos em 37 hosts (servidores).

DASHBOARD RIS/PACS COMPLETO

NAGIOS – lista expandida dos servidores RIS/PACS cujos serviços são monitorados pela solução.

CACTI – vista expandida dos servidores RIS/PACS cuja rede e nível de acesso são monitorados pela solução.

Alerta automático encaminhado pelo Nagios à caixa de correio eletrônico do Administrador do Sistema, informando a parada imotivada de um serviço de integração RIS/HIS.

Vista expandida dos serviços monitorados num dos servidores de Banco de Dados da solução RIS.

Alerta identificado no Nagios e isolado no servidor correspondente. Este alerta indica num primeiro momento (WARNING) que foi atingida a “marca d’água” de controle, ajustada no sistema para determinar a capacidade de armazenamento de imagens ainda disponível nos discos da aplicação. Por meio deste alerta, foi possível verificar e corrigir uma tarefa diária automática de autodelete de imagens programada na aplicação, evitando uma parada de sistema e indisponibilidade aos usuários.

Exemplo de monitoração do nível de acesso a um dos servidores do sistema PACS em três dias contínuos. Por este gráfico é possível identificar picos de utilização de rede e atuar preventivamente em possíveis rearranjos.

Derivações possíveis de desenvolvimento em “php”, com distinção de criticidade por cores, com apontamentos para as ferramentas Nagios e Cacti e em utilização pela equipe do “Network Operation Center” do HIAE.

EXEMPLOS DE TELAS DE ALERTAS

WIKIPÉDIA – A enciclopédia livre - < http://pt.wikipedia.org/wiki/Nagios>, < http://pt.wikipedia.org/wiki/Cacti> acesso em 28/03/2014

Toland C, Meenan C, Warnock M, Nagy P. Proactively monitoring departmental clinical IT systems with an open source availability system. J Digit Imaging. 2007;20(Suppl 1):119–124. doi: 10.1007/s10278-007-9063-2.

Sweeney R. Monitoring your Enterprise PACS with Nagios®, Cacti and Smokeping – Whitepaper (11/03/04)

Nagios é um serviço de monitoração ativo de rede desenhado em código OPEN SOURCE com o intuito de informar gestores, gerentes e administradores de sistemas, em tempo real, eventuais problemas nos seus sistemas e redes. É possível monitorar tanto hosts quanto serviços, para que sejam gerados alertas quando ocorrerem problemas e também quando os problemas forem resolvidos. Através das suas telas de monitoração, os profissionais que trabalham com operações de TI podem obter insights sobre a saúde de toda a rede da organização através de uma visão centralizada.

Dentre várias possibilidades de monitoração possíveis com o Nagios, destacamos:

• Capacidade de monitoração dos serviços de rede (SMTP, POP3, HTTP, NNTP, ICMP, SNMP);

• Capacidade de monitoração dos recursos computacionais (carga do processador, uso de disco, logs do sistema);

• Capacidade de notificar quando um serviço ou equipamento apresenta problemas e quando o problema é resolvido (via email, pager, SMS ou qualquer outro meio definido pelo usuário por plugin);

• Capacidade de definir tratadores de eventos que executam tarefas em situações pré-determinadas ou para a resolução pró-ativa de problemas;

• Excelente interface web para visualização do atual status da rede, notificações, histórico de problemas, arquivos de log, etc.

Já o Cacti é também uma ferramenta OPEN SOURCE para administração de rede que recolhe e exibe informações sobre o estado de uma rede de computadores através de gráficos. Permite o monitoramento e gerenciamento de redes simples até redes complexas, com centenas de dispositivos. Desenvolvido para ser flexível de modo a se adaptar facilmente a diversas necessidades, monitora o estado de elementos de rede e programas, bem como largura de banda utilizada e uso de CPU.