Conforme explicámos num artigo relacionado, muitos gestores de TI contam inúmeras histórias de períodos de inatividade nas suas salas de servidores distribuídas e repartidores técnicos remotos causados por acontecimentos inesperados, mas bastante habituais. Ao analisar essas histórias, surge um elo comum: a falta de informação que leva ao erro humano, que por sua vez causa períodos de inatividade.

Considere estas estatísticas:

  • A IDC estima que existam 2,9 milhões de salas de servidores e repartidores técnicos apenas nos Estados Unidos da América.
  • Mais de 70% dos cortes de energia nos centros de dados reportados são diretamente atribuídos a erro humano, de acordo com o Uptime Institute.
Pode conceber um sistema de monitorização para fornecer as informações de que precisa para evitar períodos de inatividade dispendiosos. Para um sistema cuja função principal seja limitar a ocorrência de erros humanos em salas de servidores remotos, considere estes quatro componentes chave: videovigilância, sensores, tomadas inteligentes de bastidor e software de monitorização e automatização.

Videovigilância e sensores

Os sistemas escaláveis de monitorização e automatização podem recolher, organizar e distribuir alertas críticos e vídeos de vigilância. Ao monitorizar a alimentação elétrica, o arrefecimento, as partes dianteiras e traseiras dos bastidores e o ambiente, estes sistemas podem gerar um aviso de falha imediato, permitir a rápida avaliação da situação e fornecer uma solução para eventos críticos em infraestruturas que possam afetar negativamente a disponibilidade do sistema de TI.

Os sistemas de videovigilância podem ser ligados a sensores de movimento, de forma a que, sempre que seja detetado qualquer movimento, ele ative a câmara que varre a área e envie o vídeo para um administrador autorizado, que pode retificar rapidamente situações como um prestador de serviços a retirar um servidor ativo.

Um sistema de gestão de câmaras permite, tipicamente, seguir o pessoal das instalações, fabricantes, pessoal de segurança, custodiantes e outros visitantes que entrem na sala de servidores ou no repartidor técnico remoto. Um administrador pode optar por aceder remotamente ao sistema e observar as ações de qualquer pessoa que se encontre na sala. Alguns sistemas podem ser equipados com altifalantes para que o administrador possa fornecer instruções ou avisos ao visitante.

Tomadas inteligentes de bastidor

As tomadas inteligentes de bastidor, também conhecidas por PDU montadas em bastidor, são longas réguas de tomadas elétricas montadas no interior da parte traseira do bastidor. Estes dispositivos permitem aos utilizadores encerrarem e reiniciarem remotamente um equipamento bloqueado e configurar a sequência na qual a alimentação é ligada ou desligada para cada tomada, para determinar previamente que peça do equipamento é desligada em primeiro lugar para que outros equipamentos dependentes dessa unidade funcionem corretamente.

O sistema de monitorização evita sobrecargas, medindo o consumo efetivo através de tomadas inteligentes de bastidor, fornecendo aos administradores a informação de que precisam para tomar decisões sobre o local de colocação de novos equipamentos.

Software de monitorização e automatização

Um sistema de gestão e automatização fornece aos administradores inúmeros dados que irão reduzir os períodos de inatividade causados por erro humano, incluindo:
  • Emissão de alarmes e notificações quando os limiares são excedidos, através de e-mail, mensagem de texto, chamada telefónica ou qualquer outro método escolhido pelo utilizador.
  • Verificações do estado do equipamento, dos servidores às baterias. Lembre-se de que a falha de uma única bateria pode resultar na perda da carga crítica. O custo da substituição de uma ou duas baterias é mínimo em comparação com o de uma falha que leve ao colapso do armário ou do servidor.
  • Relatórios de análise: Os dados recolhidos por um sistema de monitorização podem ser convertidos em relatórios personalizados para o administrador de TI rever. Estes relatórios podem alertar os administradores de situações como as oscilações da temperatura, quem esteve em que bastidor durante quanto tempo e quanta carga existe numa UPS em particular.
  • Configuração em massa: Os administradores podem emitir ordens de alteração em massa para todos os dispositivos perfilados no sistema central de monitorização e automatização, como o bloqueio de 50 portas de bastidor em simultâneo – eventualmente, para os proteger do excesso de zelo do pessoal de limpeza.
  • Controlo: Os dados detalhados do sistema de monitorização e automatização ajudam a fornecer aos administradores as informações de que necessitam para assumir o controlo quando surgem problemas. Por exemplo, um sistema pode criar um mapa do circuito da energia e das relações e dependências físicas do sistema, assim ajudando a identificar a fonte de um problema. Um sistema também pode ilustrar as consequências da falha de um dispositivo em particular num equipamento baseado em bastidor, para ajudar a identificar um impacto crítico no negócio.
Um maior controlo sobre o ambiente, mais alertas e mais dados históricos podem ajudar a promover um ambiente com menos tensão – e menos períodos de inatividade. Saiba mais transferindo o White Paper da APC by Schneider Electric “De que Forma os Sistemas de Monitorização Reduzem a Falha Humana nas Salas de Servidores e nos Armários de Cablagem.”