Tolerância a Falhas e Balanceamento de Carga em Redes Multi-Homing

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar

Autor: Helton Porto
Orientador: Eraldo Silveira e Silva
Co-Orientadores: Marcelo Sobral


RESUMO ESTENDIDO

Hoje em dia, o mundo vem a cada dia se tornando dependente de novas tecnologias e principalmente dos serviços de telecomunicações. O acesso à internet e outros meios de comunicação estão sendo vistos como algo trivial para as pessoas, principalmente no mundo corporativo. Com esta dependência, Provedores de Serviços (ISP) ou operadoras que proveem serviços de conexão de acesso a internet a seus clientes, vem se aplicando em estudos e serviços para a uma total disponibilidade.

Uma única conexão ao ISP, com um único caminho de saída, é comumente chamado de redes stub, e para que uma rede stub possua a capacidade de tolerar falhas na sua conexão lógica/física ao seu provedor (ou provedores), é necessário redundância de enlaces físicos. Tais redes podem ser chamadas de redes stub multi-homing. Existem várias opções de redundância física. De forma geral, pode-se ter (i) um gateway da rede stub conectado ao ISP via dois ou mais enlaces, ou ainda, (ii) dois ou mais gateways da rede stub, cada um com enlace para o ISP (ou diferentes ISPs).

Dentro das possibilidades acima pode-se ter um enlace primário (ativo) com um ou mais enlaces em estado de redundância passiva (hot-standby), ou ainda, pode-se ter todos enlaces ativos implementando-se alguma forma de balanceamento de carga. Em adição, o cliente proprietário da rede stub pode desejar aplicar diferentes estratégias para o tráfego que sai de sua rede (outgoing traffic) e para o que entra (ingoing traffic).

Existem varias tecnologias e diferentes formas de implementar a redundância passiva e o balanceamento de carga. Por exemplo, é possível usar os protocolos que permitem redundância com a técnica de duplicação de gateway como o VRRP (Virtual Router Redundancy Protocol), um protocolo não proprietário descrito na RFC 3768, e os protocolos proprietários da Cisco, HSRP (Hot Standby Router Protocol) e GLBP (Gateway Load Balancing Protocol), que também provê balanceamento de carga no primeiro salto. Protocolos de roteamento também podem ser usados como OSPF e BGP que também possuem mecanismos para implementar tais características em camada de rede.

Este trabalho visa comparar os protocolos apontados acima no que tange a capacidade de implementar os vários cenários descritos. Pretende-se também avaliar o desempenho e levantar limitações de cada um. Finalmente, pretende-se demonstrar uma implantação real de um cenário de redundância, desde o projeto, simulação, implantação e avaliação do desempenho do sistema.

ESQUELETO DO DOC TCC1

1.Introdução (1 página)

O mundo vem a cada dia se tornando dependente de novas tecnologias e principalmente dos serviços de telecomunicações. O acesso à internet e outros meios de comunicação estão sendo vistos como serviços triviais para as pessoas, principalmente no mundo corporativo. Com esta dependência, Provedores de Serviços (ISP) ou operadoras que proveem serviços de conexão de acesso a internet e comunicação de dados a seus clientes, vem se aplicando em novas tecnologias, estudos e serviços para a uma total disponibilidade. Uma única conexão a rede (ISP), com um único caminho de saída, é comumente chamado de redes stub, e para que uma rede stub possua a capacidade de tolerar falhas na sua conexão lógica/física ao seu provedor (ou provedores), é necessário redundância de enlaces físicos. Tais redes podem ser chamadas de redes stub multi-homing. Existem várias opções de redundância física. De forma geral, pode-se ter (i) um gateway da rede stub conectado ao ISP via dois ou mais enlaces, ou ainda, (ii) dois ou mais gateways da rede stub, cada um com enlace para o ISP (ou diferentes ISPs).

Dentro das possibilidades acima pode-se ter um enlace primário (ativo) com um ou mais enlaces em estado de redundância passiva (hot-standby), ou ainda, pode-se ter todos enlaces ativos implementando-se alguma forma de balanceamento de carga. Em adição, o cliente proprietário da rede stub pode desejar aplicar diferentes estratégias para o tráfego que sai de sua rede (outgoing traffic) e para o que entra (ingoing traffic). Existem varias tecnologias e diferentes formas de implementar a redundância passiva e o balanceamento de carga. Por exemplo, é possível usar os protocolos que permitem redundância com a técnica de duplicação de gateway como o VRRP (Virtual Router Redundancy Protocol), um protocolo não proprietário descrito na RFC 3768, e os protocolos proprietários da Cisco, HSRP (Hot Standby Router Protocol) e GLBP (Gateway Load Balancing Protocol), que também provê balanceamento de carga no primeiro salto. Protocolos de roteamento também podem ser usados como OSPF e BGP que também possuem mecanismos para implementar tais características em camada de rede. Este trabalho visa comparar os protocolos apontados acima no que tange a capacidade de implementar os vários cenários descritos. Pretende-se também avaliar o desempenho e levantar limitações de cada um. Finalmente, pretende-se demonstrar uma implantação real de um cenário de redundância, desde o projeto, simulação, implantação e avaliação do desempenho do sistema.

2.Fundamentação Teórica (20 páginas)

2.1.Conceitos Tolerância a Falhas

No ambiente de redes de computadores, sempre se estará sujeito a falhas de equipamentos indisponibilizando os recursos oferecidos e muitas vezes importantes para seus usuários. Um projeto de rede pode ser estudado para viabilizar a tolerância as falhas. Para isso, alguns conceitos devem ser estudados.

2.1.1.Redundância

A redundância é definida como a "capacidade de um sistema em superar a falha de um de seus componentes através do uso de recursos redundantes" (PINHEIRO, 2004). Para isso, um sistema depende de recursos alternativos, alem do principal, que estejam disponíveis para assumir o sistema assim que a falha ocorrer.

A redundância é termo muito usual e não se prende apenas em redes de computadores. Ela pode ser embarcada em vários sistemas como: energia, aviação, maquinas industriais e outros. A finalidade de um recurso redundante é suprir integral ou parcialmente os serviços, visando sempre que as funções mínimas do sistema estejam em funcionamento.


2.1.2.Contingência

Pinheiro (2004) define contingencia como: “possibilidade de um acontecimento futuro de uma condição existente, incerteza sobre as condições operacionais envolvidas e a resolução destas condições dependerem de eventos futuros”, ou seja, a possibilidade de um fato ocorrer ou não, com uma situação de risco existente, com certo grau de probabilidade de acontecer.

Portanto, quando se projeta um sistema, deve-se definir em conjunto um plano de contingencia, plano este que deve visar manter o sistema, caso ocorra uma falha, de natureza diversa, quando este estiver executando tal processo.

Para isso um estudo de cada um dos processos em particular, quais os riscos envolvidos em cada um deles, de como afetariam o sistema, quais seriam os mais impactantes, quais as áreas mais críticas, o que poderia paralisar o sistema, e o tempo de restabelecimento para cada fase, são questões que norteiam o plano de contingencia.

Medidas preventivas e planejadas, que suportem, por exemplo, falhas de software, hardware, base de dados, energia, temperatura, perda do link de comunicação e de causas naturais, devem estar incluídas no plano de contingenciamento, ou seja, ações imediatas, para serem executadas, visando o restabelecimento dos serviços, mesmo que parcialmente, diminuindo o tempo de paralisação, caso ocorra uma falha.

O plano de contingencia deve ter alta disponibilidade de informações de monitoramento, ser implantado de maneira que, de um modo seguro e eficiente, possa-se gerenciar/solucionar os problemas ocorridos, e que, se possível, seja pró-ativo e disponibilize a solução da falha independentemente de ações externas, minimizando os impactos, e apenas mantendo relatório dos fatos ocorridos.



2.1.3.Disponibilidade

2.1.4.Balanceamento


-Conceito de disponibilidade, tolerância a falta e balanceamento de cargas em rede -roteamento na internet -Tecnologias para a conexão de redes stubs com ISPs -redes multihoming

2.2.Tecnologias para Redundância de acesso no primeiro hop.

A multiplicação de gateway padrão é umas das tecnologias usadas para redundância no primeiro hop. Este recurso é utilizado através de protocolos de rede, e fazem com que a rede fique protegida por dois ou mais equipamentos gateway da rede (CPE), caso haja uma falha no equipamento e também nas interfaces de acesso a rede externa. Os roteadores trocam mensagens entre eles com varias informações, que podem transferir o status do gateway em espera como ativo ou vice-versa. Os protocolos são o HSRP, VRRP e o GLBP.

2.2.1.HSRP

O HSRP (Hot Standby Router Protocol) é um protocolo de rede definido pela RFC 2281 desenvolvido e proprietário da Cisco. Aplicado em um domínio de rede, em dois ou mais roteadores, cada roteador terá seu ip fixo da rede e também o ip gateway padrão do domínio, comum em todos os roteadores, e chamado de ip virtual. Desta forma o gateway dos dispositivos finais da rede não precisa ser alterado. Os roteadores trocam mensagens hello a cada 3 segundos através do endereço multicast 224.0.0.2, usando a porta UDP 1985. Para definir o gateway ativo (link principal) ou stand-by (link back-up) no domínio, é dado prioridades nos roteadores. O roteador que tiver maior prioridade é eleito como ativo. O valor padrão da prioridade é 100, e se não definido, o roteador que tiver o maior valor ip é eleito ativo, mas geralmente se define estaticamente por escolha do administrador da rede. O HSRP é configurado nos roteadores para que se houver uma falha em alguma regra estabelecida no roteador como queda de interface ou falta de conectividade no próximo hop (WAN), decrementa-se o valor de sua prioridade, afim do roteador vizinho se tornar ativo. Caso normalize as regras o roteador dado como link principal volta a sua prioridade e seu status como ativo.

2.2.2.VRRP O protocolo VRRP é muito semelhante ao HSRP, porem é um protocolo aberto e definido pela RFC 3678, podendo ser usado em qualquer equipamento que suporte o protocolo. O VRRP diferente do HSRP, define o status dos roteadores como máster para o ativo e backup para os demais. As mensagens trocadas pelos roteadores são chamados de Link-State Advertisement (LSA), através do endereço multicast 224.0.0.18. Caso ocorra alguma falha no roteador mestre, o mesmo envias mensagens para o backup assumir o status de master.

2.2.3.GLBP

O GLBP (Gateway Load Balancing Protocol), também é um protocolo proprietário da Cisco, semelhantes aos protocolos já mencionados porem além de fazer redundância de rede ele suporta balanceamento de carga. A principal diferença do GLBP em relação aos demais é que ele consegue atribuir diferentes endereços MAC para um mesmo IP Virtual(KRAEMER, et al., 2010, p. 2). Os roteadores eleitos back-up também são encaminhadores e ativos. No GLBP existem dois tipos de gateways ativos: o Gateway Virtual Ativo (AVG) e o Gateway Virtual Encaminhador (AVF). O AVG é eleito pelo grupo e os AVF são seus backups. A cada solicitação ARP feita ao AVG é devolvido o MAC Virtual de outro roteador AVF. Com este mecanismo, o endereço MAC do gateway armazenado na tabela ARP do cliente não é o mesmo em todas as estações, permitindo o balanceando da carga [Satapati et al.,2004, pp.02].

2.2.4.Cenário de Múltiplos Links

Existem vários cenários, diferentes topologias e meios de acesso a rede. A multiplicação de links wan's são os mais comuns para a aplicação num plano de contingencia. Ela pode ser fornecida por um único ou diferentes provedores de acesso. Múltiplas conexões são conhecidas como redes multi-homing e aplicadas de varias maneiras. Iremos explorar três topologias diferente.

2.2.4.1.Multi-homing com CPE único

Esta configuração permite ter mais de um acesso wan, porem os links são concentrados em apenas um CPE. A redundância fica apenas no enlace entre o cliente e operadora. Nesta topologia os protocolos de duplicidade de gateway (HSRP, VRRP e GLBP) não são aplicáveis porém se utiliza dos protocolos de enlace e roteamento para prover redundância. Nos acessos simétricos, em que os links sã iguais, pode ser aplicado balanceamento de carga entre os links.Em acessos assimétricos, ou seja, links de diferentes velocidades é mais comum que se utilize o plano de links principal e backup.

2.2.4.1.1.Multilink PPP

2.2.4.1.2.Balanceamento por pacotes e destino

2.2.4.1.3.Acesso Diferenciados

2.2.4.1.4.Sessões BGP


2.2.4.2.Multi-homing com múltiplos CPEs

  -VRRP etc
  -BGP prepend,MED, local preference, peso
  -OSPF e RIP
  IRDP
  -proxy ARP

2.3.Integração de Balanceamento de Carga nas estruturas de acesso

2.4.Utilização integrada de VRRP com BGP

2.6.Aspectos de Desempenho dos Sistema

2.5.Conclusão

3.Proposta (5 páginas)

Cronograma

Etapas/Mes dezembro/2012 janeiro/2013 fevereiro/2013 março/2013
Conclusão do Resumo estendido x x
Ler artigos, textos, livros, entre outros, sobre o tema definido e iniciar a fundamentação teórica. x x
Conclusão da fundamentação teórica e elaboração dos objetivos e proposta do Trabalho de Conclusão de Curso. x x x
Entrega do documento e Defesa do TCC I x

Referências Bibliográficas

HINDEN. “RFC 3768: Virtual Router Redundancy Protocol (VRRP)", Abril 2004. Disponível em: <http://www.ietf.org/rfc/rfc3768.txt>. Acesso em: 29 jan. 2013.

KRAEMER, VILAR, GOLDMAN. Tolerância a Falhas utilizando protocolos de Gateway Redundantes. Disponível em: http://www.ime.usp.br/~gold/publications/pdf/erad2010.pdf. Acesso em: 29 jan. 2013.

Links Interessantes

Border Gateway Protocol Best Practices : Discute propostas da Verizon para redundância. Não explora balanceamento de carga.

Build Redundant IP Routing

[http://lib.tkk.fi/Dipl/2011/urn100430.pdf Redundancy and load balancing at IP layer in access and aggregation networks]

Building Redundant Networks in Data Centers

Soluções de Balanceamento e Contingência em Circuitos WAN


http://netgroup.polito.it/teaching/prlc/LAN%20-%20L3%20redundancy.pdf

http://www.iitg.ernet.in/gb/papers/comsnets09_loadbalance.pdf

http://www.h3c.com/portal/Products___Solutions/Products/Security_Products/H3C_SecBlade_Module/H3C_SecBlade_LB/White_Paper/200907/641567_57_0.htm

http://oreilly.com/catalog/bgp/chapter/ch06.html

http://www.cse.msu.edu/~lxiao/publications/ICDCS-08.pdf

http://www.aedb.br/seget/artigos10/324_SEGET%20-2010%20-%20Artigo.pdf

http://www.csc.kth.se/utbildning/kth/kurser/DD2491/ipro2-09/lectures/bgp_load_balancing.pdf

http://www-rp.lip6.fr/~augustin/augustin07measuring.pdf

http://www.projetoderedes.com.br/artigos/artigo_conceitos_de_redundancia.php#.UStqGaK9zuY