Questa mattina abbiamo riscontrato problemi massivi con perdite di pacchetti sulla portante del nostro carrier principale, tuttavia l’upstream risultava funzionare almeno in parte e le sessioni BGP ridondante sono rimaste attive.
Per questo motivo i nostri sistemi non hanno effettuato lo switchover automatico che avrebbe risolto il tutto entro 30 secondi. Abbiamo quindi provveduto manualmente ad effettuare lo switchover sugli altri carrier e le portanti ridondanti ed ora la situazione sembra essersi normalizzata.
Non appena riceviamo riscontro e report sul guasto da parte del carrier provvedo ad aggiornare questo post.
Nel frattempo ringrazio per la pazienza.
Thomas Moroder
UPDATE #1:
Il carrier ci ha contattato descrivendo la situazione come segue (inglese):
Some customers with their services connected at Munich, or in transit through this location, may have experienced packet loss and/or connectivity issues during some minutes, since 09:20 CEST.
The root cause of this issue has been a misconfiguration on Cogent network, that has caused a few routers at our network to bring online with duplicated router IDs, and some IP addresses duplicated as well , which impacted internal BGP sessions and caused routing issues for the traffic crossing through this hub.
The misconfiguration has been corrected now, and the devices causing the duplicated configuration have been isolated from the network. No further impact is expected due to this.
We truly apologize for any inconvenience this may have caused.
Il problema quindi sembra essere stato risolto anche lato carrier, provvediamo ad effettuare uno switchback ripristinando il best-hop routing.
Ultimi commenti