Technology

Cloudflare menutup lalu lintasnya sendiri selama satu jam – Telco/ISP

Cloudflare telah menghubungkan pemadaman selama satu jam kemarin dengan kesalahan BGP yang membuat 19 pusat datanya tidak terlihat oleh Internet.

Perusahaan telah menerbitkan post-mortem dari pemadaman, yang disebabkan oleh iklan BGP yang secara tidak sengaja menarik pengumuman rute untuk pusat data yang terpengaruh.

“Sayangnya, 19 lokasi ini menangani sebagian besar lalu lintas global kami,” kata perusahaan itu.

“Pemadaman ini disebabkan oleh perubahan yang merupakan bagian dari proyek jangka panjang untuk meningkatkan ketahanan di lokasi tersibuk kami.

“Kami sangat menyayangkan pemadaman ini. Ini adalah kesalahan kami dan bukan hasil dari serangan atau aktivitas jahat.”

Garis waktu perusahaan menunjukkan bahwa pemadaman dimulai pada 06:27 UTC (16:27 AEST) pada 21 Juni, dan kasus ditutup pada 8:00 UTC.

Seperti yang dijelaskan dalam posting tersebut, Cloudflare telah melakukan proyek 18 bulan untuk mengubah pusat data tersibuknya menjadi “arsitektur yang lebih fleksibel dan tangguh” yang dijuluki “Multi-Colo PoP” (MCP).

Lokasi yang menggunakan arsitektur tersebut antara lain Amsterdam, Atlanta, Ashburn, Chicago, Frankfurt, London, Los Angeles, Madrid, Manchester, Miami, Milan, Mumbai, Newark, Osaka, São Paulo, San Jose, Singapura, Sydney, dan Tokyo.

BGP pelakunya

Lokasi MCP menggunakan instruksi perutean yang membuat jaringan koneksi, dan instruksi perutean tersebut dibawa dalam standar Internet yang disebut Border Gateway Protocol (BGP).

Antara lain, BGP memungkinkan operator menentukan kebijakan yang mengatur awalan alamat IP mana yang diiklankan oleh router ke rekan mereka, dan router rekan mana yang akan menerima iklan.

Seperti yang dijelaskan dalam posting: “Kebijakan ini memiliki komponen individual, yang dievaluasi secara berurutan. Hasil akhirnya adalah bahwa setiap awalan yang diberikan akan diiklankan atau tidak diiklankan.

“Perubahan kebijakan dapat berarti awalan yang diiklankan sebelumnya tidak lagi diiklankan, yang dikenal sebagai ‘ditarik’, dan alamat IP tersebut tidak lagi dapat dijangkau di Internet.”

Dan di situlah kesalahan peluncuran MCP Cloudflare: “Saat menerapkan perubahan pada kebijakan iklan awalan kami, pengurutan ulang istilah menyebabkan kami menarik subset awalan yang penting.”

Perubahan yang tidak disengaja itu membuat router tulang belakang tidak dapat dijangkau melalui Internet, sehingga awalnya sulit bagi para insinyur Cloudflare untuk mengaksesnya dan membalikkan perubahan tersebut.

Postingan tersebut menyoroti betapa kritisnya lokasi yang terkena dampak: “Meskipun lokasi ini hanya empat persen dari total jaringan kami, pemadaman berdampak pada 50 persen dari total jaringan kami. [HTTP] permintaan.”

Selain membuat lokasi yang terpengaruh tidak terlihat oleh Internet, ada satu lagi efek samping dari perubahan konfigurasi yang tidak disengaja: ini menonaktifkan sistem penyeimbangan beban internal perusahaan.

“Ini berarti bahwa cluster komputasi kami yang lebih kecil di MCP menerima jumlah lalu lintas yang sama dengan cluster terbesar kami, menyebabkan cluster yang lebih kecil kelebihan beban,” katanya.

Perusahaan mengatakan akan mengerjakan proses, arsitektur, dan otomatisasinya untuk menghindari terulangnya insiden tersebut.

Posted By : pengeluaran hk hari ini 2021