Sự cố toàn cầu hôm 18/11 khiến ChatGPT, Shopify, X và hàng loạt website sập nguồn bắt nguồn từ một lỗi nhỏ trong hệ thống Cloudflare. Vì sao một công ty ít người biết lại có thể làm tê liệt cả Internet?

Trong hôm 18/11, hàng triệu người trên khắp thế giới cố gắng truy cập vào các website và ứng dụng yêu thích, nhưng tất cả bỗng dưng biến mất đầy bí ẩn. ChatGPT, Indeed, Shopify, Truth Social và X nằm trong số những nền tảng lớn bất ngờ bị đánh sập. Thủ phạm? Một công ty mà hầu hết mọi người thậm chí chưa từng nghe tới: Cloudflare.

Sự cố bắt đầu vào khoảng 5h20 sáng theo giờ miền Đông nước Mỹ (5h20 chiều 18/11 giờ VN) khi Cloudflare phát hiện những mô hình lưu lượng bất thường. Chỉ vài giờ sau, các website trên toàn Internet trở nên không thể truy cập với người dùng toàn cầu.

Đến giữa buổi sáng, Cloudflare đã triển khai bản vá, dù một số người dùng vẫn tiếp tục gặp sự cố. Công ty sau đó tiết lộ nguyên nhân: một tệp cấu hình được tạo tự động –về bản chất là tập hợp các hướng dẫn để quản lý lưu lượng Internet đáng ngờ – đã lớn hơn mức dự kiến và khiến hệ thống bị quá tải dẫn đến sập hoàn toàn.

Cloudflare là gì?

Cloudflare Inc. là một công ty Mỹ cung cấp hàng loạt dịch vụ Internet, bao gồm dịch vụ mạng phân phối nội dung, an ninh mạng, giảm thiểu DDoS, dịch vụ mạng diện rộng v.v...

Hãy hình dung Cloudflare như “vệ sĩ kiêm cảnh sát giao thông” của Internet. Khi bạn truy cập vào một website, bạn không kết nối trực tiếp tới máy chủ của công ty đó. Thay vào đó, yêu cầu của bạn thường đi qua hệ thống của Cloudflare trước.

Cloudflare giúp tăng tốc website, bảo vệ khỏi các cuộc tấn công mạng và quản lý lượng lưu lượng Internet khổng lồ. Họ xử lý khoảng 20% tổng lưu lượng web toàn cầu – tức hàng triệu website phụ thuộc vào hạ tầng của họ để duy trì hoạt động và an toàn.

Một trong những dịch vụ chủ chốt của họ là bảo vệ trước các cuộc tấn công DDoS (tấn công từ chối dịch vụ phân tán), khi kẻ xấu gửi hàng loạt lưu lượng giả nhằm đánh sập website. Cloudflare lọc bỏ các cuộc tấn công này trước khi chúng gây hại, giúp website vận hành ổn định.

Vì sao chỉ vài công ty lại kiểm soát gần như toàn bộ Internet?

Nhiều người có thể thắc mắc: nếu chỉ riêng Cloudflare gặp sự cố đã khiến ChatGPT, Shopify và X đồng loạt “tắt điện”, liệu điều đó có quá rủi ro? Câu trả lời là: đúng vậy.

Internet hiện đang ngày càng bị tập trung hóa, với chỉ vài tập đoàn hạ tầng – Cloudflare, Amazon Web Services, Microsoft Azure – nắm vai trò xương sống cho vô số website và ứng dụng.

Sự tập trung này xuất phát từ việc xây dựng và vận hành hạ tầng Internet là vô cùng đắt đỏ và phức tạp. Với hầu hết doanh nghiệp, thuê dịch vụ từ các nền tảng lớn sẽ thực tế hơn nhiều so với việc tự xây dựng. Nhưng sự tiện lợi này đi kèm mặt trái: khi một trong các nhà cung cấp gặp sự cố, hậu quả lan rộng là điều không thể tránh khỏi.

Vì sao những sự cố như thế này liên tục xảy ra?

Sự cố Cloudflare vừa qua hoàn toàn không phải cá biệt. Amazon Web Services gặp sự cố lớn chỉ mới trong tháng trước. Microsoft Azure cũng bị gián đoạn toàn cầu vào thời điểm tương tự.

Tháng 7 năm ngoái, một bản cập nhật lỗi từ CrowdStrike khiến hàng loạt chuyến bay phải hủy, bệnh viện tê liệt và doanh nghiệp toàn cầu gặp rối loạn.

Những hệ thống này vô cùng phức tạp, xử lý hàng tỷ yêu cầu mỗi giây. Như một phát ngôn viên Cloudflare mô tả, có những tệp cấu hình tự động có thể lớn bất thường, khiến hệ thống xảy ra lỗi dây chuyền. Dù các công ty đầu tư mạnh vào việc ngăn chặn sự cố, quy mô và độ phức tạp của hạ tầng Internet hiện đại khiến việc gián đoạn trở thành điều gần như không thể tránh.

Khi cuộc sống số của chúng ta ngày càng phụ thuộc vào các dịch vụ này, những sự cố kiểu này là minh chứng rõ ràng cho một thế giới siêu kết nối – và cũng vô cùng mong manh.

Theo AOL