Tính sẵn sàng (availability) là gì?

What is Availability?

Tính sẵn sàng là gì?

Tính sẵn sàng là thước đo độ bền của một hệ thống. Nó được định nghĩa bằng thời gian hệ thống thực sự hoạt động (hoặc dịch vụ đang vận hành) chia cho tổng thời gian hệ thống có thể hoạt động.

Các mức độ tính sẵn sàng phổ biến

What are typical availability levels

Hệ thống thường được phân loại theo mức độ tính sẵn sàng dựa trên số lượng “chín” và được mô tả bằng các thuật ngữ như “độ sẵn sàng cao” và “khả năng chịu lỗi.” Nếu một hệ thống có độ sẵn sàng 99% (tương đương hai số chín), điều đó có nghĩa là hệ thống không hoạt động trong 1% thời gian còn lại. Trong một năm có 525.600 phút, hệ thống “hai số chín” có thể ngừng hoạt động khoảng 5.256 phút, tương đương 88 giờ hoặc 4 ngày. Tùy thuộc vào chi phí gián đoạn của bạn, con số này có thể gây tổn thất đáng kể.

Tính sẵn sàng Số lượng “chín” Thời gian gián đoạn mỗi năm Thường được mô tả là
99.9% Ba số chín Dưới 526 phút Có sẵn
99.99% Bốn số chín Dưới 53 phút Độ sẵn sàng cao
99.999% Năm số chín Dưới 5 phút Chịu lỗi

Các hệ thống có độ sẵn sàng trung bình ở mức “bốn số chín” và “năm số chín” thường được gọi là hệ thống có độ sẵn sàng cao hoặc chịu lỗi.

Tìm hiểu thêm: So Sánh Tính Sẵn Sàng Cao (HA) và Khả Năng Chịu Lỗi (Fault Tolerance)

Các phương pháp phổ biến để tăng độ sẵn sàng

Có nhiều phương pháp đã được chứng minh giúp doanh nghiệp cải thiện độ sẵn sàng, bao gồm nâng cao độ tin cậykhả năng phục hồi của hệ thống, triển khai quy trình sao lưukhôi phục dữ liệu, hoặc thiết lập cụm hệ thống dự phòng (vật lý hoặc ảo hóa) với dịch vụ chuyển đổi dự phòng (failover).

Sử dụng hệ thống đáng tin cậy và có khả năng phục hồi

Stratus ZtC Edge
Hệ thống bền bỉ, không quạt, đạt chuẩn IP-40

Một cách để cải thiện độ sẵn sàng là sử dụng hệ thống có độ tin cậy cao. Hệ thống càng bền bỉ, khả năng hư hỏng càng thấp. Khi ít bị gián đoạn hơn, hệ thống sẽ hoạt động liên tục hơn, từ đó nâng cao độ sẵn sàng.

Một phương pháp liên quan là triển khai hệ thống có khả năng phục hồi tốt – nghĩa là có thể nhanh chóng khôi phục sau sự cố. Khi giảm thời gian sửa chữa và khôi phục hệ thống, doanh nghiệp có thể giảm thời gian gián đoạn và tăng tổng thể độ sẵn sàng. Điều quan trọng là nếu một hệ thống có thể phục hồi nhanh chóng sau mỗi lần sự cố, thì tần suất xảy ra sự cố cũng trở nên ít quan trọng hơn.

Triển khai sao lưu và khôi phục dữ liệu

Triển khai sao lưu và khôi phục dữ liệu
Triển khai sao lưu và khôi phục dữ liệu

Dù hệ thống có đáng tin cậy đến đâu, vẫn tồn tại những giới hạn. Trong nhiều trường hợp, không chỉ độ sẵn sàng của hệ thống mà cả việc bảo vệ dữ liệuđảm bảo tính toàn vẹn của dữ liệu cũng rất quan trọng.

Các doanh nghiệp có chiến lược toàn diện về độ sẵn sàng thường thực hiện sao lưu dữ liệu định kỳ và duy trì hệ thống dự phòng. Nếu hệ thống sản xuất gặp sự cố nghiêm trọng, họ có thể nhanh chóng khôi phục dịch vụ trên hệ thống dự phòng và truy xuất dữ liệu từ bản lưu trữ.

Thiết lập hệ thống sao lưu và khôi phục yêu cầu chuyên môn và kỹ năng. Thời gian khôi phục có thể dao động từ vài giờ đến vài ngày, tùy thuộc vào ứng dụng, dung lượng dữ liệu và sự sẵn có của linh kiện thay thế.

Sử dụng cụm hệ thống (clustering) và dịch vụ chuyển đổi dự phòng (failover) tự nhiên và ảo hóa

Sử dụng cụm hệ thống và dịch vụ chuyển đổi dự phòng

Đối với một số doanh nghiệp, việc khôi phục dịch vụ sau vài giờ hoặc vài ngày có thể chấp nhận được. Nhưng với những doanh nghiệp có chi phí gián đoạn cao, họ cần một giải pháp mạnh mẽ hơn để đảm bảo ứng dụng và dữ liệu luôn sẵn sàng.

Cụm hệ thống và chuyển đổi dự phòng hoạt động dựa trên nguyên tắc tương tự như sao lưu và khôi phục, nhưng rút ngắn thời gian phục hồi bằng cách thực hiện một số bước chuẩn bị trước, chẳng hạn như nhân bản hệ thống để có thể hoạt động ngay lập tức khi cần. Nhiều hệ thống được kết hợp lại và chia sẻ dữ liệu với nhau. Thông thường, một hệ thống chính (primary) sẽ chịu trách nhiệm cung cấp ứng dụng và dữ liệu cho người dùng, trong khi hệ thống phụ (secondary) đóng vai trò dự phòng, có thể ở trạng thái chờ (passive) hoặc chạy các ứng dụng khác (active). Khi hệ thống chính gặp sự cố, ứng dụng sẽ “chuyển đổi dự phòng” (failover) sang hệ thống phụ và tiếp tục hoạt động, miễn là kết nối với dữ liệu được duy trì.

Với sự phát triển của công nghệ ảo hóa, các khái niệm về cụm hệ thống và chuyển đổi dự phòng đã được mở rộng sang các hệ thống ảo. Ngày nay, công nghệ ảo hóa và cụm hệ thống được sử dụng để kết hợp các hệ thống vật lý, đồng thời hỗ trợ chuyển đổi dự phòng cho các ứng dụng chạy trên máy ảo (VM), tận dụng tính di động của VM.

Stratus cung cấp những gì?

Stratus cung cấp nhiều giải pháp điện toán biên (edge computing) phù hợp với các yêu cầu về độ sẵn sàng khác nhau. Từ các sản phẩm phần mềm như everRun, đến các giải pháp hoàn chỉnh như ztC EdgeftServer, bao gồm cả phần cứng, phần mềm và dịch vụ. Stratus giúp khách hàng triển khai các hệ thống có độ sẵn sàng cao và khả năng chịu lỗi mạnh mẽ một cách dễ dàng và tiết kiệm chi phí.