Hãy tưởng tượng các ứng dụng quan trọng của một tổ chức – là yếu tố sống còn của hoạt động – bỗng nhiên ngừng hoạt động. Thời gian chết có thể gây gián đoạn nghiêm trọng, mất doanh thu, và thậm chí tổn hại đến danh tiếng. Điều này đặc biệt đúng với các ngành công nghiệp yêu cầu hoạt động liên tục, nơi mà chỉ một giây ngừng hoạt động cũng có thể gây ra ảnh hưởng lớn. Giới thiệu nền tảng Stratus ztC Endurance: một giải pháp mạnh mẽ được thiết kế để duy trì các ứng dụng quan trọng hoạt động liên tục mà không mất dữ liệu, dù ở các điểm biên hay trung tâm dữ liệu. Nó đạt được điều này như thế nào? Bằng cách sử dụng khả năng chống lỗi thông minh, quản lý thời gian hoạt động tự động và kiến trúc bền bỉ ưu tiên độ tin cậy.
Trong bài viết này, chúng ta sẽ khám phá nền tảng Stratus ztC Endurance, tìm hiểu các tính năng cốt lõi, lợi ích chính và cách nó hỗ trợ các ứng dụng quan trọng ở nhiều ngành công nghiệp.
Tổng Quan về Stratus ztC Endurance
Stratus ztC Endurance™ là gì?
Stratus ztC Endurance là nền tảng tính toán chống lỗi thông minh, dự đoán được, có dạng 2U, có sẵn trong các cấu hình từ cơ bản, trung bình đến cao cấp, dành cho việc chạy các ứng dụng phần mềm quan trọng. Các nền tảng này kết hợp các thành phần tiêu chuẩn công nghiệp hiệu suất cao, bao gồm bộ vi xử lý Intel Xeon thế hệ thứ 4, mạng tốc độ cao, bộ nhớ Zefr (zero failure rate) và bộ nhớ lưu trữ NVMe thể rắn.
Stratus ztC Endurance cho phép chuyển đổi dự đoán thông minh và bảo đảm khả năng hoạt động và dữ liệu lên đến 99.99999%. Dòng sản phẩm này phát triển từ sự kết hợp đã được chứng minh của Stratus giữa tính năng chống lỗi tích hợp, giám sát sức khỏe chủ động và khả năng bảo trì. ztC Endurance, cùng với lớp tự động hóa thời gian hoạt động và Smart Exchange™, mang lại hiệu suất bảo vệ, dự đoán được mà các trung tâm dữ liệu và môi trường biên hiện tại và tương lai cần, thông qua việc tận dụng các khả năng Intel RAS, bảo mật phần cứng và phần mềm tích hợp, và khả năng quản lý và bảo trì tăng cường nhờ kiến trúc mô-đun.
ztC Endurance hoạt động như thế nào?
Stratus ztC Endurance cho phép các tổ chức chạy các ứng dụng quan trọng mà không có thời gian chết hoặc mất dữ liệu, trong các môi trường biên hoặc trung tâm dữ liệu, nhờ vào khả năng chống lỗi dự đoán thông minh, tận dụng sự kết hợp độc đáo của Stratus giữa thiết kế phần cứng dự phòng, trình điều khiển phần cứng bảo mật và lớp tự động hóa thời gian hoạt động Smart Exchange. Nền tảng này cung cấp tính năng chống lỗi tích hợp mà không yêu cầu hệ điều hành và ứng dụng cần sửa đổi, không cần kịch bản bổ sung, cung cấp một hình ảnh hệ thống duy nhất cho người dùng, và cung cấp giám sát sức khỏe chủ động để đơn giản hóa việc hỗ trợ và bảo trì trong khi vận hành. Tất cả những điều này được thực hiện trong một kiến trúc mô-đun hơn, giúp dễ bảo trì và cung cấp sức mạnh để đáp ứng nhu cầu của các hoạt động bền vững thế hệ tiếp theo. Đây là một bước tiến khác của Stratus trong việc cung cấp tính toán tự động, bảo vệ và đơn giản.
Thông điệp chính của Stratus
Đơn Giản – Stratus ztC Endurance đơn giản hóa cách các tổ chức đạt được khả năng hoạt động 99.99999% cho các ứng dụng quan trọng với tính năng chống lỗi tích hợp, cho phép quản lý bởi nhân viên OT hoặc IT, và cho phép hợp nhất nhiều khối công việc trên một nền tảng duy nhất, giảm độ phức tạp và chi phí.
Bảo Vệ – Stratus ztC Endurance giảm thiểu rủi ro về vận hành, tài chính và danh tiếng bằng cách đảm bảo khả năng hoạt động “luôn bật”, loại bỏ thời gian chết của ứng dụng hoặc mất dữ liệu, đồng thời bảo vệ dữ liệu và ứng dụng khỏi các mối đe dọa mạng.
Tự Động – Stratus ztC Endurance vận hành các ứng dụng quan trọng một cách tự động mà không cần thời gian chết hay can thiệp của con người, và cho phép quản lý từ xa từ các địa điểm tập trung. Nền tảng này được thiết kế đặc biệt để tự phục hồi và cung cấp giám sát sức khỏe dự đoán, chủ động, giúp phát hiện và giải quyết các vấn đề tiềm ẩn trước khi chúng xảy ra.
Ai sử dụng
Nền tảng Stratus ztC Endurance được thiết kế để đáp ứng nhu cầu ứng dụng quan trọng của cả đội ngũ OT và IT.
Dành cho các nhà lãnh đạo IT chịu trách nhiệm triển khai và quản lý các nền tảng IT hỗ trợ các hoạt động kinh doanh phức tạp tại các điểm biên hoặc trung tâm dữ liệu, Stratus ztC Endurance cung cấp thời gian hoạt động 99.99999% và khả năng chống lỗi mà người dùng, ứng dụng và hệ điều hành không cần phải biết đến, loại bỏ nhu cầu về kịch bản hoặc sửa đổi bổ sung.
Dành cho các nhà lãnh đạo OT đầu tư vào các chương trình tự động hóa mới yêu cầu các nền tảng Edge Computing để vận hành các phần mềm phức tạp của Industry 4.0, Stratus ztC Endurance đảm bảo khả năng hoạt động liên tục của các ứng dụng quan trọng chạy ở điểm biên, trung tâm dữ liệu vi mô và trung tâm vận hành với thời gian hoạt động 99.99999%, giúp các đội OT dễ dàng cài đặt, quản lý và bảo trì, từ đó thúc đẩy sự chuyển đổi nhanh chóng cơ sở hạ tầng tính toán để hiện đại hóa các hoạt động và triển khai các phần mềm phức tạp.
Stratus ztC Endurance cung cấp đổi mới trong 5 lĩnh vực hiệu suất chính
Dự đoán – ztC Endurance giới thiệu khả năng chống lỗi dự đoán thông minh thông qua Stratus Automated Uptime Layer với Smart Exchange, theo dõi và nhắm đến một phạm vi điểm lỗi rộng hơn so với các giải pháp độc lập và siêu hội tụ khác. ztC Endurance cũng tự động thực hiện các hành động khắc phục để giải quyết và khắc phục các vấn đề trước khi chúng ảnh hưởng đến hoạt động.
Bảo vệ– ztC Endurance đảm bảo tính toàn vẹn dữ liệu và bảo vệ khỏi mất mát dữ liệu ứng dụng đang xử lý với khả năng sẵn có hệ thống ứng dụng lên đến 7 chín (99.99999%) và cung cấp các tính năng bảo mật phần cứng và phần mềm tích hợp, cùng khả năng chạy các ứng dụng bảo mật mạng của bên thứ ba để bảo vệ tài sản IT và OT.
Quản lý được– Là một hệ thống mở, ztC Endurance đơn giản hóa việc quản lý với khả năng giám sát từ xa và các API quản lý có thể tương tác với các công cụ và hệ thống IT hiện có mà các đội IT quen thuộc. Ngoài ra, ztC Endurance và kiến trúc chống lỗi của nó hỗ trợ các hệ điều hành tiêu chuẩn mà không cần sửa đổi. Để đơn giản hóa việc triển khai và quản lý, ztC Endurance cung cấp một hình ảnh hệ thống duy nhất, làm cho tính năng dự phòng của nó trở nên trong suốt đối với các ứng dụng, loại bỏ sự cần thiết phải viết kịch bản hoặc sửa đổi bổ sung.
Dễ bảo trì – Kiến trúc mô-đun dự phòng của ztC Endurance có bốn (4) cặp đơn vị thay thế do khách hàng thay thế (CRUs) – mô-đun tính toán, mô-đun I/O, bộ cấp nguồn và bộ lưu trữ – có thể thay thế nóng bởi OT hoặc IT mà không cần chuyên môn hay công cụ đặc biệt để duy trì thời gian hoạt động và vận hành hiệu quả.
Hiệu suất– ztC Endurance kết hợp công nghệ mới nhất, đặc biệt là bộ vi xử lý Intel Xeon Scalable “Sapphire Rapids” thế hệ thứ 4, NVMe tốc độ cao và bộ nhớ DDR5 bền bỉ, hiệu suất cao, mang lại mức hiệu suất mới cùng với khả năng chống lỗi cần thiết để hợp nhất các ứng dụng quan trọng và vận hành các phần mềm phức tạp và ứng dụng tiên tiến.
Kiến trúc hệ thống của Stratus ztC Endurance
Kiến trúc hệ thống của Stratus ztC Endurance – Phần cứng
Thiết kế mô-đun dễ bảo trì
ztC Endurance là nền tảng ứng dụng quan trọng được thiết kế để cung cấp cả hiệu suất cao và khả năng chống lỗi trong một hệ thống duy nhất. Xây dựng trên các đơn vị thay thế do khách hàng thay thế (CRUs) dự phòng trong thế hệ Stratus ftServer® trước đó, kiến trúc ztC Endurance mang đến một thiết kế mô-đun dự phòng dễ bảo trì hơn nữa. Thay vì phải thay thế toàn bộ bộ thành phần hệ thống trong một CRU khi một thành phần bị hỏng, ztC Endurance bao gồm bốn cặp mô-đun CRU (tổng cộng tám) như sau:
- Mô-đun tính toán
- Mô-đun I/O
- Mô-đun lưu trữ
- Bộ cấp nguồn (PSU)
Kiến trúc mô-đun này cải thiện quy trình thay thế các thành phần bị lỗi bằng cách cho phép người dùng chỉ cần tháo mô-đun bị lỗi và thay thế bằng mô-đun mới, trong khi các mô-đun còn lại vẫn được kết nối và vận hành. Điều này đảm bảo tính khả dụng của tài nguyên hệ thống mọi lúc và đơn giản hóa quy trình thay thế các thành phần bị lỗi, giúp đội ngũ không chuyên cũng có thể thay thế mô-đun khi cần thiết.
Mô-đun tính toán
Loại mô-đun CRU đầu tiên trong máy chủ ztC Endurance là mô-đun tính toán. Mỗi ztC Endurance chứa hai mô-đun tính toán giống hệt nhau, có thể thay thế nóng và được cắm vào/ tháo ra từ phía trước của khung hệ thống. Mô-đun tính toán là một đơn vị độc lập, bao gồm bo mạch chủ, bộ xử lý và bộ nhớ. Ngoài ra, mỗi mô-đun tính toán còn bao gồm một ổ đĩa SSD NVMe M.2 nội bộ (được gọi là thiết bị khởi động dự phòng), quạt làm mát và nhiều cảm biến nội bộ để giám sát sức khỏe hệ thống.
Mô-đun I/O
Loại mô-đun CRU thứ hai trong ztC Endurance là mô-đun I/O. Hệ thống có hai mô-đun I/O giống hệt nhau, có thể thay thế nóng và được cắm / tháo từ phía sau khung hệ thống. Mỗi mô-đun I/O là một đơn vị độc lập bao gồm các giao diện mạng nhúng (hai cổng đồng 10 Gb và một cổng đồng 1 Gb) và 5 khe PCIe phụ trợ, cho phép mỗi mô-đun I/O của ztC Endurance hỗ trợ tối đa 5 thiết bị PCIe. Cổng giao diện đồng 1 Gb được sử dụng độc quyền cho cổng quản lý hệ thống; nó giao tiếp với giao diện người dùng, Mạng ActiveService (ASN) để gọi về, gửi cảnh báo qua email, cung cấp truy cập từ xa vào BMC (bộ điều khiển quản lý bo mạch), và báo cáo tình trạng giám sát sức khỏe. Các mô-đun I/O sử dụng giao diện PCIe Gen4 tiêu chuẩn ngành mới nhất, giúp tăng băng thông giao tiếp nội bộ và cung cấp hiệu suất tối đa cho hệ thống I/O.
Trong mỗi mô-đun I/O có một bộ chuyển mạch PCIe có thể cấu hình trực tuyến để kết nối mô-đun I/O với một trong các mô-đun tính toán trong hệ thống. Mỗi mô-đun I/O cũng bao gồm cảm biến nhiệt độ và cảm biến điện áp để giám sát sức khỏe của hệ thống. Ngoài ra, các mô-đun I/O hỗ trợ điều khiển nguồn độc lập cho các bộ điều hợp mạng nhúng và từng khe cắm thiết bị PCIe để sử dụng trong các hoạt động phục hồi khi có sự cố.
Mô-đun lưu trữ
Mô-đun lưu trữ là loại mô-đun CRU thứ ba trong máy chủ ztC Endurance. Hệ thống có hai mô-đun lưu trữ giống hệt nhau, có thể thay thế nóng, mỗi mô-đun chứa tối đa sáu ổ đĩa SSD NVMe có thể thay thế nóng. Mỗi mô-đun lưu trữ phải được lắp đầy với các ổ đĩa có cấu hình giống nhau về số lượng ổ đĩa, dung lượng của ổ đĩa, v.v. PCIe fabric được cấu hình trong mỗi mô-đun lưu trữ luôn kết nối với mô-đun tính toán hoạt động trong suốt quá trình vận hành bình thường của hệ thống. Các trình điều khiển phần mềm RAID 1 chạy trên hệ điều hành của khách hàng sẽ sao chép dữ liệu giữa các ổ đĩa tương ứng giữa các mô-đun lưu trữ để cung cấp khả năng lưu trữ và dữ liệu dư thừa cho hệ thống. Quản lý hệ thống trong ztC Endurance cho phép cấu hình cặp ổ đĩa sao chép này ngay từ khi triển khai ban đầu hoặc có thể tái cấu hình ngay trong khi hệ thống đang hoạt động.
ztC Endurance đạt được khả năng có sẵn dữ liệu bằng cách cung cấp sự dư thừa lưu trữ hoàn toàn giữa các ổ đĩa tương ứng trong hai mô-đun lưu trữ; các ổ đĩa và mô-đun lưu trữ hoạt động theo cấu hình hoạt động / hoạt động, có nghĩa là dữ liệu được ghi vào cả hai ổ đĩa cùng một lúc. Vì dữ liệu luôn được sao chép đầy đủ, nó vẫn luôn có sẵn ngay cả khi một ổ đĩa gặp sự cố.
Đơn vị cung cấp nguồn (PSU)
Đơn vị Cung cấp Nguồn (PSU) là loại mô-đun CRU cuối cùng trong hệ thống ztC Endurance. Hai PSU giống hệt nhau, có thể thay thế nóng, có thể cắm hoặc tháo từ phía sau khung hệ thống và hoàn toàn dư thừa. Sự dư thừa này đạt được bằng cách phân bổ hai PSU cho một hệ thống phân phối nguồn nội bộ chung, thay vì phân bổ cho các thành phần, phụ trợ, hoặc mô-đun nội bộ riêng biệt. Điều này cho phép toàn bộ máy chủ ztC Endurance có thể hoạt động chỉ với một PSU, nếu một PSU gặp sự cố, đơn vị còn lại vẫn sẽ cung cấp nguồn cho hệ thống.
Các thành phần khách hàng có thể thay thế
Các mô-đun CRU có thể thay thế nóng giúp ztC Endurance dễ bảo trì, cho phép người dùng không chuyên có thể thay thế một thành phần bị hỏng hoặc thêm hoặc nâng cấp một thành phần hiện có mà không cần dịch vụ hiện trường hoặc tại nhà máy. Để thay thế một thành phần có thể thay thế bởi khách hàng, khách hàng phải tháo mô-đun CRU chứa thành phần đó và thay thế bộ phận mới. Khách hàng cũng có thể thay thế khung máy bằng cách tháo tất cả các mô-đun khỏi khung gốc và lắp chúng vào khung mới.
Các thành phần khách hàng có thể thay thế | CRU Module | Thay thế | Nâng cấp |
DIMMS | Mô-đun Tính toán | Y | Y |
Ổ đĩa | Mô-đun Lưu trữ | Y | Y |
Thẻ PCIe | Mô-đun I/O | Y | Y |
Khung máy | N/A | Y | N/A |
Kiến trúc hệ thống của Stratus ztC Endurance – Quản lý hệ thống
- Quản lý hệ thống – Là một nền tảng ứng dụng quan trọng cung cấp tính toán không cần can thiệp (zero-touch computing – ztC), ztC Endurance cung cấp các chức năng quản lý hệ thống sau để giám sát sức khỏe hệ thống, cung cấp giao diện người dùng để truy cập các chức năng giám sát và cấu hình, hỗ trợ giám sát trực tiếp và từ xa, và tự động quản lý quá trình duy trì tính sẵn sàng giữa các tài nguyên trong hệ thống:
- Giám sát sức khỏe – Hệ thống quản lý đọc các đầu vào sức khỏe hệ thống từ nhiều nguồn khác nhau và xác định các hành động cần thực hiện tự động để đảm bảo tính sẵn sàng của hệ thống. Các nguồn dữ liệu cho đầu vào giám sát sức khỏe hệ thống bao gồm:
– BMCs – Hệ thống quản lý đọc Nhật ký Sự kiện Hệ thống (SELs) của BMC và giao tiếp với BMC để giám sát nhiệt độ hệ thống, mức điện áp và dòng điện, tốc độ quạt, và các tham số liên quan đến khung hệ thống.
– Hệ thống RAS – Hệ thống quản lý sử dụng các tính năng và chức năng về Độ tin cậy, Sẵn sàng và Dễ bảo trì (RAS) của các bộ xử lý, bộ nhớ và các hệ thống PCIe để giám sát sức khỏe các phân hệ và nhận thông báo về nhiều điều kiện, suy giảm và lỗi tiềm ẩn.
- Giao diện người dùng (UI) – Hệ thống quản lý cung cấp giao diện người dùng để quản lý hệ thống, cấu hình, giám sát và chẩn đoán.
- Giám sát tại chỗ – Hệ thống quản lý hỗ trợ các phương pháp giám sát tại chỗ (như cảnh báo qua e-mail, SNMP và REST APIs) để thông báo cho khách hàng khi có sự cố hệ thống xảy ra.
- Giám sát từ xa – Hệ thống quản lý hỗ trợ các phương pháp giám sát từ xa, như “call home” tới Stratus qua Mạng Dịch vụ Chủ động Stratus (Stratus ActiveService Network – ASN).
- Phối hợp Mô-đun tính toán – Hệ thống quản lý cho phép phối hợp và giao tiếp giữa các mô-đun tính toán chính và dự phòng.
- Xác định chuyển đổi tính toán (Failover) – Hệ thống quản lý đánh giá các đầu vào giám sát sức khỏe để xác định xem có cần thiết phải thực hiện chuyển đổi tính toán (Smart Exchange) hay không, khi có lỗi hoặc khi dự báo lỗi sắp xảy ra.
- Thực thi chuyển đổi tính toán – Hệ thống quản lý hỗ trợ quá trình chuyển đổi tính toán (Smart Exchange) để chuyển quá trình xử lý của khách hàng từ mô-đun tính toán chính sang mô-đun dự phòng nếu có lỗi được phát hiện hoặc khi một lỗi sắp xảy ra.
Kiến trúc Stratus ztC Endurance – Phương pháp chống lỗi
Đảm bảo tính sẵn sàng liên tục thông qua kiến trúc chống lỗi
Để đảm bảo tính chống lỗi, nền tảng ztC Endurance sử dụng phần cứng dự phòng và khả năng chuyển đổi dự phòng thông minh, tự động thực hiện hành động để tránh sự cố hệ thống khi phát hiện sự cố phần cứng hoặc dự đoán khả năng hỏng hóc của phần cứng.
ztC Endurance áp dụng phương pháp “Nhận diện -> Cách ly -> Cung cấp dịch vụ” để đạt được tính chống lỗi. Nếu một thành phần nội bộ được nhận diện là hỏng (hoặc có khả năng hỏng), thành phần đó sẽ tự động bị loại khỏi hoạt động mà không ảnh hưởng đến khối lượng công việc tính toán của khách hàng, cho phép các ứng dụng của khách hàng tiếp tục hoạt động và dữ liệu vẫn có thể truy cập. Sau khi bị loại, mô-đun CRU hỏng có thể được thay thế trong khi máy chủ vẫn tiếp tục chạy mà không làm gián đoạn các hoạt động kinh doanh của khách hàng.
Hệ thống ztC Endurance tự động cung cấp sự bảo vệ chống lỗi này một cách không rõ ràng đối với ứng dụng. Tính năng dự phòng phần cứng và khả năng chống lỗi của hệ thống được ẩn (hoặc ẩn sau màn hình) từ góc độ hệ điều hành / hypervisor, máy ảo (VM) và ứng dụng. Điều này cung cấp một hình ảnh hệ thống duy nhất cho hệ điều hành/hypervisor, máy ảo và ứng dụng, cho phép khách hàng chạy các hệ điều hành tiêu chuẩn của khách hàng và các ứng dụng tiêu chuẩn, off-the-shelf trên nền tảng ztC Endurance mà không yêu cầu thiết lập đặc biệt, cấu hình tùy chỉnh hay thay đổi mã nguồn. Hệ điều hành/hypervisor, máy ảo, ứng dụng và dữ liệu của khách hàng sẽ được bảo vệ tự động khỏi sự cố và thời gian chết chỉ bằng cách chạy trên hệ thống ztC Endurance, và không cần thực hiện thêm công việc nào.
Nền tảng ztC Endurance đạt được tính sẵn sàng thông qua các phương thức khác nhau. Mô-đun tính toán áp dụng phương pháp chủ động / dự phòng để đảm bảo tính sẵn sàng. Điều này có nghĩa là mô-đun tính toán dự phòng thứ hai sẽ được kích hoạt nếu hệ thống phát hiện khả năng hỏng của mô-đun tính toán chủ động. Các mô-đun I/O, lưu trữ và cung cấp điện mang đến tính sẵn sàng ở chế độ chủ động / chủ động nhờ các hệ thống phụ trợ hoàn toàn dự phòng.
Tính sẵn sàng liên tục thông qua lớp uptime tự động với Smart Exchange (AUL – Smart Exchange)
Lớp Uptime Tự Động với Smart Exchange (AUL – Smart Exchange) của Stratus tự động quản lý quá trình giám sát và duy trì tính sẵn sàng trên tất cả các subsystem của ztC Endurance. Điều này loại bỏ sự cần thiết phải can thiệp của con người để duy trì tính sẵn sàng của hệ thống và ngăn ngừa mất dữ liệu. Làm việc cùng với các tính năng Độ tin cậy, Tính sẵn sàng và Khả năng dịch vụ (RAS) trong kiến trúc bộ vi xử lý Intel và trí tuệ từ hơn bốn mươi năm xây dựng hệ thống chống lỗi của Stratus, Lớp Uptime Tự Động với Smart Exchange giám sát sức khỏe hệ thống để dự đoán khi nào sự cố thành phần có thể xảy ra, hoặc thực hiện hành động phục hồi sức khỏe hệ thống và ngăn ngừa sự cố. Khi quá trình giám sát chủ động xác định rằng việc tự phục hồi không thành công và một sự cố có khả năng xảy ra, hệ thống bắt đầu quá trình loại bỏ thành phần hỏng khỏi hoạt động. AUL-Mart Exchange cũng quản lý quá trình kích hoạt hoặc quản lý kết nối với subsystem dự phòng còn lại, đảm bảo tính sẵn sàng của hệ thống và bảo vệ khỏi mất dữ liệu.
Kiến trúc Stratus ztC Endurance – Smart Exchange™
Tính sẵn sàng tài nguyên tính toán: Công nghệ Smart Exchange™ của Stratus
Công nghệ Smart Exchange của Stratus và Lớp Uptime Tự Động với Smart Exchange là những khả năng chính hỗ trợ tính sẵn sàng 99,99999% của tài nguyên tính toán trong nền tảng ztC Endurance. Lớp Uptime Tự Động với Smart Exchange tận dụng các tính năng Độ tin cậy, Tính sẵn sàng và Khả năng dịch vụ (RAS) trong kiến trúc bộ vi xử lý Intel để giám sát sức khỏe hệ thống và dự đoán khi nào sự cố thành phần có thể xảy ra. Khi quá trình giám sát chủ động xác định rằng sự cố có khả năng xảy ra, hệ thống bắt đầu quá trình loại bỏ thành phần hỏng khỏi hoạt động. Nếu sự cố xảy ra ở mô-đun tính toán, công nghệ Smart Exchange của Stratus bắt đầu quá trình kích hoạt mô-đun tính toán dự phòng và quản lý việc chuyển giao dữ liệu từ nút tính toán hỏng sang mô-đun tính toán dự phòng đã được kích hoạt.
Khi Smart Exchange chuyển các hoạt động sang mô-đun tính toán dự phòng đã kích hoạt, nó thực hiện các bản cập nhật lặp đi lặp lại (đến bộ nhớ của hệ thống dự phòng) để đảm bảo tính sẵn sàng của hệ thống và toàn vẹn dữ liệu trong quá trình chuyển đổi. Hiệu suất hệ thống có thể bị giảm trong thời gian Smart Exchange tự động cập nhật mô-đun khỏe mạnh. Tài nguyên tính toán vẫn tiếp tục có sẵn trong suốt khoảng thời gian này – gọi là thời kỳ giảm công suất. Khi tất cả các bản cập nhật bộ nhớ hoàn tất, hệ thống sẽ không khả dụng trong khoảng thời gian khoảng 1,2 giây khi quá trình chuyển đổi từ mô-đun tính toán hỏng sang mô-đun tính toán dự phòng được hoàn tất. Thời gian chuyển đổi này được gọi là thời kỳ ngừng hoạt động.
Nguyên lý hoạt động của Stratus ztC Endurance
1. Phần cứng hoàn toàn dự phòng
Cách hoạt động
Bốn (4) cặp mô-đun khách hàng thay thế được (CRUs) xây dựng với các thành phần tiêu chuẩn công nghiệp – mô-đun tính toán, lưu trữ, I/O và nguồn điện
Các mô-đun dự phòng sử dụng đa đường IO để đảm bảo khả năng sẵn sàng
Các trình điều khiển Stratus được cứng hóa là yếu tố quan trọng cho độ dự phòng I/O và lưu trữ
Lợi ích
Các mô-đun tính toán có thể thay thế nóng bởi người dùng OT hoặc IT; không yêu cầu công cụ chuyên dụng
Nền tảng dự đoán sự cố và tự động chuyển tải công việc từ mô-đun tính toán chủ sang mô-đun dự phòng trong vài giây
2. Khả năng chịu lỗi dựa trên phần cứng
Cách hoạt động
Công tắc PCIe Fabric kết nối mô-đun tính toán “Hoạt động” và mô-đun tính toán “Dự phòng”
Chuyển trạng thái CPU, hệ điều hành và tải công việc từ mô-đun tính toán “Hoạt động” sang mô-đun tính toán “Dự phòng” trước khi xảy ra lỗi
Lợi ích
Khả năng chịu lỗi dựa trên phần cứng loại bỏ thời gian chuyển đổi
Không mất dữ liệu đang xử lý hoặc gián đoạn trong quá trình giao dịch
Không yêu cầu thay đổi phần mềm hay kịch bản chuyển đổi
3. Stratus Automated Uptime Layer (AUL) với Smart Exchange
Cách hoạt động
Phần mềm Stratus Automated Uptime Layer với Smart Exchange hoạt động trên toàn bộ hệ thống ztC Endurance
Quản lý việc nhận diện, cô lập và xử lý lỗi
Giám sát 500 điểm về sức khỏe nền tảng và hiệu suất thành phần
Khởi tạo Smart Exchange nếu dự đoán có lỗi không thể phục hồi ở mô-đun tính toán
Lợi ích
Cung cấp khả năng tự chuẩn đoán, tự chữa lỗi và giám sát sức khỏe chủ động bao gồm cảnh báo
Các cảnh báo về sức khỏe nền tảng được gửi qua Mạng Stratus ActiveService™ (ASN) hoặc qua các giao thức chuẩn như SNMP traps, OPC UA, REST APIs, và các giao thức khác
Các mô hình của Stratus ztC Endurance
Các nền tảng Stratus ztC Endurance dễ dàng triển khai, dễ dàng quản lý và bảo trì. Chúng tôi cung cấp ba mô hình Stratus ztC Endurance khác nhau để đáp ứng nhu cầu về tải công việc, môi trường và ngân sách của các doanh nghiệp và các điểm mạng biên hiện nay.
Hiệu suất hợp lý cho các ứng dụng độc lập ổn định trong các văn phòng xa, văn phòng chi nhánh hoặc khu vực sản xuất
Tính linh hoạt và đa dạng cho các ứng dụng phát triển nhanh hoặc thay đổi trong các văn phòng khu vực, nhà máy xa hoặc trung tâm dữ liệu khu vực
Hiệu suất cao cho các ứng dụng yêu cầu dữ liệu hoặc giao dịch lớn trong các nhà máy xa lớn hoặc trung tâm dữ liệu công ty
ztC Endurance System Specifications | 3100 | 5100 | 7100 | |||
Compute Module | ||||||
Processor(s) | 1 x Intel® Xeon® Silver 4410Y processor 2.0 GHz | 2 x Intel® Xeon® Silver 4410Y processor 2.0 GHz | 2 x Intel® Xeon® Gold 5418Y processor 2.0 GHz | |||
All Core Turbo Max Frequency Max Turbo Frequency | 2.8 GHz 3.9 GHz |
2.8 GHz 3.9 GHz |
2.8 GHz 3.8 GHz |
|||
Intel® Hyper-threaded Cores | 12 per processor/ 12 per compute module | 12 per processor/ 24 per compute module | 24 per processor/ 48 per compute module | |||
Threads | 24 per processor/ 24 per compute module | 24 per processor/ 48 per compute module | 48 per processor/ 96 per compute module | |||
Min/max memory | 64 GB / 256 GB DDR5 RDIMMS | 128 GB / 512 GB DDR5 RDIMMS | 256 GB/ 1024 GB DDR5 RDIMMS | |||
Intel UPI speed | 16 GT/s | 16 GT/s | 16 GT/s | |||
Maximum memory speed | 4000 MT/s | 4000 MT/s | 4400 MT/s | |||
USB Port | 2 USB 3.0 (non-redundant) per compute module | 2 USB 3.0 (non-redundant) per compute module | 2 USB 3.0 (non-redundant) per compute module | |||
I/O Module | ||||||
Integrated PCIe® adapter slots | 5 PCIe 4 x8 per I/O module |
5 PCIe 4 x8 per I/O module |
5 PCIe 4 x8 per I/O module |
|||
10 Gb Ethernet ports | 4 / 2 per I/O module | 4 / 2 per I/O module | 4 / 2 per I/O module | |||
1 Gb Ethernet management ports | 2 / 1 per I/O module | 2 / 1 per I/O module | 2 / 1 per I/O module | |||
10 Gb dual-port Ethernet server PCIe adapter (fiber & copper) |
Up to 5 optional per I/O module1 | |||||
25 Gb dual-port Ethernet server PCIe adapter (fiber & copper) | Up to 5 optional per I/O module1 | |||||
32 Gb Fibre Channel PCIe adapter | Up to 5 optional per I/O module | |||||
Storage Module | ||||||
Internal system drive bays | 6 per storage module NVMe PCIe Gen 4 | |||||
Internal 2.5″ drives | ||||||
Manageability | ||||||
Alerts & Notifications | SNMP support, email alerts, REST API, and ActiveService Network (ASN) | SNMP support, email alerts, REST API, and ActiveService Network (ASN) | SNMP support, email alerts, REST API, and ActiveService Network (ASN) | |||
Baseboard management controller | Standard | Standard | Standard |
Tính năng của Stratus ztC endurance
Khi sử dụng Stratus ztC Endurance, các tổ chức có thể hiện đại hóa nhanh chóng cơ sở hạ tầng CNTT để tối đa hóa độ tin cậy, đơn giản hóa khả năng quản lý và tăng hiệu quả với rủi ro tối thiểu. Một số tính năng chính giúp ztC Endurance dễ dàng triển khai, dễ dàng quản lý và dễ dàng bảo trì – tại trung tâm dữ liệu doanh nghiệp, trung tâm vận hành hoặc các điểm mạng biên:
Khả năng chịu lỗi thông minh và dự đoán
Stratus ztC Endurance cung cấp khả năng chịu lỗi tích hợp, hoàn toàn trong suốt đối với các ứng dụng mà không cần kịch bản hay thay đổi phần mềm. Phần mềm Stratus Automated Uptime Layer với Smart Exchange™ (AUL – Smart Exchange) tự động quản lý tài nguyên hệ thống để đảm bảo tính sẵn sàng liên tục đồng thời cung cấp một hình ảnh hệ thống duy nhất cho hệ điều hành, ứng dụng và người dùng. AUL – Smart Exchange giám sát gần 500 điểm cảnh báo để dự đoán và tránh lỗi tiềm ẩn trước khi chúng xảy ra, hành động trước khi ảnh hưởng đến hoạt động.
Giám sát sức khỏe chủ động
Stratus ztC Endurance cung cấp khả năng tự giám sát, cảnh báo, tự chuẩn đoán và sửa lỗi tự động. Sử dụng Mạng Stratus ActiveService™ (ASN) hoặc các phương pháp giám sát hiện có của tổ chức, Stratus, đối tác và/hoặc khách hàng có thể nhận thông tin sức khỏe nền tảng và các cảnh báo. Trong hầu hết các trường hợp, AUL – Smart Exchange nhận diện và giải quyết các vấn đề tiềm ẩn trước khi chúng xảy ra, đồng thời giữ cho các nhóm liên quan luôn được thông báo.
Các thành phần tiêu chuẩn công nghiệp
Stratus ztC Endurance được thiết kế với các thành phần tiêu chuẩn công nghiệp chất lượng cao nhất – chipset Intel, RDIMM, thẻ I/O, thẻ mạng và ổ NVMe. Nền tảng này chạy hệ điều hành và hypervisor tiêu chuẩn, hỗ trợ các giao diện lập trình ứng dụng (API) tiêu chuẩn ngành và phần mềm bảo mật mạng để dễ dàng quản lý, tương tác mở, quản lý từ xa và bảo mật. Stratus xây dựng trên thiết kế này với các trình điều khiển được cứng hóa và khả năng chịu lỗi tích hợp.
Tích hợp tải công việc
Stratus ztC Endurance cung cấp tính linh hoạt để chạy các ứng dụng quan trọng trên phần cứng trần – với sự lựa chọn hệ điều hành tiêu chuẩn ngành từ Microsoft hoặc RedHat – hoặc tích hợp tải công việc với hypervisor mà bạn chọn – cho dù là VMware vSphere hay Microsoft Windows Server với Hyper-V. Với khả năng ảo hóa tích hợp, các nhóm có thể dễ dàng hợp nhất nhiều máy chủ và thiết bị vào một nền tảng chịu lỗi, cho phép chạy nhiều ứng dụng hơn, cải thiện hiệu suất, giảm thiểu không gian và chi phí CNTT đồng thời đảm bảo tính sẵn sàng và thời gian hoạt động của ứng dụng.
Dễ quản lý và bảo trì cho OT và IT
Stratus ztC Endurance đơn giản hóa khả năng quản lý với khả năng giám sát từ xa và các API quản lý tương thích với các hệ thống tiêu chuẩn. ztC Endurance cũng dễ dàng bảo trì mà không cần kỹ năng hoặc công cụ CNTT chuyên dụng. Nền tảng này có bốn cặp mô-đun thay thế cho khách hàng (CRU) có thể thay thế nóng. Khi một mô-đun CRU được thay thế, hệ thống tự động đưa mô-đun vào hoạt động, giúp ztC Endurance lý tưởng cho các môi trường có nguồn lực IT hạn chế.
Thiết kế mô-đun với các mô-đun CRU dự phòng
Mỗi nền tảng ztC Endurance có bốn cặp mô-đun thay thế cho khách hàng (CRU) giống nhau—hai mô-đun tính toán, hai mô-đun lưu trữ, hai mô-đun I/O và hai mô-đun nguồn điện. Cùng với AUL – Smart Exchange, các cặp mô-đun CRU dự phòng hoạt động như một hệ thống duy nhất, duy trì mức độ sẵn sàng 99.99999%.
Kết nối với cơ sở hạ tầng quan trọng
Stratus ztC Endurance cung cấp mức độ tin cậy tính toán cao nhất, cho phép thu thập dữ liệu quan trọng và kết nối với hệ thống doanh nghiệp, dù ở trung tâm dữ liệu hay tại các điểm mạng biên. Nền tảng này đảm bảo truy cập nhanh chóng và bảo mật đến dữ liệu quan trọng trong Mạng Lưu Trữ (SAN) của bạn với kết nối Fibre Channel đáng tin cậy. ztC Endurance cho phép cái nhìn tổng quan từ một giao diện duy nhất về cơ sở hạ tầng tự động hóa công nghiệp của bạn với OPC-UA Server, tích hợp khả năng tương thích và bảo mật tiêu chuẩn cho kết nối với các cảm biến kỹ thuật số, thiết bị công nghiệp và ứng dụng phần mềm công nghiệp.
Lợi ích của Stratus ztC Endurance
- Sẵn sàng 99.99999% cho các ứng dụng quan trọng: Khả năng chịu lỗi tính toán tích hợp mang lại mức độ sẵn sàng 99.99999% để chạy các ứng dụng quan trọng.
- Không mất dữ liệu: Kiến trúc tính toán dự phòng kết hợp với quản lý tự động thông minh ngăn ngừa mất dữ liệu đang xử lý và đảm bảo tính toàn vẹn dữ liệu.
- Quản lý và hỗ trợ “Zero Touch”: Thiết kế mô-đun cộng với giám sát sức khỏe từ xa chủ động và khả năng tự chữa lỗi giúp đơn giản hóa việc quản lý hệ thống và bảo trì cho cả nhóm IT và OT.
- Hiện đại hóa nhanh chóng và tích hợp tải công việc: Cập nhật cơ sở hạ tầng và đơn giản hóa hoạt động bằng cách sử dụng ảo hóa để hợp nhất nhiều tải công việc phần mềm lên một nền tảng duy nhất.
- Bảo mật đa lớp: Hỗ trợ các phương pháp phòng thủ sâu đa lớp, tập trung vào cả bảo mật quy trình và bảo mật sản phẩm để đảm bảo bảo vệ tối đa.
- Giảm tổng chi phí sở hữu (TCO): Giảm bớt không gian CNTT và mua ít giấy phép phần mềm hơn trên một nền tảng có độ tin cậy cao với tuổi thọ dự kiến từ 7-10 năm, gấp đôi so với máy chủ truyền thống.
Stratus ztC Endurance so với các giải pháp thay thế
Tại Sao Chọn Stratus
Stratus là công ty tiên phong trong lĩnh vực tính toán chịu lỗi. Với hơn 40 năm hoạt động, công ty đã xây dựng tên tuổi bằng việc cung cấp giải pháp tính toán chịu lỗi để đảm bảo việc xử lý giao dịch trong các dịch vụ tài chính và viễn thông. Ngày nay, khả năng này đã được mở rộng ra hầu hết các ngành công nghiệp và các trường hợp sử dụng yêu cầu tính sẵn sàng của ứng dụng, không có thời gian chết hoặc mất dữ liệu. Ba trong số bốn mạng thẻ tín dụng lớn nhất của Mỹ, 8/10 công ty năng lượng lớn nhất, và 5/10 nhà bán lẻ lớn nhất đều tin dùng Stratus.
Nền tảng ztC Endurance của Stratus được phát triển từ việc phân tích hơn 100 triệu giờ vận hành trên hàng nghìn khách hàng, giúp Stratus hiểu rõ nguyên nhân gây ra sự cố và cách chủ động ngăn ngừa chúng trước khi xảy ra. Nếu bạn cần một nền tảng tính toán để vận hành các ứng dụng mà không gặp phải thời gian chết, Stratus chính là lựa chọn hàng đầu.
Xem thêm: Stratus Technologies |
Servo Dynamics – Nhà phân phối chính thức của Stratus Technologies tại Việt Nam
Xem thêm: Servo Dynamics – Nhà phân phối chính thức của Stratus tại Việt Nam |
Dịch vụ của Servo Dynamics cho ztC Endurance
Servo Dynamics cung cấp nhiều dịch vụ hỗ trợ và dịch vụ nhằm duy nhất một mục tiêu – đảm bảo khả năng hoạt động liên tục lâu dài của hệ thống và thời gian hoạt động cho các ứng dụng quan trọng của bạn. Để đảm bảo hiệu suất tối ưu mà không có thời gian ngừng hệ thống, Dịch vụ Hỗ trợ của Servo Dynamics cung cấp các dịch vụ chủ động đáp ứng các yêu cầu cụ thể của bạn và đảm bảo tình trạng hoạt động tốt của nền tảng ztC Endurance, bao gồm các thành phần phần cứng và phần mềm bên dưới.
Các tùy chọn dịch vụ của chúng tôi bao gồm:
- Hỗ trợ tối đa hóa khả năng hoạt động của nền tảng
- Giám sát sức khỏe chủ động với Stratus ASN hoặc phương pháp bạn chọn
- Nguồn hỗ trợ toàn diện từ một nguồn duy nhất
- Phân tích nguyên nhân gốc rễ ngăn chặn tái phát sự cố
- Công cụ hỗ trợ trực tuyến
- Hỗ trợ Toàn diện (Total Assurance)
- Hỗ trợ Nền tảng Mở rộng (Extended Platform Support)
Câu hỏi thường gặp
Stratus ztC Endurance cho phép chuyển đổi dự phòng dự đoán thông minh, cung cấp hiệu suất được bảo vệ và đáng tin cậy nhờ vào lớp Uptime Layer tự động với Smart Exchange™, cùng với khả năng quản lý và bảo trì tăng cường qua kiến trúc mô-đun độc đáo không có ở các nền tảng khác. Sự kết hợp các tính năng này, cùng với khả năng RAS từ Stratus và Intel, bảo mật phần cứng và phần mềm tích hợp, chỉ có ở ztC Endurance.
Stratus ztC Endurance được xây dựng trên các thành phần và công nghệ mới nhất, mang lại hiệu suất cao hơn 40% so với ftServer, tăng khả năng mô-đun để dễ dàng bảo trì, và có khả năng chịu lỗi dự đoán thông minh, lý tưởng cho các hoạt động bền vững thế hệ mới.
Stratus ztC Endurance hỗ trợ VMware vSphere 8.0 ngay từ khi ra mắt. Hiện tại, chúng tôi đang lên kế hoạch phát hành hỗ trợ cho Windows Server và Red Hat Enterprise Linux vào nửa cuối năm 2024.
Mặc dù giá của Stratus ztC Endurance cao hơn so với các máy chủ đa năng thông thường với mức sẵn sàng dưới 99%, nhưng giá của nó vẫn thấp hơn hoặc ngang bằng với các nền tảng sẵn sàng cao khác trên thị trường, theo nghiên cứu của các nhà phân tích ngành. Không giống như các máy chủ đa năng truyền thống, các cụm sẵn sàng cao, hoặc hệ thống hạ tầng hội tụ (HCI), ztC Endurance có tính năng tích hợp sẵn sàng chịu lỗi mà không cần thêm mã kịch bản hay chỉnh sửa để đạt mức sẵn sàng 99,99999%. Trong khi đó, các phương pháp chịu lỗi khác đòi hỏi nhiều máy chủ, giấy phép, và kết nối mạng, làm tăng chi phí cho doanh nghiệp và không cung cấp tính sẵn sàng liên tục, dễ quản lý, hoặc dễ bảo trì như ztC Endurance. Ngoài ra, các nền tảng của Stratus đã được chứng minh có tuổi thọ dịch vụ tối thiểu từ 7 đến 10 năm, gấp đôi so với các máy chủ thông thường, giúp giảm đáng kể tổng chi phí sở hữu (TCO) cho giải pháp điện toán chịu lỗi.
Mặc dù lockstep (hai CPU chạy đồng bộ) là một phương pháp chịu lỗi cực kỳ tin cậy trên ftServer, các tiến bộ trong hiệu suất xử lý hiện nay cho phép Stratus cung cấp mức chịu lỗi tương đương hoặc tốt hơn, đồng thời tận dụng các tính năng mới trong chip Intel như chế độ Turbo Mode và các bộ chỉ thị AVX, vượt trội hơn các giới hạn của xử lý lockstep.
Hiện tại, 220V là tùy chọn duy nhất cho các hệ thống này. Điều này cũng tương đồng với các máy chủ truyền thống trên thị trường với sức mạnh xử lý tương tự. Nhìn chung, yêu cầu về nguồn điện cho các máy chủ trong ngành công nghiệp ngày càng tăng theo sức mạnh và độ phức tạp của xử lý. Chúng tôi dự đoán rằng 220V sẽ tiếp tục là tiêu chuẩn ngành trong tương lai.
Đối với ztC Endurance, chúng tôi vẫn duy trì yêu cầu về nguồn điện như ftServer trong khi cải thiện đáng kể sức mạnh xử lý, dung lượng lưu trữ và chỉ cần một dây nguồn để cung cấp cho hệ thống dự phòng.
Mặc dù thế hệ đầu tiên của ztC Endurance chỉ cung cấp cấu hình chip Xeon 4 thế hệ 2.0 GHz, nền tảng này được thiết kế để hỗ trợ một loạt các chip Xeon Scalable thế hệ thứ 4 của Intel. Cần lưu ý rằng có nhiều yếu tố ảnh hưởng đến hiệu suất tổng thể của hệ thống ngoài tốc độ xung nhịp CPU. Thông thường, tốc độ xung nhịp cao hơn đi kèm với số lõi thấp hơn. Đây là một xu hướng của ngành công nghiệp, và Intel đặc biệt đã chọn nhấn mạnh vào việc sử dụng các bộ tăng tốc và các bộ chỉ thị bổ sung thay vì tốc độ xung nhịp để cải thiện hiệu suất.
Khi xem xét các cấu hình máy chủ thay thế trên thị trường, tất cả đều gặp phải sự đánh đổi giữa số lõi và tốc độ xung nhịp. Chỉ có một số ít cấu hình sử dụng chip cấp máy chủ với tốc độ xung nhịp cao, do cũng phải đối mặt với sự đánh đổi giữa số lõi và tốc độ xung nhịp.
Quan trọng nhất, Stratus kiểm tra các nền tảng của mình với các đối tác công nghệ như Rockwell Automation và AVEVA để cung cấp các kiến trúc phần cứng và phần mềm được xác thực trước nhằm đảm bảo hiệu suất và triển khai nhanh chóng.