Trong một bài đăng trên blog trước, tôi đã nói về việc thiết kế các triển khai RAC của bạn với N + 1 dự phòng. Điều này đảm bảo việc mất một nút không lấn át các nút còn lại nếu một nút bị lỗi. Hôm nay, tôi sẽ thảo luận về tác động của việc hợp nhất máy chủ, cụ thể là lõi CPU và các tác động N + 1 tiềm năng của nó.
Một trong những hệ thống chính mà tôi làm việc hôm nay là một cụm Oracle RAC bốn nút. Mỗi nút có 4 lõi. Tôi được cấp phép cho tất cả 16 lõi (4 lõi / nút * 4 nút =16 lõi tổng số) trong môi trường của mình. Tôi đã thiết kế hệ thống này với N + 1 dự phòng. Nếu tôi mất một nút và mất 4 lõi, tôi vẫn ổn vì nhu cầu khối lượng công việc của tôi chỉ yêu cầu 12 lõi để duy trì mức hiệu suất bình thường, có thể chấp nhận được.
Khi hệ thống này được thiết kế ban đầu, các máy chủ 4 lõi đã trở nên phổ biến. Môi trường ngày nay đã khác và ngày càng khó tìm thấy các máy chủ 4 lõi. Chúng vẫn tồn tại, nhưng các nhà cung cấp phần cứng đang thúc đẩy các hệ thống có số lượng lõi lớn hơn.
Trong một cuộc trò chuyện với SysAdmin của tôi gần đây, anh ấy muốn đặt hàng các hệ thống 6 lõi để thay thế các máy chủ 3 năm tuổi của chúng tôi. Chà, chúng tôi không thể đơn giản làm điều đó. Giấy phép Oracle của tôi dành cho 16 lõi. Tôi có thể triển khai ba hệ thống 6 lõi, nhưng sau đó tôi sẽ có tổng cộng 18 lõi trong cụm và tôi cần có thêm 2 lõi có giá trị giấy phép Oracle. Nếu tôi triển khai hai hệ thống 6 lõi, tôi sẽ có tổng cộng 12 lõi và có 4 lõi có giá trị giấy phép chưa được sử dụng.
Tôi cũng đã thông báo cho SysAdmin về thiết kế N + 1 của chúng tôi. Tác động của việc chuyển sang hệ thống 6 lõi có thể ảnh hưởng lớn đến thiết kế N + 1. Hãy nhớ rằng tôi đã nói trước đó rằng nhu cầu khối lượng công việc của chúng tôi yêu cầu 12 lõi để duy trì mức hoạt động bình thường. Nếu chúng tôi triển khai các máy 6 lõi, thì hai trong số chúng đáp ứng các yêu cầu của chúng tôi và một nút khác, “+1”, sẽ cần thiết để đảm bảo chúng tôi có thể mất một nút mà không ảnh hưởng lớn đến hiệu suất. Chúng tôi cần triển khai ba máy 6 lõi để giữ nguyên mục tiêu thiết kế N + 1 của mình. Nhưng điều này có nghĩa là chúng tôi cần tăng số lượng giấy phép của mình như tôi đã nêu trước đó.
Tại thời điểm này, SysAdmin của tôi nghĩ rằng anh ấy có một ý tưởng hay… chúng tôi có thể mua hai máy chủ 8 lõi. Đó vẫn là tổng số 16 lõi và chính xác là những gì chúng tôi được cấp phép cho ngày hôm nay. Không tăng lệ phí giấy phép. Nhưng nếu chúng tôi mất một nút, chúng tôi sẽ giảm xuống tổng số 8 lõi đang hoạt động, ít hơn tôi cần. Điều này mang lại một điểm rất tốt…
Ngay bây giờ, không có câu trả lời dễ dàng. Chúng tôi vẫn có thể mua các máy chủ 4 lõi để đó là những gì chúng tôi sẽ thay thế các máy chủ hiện tại vào năm sau. Nhưng sẽ có ngày máy chủ 4 nhân không thể tìm thấy. Chúng tôi sẽ cần có kế hoạch vào thời điểm đó, lưu ý các mục tiêu thiết kế N + 1 của chúng tôi.
Giá như tôi có thể phân vùng cứng các máy chủ Linux của chúng tôi và để các lõi không hoạt động và vẫn tuân thủ các thỏa thuận cấp phép Oracle của chúng tôi.