Vì vậy, bạn đang xem xét một nơi nào đó trong khu vực 100 tỷ bản ghi (1 triệu bản ghi * 100.000 người dùng).
Cách ưa thích để xử lý lượng lớn dữ liệu là tạo một cụm phân đoạn chia nhỏ dữ liệu ra trên một số máy chủ được trình bày dưới dạng đơn vị logic duy nhất thông qua ứng dụng khách mongo.
Do đó, câu trả lời cho câu hỏi của bạn là đặt tất cả các bản ghi của bạn vào một bộ sưu tập phân đoạn duy nhất.
Số lượng phân đoạn được yêu cầu và cấu hình của cụm có liên quan đến kích thước của dữ liệu và các yếu tố khác như số lượng và sự phân bố của các lần đọc và ghi. Câu trả lời cho những câu hỏi đó có lẽ rất cụ thể đối với tình huống đặc biệt của bạn, vì vậy tôi sẽ không cố gắng đoán chúng.
Tôi có thể sẽ bắt đầu bằng cách quyết định xem bạn có bao nhiêu phân đoạn và máy móc có sẵn để thiết lập và kiểm tra hệ thống trên một cụm gồm nhiều máy đó. Dựa trên hiệu suất của nó, bạn có thể quyết định xem bạn cần nhiều hay ít phân đoạn trong cụm của mình