Tôi đã nói chuyện với kiến trúc sư cơ sở dữ liệu từ wordpress.com, dịch vụ lưu trữ cho WordPress. Anh ấy nói rằng họ bắt đầu với một cơ sở dữ liệu, lưu trữ tất cả các khách hàng lại với nhau. Rốt cuộc thì nội dung của một trang blog đơn lẻ thực sự không nhiều. Đó là lý do mà một cơ sở dữ liệu duy nhất dễ quản lý hơn.
Điều này đã mang lại hiệu quả tốt cho họ cho đến khi họ có hàng trăm và hàng nghìn khách hàng, họ nhận ra rằng họ cần phải mở rộng quy mô , chạy nhiều máy chủ vật lý và lưu trữ một tập hợp con khách hàng của họ trên mỗi máy chủ. Khi họ thêm một máy chủ, sẽ dễ dàng di chuyển từng khách hàng sang máy chủ mới, nhưng khó hơn để tách dữ liệu trong một cơ sở dữ liệu duy nhất thuộc về blog của từng khách hàng.
Khi khách hàng đến và đi và blog của một số khách hàng có hoạt động với khối lượng lớn trong khi những blog khác lại cũ đi, việc tái cân bằng trên nhiều máy chủ trở thành một công việc bảo trì thậm chí còn phức tạp hơn. Theo dõi kích thước và hoạt động trên mỗi cơ sở dữ liệu riêng lẻ cũng dễ dàng hơn.
Tương tự, thực hiện một cơ sở dữ liệu sao lưu hoặc khôi phục của một cơ sở dữ liệu duy nhất chứa các địa hình dữ liệu, so với các bản sao lưu và khôi phục cơ sở dữ liệu riêng lẻ có dung lượng vài megabyte mỗi cơ sở dữ liệu là một yếu tố quan trọng. Hãy xem xét:một khách hàng gọi điện và nói rằng dữ liệu của họ bị SNAFU'd do một số mục nhập dữ liệu không tốt và bạn có thể vui lòng khôi phục dữ liệu từ bản sao lưu của ngày hôm qua không? Bạn sẽ khôi phục một như thế nào dữ liệu của khách hàng nếu tất cả khách hàng của bạn chia sẻ một cơ sở dữ liệu duy nhất?
Cuối cùng, họ quyết định tách thành một cơ sở dữ liệu riêng biệt cho mỗi khách hàng , mặc dù phức tạp để quản lý, cung cấp cho họ tính linh hoạt cao hơn và họ đã cấu trúc lại dịch vụ lưu trữ của mình theo mô hình này.
Vì vậy, trong khi từ lập mô hình dữ liệu quan điểm dường như là điều đúng đắn cần làm để giữ mọi thứ trong một cơ sở dữ liệu duy nhất, một số quản trị cơ sở dữ liệu nhiệm vụ trở nên dễ dàng hơn khi bạn vượt qua một điểm dừng nhất định của khối lượng dữ liệu.