Ý tưởng đằng sau phân vùng không phải là sử dụng nhiều máy chủ mà là sử dụng nhiều bảng thay vì một bảng. Bạn có thể chia một bảng thành nhiều bảng để bạn có thể có dữ liệu cũ trong một bảng con và dữ liệu mới trong một bảng khác. Sau đó, cơ sở dữ liệu có thể tối ưu hóa các truy vấn mà bạn yêu cầu dữ liệu mới khi biết rằng chúng nằm trong bảng thứ hai. Hơn nữa, bạn xác định cách dữ liệu được phân vùng.
Ví dụ đơn giản từ Tài liệu MySQL :
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY RANGE ( YEAR(separated) ) (
PARTITION p0 VALUES LESS THAN (1991),
PARTITION p1 VALUES LESS THAN (1996),
PARTITION p2 VALUES LESS THAN (2001),
PARTITION p3 VALUES LESS THAN MAXVALUE
);
Điều này cho phép tăng tốc độ, ví dụ:
-
Loại bỏ dữ liệu cũ bằng cách đơn giản:
ALTER TABLE employees DROP PARTITION p0;
-
Cơ sở dữ liệu có thể tăng tốc một truy vấn như sau:
SELECT COUNT(*) FROM employees WHERE separated BETWEEN '2000-01-01' AND '2000-12-31' GROUP BY store_id;
Biết rằng tất cả dữ liệu chỉ được lưu trữ trên phân vùng p2.