Tôi đang sử dụng một cách tiếp cận tương tự với các tập hợp được sắp xếp để triển khai lập chỉ mục toàn văn. Cách tiếp cận tổng thể là tốt, mặc dù có một số cải tiến khá đơn giản mà bạn có thể thực hiện.
- Thay vì sử dụng các khóa được tạo ngẫu nhiên, bạn có thể sử dụng truy vấn (hoặc một dạng rút gọn của nó) làm khóa. Điều đó cho phép bạn sử dụng lại các tập hợp đã được tính toán, điều này có thể cải thiện đáng kể hiệu suất nếu bạn có các truy vấn trên hai tập hợp lớn thường được kết hợp theo những cách tương tự.
- Việc xử lý tiêu đề như một chuỗi hoàn chỉnh sẽ dẫn đến một số lượng rất lớn các tập hợp thành viên. Tốt hơn là nên lập chỉ mục các từ riêng lẻ trong tiêu đề và lọc kết quả cuối cùng để có kết quả khớp chính xác nếu bạn thực sự cần.