điều đó có thể hoạt động, nhưng có thể có kết quả phù hợp sai, không có cách nào để ngăn chặn chúng, bởi vì bạn chỉ có một giải pháp thuật toán. Đặt cược tốt nhất của bạn là tạo một bảng bí danh. Bao gồm mọi biến thể từng được tìm thấy cho từng tên công ty và FK vào ID của công ty thực. Bao gồm cả một hàng cho tên thực.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Nếu không tìm thấy đối sánh tên chính xác trong bảng này khi nhập dữ liệu, bạn có thể sử dụng thuật toán được đề xuất của mình hoặc thuật toán khác hoặc sử dụng đầu vào của con người, v.v. để tìm đối sánh hoặc tạo một công ty mới. Tại thời điểm đó, hãy chèn vào bảng bí danh. Nếu bạn thấy rằng kết quả khớp của mình bị sai vì lý do nào đó, bạn có thể thay đổi bảng bí danh để tạo ánh xạ thích hợp. Nếu bạn chỉ sử dụng một thuật toán, bạn cần phải bao gồm các ngoại lệ và thuật toán của bạn sẽ phát triển lớn và chậm. Với bảng này và một chỉ số tốt, việc tìm kiếm các kết quả phù hợp của bạn sẽ nhanh chóng.