Đối sánh tên là khó . Lập chỉ mục Văn bản của Oracle hỗ trợ kết hợp mờ và tạo gốc, đây là một bước khởi đầu, nhưng hãy xem xét các tên sau:
- Nicholas Raleigh
- Nihcolas Raleigh
- Nico Raleigh
- Nik Raleigh
- Nicky Raleigh
- Nick Raleigh
- Nikolaus Raleigh
- Nicola Raleigh
- Nikki Raleigh
- Nikola Raleigh
- Nikolai Raleigh
- Nikolaj Raleigh
Việc cố gắng so khớp những thứ đó thông qua sự trừu tượng, có thể là Levenshtein Distance hoặc Double Metaphone, sẽ tạo ra các kết quả dương tính giả và âm tính giả. Đây là bản chất của sự trừu tượng. Cách tốt nhất để có được bộ kết quả tập trung và chính xác là sử dụng từ điển đồng nghĩa (và thậm chí điều này không hoàn hảo). Thật không may, việc tập hợp một từ điển đồng nghĩa toàn diện về tên là một công việc khổng lồ; để hiểu nhiệm vụ, hãy xem số liệu thống kê trên trang web NameX .
Cập nhật:Oracle 11gR2 bao gồm một phần mở rộng cho Văn bản Oracle được điều chỉnh để tìm kiếm tên. Điều này rất gọn gàng và chắc chắn là nơi đầu tiên để bắt đầu. Tìm hiểu thêm .