Công thức khoảng cách Jaro-Winkler thiên về các chuỗi có đầu chung. Ví dụ:Valenti na và Valenti ria .
Nó cũng có một số "quy tắc" không trực quan (xem wikipedia ).
Trước tiên, bạn có thể nên xác định loại chênh lệch mà bạn đang mong đợi, sau đó tìm kiếm một công thức khoảng cách phù hợp. Ví dụ:trong văn bản, "angleworm" và "angelworm" rất dễ xảy ra lỗi, vì vậy khoảng cách giữa hai chuỗi phải thấp. Trong khi "there" và "ba" không khớp thì ít có khả năng xảy ra hơn và "ether" thậm chí còn nhiều hơn thế. Với các phép đảo chữ dài hơn, khoảng cách Jaro có thể giống hệt nhau và ngay cả việc chỉnh sửa Winkler cũng có thể không phát huy tác dụng.
Như bạn có thể đọc trong trang này (nhấn mạnh của tôi)