Một ý tưởng khác để thử có thể là xác định các chuỗi phổ biến và biểu diễn chúng bằng một bitmap. Ví dụ:có hai bit để đại diện cho giao thức (http, https, ftp hoặc thứ gì đó khác), một bit khác để cho biết miền có bắt đầu bằng "wwww" hay không, hai bit để cho biết miền có kết thúc bằng ".com", "hay không. org "," .edu "hoặc thứ gì khác. Bạn sẽ phải thực hiện một số phân tích trên dữ liệu của mình và xem những điều này có hợp lý không và nếu có bất kỳ chuỗi chung nào khác mà bạn có thể xác định.
Nếu bạn có nhiều URL đến cùng một trang web, bạn cũng có thể xem xét chia bảng của mình thành hai cái khác nhau, một cái chứa tên miền và cái kia chứa đường dẫn tên miền tương đối (và chuỗi truy vấn &id phân đoạn, nếu có). Bạn sẽ có một bảng liên kết có id của URL, id của miền và id của đường dẫn và bạn sẽ thay thế bảng URL ban đầu của mình bằng một chế độ xem kết hợp ba bảng. Bảng tên miền sẽ không bị giới hạn đối với tên miền, bạn có thể bao gồm nhiều URL như thường lệ (ví dụ:'http://stackoverflow.com/questions'). Điều này sẽ không tốn quá nhiều mã để triển khai và có lợi thế là vẫn có thể đọc được. Mã hóa số của bạn có thể hiệu quả hơn, khi bạn đã tìm ra nó, bạn sẽ phải phân tích dữ liệu của mình để xem cái nào có ý nghĩa hơn.