Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

nén văn bản url (không rút gọn) và lưu trữ trong mysql

Một ý tưởng khác để thử có thể là xác định các chuỗi phổ biến và biểu diễn chúng bằng một bitmap. Ví dụ:có hai bit để đại diện cho giao thức (http, https, ftp hoặc thứ gì đó khác), một bit khác để cho biết miền có bắt đầu bằng "wwww" hay không, hai bit để cho biết miền có kết thúc bằng ".com", "hay không. org "," .edu "hoặc thứ gì khác. Bạn sẽ phải thực hiện một số phân tích trên dữ liệu của mình và xem những điều này có hợp lý không và nếu có bất kỳ chuỗi chung nào khác mà bạn có thể xác định.

Nếu bạn có nhiều URL đến cùng một trang web, bạn cũng có thể xem xét chia bảng của mình thành hai cái khác nhau, một cái chứa tên miền và cái kia chứa đường dẫn tên miền tương đối (và chuỗi truy vấn &id phân đoạn, nếu có). Bạn sẽ có một bảng liên kết có id của URL, id của miền và id của đường dẫn và bạn sẽ thay thế bảng URL ban đầu của mình bằng một chế độ xem kết hợp ba bảng. Bảng tên miền sẽ không bị giới hạn đối với tên miền, bạn có thể bao gồm nhiều URL như thường lệ (ví dụ:'http://stackoverflow.com/questions'). Điều này sẽ không tốn quá nhiều mã để triển khai và có lợi thế là vẫn có thể đọc được. Mã hóa số của bạn có thể hiệu quả hơn, khi bạn đã tìm ra nó, bạn sẽ phải phân tích dữ liệu của mình để xem cái nào có ý nghĩa hơn.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. ứng dụng web spring-boot mất khả năng kết nối với MySQL / RDS sau một thời gian

  2. Làm thế nào để tạo một truy vấn đệ quy phân cấp MySQL?

  3. Chọn nhiều cột / trường trong truy vấn con MySQL

  4. JPA:MySQL nói rằng bảng không tồn tại, nhưng nó thực sự tồn tại

  5. Xử lý múi giờ chính xác với TYPO3 và Fluid