Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Nhận các trường tương tự được lặp lại nhiều nhất trong cơ sở dữ liệu MySQL

Những gì bạn đang nói đến là một quá trình phân cụm văn bản. Bạn đang cố gắng tìm những đoạn văn bản tương tự và tùy ý chọn một trong số chúng. Tôi không quen với bất kỳ cơ sở dữ liệu nào thực hiện hình thức khai thác văn bản này.

Đối với những gì bạn mô tả, một kỹ thuật khai thác văn bản khá cơ bản có thể sẽ hoạt động. Tạo ma trận tài liệu thuật ngữ với tất cả các từ ngoại trừ tên người dùng. Sau đó, sử dụng phân rã giá trị kỳ dị để nhận được giá trị kỳ dị và vectơ lớn nhất (đây là thành phần chính đầu tiên của ma trận tương quan). Các hoạt động tương tự nên tập hợp dọc theo dòng này.

Nếu bạn có vốn từ vựng hạn chế và có các thuật ngữ trong bảng, bạn có thể đo khoảng cách giữa hai hành động bằng tỷ lệ các từ trùng nhau. Bạn có danh sách tất cả các từ trong các hành động không?



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Có thể thực hiện việc chèn SQL (Mức cao) trên Ứng dụng web dễ bị tổn thương không?

  2. Trình tạo truy vấn của Laravel Bộ chọn JSON `trường-> khóa` gây ra lỗi cú pháp

  3. MySQL tham gia cùng một bảng hai lần trên cùng một cột với giá trị khác nhau chỉ trả về hàng gần đây nhất

  4. Số lượng MySQL trong cùng một bảng bao gồm các giá trị đếm bằng không

  5. Hàm CONV () trong bông tuyết