Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Cách hiệu quả để tính toán tỷ lệ phần trăm tương tự giữa các tập dữ liệu

Cách tiêu chuẩn để làm điều này là tương tự Jaccard. Nếu A là tập hợp các mục tiêu của người dùng đầu tiên và B là tập hợp các mục tiêu của người dùng thứ hai, thì điểm tương đồng của Jaccard là:

#(A intersect B)/#(A union B)

Đây là số bàn thắng mà họ chia sẻ chia cho tổng số phiếu bầu của cả hai (tính các bàn thắng mà họ chia sẻ chỉ một lần). Vì vậy, nếu người dùng đầu tiên có mục tiêu A ={1,2,3} và người dùng thứ hai có mục tiêu B ={2,4} thì đó là:

A intersect B = {2}
A union B = {1,2,3,4}

#(A intersect B)/#(A union B) = 1/4

Điểm giống nhau của Jaccard luôn nằm giữa 0 (chúng không có chung mục tiêu) và 1 (chúng có cùng mục tiêu), vì vậy bạn có thể nhận được phần trăm bằng cách nhân nó với 100.

http://en.wikipedia.org/wiki/Jaccard_index




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Rắc rối khi quyết định xác định hoặc không xác định mối quan hệ

  2. Cập nhật và xóa các Mô hình có Liên quan (Bảng quan hệ) trong Yii

  3. Làm cách nào để truy cập công cụ dòng lệnh mysql khi sử dụng XAMPP trong OS X?

  4. Cách chèn thời gian JS thời điểm vào MySQL

  5. Lưu trữ Logic Kinh doanh trong Cơ sở dữ liệu