Cách cải thiện hiệu suất truy vấn (sử dụng giải thích kết quả lệnh f.e.)

Bạn có thể thử một cái gì đó như thế này (mặc dù nó không thực tế đối với tôi để kiểm tra điều này)

SELECT
    sac.surveyId,
    q.cat,
    SUM((sac.answer_id*q.weight))/SUM(q.weight) AS score,
    user.division_id,
    user.unit_id,
    user.department_id,
    user.team_id,
    division.division_name,
    unit.unit_name,
    dpt.department_name,
    team.team_name
FROM survey_answers_cache sac
    JOIN
    (
        SELECT
            s.surveyId,
            sc.subcluster_id
        FROM
            surveys s
            JOIN subcluster sc ON s.subcluster_id = sc.subcluster_id
            JOIN cluster c ON sc.cluster_id = c.cluster_id
        WHERE
            c.cluster_id=? AND sc.subcluster_id=? AND s.active=0 AND s.prepare=0
    ) AS v ON v.surveyid = sac.surveyid
    JOIN user ON user.user_id = sac.user_id
    JOIN questions q ON q.question_id = sac.question_id
    JOIN division ON division.division_id = user.division_id
    LEFT JOIN unit ON unit.unit_id = user.unit_id
    LEFT JOIN department dpt ON dpt.department_id = user.department_id
    LEFT JOIN team ON team.team_id = user.team_id
GROUP BY user.team_id, v.surveyId, q.cat
ORDER BY v.surveyId, user.team_id, q.cat ASC

Vì vậy, tôi hy vọng mình đã không làm hỏng bất cứ điều gì.

Dù sao, ý tưởng là trong truy vấn bên trong, bạn chỉ chọn các hàng bạn cần dựa trên điều kiện vị trí của bạn. Điều này sẽ tạo một bảng tmp nhỏ hơn vì nó chỉ kéo 2 trường cả hai int.

Sau đó, trong truy vấn bên ngoài, bạn tham gia vào các bảng mà bạn thực sự lấy phần còn lại của dữ liệu từ đó, sắp xếp và nhóm. Bằng cách này, bạn đang sắp xếp và nhóm trên một tập dữ liệu nhỏ hơn. Và mệnh đề where của bạn có thể chạy theo cách tối ưu nhất.

Bạn thậm chí có thể bỏ qua một số bảng này vì bạn chỉ lấy dữ liệu từ một vài trong số chúng, nhưng không nhìn thấy toàn bộ lược đồ và khó có thể nói nó liên quan như thế nào.

Nhưng chỉ nói chung chung phần này (Truy vấn phụ)

SELECT
    s.surveyId,
    sc.subcluster_id
FROM
    surveys s
    JOIN subcluster sc ON s.subcluster_id = sc.subcluster_id
    JOIN cluster c ON sc.cluster_id = c.cluster_id
WHERE
    c.cluster_id=? AND sc.subcluster_id=? AND s.active=0 AND s.prepare=0

Là điều bị ảnh hưởng trực tiếp bởi mệnh đề WHERE của bạn. Hãy xem để chúng tôi có thể tối ưu hóa phần này, sau đó sử dụng nó để kết hợp phần còn lại của dữ liệu bạn cần.

Ví dụ về việc xóa bảng có thể dễ dàng suy ra từ những điều trên, hãy xem xét điều này

SELECT
    s.surveyId,
    sc.subcluster_id
FROM
    surveys s
    JOIN subcluster sc ON s.subcluster_id = sc.subcluster_id
WHERE
    sc.cluster_id=? AND sc.subcluster_id=? AND s.active=0 AND s.prepare=0

c bảng cluster không bao giờ được sử dụng để lấy dữ liệu từ, chỉ dành cho nơi. Như vậy là không

    JOIN cluster c ON sc.cluster_id = c.cluster_id
 WHERE
    c.cluster_id=?

Giống hoặc tương đương với

WHERE
    sc.cluster_id=?

Và do đó, chúng tôi có thể loại bỏ hoàn toàn sự tham gia đó.