Đối chiếu là ít lo lắng nhất của bạn, điều bạn cần nghĩ đến là bộ ký tự cho cột / bảng / cơ sở dữ liệu. Đối chiếu (các quy tắc điều chỉnh cách dữ liệu được so sánh và đã sắp xếp ) chỉ là một hệ quả của điều đó.
MySQL hỗ trợ một số bộ ký tự Unicode, utf8
và utf8mb4
là thú vị nhất. utf8
hỗ trợ các ký tự Unicode trong BMP
, tức là một tập hợp con của tất cả Unicode. utf8mb4
, có sẵn kể từ MySQL 5.5.3, hỗ trợ tất cả của Unicode.
Đối chiếu được sử dụng với bất kỳ bảng mã Unicode nào rất có thể là xxx_general_ci
hoặc xxx_unicode_ci
. Thuật toán trước là một thuật toán sắp xếp và so sánh chung độc lập với ngôn ngữ, thuật toán sau là một hoàn chỉnh hơn thuật toán độc lập với ngôn ngữ hỗ trợ nhiều tính năng Unicode hơn (ví dụ:coi "ß" và "ss" là tương đương), nhưng do đó cũng chậm hơn.
Xem https://dev.mysql.com/ doc / refman / 5.5 / en / charset-unicode-sets.html .