- Lựa chọn đầu tiên (MySQL 8.0):
utf8mb4_0900_ai_ci
- Lựa chọn thứ hai (kể từ 5.6):
utf8mb4_unicode_520_ci
- Lựa chọn thứ ba (5.5+):
utf8mb4_unicode_ci
- Trước 5.5, bạn không thể xử lý tất cả tiếng Trung cũng như Biểu tượng cảm xúc:
utf8_unicode_ci
Các số liên quan đến các tiêu chuẩn Unicode 9.0, 5.20 và (không có số) 4.0.
Không có đối chiếu nào tốt cho việc sắp xếp tất cả ngôn ngữ cùng một lúc. Tiếng Tây Ban Nha, tiếng Đức, tiếng Thổ Nhĩ Kỳ, v.v., có những điểm không tương thích. Các ảnh ghép ở trên là những ảnh ghép dành cho mục đích chung 'tốt nhất' hiện có.
utf8mb4 xử lý tất cả các ký tự chưa được chỉ định bởi Unicode (bao gồm Cherokee, Klingon, Cuneiform, Byzantine, v.v.)
Nếu tiếng Bồ Đào Nha là trọng tâm:
Xem https://pt.stackoverflow.com/ và Đối chiếu MySQL cho tiếng Bồ Đào Nha .
Nghiên cứu điều này cho 8.0
hoặc cái này cho trước 8.0
để xem đối chiếu utf8 / utf8mb4 nào gần nhất với việc sắp xếp tiếng Bồ Đào Nha 'chính xác'. Có lẽ utf8mb4_danish_ci
hoặc utf8mb4_de_pb_0900_ai_ci
sẽ là tốt nhất.
(Khác với 'lựa chọn' được liệt kê ở trên.)