Nó phụ thuộc vào những gì bạn cần.
utf8_bin
collation so sánh các chuỗi hoàn toàn dựa trên Unicode điểm mã
của chúng các giá trị. Nếu tất cả các điểm mã có cùng giá trị thì các chuỗi bằng nhau. Tuy nhiên, điều này sẽ xảy ra khi bạn có các chuỗi có thành phần khác nhau để kết hợp các dấu (sáng tác so với phân rã) hoặc các ký tự tương đương về mặt quy tắc nhưng không có cùng giá trị điểm mã. Trong một số trường hợp, sử dụng utf8_bin
sẽ dẫn đến các chuỗi không khớp khi bạn mong đợi. Về mặt lý thuyết, utf8_bin
là nhanh nhất vì không có chuẩn hóa Unicode nào được áp dụng cho các chuỗi, nhưng nó có thể không phải là những gì bạn muốn.
utf8_general_ci
áp dụng chuẩn hóa Unicode bằng cách sử dụng các quy tắc dành riêng cho ngôn ngữ và so sánh các chuỗi phân biệt chữ hoa chữ thường. utf8_general_cs
làm tương tự, nhưng so sánh các chuỗi phân biệt chữ hoa chữ thường.