SHOW COLLATIONS;
để xem bạn có sẵn những đối chiếu nào. Trên phiên bản của tôi, tôi không thấy bất kỳ thứ gì trông phù hợp với tiếng Ả Rập. Tuy nhiên, utf8_unicode_ci
dường như làm gấp bạn muốn. Đây là một cách đơn giản để thử nó:
SELECT 'بِسْمِ' = 'بسم' COLLATE utf8_unicode_ci;
Kết quả tôi nhận lại là 1 (true), nghĩa là chúng được coi là bằng nhau. Với utf8_general_ci
nó trả về 0, nghĩa là không bằng.
Sau đó, khai báo các trường của bạn là VARCHAR(...) (or TEXT) CHARACTER SET utf8 COLLATE utf8_unicode_ci
; Tương tự cho utf8mb4.
Để tạo đối chiếu của riêng bạn (và gửi nó để đưa vào các phiên bản sau), hãy xem http://dev.mysql.com/doc/refman/5.6/en/adding-collation.html