Giả sử rằng $str
được mã hóa UTF-8:
function maxThreeBytes($str) {
return preg_match('@[\\xf0-\\xff][\\x80-\\xff][\\x80-\\xff][\\x80-\\xff]@', $str) ? false : true;
}
Nó kiểm tra xem chuỗi có chứa bốn ký tự khớp với 11110xxxb 10xxxxxxb 10xxxxxxb 10xxxxxxb
không là mã hóa cho các ký tự từ U + 10000 đến U + 10FFFF.