Bạn đang nhầm lẫn UTF-8 với Unicode.
0x00FC là Unicode điểm mã cho ü:
mysql> select char(0x00FC using ucs2);
+----------------------+
| char(0x00FC using ucs2) |
+----------------------+
| ü |
+----------------------+
Trong UTF-8 mã hóa, 0x00FC được biểu thị bằng hai byte :
mysql> select char(0xC3BC using utf8);
+-------------------------+
| char(0xC3BC using utf8) |
+-------------------------+
| ü |
+-------------------------+
UTF-8 chỉ là một cách mã hóa Các ký tự Unicode ở dạng nhị phân. Nó có nghĩa là hiệu quả về không gian, đó là lý do tại sao các ký tự ASCII chỉ chiếm một byte duy nhất và các ký tự iso-8859-1 chẳng hạn như ü chỉ chiếm hai byte. Một số ký tự khác có ba hoặc bốn byte, nhưng chúng ít phổ biến hơn nhiều.