>
java 的char用兩字節存儲,表示範圍從 'u0000' 到 'uffff' ,也就是從0到65535。事實上,一個char不能表示65535個字元,因爲 只有
U+0000 到 U+D7FF 和 U+E000 到U+FFFF能用來表示
一個完整的字元,這些叫做 BMP,另外的作爲high surrogate和 low surrogate 拼接組成由4字節表示的字元。
所以java的char只能表示utf-16中的bmp部分字元。
圖文推薦