- 100 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 11:18:53 ]
- んじゃ、文字数とかバイト数とかのお話の説明なぞ
UTF-16っていうので16bitで全部の文字を表そうと思ってたのね でも実際に作り始めたら16bitじゃ全然足りなかったから その分は16bitをふたつ使って32bitで表しますよっていうコトにしたの それがサロゲートペアって呼ばれてるモノね(ふたつ組だからペア) そんなわけで、UTF-16は基本的に16bitで一文字なんだけど 例外的にサロゲートペアだけ32bitで一文字っていう ヘンテコリンな規格になっちゃったわけ サロゲートペアの処理がちゃんとされてないプログラムだと 16bitなら一文字、32bitなら二文字っていう風に 機械的に文字数を判断しちゃって困るねっていうこと
|

|