- 194 名前:login:Penguin [01/11/06 16:04 ID:lMX1zb5b.net]
- >> 192
UCS-2, UCS-4 は文字セット。 UTF-16 はエンコーディング。 区別しようね。 以下、説明はちょっとはしょってるので用語は不正確かもしれん。 UTF-16 ちうのは 2 バイトであらわされる範囲は UCS-4 の BMP 領域(すなわち UCS-2) の文字番号(?)をそのままコードとして採用する + それ以外はサロゲートペアで表現。 なので、混同するのは無理ないが。 まぁ、UCS-4 の BMP 以外って事実上まだなんとも、なので、現実的には UTF-16 のコード == UCS-2 の文字番号 になってるかな。 Win の UTF-16 ってサロゲートペア対応してるんだろうか?
|

|