- 1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ]
- ビッグインディアンとかなんとかかんとか
- 110 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 20:02:03 ]
- 7bit文字の場合
0xxx xxxx 8-11bit 110x xxxx 10xx xxxx 11-16bit 1110 xxxx 10xx xxxx 10xx xxxx unicodeの部分がxxxx
- 111 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 21:38:28 ]
- 1バイトだけ見た場合、
0xxx xxxxならそのバイトだけで1文字 1xxx xxxxなら -- 10xx xxxxなら多バイト文字の2バイト目以降(先頭は遡って11xxなバイト) -- 11xx xxxxなら多バイト文字の先頭バイト ---- 110x xxxxなら2バイト文字の先頭バイト ---- 111x xxxxなら3バイト文字の先頭バイト と判別できるわけだな。
|

|