- 812 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/08(水) 18:20:01 ID:C3X9Qxhb0]
- >>811
726 を書いた者だけど、事情は書いたほど単純なものではなかった 簡潔に言うと、xyzzy は gb2312 のコードを正しく扱うことができる 問題は、gb2312 として流通しているファイルのほとんどが、実際には 拡張された上位の文字セットである GBK だということ つまり、GBK では1バイト目と2バイト目が gb2312 から拡張されていて その拡張された部分を含む文字を読み込んだときに、バイト単位で文字がずれる つまり文字化けが起こり、それは行末まで続く gb2312 では 94×94=8836文字までしか扱うことができず、これは中国では 絶対的に不足していたため、Microsoft が Windows95 で独自に拡張を行い、 約2万字(強)を扱えるようにし、そしてそれは普及した。これが GBK。 例をあげると、html に charset=gb2312 として記述されている場合、 実際に使われている文字コードは GBK であることが多い これに対応させるためには gb2312 を最初から GBK として扱うか、または GBK を xyzzy で扱える文字コードとして追加する必要があると思う
|

|