[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 06/05 23:37 / Filesize : 235 KB / Number-of Response : 817
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

xyzzyの使い方が分からぬやし 励ましあえ その10



812 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/08(水) 18:20:01 ID:C3X9Qxhb0]
>>811
726 を書いた者だけど、事情は書いたほど単純なものではなかった
簡潔に言うと、xyzzy は gb2312 のコードを正しく扱うことができる
問題は、gb2312 として流通しているファイルのほとんどが、実際には
拡張された上位の文字セットである GBK だということ

つまり、GBK では1バイト目と2バイト目が gb2312 から拡張されていて
その拡張された部分を含む文字を読み込んだときに、バイト単位で文字がずれる
つまり文字化けが起こり、それは行末まで続く

gb2312 では 94×94=8836文字までしか扱うことができず、これは中国では
絶対的に不足していたため、Microsoft が Windows95 で独自に拡張を行い、
約2万字(強)を扱えるようにし、そしてそれは普及した。これが GBK。
例をあげると、html に charset=gb2312 として記述されている場合、
実際に使われている文字コードは GBK であることが多い

これに対応させるためには gb2312 を最初から GBK として扱うか、または
GBK を xyzzy で扱える文字コードとして追加する必要があると思う






[ 続きを読む ] / [ 携帯版 ]

全部読む 前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<235KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef