- 291 名前:デフォルトの名無しさん mailto:sage [2007/04/10(火) 22:39:22 ]
- >>284はそんなに見当違いか?
テキストとバイナリを区別せずただのバイト列として扱うのが 伝統的なUnixおよびCの文化だ。 実際にはそうした愚直で単純なやり方ではマルチバイトテキストを 扱う上で大きな問題を引き起こす。 無論UnixおよびCでそうでないプログラムを書くことは可能だが、 それに対するサポートレベルがWindowsに比べて非常に低い。 Windowsはテキストを明確に区別する。ほぼ全てのテキストを受け渡しする APIには、Ansi版とUnicode版が存在し、APIユーザ=プログラマは、 自分のプログラムに適したストラテジーによってそれらを使い分けることが出来る。 Ansi版を使う場合はUnixのロケールモデルに近くなり、それらの切り替えは容易だ。 正しくWindowsの作法に従って書かれたプログラムなら、OSに渡るテキストは 全てUTF-16だ。 そうした世界では、もともとm17n対応であり、SJISの2byte目が引き起こす 伝統的な下らない問題とも無縁だ。 ファイルシステム内のファイル名も一貫しており、どんなコードページで 実行していようが全てのファイルを正しく扱える。 テキストを意識し、テキストを正しく扱っているから出来ることだ。 Unixは「何でもあり」と一見自由のようなことを言っていて、 実際にはエラーを起こしがちで問題の多い解でしかないわけだ。 ちょうど行毎にエンコード形式の異なるテキストファイルのように。
|

|