- 406 名前:デフォルトの名無しさん mailto:sage [2008/07/23(水) 21:44:47 ]
- にもかかわらず、UNIX系OSがUTF-8に固執するのは、OSがC言語で記述されているから。
UNIXのシステムコールもC言語から呼ぶことになっている。 UNIXはすべてC言語が基本なんだね。 ところで、ユニコードの"ABC"という文字を、C言語のライブラリに渡すことを考えてみよう。 int fd = open("ABC", O_RDONLY); ユニコードの"ABC" を受け取った open 関数はどういう挙動をするか? ユニコードの"ABC" は char の配列 { 0x41, 0x00, 0x42, 0x00, 0x43, 0x00 } と解釈されてしまう。 (インテルCPUの場合) ここで注意しなければならないのは、 0x00 は文字列の終端記号に間違われてしまうという事。 文字列に \0 が含まれていると、それが文字列の終わりという腐った約束ごとがあるから 結局、open 関数には "A" というファイルをオープンしようとするだろうね。 つ・ま・り、UNIX系OSは、どうあがいても、泣けど叫べど、絶対にユニコード化は不可能。 だから UTF-8 に固執してるんだよ。 くやしかったら 文字列の終端が \0 って言うクソ仕様を廃止してみろwww
|

|