- 360 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 20:31:17 ]
- UTF-8にBOMなんか辞めようと
そもそも、BOM=Byte Order Mark で、UTF-16、UCS-2、UTF-32、UCS-4なんかで使うものだし そいつ(BOM)をそのままUTF-8変換した値がBOMもどきだし Visual Studio 2005なんかはUTF-8でソース管理出来るみたいだな 今のPRJはLinuxでUTF-16使ってるから文字列は全てリソース扱い、っつかASCIIだろうとそうすべきではあるけど ソースコードにUTF-16をhexでどかどか書いても見づらいだけだ だけど、データ管理はUTF-16のがいい。サロゲートペアなんて使うことはまず無いし、1文字=2バイトと見なして差し支えなければ楽でいい UTF-8は最近ISO 10646だっけ、RFCだっけ、あれUnicode.orgだっけ?規格変更で1〜4バイトの可変長になって、それとともにUTF-32の領域も狭くなったみたいだが XMLなんかはエンコーディング付いてるから問題ないし、ソースもSJISやEUCさえなんとかなれば別に問題らしいものはない気がする>UTF-8 UTF-8自体ASCIIコンパチだしね
|

|