テキストエディタ総合 part8 at MAC
[2ch|▼Menu]
223:名称未設定
09/03/11 18:58:00 bswrp0Lj0
>>221
UTF-8だな。
容量無制限のフリースペース借りてるし。

もう知ってるとは思うけど、UTF-8での日本語は基本的に3バイト。
代わりにアルファベットなどASCII文字は1バイト。
一方のUTF-16は基本的に全部2バイト。
ただしエンディアンが自由なんでその判定用に
2バイト頭にくっつく(Byte Oder Mark; BOM)。
UTF-8はビッグエンディアンだから基本的にBOMはいらないんだけど
ASCII文字が1バイトなせいで頭の悪いエディタでは判定に失敗することがままある。
で、UTF-16のBOMに相当する3バイトのBOMが
それを防ぐのに使えるもんだからBOMをくっつけることがあるんだね。

ASCII文字が1バイトだからタグとか英文が多ければUTF-16とは
あまり差が出ないと思うよ。


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5439日前に更新/154 KB
担当:undef