- 19 名前:デフォルトの名無しさん mailto:sage [2010/12/20(月) 08:57:56 ]
- 971 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:09:15
結局UnicodeとUTF-8の違いは何なのでしょうか。 符号化文字集合Unicodeにも各文字に符号が振られているのに さらにUTF-8が符号化方式とかわけわかりません。 972 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:15:38 Unicodeは文字に番号を振っているだけ。ビットもバイトも関係ない。 そのUnicode番号を、バイト(正確にはオクテット)データの連続として 表現する方法の一つがUTF-8。 973 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 22:06:07 Unicode: 単なる「文字の表」で、あいうえお表のようなもの。 便利にするために、文字ごとに番号がついてあるけど、 その番号はコンピュータ上のデータとは何ら関係がない。単なる整理番号。 UTF-8, UTF-16など: Unicodeの表にある文字をコンピュータ上で表現したいとき、 どういう手順で表せばいいかを定めた「決まりごと」。 Unicode表の文字をコンピュータ上のデータに変換する規則、 コンピュータ上のデータをUnicode表の文字に変換する規則が定められている。 Unicode系の規格では「文字の表」と「決まりごと」が一組そろってはじめて、文字とデータの対応付けができる。 ASCIIコードでは、表と決まりごとの区別はあんまり明確じゃない。 Shift_JIS, iso-2022-jp, euc-jpは全部「決まりごと」で、やっぱり「文字の表」がないと意味をなさない。 そいつらはUnicode表じゃなくて、JISコードって表のための決まりごと。
|

|