- 394 名前:デフォルトの名無しさん mailto:sage [04/03/08 11:34]
- >>391
> UTF8は、情報処理用としてもかなり考慮されていて、ASCII用に書かれ > た古い検索ルーチンや文字処理ルーチンを無修正でUnicodeに対応でき > る特徴をっている。こんな特性は、よく知られている他の可変長符号に > はない。 それはEUC-JPでも普通に行われてきたのでは?^^; 「問題が出ないようにしてある」のと「情報処理用に作ってある」のとは別です。 EUC-JPでもShift JISでもISO-2022-JPでも、内部処理用に使おうと思えば 可能です。実際そういうソフトウェアもあるわけですし。 ただ、その場合処理が複雑になるしその分エンバグする可能性も高いわけです。 > そもそも、情報交換用なら、BOCU圧縮を使えば、UTF8よりコンパクトに > なる: > www-6.ibm.com/jp/developerworks/unicode/010921/j_u-binary.html ここまでするなら、レイヤーを分けて普通にハフマン符号化した方が良いと思うんだけど。
|

|