UnicodeとUTF-8の違いは?
at TECH
[
2ch
|
▼Menu
]
■コピペモード
□
スレを通常表示
□
オプションモード
□このスレッドのURL
■項目テキスト
100:デフォルトの名無しさん 07/05/02 11:18:53 んじゃ、文字数とかバイト数とかのお話の説明なぞ UTF-16っていうので16bitで全部の文字を表そうと思ってたのね でも実際に作り始めたら16bitじゃ全然足りなかったから その分は16bitをふたつ使って32bitで表しますよっていうコトにしたの それがサロゲートペアって呼ばれてるモノね(ふたつ組だからペア) そんなわけで、UTF-16は基本的に16bitで一文字なんだけど 例外的にサロゲートペアだけ32bitで一文字っていう ヘンテコリンな規格になっちゃったわけ サロゲートペアの処理がちゃんとされてないプログラムだと 16bitなら一文字、32bitなら二文字っていう風に 機械的に文字数を判断しちゃって困るねっていうこと 101:デフォルトの名無しさん 07/05/02 11:27:33 言ってみればサロゲートペア非対応のプログラムでサロゲートペアを含む文字列を扱おうということは、 マルチバイト文字列非対応のプログラムでマルチバイト文字列を扱おうとするのと同じこと。 まあShift_JISのような駄目文字問題が生まれないのはましだけど。
次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
レスジャンプ
mixiチェック!
Twitterに投稿
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch
5386日前に更新/116 KB
担当:undef