[表示 :
全て
最新50
1-99
101-
201-
301-
401-
501-
2ch.scのread.cgiへ
]
Update time : 04/11 14:45 / Filesize : 124 KB / Number-of Response : 537
[
このスレッドの書き込みを削除する
]
[
+板 最近立ったスレ&熱いスレ一覧
:
+板 最近立ったスレ/記者別一覧
] [
類似スレッド一覧
]
↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました
SJIS撲滅運動
282 名前:
272
mailto:sage
[03/10/13 03:18.net]
ISO-2022-JP、EUC-JPの場合:
使ってはいけない理由の根本はISO/IEC 2022にあります。JISでいうとJIS X
0202。「7.5 図形文字の一意な符号化」にはこう書かれています。
----ここから引用----
同じ文字が8ビット又は7ビットの符号の符号要素のG0, G1, G2及びG3として、指
示される複数の図形文字集合に現れることがある。このような文字は、二つの集
合を定義する仕様又はISO符号化文字集合の国際登録簿で同じ名前をもつ場合、
同じ文字とみなされる。
同一の文字が複数の集合に割り当てられている場合、その文字は、その文字が割
り当てられた任意の符号要素のG0, G1, G2又はG3から取り出された符号化表現で
表現されてよい。
この規格を適用する場合、情報交換の際にすべての文字が一意の符号化表現をも
つことを要求されるとき、符号の版の規定(10.1参照)で、その制限を明らかにし
なければならない。
符号の一意化の制限を適用した場合、その文字が割り当てられた最下位番号の符
号要素(G0, G1, G2及びG3の順)から符号化表現が表現される。この場合、たとえ、
高位番号の符号要素が既に呼び出されていて、かつ、その文字が割り当てられて
いる下位番号の符号要素が呼び出されていないときでも、高位番号の符号要素の
文字の符号化表現は、使用しない。
----ここまで引用----
「二つの集合を定義する仕様」というのはこの場合JIS X 0201とJIS X 0208です。
さて、例の「使うとまずい文字」の名称はどうなっているか? なんとJIS X 0201
とJIS X 0208でまったく同じです。たとえば「ア」は両方とも「KATAKANA
LETTER A」ですし「?」は「QUESTION MARK」です。つまり半角と全角の二つの文
字があるのではなく、「ア」という文字があってそれが二つの集合に存在するわ
けです。続きを読みます。
[
続きを読む
] / [
携帯版
]
全部読む
前100
次100
最新50
▲
[
このスレをブックマーク! 携帯に送る
]
2chのread.cgiへ
[
+板 最近立ったスレ&熱いスレ一覧
:
+板 最近立ったスレ/記者別一覧
]
( ´∀`)<124KB
read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) /
eucaly.net
products.
担当:undef