- 1 名前:デフォルトの名無しさん [2007/05/27(日) 16:19:36 ]
- プログラムにおける各種文字コードの処理について語りましょう♪
■前スレ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ ■参考サイト Unicode Home Page www.unicode.org/ Java Character Encodings www.ingrid.org/java/i18n/encoding/ euc.JP: tech docs, BeOS tools euc.jp/ ISO-IR - 2.8.1 Coding systems with Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm ISO-IR - 2.8.2 Coding Systems without Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
- 260 名前:デフォルトの名無しさん mailto:sage [2007/12/04(火) 12:53:57 ]
- ExtA = CJK Ideograph Extension A
U+3400〜U+4DB5(Unicode3,4), U+4DBF(Unicode5) いわゆる「機種依存文字」な漢字でUnicode2に入ってなかった奴が入った所と思った。確か
- 261 名前:デフォルトの名無しさん mailto:sage [2007/12/04(火) 13:03:01 ]
- JIS X 0208あるいは指定した文字集合だけ考えればいいなら、
JIS X 0208の全ての区点コードをリストアップ ('あ'を例に) ↓ UTF-8の16進数表現に変換 (0xE3 0x81 0x82) ↓ バイト列をソートしたのものを一桁目に(CSV) (0x81 0x82 0xE3, 0xe3 0x81 0x82) ↓ 一桁目でjoin (0x81 0x82 0xE3でjoin) ↓ join後、複数項目のあるものをリストアップ。
|

|