- 1 名前:デフォルトの名無しさん [2007/05/27(日) 16:19:36 ]
- プログラムにおける各種文字コードの処理について語りましょう♪
■前スレ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ ■参考サイト Unicode Home Page www.unicode.org/ Java Character Encodings www.ingrid.org/java/i18n/encoding/ euc.JP: tech docs, BeOS tools euc.jp/ ISO-IR - 2.8.1 Coding systems with Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm ISO-IR - 2.8.2 Coding Systems without Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
- 644 名前:641 mailto:sage [2008/06/05(木) 01:51:37 ]
- えーと補足すると、全角/半角というのは単に表示側の表示の問題であって
概念的には同じ文字なので半角にNORMALIZEされた形にすべき、 ってのが昔のvoidの主張だった気がする。JIS X 0208もUnicodeも規格はそういう 考えだったと思う。それがこのスレ的にどうなのかなと。 たとえばUnicodeテキストでWinの「〜(U+2015)」とMacの「〜(U+2014)」が混ざってたら俺としては 2015に正規化したくなる。でも全角半角は事実上すべての環境で表示される字の大きさが 異なるので同じ文字としては扱いたくないなーと。
- 645 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 02:02:01 ]
- カレーパンのうた、すげぇw
ttp://www.geocities.jp/jugongordie/old/curryfla/curryfla.html >>644 まぁ細かいこと気にするな ( ゚Д゚)⊃ ○ < カレーパン食え ttp://food8.2ch.net/test/read.cgi/bread/1092166761/
- 646 名前:644 mailto:sage [2008/06/05(木) 02:56:34 ]
- 間違えた。カレーパン喰ってくる。
(誤) Winの「〜(U+2015)」とMacの「〜(U+2014)」 (正) Winの「‖(U+2225)」とMacの「‖(U+2016)」 ん? いつから双柱って傾いて表示されるようになった? Vistaから?
- 647 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 00:53:19 ]
- ‖
- 648 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 06:36:11 ]
- itpro.nikkeibp.co.jp/article/COLUMN/20061221/257533/
の図12
- 649 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 00:31:44 ]
- IVS対応ATOKマダー(AAry
appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf >>646 メイリオだともっと露骨に斜め45度の線2本で表示される。 まあちゃんと研究してるんだろう。角度とか
- 650 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 07:22:05 ]
- Last Resort Font
www.unicode.org/policies/lastresortfont_eula.html てっきりエイプリルフールネタだと思ってたのに本気でグリフをUnicodeに収録するつもり なんだろうか
- 651 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 18:24:17 ]
- >>650
グリフをUnicodeに収録? まともかく、文字が表示されないときにそれが単にグリフがないせいなのか Unicodeの範囲に入っていないせいなのかわかるとうれしいけどね。 で前者の場合にはだいたいどこら辺の文字かもわかると。 フォントの自動置換が働く場合には特に。
- 652 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 22:20:54 ]
- appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1470KXRemainder.pdf
ようやく見出し文字を全部符号化したUnicode康煕字典が作れるようになるのか。 韓国なんかUNC(緊急に必要な文字)を1万字くらい収録しる! とか無理難題言ってるのに 日本の謙虚さは異常。大漢和の未収録文字くらい提案したって罰は当たらないと 思うんだが
- 653 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:34:12 ]
- 日本語みたいにひらがなで書けばいいみたいなのができないから
しゃーないのかなと思う所はある。
- 654 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:09 ]
- 韓国はハングル専用で日本より脱漢字は進んでいるはずなんだけどな
- 655 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:53 ]
- そのハングルが合成文字で凄まじい組み合わせ数あるから・・・
- 656 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:43:09 ]
- 今回提案されてるのは全部漢字な件
- 657 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:44:50 ]
- そうだったのか・・・
- 658 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:53:23 ]
- Ideographicなんとかグループだから表音文字は対象外だろjk
- 659 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 00:20:59 ]
- 表音文字の癖にコード空間を浪費するハングルは、ほんと迷惑文字。
- 660 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 12:48:40 ]
- インド人の爪の垢を煎じて飲ませたいな
(インド系文字もハングル式に実装すると数千字分くらいのコードポイントは平気で使う)
- 661 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:14:47 ]
- 俺、ハングルのことは全くと言っていいほど知らないんだが、
それ実際にやったら描画・文字幅計算とかアラビア文字みたいにややこしいことにならない?
- 662 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:30:44 ]
- いちおうOpenTypeのグリフ置換の機能を使った組合型の実装例はある
(Hangeul Jamoブロックを使った奴ね) Mac OS Xは(互換漢字と一部の記号を除いて)NFDだからHFS Plusのボリューム上では ハングルはバラバラになって記録されてる
- 663 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:47:33 ]
- 小学生の頃はどんな漢字も部首の組み合わせで表現できると信じていたのを思い出す。
- 664 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 03:32:42 ]
- 日本政府はわざわざ常用漢字と表外字で字体の違いを発生させて
部首の組み合わせによる表現をやりにくくしてるし
- 665 名前:デフォルトの名無しさん [2008/06/17(火) 12:24:24 ]
- ハングルは大移動なんかしないで従来のコードで表せない字母の組み合わせは
U+1100〜のHangeul Jamoブロックの組み合わせで表すことにすればよかったのに。 それかどうしても全ての組み合わせのコードが必要なら追加分はBMP外にするべきだったと思う。
- 666 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 12:54:01 ]
- BMPを占有しすぎだな。
ttp://www.unicode.org/roadmaps/bmp/
- 667 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 20:06:18 ]
- >>665
> 従来のコードで表せない字母の組み合わせは > U+1100〜のHangeul Jamoブロックの組み合わせで表す Unicode 1.1までははそうするつもりだったのに全部収録させるためだけに Hangul and ComputerがUnicode Consortiumのフルメンバーになったりしてだな www.unicode.org/history/contributors.html
- 668 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 10:54:24 ]
- JIS以降、日本の文字コードで試行錯誤したのをそのままトレースしてるようだなw
- 669 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 22:29:01 ]
- 日本がやったのは試行錯誤じゃなくて一学者によるゲリラ活動。
- 670 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 23:14:36 ]
- 今も続く混乱を考えると一学者だけじゃないな
|

|