[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 05/09 17:12 / Filesize : 157 KB / Number-of Response : 671
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ part3



1 名前:デフォルトの名無しさん [2007/05/27(日) 16:19:36 ]
プログラムにおける各種文字コードの処理について語りましょう♪

■前スレ
文字コード総合スレ part2
pc11.2ch.net/test/read.cgi/tech/1143375639/

■参考サイト
Unicode Home Page
www.unicode.org/
Java Character Encodings
www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm


644 名前:641 mailto:sage [2008/06/05(木) 01:51:37 ]
えーと補足すると、全角/半角というのは単に表示側の表示の問題であって
概念的には同じ文字なので半角にNORMALIZEされた形にすべき、
ってのが昔のvoidの主張だった気がする。JIS X 0208もUnicodeも規格はそういう
考えだったと思う。それがこのスレ的にどうなのかなと。
たとえばUnicodeテキストでWinの「〜(U+2015)」とMacの「〜(U+2014)」が混ざってたら俺としては
2015に正規化したくなる。でも全角半角は事実上すべての環境で表示される字の大きさが
異なるので同じ文字としては扱いたくないなーと。

645 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 02:02:01 ]
カレーパンのうた、すげぇw
ttp://www.geocities.jp/jugongordie/old/curryfla/curryfla.html

>>644
まぁ細かいこと気にするな
( ゚Д゚)⊃ ○ < カレーパン食え
ttp://food8.2ch.net/test/read.cgi/bread/1092166761/

646 名前:644 mailto:sage [2008/06/05(木) 02:56:34 ]
間違えた。カレーパン喰ってくる。
(誤) Winの「〜(U+2015)」とMacの「〜(U+2014)」
(正) Winの「‖(U+2225)」とMacの「‖(U+2016)」

ん? いつから双柱って傾いて表示されるようになった? Vistaから?

647 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 00:53:19 ]


648 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 06:36:11 ]
itpro.nikkeibp.co.jp/article/COLUMN/20061221/257533/
の図12

649 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 00:31:44 ]
IVS対応ATOKマダー(AAry
appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf
>>646
メイリオだともっと露骨に斜め45度の線2本で表示される。
まあちゃんと研究してるんだろう。角度とか

650 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 07:22:05 ]
Last Resort Font
www.unicode.org/policies/lastresortfont_eula.html
てっきりエイプリルフールネタだと思ってたのに本気でグリフをUnicodeに収録するつもり
なんだろうか

651 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 18:24:17 ]
>>650
グリフをUnicodeに収録?

まともかく、文字が表示されないときにそれが単にグリフがないせいなのか
Unicodeの範囲に入っていないせいなのかわかるとうれしいけどね。
で前者の場合にはだいたいどこら辺の文字かもわかると。
フォントの自動置換が働く場合には特に。

652 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 22:20:54 ]
appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1470KXRemainder.pdf
ようやく見出し文字を全部符号化したUnicode康煕字典が作れるようになるのか。
韓国なんかUNC(緊急に必要な文字)を1万字くらい収録しる! とか無理難題言ってるのに
日本の謙虚さは異常。大漢和の未収録文字くらい提案したって罰は当たらないと
思うんだが



653 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:34:12 ]
日本語みたいにひらがなで書けばいいみたいなのができないから
しゃーないのかなと思う所はある。

654 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:09 ]
韓国はハングル専用で日本より脱漢字は進んでいるはずなんだけどな

655 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:53 ]
そのハングルが合成文字で凄まじい組み合わせ数あるから・・・

656 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:43:09 ]
今回提案されてるのは全部漢字な件

657 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:44:50 ]
そうだったのか・・・

658 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:53:23 ]
Ideographicなんとかグループだから表音文字は対象外だろjk

659 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 00:20:59 ]
表音文字の癖にコード空間を浪費するハングルは、ほんと迷惑文字。

660 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 12:48:40 ]
インド人の爪の垢を煎じて飲ませたいな
(インド系文字もハングル式に実装すると数千字分くらいのコードポイントは平気で使う)

661 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:14:47 ]
俺、ハングルのことは全くと言っていいほど知らないんだが、
それ実際にやったら描画・文字幅計算とかアラビア文字みたいにややこしいことにならない?

662 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:30:44 ]
いちおうOpenTypeのグリフ置換の機能を使った組合型の実装例はある
(Hangeul Jamoブロックを使った奴ね)
Mac OS Xは(互換漢字と一部の記号を除いて)NFDだからHFS Plusのボリューム上では
ハングルはバラバラになって記録されてる



663 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:47:33 ]
小学生の頃はどんな漢字も部首の組み合わせで表現できると信じていたのを思い出す。

664 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 03:32:42 ]
日本政府はわざわざ常用漢字と表外字で字体の違いを発生させて
部首の組み合わせによる表現をやりにくくしてるし

665 名前:デフォルトの名無しさん [2008/06/17(火) 12:24:24 ]
ハングルは大移動なんかしないで従来のコードで表せない字母の組み合わせは
U+1100〜のHangeul Jamoブロックの組み合わせで表すことにすればよかったのに。
それかどうしても全ての組み合わせのコードが必要なら追加分はBMP外にするべきだったと思う。

666 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 12:54:01 ]
BMPを占有しすぎだな。
ttp://www.unicode.org/roadmaps/bmp/

667 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 20:06:18 ]
>>665
> 従来のコードで表せない字母の組み合わせは
> U+1100〜のHangeul Jamoブロックの組み合わせで表す
Unicode 1.1までははそうするつもりだったのに全部収録させるためだけに
Hangul and ComputerがUnicode Consortiumのフルメンバーになったりしてだな
www.unicode.org/history/contributors.html

668 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 10:54:24 ]
JIS以降、日本の文字コードで試行錯誤したのをそのままトレースしてるようだなw

669 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 22:29:01 ]
日本がやったのは試行錯誤じゃなくて一学者によるゲリラ活動。

670 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 23:14:36 ]
今も続く混乱を考えると一学者だけじゃないな






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<157KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef