- 1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
- Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ 意味ないじゃん! Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。
- 445 名前:名無しさん@Emacs [03/04/27 01:19 ID:6zN1r8md.net]
- お前ら、新しいエサですよ。
Unicode 4.0 Released! www.unicode.org/versions/Unicode4.0.0/
- 446 名前:login:Penguin mailto:sage [03/04/27 01:25 ID:qRyDd44s.net]
- (゚д゚)ハァーン
- 447 名前:( ´Д`)/< 先生!!こんなのが有りますた。 mailto:sage [03/04/27 01:31 ID:dA76kPz1.net]
- www.yamazaki.90.kg/hankaku/hankaku07.html
www.yamazaki.90.kg/zenkaku/index.html www.yamazaki.90.kg/hankaku/hankaku08.html yamazaki.90.kg/hankaku/hankaku10.html www.yamazaki.90.kg/hankaku/hankaku01.html yamazaki.90.kg/hankaku/hankaku03.html www.yamazaki.90.kg/hankaku/hankaku02.html yamazaki.90.kg/hankaku/hankaku09.html www.yamazaki.90.kg/hankaku/hankaku06.html yamazaki.90.kg/hankaku/hankaku04.html www.yamazaki.90.kg/zenkaku/index.html www.yamazaki.90.kg/hankaku/hankaku05.html
- 448 名前:login:Penguin [03/04/27 04:22 ID:AM2rRROs.net]
- 日本が独自に4バイト固定長あるいは8バイト固定長の国際標準を
ぶちあげようとしたら、急に経済制裁とか空爆とかを受けそうだな。
- 449 名前:login:Penguin mailto:sage [03/04/27 05:07 ID:r9SAhPiw.net]
- >日本が独自に
という時点で >国際標準 にはなりえん気もするが。
- 450 名前:login:Penguin mailto:sage [03/04/27 10:26 ID:CIHHY3pY.net]
- >>445>>446
ISOの国際化規格もXの国際化規格もli18nuxも日本人が中心となって 作った。 Linuxの既存の国際化の仕組みに不満があるなら、li18nuxの樋浦さん あたりに直接文句言えば。
- 451 名前:login:Penguin mailto:sage [03/04/27 14:04 ID:PuFritwf.net]
- li18nuxって役に立ってる?
li18nuxの作ったソフトってどこの ディストリビューションも使ってないよね?
- 452 名前:login:Penguin [03/04/27 14:17 ID:12AnfH8t.net]
- 法律で、UCS-4以外を使えば犯罪にしてくれ
- 453 名前:login:Penguin mailto:sage [03/04/27 15:10 ID:LPP1MV5m.net]
- >>448
li18nuxは標準化グループです。 今すぐ移行できるレベルの標準はわざわざみんなで考える必要はありません。 ディストリビューション屋さんの得意な既存のソフト組合わせ+少々の改造は、 ディストリビューション屋さんに任せましょう。
- 454 名前:login:Penguin mailto:sage [03/04/27 15:36 ID:PuFritwf.net]
- でも、いくつかのsubgroupはクソなので困るんだよね。
- 455 名前:login:Penguin mailto:sage [03/04/27 16:21 ID:TW4m7+2W.net]
- >> 450
実装も何気に多い罠 1. locale名の標準化とlocaledefの提供 ja_JP.ujis -> ja_JP.EUC-JP 2. netscape4.xの不正なmultibyte処理で落ちるバグ対策 mozillaが使い物になりはじめてた時期であんまり意味なし 3. Xlib-I18N Xlocaleのdynamic module化 -> XFree86にmerge済(iconv依存部以外) XomCTL(by Sun) -> いまどうなってんの? CSI xterm -> UTF-8 xterm/luitの出現に敗北 4. GNU toolのmultibyte対応化(by IBM) bash(readline)、grep、sed、gawkなど、現在本家へのmergeが進む 5. その他いろいろ(Big5をISOに〜etc...) あとは前世のNLS分科会での 1. glibc2のmb/wcとlocaledefで日本語が通る為の修正 2. gettext catalogのcontrib などもあるわけだが。 標準化ならthread-safe localeとかnetwork transparent localeとか もっと大風呂敷を広げてくれって感じ。 (Open groupのdistributed localeみたいな) >>451 > いくつかのsubgroupはクソ maja(ryっすか?
- 456 名前:login:Penguin [03/04/30 03:11 ID:3+jGzA7G.net]
- まずは、C言語、C++言語の国際標準を改定させてcharという型名を
バイトの代わりにつかうことを禁止させて欲しい。octet とか、byte という型名に変えて欲しい。すべてはまずそこからだ。 Fortran言語も、もしも型名characterが本当に採用している文字表記の 文字1字に対応しているのならよいが、そうでないのなら、octetとか asciiとかbyteというような型名に国際規格を変更して欲しい。
- 457 名前:login:Penguin mailto:sage [03/04/30 03:35 ID:3ObV2i6L.net]
- >>453
int8_t〜int64_tとかuint8_t〜uint64_tとかquad_tとかご存知無い? stdint.hとかC99の仕様を一読してから再度ご来場願いたい
- 458 名前:login:Penguin [03/04/30 05:40 ID:3+jGzA7G.net]
- char がC/C++言語として使える限り、あれを文字型と称するかぎり、
コードからcharを文字のデータに使うコーディングが無くなる ことはない。
- 459 名前:(・∀・)y−~~~ [03/04/30 06:32 ID:1OhVc4dx.net]
- homepage3.nifty.com/coco-nut/
- 460 名前:login:Penguin mailto:sage [03/04/30 06:42 ID:cbI0AZKf.net]
- 型なんて飾りです、若い香具師にはそれがそれが判らんのです
最近はJavaあたりの影響か、くだらんこと気にする香具師が増えたのか? char = iso646ってことで、文字型と呼んどきゃいいじゃん
- 461 名前:login:Penguin mailto:sage [03/04/30 11:41 ID:tIYWtx7i.net]
- >>455
規格書、ちゃんと読んだ方がいいんじゃない? charのbit幅について、とかさ。 君がchar = UCS-4な実装するのは誰も止めないぞ。 さらにスレ違い。
- 462 名前:login:Penguin mailto:sage [03/04/30 22:48 ID:lotq/ow/.net]
- plain Cで書くのを禁止にすれ。
- 463 名前:login:Penguin [03/05/04 13:33 ID:E/rgpU1m.net]
- 結論として、多言語混在の文書を書くには、
UTF-8がベストなのか?
- 464 名前:login:Penguin mailto:sage [03/05/04 22:04 ID:LYzzLtSd.net]
- >>460
> 多言語混在 UTF-8/UnicodeだとHan-Unification問題、fontの問題がありますが何か? 言語タグで解決するくらいならISO2022で良かった。
- 465 名前:山崎渉 mailto:(^^) [03/05/22 02:03 ID:VfjbtMwi.net]
- ━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
- 466 名前:login:Penguin mailto:sage [03/05/29 14:48 ID:njol5Zmj.net]
- 欧米人には utf-8 めちゃくちゃ受けがいいんだよ。
らくちんだもんな。
- 467 名前:login:Penguin mailto:sage [03/06/01 02:26 ID:fkUOiXAk.net]
- >>461
ISO 2022マンセーなのは日本人だけ。 >>463 ISO-8859-1→ISO-8859-15よりISO-8859-1→UTF-8の方が都合がいいんだろ。
- 468 名前:login:Penguin [03/06/01 15:14 ID:xEapgirA.net]
- 保全age
- 469 名前:login:Penguin mailto:sage [03/06/02 00:06 ID:RU4bgj1/.net]
- ISO-8859-1以外だと即変換テーブル必要になるUnicodeはアフォ。
- 470 名前:login:Penguin mailto:sage [03/06/02 04:55 ID:CmpL8QI9.net]
- よく知らんが、
サーゲなんとかペアで Han Unification は解決できるの? というか、iso-2022 <-> unicode の変換が一意にできるような標準は できてないの?
- 471 名前:login:Penguin mailto:sage [03/06/08 00:06 ID:wjasDkQy.net]
- >>467
> サーゲなんとかペアで Han Unification は解決できるの? サロゲートペアってのは16bitで足りねーから建て増ししたってだけの話。 Han-Unificationってのは同じコードポイントであってもCJ(K)でグリフが違うって話。 よって両者は無関係。 過去のUnicodeと互換性を無くしてまでこれらの文字に新しくコードを 割り当てる英断を期待しろとでも? > というか、iso-2022 <-> unicode の変換が一意にできるような標準は ISO2022は文字コードではないぞ。 Unicodeは過去の文字コードとの互換性をISO8859-1以外一切無視してるので 計算による変換は不可能。変換テーブルはftpで公開してるが内容についてはかなりアヤシイ。
- 472 名前:login:Penguin mailto:sage [03/06/08 01:08 ID:ZOaY8FC3.net]
- 「言語タグ」を使えば理論的には可能じゃない?
まあ、実装する奴がいるとは思えないが(w
- 473 名前:login:Penguin mailto:sage [03/06/08 18:33 ID:wjasDkQy.net]
- Unicode 14面に入ってるからいずれ実装せざるを得ないんだろね >言語タグ
もしくはxmlのlang属性とかpangoとかplain textで直接文字列操作しないのがあたりまえになるか。
- 474 名前:login:Penguin mailto:sage [03/06/09 04:56 ID:jVTEBnNx.net]
- >>468
> 過去のUnicodeと互換性を無くしてまでこれらの文字に新しくコードを > 割り当てる英断を期待しろとでも? 結局 unicode では、漢字圏の多国語同時表示はいつまでたっても 期待できないんですか? emacs の iso-2022-7bit の方がまし?
- 475 名前:login:Penguin mailto:sage [03/06/09 08:22 ID:8Cy1V2dg.net]
- 漢字圏の多国語同時表示なんかより、☆とか⌒…とか、記号すらまともに表示できない糞環境をなんとかすれ。
- 476 名前:login:Penguin mailto:sage [03/06/09 23
]
- [ここ壊れてます]
- 477 名前::02 ID:/M+iPP4I.net mailto: >>471
いや、出来るよ。固定16bit幅の文字エンコーディングじゃなくなっただけで。 まあ、内部的には21bitあれば、固定幅に出来るけども。 [] - [ここ壊れてます]
- 478 名前:山崎 渉 mailto:(^^) [03/07/15 11:28 ID:doz396Fq.net]
-
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
- 479 名前:ぼるじょあ ◆yBEncckFOU mailto:(^^) [03/08/02 05:35 ID:GfRe8vK7.net]
- ∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。 =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕 = ◎――――――◎ 山崎渉&ぼるじょあ
- 480 名前:login:Penguin mailto:sage [03/08/07 06:03 ID:13nJB4vb.net]
- ja_JP.EUC-JP って、なんか意味あるんですか?
実は ja_JP.eucJP とは微妙に違うコードセットだったりするん でしょうか? 全く同じコードセットだとすると、また新しくlocale名の変種が 増えるだけで、ソフトウェア作成の手間が増えて不便になるだけ のような気がするんだけど。 ひょっとして、MIMEのcharset名が全てlocaleのコードセット名と しても使えるようになるんですか? en_US.ISO_8859-1 とか ja_JP.CSEUCPKDFMTJAPANESE も可能に なるの?
- 481 名前:476 [03/08/07 06:05 ID:13nJB4vb.net]
- 失礼、age忘れました。
- 482 名前:login:Penguin [03/08/07 17:06 ID:ZrTxZZCU.net]
- lists.debian.or.jp/debian-devel/200306/msg00011.html
[debian-devel:15660] Re: ja_JP locale name
- 483 名前:login:Penguin mailto:sage [03/08/07 21:05 ID:13nJB4vb.net]
- つまり、コードセット名は全て大文字にしなきゃいけない
ことに新しく決まったから eucJP から EUC-JP に変えるっ てことなのか。 で、なんで全て大文字にしなきゃいけないってことになったの? 互換性を崩してまで統一するメリットってなんなんだろう?
- 484 名前:476 [03/08/07 21:07 ID:13nJB4vb.net]
- またもage忘れ。すんません。
- 485 名前:login:Penguin [03/08/07 22:23 ID:OLNWypPZ.net]
- んなどーでもいいことやる暇があったらja_JP.CP932でもサポートした方が良さそうだが。
- 486 名前:login:Penguin mailto:sage [03/08/07 22:37 ID:/bM3o4Ra.net]
- >>481
ja_JP.SJISがサポートされない理由についてはBruno Haibleが バックスラッシュがどうたらこうたら言ってたという話を どこかで見たような気がする。
- 487 名前:login:Penguin [03/08/07 23:04 ID:OLNWypPZ.net]
- >>482
サポートしている商用Unixもあるんだから技術的には不可能ではないと思うのだが、やっぱりめんどくさいからなのかな。
- 488 名前:login:Penguin [03/08/13 01:01 ID:vZiKmtQp.net]
- とにかく文字はアトミックなデーターとして、内部構造に依存せずに
プログラム言語から素直に処理できるのが良い。32ビットを 1文字にするのが、絶対にいいよ。
- 489 名前:login:Penguin mailto:sage [03/08/13 01:49 ID:Hpn4pIg2.net]
- そうは言っても、Unicodeは半角全角問題とか、
ハイフン問題とか、decomposed正規化とか、 サロゲートペアとかあって一筋縄ではイカンわな。 毛ちょっと何とかしてほしひ。
- 490 名前:login:Penguin mailto:sage [03/08/15 15:29 ID:CM17UZsB.net]
- この文脈でのatomicの意味が分からん。
statelessなencodingのことをいってんのか thread-safeなlocaleとwchar_t(たとえばwchar_tをUCS4にするとか)のことを いってるのかサパーリ。 そもそも文字コードといってるのはCCSかCESどっちよ?
- 491 名前:login:Penguin [03/08/15 20:48 ID:d8HSbf3p.net]
- ↑皿仕上げ
- 492 名前:login:Penguin mailto:sage [03/08/15 22:05 ID:uQ1Z8d9X.net]
- 定期的に
www.ietf.org/rfc/rfc2130.txt www.unicode.org/unicode/reports/tr17/ www.w3.org/TR/1999/WD-charmod-19991129/ あたりすら読まん厨がage続けるスレはここですか?
- 493 名前:山崎 渉 mailto:(^^) [03/08/15 22:08 ID:dil3w4kp.net]
- (⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
- 494 名前:山崎 渉 mailto:(^^) [03/08/15 22:38 ID:dil3w4kp.net]
- (⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
- 495 名前:login:Penguin [03/08/16 10:25 ID:+/Q/RORk.net]
- ATOMICということは、その言語の通常の操作では、内部構造がなくて、
分割できない塊としてのみ操作ができるという意味だよ。 たとえばPascal言語では、整数型や実数型、文字型、ポインタ型 などのデータは、その内部構造や内部表現にはPASCAL言語としては 立ち入ることが出来ない。(もちろん普通は実数も整数も、バイト単位 で構成されていたり突き詰めれば二進数ビットで符号化されているわけだが、 言語仕様上は、そのような内部事情にはアクセス手段がない。だから 化学での原子のように扱える。内部に核があって電子があって、陽子中性子 があるというようなことはとりあえず考えないでいこうということ。)
- 496 名前:login:Penguin mailto:sage [03/08/17 14:20 ID:fizQt/ca.net]
- で、どのレイヤを指して文字ってんのよ?
- 497 名前:login:Penguin mailto:sage [03/08/18 11:47 ID:qg3zTJIe.net]
- 超今更だが、>>37が過ちを犯している。utf-8の漢字は3byteな。
- 498 名前:login:Penguin mailto:sage [03/08/20 00:41 ID:mKHd8Wgb.net]
- >>493
最小で3byteですが最大では6byteですよ
- 499 名前:login:Penguin [03/10/20 03:44 ID:Z7b4Bpl5.net]
- (゜ω゜)ポカーン.....
- 500 名前:login:Penguin [03/11/30 01:44 ID:57WnbG8d.net]
- すいませーん、
オンラインで EUC-JP の規格を参照できるようなサイトはありますか? 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 >> 165 結局、EUC-JP の 0x21 から 0x7E のあたりって、ASCII なんでしたっけ、 それとも JIS X 0201 ローマ字を使うんでしたっけ? なんとなく ASCII だと思い込んでいたんですが。。。 Unicode と旧来のエンコーディングを行ったり来たりする処理を使うことが ときどきありますが、この「ASCII か JIS X 0201 ローマ字か」でいつも 頭が痛いんです。困っているのは僕だけじゃないと思いますが.... どうにかしてくれ > 偉い人
- 501 名前:login:Penguin mailto:sage [03/11/30 03:21 ID:W0msD5oz.net]
- muleに付いている文書、ISO2022.jaを読めば?
www.iana.org/assignments/character-sets もね。 そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?
- 502 名前:login:Penguin [03/12/01 03:18 ID:SviQyXwA.net]
- どうもさんくすです。
> muleに付いている文書、ISO2022.jaを読めば? これは「規格」なのかどうかはよくわかりませんが、 xemacs を調べてみると、etc/CODINGS というファイルで euc-japan は ASCII を使うようになってるみたいですね。(僕が見方を間違えていなければ) > www.iana.org/assignments/character-sets もね。 こちらも、ASCII っぽいですね... ってことで ASCII と思っていいのかな? > そもそも www.unicode.org/Public/UNIDATA/ じゃないのか? えーと Unicode の方は規格を知らないということじゃなくて、 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、 既存のエンコーディングとのからみの話です。もはや、Unicode と既存のエン コーディングの対応が整備/修正されるのは諦めるしかないのかなあ、なんて 思ったりして。 たぶん、これってもう何度も何度も繰り返された話題でしょうね、スマソ。
- 503 名前:>>497 [03/12/01 04:03 ID:YFXe237k.net]
- >>498
規格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。 > 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。 >>498 > 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、 > 既存のエンコーディングとのからみの話です。 風間Java国際化本読め。 大体文字使っている奴が reverse solidus として使っているか、 yen sign として使っているか、全くわからんのだから、 文章書いた奴以外完全な解決はできん。そいつも忘れてるかもしれん。 ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。
- 504 名前:login:Penguin mailto:sage [03/12/01 11:02 ID:bqzp7dFQ.net]
- >格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。
ヴァカですか? >風間Java国際化本読め。 営業ですか?
- 505 名前:login:Penguin mailto:sage [03/12/01 11:03 ID:bqzp7dFQ.net]
- >格読みたければ、JISの規格票買えよ。
ヴァカですか? >風間Java国際化本読め。 営業ですか?
- 506 名前:login:Penguin mailto:sage [03/12/01 11:33 ID:doVY1QDl.net]
- EUC-JP って JIS に入ってたっけ?
- 507 名前:login:Penguin [03/12/02 04:37 ID:Ld5fw5ew.net]
- >>499
>> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 >もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。 は。ちなみに Unicode だとそういうのがオンラインであるわけで、 こうやって普及に差が出るのかなあって思う。 >文章書いた奴以外完全な解決はできん。 そうです。で文章書いた奴の意図を汲むための処理 (UI 等) が必要なわけ。 でもそういう処理を用意するのは面倒だし、さらに文字コードのことを深く 知らないユーザから見たら奇異だよね。 で、それって別に原理的にそうなんじゃなくて単に規格がダメなせいでしょ、 って話。 >ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。 kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html や euc.jp/i18n/charcode.ja.html の「5.1 EUC」 を見ると、EUC でも ISO 646(JIS X 0201 ローマ文字)はアリみたいなんで すが。極少でも、間違いじゃないなら面倒見るべきでは。
- 508 名前:login:Penguin mailto:sage [03/12/02 06:54 ID:0RsR6Dsz.net]
- >>503
EUC は CES ですが、EUC-JP は CCS です。 EUC-JP では、code set 0 は ASCII に決まってます。 www.iana.org/assignments/character-sets の MIBenum: 18
- 509 名前:login:Penguin [03/12/03 02:46 ID:UUcL758a.net]
-
- 510 名前:login:Penguin [03/12/03 14:18 ID:6d4CdMx0.net]
- どっちでもいいからどっちかに統一しろや無能どもが。
- 511 名前:login:Penguin mailto:sage [03/12/03 16:56 ID:B3zlXzir.net]
- >>506
統一したらしたで文句言うんだろう?カスが。
- 512 名前:login:Penguin mailto:sage [03/12/04 19:14 ID:9n6DOrlU.net]
- >>504
CESとCSSはなんの略でしょうか? 教えてください。
- 513 名前:login:Penguin mailto:sage [03/12/05 00:06 ID:TihMjOjI.net]
- Character Encoding Scheme (文字符号化方式)
Coded Character Set (符号化文字集合) CCS は文字の集合を表現するもの。CES は一つ、あるいは複数の CCS を実際の バイト列というかビット列というか、そういう表現に写像するもの。
- 514 名前:508 mailto:sage [03/12/05 04:19 ID:mdRn2HdJ.net]
- >>509
ということは、EUC-JPもCESじゃないでしょうか? 私は、ISO-2022の状態遷移を持たずに済むようにしたサブセットがEUCで、 EUCの文字集合を具体的に定義したものがEUC-JPだと理解していますが どうなんでしょうか?
- 515 名前:login:Penguin mailto:sage [03/12/05 21:19 ID:WmOgE02Z.net]
- >>499
www.jisc.go.jp/ から読めたりしますが。 ただし「解説」は読めないみたい。 あと、JIS X 0208と0213は規格協会から出版されている 『増補改訂 JIS漢字字典』に縮刷版が入ってたりする。 0x5cが円記号か逆斜線かは、コードの由来に立ちかえれば明快。 ・シフトJIS: JIS X 0201の8ビットコードの拡張なので円記号(YEN SIGN) ・EUC: ASCIIの拡張なので逆斜線 (REVERSE SOLIDUS) >>510 CCS, CESという定義の仕方はあまりうまくないので、真面目に考えるだけ損。
- 516 名前:login:Penguin [04/01/04 13:24 ID:KetwKeXM.net]
- なんでわざわざ規格が2つもあるんだか。普通に考えておかしいじゃん。
両方とも、他方の欠点についてくだらん言い訳をグダグダのたまうんだろうけど 結局のところこの統一されてない状態が一番不便なのがわからんのかクソども。
- 517 名前:login:Penguin mailto:sage [04/01/05 05:56 ID:AOcZ5fo2.net]
- どんな文字コードでも使える実装をほどこせばいいんでない?
とか言うのはソフトを書くわけでもない素人の意見なのかな、やっぱり……
- 518 名前:login:Penguin mailto:sage [04/01/05 10:29 ID:gmkRu+uW.net]
- >>513
はい。
- 519 名前:login:Penguin mailto:sage [04/01/12 16:06 ID:Z4GWGJfa.net]
- lヽ ノ l l l l ヽ ヽ
)'ーーノ( | | | 、 / l| l ハヽ |ー‐''"l / C | | |/| ハ / / ,/ /|ノ /l / l l l| l C ヽ l ・ i´ | ヽ、| |r|| | //--‐'" `'メ、_lノ| / ・ / | S l トー-トヽ| |ノ ''"´` rー-/// | S | | ・ |/ | l ||、 ''""" j ""''/ | |ヽl ・ | | I | | l | ヽ, ― / | | l I | | !! | / | | | ` ー-‐ ' ´|| ,ノ| | | !! | ノー‐---、,| / │l、l |レ' ,ノノ ノハ、_ノヽ / / ノ⌒ヾ、 ヽ ノハ, | ,/ ,イーf'´ /´ \ | ,/´ |ヽl | /-ト、| ┼―- 、_ヽメr' , -=l''"ハ | l ,/ | ヽ \ _,ノーf' ´ ノノ ヽ | | 、_ _ ‐''l `ー‐―''" ⌒'ー--‐'´`ヽ、_ _,ノ ノ  ̄ ̄ | /  ̄
- 520 名前:login:Penguin [04/01/21 04:54 ID:l6i+YvvA.net]
- Post
- 521 名前:login:Penguin [04/01/24 12:36 ID:OGcyA9QE.net]
- GBやKSやCNSって文字名を規定するように改訂されてるんですか?
されてなかったら文字名による同定なんて絵に描いた餅だと思うんですが。 少なくともGB2312は廃止されてGB18030になったんだから 改訂版は存在しないですよね?
- 522 名前:login:Penguin mailto:sage [04/01/27 17:53 ID:Vqw8VTxA.net]
- >>517
少なくともISO/IEC 8859シリーズやJIS X 0201/0208/0213は文字名を規定してる。 他の奴は調査のうえ報告きぼん。
- 523 名前:login:Penguin mailto:sage [04/01/27 18:02 ID:CYFtYKQ6.net]
- >>518
それは知ってます。だからGB/KS/CNSについて聞いてみたわけです。 JIS X 0212の文字名は「参考」しか存在しないですね。
- 524 名前:login:Penguin mailto:sage [04/01/28 01:38 ID:yXeHWwGb.net]
- GB18030の仕様書?
www.anycities.com/gb18030/standard.htm
- 525 名前:login:Penguin mailto:sage [04/01/28 09:30 ID:zcjMBZrl.net]
- >>520
やっぱり絵に描いた餅っぽいな JISの範囲に限定してもけっこう破綻してるし
- 526 名前:login:Penguin mailto:sage [04/01/31 00:53 ID:0gxSoMh4.net]
- Unicode Normalization派には全ての文字集合が破綻して見える。
CSI派にはUnicodeが破綻して見える。 いじょ。
- 527 名前:login:Penguin mailto:sage [04/01/31 07:48 ID:uM5oI3vd.net]
- CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
TRONコード?
- 528 名前:login:Penguin mailto:sage [04/01/31 15:12 ID:A1rPcmld.net]
- > CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
CSIだから何でも有りなわけだが…
- 529 名前:login:Penguin mailto:sage [04/02/01 13:09 ID:N4VOvKZ9.net]
- >>520
何がどう破綻してるのか意味不明。 文字名称による同定が破綻しているとすればUnicode/10646自体の失敗に近い。 Unicodeしか無い世界を想定すればそれでも良いのかもしれないけど、 そんな想定は頭の中のお花畑でしょ。
- 530 名前:login:Penguin mailto:sage [04/02/02 10:00 ID:hq6ctxrf.net]
- >>524
内部が何でも有りでよくても外部と情報交換するときには 相手の知らないコードでは話にならないと思うんですが
- 531 名前:login:Penguin mailto:sage [04/02/02 10:06 ID:hq6ctxrf.net]
- >>525
> 文字名称による同定が破綻 そもそも一対一の対応関係しか記述できないのが無理ありすぎ。 > Unicode/10646自体の失敗に近い。 でも国際規格との整合という名目で文字名を規定してしまった。 つーかCJKでUnicodeに一番反対しているはずの日本だけが 自国の文字集合で文字名を規定してる(らしい)ってほとんど ギャクだな。
- 532 名前:login:Penguin mailto:sage [04/02/02 10:41 ID:ZMPM1Vhd.net]
- >>526
何でもありと言ってもcharset repositoryに登録されてる奴だけでしょ。
- 533 名前:login:Penguin mailto:sage [04/02/02 22:12 ID:rBgXmwm9.net]
- 「相手の知らないもの」を「交換」すること事態アリエナイ、
お互いが情報を共有していれば既存の文字集合でなくても構わない。
- 534 名前:login:Penguin mailto:sage [04/02/12 11:08 ID:KO5Q49AN.net]
- > 「相手の知らないもの」を「交換」すること事態アリエナイ、
> お互いが情報を共有していれば どうやって共有するんですか? そんなこと言い出したらネットワークプロトコルなんて 一切必要ないということになると思いますが。
- 535 名前:login:Penguin mailto:sage [04/02/13 07:42 ID:AkWuZ3md.net]
- 既存のコードのどれかに対する写像関数があれば
何も問題なさそうだけど。プロトコルと違って 文字コードは単純なので同じように考えることは できないと思うけど。
- 536 名前:login:Penguin mailto:sage [04/02/13 10:16 ID:9tJnggCR.net]
- 関数が、ベンダーによって違ったり、
単射に出来なかったりで問題。
- 537 名前:login:Penguin mailto:sage [04/02/19 17:11 ID:HogZ/lIc.net]
- とりあえずSJIS撲滅しろ
- 538 名前:login:Penguin mailto:sage [04/02/19 18:46 ID:wXxKmQwW.net]
- /⌒ヽ すいません、ちょっと撲殺しますよ・・・
/ ´_ゝ`) | | と ) | | ガッ Y /ノ 人 / ) < >_∧∩ _/し' //. V`Д´)/ (_フ彡 /←>>533
- 539 名前:login:Penguin mailto:sage [04/02/20 15:15 ID:MhppvPgK.net]
- 「SJIS撲滅しろ」とSJISで読ませてる矛盾…
日本製品排斥運動のプラカードを日本製筆記用具で書いてる話を思い出したよ。
- 540 名前:login:Penguin mailto:sage [04/02/20 15:25 ID:USABAkbG.net]
- ネット上を流れる日本語の何割ぐらいがEUCなのかな。
事情がどうであれ、SJISが既に多数派だってことは 受け入れないとダメだろね<EUC派の人。
- 541 名前:login:Penguin mailto:sage [04/02/20 15:42 ID:HZ88v8IJ.net]
- YahooはEUC-JPだよね。
- 542 名前:login:Penguin mailto:sage [04/02/20 15:59 ID:DuOkNDXy.net]
- >>536
煽りか知らんが、それを受け入れてない香具師はいないだろ。 wwwにutf-8,16使ってるページが少ないからといってunicode推進は間違ってるという結論にはならん訳だし。
- 543 名前:login:Penguin mailto:sage [04/02/20 16:10 ID:HZ88v8IJ.net]
- >>538
全然関係ない話だが、XHTMLがXMLの派生だと考えると、XHTMLでは UTF-8・UTF-16を使うのが正道だと思うのだが、どう思う? Unicode嫌いだがXHMLラブな俺。
- 544 名前:login:Penguin mailto:sage [04/02/20 18:02 ID:DuOkNDXy.net]
- utf-16より16ビットクリーンのucs-2が乙。
- 545 名前:login:Penguin mailto:sage [04/02/20 18:13 ID:OGx3SqOQ.net]
- > 16ビットクリーン
どういう意味? ぐぐっても0件だし。 「8ビットクリーン」の語義から類推すれば、 途中で16ビット目が壊れることはないって意味になるけど・・・
|

|