- 1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
- Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ 意味ないじゃん! Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。
- 520 名前:login:Penguin [04/01/21 04:54 ID:l6i+YvvA.net]
- Post
- 521 名前:login:Penguin [04/01/24 12:36 ID:OGcyA9QE.net]
- GBやKSやCNSって文字名を規定するように改訂されてるんですか?
されてなかったら文字名による同定なんて絵に描いた餅だと思うんですが。 少なくともGB2312は廃止されてGB18030になったんだから 改訂版は存在しないですよね?
- 522 名前:login:Penguin mailto:sage [04/01/27 17:53 ID:Vqw8VTxA.net]
- >>517
少なくともISO/IEC 8859シリーズやJIS X 0201/0208/0213は文字名を規定してる。 他の奴は調査のうえ報告きぼん。
- 523 名前:login:Penguin mailto:sage [04/01/27 18:02 ID:CYFtYKQ6.net]
- >>518
それは知ってます。だからGB/KS/CNSについて聞いてみたわけです。 JIS X 0212の文字名は「参考」しか存在しないですね。
- 524 名前:login:Penguin mailto:sage [04/01/28 01:38 ID:yXeHWwGb.net]
- GB18030の仕様書?
www.anycities.com/gb18030/standard.htm
- 525 名前:login:Penguin mailto:sage [04/01/28 09:30 ID:zcjMBZrl.net]
- >>520
やっぱり絵に描いた餅っぽいな JISの範囲に限定してもけっこう破綻してるし
- 526 名前:login:Penguin mailto:sage [04/01/31 00:53 ID:0gxSoMh4.net]
- Unicode Normalization派には全ての文字集合が破綻して見える。
CSI派にはUnicodeが破綻して見える。 いじょ。
- 527 名前:login:Penguin mailto:sage [04/01/31 07:48 ID:uM5oI3vd.net]
- CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
TRONコード?
- 528 名前:login:Penguin mailto:sage [04/01/31 15:12 ID:A1rPcmld.net]
- > CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
CSIだから何でも有りなわけだが…
- 529 名前:login:Penguin mailto:sage [04/02/01 13:09 ID:N4VOvKZ9.net]
- >>520
何がどう破綻してるのか意味不明。 文字名称による同定が破綻しているとすればUnicode/10646自体の失敗に近い。 Unicodeしか無い世界を想定すればそれでも良いのかもしれないけど、 そんな想定は頭の中のお花畑でしょ。
- 530 名前:login:Penguin mailto:sage [04/02/02 10:00 ID:hq6ctxrf.net]
- >>524
内部が何でも有りでよくても外部と情報交換するときには 相手の知らないコードでは話にならないと思うんですが
- 531 名前:login:Penguin mailto:sage [04/02/02 10:06 ID:hq6ctxrf.net]
- >>525
> 文字名称による同定が破綻 そもそも一対一の対応関係しか記述できないのが無理ありすぎ。 > Unicode/10646自体の失敗に近い。 でも国際規格との整合という名目で文字名を規定してしまった。 つーかCJKでUnicodeに一番反対しているはずの日本だけが 自国の文字集合で文字名を規定してる(らしい)ってほとんど ギャクだな。
- 532 名前:login:Penguin mailto:sage [04/02/02 10:41 ID:ZMPM1Vhd.net]
- >>526
何でもありと言ってもcharset repositoryに登録されてる奴だけでしょ。
- 533 名前:login:Penguin mailto:sage [04/02/02 22:12 ID:rBgXmwm9.net]
- 「相手の知らないもの」を「交換」すること事態アリエナイ、
お互いが情報を共有していれば既存の文字集合でなくても構わない。
- 534 名前:login:Penguin mailto:sage [04/02/12 11:08 ID:KO5Q49AN.net]
- > 「相手の知らないもの」を「交換」すること事態アリエナイ、
> お互いが情報を共有していれば どうやって共有するんですか? そんなこと言い出したらネットワークプロトコルなんて 一切必要ないということになると思いますが。
- 535 名前:login:Penguin mailto:sage [04/02/13 07:42 ID:AkWuZ3md.net]
- 既存のコードのどれかに対する写像関数があれば
何も問題なさそうだけど。プロトコルと違って 文字コードは単純なので同じように考えることは できないと思うけど。
- 536 名前:login:Penguin mailto:sage [04/02/13 10:16 ID:9tJnggCR.net]
- 関数が、ベンダーによって違ったり、
単射に出来なかったりで問題。
- 537 名前:login:Penguin mailto:sage [04/02/19 17:11 ID:HogZ/lIc.net]
- とりあえずSJIS撲滅しろ
- 538 名前:login:Penguin mailto:sage [04/02/19 18:46 ID:wXxKmQwW.net]
- /⌒ヽ すいません、ちょっと撲殺しますよ・・・
/ ´_ゝ`) | | と ) | | ガッ Y /ノ 人 / ) < >_∧∩ _/し' //. V`Д´)/ (_フ彡 /←>>533
- 539 名前:login:Penguin mailto:sage [04/02/20 15:15 ID:MhppvPgK.net]
- 「SJIS撲滅しろ」とSJISで読ませてる矛盾…
日本製品排斥運動のプラカードを日本製筆記用具で書いてる話を思い出したよ。
- 540 名前:login:Penguin mailto:sage [04/02/20 15:25 ID:USABAkbG.net]
- ネット上を流れる日本語の何割ぐらいがEUCなのかな。
事情がどうであれ、SJISが既に多数派だってことは 受け入れないとダメだろね<EUC派の人。
- 541 名前:login:Penguin mailto:sage [04/02/20 15:42 ID:HZ88v8IJ.net]
- YahooはEUC-JPだよね。
- 542 名前:login:Penguin mailto:sage [04/02/20 15:59 ID:DuOkNDXy.net]
- >>536
煽りか知らんが、それを受け入れてない香具師はいないだろ。 wwwにutf-8,16使ってるページが少ないからといってunicode推進は間違ってるという結論にはならん訳だし。
- 543 名前:login:Penguin mailto:sage [04/02/20 16:10 ID:HZ88v8IJ.net]
- >>538
全然関係ない話だが、XHTMLがXMLの派生だと考えると、XHTMLでは UTF-8・UTF-16を使うのが正道だと思うのだが、どう思う? Unicode嫌いだがXHMLラブな俺。
- 544 名前:login:Penguin mailto:sage [04/02/20 18:02 ID:DuOkNDXy.net]
- utf-16より16ビットクリーンのucs-2が乙。
- 545 名前:login:Penguin mailto:sage [04/02/20 18:13 ID:OGx3SqOQ.net]
- > 16ビットクリーン
どういう意味? ぐぐっても0件だし。 「8ビットクリーン」の語義から類推すれば、 途中で16ビット目が壊れることはないって意味になるけど・・・
- 546 名前:login:Penguin mailto:sage [04/02/20 18:17 ID:HZ88v8IJ.net]
- >>540
まぁUTF-16とUTF-8の二者択一で、UTF-16は選ばんな。 サロゲートペアが気持ち悪すぎる。 しかしUCS-2はどうかといわれると、それならUCS-4使いたいところ。
- 547 名前:542 mailto:sage [04/02/20 18:18 ID:HZ88v8IJ.net]
- 似たような理由でShift JISも気持ち悪い。
- 548 名前:login:Penguin mailto:sage [04/02/20 18:36 ID:SE61JsUR.net]
- >>536
シフトJISって言っても何種類もあるしね。
- 549 名前:login:Penguin mailto:sage [04/02/20 18:47 ID:HZ88v8IJ.net]
- >>544
たとえば? まさか「Unicodeへのマッピングが〜」なんて言わないよね……。
- 550 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:YAuvVXfE.net]
- どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。
- 551 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:DuOkNDXy.net]
- >>541
16ビットオンリーと言うべきだったかもしれぬ。 EUC,JIS,SJIS,UTF-8 -> 8ビットと16ビットが混在 UTF-16 -> 16ビットだけと見せかけてサロゲートがある。 UCS-2 -> 16ビットのみ(n文字目に定数時間でアクセス可能)
- 552 名前:login:Penguin mailto:sage [04/02/20 20:26 ID:HZ88v8IJ.net]
- >>546
>どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。 文字集合の話なら、ISO国際登録簿に登録されている。 符号化も含めてなら、一応ISO-2022には「他の符号化システムの指示(DOCS)」機能がある。 これを使えばUnicode(UTF-8・UTF-16)に切り替えられる。 # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
- 553 名前:login:Penguin mailto:sage [04/02/20 20:35 ID:YAuvVXfE.net]
- > # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
本当だ。知らんかった。
- 554 名前:login:Penguin mailto:sage [04/02/20 20:37 ID:SE61JsUR.net]
- >>545
Shift_JISとかMicrosoftのCP932とか
- 555 名前:login:Penguin mailto:sage [04/02/20 20:53 ID:HZ88v8IJ.net]
- >>550
> Shift_JISとかMicrosoftのCP932とか その二つはどこが違うの? 俺の理解では、まさに「Unicodeへのマッピング」の違いなんだが。 あと「何種類もあるしね」と書いているが、2つだけ?
- 556 名前:login:Penguin [04/02/21 10:55 ID:8cIti7Dp.net]
- >>551
マッピングが違う時点で、別の文字コードになる。 種類も 2つではすまない。 www.opengroup.or.jp/jvc/cde/sjis.html
- 557 名前:login:Penguin mailto:sage [04/02/21 11:11 ID:r6ckEmFW.net]
- >>552
> マッピングが違う時点で、別の文字コードになる。 ならない。 文字コードとは文字集合+符号化方式であらわされるもの。 Unicodeへのマッピングは関係ない。 > www.opengroup.or.jp/jvc/cde/sjis.html これはまさに「文字コードの違い」と言える。 ・JIS X 0201かASCIIか ・JIS X 0208は1978か1983か1990か
- 558 名前:login:Penguin [04/02/21 11:28 ID:QqGdeQdg.net]
- アンチEUのスレはここですか?
やはりEUに対抗して大東亜共栄圏を。
- 559 名前:login:Penguin mailto:sage [04/02/21 11:47 ID:u/H1Y2zG.net]
- いや、日本もEUに加盟しようぜ。
- 560 名前:login:Penguin mailto:sage [04/02/21 12:47 ID:Ij37nYR/.net]
- それはブッシュ君が絶対に許しません!
- 561 名前:login:Penguin [04/02/22 12:06 ID:/tZPZccw.net]
- m17libあげ
japan.cnet.com/news/ent/story/0,2000047623,20064400,00.htm
- 562 名前:login:Penguin mailto:sage [04/02/24 16:52 ID:f1XKVOzh.net]
- >>553
> Unicodeへのマッピングは関係ない。 正解。 ただし、外字が入ってる時点でCP932は別の文字コードになってる罠。
- 563 名前:login:Penguin [04/02/25 09:17 ID:OHUltstF.net]
- G2に78JISを指示して78JISの字形を出したいときだけSS2で
切り換えるような実装はISO 2022に適合しますか?
- 564 名前:login:Penguin mailto:sage [04/02/25 09:42 ID:QrUE0gBl.net]
- >>559
ISO-2022的にはアリだと思います。
- 565 名前:login:Penguin mailto:sage [04/02/25 10:36 ID:OHUltstF.net]
- 一意な符号化を要求された場合90JISと同じ字は使用禁止に
なるし要求されなくても同じ字は同じ扱いにならなくてはいけない (違う字形が出力されることに期待してはいけない)わけですが、 何をもって同じ字と判断するのかが悩ましいです。
- 566 名前:login:Penguin mailto:sage [04/02/25 11:23 ID:QrUE0gBl.net]
- >>561
おっしゃるとおりです。使うのはかなりグレーだと思います。 普通にやるなら、上のレイヤーで切り替えるべきでしょうね。 そういえば、JIS X 0208:1997の付属書6を見ていて気づいたのですが、 規格票の刷によっても字形が違うのですね。 たとえば「芦」という字。1978の第4刷より前は「戸」の上部は「一」 ですが、第4刷以降は「ノ」になっています。ところが1983ではまた 「一」に戻っています。
- 567 名前:login:Penguin mailto:sage [04/02/25 23:19 ID:XkkFjwVk.net]
- 97JISの附属書6に78JIS字形として掲げられているものって結構間違い
(実際に78JISに載っていたのとは明らかにデザイン差を越えて異なると 思われるもの)がありますね。私は少なくとも3つ見つけました。 新字源番号にも明らかにおかしいところがありますし。
- 568 名前:login:Penguin mailto:sage [04/03/01 15:28 ID:JCvjaOH6.net]
- charの内部コードはたとえばEBCDICかもしれないから
文字クラス判定を不等号で行ってはいけませんなんて言われてた こともあるのに時代は変わったもんだ
- 569 名前:login:Penguin mailto:sage [04/03/01 15:36 ID:ZJ6X9SrZ.net]
- JIS漢字コード表の改正について−168字の例示字形を変更−(2004.2.20)(pdf:333kB)
www.jisc.go.jp/tpk/pdf/040220kanjicode.pdf こんなん出たらしいですよ。 「芦」なんかが変ってますね。
- 570 名前:login:Penguin mailto:sage [04/03/01 15:47 ID:xLYQ3+Xr.net]
- >>564
変わってませんよ。今でも良くないですよね。
- 571 名前:login:Penguin mailto:sage [04/03/01 16:54 ID:JCvjaOH6.net]
- >>566
もちろん今でもよくないけど __STDC_ISO_10646__ なんてのもできたじゃないですか
- 572 名前:login:Penguin mailto:sage [04/03/01 17:07 ID:ZJ6X9SrZ.net]
- 「じゃないですか」かよ!?
- 573 名前:login:Penguin mailto:sage [04/03/01 17:39 ID:xLYQ3+Xr.net]
- >>567
それでもwchar_tの中身を直接触るのは良くないことなのですよ。
- 574 名前:login:Penguin mailto:sage [04/03/01 22:38 ID:gv8ZeGbq.net]
- sourceforgeのapacheはEUC固定だったりする。
今だにUTF-8が使えない。
- 575 名前:login:Penguin [04/03/03 20:36 ID:CKuIXPe4.net]
- やっとこさthe m17n libraryが公開されたけど、海外の反応が全くないのが気に
なるな。というか、The Free Standards Groupのプレスリリースくらいしか情報 らしい情報は出してないもんなあ。SlashdotとかFreshmeatにアナウンス出した 方がいいと思うけど。
- 576 名前:login:Penguin mailto:sage [04/03/03 20:40 ID:rkyENV70.net]
- >>571
m17nのメイリングリスト入ってるんだけど、一通も流れないのが不気味だ。
- 577 名前:login:Penguin mailto:sage [04/03/04 02:24 ID:clL2BqDq.net]
- 海外の人にこそ使って欲しいなあ。
- 578 名前:login:Penguin mailto:sage [04/03/04 10:43 ID:9PDHb3Ho.net]
- pdx.freedesktop.org/pipermail/uim/2004-March/000171.html
> Great to see that more programmers are getting invonved in > internationalization. I hope they don't release TOO many libraries, > though... ;) とあるひとの反応。
- 579 名前:login:Penguin [04/03/05 10:05 ID:TJTIZyFT.net]
- SJISって文字化け多いんでしょ?
- 580 名前:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ [04/03/05 10:11 ID:BY8DAhkI.net]
- ( ゚Д゚)<呼ばれた気がした
- 581 名前:login:Penguin mailto:sage [04/03/05 17:30 ID:xV2/aTba.net]
- まじばか多いよ。
- 582 名前:login:Penguin [04/03/06 02:50 ID:LSF51fr1.net]
- とりあえず、私の使ってる日本語は2バイトまでにしてください。
漢字はあまり使わないのでJIS第2水準までで十分ですから… 正直、漢字もう少し減らして欲しいよ。 5000字程度に絞って統合しないかな… 市町村みたいにあまり使われてないとこは合併。 そしたらフリーのフォントも作りやすくなるし… ダメかな?とにかく頑張れ総理(えー
- 583 名前:login:Penguin mailto:sage [04/03/06 06:09 ID:xBLfCQy5.net]
- >>578もいなくなれば、人口過密も軽減されるのに…
- 584 名前:login:Penguin [04/03/06 12:19 ID:nOqS+3CF.net]
- >>578
UTF-8は3バイトになるのが嫌っては思う。 そのまま検索できる圧縮方法を標準化すりゃ、色々便利だろうにな。 UCS4の文字コードの差分
- 585 名前:使えんかな。
近い所の文字を連続で使う事が多いだろうし。 検索の時も先頭の文字以外はマッチングするだろうし。 [] - [ここ壊れてます]
- 586 名前:login:Penguin mailto:age [04/03/06 16:57 ID:RIYFz2Z8.net]
- UTF-8の作成に日本はお金だしたの?
ちょっとしかお金ださないから3バイトに追いやられたの? 最近は「金は力なり」ってことはないのかな…
- 587 名前:login:Penguin mailto:sage [04/03/06 17:37 ID:FTiwHY/0.net]
- >>581
なんか外人からみた日本人のイメージの典型みたいな人だなぁ
- 588 名前:login:Penguin [04/03/06 20:57 ID:NtiYGtdX.net]
- >>581
とりあえず、UNICODE コンソーシアムのメンバーで日本の会社は ジャストシステムしか見あたらない。 www.unicode.org/consortium/memblogo.html
- 589 名前:login:Penguin [04/03/06 21:52 ID:k9F50u4V.net]
- >>581
どっかで聞いた気がするのだが結構お金だしてたような……… UNICODEの方だったかなぁ………
- 590 名前:login:Penguin mailto:sage [04/03/07 01:10 ID:1mpDS4RM.net]
- >>578
www.itscj.ipsj.or.jp/ipsj-ts/02-07/coreset/toc.htm というのがあるけど。
- 591 名前:login:Penguin mailto:sage [04/03/07 10:03 ID:JJs7467H.net]
- 特定のロケールのみ使う場合に短縮できるというアイデアは
DIS 10646そのものじゃん。それを葬り去って(ry
- 592 名前:LightCone ◆sSJBc30S5w [04/03/07 19:36 ID:Q1hO8bzI.net]
- >>578, >>580
日本語のJIS第一、第二水準、中国語の第一級、第二級漢字までを2BYTEで 符号化できる新しいUnicode符号化方式:UTFCPを開発したのでご覧下さい。 2バイトで一万五千文字ものコード・ポイントがあります。 www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utf.htm また、この符号は、ロケールやコードページの必要のない世界共通の符号 になり得る可能性があります。 符号の逆戻りも可能なので、文字列を後ろから検索する際の効率も 高いですし、複数バイト文字にASCII符号を一切含まないので、 無配慮に大文字小文字変換をしてしまう様な欧米のアプリケーションに 対しても問題ありません。
- 593 名前:login:Penguin mailto:sage [04/03/08 00:10 ID:Jjoer6mt.net]
- basic planeマンセー!(やや曇り勝ちな声で)
- 594 名前:login:Penguin mailto:sage [04/03/08 00:16 ID:xPUur27x.net]
- >>587
> 今まで2バイトで余裕を持って扱えていたものを、突然3バイトで > 扱わなければならないと言われれば、誰でも納得しがたいもので > しょう。 いや別に……。 でかい文字集合突っ込んでる立場としては、3バイトくらいが妥当と いう感覚がある。
- 595 名前:login:Penguin mailto:sage [04/03/08 00:45 ID:8nTBrLvd.net]
- >>589
それでも、やっぱり2バイトがいい。 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw 飛躍しすぎですが、メールとかの通信量が1.5倍=料金1.5倍と思えば… 2chのログも1.5倍になったら……… FedoraがUTF-8になったので危機感を感じてるのですが 日本か中国で差別用語(?)とか言ってUTF-8禁止令とかでないかなぁ〜 日本政府ヨワッチイからなぁ、中国やってくれないかなw で、英数字1バイト、日本語2バイトが良い我々は、SiftJISかEUC-JP使えばいいの?
- 596 名前:login:Penguin mailto:sage [04/03/08 01:38 ID:CDAnHB+K.net]
- もっと先を見越した発想しないと駄目だよ。
- 597 名前:login:Penguin mailto:sage [04/03/08 01:58 ID:BCltEIyA.net]
- >>591
先を見越すとどうなるの? あとホームページが全部UTF-8になったらインターネットは混む
- 598 名前:かな?
メールがなったら携帯電話は大変だな。ドコモセンター落ちるかな(笑 [] - [ここ壊れてます]
- 599 名前:login:Penguin mailto:sage [04/03/08 02:28 ID:nJKGONH1.net]
- 中華人民共和国にはGB2312やGBKと完全な互換性を保ちつつ
UCS4の上位互換でもあるGB18030が既にありますが。
- 600 名前:login:Penguin mailto:sage [04/03/08 03:06 ID:BCltEIyA.net]
- >>593
さすが中国。で、日本は?
- 601 名前:login:Penguin mailto:sage [04/03/08 03:56 ID:y/RuiKoY.net]
- >>594
日本はUnicodeアレルギーが強すぎるのでUnicodeへの上位互換なんか 屁の突っ張りほどにも思ってない俺コードばかりです。 たいてい大漢和への上位互換は売り文句にしてますね
- 602 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 08:53 ID:JfYQzP4X.net]
- >>595
拡張シフトJIS案、拡張EUC-JP案は提唱されています: web.archive.org/web/20030605094425/www.ksky.ne.jp/~smile4me/charcode/index.htm それと、>>587のUTFCP。
- 603 名前:589 mailto:sage [04/03/08 10:11 ID:xPUur27x.net]
- >>590
> 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw 文化の違いっていうのがよく分かりませんが。 「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と いう意見ならEUC-JPを使えばいいし、他の言語の文字集合も使いたい のならISO-2022を使えばいいでしょう。 > FedoraがUTF-8になったので危機感を感じてるのですが なぜ?
- 604 名前:login:Penguin mailto:sage [04/03/08 10:42 ID:Bwi62gzy.net]
- >>597
なんかいろいろと意味不明な文章ですが > EUC-JP →EUC > ISO-2022 →文字集合指示のエスケープシーケンス ですか? それはともかく簡体字中国語はGB2312しか登録されてないから ISO 2022じゃ話にならないです
- 605 名前:login:Penguin mailto:sage [04/03/08 10:53 ID:xPUur27x.net]
- >>598
> なんかいろいろと意味不明な文章ですが 私もあなたの書いている文章の意味が分かりません。 > > EUC-JP > →EUC EUC-JPであってます。 590の人は「日本語を2バイトで扱いたい」ようでしたので。 > > ISO-2022 > →文字集合指示のエスケープシーケンス ISO-2022を誤解しているのでは? > それはともかく簡体字中国語はGB2312しか登録されてないから > ISO 2022じゃ話にならないです 使えます。「ESC 2/4 4/1」でG0にdesignate。
- 606 名前:login:Penguin mailto:sage [04/03/08 10:54 ID:Bwi62gzy.net]
- > GB2312しか登録されてない
訂正。CCITT Extended GBもありましたね。
- 607 名前:login:Penguin mailto:sage [04/03/08 10:55 ID:xPUur27x.net]
- >>600
あぁ、そういう意味ですか。了解。
- 608 名前:login:Penguin mailto:sage [04/03/08 10:58 ID:Bwi62gzy.net]
- >>598
> 590の人は「日本語を2バイトで扱いたい」ようでしたので。 ならそれに > 「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と > いう意見なら という前提の答えをすること自体が変というだけです。 > ISO-2022を誤解しているのでは? そのままお返しします。EUCもISO 2022の一種でしょう。 > 使えます。「ESC 2/4 4/1」でG0にdesignate。 でも結論は変わりませんね。
- 609 名前:login:Penguin mailto:sage [04/03/08 11:05 ID:xPUur27x.net]
- >>602
> > 590の人は「日本語を2バイトで扱いたい」ようでしたので。 > ならそれに > > 「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と > > いう意見なら > という前提の答えをすること自体が変というだけです。 いいえ。ちっとも変じゃないですね。 > > ISO-2022を誤解しているのでは? > そのままお返しします。EUCもISO 2022の一種でしょう。 サブセットという方が適切ですね。 > > 使えます。「ESC 2/4 4/1」でG0にdesignate。 > でも結論は変わりませんね。 で、結論は?
- 610 名前:login:Penguin mailto:sage [04/03/08 14:41 ID:CDAnHB+K.net]
- このスレに定期的に出ますね。
内容は高度なのに 精神年齢が低い人たちの争い。
- 611 名前:login:Penguin mailto:sage [04/03/08 15:43 ID:W+OHYtj/.net]
- >>604
宗教戦争みたいなものですから。
- 612 名前:login:Penguin mailto:sage [04/03/08 18:49 ID:ERahI9hZ.net]
- > 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw
文化の違いってのは各国の言語事情とかかな。 それ無視したら、言語統制して英語使えって事になりかねないから。 そしたらASCIIで足りるようになるけど。 > FedoraがUTF-8になったので危機感を感じてるのですが なぜかと言うとUTF-8がメインになりそうだからでしょう。 実際には自分で他のコード選べませんから(今だってEUC前提のとこにSiftJISじゃあ… 難しいことは分からないけど 英数字1byteで日本語2byteで他の文字も2byteのコードが欲しい。 で、それを世界標準にしたい。メールもホームページも、それにする。 でも65536文字以上の文字が有るのはどしたらよかろ? 使わなそうな古代XX文字とか非常用漢字は4byte(6?)にでもすればいいのかな
- 613 名前:。
(3byteだと分かりにくそうだし、あとで足りないのはイヤだし…) 中国怒るかな?あと日本中国韓国の常用漢字いれても2byteでいけるのかな? [] - [ここ壊れてます]
- 614 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 21:12 ID:JfYQzP4X.net]
- >>606
>あと日本中国韓国の常用漢字いれても2byteでいけるのかな? これくらいだとなんとかなりそうな符号がUTFCP(UTFCP2も出た(笑))です。
- 615 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 21:13 ID:JfYQzP4X.net]
- UTFCP2のスペック(だけ):
www.nowsmartsoft.or.tv/nws/Japanese/chara_code_compare.htm
- 616 名前:login:Penguin mailto:sage [04/03/08 22:02 ID:Jjoer6mt.net]
- >>590
その前にお前のレスの長さを半分にしてくれ。
- 617 名前:login:Penguin mailto:sage [04/03/08 22:36 ID:kN4paUAc.net]
- 長い行は黙って切り詰めるスレはここですか?
- 618 名前:login:Penguin mailto:sage [04/03/09 12:01 ID:fWu0tHS8.net]
- >>606
そうやって考えられたのがTRONコード。 たとえ、明日宇宙人と交流が始まったとしても、 とっととフォントと割り当て作り配れば、そのままどのクライアントでも宇宙人の文字が読める。 運用や仕様に問題がないとは思わないし手放しで褒められるものじゃないみたいだけど、 その考え方自体は賛成。
- 619 名前:login:Penguin mailto:sage [04/03/09 13:14 ID:yT9facPe.net]
- >>611
TRONコードは、ISO2022と同様の状態指定が必要なんでしたよね。 状態指定がある文字コード体系ではプログラミングし辛いので、EUCや、SJISが 登場したんだけど。
- 620 名前:login:Penguin mailto:sage [04/03/09 17:30 ID:QwDvTJcd.net]
- 状態指定していいのなら色々やれるようになるが……
現時点ではUTF-8の勝利っぽいな。日本語は3byteで我慢する。 通信量だってプロバイダからすればnyから見れば微々たるもの。 通信料固定の携帯会社は少し痛いかな。 でも日本と中国だけ自分の国の2byteコード使いそう… UTFCP頑張って欲しいが国際的には全然ダメそう;; あと最近電子政府とか言ってるけど文字コード何使うの? かなり昔だが市役所行ったら漢字が出ないとか言われて 名前の漢字変えられたわな(いいのかな?まずい気がしたんだが…) ちなみにWindowsでは変えられた方の漢字もでないんだが…… 略字で登録してるとこと、正規で登録してるところがあるのが不便でつ。 戸籍略字に出来ないかなぁ………
|

|