- 1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
- Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ 意味ないじゃん! Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。
- 496 名前:login:Penguin mailto:sage [03/08/17 14:20 ID:fizQt/ca.net]
- で、どのレイヤを指して文字ってんのよ?
- 497 名前:login:Penguin mailto:sage [03/08/18 11:47 ID:qg3zTJIe.net]
- 超今更だが、>>37が過ちを犯している。utf-8の漢字は3byteな。
- 498 名前:login:Penguin mailto:sage [03/08/20 00:41 ID:mKHd8Wgb.net]
- >>493
最小で3byteですが最大では6byteですよ
- 499 名前:login:Penguin [03/10/20 03:44 ID:Z7b4Bpl5.net]
- (゜ω゜)ポカーン.....
- 500 名前:login:Penguin [03/11/30 01:44 ID:57WnbG8d.net]
- すいませーん、
オンラインで EUC-JP の規格を参照できるようなサイトはありますか? 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 >> 165 結局、EUC-JP の 0x21 から 0x7E のあたりって、ASCII なんでしたっけ、 それとも JIS X 0201 ローマ字を使うんでしたっけ? なんとなく ASCII だと思い込んでいたんですが。。。 Unicode と旧来のエンコーディングを行ったり来たりする処理を使うことが ときどきありますが、この「ASCII か JIS X 0201 ローマ字か」でいつも 頭が痛いんです。困っているのは僕だけじゃないと思いますが.... どうにかしてくれ > 偉い人
- 501 名前:login:Penguin mailto:sage [03/11/30 03:21 ID:W0msD5oz.net]
- muleに付いている文書、ISO2022.jaを読めば?
www.iana.org/assignments/character-sets もね。 そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?
- 502 名前:login:Penguin [03/12/01 03:18 ID:SviQyXwA.net]
- どうもさんくすです。
> muleに付いている文書、ISO2022.jaを読めば? これは「規格」なのかどうかはよくわかりませんが、 xemacs を調べてみると、etc/CODINGS というファイルで euc-japan は ASCII を使うようになってるみたいですね。(僕が見方を間違えていなければ) > www.iana.org/assignments/character-sets もね。 こちらも、ASCII っぽいですね... ってことで ASCII と思っていいのかな? > そもそも www.unicode.org/Public/UNIDATA/ じゃないのか? えーと Unicode の方は規格を知らないということじゃなくて、 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、 既存のエンコーディングとのからみの話です。もはや、Unicode と既存のエン コーディングの対応が整備/修正されるのは諦めるしかないのかなあ、なんて 思ったりして。 たぶん、これってもう何度も何度も繰り返された話題でしょうね、スマソ。
- 503 名前:>>497 [03/12/01 04:03 ID:YFXe237k.net]
- >>498
規格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。 > 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。 >>498 > 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、 > 既存のエンコーディングとのからみの話です。 風間Java国際化本読め。 大体文字使っている奴が reverse solidus として使っているか、 yen sign として使っているか、全くわからんのだから、 文章書いた奴以外完全な解決はできん。そいつも忘れてるかもしれん。 ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。
- 504 名前:login:Penguin mailto:sage [03/12/01 11:02 ID:bqzp7dFQ.net]
- >格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。
ヴァカですか? >風間Java国際化本読め。 営業ですか?
- 505 名前:login:Penguin mailto:sage [03/12/01 11:03 ID:bqzp7dFQ.net]
- >格読みたければ、JISの規格票買えよ。
ヴァカですか? >風間Java国際化本読め。 営業ですか?
- 506 名前:login:Penguin mailto:sage [03/12/01 11:33 ID:doVY1QDl.net]
- EUC-JP って JIS に入ってたっけ?
- 507 名前:login:Penguin [03/12/02 04:37 ID:Ld5fw5ew.net]
- >>499
>> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。 >もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。 は。ちなみに Unicode だとそういうのがオンラインであるわけで、 こうやって普及に差が出るのかなあって思う。 >文章書いた奴以外完全な解決はできん。 そうです。で文章書いた奴の意図を汲むための処理 (UI 等) が必要なわけ。 でもそういう処理を用意するのは面倒だし、さらに文字コードのことを深く 知らないユーザから見たら奇異だよね。 で、それって別に原理的にそうなんじゃなくて単に規格がダメなせいでしょ、 って話。 >ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。 kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html や euc.jp/i18n/charcode.ja.html の「5.1 EUC」 を見ると、EUC でも ISO 646(JIS X 0201 ローマ文字)はアリみたいなんで すが。極少でも、間違いじゃないなら面倒見るべきでは。
- 508 名前:login:Penguin mailto:sage [03/12/02 06:54 ID:0RsR6Dsz.net]
- >>503
EUC は CES ですが、EUC-JP は CCS です。 EUC-JP では、code set 0 は ASCII に決まってます。 www.iana.org/assignments/character-sets の MIBenum: 18
- 509 名前:login:Penguin [03/12/03 02:46 ID:UUcL758a.net]
-
- 510 名前:login:Penguin [03/12/03 14:18 ID:6d4CdMx0.net]
- どっちでもいいからどっちかに統一しろや無能どもが。
- 511 名前:login:Penguin mailto:sage [03/12/03 16:56 ID:B3zlXzir.net]
- >>506
統一したらしたで文句言うんだろう?カスが。
- 512 名前:login:Penguin mailto:sage [03/12/04 19:14 ID:9n6DOrlU.net]
- >>504
CESとCSSはなんの略でしょうか? 教えてください。
- 513 名前:login:Penguin mailto:sage [03/12/05 00:06 ID:TihMjOjI.net]
- Character Encoding Scheme (文字符号化方式)
Coded Character Set (符号化文字集合) CCS は文字の集合を表現するもの。CES は一つ、あるいは複数の CCS を実際の バイト列というかビット列というか、そういう表現に写像するもの。
- 514 名前:508 mailto:sage [03/12/05 04:19 ID:mdRn2HdJ.net]
- >>509
ということは、EUC-JPもCESじゃないでしょうか? 私は、ISO-2022の状態遷移を持たずに済むようにしたサブセットがEUCで、 EUCの文字集合を具体的に定義したものがEUC-JPだと理解していますが どうなんでしょうか?
- 515 名前:login:Penguin mailto:sage [03/12/05 21:19 ID:WmOgE02Z.net]
- >>499
www.jisc.go.jp/ から読めたりしますが。 ただし「解説」は読めないみたい。 あと、JIS X 0208と0213は規格協会から出版されている 『増補改訂 JIS漢字字典』に縮刷版が入ってたりする。 0x5cが円記号か逆斜線かは、コードの由来に立ちかえれば明快。 ・シフトJIS: JIS X 0201の8ビットコードの拡張なので円記号(YEN SIGN) ・EUC: ASCIIの拡張なので逆斜線 (REVERSE SOLIDUS) >>510 CCS, CESという定義の仕方はあまりうまくないので、真面目に考えるだけ損。
- 516 名前:login:Penguin [04/01/04 13:24 ID:KetwKeXM.net]
- なんでわざわざ規格が2つもあるんだか。普通に考えておかしいじゃん。
両方とも、他方の欠点についてくだらん言い訳をグダグダのたまうんだろうけど 結局のところこの統一されてない状態が一番不便なのがわからんのかクソども。
- 517 名前:login:Penguin mailto:sage [04/01/05 05:56 ID:AOcZ5fo2.net]
- どんな文字コードでも使える実装をほどこせばいいんでない?
とか言うのはソフトを書くわけでもない素人の意見なのかな、やっぱり……
- 518 名前:login:Penguin mailto:sage [04/01/05 10:29 ID:gmkRu+uW.net]
- >>513
はい。
- 519 名前:login:Penguin mailto:sage [04/01/12 16:06 ID:Z4GWGJfa.net]
- lヽ ノ l l l l ヽ ヽ
)'ーーノ( | | | 、 / l| l ハヽ |ー‐''"l / C | | |/| ハ / / ,/ /|ノ /l / l l l| l C ヽ l ・ i´ | ヽ、| |r|| | //--‐'" `'メ、_lノ| / ・ / | S l トー-トヽ| |ノ ''"´` rー-/// | S | | ・ |/ | l ||、 ''""" j ""''/ | |ヽl ・ | | I | | l | ヽ, ― / | | l I | | !! | / | | | ` ー-‐ ' ´|| ,ノ| | | !! | ノー‐---、,| / │l、l |レ' ,ノノ ノハ、_ノヽ / / ノ⌒ヾ、 ヽ ノハ, | ,/ ,イーf'´ /´ \ | ,/´ |ヽl | /-ト、| ┼―- 、_ヽメr' , -=l''"ハ | l ,/ | ヽ \ _,ノーf' ´ ノノ ヽ | | 、_ _ ‐''l `ー‐―''" ⌒'ー--‐'´`ヽ、_ _,ノ ノ  ̄ ̄ | /  ̄
- 520 名前:login:Penguin [04/01/21 04:54 ID:l6i+YvvA.net]
- Post
- 521 名前:login:Penguin [04/01/24 12:36 ID:OGcyA9QE.net]
- GBやKSやCNSって文字名を規定するように改訂されてるんですか?
されてなかったら文字名による同定なんて絵に描いた餅だと思うんですが。 少なくともGB2312は廃止されてGB18030になったんだから 改訂版は存在しないですよね?
- 522 名前:login:Penguin mailto:sage [04/01/27 17:53 ID:Vqw8VTxA.net]
- >>517
少なくともISO/IEC 8859シリーズやJIS X 0201/0208/0213は文字名を規定してる。 他の奴は調査のうえ報告きぼん。
- 523 名前:login:Penguin mailto:sage [04/01/27 18:02 ID:CYFtYKQ6.net]
- >>518
それは知ってます。だからGB/KS/CNSについて聞いてみたわけです。 JIS X 0212の文字名は「参考」しか存在しないですね。
- 524 名前:login:Penguin mailto:sage [04/01/28 01:38 ID:yXeHWwGb.net]
- GB18030の仕様書?
www.anycities.com/gb18030/standard.htm
- 525 名前:login:Penguin mailto:sage [04/01/28 09:30 ID:zcjMBZrl.net]
- >>520
やっぱり絵に描いた餅っぽいな JISの範囲に限定してもけっこう破綻してるし
- 526 名前:login:Penguin mailto:sage [04/01/31 00:53 ID:0gxSoMh4.net]
- Unicode Normalization派には全ての文字集合が破綻して見える。
CSI派にはUnicodeが破綻して見える。 いじょ。
- 527 名前:login:Penguin mailto:sage [04/01/31 07:48 ID:uM5oI3vd.net]
- CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
TRONコード?
- 528 名前:login:Penguin mailto:sage [04/01/31 15:12 ID:A1rPcmld.net]
- > CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
CSIだから何でも有りなわけだが…
- 529 名前:login:Penguin mailto:sage [04/02/01 13:09 ID:N4VOvKZ9.net]
- >>520
何がどう破綻してるのか意味不明。 文字名称による同定が破綻しているとすればUnicode/10646自体の失敗に近い。 Unicodeしか無い世界を想定すればそれでも良いのかもしれないけど、 そんな想定は頭の中のお花畑でしょ。
- 530 名前:login:Penguin mailto:sage [04/02/02 10:00 ID:hq6ctxrf.net]
- >>524
内部が何でも有りでよくても外部と情報交換するときには 相手の知らないコードでは話にならないと思うんですが
- 531 名前:login:Penguin mailto:sage [04/02/02 10:06 ID:hq6ctxrf.net]
- >>525
> 文字名称による同定が破綻 そもそも一対一の対応関係しか記述できないのが無理ありすぎ。 > Unicode/10646自体の失敗に近い。 でも国際規格との整合という名目で文字名を規定してしまった。 つーかCJKでUnicodeに一番反対しているはずの日本だけが 自国の文字集合で文字名を規定してる(らしい)ってほとんど ギャクだな。
- 532 名前:login:Penguin mailto:sage [04/02/02 10:41 ID:ZMPM1Vhd.net]
- >>526
何でもありと言ってもcharset repositoryに登録されてる奴だけでしょ。
- 533 名前:login:Penguin mailto:sage [04/02/02 22:12 ID:rBgXmwm9.net]
- 「相手の知らないもの」を「交換」すること事態アリエナイ、
お互いが情報を共有していれば既存の文字集合でなくても構わない。
- 534 名前:login:Penguin mailto:sage [04/02/12 11:08 ID:KO5Q49AN.net]
- > 「相手の知らないもの」を「交換」すること事態アリエナイ、
> お互いが情報を共有していれば どうやって共有するんですか? そんなこと言い出したらネットワークプロトコルなんて 一切必要ないということになると思いますが。
- 535 名前:login:Penguin mailto:sage [04/02/13 07:42 ID:AkWuZ3md.net]
- 既存のコードのどれかに対する写像関数があれば
何も問題なさそうだけど。プロトコルと違って 文字コードは単純なので同じように考えることは できないと思うけど。
- 536 名前:login:Penguin mailto:sage [04/02/13 10:16 ID:9tJnggCR.net]
- 関数が、ベンダーによって違ったり、
単射に出来なかったりで問題。
- 537 名前:login:Penguin mailto:sage [04/02/19 17:11 ID:HogZ/lIc.net]
- とりあえずSJIS撲滅しろ
- 538 名前:login:Penguin mailto:sage [04/02/19 18:46 ID:wXxKmQwW.net]
- /⌒ヽ すいません、ちょっと撲殺しますよ・・・
/ ´_ゝ`) | | と ) | | ガッ Y /ノ 人 / ) < >_∧∩ _/し' //. V`Д´)/ (_フ彡 /←>>533
- 539 名前:login:Penguin mailto:sage [04/02/20 15:15 ID:MhppvPgK.net]
- 「SJIS撲滅しろ」とSJISで読ませてる矛盾…
日本製品排斥運動のプラカードを日本製筆記用具で書いてる話を思い出したよ。
- 540 名前:login:Penguin mailto:sage [04/02/20 15:25 ID:USABAkbG.net]
- ネット上を流れる日本語の何割ぐらいがEUCなのかな。
事情がどうであれ、SJISが既に多数派だってことは 受け入れないとダメだろね<EUC派の人。
- 541 名前:login:Penguin mailto:sage [04/02/20 15:42 ID:HZ88v8IJ.net]
- YahooはEUC-JPだよね。
- 542 名前:login:Penguin mailto:sage [04/02/20 15:59 ID:DuOkNDXy.net]
- >>536
煽りか知らんが、それを受け入れてない香具師はいないだろ。 wwwにutf-8,16使ってるページが少ないからといってunicode推進は間違ってるという結論にはならん訳だし。
- 543 名前:login:Penguin mailto:sage [04/02/20 16:10 ID:HZ88v8IJ.net]
- >>538
全然関係ない話だが、XHTMLがXMLの派生だと考えると、XHTMLでは UTF-8・UTF-16を使うのが正道だと思うのだが、どう思う? Unicode嫌いだがXHMLラブな俺。
- 544 名前:login:Penguin mailto:sage [04/02/20 18:02 ID:DuOkNDXy.net]
- utf-16より16ビットクリーンのucs-2が乙。
- 545 名前:login:Penguin mailto:sage [04/02/20 18:13 ID:OGx3SqOQ.net]
- > 16ビットクリーン
どういう意味? ぐぐっても0件だし。 「8ビットクリーン」の語義から類推すれば、 途中で16ビット目が壊れることはないって意味になるけど・・・
- 546 名前:login:Penguin mailto:sage [04/02/20 18:17 ID:HZ88v8IJ.net]
- >>540
まぁUTF-16とUTF-8の二者択一で、UTF-16は選ばんな。 サロゲートペアが気持ち悪すぎる。 しかしUCS-2はどうかといわれると、それならUCS-4使いたいところ。
- 547 名前:542 mailto:sage [04/02/20 18:18 ID:HZ88v8IJ.net]
- 似たような理由でShift JISも気持ち悪い。
- 548 名前:login:Penguin mailto:sage [04/02/20 18:36 ID:SE61JsUR.net]
- >>536
シフトJISって言っても何種類もあるしね。
- 549 名前:login:Penguin mailto:sage [04/02/20 18:47 ID:HZ88v8IJ.net]
- >>544
たとえば? まさか「Unicodeへのマッピングが〜」なんて言わないよね……。
- 550 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:YAuvVXfE.net]
- どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。
- 551 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:DuOkNDXy.net]
- >>541
16ビットオンリーと言うべきだったかもしれぬ。 EUC,JIS,SJIS,UTF-8 -> 8ビットと16ビットが混在 UTF-16 -> 16ビットだけと見せかけてサロゲートがある。 UCS-2 -> 16ビットのみ(n文字目に定数時間でアクセス可能)
- 552 名前:login:Penguin mailto:sage [04/02/20 20:26 ID:HZ88v8IJ.net]
- >>546
>どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。 文字集合の話なら、ISO国際登録簿に登録されている。 符号化も含めてなら、一応ISO-2022には「他の符号化システムの指示(DOCS)」機能がある。 これを使えばUnicode(UTF-8・UTF-16)に切り替えられる。 # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
- 553 名前:login:Penguin mailto:sage [04/02/20 20:35 ID:YAuvVXfE.net]
- > # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
本当だ。知らんかった。
- 554 名前:login:Penguin mailto:sage [04/02/20 20:37 ID:SE61JsUR.net]
- >>545
Shift_JISとかMicrosoftのCP932とか
- 555 名前:login:Penguin mailto:sage [04/02/20 20:53 ID:HZ88v8IJ.net]
- >>550
> Shift_JISとかMicrosoftのCP932とか その二つはどこが違うの? 俺の理解では、まさに「Unicodeへのマッピング」の違いなんだが。 あと「何種類もあるしね」と書いているが、2つだけ?
- 556 名前:login:Penguin [04/02/21 10:55 ID:8cIti7Dp.net]
- >>551
マッピングが違う時点で、別の文字コードになる。 種類も 2つではすまない。 www.opengroup.or.jp/jvc/cde/sjis.html
- 557 名前:login:Penguin mailto:sage [04/02/21 11:11 ID:r6ckEmFW.net]
- >>552
> マッピングが違う時点で、別の文字コードになる。 ならない。 文字コードとは文字集合+符号化方式であらわされるもの。 Unicodeへのマッピングは関係ない。 > www.opengroup.or.jp/jvc/cde/sjis.html これはまさに「文字コードの違い」と言える。 ・JIS X 0201かASCIIか ・JIS X 0208は1978か1983か1990か
- 558 名前:login:Penguin [04/02/21 11:28 ID:QqGdeQdg.net]
- アンチEUのスレはここですか?
やはりEUに対抗して大東亜共栄圏を。
- 559 名前:login:Penguin mailto:sage [04/02/21 11:47 ID:u/H1Y2zG.net]
- いや、日本もEUに加盟しようぜ。
- 560 名前:login:Penguin mailto:sage [04/02/21 12:47 ID:Ij37nYR/.net]
- それはブッシュ君が絶対に許しません!
- 561 名前:login:Penguin [04/02/22 12:06 ID:/tZPZccw.net]
- m17libあげ
japan.cnet.com/news/ent/story/0,2000047623,20064400,00.htm
- 562 名前:login:Penguin mailto:sage [04/02/24 16:52 ID:f1XKVOzh.net]
- >>553
> Unicodeへのマッピングは関係ない。 正解。 ただし、外字が入ってる時点でCP932は別の文字コードになってる罠。
- 563 名前:login:Penguin [04/02/25 09:17 ID:OHUltstF.net]
- G2に78JISを指示して78JISの字形を出したいときだけSS2で
切り換えるような実装はISO 2022に適合しますか?
- 564 名前:login:Penguin mailto:sage [04/02/25 09:42 ID:QrUE0gBl.net]
- >>559
ISO-2022的にはアリだと思います。
- 565 名前:login:Penguin mailto:sage [04/02/25 10:36 ID:OHUltstF.net]
- 一意な符号化を要求された場合90JISと同じ字は使用禁止に
なるし要求されなくても同じ字は同じ扱いにならなくてはいけない (違う字形が出力されることに期待してはいけない)わけですが、 何をもって同じ字と判断するのかが悩ましいです。
- 566 名前:login:Penguin mailto:sage [04/02/25 11:23 ID:QrUE0gBl.net]
- >>561
おっしゃるとおりです。使うのはかなりグレーだと思います。 普通にやるなら、上のレイヤーで切り替えるべきでしょうね。 そういえば、JIS X 0208:1997の付属書6を見ていて気づいたのですが、 規格票の刷によっても字形が違うのですね。 たとえば「芦」という字。1978の第4刷より前は「戸」の上部は「一」 ですが、第4刷以降は「ノ」になっています。ところが1983ではまた 「一」に戻っています。
- 567 名前:login:Penguin mailto:sage [04/02/25 23:19 ID:XkkFjwVk.net]
- 97JISの附属書6に78JIS字形として掲げられているものって結構間違い
(実際に78JISに載っていたのとは明らかにデザイン差を越えて異なると 思われるもの)がありますね。私は少なくとも3つ見つけました。 新字源番号にも明らかにおかしいところがありますし。
- 568 名前:login:Penguin mailto:sage [04/03/01 15:28 ID:JCvjaOH6.net]
- charの内部コードはたとえばEBCDICかもしれないから
文字クラス判定を不等号で行ってはいけませんなんて言われてた こともあるのに時代は変わったもんだ
- 569 名前:login:Penguin mailto:sage [04/03/01 15:36 ID:ZJ6X9SrZ.net]
- JIS漢字コード表の改正について−168字の例示字形を変更−(2004.2.20)(pdf:333kB)
www.jisc.go.jp/tpk/pdf/040220kanjicode.pdf こんなん出たらしいですよ。 「芦」なんかが変ってますね。
- 570 名前:login:Penguin mailto:sage [04/03/01 15:47 ID:xLYQ3+Xr.net]
- >>564
変わってませんよ。今でも良くないですよね。
- 571 名前:login:Penguin mailto:sage [04/03/01 16:54 ID:JCvjaOH6.net]
- >>566
もちろん今でもよくないけど __STDC_ISO_10646__ なんてのもできたじゃないですか
- 572 名前:login:Penguin mailto:sage [04/03/01 17:07 ID:ZJ6X9SrZ.net]
- 「じゃないですか」かよ!?
- 573 名前:login:Penguin mailto:sage [04/03/01 17:39 ID:xLYQ3+Xr.net]
- >>567
それでもwchar_tの中身を直接触るのは良くないことなのですよ。
- 574 名前:login:Penguin mailto:sage [04/03/01 22:38 ID:gv8ZeGbq.net]
- sourceforgeのapacheはEUC固定だったりする。
今だにUTF-8が使えない。
- 575 名前:login:Penguin [04/03/03 20:36 ID:CKuIXPe4.net]
- やっとこさthe m17n libraryが公開されたけど、海外の反応が全くないのが気に
なるな。というか、The Free Standards Groupのプレスリリースくらいしか情報 らしい情報は出してないもんなあ。SlashdotとかFreshmeatにアナウンス出した 方がいいと思うけど。
- 576 名前:login:Penguin mailto:sage [04/03/03 20:40 ID:rkyENV70.net]
- >>571
m17nのメイリングリスト入ってるんだけど、一通も流れないのが不気味だ。
- 577 名前:login:Penguin mailto:sage [04/03/04 02:24 ID:clL2BqDq.net]
- 海外の人にこそ使って欲しいなあ。
- 578 名前:login:Penguin mailto:sage [04/03/04 10:43 ID:9PDHb3Ho.net]
- pdx.freedesktop.org/pipermail/uim/2004-March/000171.html
> Great to see that more programmers are getting invonved in > internationalization. I hope they don't release TOO many libraries, > though... ;) とあるひとの反応。
- 579 名前:login:Penguin [04/03/05 10:05 ID:TJTIZyFT.net]
- SJISって文字化け多いんでしょ?
- 580 名前:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ [04/03/05 10:11 ID:BY8DAhkI.net]
- ( ゚Д゚)<呼ばれた気がした
- 581 名前:login:Penguin mailto:sage [04/03/05 17:30 ID:xV2/aTba.net]
- まじばか多いよ。
- 582 名前:login:Penguin [04/03/06 02:50 ID:LSF51fr1.net]
- とりあえず、私の使ってる日本語は2バイトまでにしてください。
漢字はあまり使わないのでJIS第2水準までで十分ですから… 正直、漢字もう少し減らして欲しいよ。 5000字程度に絞って統合しないかな… 市町村みたいにあまり使われてないとこは合併。 そしたらフリーのフォントも作りやすくなるし… ダメかな?とにかく頑張れ総理(えー
- 583 名前:login:Penguin mailto:sage [04/03/06 06:09 ID:xBLfCQy5.net]
- >>578もいなくなれば、人口過密も軽減されるのに…
- 584 名前:login:Penguin [04/03/06 12:19 ID:nOqS+3CF.net]
- >>578
UTF-8は3バイトになるのが嫌っては思う。 そのまま検索できる圧縮方法を標準化すりゃ、色々便利だろうにな。 UCS4の文字コードの差分
- 585 名前:使えんかな。
近い所の文字を連続で使う事が多いだろうし。 検索の時も先頭の文字以外はマッチングするだろうし。 [] - [ここ壊れてます]
- 586 名前:login:Penguin mailto:age [04/03/06 16:57 ID:RIYFz2Z8.net]
- UTF-8の作成に日本はお金だしたの?
ちょっとしかお金ださないから3バイトに追いやられたの? 最近は「金は力なり」ってことはないのかな…
- 587 名前:login:Penguin mailto:sage [04/03/06 17:37 ID:FTiwHY/0.net]
- >>581
なんか外人からみた日本人のイメージの典型みたいな人だなぁ
- 588 名前:login:Penguin [04/03/06 20:57 ID:NtiYGtdX.net]
- >>581
とりあえず、UNICODE コンソーシアムのメンバーで日本の会社は ジャストシステムしか見あたらない。 www.unicode.org/consortium/memblogo.html
- 589 名前:login:Penguin [04/03/06 21:52 ID:k9F50u4V.net]
- >>581
どっかで聞いた気がするのだが結構お金だしてたような……… UNICODEの方だったかなぁ………
- 590 名前:login:Penguin mailto:sage [04/03/07 01:10 ID:1mpDS4RM.net]
- >>578
www.itscj.ipsj.or.jp/ipsj-ts/02-07/coreset/toc.htm というのがあるけど。
- 591 名前:login:Penguin mailto:sage [04/03/07 10:03 ID:JJs7467H.net]
- 特定のロケールのみ使う場合に短縮できるというアイデアは
DIS 10646そのものじゃん。それを葬り去って(ry
- 592 名前:LightCone ◆sSJBc30S5w [04/03/07 19:36 ID:Q1hO8bzI.net]
- >>578, >>580
日本語のJIS第一、第二水準、中国語の第一級、第二級漢字までを2BYTEで 符号化できる新しいUnicode符号化方式:UTFCPを開発したのでご覧下さい。 2バイトで一万五千文字ものコード・ポイントがあります。 www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utf.htm また、この符号は、ロケールやコードページの必要のない世界共通の符号 になり得る可能性があります。 符号の逆戻りも可能なので、文字列を後ろから検索する際の効率も 高いですし、複数バイト文字にASCII符号を一切含まないので、 無配慮に大文字小文字変換をしてしまう様な欧米のアプリケーションに 対しても問題ありません。
- 593 名前:login:Penguin mailto:sage [04/03/08 00:10 ID:Jjoer6mt.net]
- basic planeマンセー!(やや曇り勝ちな声で)
- 594 名前:login:Penguin mailto:sage [04/03/08 00:16 ID:xPUur27x.net]
- >>587
> 今まで2バイトで余裕を持って扱えていたものを、突然3バイトで > 扱わなければならないと言われれば、誰でも納得しがたいもので > しょう。 いや別に……。 でかい文字集合突っ込んでる立場としては、3バイトくらいが妥当と いう感覚がある。
- 595 名前:login:Penguin mailto:sage [04/03/08 00:45 ID:8nTBrLvd.net]
- >>589
それでも、やっぱり2バイトがいい。 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw 飛躍しすぎですが、メールとかの通信量が1.5倍=料金1.5倍と思えば… 2chのログも1.5倍になったら……… FedoraがUTF-8になったので危機感を感じてるのですが 日本か中国で差別用語(?)とか言ってUTF-8禁止令とかでないかなぁ〜 日本政府ヨワッチイからなぁ、中国やってくれないかなw で、英数字1バイト、日本語2バイトが良い我々は、SiftJISかEUC-JP使えばいいの?
- 596 名前:login:Penguin mailto:sage [04/03/08 01:38 ID:CDAnHB+K.net]
- もっと先を見越した発想しないと駄目だよ。
|

|