[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2ch.scのread.cgiへ]
Update time : 11/30 16:27 / Filesize : 244 KB / Number-of Response : 873
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

EUCボクメツ委員会



1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO
せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ
意味ないじゃん!
Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO
Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。

445 名前:名無しさん@Emacs [03/04/27 01:19 ID:6zN1r8md.net]
お前ら、新しいエサですよ。

Unicode 4.0 Released!
www.unicode.org/versions/Unicode4.0.0/

446 名前:login:Penguin mailto:sage [03/04/27 01:25 ID:qRyDd44s.net]
(゚д゚)ハァーン

447 名前:( ´Д`)/< 先生!!こんなのが有りますた。 mailto:sage [03/04/27 01:31 ID:dA76kPz1.net]
www.yamazaki.90.kg/hankaku/hankaku07.html
www.yamazaki.90.kg/zenkaku/index.html
www.yamazaki.90.kg/hankaku/hankaku08.html
yamazaki.90.kg/hankaku/hankaku10.html
www.yamazaki.90.kg/hankaku/hankaku01.html
yamazaki.90.kg/hankaku/hankaku03.html
www.yamazaki.90.kg/hankaku/hankaku02.html
yamazaki.90.kg/hankaku/hankaku09.html
www.yamazaki.90.kg/hankaku/hankaku06.html
yamazaki.90.kg/hankaku/hankaku04.html
www.yamazaki.90.kg/zenkaku/index.html
www.yamazaki.90.kg/hankaku/hankaku05.html

448 名前:login:Penguin [03/04/27 04:22 ID:AM2rRROs.net]
日本が独自に4バイト固定長あるいは8バイト固定長の国際標準を
ぶちあげようとしたら、急に経済制裁とか空爆とかを受けそうだな。

449 名前:login:Penguin mailto:sage [03/04/27 05:07 ID:r9SAhPiw.net]
>日本が独自に
という時点で
>国際標準
にはなりえん気もするが。

450 名前:login:Penguin mailto:sage [03/04/27 10:26 ID:CIHHY3pY.net]
>>445>>446
ISOの国際化規格もXの国際化規格もli18nuxも日本人が中心となって
作った。

Linuxの既存の国際化の仕組みに不満があるなら、li18nuxの樋浦さん
あたりに直接文句言えば。

451 名前:login:Penguin mailto:sage [03/04/27 14:04 ID:PuFritwf.net]
li18nuxって役に立ってる?
li18nuxの作ったソフトってどこの
ディストリビューションも使ってないよね?

452 名前:login:Penguin [03/04/27 14:17 ID:12AnfH8t.net]
法律で、UCS-4以外を使えば犯罪にしてくれ

453 名前:login:Penguin mailto:sage [03/04/27 15:10 ID:LPP1MV5m.net]
>>448
li18nuxは標準化グループです。
今すぐ移行できるレベルの標準はわざわざみんなで考える必要はありません。

ディストリビューション屋さんの得意な既存のソフト組合わせ+少々の改造は、
ディストリビューション屋さんに任せましょう。



454 名前:login:Penguin mailto:sage [03/04/27 15:36 ID:PuFritwf.net]
でも、いくつかのsubgroupはクソなので困るんだよね。

455 名前:login:Penguin mailto:sage [03/04/27 16:21 ID:TW4m7+2W.net]
>> 450
実装も何気に多い罠

1. locale名の標準化とlocaledefの提供
 ja_JP.ujis -> ja_JP.EUC-JP
2. netscape4.xの不正なmultibyte処理で落ちるバグ対策
 mozillaが使い物になりはじめてた時期であんまり意味なし
3. Xlib-I18N
 Xlocaleのdynamic module化 -> XFree86にmerge済(iconv依存部以外)
 XomCTL(by Sun) -> いまどうなってんの?
CSI xterm -> UTF-8 xterm/luitの出現に敗北
4. GNU toolのmultibyte対応化(by IBM)
bash(readline)、grep、sed、gawkなど、現在本家へのmergeが進む
5. その他いろいろ(Big5をISOに〜etc...)

あとは前世のNLS分科会での
1. glibc2のmb/wcとlocaledefで日本語が通る為の修正
2. gettext catalogのcontrib
などもあるわけだが。

標準化ならthread-safe localeとかnetwork transparent localeとか
もっと大風呂敷を広げてくれって感じ。
(Open groupのdistributed localeみたいな)

>>451
> いくつかのsubgroupはクソ
maja(ryっすか?

456 名前:login:Penguin [03/04/30 03:11 ID:3+jGzA7G.net]
まずは、C言語、C++言語の国際標準を改定させてcharという型名を
バイトの代わりにつかうことを禁止させて欲しい。octet とか、byte
という型名に変えて欲しい。すべてはまずそこからだ。
Fortran言語も、もしも型名characterが本当に採用している文字表記の
文字1字に対応しているのならよいが、そうでないのなら、octetとか
asciiとかbyteというような型名に国際規格を変更して欲しい。

457 名前:login:Penguin mailto:sage [03/04/30 03:35 ID:3ObV2i6L.net]
>>453
int8_t〜int64_tとかuint8_t〜uint64_tとかquad_tとかご存知無い?
stdint.hとかC99の仕様を一読してから再度ご来場願いたい

458 名前:login:Penguin [03/04/30 05:40 ID:3+jGzA7G.net]
char がC/C++言語として使える限り、あれを文字型と称するかぎり、
コードからcharを文字のデータに使うコーディングが無くなる
ことはない。

459 名前:(・∀・)y−~~~  [03/04/30 06:32 ID:1OhVc4dx.net]
homepage3.nifty.com/coco-nut/

460 名前:login:Penguin mailto:sage [03/04/30 06:42 ID:cbI0AZKf.net]
型なんて飾りです、若い香具師にはそれがそれが判らんのです
最近はJavaあたりの影響か、くだらんこと気にする香具師が増えたのか?
char = iso646ってことで、文字型と呼んどきゃいいじゃん

461 名前:login:Penguin mailto:sage [03/04/30 11:41 ID:tIYWtx7i.net]
>>455
規格書、ちゃんと読んだ方がいいんじゃない?
charのbit幅について、とかさ。

君がchar = UCS-4な実装するのは誰も止めないぞ。

さらにスレ違い。

462 名前:login:Penguin mailto:sage [03/04/30 22:48 ID:lotq/ow/.net]
plain Cで書くのを禁止にすれ。

463 名前:login:Penguin [03/05/04 13:33 ID:E/rgpU1m.net]
結論として、多言語混在の文書を書くには、
UTF-8がベストなのか?



464 名前:login:Penguin mailto:sage [03/05/04 22:04 ID:LYzzLtSd.net]
>>460

> 多言語混在
UTF-8/UnicodeだとHan-Unification問題、fontの問題がありますが何か?
言語タグで解決するくらいならISO2022で良かった。


465 名前:山崎渉 mailto:(^^) [03/05/22 02:03 ID:VfjbtMwi.net]
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

466 名前:login:Penguin mailto:sage [03/05/29 14:48 ID:njol5Zmj.net]
欧米人には utf-8 めちゃくちゃ受けがいいんだよ。
らくちんだもんな。

467 名前:login:Penguin mailto:sage [03/06/01 02:26 ID:fkUOiXAk.net]
>>461
ISO 2022マンセーなのは日本人だけ。

>>463
ISO-8859-1→ISO-8859-15よりISO-8859-1→UTF-8の方が都合がいいんだろ。

468 名前:login:Penguin [03/06/01 15:14 ID:xEapgirA.net]
保全age

469 名前:login:Penguin mailto:sage [03/06/02 00:06 ID:RU4bgj1/.net]
ISO-8859-1以外だと即変換テーブル必要になるUnicodeはアフォ。


470 名前:login:Penguin mailto:sage [03/06/02 04:55 ID:CmpL8QI9.net]
よく知らんが、
サーゲなんとかペアで Han Unification は解決できるの?
というか、iso-2022 <-> unicode の変換が一意にできるような標準は
できてないの?

471 名前:login:Penguin mailto:sage [03/06/08 00:06 ID:wjasDkQy.net]
>>467
> サーゲなんとかペアで Han Unification は解決できるの?

サロゲートペアってのは16bitで足りねーから建て増ししたってだけの話。
Han-Unificationってのは同じコードポイントであってもCJ(K)でグリフが違うって話。
よって両者は無関係。
過去のUnicodeと互換性を無くしてまでこれらの文字に新しくコードを
割り当てる英断を期待しろとでも?

> というか、iso-2022 <-> unicode の変換が一意にできるような標準は

ISO2022は文字コードではないぞ。
Unicodeは過去の文字コードとの互換性をISO8859-1以外一切無視してるので
計算による変換は不可能。変換テーブルはftpで公開してるが内容についてはかなりアヤシイ。


472 名前:login:Penguin mailto:sage [03/06/08 01:08 ID:ZOaY8FC3.net]
「言語タグ」を使えば理論的には可能じゃない?
まあ、実装する奴がいるとは思えないが(w


473 名前:login:Penguin mailto:sage [03/06/08 18:33 ID:wjasDkQy.net]
Unicode 14面に入ってるからいずれ実装せざるを得ないんだろね >言語タグ
もしくはxmlのlang属性とかpangoとかplain textで直接文字列操作しないのがあたりまえになるか。



474 名前:login:Penguin mailto:sage [03/06/09 04:56 ID:jVTEBnNx.net]
>>468
> 過去のUnicodeと互換性を無くしてまでこれらの文字に新しくコードを
> 割り当てる英断を期待しろとでも?

結局 unicode では、漢字圏の多国語同時表示はいつまでたっても
期待できないんですか? emacs の iso-2022-7bit の方がまし?


475 名前:login:Penguin mailto:sage [03/06/09 08:22 ID:8Cy1V2dg.net]
漢字圏の多国語同時表示なんかより、☆とか⌒…とか、記号すらまともに表示できない糞環境をなんとかすれ。

476 名前:login:Penguin mailto:sage [03/06/09 23 ]
[ここ壊れてます]

477 名前::02 ID:/M+iPP4I.net mailto: >>471
いや、出来るよ。固定16bit幅の文字エンコーディングじゃなくなっただけで。
まあ、内部的には21bitあれば、固定幅に出来るけども。
[]
[ここ壊れてます]

478 名前:山崎 渉 mailto:(^^) [03/07/15 11:28 ID:doz396Fq.net]

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

479 名前:ぼるじょあ ◆yBEncckFOU mailto:(^^) [03/08/02 05:35 ID:GfRe8vK7.net]
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ

480 名前:login:Penguin mailto:sage [03/08/07 06:03 ID:13nJB4vb.net]
ja_JP.EUC-JP って、なんか意味あるんですか?
実は ja_JP.eucJP とは微妙に違うコードセットだったりするん
でしょうか?
全く同じコードセットだとすると、また新しくlocale名の変種が
増えるだけで、ソフトウェア作成の手間が増えて不便になるだけ
のような気がするんだけど。

ひょっとして、MIMEのcharset名が全てlocaleのコードセット名と
しても使えるようになるんですか?
en_US.ISO_8859-1 とか ja_JP.CSEUCPKDFMTJAPANESE も可能に
なるの?


481 名前:476 [03/08/07 06:05 ID:13nJB4vb.net]
失礼、age忘れました。

482 名前:login:Penguin [03/08/07 17:06 ID:ZrTxZZCU.net]
lists.debian.or.jp/debian-devel/200306/msg00011.html
[debian-devel:15660] Re: ja_JP locale name

483 名前:login:Penguin mailto:sage [03/08/07 21:05 ID:13nJB4vb.net]
つまり、コードセット名は全て大文字にしなきゃいけない
ことに新しく決まったから eucJP から EUC-JP に変えるっ
てことなのか。

で、なんで全て大文字にしなきゃいけないってことになったの?
互換性を崩してまで統一するメリットってなんなんだろう?




484 名前:476 [03/08/07 21:07 ID:13nJB4vb.net]
またもage忘れ。すんません。

485 名前:login:Penguin [03/08/07 22:23 ID:OLNWypPZ.net]
んなどーでもいいことやる暇があったらja_JP.CP932でもサポートした方が良さそうだが。

486 名前:login:Penguin mailto:sage [03/08/07 22:37 ID:/bM3o4Ra.net]
>>481
ja_JP.SJISがサポートされない理由についてはBruno Haibleが
バックスラッシュがどうたらこうたら言ってたという話を
どこかで見たような気がする。

487 名前:login:Penguin [03/08/07 23:04 ID:OLNWypPZ.net]
>>482
サポートしている商用Unixもあるんだから技術的には不可能ではないと思うのだが、やっぱりめんどくさいからなのかな。

488 名前:login:Penguin [03/08/13 01:01 ID:vZiKmtQp.net]
とにかく文字はアトミックなデーターとして、内部構造に依存せずに
プログラム言語から素直に処理できるのが良い。32ビットを
1文字にするのが、絶対にいいよ。

489 名前:login:Penguin mailto:sage [03/08/13 01:49 ID:Hpn4pIg2.net]
そうは言っても、Unicodeは半角全角問題とか、
ハイフン問題とか、decomposed正規化とか、
サロゲートペアとかあって一筋縄ではイカンわな。

毛ちょっと何とかしてほしひ。


490 名前:login:Penguin mailto:sage [03/08/15 15:29 ID:CM17UZsB.net]
この文脈でのatomicの意味が分からん。
statelessなencodingのことをいってんのか
thread-safeなlocaleとwchar_t(たとえばwchar_tをUCS4にするとか)のことを
いってるのかサパーリ。
そもそも文字コードといってるのはCCSかCESどっちよ?

491 名前:login:Penguin [03/08/15 20:48 ID:d8HSbf3p.net]
↑皿仕上げ

492 名前:login:Penguin mailto:sage [03/08/15 22:05 ID:uQ1Z8d9X.net]
定期的に
www.ietf.org/rfc/rfc2130.txt
www.unicode.org/unicode/reports/tr17/
www.w3.org/TR/1999/WD-charmod-19991129/
あたりすら読まん厨がage続けるスレはここですか?

493 名前:山崎 渉 mailto:(^^) [03/08/15 22:08 ID:dil3w4kp.net]
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン



494 名前:山崎 渉 mailto:(^^) [03/08/15 22:38 ID:dil3w4kp.net]
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

495 名前:login:Penguin [03/08/16 10:25 ID:+/Q/RORk.net]
ATOMICということは、その言語の通常の操作では、内部構造がなくて、
分割できない塊としてのみ操作ができるという意味だよ。

たとえばPascal言語では、整数型や実数型、文字型、ポインタ型
などのデータは、その内部構造や内部表現にはPASCAL言語としては
立ち入ることが出来ない。(もちろん普通は実数も整数も、バイト単位
で構成されていたり突き詰めれば二進数ビットで符号化されているわけだが、
言語仕様上は、そのような内部事情にはアクセス手段がない。だから
化学での原子のように扱える。内部に核があって電子があって、陽子中性子
があるというようなことはとりあえず考えないでいこうということ。)

496 名前:login:Penguin mailto:sage [03/08/17 14:20 ID:fizQt/ca.net]
で、どのレイヤを指して文字ってんのよ?

497 名前:login:Penguin mailto:sage [03/08/18 11:47 ID:qg3zTJIe.net]
超今更だが、>>37が過ちを犯している。utf-8の漢字は3byteな。

498 名前:login:Penguin mailto:sage [03/08/20 00:41 ID:mKHd8Wgb.net]
>>493
最小で3byteですが最大では6byteですよ

499 名前:login:Penguin [03/10/20 03:44 ID:Z7b4Bpl5.net]
(゜ω゜)ポカーン.....

500 名前:login:Penguin [03/11/30 01:44 ID:57WnbG8d.net]
すいませーん、
オンラインで EUC-JP の規格を参照できるようなサイトはありますか?
文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。

>> 165
結局、EUC-JP の 0x21 から 0x7E のあたりって、ASCII なんでしたっけ、
それとも JIS X 0201 ローマ字を使うんでしたっけ?
なんとなく ASCII だと思い込んでいたんですが。。。
Unicode と旧来のエンコーディングを行ったり来たりする処理を使うことが
ときどきありますが、この「ASCII か JIS X 0201 ローマ字か」でいつも
頭が痛いんです。困っているのは僕だけじゃないと思いますが....
どうにかしてくれ > 偉い人

501 名前:login:Penguin mailto:sage [03/11/30 03:21 ID:W0msD5oz.net]
muleに付いている文書、ISO2022.jaを読めば?
www.iana.org/assignments/character-sets もね。
そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?

502 名前:login:Penguin [03/12/01 03:18 ID:SviQyXwA.net]
どうもさんくすです。
> muleに付いている文書、ISO2022.jaを読めば?
これは「規格」なのかどうかはよくわかりませんが、
xemacs を調べてみると、etc/CODINGS というファイルで euc-japan は
ASCII を使うようになってるみたいですね。(僕が見方を間違えていなければ)

> www.iana.org/assignments/character-sets もね。
こちらも、ASCII っぽいですね... ってことで ASCII と思っていいのかな?

> そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?
えーと Unicode の方は規格を知らないということじゃなくて、
例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、
既存のエンコーディングとのからみの話です。もはや、Unicode と既存のエン
コーディングの対応が整備/修正されるのは諦めるしかないのかなあ、なんて
思ったりして。
たぶん、これってもう何度も何度も繰り返された話題でしょうね、スマソ。

503 名前:>>497 [03/12/01 04:03 ID:YFXe237k.net]
>>498
規格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。

> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。

もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。

>>498
> 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、
> 既存のエンコーディングとのからみの話です。

風間Java国際化本読め。

大体文字使っている奴が reverse solidus として使っているか、
yen sign として使っているか、全くわからんのだから、
文章書いた奴以外完全な解決はできん。そいつも忘れてるかもしれん。

ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。



504 名前:login:Penguin mailto:sage [03/12/01 11:02 ID:bqzp7dFQ.net]
>格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。
ヴァカですか?

>風間Java国際化本読め。
営業ですか?

505 名前:login:Penguin mailto:sage [03/12/01 11:03 ID:bqzp7dFQ.net]
>格読みたければ、JISの規格票買えよ。
ヴァカですか?

>風間Java国際化本読め。
営業ですか?

506 名前:login:Penguin mailto:sage [03/12/01 11:33 ID:doVY1QDl.net]
EUC-JP って JIS に入ってたっけ?

507 名前:login:Penguin [03/12/02 04:37 ID:Ld5fw5ew.net]
>>499
>> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。
>もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。
は。ちなみに Unicode だとそういうのがオンラインであるわけで、
こうやって普及に差が出るのかなあって思う。

>文章書いた奴以外完全な解決はできん。
そうです。で文章書いた奴の意図を汲むための処理 (UI 等) が必要なわけ。
でもそういう処理を用意するのは面倒だし、さらに文字コードのことを深く
知らないユーザから見たら奇異だよね。
で、それって別に原理的にそうなんじゃなくて単に規格がダメなせいでしょ、
って話。

>ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。
kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html
euc.jp/i18n/charcode.ja.html の「5.1 EUC」
を見ると、EUC でも ISO 646(JIS X 0201 ローマ文字)はアリみたいなんで
すが。極少でも、間違いじゃないなら面倒見るべきでは。

508 名前:login:Penguin mailto:sage [03/12/02 06:54 ID:0RsR6Dsz.net]
>>503
EUC は CES ですが、EUC-JP は CCS です。
EUC-JP では、code set 0 は ASCII に決まってます。

www.iana.org/assignments/character-sets の MIBenum: 18

509 名前:login:Penguin [03/12/03 02:46 ID:UUcL758a.net]


510 名前:login:Penguin [03/12/03 14:18 ID:6d4CdMx0.net]
どっちでもいいからどっちかに統一しろや無能どもが。

511 名前:login:Penguin mailto:sage [03/12/03 16:56 ID:B3zlXzir.net]
>>506
統一したらしたで文句言うんだろう?カスが。

512 名前:login:Penguin mailto:sage [03/12/04 19:14 ID:9n6DOrlU.net]
>>504
CESとCSSはなんの略でしょうか?
教えてください。

513 名前:login:Penguin mailto:sage [03/12/05 00:06 ID:TihMjOjI.net]
Character Encoding Scheme (文字符号化方式)
Coded Character Set (符号化文字集合)

CCS は文字の集合を表現するもの。CES は一つ、あるいは複数の CCS を実際の
バイト列というかビット列というか、そういう表現に写像するもの。





514 名前:508 mailto:sage [03/12/05 04:19 ID:mdRn2HdJ.net]
>>509
ということは、EUC-JPもCESじゃないでしょうか?

私は、ISO-2022の状態遷移を持たずに済むようにしたサブセットがEUCで、
EUCの文字集合を具体的に定義したものがEUC-JPだと理解していますが
どうなんでしょうか?


515 名前:login:Penguin mailto:sage [03/12/05 21:19 ID:WmOgE02Z.net]
>>499
www.jisc.go.jp/ から読めたりしますが。
ただし「解説」は読めないみたい。

あと、JIS X 0208と0213は規格協会から出版されている
『増補改訂 JIS漢字字典』に縮刷版が入ってたりする。

0x5cが円記号か逆斜線かは、コードの由来に立ちかえれば明快。
・シフトJIS: JIS X 0201の8ビットコードの拡張なので円記号(YEN SIGN)
・EUC: ASCIIの拡張なので逆斜線 (REVERSE SOLIDUS)

>>510
CCS, CESという定義の仕方はあまりうまくないので、真面目に考えるだけ損。


516 名前:login:Penguin [04/01/04 13:24 ID:KetwKeXM.net]
なんでわざわざ規格が2つもあるんだか。普通に考えておかしいじゃん。
両方とも、他方の欠点についてくだらん言い訳をグダグダのたまうんだろうけど
結局のところこの統一されてない状態が一番不便なのがわからんのかクソども。

517 名前:login:Penguin mailto:sage [04/01/05 05:56 ID:AOcZ5fo2.net]
どんな文字コードでも使える実装をほどこせばいいんでない?
とか言うのはソフトを書くわけでもない素人の意見なのかな、やっぱり……



518 名前:login:Penguin mailto:sage [04/01/05 10:29 ID:gmkRu+uW.net]
>>513
はい。

519 名前:login:Penguin mailto:sage [04/01/12 16:06 ID:Z4GWGJfa.net]
       lヽ ノ l        l l l ヽ   ヽ
  )'ーーノ(  | |  | 、      / l| l ハヽ  |ー‐''"l
 / C  | | |/| ハ  / / ,/ /|ノ /l / l l l| l  C ヽ
 l   ・  i´ | ヽ、| |r|| | //--‐'"   `'メ、_lノ| /  ・  /
 |  S  l  トー-トヽ| |ノ ''"´`   rー-/// |  S |
 |  ・   |/     | l ||、 ''"""  j ""''/ | |ヽl  ・ |
 |  I   |       | l | ヽ,   ―   / | | l  I  |
 |   !!  |     / | | |   ` ー-‐ ' ´|| ,ノ| | |  !! |
ノー‐---、,|    / │l、l         |レ' ,ノノ ノハ、_ノヽ
 /        / ノ⌒ヾ、  ヽ    ノハ,      |
,/      ,イーf'´ /´  \ | ,/´ |ヽl      |
     /-ト、| ┼―- 、_ヽメr' , -=l''"ハ    |  l
   ,/   | ヽ  \  _,ノーf' ´  ノノ  ヽ   | |
、_    _ ‐''l  `ー‐―''" ⌒'ー--‐'´`ヽ、_   _,ノ ノ
   ̄ ̄   |           /       ̄


520 名前:login:Penguin [04/01/21 04:54 ID:l6i+YvvA.net]
Post

521 名前:login:Penguin [04/01/24 12:36 ID:OGcyA9QE.net]
GBやKSやCNSって文字名を規定するように改訂されてるんですか?
されてなかったら文字名による同定なんて絵に描いた餅だと思うんですが。
少なくともGB2312は廃止されてGB18030になったんだから
改訂版は存在しないですよね?

522 名前:login:Penguin mailto:sage [04/01/27 17:53 ID:Vqw8VTxA.net]
>>517
少なくともISO/IEC 8859シリーズやJIS X 0201/0208/0213は文字名を規定してる。
他の奴は調査のうえ報告きぼん。


523 名前:login:Penguin mailto:sage [04/01/27 18:02 ID:CYFtYKQ6.net]
>>518
それは知ってます。だからGB/KS/CNSについて聞いてみたわけです。
JIS X 0212の文字名は「参考」しか存在しないですね。



524 名前:login:Penguin mailto:sage [04/01/28 01:38 ID:yXeHWwGb.net]
GB18030の仕様書?
www.anycities.com/gb18030/standard.htm

525 名前:login:Penguin mailto:sage [04/01/28 09:30 ID:zcjMBZrl.net]
>>520
やっぱり絵に描いた餅っぽいな
JISの範囲に限定してもけっこう破綻してるし

526 名前:login:Penguin mailto:sage [04/01/31 00:53 ID:0gxSoMh4.net]
Unicode Normalization派には全ての文字集合が破綻して見える。
CSI派にはUnicodeが破綻して見える。
いじょ。

527 名前:login:Penguin mailto:sage [04/01/31 07:48 ID:uM5oI3vd.net]
CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
TRONコード?

528 名前:login:Penguin mailto:sage [04/01/31 15:12 ID:A1rPcmld.net]
> CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
CSIだから何でも有りなわけだが…

529 名前:login:Penguin mailto:sage [04/02/01 13:09 ID:N4VOvKZ9.net]
>>520
何がどう破綻してるのか意味不明。
文字名称による同定が破綻しているとすればUnicode/10646自体の失敗に近い。
Unicodeしか無い世界を想定すればそれでも良いのかもしれないけど、
そんな想定は頭の中のお花畑でしょ。


530 名前:login:Penguin mailto:sage [04/02/02 10:00 ID:hq6ctxrf.net]
>>524
内部が何でも有りでよくても外部と情報交換するときには
相手の知らないコードでは話にならないと思うんですが

531 名前:login:Penguin mailto:sage [04/02/02 10:06 ID:hq6ctxrf.net]
>>525
> 文字名称による同定が破綻
そもそも一対一の対応関係しか記述できないのが無理ありすぎ。
> Unicode/10646自体の失敗に近い。
でも国際規格との整合という名目で文字名を規定してしまった。
つーかCJKでUnicodeに一番反対しているはずの日本だけが
自国の文字集合で文字名を規定してる(らしい)ってほとんど
ギャクだな。

532 名前:login:Penguin mailto:sage [04/02/02 10:41 ID:ZMPM1Vhd.net]
>>526
何でもありと言ってもcharset repositoryに登録されてる奴だけでしょ。

533 名前:login:Penguin mailto:sage [04/02/02 22:12 ID:rBgXmwm9.net]
「相手の知らないもの」を「交換」すること事態アリエナイ、
お互いが情報を共有していれば既存の文字集合でなくても構わない。



534 名前:login:Penguin mailto:sage [04/02/12 11:08 ID:KO5Q49AN.net]
> 「相手の知らないもの」を「交換」すること事態アリエナイ、
> お互いが情報を共有していれば
どうやって共有するんですか?
そんなこと言い出したらネットワークプロトコルなんて
一切必要ないということになると思いますが。

535 名前:login:Penguin mailto:sage [04/02/13 07:42 ID:AkWuZ3md.net]
既存のコードのどれかに対する写像関数があれば
何も問題なさそうだけど。プロトコルと違って
文字コードは単純なので同じように考えることは
できないと思うけど。

536 名前:login:Penguin mailto:sage [04/02/13 10:16 ID:9tJnggCR.net]
関数が、ベンダーによって違ったり、
単射に出来なかったりで問題。

537 名前:login:Penguin mailto:sage [04/02/19 17:11 ID:HogZ/lIc.net]
とりあえずSJIS撲滅しろ

538 名前:login:Penguin mailto:sage [04/02/19 18:46 ID:wXxKmQwW.net]
   /⌒ヽ  すいません、ちょっと撲殺しますよ・・・
  / ´_ゝ`)   | | 
 と    )    | | ガッ
   Y /ノ    人
    / )    <  >_∧∩
  _/し' //. V`Д´)/
 (_フ彡        /←>>533


539 名前:login:Penguin mailto:sage [04/02/20 15:15 ID:MhppvPgK.net]
「SJIS撲滅しろ」とSJISで読ませてる矛盾…
日本製品排斥運動のプラカードを日本製筆記用具で書いてる話を思い出したよ。

540 名前:login:Penguin mailto:sage [04/02/20 15:25 ID:USABAkbG.net]
ネット上を流れる日本語の何割ぐらいがEUCなのかな。
事情がどうであれ、SJISが既に多数派だってことは
受け入れないとダメだろね<EUC派の人。

541 名前:login:Penguin mailto:sage [04/02/20 15:42 ID:HZ88v8IJ.net]
YahooはEUC-JPだよね。

542 名前:login:Penguin mailto:sage [04/02/20 15:59 ID:DuOkNDXy.net]
>>536
煽りか知らんが、それを受け入れてない香具師はいないだろ。
wwwにutf-8,16使ってるページが少ないからといってunicode推進は間違ってるという結論にはならん訳だし。


543 名前:login:Penguin mailto:sage [04/02/20 16:10 ID:HZ88v8IJ.net]
>>538
全然関係ない話だが、XHTMLがXMLの派生だと考えると、XHTMLでは
UTF-8・UTF-16を使うのが正道だと思うのだが、どう思う?
Unicode嫌いだがXHMLラブな俺。



544 名前:login:Penguin mailto:sage [04/02/20 18:02 ID:DuOkNDXy.net]
utf-16より16ビットクリーンのucs-2が乙。

545 名前:login:Penguin mailto:sage [04/02/20 18:13 ID:OGx3SqOQ.net]
> 16ビットクリーン
どういう意味? ぐぐっても0件だし。
「8ビットクリーン」の語義から類推すれば、
途中で16ビット目が壊れることはないって意味になるけど・・・

546 名前:login:Penguin mailto:sage [04/02/20 18:17 ID:HZ88v8IJ.net]
>>540
まぁUTF-16とUTF-8の二者択一で、UTF-16は選ばんな。
サロゲートペアが気持ち悪すぎる。
しかしUCS-2はどうかといわれると、それならUCS-4使いたいところ。

547 名前:542 mailto:sage [04/02/20 18:18 ID:HZ88v8IJ.net]
似たような理由でShift JISも気持ち悪い。

548 名前:login:Penguin mailto:sage [04/02/20 18:36 ID:SE61JsUR.net]
>>536
シフトJISって言っても何種類もあるしね。


549 名前:login:Penguin mailto:sage [04/02/20 18:47 ID:HZ88v8IJ.net]
>>544
たとえば?
まさか「Unicodeへのマッピングが〜」なんて言わないよね……。

550 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:YAuvVXfE.net]
どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。

551 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:DuOkNDXy.net]
>>541
16ビットオンリーと言うべきだったかもしれぬ。
EUC,JIS,SJIS,UTF-8 -> 8ビットと16ビットが混在
UTF-16 -> 16ビットだけと見せかけてサロゲートがある。
UCS-2 -> 16ビットのみ(n文字目に定数時間でアクセス可能)


552 名前:login:Penguin mailto:sage [04/02/20 20:26 ID:HZ88v8IJ.net]
>>546
>どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。

文字集合の話なら、ISO国際登録簿に登録されている。


符号化も含めてなら、一応ISO-2022には「他の符号化システムの指示(DOCS)」機能がある。
これを使えばUnicode(UTF-8・UTF-16)に切り替えられる。
# UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。

553 名前:login:Penguin mailto:sage [04/02/20 20:35 ID:YAuvVXfE.net]
> # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
本当だ。知らんかった。




554 名前:login:Penguin mailto:sage [04/02/20 20:37 ID:SE61JsUR.net]
>>545
Shift_JISとかMicrosoftのCP932とか

555 名前:login:Penguin mailto:sage [04/02/20 20:53 ID:HZ88v8IJ.net]
>>550
> Shift_JISとかMicrosoftのCP932とか

その二つはどこが違うの?
俺の理解では、まさに「Unicodeへのマッピング」の違いなんだが。
あと「何種類もあるしね」と書いているが、2つだけ?

556 名前:login:Penguin [04/02/21 10:55 ID:8cIti7Dp.net]
>>551
マッピングが違う時点で、別の文字コードになる。
種類も 2つではすまない。
www.opengroup.or.jp/jvc/cde/sjis.html

557 名前:login:Penguin mailto:sage [04/02/21 11:11 ID:r6ckEmFW.net]
>>552
> マッピングが違う時点で、別の文字コードになる。
ならない。
文字コードとは文字集合+符号化方式であらわされるもの。
Unicodeへのマッピングは関係ない。

> www.opengroup.or.jp/jvc/cde/sjis.html
これはまさに「文字コードの違い」と言える。
・JIS X 0201かASCIIか
・JIS X 0208は1978か1983か1990か

558 名前:login:Penguin [04/02/21 11:28 ID:QqGdeQdg.net]
アンチEUのスレはここですか?
やはりEUに対抗して大東亜共栄圏を。

559 名前:login:Penguin mailto:sage [04/02/21 11:47 ID:u/H1Y2zG.net]
いや、日本もEUに加盟しようぜ。

560 名前:login:Penguin mailto:sage [04/02/21 12:47 ID:Ij37nYR/.net]
それはブッシュ君が絶対に許しません!

561 名前:login:Penguin [04/02/22 12:06 ID:/tZPZccw.net]
m17libあげ
japan.cnet.com/news/ent/story/0,2000047623,20064400,00.htm


562 名前:login:Penguin mailto:sage [04/02/24 16:52 ID:f1XKVOzh.net]
>>553
> Unicodeへのマッピングは関係ない。
正解。

ただし、外字が入ってる時点でCP932は別の文字コードになってる罠。


563 名前:login:Penguin [04/02/25 09:17 ID:OHUltstF.net]
G2に78JISを指示して78JISの字形を出したいときだけSS2で
切り換えるような実装はISO 2022に適合しますか?



564 名前:login:Penguin mailto:sage [04/02/25 09:42 ID:QrUE0gBl.net]
>>559
ISO-2022的にはアリだと思います。

565 名前:login:Penguin mailto:sage [04/02/25 10:36 ID:OHUltstF.net]
一意な符号化を要求された場合90JISと同じ字は使用禁止に
なるし要求されなくても同じ字は同じ扱いにならなくてはいけない
(違う字形が出力されることに期待してはいけない)わけですが、
何をもって同じ字と判断するのかが悩ましいです。

566 名前:login:Penguin mailto:sage [04/02/25 11:23 ID:QrUE0gBl.net]
>>561
おっしゃるとおりです。使うのはかなりグレーだと思います。
普通にやるなら、上のレイヤーで切り替えるべきでしょうね。

そういえば、JIS X 0208:1997の付属書6を見ていて気づいたのですが、
規格票の刷によっても字形が違うのですね。
たとえば「芦」という字。1978の第4刷より前は「戸」の上部は「一」
ですが、第4刷以降は「ノ」になっています。ところが1983ではまた
「一」に戻っています。

567 名前:login:Penguin mailto:sage [04/02/25 23:19 ID:XkkFjwVk.net]
97JISの附属書6に78JIS字形として掲げられているものって結構間違い
(実際に78JISに載っていたのとは明らかにデザイン差を越えて異なると
思われるもの)がありますね。私は少なくとも3つ見つけました。
新字源番号にも明らかにおかしいところがありますし。

568 名前:login:Penguin mailto:sage [04/03/01 15:28 ID:JCvjaOH6.net]
charの内部コードはたとえばEBCDICかもしれないから
文字クラス判定を不等号で行ってはいけませんなんて言われてた
こともあるのに時代は変わったもんだ

569 名前:login:Penguin mailto:sage [04/03/01 15:36 ID:ZJ6X9SrZ.net]
JIS漢字コード表の改正について−168字の例示字形を変更−(2004.2.20)(pdf:333kB)
www.jisc.go.jp/tpk/pdf/040220kanjicode.pdf

こんなん出たらしいですよ。
「芦」なんかが変ってますね。

570 名前:login:Penguin mailto:sage [04/03/01 15:47 ID:xLYQ3+Xr.net]
>>564
変わってませんよ。今でも良くないですよね。

571 名前:login:Penguin mailto:sage [04/03/01 16:54 ID:JCvjaOH6.net]
>>566
もちろん今でもよくないけど
__STDC_ISO_10646__
なんてのもできたじゃないですか

572 名前:login:Penguin mailto:sage [04/03/01 17:07 ID:ZJ6X9SrZ.net]
「じゃないですか」かよ!?

573 名前:login:Penguin mailto:sage [04/03/01 17:39 ID:xLYQ3+Xr.net]
>>567
それでもwchar_tの中身を直接触るのは良くないことなのですよ。



574 名前:login:Penguin mailto:sage [04/03/01 22:38 ID:gv8ZeGbq.net]
sourceforgeのapacheはEUC固定だったりする。
今だにUTF-8が使えない。

575 名前:login:Penguin [04/03/03 20:36 ID:CKuIXPe4.net]
やっとこさthe m17n libraryが公開されたけど、海外の反応が全くないのが気に
なるな。というか、The Free Standards Groupのプレスリリースくらいしか情報
らしい情報は出してないもんなあ。SlashdotとかFreshmeatにアナウンス出した
方がいいと思うけど。

576 名前:login:Penguin mailto:sage [04/03/03 20:40 ID:rkyENV70.net]
>>571
m17nのメイリングリスト入ってるんだけど、一通も流れないのが不気味だ。

577 名前:login:Penguin mailto:sage [04/03/04 02:24 ID:clL2BqDq.net]
海外の人にこそ使って欲しいなあ。


578 名前:login:Penguin mailto:sage [04/03/04 10:43 ID:9PDHb3Ho.net]
pdx.freedesktop.org/pipermail/uim/2004-March/000171.html
> Great to see that more programmers are getting invonved in
> internationalization. I hope they don't release TOO many libraries,
> though... ;)

とあるひとの反応。


579 名前:login:Penguin [04/03/05 10:05 ID:TJTIZyFT.net]
SJISって文字化け多いんでしょ?

580 名前:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ [04/03/05 10:11 ID:BY8DAhkI.net]
( ゚Д゚)<呼ばれた気がした

581 名前:login:Penguin mailto:sage [04/03/05 17:30 ID:xV2/aTba.net]
まじばか多いよ。

582 名前:login:Penguin [04/03/06 02:50 ID:LSF51fr1.net]
とりあえず、私の使ってる日本語は2バイトまでにしてください。
漢字はあまり使わないのでJIS第2水準までで十分ですから…


正直、漢字もう少し減らして欲しいよ。
5000字程度に絞って統合しないかな…
市町村みたいにあまり使われてないとこは合併。
そしたらフリーのフォントも作りやすくなるし…
ダメかな?とにかく頑張れ総理(えー

583 名前:login:Penguin mailto:sage [04/03/06 06:09 ID:xBLfCQy5.net]
>>578もいなくなれば、人口過密も軽減されるのに…




584 名前:login:Penguin [04/03/06 12:19 ID:nOqS+3CF.net]
>>578
UTF-8は3バイトになるのが嫌っては思う。
そのまま検索できる圧縮方法を標準化すりゃ、色々便利だろうにな。
UCS4の文字コードの差分

585 名前:使えんかな。
近い所の文字を連続で使う事が多いだろうし。
検索の時も先頭の文字以外はマッチングするだろうし。
[]
[ここ壊れてます]

586 名前:login:Penguin mailto:age [04/03/06 16:57 ID:RIYFz2Z8.net]
UTF-8の作成に日本はお金だしたの?
ちょっとしかお金ださないから3バイトに追いやられたの?
最近は「金は力なり」ってことはないのかな…

587 名前:login:Penguin mailto:sage [04/03/06 17:37 ID:FTiwHY/0.net]
>>581
なんか外人からみた日本人のイメージの典型みたいな人だなぁ

588 名前:login:Penguin [04/03/06 20:57 ID:NtiYGtdX.net]
>>581
とりあえず、UNICODE コンソーシアムのメンバーで日本の会社は
ジャストシステムしか見あたらない。
www.unicode.org/consortium/memblogo.html

589 名前:login:Penguin [04/03/06 21:52 ID:k9F50u4V.net]
>>581
どっかで聞いた気がするのだが結構お金だしてたような………
UNICODEの方だったかなぁ………

590 名前:login:Penguin mailto:sage [04/03/07 01:10 ID:1mpDS4RM.net]
>>578
www.itscj.ipsj.or.jp/ipsj-ts/02-07/coreset/toc.htm
というのがあるけど。

591 名前:login:Penguin mailto:sage [04/03/07 10:03 ID:JJs7467H.net]
特定のロケールのみ使う場合に短縮できるというアイデアは
DIS 10646そのものじゃん。それを葬り去って(ry

592 名前:LightCone ◆sSJBc30S5w [04/03/07 19:36 ID:Q1hO8bzI.net]
>>578, >>580
日本語のJIS第一、第二水準、中国語の第一級、第二級漢字までを2BYTEで
符号化できる新しいUnicode符号化方式:UTFCPを開発したのでご覧下さい。
2バイトで一万五千文字ものコード・ポイントがあります。

www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utf.htm

また、この符号は、ロケールやコードページの必要のない世界共通の符号
になり得る可能性があります。

符号の逆戻りも可能なので、文字列を後ろから検索する際の効率も
高いですし、複数バイト文字にASCII符号を一切含まないので、
無配慮に大文字小文字変換をしてしまう様な欧米のアプリケーションに
対しても問題ありません。

593 名前:login:Penguin mailto:sage [04/03/08 00:10 ID:Jjoer6mt.net]
basic planeマンセー!(やや曇り勝ちな声で)



594 名前:login:Penguin mailto:sage [04/03/08 00:16 ID:xPUur27x.net]
>>587
> 今まで2バイトで余裕を持って扱えていたものを、突然3バイトで
> 扱わなければならないと言われれば、誰でも納得しがたいもので
> しょう。
いや別に……。
でかい文字集合突っ込んでる立場としては、3バイトくらいが妥当と
いう感覚がある。

595 名前:login:Penguin mailto:sage [04/03/08 00:45 ID:8nTBrLvd.net]
>>589
それでも、やっぱり2バイトがいい。
文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw
飛躍しすぎですが、メールとかの通信量が1.5倍=料金1.5倍と思えば…
2chのログも1.5倍になったら………

FedoraがUTF-8になったので危機感を感じてるのですが
日本か中国で差別用語(?)とか言ってUTF-8禁止令とかでないかなぁ〜
日本政府ヨワッチイからなぁ、中国やってくれないかなw

で、英数字1バイト、日本語2バイトが良い我々は、SiftJISかEUC-JP使えばいいの?

596 名前:login:Penguin mailto:sage [04/03/08 01:38 ID:CDAnHB+K.net]
もっと先を見越した発想しないと駄目だよ。

597 名前:login:Penguin mailto:sage [04/03/08 01:58 ID:BCltEIyA.net]
>>591
先を見越すとどうなるの?
あとホームページが全部UTF-8になったらインターネットは混む

598 名前:かな?
メールがなったら携帯電話は大変だな。ドコモセンター落ちるかな(笑
[]
[ここ壊れてます]

599 名前:login:Penguin mailto:sage [04/03/08 02:28 ID:nJKGONH1.net]
中華人民共和国にはGB2312やGBKと完全な互換性を保ちつつ
UCS4の上位互換でもあるGB18030が既にありますが。

600 名前:login:Penguin mailto:sage [04/03/08 03:06 ID:BCltEIyA.net]
>>593
さすが中国。で、日本は?

601 名前:login:Penguin mailto:sage [04/03/08 03:56 ID:y/RuiKoY.net]
>>594
日本はUnicodeアレルギーが強すぎるのでUnicodeへの上位互換なんか
屁の突っ張りほどにも思ってない俺コードばかりです。
たいてい大漢和への上位互換は売り文句にしてますね

602 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 08:53 ID:JfYQzP4X.net]
>>595
拡張シフトJIS案、拡張EUC-JP案は提唱されています:
web.archive.org/web/20030605094425/www.ksky.ne.jp/~smile4me/charcode/index.htm

それと、>>587のUTFCP。

603 名前:589 mailto:sage [04/03/08 10:11 ID:xPUur27x.net]
>>590
> 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw

文化の違いっていうのがよく分かりませんが。
「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と
いう意見ならEUC-JPを使えばいいし、他の言語の文字集合も使いたい
のならISO-2022を使えばいいでしょう。

> FedoraがUTF-8になったので危機感を感じてるのですが

なぜ?



604 名前:login:Penguin mailto:sage [04/03/08 10:42 ID:Bwi62gzy.net]
>>597
なんかいろいろと意味不明な文章ですが
> EUC-JP
→EUC
> ISO-2022
→文字集合指示のエスケープシーケンス
ですか?
それはともかく簡体字中国語はGB2312しか登録されてないから
ISO 2022じゃ話にならないです

605 名前:login:Penguin mailto:sage [04/03/08 10:53 ID:xPUur27x.net]
>>598
> なんかいろいろと意味不明な文章ですが

私もあなたの書いている文章の意味が分かりません。

> > EUC-JP
> →EUC

EUC-JPであってます。
590の人は「日本語を2バイトで扱いたい」ようでしたので。

> > ISO-2022
> →文字集合指示のエスケープシーケンス

ISO-2022を誤解しているのでは?

> それはともかく簡体字中国語はGB2312しか登録されてないから
> ISO 2022じゃ話にならないです

使えます。「ESC 2/4 4/1」でG0にdesignate。

606 名前:login:Penguin mailto:sage [04/03/08 10:54 ID:Bwi62gzy.net]
> GB2312しか登録されてない
訂正。CCITT Extended GBもありましたね。

607 名前:login:Penguin mailto:sage [04/03/08 10:55 ID:xPUur27x.net]
>>600
あぁ、そういう意味ですか。了解。

608 名前:login:Penguin mailto:sage [04/03/08 10:58 ID:Bwi62gzy.net]
>>598
> 590の人は「日本語を2バイトで扱いたい」ようでしたので。
ならそれに
> 「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と
> いう意見なら
という前提の答えをすること自体が変というだけです。
> ISO-2022を誤解しているのでは?
そのままお返しします。EUCもISO 2022の一種でしょう。
> 使えます。「ESC 2/4 4/1」でG0にdesignate。
でも結論は変わりませんね。

609 名前:login:Penguin mailto:sage [04/03/08 11:05 ID:xPUur27x.net]
>>602
> > 590の人は「日本語を2バイトで扱いたい」ようでしたので。
> ならそれに
> > 「それぞれの言語でもっとも効率のよいエンコーディングを使うのが良い」と
> > いう意見なら
> という前提の答えをすること自体が変というだけです。

いいえ。ちっとも変じゃないですね。

> > ISO-2022を誤解しているのでは?
> そのままお返しします。EUCもISO 2022の一種でしょう。

サブセットという方が適切ですね。

> > 使えます。「ESC 2/4 4/1」でG0にdesignate。
> でも結論は変わりませんね。

で、結論は?

610 名前:login:Penguin mailto:sage [04/03/08 14:41 ID:CDAnHB+K.net]
このスレに定期的に出ますね。
内容は高度なのに
精神年齢が低い人たちの争い。

611 名前:login:Penguin mailto:sage [04/03/08 15:43 ID:W+OHYtj/.net]
>>604
宗教戦争みたいなものですから。


612 名前:login:Penguin mailto:sage [04/03/08 18:49 ID:ERahI9hZ.net]
> 文化の違いを考慮するべきでしょう(私は日本語だけ2バイトにでいいですがw
文化の違いってのは各国の言語事情とかかな。
それ無視したら、言語統制して英語使えって事になりかねないから。
そしたらASCIIで足りるようになるけど。

> FedoraがUTF-8になったので危機感を感じてるのですが
なぜかと言うとUTF-8がメインになりそうだからでしょう。
実際には自分で他のコード選べませんから(今だってEUC前提のとこにSiftJISじゃあ…


難しいことは分からないけど
英数字1byteで日本語2byteで他の文字も2byteのコードが欲しい。
で、それを世界標準にしたい。メールもホームページも、それにする。

でも65536文字以上の文字が有るのはどしたらよかろ?
使わなそうな古代XX文字とか非常用漢字は4byte(6?)にでもすればいいのかな

613 名前:
(3byteだと分かりにくそうだし、あとで足りないのはイヤだし…)
中国怒るかな?あと日本中国韓国の常用漢字いれても2byteでいけるのかな?
[]
[ここ壊れてます]



614 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 21:12 ID:JfYQzP4X.net]
>>606
>あと日本中国韓国の常用漢字いれても2byteでいけるのかな?
これくらいだとなんとかなりそうな符号がUTFCP(UTFCP2も出た(笑))です。

615 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/08 21:13 ID:JfYQzP4X.net]
UTFCP2のスペック(だけ):
www.nowsmartsoft.or.tv/nws/Japanese/chara_code_compare.htm

616 名前:login:Penguin mailto:sage [04/03/08 22:02 ID:Jjoer6mt.net]
>>590
その前にお前のレスの長さを半分にしてくれ。

617 名前:login:Penguin mailto:sage [04/03/08 22:36 ID:kN4paUAc.net]
長い行は黙って切り詰めるスレはここですか?

618 名前:login:Penguin mailto:sage [04/03/09 12:01 ID:fWu0tHS8.net]
>>606
そうやって考えられたのがTRONコード。
たとえ、明日宇宙人と交流が始まったとしても、
とっととフォントと割り当て作り配れば、そのままどのクライアントでも宇宙人の文字が読める。

運用や仕様に問題がないとは思わないし手放しで褒められるものじゃないみたいだけど、
その考え方自体は賛成。



619 名前:login:Penguin mailto:sage [04/03/09 13:14 ID:yT9facPe.net]
>>611
TRONコードは、ISO2022と同様の状態指定が必要なんでしたよね。

状態指定がある文字コード体系ではプログラミングし辛いので、EUCや、SJISが
登場したんだけど。


620 名前:login:Penguin mailto:sage [04/03/09 17:30 ID:QwDvTJcd.net]
状態指定していいのなら色々やれるようになるが……
現時点ではUTF-8の勝利っぽいな。日本語は3byteで我慢する。
通信量だってプロバイダからすればnyから見れば微々たるもの。
通信料固定の携帯会社は少し痛いかな。

でも日本と中国だけ自分の国の2byteコード使いそう…
UTFCP頑張って欲しいが国際的には全然ダメそう;;

あと最近電子政府とか言ってるけど文字コード何使うの?
かなり昔だが市役所行ったら漢字が出ないとか言われて
名前の漢字変えられたわな(いいのかな?まずい気がしたんだが…)
ちなみにWindowsでは変えられた方の漢字もでないんだが……
略字で登録してるとこと、正規で登録してるところがあるのが不便でつ。
戸籍略字に出来ないかなぁ………

621 名前:login:Penguin mailto:sage [04/03/09 20:21 ID:2DDflbAy.net]
役所はJEF相当の字が使えるんじゃないかな。

622 名前:login:Penguin mailto:sage [04/03/09 20:27 ID:uH50TqIT.net]
>>612
TRONコードは内部処理用にstatelessな表現もあったような気が。
以前何かの資料でちらっと見ただけで不確実すまんぬ。

623 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/10 12:25 ID:FD2GRc4Q.net]
JIS第1水準、中国第1級の混合テーブル:
www.nowsmartsoft.or.tv/nws/Japanese/jpcn1.htm

2997文字+3749文字--->5025文字になった。



624 名前:login:Penguin [04/03/10 14:00 ID:7wD2ks5p.net]
解決策:日本語は使用せず、ネイティヴでそのまま使用する。

625 名前:login:Penguin mailto:sage [04/03/10 20:43 ID:0cmjmGF/.net]
はい、私はネイティヴな日本語を利用しております。

626 名前:login:Penguin mailto:sage [04/03/11 00:17 ID:qo0Fn/uZ.net]
UTF-8使ってれば問題ないぞ!
世界的にはUTF-8が標準だ!FedoraだってUTF-8だぞ!
1よUTF-8で決定して良かったな。WindowsもUTF-8使えるから大丈夫だぞ。

627 名前:login:Penguin [04/03/11 01:16 ID:MFIoWDtG.net]
詳しいことは知らないし、どうせ時代に流されるだけだけど
UTF-8になったら文字化けとかしなくなるの?
2バイト文字より3バイト文字の処理が遅くなったりしない?

628 名前:login:Penguin mailto:sage [04/03/11 02:42 ID:J+pKjlDB.net]
CPUの計算速度は秒間10億回、メモリーは秒百メガ以上転送します。
2バイトと3バイトの差なんぞ。

629 名前:login:Penguin [04/03/11 04:34 ID:3Et/51wn.net]
とりあえずJISは死滅してるってことでいいんだよね?
少なくともEUCより先に使われなくなると思うけど <

630 名前:login:Penguin mailto:sage [04/03/11 04:38 ID:kmGNgh8j.net]
iso-2022-jp のことなら、mail に使われてるよ。


631 名前:login:Penguin [04/03/11 12:15 ID:5SXwbIF3.net]
ふと思ったけど、7bit ISO 2022なcodesetが使われているのって実は日本だけ?

* USAや西欧はISO-8859-1
* 韓国はEUC-KR
* 台湾はBig 5
* 中国はGB2312→GB18030?


632 名前:login:Penguin mailto:sage [04/03/11 12:16 ID:5SXwbIF3.net]
>>624
ぐは、「mailに」使われていると書き忘れた。

633 名前:login:Penguin mailto:sage [04/03/11 12:55 ID:Kb5yLeCK.net]
中国はISO2022より前からHZ(7bit、stateful)が使われてたし、いらんのよ。



634 名前:login:Penguin mailto:sage [04/03/11 13:54 ID:/yDh0VN8.net]
>>624
韓国は、ISO-2022-KRを使っていた頃がありませんでしたか?
少なくとも俺の知っている留学生はそうだった。15年くらい前の話。
nemacs+sj3+sendmailって環境。(留学生の間だけだったのかも…)

今はEUC-KR固定なんですか?


635 名前:login:Penguin mailto:sage [04/03/11 14:11 ID:5SXwbIF3.net]
>>627
現在ではEUC-KRが使われているというか、ISO-2022-KRはほとんど使われて
いないそうな。グッデイに移る前のSylpheedのMLでそういう話が出てた。
どっかの日記にも引用されてたような。

636 名前:628 mailto:sage [04/03/11 14:47 ID:5SXwbIF3.net]
>>628
見つけた。
ttp://gotom.jp/~gotom/diary/?200010b#200010161S3


637 名前:login:Penguin mailto:sage [04/03/11 20:04 ID:7rWfBDb3.net]
>>620
JISX0208 <-> UNICODE 間での変換表はすでに混乱しているわけだが。
このへんでも見とけ -> www.denpa.org/~go/denpa/200402/from01.html#01_2

>>619
はい、Fedoraはどの変換表を使ってるのかくらい知ってるよね?
で、Java方式? Windows方式? それとも Mac方式? それとも Fedora 独自ですか(w

638 名前:login:Penguin mailto:sage [04/03/11 20:42 ID:ud4fgRTq.net]
変換しなければいいんだろ?UNICODE外のエンコードは捨て。時代遅れ。

639 名前:login:Penguin mailto:sage [04/03/11 20:57 ID:O42OfURm.net]
と、Shift_JISっぽいエンコードで書き込む、自称時代遅れの631。

640 名前:login:Penguin mailto:sage [04/03/11 21:18 ID:n7h4RRup.net]
Unicode(って何?)で書き込むスレとかあったら面白いかも。

641 名前:login:Penguin mailto:sage [04/03/12 00:11 ID:80GSSPnR.net]
634get

642 名前:login:Penguin mailto:sage(UTF-8) [04/03/12 00:26 ID:zv+9d8+B.net]
?x3053;?x3093;?x306a;?x611f;?x3058;?x003f;

643 名前:login:Penguin mailto:sage [04/03/12 00:29 ID:zv+9d8+B.net]
BBS_UNICODE=changeだった…。



644 名前:login:Penguin mailto:sage [04/03/12 21:05 ID:8N+xdVQn.net]
>>627
ISO-2022-KR じゃなくて、ks_c_5601-1987 かな。
その名に反して、事実上 EUC-KR。
(あと、SJIS的な空き領域にたっぷり詰め込まれてるらしいけど。

ttp://www.mew.org/ml/mew-dist-1.94/msg07160.html

あたり参照。


645 名前:login:Penguin mailto:sage [04/03/14 06:05 ID:p3IFOeaA.net]
TRON code使えばいいじゃん

646 名前:login:Penguin mailto:sage [04/03/15 00:07 ID:FjBdRajh.net]
>>637
えーと、7bit ISO 2022だったけど、ISO-2022-KRじゃなかった。
muleの古いdocument, ISO2022.jaより、

*korean-mail* -- 韓国のネットワークで使用される符号系
1. G0 <- ASCII, G1 <- KSC5601, G2,3 <- 使用せず
2. No.
3. Yes.
4. Yes.
5. 7ビット環境
6. Yes.
7. No.
8. No.

G1使っているから、ISO-2022-JP風文字集合違いではない。



647 名前:login:Penguin mailto:sage [04/04/19 18:35 ID:TRVyblqf.net]
m17n-libに対するネガティブな評価
tabesugi.net/memo/cur/cur.html#172331


648 名前:login:Penguin mailto:sage [04/04/19 19:37 ID:TxiUU5Sx.net]
その人、かなりアポなような気がする。

649 名前:login:Penguin mailto:sage [04/04/19 20:43 ID:WBHL9VYt.net]
気がしても

650 名前:セっちゃいけないこともある。見ないふりをしてあげるのが礼義 []
[ここ壊れてます]

651 名前:login:Penguin mailto:sage [04/04/19 20:58 ID:TRVyblqf.net]
でも実際のところ、これって流行るのか?


652 名前:login:Penguin mailto:sage [04/04/20 01:16 ID:vUH5wJkn.net]
m17n.orgに置いた位じゃ無理だろう。
freshmeatあたりで宣伝するとか。


653 名前:login:Penguin mailto:sage [04/04/20 06:55 ID:rTQHYqpZ.net]
>>644
> m17n.orgに置いた位じゃ無理だろう。
なんで?



654 名前:login:Penguin mailto:sage [04/04/20 07:20 ID:/Sip6aJR.net]
そもそもm17n.orgなんて知らないし。

655 名前:login:Penguin [04/07/01 15:11 ID:dfbyP3DL.net]
良スレが埋もれてしまうのは惜しいのでage

文字コード問題って複雑でわからんので、「加護ちゃんはウンコするよ派
/しないよ派/加護ちゃんの肛門から出るのはウンコじゃないよ派」
みたいにわかりやすく図示してくれんもんかねぇ>識者様

656 名前:login:Penguin mailto:sage [04/07/01 23:44 ID:gL6c8Bme.net]
>>647
巣に帰れ。

657 名前:login:Penguin mailto:age [04/07/02 04:21 ID:ijjyl7Oa.net]
文字コード・ストーカー事件
anthill.hp.infoseek.co.jp/misc/memorandum/stalker.html

658 名前:login:Penguin [04/07/26 20:35 ID:9+dUBwXS.net]
IBMのEUCコード表に、日本語EUCでは文字型表示装置における表示幅が
定義されてるって書いてたんだけどホント?

659 名前:login:Penguin mailto:sage [04/07/31 06:35 ID:mohvMq6x.net]
EUCjpなんて駄目駄目よ

ケ小平とかマップできてないだろう。
まだMSKANJIの方がよいな


660 名前:login:Penguin [04/07/31 08:09 ID:euiPIjU0.net]
>>651
ケ 8F E2 C7
小 BE AE
平 CA BF

661 名前:login:Penguin mailto:sage [04/08/04 12:27 ID:Tzmg5Mgq.net]
EUCなんかよりISO 10646

662 名前:login:Penguin mailto:sage [04/08/21 13:06 ID:sZauC9ye.net]
各ディス鳥のSJIS化の情報を収集に来たのだが、
文字コードのスレになってて期待ハズレ。

と、保守下記子。

663 名前:login:Penguin mailto:sage [04/08/21 23:47 ID:WhdMMhrh.net]
ディス鳥のSJIS化???



664 名前:login:Penguin mailto:sage [04/08/21 23:58 ID:fky5S1QK.net]
単純にlocaledefでつくってしまえばよいと思われ
EUCやUTF-8のメッセージカタログが入っていれば
コード変換も行ってくれるし

まぁテキストファイルなんかの文字コード変換は自前でやるアプリもあるから
ロケールが直接影響するのは
コード変換を自前でやらないアプリと、ファイル名くらいの気もするが

665 名前:login:Penguin mailto:sage [04/08/25 21:00 ID:jObGm5N7.net]
ファイルやデータのやり取りが決め打ちな組み込みに近いミニディストリでもない限り
現行のソフトを使う限りにおいては「SJIS化」には意味がないな。

666 名前:login:Penguin mailto:sage [04/08/31 13:53 ID:VTbpM5cz.net]
こんなスレが立ってしまいましたよ
pc5.2ch.net/test/read.cgi/unix/1093879892/

667 名前:login:Penguin mailto:sage [04/08/31 14:03 ID:Z/eOEk8J.net]
、筅゙、、、鬢筍「オュヌー・゙・ュ・ウスチ! >>658

668 名前:login:Penguin [04/10/05 20:31:01 ID:Bv1T0iZx.net]
記念カキコ

669 名前:login:Penguin mailto:sage [04/10/07 05:42:33 ID:KhLYeD11.net]
>>658
スレタイもEUCにしろ

670 名前:login:Penguin mailto:sage [04/10/17 23:49:26 ID:DOTd84Rc.net]
Unicodeのいろんな問題見てたら、俺としては一つの結論にたどり着いたわけだ。

Unicodeを日本語、英語含めて全言語に適用できる文字コードにしようとするのは間違ってる。
UTF8はあくまで、他の言語もある程度満足に扱える、拡張ASCIIコードと考えよう。

今のコンピュータ業界では世界共通文字コードであるASCIIが拡張されて、
各国の言語がとりあえず使えるようになったんだ。

ASCIIだけでは不満だった人達がSJISやEUCなどを使っていたように、
Unicodeだけでは不満な人達はTRONコードでも超漢字でも、独自規格でも自由にしなよ。
でも、みんなに配るときは、UTF8で書かれた文章も付けて。
だいたいはそれで事足りるだろうし、それで不満ならそのコードが読める環境を用意するから。

#そうして歴史は繰り返す

671 名前:login:Penguin mailto:sage [04/10/17 23:54:44 ID:DOTd84Rc.net]
↑Unicodeって書いたり、UTF8って書いたりしててわけ分からんorz

UnicodeをUCS-2と読みかえてくれ。
UTF8はUCS-2のエンコード方式の中で、ASCIIと互換性があり、
その中で一番一般的なように思えるもの、というような意味合い。

672 名前:login:Penguin mailto:sage [04/10/18 23:17:47 ID:g1D5JuB1.net]
>>662-663
はぁ??でなおしてこい。

673 名前:login:Penguin mailto:sage [04/10/19 23:23:04 ID:Al9qBxAQ.net]
unicodeでいいよ。
m17n楽だから。



674 名前:login:Penguin [04/12/01 22:05:16 ID:c7RgDl8N.net]
ISO-2022-JPがISO/IEC 2022に適合しないのってどのへん?

675 名前:login:Penguin mailto:sage [04/12/01 22:27:58 ID:w/F2PYLo.net]
改行でASCIIに戻るとこ。

676 名前:667 mailto:sage [04/12/01 22:37:58 ID:w/F2PYLo.net]
おおっと、ちょっと嘘書いちゃった。RFC 1468のこのへんかな。

> オンラインにJIS X 0208 文字がある場合、行の終(すなわちCRLFの前)
> ASCIIもしくはJIS X 0201の"Roman"セットに切り替えなければなりません。
> これは、次の行が直前の行の終の前で切り替えられた文字セットではじます
> ことを意味します。
> また、テキストはASCIIで終わらなければなりません。

www.asahi-net.or.jp/~bd9y-ktu/dtd_f/rfc_f/rfc1468j.html

677 名前:login:Penguin mailto:sage [04/12/02 00:01:17 ID:/R16VbWh.net]
>>668
別にそれは更なる制約だから問題ないでしょ。

同一文字の二重符号化禁止でしょ。
半角のAと全角のA。Unicodeではあれだけど、
ASCII, JIS X 0201, JIS X 0208では同じ文字。
だから「AはASCIIのAのみを利用する」という約束がないと駄目なんじゃない?

678 名前:667 mailto:sage [04/12/02 01:37:50 ID:+PbXBE2p.net]
>>669
> 同一文字の二重符号化禁止でしょ。
なんのこっちゃ。
「図形文字の一意な符号化」が何の関係があるの?
ISO-2022では「要求される場合がある。その場合は...」と書いてあるだけだろう。

> 別にそれは更なる制約だから問題ないでしょ。

制約じゃないだろ。明らかにISO-2022の範囲外。

679 名前:667 mailto:sage [04/12/02 01:44:22 ID:+PbXBE2p.net]
>>669
ちょっと厳しく書きすぎたかも知れない。
どう誤解してるのかに興味があるから、もう少し詳しく書いてみて。
669の文章から推測すると、
「ISO-2022では一意な符号化が要求されているが、ISO-2022-JPでは
そのへんが定められていないから違反だ」というところか?

680 名前:login:Penguin mailto:sage [04/12/02 06:15:35 ID:CCz/AXQj.net]
> 別にそれは更なる制約だから問題ないでしょ。
web.archive.org/web/20040105042210/www.xinada.ne.jp/~handa/tech/Scribbles/RFC1468-and-ISO2022
とか
suika.fam.cx/~wakaba/-temp/wiki/wiki?ISO-2022-JP%A4%CEISO%2FIEC%202022%C5%AC%B9%E7%C0%AD
の受け売り?
こんな明らかな間違いに今まで誰も突っ込んでないのが不思議なんだが
受信装置の適合性は無視ですか? でもSuikaWikiのすぐ下読むと
> 文字を実装しなくて良い、はデータの適合性には影響しないでしょうが、受信装置の
> 適合性で問題がある可能性があります。
とか
> (受信装置?の適合性は疑わしい可能性がありますが) データの適合性には影響しない
> でしょう。
とか書いてるしマジわけわかんねぇ
問題: 上記2つの文書にはもう1つ共通する間違いがあります。それはなんでしょう?

> 同一文字の二重符号化禁止でしょ。
それが関係するのはG0〜G3の複数のバッファから呼び出す場合で、
ISO-2022-JPみたいに指示のみで切り替える場合には関係ない。

少しは規格票読んだら?

681 名前:667 mailto:sage [04/12/02 16:50:35 ID:+PbXBE2p.net]
>>670
>> 別にそれは更なる制約だから問題ないでしょ。
> 制約じゃないだろ。明らかにISO-2022の範囲外。

ごめん、俺が間違ってた。これは制約にすぎないな。
# ASCIIやJIS X 0201 Romanにもどす話は、JIS X 0208:1997 附属書2に書いてあるだけか。

>> 同一文字の二重符号化禁止でしょ。

670 の追記だが、ISO/IEC 2022やJIS X 0202の
「7.5 Unique coding of graphic characters(図形文字の一意な符号化)」
では、一意な符号化はmustではないし、shouldでもない。

そもそも 672 の言うように、ISO-2022-JPのようなG0のみの使い方なら関係ないとも
考えられる。

682 名前:672 mailto:sage [04/12/03 03:59:08 ID:9rXlF8ug.net]
解答例:
改訂番号の識別機能を使うとき、それがエスケープシーケンスとしてCCデータ要素
に埋め込まれている必要はない。
したがって、改訂番号識別シーケンスを使わないことをもってただちに不適合である
とは結論できない。

683 名前:login:Penguin [05/01/23 19:59:57 ID:pIU32Ad7.net]
明けましておめでとう



684 名前:login:Penguin mailto:sage [05/01/23 23:18:08 ID:5luBPpp6.net]
ことよろ


685 名前:login:Penguin mailto:sage [05/02/12 22:41:24 ID:q+2/aCG1.net]
CSIって具体的にどういう実装?

686 名前:login:Penguin [2005/07/13(水) 03:16:01 ID:GiU0rXXK.net]
  

687 名前:login:Penguin mailto:sage [2005/07/20(水) 09:02:03 ID:6Oqfp2xg.net]
ユニコードで多国籍言語が混在できるわけだから、もうユニコードしかないだろ。


688 名前:login:Penguin mailto:sage [2005/07/21(木) 03:14:07 ID:OTpKdDbb.net]
最初っからワイドキャラクター4バイト扱いになってればよかったのにね

689 名前:login:Penguin mailto:sage [2005/07/21(木) 22:28:05 ID:VqTdSdS9.net]
まあCJKには問題はあるが今更どうにもならねーじゃん。
言語に合わせたフォントを使うって事で我慢するしか無いんじゃないの。
あんまり困らんし。

まあ、xml:lang="ja"みたいに言語を指定できる形式のデータでなければ
自動判別も難しいがなー

690 名前:login:Penguin mailto:sage [2005/07/21(木) 22:54:50 ID:ELrUD4wT.net]
CJKのあれは糞だとは思うが、それを考えてもUnicodeはやっぱEUCやShiftJISよりはいいと思うよ

691 名前:login:Penguin mailto:sage [2005/07/22(金) 05:35:05 ID:IQMf+bjf.net]
勝ち組 UTF-8>Shift_JIS>EUC-JP 負け組

692 名前:login:Penguin mailto:sage [2005/07/22(金) 08:51:40 ID:UYAHvv2j.net]
>>681
> まあCJKには問題はあるが今更どうにもならねーじゃん。
> 言語に合わせたフォントを使うって事で我慢するしか無いんじゃないの。

お前…サロゲートペアくらい知れ…

693 名前:login:Penguin mailto:sage [2005/07/22(金) 09:45:37 ID:xE5bf7Ay.net]
>>684
それを言うなら言語タグ。
ただ、まったくもって使われていないし、Unicodeの規格で「使うな」って書かれてる。



694 名前:login:Penguin mailto:sage [2005/07/22(金) 20:51:44 ID:WBS25hy8.net]
UTF-8のエンコード方法だけは美しくて好きだ

695 名前:login:Penguin [2005/07/25(月) 15:58:52 ID:OIgwFSJr.net]
半角カタカナはいずれなくなるって聞いてたんですが、どうなってるんでしょうか?


696 名前:login:Penguin mailto:sage [2005/07/25(月) 16:10:14 ID:Zgta4wI+.net]
>>687
昔そんなことを言っていた親父がいたね。

まぁそれにしても初心者ばかりのスレだな。
フォントとエンコーディングの違いすらわかってない。
メールに関するRFCでも読んでみたら?


697 名前:login:Penguin mailto:sage [2005/07/25(月) 16:34:51 ID:Z+0f5Lrq.net]
Unicodeって3バイトの固定長なの?それとも長さ変わるのかな?

698 名前:login:Penguin mailto:sage [2005/07/25(月) 18:33:53 ID:E/JhV6+H.net]
>半角カタカナはいずれなくなるって聞いてたんですが、どうなってるんでしょうか?

憲法9条を改正して日本も核武装すればいいん

699 名前:です。 []
[ここ壊れてます]

700 名前:login:Penguin [2005/07/25(月) 18:39:06 ID:CcIbwQig.net]
おーすげえつまんねえ

701 名前:login:Penguin mailto:sage [2005/07/25(月) 19:04:20 ID:7F07vbuU.net]
UTF-8とUTF-16は、どっちがすぐれているのか?
Linuxでは、UTF-8が一般的なようだ。
しかし、8の方は、日本語で4バイトも使ってしまうときがあるらしい。
16のほうが2バイトですむので、16のほうがいいはず。

702 名前:login:Penguin mailto:sage [2005/07/25(月) 23:12:43 ID:ShkskimW.net]
>>692
UTF-16でも4バイト使うことがあるよ。

703 名前:login:Penguin mailto:sage [2005/07/26(火) 01:42:22 ID:oG1gSYzU.net]
>>693
ふつうは、2バイトらしいけど。



704 名前:login:Penguin mailto:age [2005/07/26(火) 02:19:12 ID:TGspmtnU.net]
UCS-2なら確実に2バイトだぞ。

705 名前:login:Penguin mailto:sage [2005/07/26(火) 04:58:27 ID:Q6tbTaTJ.net]
ということは、将来的には、UTF-16が最高だ。

706 名前:login:Penguin mailto:sage [2005/07/26(火) 05:15:48 ID:Q6tbTaTJ.net]
英数の割合が多い場合はUTF-8の方が効率が良い
日本語が多い場合はUTF-16の方が効率が良い
どちらを標準として使用するではなく、状況で
文字コードを使い分けることが必要となります。

日本人はUTF-16がよい。
しかし、いちいち使い分けとかできるのか?



707 名前:login:Penguin mailto:sage [2005/07/26(火) 05:40:20 ID:IExHqSN1.net]
日本人はUTF-32 or UTF-8だろ。UTF-16なんか使うのはマイクロソフトのうんこ食ってるやつらのみ。

708 名前:login:Penguin mailto:sage [2005/07/26(火) 06:33:45 ID:7TQVMoPo.net]
>>698
同意。

709 名前:LightCone ◆sSJBc30S5w mailto:sage [2005/07/26(火) 07:09:13 ID:nE9DPpZk.net]
UTFCP2も広がっていって欲しいんだけども。

www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utfcp2.htm
www.nowsmartsoft.or.tv/nws/Japanese/chara_code_compare.htm



710 名前:LightCone ◆sSJBc30S5w mailto:sage [2005/07/26(火) 07:43:37 ID:nE9DPpZk.net]
>>697
英数が1バイト、日本語文字の主要部と主要言語の文字が2バイトで
表せて、しかも、地域切り替えの必要のない符号があるといいんで
すよね。

UTFCP2がその条件を満たします。

しかも、UTFCP2は正確に逆戻りできるので、プログラミングもし
易い。

逆方向に戻りたくても正確に先頭文字が見いだせないタイプの符号も
あって、そういう物だと、いったん固定長コードに展開してから扱う
か、先頭から繰り返し文字をたどって(O(N^2)の時間をかけて処理す
る)扱わなくてはならずに効率が悪いし、プログラミングもしにくい。
しかし、UTFCP2はその点はクリアしてる。

711 名前:login:Penguin mailto:sage [2005/07/26(火) 08:25:29 ID:EQBnsRUf.net]
>>688
いや、規格に書いてるんだが。

712 名前:login:Penguin mailto:sage [2005/07/26(火) 11:31:40 ID:d36L+Iw2.net]
LightCoreかよ!

713 名前:login:Penguin mailto:sage [2005/07/26(火) 14:24:07 ID:dLabsIQO.net]
ユニコードでは、UTFCP2が最高みたい。



714 名前:login:Penguin mailto:sage [2005/07/27(水) 01:08:36 ID:70yWMgNw.net]
>>700
おまえまばいたのか
わざわざ非直感的な変換なんていう前時代的でバグや混乱の温床なものが今さら使われるわきゃないだろ

715 名前:login:Penguin mailto:sage [2005/07/27(水) 01:14:12 ID:T9lroKWZ.net]
遺蹟
citrus.bsdclub.org/

716 名前:login:Penguin mailto:sage [2005/07/27(水) 01:25:12 ID:knrk8KBH.net]
続報発見
www.rubyist.net/~matz/20040107.html

717 名前:login:Penguin mailto:sage [2005/07/27(水) 04:12:52 ID:VSgKtkuW.net]
UTFCP2て情報が少ない。ものすごくマイナーみたい。
いいのか悪いのかよくわからない。

718 名前:login:Penguin mailto:sage [2005/07/27(水) 12:07:32 ID:sDlvvdfy.net]
マイナーも何も学生さんのままごと遊びだろ
本人には多少商売っ気もあるのか知らんが

719 名前:login:Penguin mailto:sage [2005/07/27(水) 12:16:34 ID:7N7n+Iw9.net]
>>706
CitrusはNetBSDに取り込まれたので、独立したプロジェクトとしてはも
う終了したんじゃないかね。



720 名前:login:Penguin mailto:sage [2005/07/29(金) 22:17:29 ID:cEfvBK8o.net]
> 【混乱大丈夫?次期ウィンドウズで漢字150字形を変更】
> マイクロソフト社は、来年発売の次期パソコン用基本

721 名前:ソフト(OS)「ウィンド
> ウズ・ビスタ」で使用する日本語の漢字約150字の形を変えることを決めた。
(略)
> 新JIS漢字の採用に踏み切った
http://www.yomiuri.co.jp/main/news/20050729i306.htm

これってCP932の字体を変えるって事ですかね?

内部コードに使っているUnicodeと照らし合わせて、
「考え方」の5-(7)に対してどういう考え方なのか提示してくれるのでしょうかね。 > MS
# http://www.jsa.or.jp/domestic/instac/h13reports/JCSmain_Web.pdf
[]
[ここ壊れてます]

722 名前:login:Penguin mailto:sage [2005/07/29(金) 23:38:48 ID:etzWhLv3.net]
混乱しすぎ。なんでこんな変なことになったのだろう。
ユニコードも変だし。

723 名前:login:Penguin mailto:sage [2005/07/30(土) 00:39:13 ID:B7TV+1pG.net]
>>711
Vistaβ1で表示すると酷くマヌケな記事に見えようね。



724 名前:login:Penguin mailto:sage [2005/07/30(土) 01:19:08 ID:Hd+4jW+B.net]
>>713
つーか>>711の記事のhtmlのencodingがShift_JISだけど、
新しいWindowsで見ると、
> 今の「ウィンドウズXP」で使われている「葛」「辻」「飴」「蝕」「逗」などは
> 基本的に表示・印刷できなくなる。
はどう見えるんだろうか…

725 名前:login:Penguin mailto:sage [2005/07/30(土) 03:30:34 ID:WvWcKt1H.net]
CJK考えた奴等と同じようなことを今さらやるのか

726 名前:login:Penguin mailto:sage [2005/07/30(土) 09:54:19 ID:6JWwMcre.net]
へ? JISが字体変えたからそれに合わせたって話でしょ?
MSがどうこうって話じゃないと思うが。

727 名前:login:Penguin mailto:sage [2005/07/30(土) 10:41:03 ID:Hd+4jW+B.net]
>>716
CP932の定義が変わって、
CP932とUnicodeのマッピングが変わるわけでしょ?
とりあえず>>711のPDFくらい読めよ。

internet.watch.impress.co.jp/www/column/ogata/sp13.htm
でも概略は理解できるよ。

JIS X 0208の1978, 1983, 1997が同じ文字集合を規定している
というセンスだと理解不可能。

728 名前:login:Penguin mailto:sage [2005/07/30(土) 17:03:24 ID:Hd+4jW+B.net]
■Windows(R)で日本の文字・活字文化に根ざしたIT利用を推進
Windowsの次期バージョンWindows Vista(TM)において日本語フォント環境を一新
〜国語審議会の答申に基づく例示字体の変更と追加漢字を反映した最新JIS規格への対応、並びに画面上での可読性が画期的に向上する新しいClearType(TM)フォントの開発を発表〜
www.microsoft.com/japan/presspass/detail.aspx?newsid=2353

729 名前:login:Penguin [2005/09/02(金) 01:54:13 ID:s8G2WNu5.net]
405 名前:名無しさん@お腹いっぱい。[] 投稿日:2005/09/01(木) 21:36:37
ttp://www.mimori.org/~h/tdiary/20050817.html#c01

> この「2004 JISをめぐる混乱」を書いた南堂久史とかいう人物は、JIS X 0213:2004の審議に参加してないばかりか、
> JIS X 0213:2004の委員会議事録www.jsa.or.jp/domestic/instac/committe/JCS/ すら読んでいないように
> 思われます。このような人物が、どうしてJIS X 0213:2004に関して「当事者ヅラ」するのか、非常に疑問だったりします。

ttp://www2.xml.gr.jp/log.html?MLID=xmlmoji&TID=1643&F=0&L=10&R=1#M1643

> えーと
> www.itmedia.co.jp/news/articles/0508/31/news062.html
> の記事の話なのですが、
> www.jsa.or.jp/domestic/instac/h13reports/JCSmain_Web.pdf の6〜8ページ目
> internet.watch.impress.co.jp/www/column/ogata/news1.htm
> のどちらにもかのお方に対

730 名前:桙キる人名を見つけられないのですが。
> 私の頭が腐れているようなので、かの方が何をもってこう主張されているのか、お教えいただければありがたいのですが。

最初読んだときから妙にネタくさいとは思っていたが… つか、本人のblogにもツッコミ入ってるけどね。

ttp://openblog.seesaa.net/article/6106946.html#comment
[]
[ここ壊れてます]

731 名前:login:Penguin mailto:sage [2005/09/02(金) 02:07:34 ID:oE1shbt2.net]
いや、南堂さんは前から有名な電波だし

732 名前:login:Penguin mailto:sage [2005/09/02(金) 15:22:54 ID:ePI9STV8.net]
>>720
知らない人もいるというか、日記とかブログ見てると例の文章に騙されている人結構多そうなんだけど。

733 名前:login:Penguin mailto:sage [2005/09/02(金) 18:46:59 ID:oE1shbt2.net]
ITMediaがドクター中松にひっかかったの図だな。



734 名前:login:Penguin mailto:sage [2005/09/02(金) 18:51:29 ID:TrL107ka.net]
>>721
まあしようがないんじゃないの? 書く方も信じる方も。

文字コード関連は安易に考える声の大きい人が集まってくる事が多いからね。
みんな字については一家言あるんだと思うよ。それだけ日本人は文字に親しみがある。

安岡さんみたいに一々指摘していくしかない。

735 名前:login:Penguin mailto:sage [2005/09/02(金) 23:34:06 ID:rPCKiR8q.net]
kterm -vb -km sjis -sl 1000 &
kterm -vb -km euc -sl 1000 &
kterm -vb -km utf8 -sl 1000 & <- こうか??

736 名前:login:Penguin mailto:sage [2005/09/03(土) 04:07:50 ID:prlbtDmw.net]
>>719
安岡って人は何が気に入らないの?
「JISの変更はオレが昔から主張していた事だ」という主張?
よくわからん。それが「当事者ヅラ」ってやつになるの???
JIS委員への影響力については謎だけど


737 名前:login:Penguin mailto:sage [2005/09/03(土) 07:14:42 ID:vuY4SZx7.net]
>>725
> JIS委員への影響力については謎だけど

その謎をスッ飛ばして「責任者」と主張してる辺りが気に入らないんじゃない?

738 名前:login:Penguin mailto:sage [2005/09/03(土) 07:24:20 ID:3XCFUrUs.net]
2004 JIS をめぐる混乱
www005.upp.so-net.ne.jp/greentree/koizumi/75_moji.htm
> そもそも、責任者は誰か。MSか? 国語審議会か? JISの規格委員会か? ……その
>いずれでもあるだろう。しかし、根源的な責任者は、私(南堂久史)である。なぜなら、私が
>この方針を提唱し、その方針が実行されたからだ。
>   発案者:南堂久史
>   推進者:メーカー技術者(JIS委員)
>   決定者:JIS委員会
>   実行者:MSなど(OSやフォントの販売社)
> という分担だ。問題の根源は、私にある。

わははははははは。

739 名前:login:Penguin mailto:sage [2005/09/03(土) 10:00:28 ID:yEiqSCM+.net]
>>725
安岡さんはひとまずおいといて、あなたは、
www005.upp.so-net.ne.jp/greentree/koizumi/75_moji.htm
は、別に何も問題ないと思うんですかあ?

740 名前:login:Penguin mailto:sage [2005/09/03(土) 11:55:14 ID:CooTmwWW.net]
電気自動車はおれが発案者。
子供の頃自力で考えたもん。

741 名前:login:Penguin mailto:sage [2005/09/03(土) 12:48:18 ID:FP8qJsDh.net]
>>729
Are you me?

742 名前:login:Penguin [2005/09/03(土) 15:00:51 ID:sT1agIm0.net]
少なくともソフト作成側、あるいはプロトコル作成側がどの文字コードを好むかということなんだろう
出てくるソフトの対応がバラバラなので統一しようにもいまさらって感じ
これから作るソフトは、統一した方法で作らないといけない条約を結ぶしかない

743 名前:login:Penguin mailto:sage [2005/09/03(土) 15:04:14 ID:prlbtDmw.net]
>>726
「責任者」っていうほどでもないだろう、とは思うけど
それで「当事者ヅラするな」というコメント付けるほどでもないだろう、と思う

安岡ていう人のページには対して文字コード関連の話がないなぁ
何故そこまで気に入らないんだろう?
似たようなコメントを良く書いてるっぽいが・・・

あと、blogのコメント欄に影響っていうか、JIS委員との関わりについては
少しコメントがあったわ。

>>728
問題あるなし、っていうか、フーンと思うだけ。別に細かい表現に
いちゃもんを付けようとか特に思わない、かな。




744 名前:login:Penguin mailto:sage [2005/09/03(土) 16:02:23 ID:U0BQMRa3.net]
「当事者ヅラするな」とかそんなきついコメントじゃないと思うが、それはまあいいや
それよりたぶん安岡違いしてると思うぞ

745 名前:login:Penguin mailto:sage [2005/09/03(土) 16:43:45 ID:V8pkfISk.net]
> ID:prlbtDmw

安岡さん、思いっきり有名人なんだけど。
kanji.zinbun.kyoto-u.ac.jp/~yasuoka/index-j.html

つーか君、>>719のリンク先読んだ?


746 名前:login:Penguin mailto:sage [2005/09/04(日) 00:50:41 ID:R+K7MdVz.net]
>>732
> 問題あるなし、っていうか、フーンと思うだけ。

じゃあ「あなたには」知識がないんだから、
「あなたは」問題あるかどうかも分からない、
そういう可能性があることくらいは「あなたも」認められるでしょう?



747 名前:login:Penguin mailto:sage [2005/09/04(日) 06:55:48 ID:MsXqhZUx.net]
>>729
子供の頃、「網戸の升目ごとに色を平均化してそれを紙に複写して塗って行けば超写実的な絵が描けないだろうか」
とか、「楽曲などの音声をごく短い一定時間で区切り、『その時点の合成済みの音』を口から発声すれば
オーケストラさえアカペラで再現可能なのでは?」
とか無茶な事と考えてた俺がやってきましたよ

748 名前:login:Penguin mailto:sage [2005/09/04(日) 09:26:08 ID:G7qNsLEx.net]
>>736
> 「網戸の升目ごとに色を平均化してそれを紙に複写して塗って行けば超写実的な絵が描けないだろうか」
デジタルカメラですな

749 名前:732 mailto:sage [2005/09/04(日) 22:34:56 ID:tXn0bCFD.net]
>>735
まぁ、有名人らしいがその人をオレは知らないから知識がないのかも
ページを見てもやはりフーンという感じだし。

まぁ、何を怒ってるのか分らないから、聞いて見たわけだが・・・

要は研究者っぽい?人だから、外から色々言われるのが
気に食わないのかなぁ、と理解したよ。この人がJIS委員に近い
立場なのかはやはり知らないけど。

750 名前:login:Penguin mailto:sage [2005/09/05(月) 10:31:34 ID:NBgmQjDk.net]
>>738
ページでの記述と違い、規格制定に殆んど関与がないんじゃないのか?
とは思わないんですか?

751 名前:login:Penguin [2005/09/07(水) 12:22:53 ID:TQuZgjGU.net]
安岡孝一氏といえば、れっきとしたJIS委員ですし、文字コードの日本で代表的な研究者。
文字コードについてのスポークスマン的な方ですよね。
下の委員会報告あたりで委員名簿を見るといいですよ。

情報処理学会 文字コード標準体系専門委員会
www.itscj.ipsj.or.jp/domestic/mojicode/index.html

JIS X 0213:2004 委員会(新JCS調査研究委員会)
www.jsa.or.jp/domestic/instac/committe/Jcs02/index.htm

人名用漢字の文字符号に関する規格検討会(日本規格協会情報技術標準化研究センター)
www.jisc.go.jp/newstopics/2004/041221kanjicode.htm

752 名前:732 mailto:sage [2005/09/08(木) 04:27:18 ID:430UC9iB.net]
>>740
そのものズバリ委員なのか。
より納得したよ。ありがとう。

753 名前:login:Penguin mailto:sage [2005/09/08(木) 05:07:26 ID:N7r4w12s.net]
>>741
>>734にも書いたけど、とりあえずお前はリンク先を読むってことを覚えような。

internet.watch.impress.co.jp/www/column/ogata/news1.htm
> ●これが新JCS委員会のメンバーだ
>
>  今年度のJCS委員会の目的は、JIS文字コードの見直し作業として、この表外漢字字体表の1,022文字に、
> どのように対応させるかを決定するものだ。委員会のメンバーは以下の通り。
(中略)
> 委員  安岡 孝一  京都大学人文科学研究所附属漢字情報研究センター





754 名前:login:Penguin [2005/09/09(金) 01:38:27 ID:sks3GiUs.net]
ttp://openblog.seesaa.net/article/6106946.html

ここ、8/6付でまた補足が入ってるね。

755 名前:login:Penguin mailto:sage [2005/09/09(金) 01:39:52 ID:sks3GiUs.net]
9/6付の間違いorz
ついでにこれも。
ttp://openblog.seesaa.net/article/6648630.html

756 名前:login:Penguin [2005/09/09(金) 03:40:30 ID:iQmZfTpp.net]
SJISのこわさをしらんのだわな

757 名前:login:Penguin mailto:sage [2005/09/09(金) 07:12:28 ID:ZJvaNmWQ.net]
>>743
>私の旧型パソコン(Windows98)は、対応できなかった。google に接続するたびに、
>異常を起こした。たいていは、マシンがビジー状態になってストップするだけであり、
>再起動すれば直った。しかし、あるときついに、ビジー状態のあげく、
>CPUが過熱して、パソコンが壊れてしまった。
> つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまった
>わけだ。同じ被害にあった人は、たくさんいる、と思う。

なんだこりゃ。

758 名前:login:Penguin [2005/09/09(金) 10:47:06 ID:sFmF9sT1.net]
>>743-746
すっごーい。笑えるブログを紹介していただき、ありがとうございました。

759 名前:login:Penguin mailto:sage [2005/09/09(金) 19:41:09 ID:UMUAs+my.net]
>>746
現象としてはありえるが、いやしかしそれは…

760 名前:login:Penguin mailto:sage [2005/09/15(木) 10:38:16 ID:TR9d+m0z.net]
Windowsのフォントキャッシュファイルが壊れて,
ウィンドウ右上のボタンとかチェックボックスの表示が乱れた(内部的にはフォントらしい)ときに,
「パソコンが壊れた! もう買い換え時なのかなぁ」とか宣いくさってた人がいたけど,

それと同じレベルの話だと思った

761 名前:login:Penguin mailto:sage [2005/09/15(木) 10:51:48 ID:v5EI1ZHi.net]
それにしては電波が強いな。

762 名前:login:Penguin mailto:sage [2005/09/15(木) 20:24:02 ID:F5S5Gxdf.net]
無駄に読点が多い人には変なやつが多い

763 名前:login:Penguin mailto:sage [2005/09/15(木) 21:25:57 ID:pTa94/VU.net]
読点が全くない奴が言ってもあんま説得力ないな。



764 名前:login:Penguin mailto:sage [2005/09/15(木) 22:42:11 ID:1dLHE645.net]
>>752

765 名前:login:Penguin mailto:sage [2005/09/17(土) 00:49:09 ID:LNMSxsLV.net]
>>752
藤岡弘、乙

766 名前:login:Penguin mailto:sage [2005/10/08(土) 07:18:48 ID:sFuPxKcN.net]
en.wikipedia.org/wiki/Han_unification
これどうなの?
discussion とかぶち切れた日本人と紛糾してるけど。

767 名前:login:Penguin [2005/10/29(土) 01:20:15 ID:4sGodI4y.net]
'機動新撰組 萌えよ剣' を EUCからSJISにしてみr

768 名前:login:Penguin mailto:sage [2005/10/29(土) 03:02:52 ID:1E580LMS.net]
>>755
またmohtaのような馬鹿が日本の恥を世界に晒しているのか

とリンク先も見ずにレスしてみるテスト

769 名前:login:Penguin mailto:sage [2005/11/04(金) 06:25:43 ID:y6nfURE5.net]
ユニコードの変換表はMS互換が主流になるんだろうか

770 名前:login:Penguin mailto:sage [2005/11/04(金) 08:55:36 ID:GYpNcw+1.net]
多数が主流

771 名前:login:Penguin mailto:sage [2006/03/11(土) 10:29:15 ID:JNwGDu3C.net]
はやいとこどれかが決定版になればいいけどね〜

772 名前:login:Penguin mailto:sage [2006/09/08(金) 17:21:43 ID:H8L/pFM+.net]
ボクメツはどれほど進みましたの?

773 名前:login:Penguin mailto:sage [2006/09/09(土) 02:41:28 ID:nKCfa59P.net]
我が家からはボクメツされました



774 名前:login:Penguin mailto:sage [2006/09/09(土) 11:31:58 ID:LUzpy+Oa.net]
UTF-8なディストリは少なからず普及したからなあ

775 名前:login:Penguin mailto:sage [2006/09/09(土) 14:50:37 ID:laIYczt4.net]
Vineは新しいバージョンでもまだeucデフォらしいよ。

776 名前:login:Penguin [2006/09/09(土) 14:53:16 ID:0zmAkScM.net]
Plamo も作者の意向から utf8 化はまだまだなんだろうね。


777 名前:login:Penguin mailto:sage [2006/09/09(土) 15:04:03 ID:laIYczt4.net]
Plamoもか。ほかにもあるのかな?
メジャーなのはみんなUTFだよね?

778 名前:login:Penguin [2006/09/09(土) 15:07:14 ID:0zmAkScM.net]
gentoo の日本語マニュアルパッケージも eucJP のままだね。
lv や w3m 使って eucJP を utf8 に変換してコンソールに出すなんて
バッドノウハウ使ってるよ。


779 名前:login:Penguin mailto:sage [2006/09/09(土) 20:32:45 ID:PNdx0Gz2.net]
utf-8 でもいいんだけど euc-jp とかへの逆変換に
何か問題なかったっけ?

780 名前:login:Penguin mailto:sage [2006/09/10(日) 01:38:23 ID:UVx9h7k5.net]
うにこは基本的に他エンコーディングとの変換テーブルに問題抱えてる
これは仕方ないことなのかもしれん

781 名前:login:Penguin mailto:sage [2006/09/10(日) 02:26:29 ID:D6z2AhmW.net]
そんなに逆変換が必要なときがありましょうか?

782 名前:login:Penguin mailto:sage [2006/09/10(日) 08:16:14 ID:0dX8SdvI.net]
U+FF3Cを\にしちゃったりU+00A3とU+FFE1の一方を捨てちゃったりといった
間抜けなことをしない限りeuc-jpに戻す分には非互換はないのでは?

783 名前:login:Penguin mailto:sage [2006/09/25(月) 11:25:29 ID:muR64Ne2.net]
ほしゅ



784 名前:login:Penguin [2006/09/30(土) 18:47:33 ID:W0e6uqrh.net]
撲滅するにはftpクライアント(ffftp)がEUCしか対応していないのが痛い。
utf対応しているnextftpはシェアだし。

785 名前:login:Penguin mailto:sage [2006/09/30(土) 19:15:06 ID:66B30ekL.net]
Core FTP LE


786 名前:login:Penguin mailto:sage [2006/10/25(水) 14:40:41 ID:u4PBzgrU.net]
ほしぇ

787 名前:login:Penguin mailto:sage [2006/11/06(月) 00:25:22 ID:Sxv3iMFN.net]
霞(辞書)を utf8 化する方法をどなたか教えていただけないでしょうか?

788 名前:login:Penguin mailto:sage [2006/11/10(金) 22:54:07 ID:1rMy0pb+.net]
つ iconv

789 名前:login:Penguin [2006/12/12(火) 21:03:23 ID:o9nBT2qw.net]
sjis死ね、マジで氏ね

790 名前:login:Penguin [2006/12/20(水) 00:28:03 ID:2Omq6sD0.net]
最近、ソフト作る時に、マジでunicode以外の漢字コードは死ねよと毎度思う。
でもネットは未だにsjisとかeucとかだからなあ。firefoxのgoogle bookmarkの拡張を使ってみたら
文字化けしたんで自分で作り中。

791 名前:login:Penguin mailto:sage [2006/12/20(水) 00:43:35 ID:m3McLQ/f.net]
携帯電話の一部機種では未だにShift-JIS。
UTF8で突っ走ってたら、一部の人から「ミレネーヨ!」
いい加減、やめれと言いたい。

統一しようよ…

792 名前:login:Penguin mailto:sage [2006/12/20(水) 01:26:34 ID:KvHBO/yG.net]
EUC は UNIX の文化か。
SHIFT-JIS は Win の何か。
JIS ( ISO-2022-jp ) は日本の標準だったのか。
UTF-8 は国際標準化なのか?

.... 多すぎる .... が全てに対応できてないと 使えません。


793 名前:login:Penguin mailto:sage [2006/12/20(水) 06:04:07 ID:h8SjL26V.net]
UTF8以外全部死んでくれ。
MSが適当にunicodeという単語使ってるせいで、
unicodeにも色々あることを知らない奴大杉。




794 名前:login:Penguin mailto:sage [2006/12/20(水) 09:12:31 ID:FG2Ton4t.net]
UTF8以外は、どうやって殺せばいいの?

795 名前:login:Penguin mailto:sage [2006/12/21(木) 11:47:15 ID:oshPKEOL.net]
Java5からUTF-16ですが。

796 名前:login:Penguin mailto:sage [2006/12/21(木) 12:55:01 ID:Ty+/aiHJ.net]
すごく長いスパンでみると
最終的には全てがUTF-32になって
文字コードに関する不毛なおしゃべりは
完全に幕を閉じるのですか?

797 名前:login:Penguin mailto:sage [2006/12/21(木) 19:19:41 ID:wjvIP/QZ.net]
>>785
あの会社が出しゃばるから、いつまでたっても不毛

798 名前:login:Penguin mailto:sage [2006/12/21(木) 22:22:41 ID:dDikwqgK.net]
>>785
そうなるといいな。無駄な労力がいらなくなる。

>>786
Mではじまる、あの会社…そこでなぜSJISを捨てない!
大事な大事な

799 名前:login:Penguin mailto:sage [2006/12/22(金) 00:37:09 ID:aDJUSHh4.net]
>>785
宇宙文字が入り始めて、4バイトで表現できなくなります。


800 名前:login:Penguin mailto:sage [2006/12/22(金) 11:48:08 ID:G0cOpVYD.net]
>>780
UTF-8にしたらパケット増えるだろ []
[ここ壊れてます]

802 名前:login:Penguin mailto:sage [2006/12/23(土) 09:16:11 ID:5Xj0fFj9.net]
今やmp3のタグにもShift_JISが紛れ込んでいるわけで…

803 名前:login:Penguin mailto:sage [2006/12/23(土) 10:05:25 ID:pzaVswcy.net]
>>790
SJISじゃ表せないタイトルがたくさんあるから、
ID3にSJIS使おうと思ったこと無いな。



804 名前:login:Penguin mailto:sage [2006/12/23(土) 21:00:40 ID:aO2nlgGd.net]
>>791,792

Windows でやるとMP3タグにSJISが入る。
それを
Linux に持ってくると見事に文字化けする。

頭に来たので、英語にした。



805 名前:login:Penguin mailto:sage [2006/12/23(土) 23:16:35 ID:i3HpvIwE.net]
>>792
昔それを自動化するスクリプトをkakasi使って書いたことがあったな。

806 名前:login:Penguin mailto:sage [2006/12/24(日) 00:56:18 ID:3db5c+Cj.net]
Windowsでもソフト選べば。WMPだとSJISだがたとえばiRiver PlusなんかはUTF-16

Linux上ではEasyTagでSJISのタグをUTF-16に一括変更できる。
設定→ID3タグの設定→ID3タグを読み込む際に...をSJISにし
書き込みのほうはチェックつけないでおいて
ファイル読み込み、使わないタグを一括変更して書き込み、でおk

ポータブルプレーヤーがID3タグSJIS仕様の場合はSJISに甘んじるしかないが

807 名前:login:Penguin mailto:sage [2006/12/24(日) 13:17:13 ID:hynwoyrt.net]
ID3タグって文字コード情報無いんだよな。
どうして仕様でUTF-8決め打ちにしてくれなかったのか…

まあ、Unicodeフル装備フォントをmp3プレイヤーに装備するのも厳しそうだけど…

808 名前:login:Penguin mailto:sage [2006/12/24(日) 13:18:41 ID:hynwoyrt.net]
>>794
UTF-16は欧米では採用されづらいので、
プレイヤー側の標準にするのは厳しいと思う。

809 名前:login:Penguin mailto:sage [2006/12/25(月) 00:41:38 ID:keSIekGY.net]
>>795
id3v2 は最初から ISO-8859(-1) か UTF-16 しか使えませんが。最近は UTF-8 も使えるらしい。
ゴミクズプログラマーが Shift_JIS 使い出したのが運の尽き。
ゴミクズ windows プログラマーはゲイツに汚染されてるから規格を無視して、
俺様規格をデファクトスタンダード化するのが好きらしい。首吊ってしねばいいのに。

810 名前:login:Penguin mailto:sage [2006/12/27(水) 17:28:50 ID:6RYeBCIk.net]
id3v1はiso-8859-1しか使えないことになってるんで、日本語入れること自体
規格違反。

でもそうも言ってられないからなんとか日本語を入れるわけだけど、id3v1タグ
には30バイト縛りがあるから、漢字1文字3バイトになるUTF-8より2バイトの
SJISの方が好ましい。漢字1文字2バイトならUTF-16でもそうだけど、こいつは
NULL terminationの問題があるし、本来のiso-8859-1すら2バイトになるからダ
メだな。

id3v2は2.4からUTF-8が使えるようになったけど、v1時代の悪習というか必要悪
を引きずって、エンコーディング設定をiso-8859-1にしつつSJIS埋め込む習慣
がまだ残ってる。こうしておくとv1でSJISをサポートしていたアプリケーショ
ンが簡単にv2対応できたせいだと思うが。

今後はid3v2 2.4でUTF-8を使ってタグ付けするのがいいと思う。でもこれはこ
れでUNIXとWindows間で運用すると「−」や「〜」のコードポイントが違うって
問題があるんだよね…


811 名前:login:Penguin mailto:sage [2007/01/05(金) 00:22:04 ID:77ZVIsGx.net]
なんかもうutf-8でいい気がしてきた。

812 名前:login:Penguin mailto:sage [2007/02/16(金) 10:17:07 ID:m44+LFvr.net]
utf-8でいいよ。。。

813 名前:login:Penguin [2007/03/20(火) 04:42:28 ID:cCWh38qs.net]
LinuxをEUCで使ってて、ファイルとか全部こっちにEUCに変換して移動したのに
UTFが標準になるとまた変換・・・・。めんどくせー
EUC



814 名前:ィUTF変換って簡単にできるもん?

調べずに書き込みですが。
どちらにせよ世界標準をきめてほしい
[]
[ここ壊れてます]

815 名前:login:Penguin [2007/03/20(火) 05:17:27 ID:QTIV+Di9.net]
EUCはSJISに戦略上すでに負けたんだよ。
UnicodeだってM$の妨害工作が進んでいる。
妨害工作に負けないためにもUnicodeを使おう。「

816 名前:login:Penguin mailto:sage [2007/03/20(火) 13:57:32 ID:8RTW38tV.net]
ハァ?MSは積極的にUnicode使おうとしてるじゃねえか。
WindowsのAPI見てみろ。全部Unicode対応版と非対応版用意してるだろ。

817 名前:login:Penguin mailto:sage [2007/03/20(火) 17:37:59 ID:QTIV+Di9.net]
MSのUnicodeは規格詐称

818 名前:login:Penguin mailto:sage [2007/03/20(火) 17:50:56 ID:QTIV+Di9.net]
詐称されたUnicodeを量産することにより、
統一的なコードという意味が薄れることを狙った妨害工作であることは明白。

819 名前:login:Penguin mailto:sage [2007/03/20(火) 21:43:46 ID:wwQdJnDl.net]
>>803
>全部Unicode対応版と非対応版用意してる
ここが一番ダメだろ。

820 名前:login:Penguin [2007/03/20(火) 21:57:01 ID:zimavaCD.net]
ファイル&通信用テキストデータ:UTF-8
プログラム内部テキストデータ:UTF-32
データベース:該当なし

もうこれでいいよ

821 名前:login:Penguin [2007/03/20(火) 23:14:28 ID:U9VKhUQU.net]
エンドユーザーコンピューティング?

822 名前:login:Penguin mailto:sage [2007/03/21(水) 01:39:52 ID:g+VVAw+0.net]


823 名前:login:Penguin mailto:sage [2007/03/27(火) 22:40:21 ID:kV81QqyL.net]
UCS4そのまま



824 名前:login:Penguin [2007/04/06(金) 15:07:47 ID:O0jpXZyJ.net]
これ何?
www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utfcp2.htm

825 名前:login:Penguin mailto:sage [2007/04/07(土) 17:48:14 ID:NQ39bQ/l.net]
M$はWebDAV(を使ったファイル共有・曰くwebフォルダ)でファイル名にSJISを押しつけた時点で
fuckin'としか言えない。

826 名前:login:Penguin mailto:sage [2008/03/08(土) 04:20:43 ID:JmLt0UM1.net]
/ ノ \
|  ( ・)(・)   糞スレ立てるなよ
|  (_人)         
ヽ   ノ\  \  
/   \  \  \  
|   |ヽニつ \  \

827 名前:login:Penguin mailto:sage [2008/03/08(土) 12:40:41 ID:c99zx9ZT.net]
>>812
本体に輪をかけて日本法人が馬鹿だから。

新しいプロトコルではShift_JIS捨てろよ…

828 名前:login:Penguin mailto:sage [2008/05/02(金) 14:32:57 ID:rhaAAtuk.net]
日本法人は開発に関わらせてもらってないでしょ

829 名前:login:Penguin mailto:sage [2008/09/07(日) 22:18:32 ID:0tXL853E.net]
ume

830 名前:login:Penguin mailto:sage [2008/12/06(土) 16:53:13 ID:Gw0MnEoY.net]
保守

831 名前:login:Penguin mailto:sage [2008/12/10(水) 07:08:24 ID:eUN1lGcu.net]
>>815
OfficeのUnicode化したの日本人だよ。日本法人所属の。

832 名前:login:Penguin [2009/02/05(木) 02:50:55 ID:8qsoAyKr.net]
   -‐'´ ̄ ̄ ̄`ヽ  常識的に考えてきめぇw
  //, '/レ/ `ノヽ ヽ
 〃 {_{ .ノ    ヽ \リ   -‐'´ ̄ ̄ ̄`ヽ、
 レ!小l(●) (●) |リ  //, '/レ/ `ノ \ ヽ
 | | |∂ (__人__) |  〃 {_{ ノ    ヽ \ ヽ おい見てみろよ
 レ|∬   `)  (´  |  レ!小l (●)  (●) ヽ リ このスレ何年やってるんだおw
   |    `ー'   }  | | |∂. (__人__)   ヽリ
   ヽ       }  レ|∬    )  ( ´   .| 
    ヽ     ノ   .\ _.  `ー'   /
   /      ヽ   /    ⌒    `ヽ、
  /         ヽ, ./  .     ,9mー )
  /  /      }  | .|  |     `ーー‐'゙
 .|  .{.      .|  | ヽ、 \       |
 .|  .|.      .|  |   |\ ヽ     .ノ

833 名前:login:Penguin mailto:sage [2009/02/05(木) 05:44:27 ID:xTR1r/lc.net]
ネットで共有するものに、Shift_jisなんてロカールなもん使うなよな



834 名前:login:Penguin mailto:sage [2009/03/07(土) 22:26:10 ID:TIxgdGj/.net]
お前ら、UTF-16777214作っちまえyo

835 名前:login:Penguin mailto:sage [2009/03/12 ]
[ここ壊れてます]

836 名前:(木) 22:31:28 ID:OX16iZFh.net mailto: >>819
クソワロタ
[]
[ここ壊れてます]

837 名前:login:Penguin [2009/06/09(火) 03:34:45 ID:klQXMFF3.net]
文字コードなんて一切気にしないアルファベットしか使わないアメリカ人がこれほど憎らしいと思ったことはない。
日本の優秀なプログラマの作業時間がどんだけ文字コード問題にとられてるかと思うと・・



838 名前:login:Penguin mailto:sage [2009/06/09(火) 10:39:33 ID:0kTzqpNh.net]
日本がm17nで全世界に行った貢献は大きいよ。
l10nだってそのまま台韓中へ持っていけたし。
アメリカは長い間文字種が少ないことに悩まされたしね。

839 名前:login:Penguin mailto:sage [2009/11/26(木) 21:27:37 ID:3jteQe9W.net]
もうみんなUTF?

840 名前:login:Penguin mailto:sage [2009/11/27(金) 14:09:14 ID:fIW1i1JF.net]
なんだかんだ utf-8 になっちゃったかなぁ。


841 名前:login:Penguin mailto:sage [2009/11/27(金) 17:47:40 ID:J+poQp1j.net]
ファイル名の256バイト制限を早くどうにかしてほしい
英語圏の人は十分なんだろうけど
utf8じゃ漢字85文字ぐらいで限界orz

842 名前:login:Penguin mailto:sage [2009/11/30(月) 04:21:21 ID:WdMtYva5.net]
EUCボクメツ委員会のお陰で今はutf-8が主流になったのか……。

843 名前:login:Penguin [2009/12/27(日) 02:33:32 ID:uXXaO/Ug.net]
1:従来のC言語を使うのを止める。
  特にヌルターミネーティッドストリングは廃止する。
2:C言語に極めてよく似た言語で、文字型はCharだが4バイト固定長とし、
  8ビットのデータ型にはByteを採用する。
3:Linuxもどきを4バイト固定長文字ベースでインプリメントしなおす。



844 名前:login:Penguin mailto:sage [2010/01/06(水) 15:00:04 ID:bcswWDU1.net]
stdintつかって、charを1バイトデータとして使わなければいい

845 名前:アジェグ4倍 ◆4xAJeG.COM mailto:chage [2010/01/19(火) 07:55:13 ID:0s2pP4ni.net]
CをやめてC#を使えばいいわけだな。

846 名前:login:Penguin mailto:sage [2010/01/19(火) 08:03:55 ID:uNv0sOJ4.net]
UTF-8-MACボクメツ委員会早くきてくれー

847 名前:login:Penguin mailto:sage [2010/01/21(木) 23:59:40 ID:jxJOI//C.net]
なんでMac OS Xはあんなにアホなんだ。
中途半端な実装しやがって。

848 名前:login:Penguin mailto:sage [2010/01/22(金) 07:24:00 ID:O/ThLavd.net]
Macが他の世界のことを気にかけるはずがないじゃないか

849 名前:login:Penguin mailto:sage [2010/01/22(金) 09:27:22 ID:LdgHn16W.net]
板違い

850 名前:login:Penguin [2010/08/04(水) 23:11:51 ID:U9KLESfl.net]



851 名前:login:Penguin mailto:sage [2010/09/05(日) 07:21:20 ID:roYY7qMI.net]
ここも役目を終えてるね
10年近くも続いておつかれさん


糸冬 了

852 名前:login:Penguin mailto:sage [2010/09/05(日) 19:42:42 ID:VmDqQ4xZ.net]
ume

853 名前:login:Penguin mailto:sage [2010/09/08(水) 06:29:03 ID:jTqaGLmc.net]
ume



854 名前:login:Penguin mailto:sage [2010/09/09(木) 15:08:43 ID:KDtoTDF7.net]
ume

855 名前:login:Penguin mailto:sage [2010/09/10(金) 06:26:08 ID:cb7e92rK.net]
ume

856 名前:login:Penguin mailto:sage [2010/09/11(土) 14:09:25 ID:1ReKt8Kp.net]
良スレだったのでdat落ちしない程度の保守にして、長持ちさせてください。

857 名前:login:Penguin mailto:sage [2010/09/11(土) 14:59:28 ID:i5+I+mnj.net]
良スレ?

858 名前:login:Penguin [2011/01/27(木) 17:23:48 ID:5NbOcYaZ.net]
age

859 名前:login:Penguin mailto:sage [2011/05/01(日) 23:30:01.52 ID:O311CsWE.net]
保守

860 名前:login:Penguin [2012/01/06(金) 22:18:58.66 ID:fmueWaMS.net]
            _
        r-、' ´   `ヽr-、
       ィ7 /l: ハヽハ トヾ    駄スレを沈めることはこの俺が許さん!
        '|l |'´_` ´_ `| ||    信念に基づいて行動する、
        | |´ヒ}   ヒ}`! l |   それを人は正義と言う。
   __ノ゙). 从 l,  _'_.  |从   今俺が行ってることは、上げ荒らしではないっ
 ,_'(_ ノ

861 名前:_ヽ ヾl.> - ,イ;リ     正義という名の粛清だぁ!
 { f:テ} {'f:テ}',/\ヽ--//ヽ    
 ヽ,r─‐ 、ィ .、、 i l>Y<! i '、    バーニング!
 / iゝ_ノ iヽ /l   |l  l   ',
 lンヽ/ムノじ
[]
[ここ壊れてます]

862 名前:login:Penguin mailto:sage [2012/01/07(土) 16:36:13.56 ID:OLGRDbhD.net]
JISより先にEUCが逝くとは思わなかったなぁ。
SJISが残るのは規定路線だけど。

一般ユーザーで関係しそうなのは地デジのEPGくらいか。


863 名前:login:Penguin [2012/01/11(水) 00:13:23.15 ID:m34kHrGu.net]
Acacia k62ptju
arise in stability
Ashley Scared The Sky
ARTEMA
Before My Life Fails
bilo'u
break your fist



864 名前:login:Penguin [2012/07/09(月) 16:57:38.04 ID:oU9cb4og.net]
Web標準でUbuntuでも使われてるUTF-8に決まりでしょ!
EUCは時代遅れ
古いアプリ使おうと思ったら日本語がEUCで文字化けして使えなかったし・・・

Shift-JISは世界では通用しない
Windowsとガラケーでしか使われてない


865 名前:login:Penguin mailto:sage [2013/04/13(土) 11:46:49.66 ID:uED8RWvO.net]
MidoriがブラウザのくせにEUC_JPにまともに対応する気なくてワロタ
SJISは下位互換性をWindowsが捨てない限り盲腸みたいに残り続けるだろうね

866 名前:login:Penguin mailto:sage [2013/04/14(日) 00:19:55.54 ID:oKaCZuqQ.net]
ところで現行バージョンでEUC-JPなディストリってどれだけあるんだ

867 名前:login:Penguin mailto:sage [2013/04/14(日) 11:56:05.92 ID:1Vz/BILS.net]
ja_JPロケールのデフォルトの文字エンコーディングがEUC-JPって意味か?

868 名前:login:Penguin mailto:sage [2013/04/14(日) 11:57:44.51 ID:1Vz/BILS.net]
逆に>>1の趣旨に従って、Shift_JISがちゃんと使えるのはどのくらいあるんだ?
端末だけじゃなくてawkとかgrepもSolarisみたいに対応しているのは。

869 名前:login:Penguin mailto:sage [2013/04/14(日) 12:24:46.13 ID:a+7ss7BE.net]
自分で試してみればよい

初期状態でSJISが選択できるディストリはそうないだろうが
一度rootで
localedef -f SHIFT_JIS -i ja_JP ja_JP.SJIS
やっておくと使えるようになる
基本コマンドはディストリによらず同じ物を使っているだろうから
設定さえちゃんとやればそんなに大きな差はないのでは

870 名前:login:Penguin mailto:sage [2013/04/14(日) 12:46:44.14 ID:qqVfLqQY.net]
それじゃダメなんだよ。
全くわかってないな。

871 名前:login:Penguin [2014/08/10(日) 11:10:33.33 ID:vCrrE681.net]
★2ch勢いランキングサイトリスト★

☆ +ニュース板
・ 2NN
・ 2chTimes
☆ +ニュース板新着
・ 2NN新着
・ Headline BBY
・ Unker
☆ +ニュース板他
・ Desktop2ch
・ 記者別一覧
☆ 全板
・ 全板縦断勢いランキング
・ スレッドランキング総合ランキング
☆ 実況板
・ 2勢
・ READ2CH
・ i-ikioi

※ 要サイト名検索

872 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<244KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef