[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2ch.scのread.cgiへ]
Update time : 04/11 14:45 / Filesize : 124 KB / Number-of Response : 537
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

SJIS撲滅運動



1 名前:ほげ [02/01/30 04:51.net]
UNICODEかEUCに統一してほしい。今現役でSJISつかってるのMSくらいだし。MacもOS-XからほぼEUCとUNICODEだし。
MP3のIDタグが統一できなくて困る!
SJISで書かれたperlとか置かれたら管理しにくくて困る!
タマにはUNIXでも日本語ファイルを堂々とつかってみたい!




291 名前:281 mailto:sage [03/10/13 15:22.net]
>>284
> そういうのは上のレイヤーでやるべきことで、文字自身にもたせるものではないんです。
> 所詮、フォントを変えただけで消し飛ぶようなものですから。

もちろん漏れも技術者のはしくれなんで、そういう「理想論」は理解できる。
# つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ただ、そういう事情を理解した上で、
「結局、『理想論』は理想論でしかない。」
と言いたいわけよ。

292 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
>>285

> # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
JISは読みましたか?

> ただ、そういう事情を理解した上で、

全然理解してないですね。

> いやあ、スマンスマン。
> 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。

こんなことを書く程度ですし。

293 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
手書きでも半角カタカナとか全角英数字を浸透させちゃえばいいんだよ。

294 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:39.net]
四半角仮名や四倍角英数字が Unicode に入るのはいつですか?

295 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:47.net]
>>286
かっかし過ぎ。

296 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:59.net]
>>289
かっかしてるわけじゃなくてね、>>281 程度の認識しか持たない人が
しばしば愚かなことを書くからガッカリしてるの。>>281 程度の話は、
今まで数え切れないほど行われてきた。>>276-279 を読めば、こちらが
もっと上のレベルの話をしたいってことは分かると思うんだけどね……

本当は >>276 の人と意見を交換したくて、がんばって長文を書いたんだけど
出てこないかなぁ。

297 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:01.net]
>>290
> もっと上のレベルの
レイヤは上かもしれないが
レベルは上じゃねーよ。
過去の実装を無視して規格だけこねくりまわしても無意味。

298 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:03.net]
>>291
そういうのは規格を読んでから言ってね。

299 名前:292 mailto:sage [03/10/13 16:11.net]
> そういうのは規格を読んでから言ってね。
こんなことを書くと、またアホが「規格規格とうるさい原理主義者」とか言いかねないので
補足しておく。まともな技術者なら、なにかを実装したりする場合一次情報にあたるのは
当然のことなんだ。たとえばHTMLを扱うならW3Cの勧告を読むのは当然だし、もしかすると
HTTPのRFCを読まないといけないかもしれない。
こちらが言っているのは、「規格は至上のものである」ということじゃなくて、日本語の処理を
するなら、読んで当然だってことなんだ。



300 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:13.net]
厨な質問ですいませんが、たとえば、2ちゃんねるなんかは、
「半角カナ」と「全角カタカナ」の使い分けが当然のように行われているわけですが、
これは「過去との互換性が要求されるとき」に合致するのではないの?

301 名前:291 mailto:sage [03/10/13 16:31.net]
「だけ」と書いたのが読めんのか。

302 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:39.net]
>>295
だから、規格さえ読んでない人は論外なんだって。

303 名前:281 mailto:sage [03/10/13 17:28.net]
>>286
> > # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。
> ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
> JISは読みましたか?
当然読んでいる。
技術者として、JISやW3Cなどの規格を読むのが
最低限必要なことなのは言われなくてもわかっている。

おそらく、>>286はHTML3.2などで(規格に厳密に従った場合)
日本語を使用することができないってことなどを言いたいんだと思うが、
そういう国際化の規格が決まる前から多くの実装で
日本語を含むHTMLを扱うことができていた。

規格ってのは、その実装ができる前から(もしくはリファレンス実装の作成と並行して)
作られるものもあるが、現状の実装を後追いする形で決まるものも多い。
そのような実装の後追いで決まった規格を使う場合は、
過去の実装や慣例についても十分考慮する必要がある。

特に文字コードのように、「非技術者」に対する影響も非常に大きい分野では、
「規格で推奨されていないから」という理由だけで
過去の慣例を排除するのは、現状を見ていない技術者のエゴでしかない。
# 完全に技術的分野で閉じた話なら構わんと思うがね。

> > いやあ、スマンスマン。
> > 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。
> こんなことを書く程度ですし。
じゃあ、>>281のはじめの一文は
「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
とでも書くべきだったのか?
俺は「2chでの慣習」に従った書き方をしているだけだ。

304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 17:55.net]
>>297
> そのような実装の後追いで決まった規格を使う場合は、
> 過去の実装や慣例についても十分考慮する必要がある。

はい、そのとおりです。
しかしながらまだその先があります。
たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
ようするに過去の実装より、規格の方を重視すべきなのです。
もちろんこれは原則にすぎず、他のシステムとやりとりである以上、可能な限り
データ交換可能なものにするべきです。

つまり、「規格より過去の実装の方が重要」という点が間違っているということ
です。規格の重みづけをする場合、過去の実装以外にも考慮しなければいけない
要素がある、ということ。

> 「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
> とでも書くべきだったのか?

「煽り」とか書いてる時点で人間的にどうかと思います。
それは置いておくとしても、

> 俺は「2chでの慣習」に従った書き方をしているだけだ。

これはただの責任転嫁ですよ。

305 名前:281 mailto:sage [03/10/13 19:09.net]
>>298
> たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
> る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
> また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
> このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
> ようするに過去の実装より、規格の方を重視すべきなのです。

それが現実を見ていない理想論に過ぎないと言いたいわけ。
GNU libiconvにcp932パッチがあるのは何故だ?
過去の実装や慣習を無視して新たな規格や実装を作っても、
それは新たな混乱を招くだけ。

306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:00.net]
>>299

ちゃんと >>298 を読みましたか?
あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
低すぎるといっているのです。「過去の実装との互換性」以外にも、規格
の重みづけの要素はあるんだよ、と。

> GNU libiconvにcp932パッチがあるのは何故だ?

Microsoftが他者(他社・Unicodeコンソーシアム)と協調してShift JISの
マッピングテーブルを決めるべきところを、無視して独自に実装したためです。
Microsoftのテーブルは個人的には現実的だと思っていますが、まさに

> 過去の実装や慣習を無視して新たな規格や実装を作っても、
> それは新たな混乱を招くだけ。

こういうことです。

307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:58.net]
そういえば、どっかの携帯会社が規格の予約領域を勝手に使っていましたね。

308 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:17.net]
で、何番の発言が AoiMoe なの?

309 名前:281 mailto:sage [03/10/13 22:42.net]
>>300
> あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
> 低すぎるといっているのです。

そうか? 別に規格をないがしろにしている気はないのだが。

ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の
文字のグリフが、JIS X 0208の部分のものの半分の横幅になると
期待すること」および「そういう表示のされ方を期待して、
JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は
慣習として既に広まっていることだし、
今更目くじらを立てることではないと思っているのだが。

> > GNU libiconvにcp932パッチがあるのは何故だ?

これは俺の表現がまずかった。
俺が言いたかったのは、「何故cp932パッチが本家に統合されずに
別々に配布されなきゃならんのか」ってこと。

確かに>>300の言う通り、cp932のマッピングテーブルはMicrosoftが
勝手に決めてしまったもの。そのためGNU libiconv本家は
cp932パッチの統合をかたくなに拒んでいる。
しかし、日本でiconvを使う場合、cp932のサポートは
もはや必須と言えるため、日本の多くのユーザが
GNU libiconvにわざわざcp932パッチを当てて使っている。

規格至上主義に走り過ぎると、かえってユーザの利便性が
損なわれることがあるって例のつもりだったんだけどね。



310 名前:281 mailto:sage [03/10/13 22:46.net]
>>302
少なくとも俺は違うぞ。(w

311 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:48.net]
>>303
> 確かに>>300の言う通り、cp932のマッピングテーブルはMicrosoftが
> 勝手に決めてしまったもの。そのためGNU libiconv本家は
> cp932パッチの統合をかたくなに拒んでいる。

少し前に、libiconvのCVSの方に入ってます。


312 名前:281 mailto:sage [03/10/13 22:52.net]
>>305
> 少し前に、libiconvのCVSの方に入ってます。

おお、それは良かった。
1.9.1にも入らなかったから、もうダメかなとあきらめていたんだけど。

パッチのマージに尽力された方々にこの場を借りてお礼を申し上げます。

313 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:34.net]
>>303
> ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の
> 文字のグリフが、JIS X 0208の部分のものの半分の横幅になると
> 期待すること」および「そういう表示のされ方を期待して、
> JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は
> 慣習として既に広まっていることだし、

広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか?
そんな期待はフォントが違うだけで無意味になる程度のものです。

> 今更目くじらを立てることではないと思っているのだが。

やれやれ……
あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。

予想では今後、Unicodeへの移行によってさらに種は増えるでしょう。

・CJK間で、かなり異なったグリフの漢字が統合されていることによる問題。
上のレイヤーで解決すればいいのですが(たとえばHTMLのlang指定)、
安易な方法としてUnicodeの言語タグを使って実装されてしまう。
言語タグの使用は推奨されていません。

・JIS X 0208の和字間隔、いわゆる全角空白の扱い。
存在が微妙なので、実装のされ方に互換性が無くなる可能性があります。

> 規格至上主義に走り過ぎると、

不適切な例でしたね。こちらは至上主義じゃないって言ってるのに。

予想(>>290)どおりの愚かな展開(平行線)になってしまった。
規格自身について話を振っているのに、「規格なんて二の次だ」なんて的はずれな
返事を返すなんて……。もうちょっと認識のある人の意見を望みます。

314 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:44.net]
>>281
> 技術者の一方的な都合で「なかったこと」にすることはできない。

日本文藝家協会の方ですか?

315 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 01:35.net]
>>307
> 返事を返すなんて……。もうちょっと認識のある人の意見を望みます。
気持ちはわかるが、そういう書き方をするから不毛なやり合いになる。

316 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 12:42.net]
>たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
>る可能性があるわけです。改訂版では過去との互換性があるとは限りません。

日本で作られたソフトは、まず無いと思う。
今までそれが行われていれば、今のような状況とは違ったと思うが。

もっとも、JIS X 0208:1983 やら、うにコードのように、
規格自体が腐ってる事が多い

317 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 13:12.net]
>>307 あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。
どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事ができるでしょうか。

今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では
否定しているという話にすぎない訳です。(その後は主観の争いになってますが…)
JISは中国のGB18030とは違い、何の強制力もありません。「いけません」と言ったところで、
結局はどこかに落ち着かなければ使い物にならないのが現実ですよね。

318 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 14:21.net]
>>311
とはいっても、>>307が言うように、
fullwidth/halfwidthは過去のものにすべく努力していくべきだろ?

319 名前:フグ/ハリセン本について mailto:sage [03/10/14 16:48.net]
フグ/ハリセン本について

CJKV日中韓越情報処理
Ken Lunde著
2002年12月発行 12,800円
www.oreilly.co.jp/BOOK/cjkv/

Data Table & Sample Code
examples.oreilly.com/cjkvinfo/

Ken Lunde's Home Page
www.praxagora.com/lunde/



320 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 04:31.net]
>>311
> 今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では
> 否定しているという話にすぎない訳です。

そ、それで終わりですか?
あの話は掘り下げるところがまだまだあると思うのですが……

> (その後は主観の争いになってますが…)

人の意見・主調なんてすべて主観です。問題はその妥当性。

> どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事が
> できるでしょうか。

普通、実装をするまえに規格を洗って、それを整理しますよね。
それをおざなりにして、いきなり実装をしてもまともなものは出来ないでしょう。
過去の実装との互換性があればいい、という適当な考えならいざしらず。

> JISは中国のGB18030とは違い、何の強制力もありません。

強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。
例えばある通信プロトコルで、RFC違反のデータを送受信することは簡単です。互換性
などの理由で、やらざるをえないこともあるでしょう。しかしそれは基本的には「やるべきで
はない」のです。理由は分かりますよね?

321 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 23:26.net]
>>314
>強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。

「使うべきではない文字」ってのを誰がどうやって決めるかっていうと、それは
情報の送り手と受け手、両者の合意によるわけだ。
「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける
手間を省くためのものだし。

322 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 02:21.net]
通信かよ!?

323 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 07:44.net]
通信だよ

324 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 12:34.net]
問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、
いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。

325 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/18 20:41.net]
いまだにJEFつかってる銀行なんか多いくらいなので、、、

やっぱ変更せずに走らせるケースが多いのでは?


326 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:00.net]
> 嘘があったり
「使うべきでない」を「使ってはいけない」と表現したり
まさかMUSTとSHOULDの区別も付かないわけじゃないですよね
> 重要なことが抜けてたりするので
「過去との互換を目的として」とかの例外事項を無視して
「使ってはいけない」としか書かなかったり
しかも知ってて抜かすんだからより悪質ですね

327 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:03.net]
文字コードが通信が終わったら端から消えていくなら
実装を変えればそれで終わりだろうけど実際には
データとしてどんどん蓄積されていくから途中で変えて
はいおしまい、過去のデータは全部捨ててください
なんて簡単に言えるわけない。

328 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:43.net]
そういえば>>232の何が結局「嘘」なのかも説明してませんね。

329 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:06.net]
> 「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける
> 手間を省くためのものだし。

はい、そのとおりです。

> 問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、
> いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。

実装の話が好きですね……。
さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの
くだりがあるわけだし。したいのなら止めませんが。




330 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:08.net]
> 「使うべきでない」を「使ってはいけない」と表現したり
> まさかMUSTとSHOULDの区別も付かないわけじゃないですよね

「使うべきではない」ものを、相当の理由なく使おうとしている場合、
「使ってはいけない」と伝えても問題ないでしょう。

> 「過去との互換を目的として」とかの例外事項を無視して
> 「使ってはいけない」としか書かなかったり
> しかも知ってて抜かすんだからより悪質ですね

また低レベルな、平行線の話を繰り返したいのですね。

> はいおしまい、過去のデータは全部捨ててください
> なんて簡単に言えるわけない。

どうして捨てる必要があるのでしょうか?
新規で使わなければいいだけなのに。

> そういえば>>232の何が結局「嘘」なのかも説明してませんね。

>>277-279 を読みましたか? 読んでも分かりませんか?
そこに含めてあるんですが……

331 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:55.net]
>>324
> 新規で使わなければいいだけなのに。
"今まで使えてただろ! どうにかしろ !"

332 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:56.net]
> "今まで使えてただろ! どうにかしろ !"

そんな人いますか?

333 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 01:28.net]
とりあえず、既存の規格を無視するやつをなんとかしろよ。
docomo とか。

334 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 07:05.net]
わざと無死してるわけですが

335 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/26 03:22.net]
>>326
います


336 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:01.net]
> 「使うべきではない」ものを、相当の理由なく使おうとしている場合、
誰がそんなことしてるんですか?

> また低レベルな、平行線の話を繰り返したいのですね。
そもそも>>272が低レベルな煽りから始まっているのです。
そういうのを自業自得といいます。

> どうして捨てる必要があるのでしょうか?
新しい実装で読めないからです。

337 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:04.net]
> さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの
> くだりがあるわけだし。
それこそがまさに「相当の理由」でしょうが。

338 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:11.net]
> >>277-279 を読みましたか? 読んでも分かりませんか?
> そこに含めてあるんですが……
順番に検証してみようか。
>>276
リンク先のどこにも「JIS X 0201のカタカナ」が特殊なカタカナだ
なんて一言も書いてない。自分以外の愚民は使うべきでないものを
使いたくて使いたくてたまらないから「JIS X 0201のカタカナ」と
書かれていたらそれは即特殊な意味を持たせていてそれ以外の
解釈はありえないとか妄想したけりゃしてもいいけど。

339 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:16.net]
> ISO-2022-JPで
リンク先は「ISO-2022-JPで」使うなんて話はしていない。
7bit-JISの話なら出てくるけど。
> EUC-JP
> Shift JIS
そもそも「使ってはいけない」が嘘だから論外



340 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:20.net]
> Unicodeの場合:
リンク先にはUnicodeの話などまったく出てこないが。
そもそもJIS X 0201の話をしてるのにUnicodeが出てくること自体
ヘンだとお前さんが自分で言ってるだろ。
>

341 名前:勘違いの典型は、「UnicodeでJIS X 0201の片仮名は使えますか?」などと
> いう質問で、

総論:
リンク先とは無関係な、誰に言ってるのかも不明な論を
一方的にまくし立ててるだけ。
> 6:一見関係ありそうで関係ない話を始める

で、どこが嘘なの?
[]
[ここ壊れてます]

342 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:26.net]
> 広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか?
> そんな期待はフォントが違うだけで無意味になる程度のものです。

区別しない実装が存在することは区別しない慣習が存在することの
否定にはならない。単に区別しない場合もあれば(規格上区別する
理由はないんだから当然だが)慣習上区別する場合もあるという
だけのこと。

だいたい使い分ける慣習が本当に存在しないならあんたの
大好きな規格書はありもしない慣習との互換性に配慮するために
わざわざページを割いてるの?

こんな初歩的な詭弁にすらツッコミが入らないようじゃ
確かにレベル低いかもね

343 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:40.net]
> 区別しない実装が存在することは区別しない慣習が存在することの
訂正
区別しない実装が存在することは区別する慣習が存在することの

344 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 20:50.net]
とりあえず引用トークはムカつくっつーことだけは
よ〜くわかった。

345 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 21:13.net]
>>337
> とりあえず引用トークはムカつくっつーことだけは
fjを思い浮かべるからかな。


などと引用してみるテスト。

346 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:53.net]
>> また低レベルな、平行線の話を繰り返したいのですね。
>そもそも>>272が低レベルな煽りから始まっているのです。
> そういうのを自業自得といいます。

責任転嫁をしないように。
低レベルな話を持ち込んだのは、あなた自身の責任です。

さて、>>330-336 には、簡単に分かる間違いがいくつかあります。

・認識不足による誤解・間違いが4つ
・引用部分とは関連のない話を持ち出して、返答しているのが1つ

それぞれどこでしょう。
>>330-336 の人は分からないでしょうから、他の方で結構です。
考えてみてください。

それから、>>330-336 を書いた人への課題も出しておきます。

>> ISO-2022-JPで
> リンク先は「ISO-2022-JPで」使うなんて話はしていない。
> 7bit-JISの話なら出てくるけど。

「7bit-JIS」とは?


347 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:57.net]
間違い探しクイズなんてしてないでハッキリ言う方が良いのでは?
と傍観者は思うのでした。

348 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 04:04.net]
死めよ。おぬーら。

349 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 18:58.net]
>>340

論理的思考が出来ない人間とのメタ議論は、しばしば発散するからです。




350 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 22:26.net]
>>341
はっきり言いすぎですYO!


351 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:18.net]
すんません! この系統に関してはドシロウトなんですが...
o コードセットとグリフの関係とか
o ウニコードとステートフル(ってゆうのか?)なコード体系の関係
とか
に関して, そこそこまとまった資料って, どこ参照すればええんで
すか?
# グリフの合理的指定方法があれば何とかなるもんちゃうの???



352 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:32.net]
>>339
手抜きせずに書いてやれよ。

>>276>>277-279 はあきらかに別人。

>>333-334>>272 の↓部分の補足であるものを、リンク先についての言及だと
曲解している。

>たいていの場合、JIS X 0201の片仮名用図形文字集合(いわゆる半角カタカナ)は
>使ってはいけない。ISO-2022(例外あり)もISO-2022-JPもShift JISもEUC-JPも
>UTF-8もUTF-16も。
>同様にJIS X 0208の一部の文字(いわゆる全角英数)も使ってはいけない。
>「?」や「/」のJIS X 0208の方もダメ。

>>335 に対しては、互換性が残されているのは、文字幅の慣習とは無関係。

あと >>272>>232 のリンク先について誤解していると思う。
あのページは誤りであることを承知の上で、JIS コード(と言われている文字コード)で
JIS X0201 の文字集合を使う方法を紹介している。
232氏はネタのつもりだったのでは。

353 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 01:59.net]
質問
jisx0213の文字って全部unicodeに反映されたの?

354 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 02:13.net]
されてない


355 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 10:49.net]
>>347
どの程度反映されてるんでせうか?それともまったく?

356 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 00:02.net]
補助漢字にある奴は全部あるでしょ。
丸付き数字のような合成文字系は全部拒絶されてんじゃない?

357 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:48.net]
丸付き数字系は全て追加されました。


358 名前:名無しさん@お腹いっぱい。 [03/11/02 01:55.net]
>>349-350
つーことは一部を覗いてほとんど入れられてるって事ですか。
ありがとうございました。

359 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:56.net]
sage忘れた…すいません。



360 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:59.net]
確か追加されてないのはひらがなとアクセント付きの発音記号だけだったと思う。


361 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 13:58.net]
Unicodeでの外字の扱いってどうなってんの?
使えんの?

362 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 16:55.net]
PUAでいいんじゃね?

363 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 22:55.net]
>>353
ひらがなってのは、'ん'+'゛'みたいなやつのこと?

364 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/06 17:00.net]
>>353
Unicode側の言い分では「全部入れた」ことになっているんだろうけどね。
「合成で済むだろゴルァ」って感じで。


365 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/08 11:28.net]
結局混乱を増しただけだと思うんだけどなー。
あぁ、日本以外じゃ困らんから、テキトーな国際化には役に立っとるんか。

366 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:35.net]
pc2.2ch.net/test/read.cgi/software/1044162360/
>>874
格納がしっかりしてれば文字コードが必ずSJISになり
どの文字コードで格納するか調べる必要も無いでしょう。

>>875
予想だろうがそれが根拠で問題だと『俺は』思う。
俺の思う理由を聞いておいてそれは無いだろう。

367 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:47.net]
>>876
その必要が有る人のみ守ってるだけでは?
普通は日本語使わないけどね。

>>877
殆どはASCIIで書かれてるからな。ASCIIはSJISで無いぞ。
稀に見かける日本語を使った書庫ではeucを使ってる。
でもSJISを使ってるのは見たこと無いとも書いたが。

>>878
作者は仕様を守るべきなんじゃない?
それが出来ないなら作らなければ良いだけ。
仕様を制定するのが自分なら殆ど負担は無いだろう。

368 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:19.net]
>UNIX上でも SJIS 使ったのしか見たこと無いね。
俺は無いな、少なくとも配布されてるものに関しては。

>仕様を制定したのと、UNIX版作ってる人は別人。
>同一人物でも仕様をコロコロ変えるのはどーかと思われ。
これは誤解を生んじゃったな。
lhaの事じゃなくソフトウェア作者の苦労の事を書いただけだから
その辺の事は分かってるし同意。

>仕様が無い場合という仮定の話なので文字コードは SJIS とは限らない。
格納をしっかりすれば仮定の話は何の意味も無い。



369 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:35.net]
>それらの書庫はファイル名に関する仕様を守ってる。
日本語ファイル名を格納してる書庫の話でしょうが。
ASCIIファイル名は日本語扱うときはSJISでって仕様を満たしている訳じゃない。

>必要がある人は自力で実装すれば良い、
>という事のどこに問題があるのかサッパリわからん。
それじゃぁ自力で実装する力の無い人、そもそもそんな事考えて無い人が作った
書庫は不正書庫になってしまうじゃないか。
大抵の人はlhaにそんな仕様が有る事すら知らないだろう。
何べんも書くけど守られない仕様は仕様の機能を果たさない。
仕様がしっかり守られるならば解凍時の文字コードも気にしなくて良い。



370 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:38.net]
>ファイル名に関する仕様が無い場合、
>UTF-8 でも SJIS でも EUC でも仕様的に問題なく「しっかり格納」できる。
lhaはSJISで格納すると言う仕様が有るんでしょ。勝手になくさないで。

371 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:59.net]
>ファイル名に関する仕様は満たしてる。
日本語のファイル名の話をしてるんだから・・・。
関係ない話を持ち出さない。

>何べんも書くけど仕様は概ね守られてる。
>例えば、信号無視する人間が延べで 5%居た場合、信号は機能を果たしてないのか?

たとえ話は嫌いだが、、、この場合その5%は必ず事故るわけだから信号の機能を果たしてるとは言いがたい。


372 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:30.net]
向こうで暴れてる困ったちゃんをどうにかしろよ

373 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:44.net]
lhaの書庫はパス名にShift JISを使うって仕様だったのか。知らなかった。
どこに書いてあるんだろう。

374 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 17:57.net]
>>365
ここで暴れてる困ったちゃんもどうにかしてください。

375 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 08:55.net]
>>366
昔のlhaのドキュメント

376 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 09:36.net]
>>368
Vectorにある吉崎氏の実行ファイルとソースのアーカイブ内には
そういう記述はみあたらなかった。
www.vector.co.jp/vpack/browse/person/an000224.html
「昔のlha」は持ってないしなぁ。

ただ、UTIL.Cにiskanji(c)というマクロがあって、それはShift JISを
想定しているっぽい。

#define iskanji(c) ((uchar)(c) >= 0x80 && (uchar)(c) <= 0x9f || \
(uchar)(c) >= 0xe0 && (uchar)(c) <= 0xfd)


377 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 11:18.net]
>>369
lha for UNIXの方だったかもしれん。
だったらそんなに昔じゃないなスマソ


378 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 15:56.net]
詳しくは知らんが、YosshiがSysopやってたflaboでは
過去ログ(LZHで固めた奴)にSJISファイル名使ってたような…

379 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:35.net]
いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
どっかでそれを仕様として確定したと思うんだよ。
それがlha for UNIX以前か以後かがよー分からん。



380 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:40.net]
よーわからんけどlha for UNIX以前か以後かって区分は重要なの?

381 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:57.net]
>>372
> いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
だろうね。

> どっかでそれを仕様として確定したと思うんだよ。
これが、「誰が」「どこで」確定したのか情報希望。

382 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 18:46.net]
よーわからんけど「誰が」はともかく「どこで」は重要なの?

383 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 23:01.net]
         ☆ チン     マチクタビレタ〜
                         マチクタビレタ〜
        ☆ チン  〃  ∧_∧   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
          ヽ ___\(\・∀・) <  「誰が」「どこで」確定したのか情報まだ〜?
             \_/⊂ ⊂_ )   \________
           / ̄ ̄ ̄ ̄ ̄ ̄ /|
        | ̄ ̄ ̄ ̄ ̄ ̄ ̄|  |
        | .愛媛みかん.  |/

384 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 23:06.net]
>>375
> よーわからんけど「誰が」はともかく「どこで」は重要なの?
必ずしも吉崎氏が策定する必要は無いんだよ。
仮に「LHA Open Group」でもいいわけだし。
そういう意味の「どこで」ってこと。

385 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/27 00:38.net]
>>377
> 仮に「LHA Open Group」でもいいわけだし。
それは「誰が」だと思うんだが…
まぁどっちでも良いけど。

ところで「LHA Open Group」って実在する組織なん?

386 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/27 00:40.net]
>>378
> ところで「LHA Open Group」って実在する組織なん?
いやー俺の脳内団体だよ。「誰が」だけだと「吉崎氏に決まってるだろ」と
なりかねないので書いたのだけれど、よけい混乱させちゃったみたいで
申し訳ない。

387 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/01 10:58.net]
過去の経緯としてはShift JISが仕様だったのかもしれないが、
# 補助漢字や第三/四水準はどうなっているのだ?
それだとASCIIな人と日本語な人以外は困るから、
アーカイブ内のパス名はUTF-16で保存することにして、
システムごと、あるいはロケールごとに、iconvして展開するのがいいんじゃないの?
アーカイブ形式に形式のバージョンを持てないの?

大体、今やWindowsやMac OS Xだって、
UTF-8のパス名持てるんだから、Shift JISのままじゃ困るんじゃないの?

388 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/01 11:06.net]
>>380
そこでなぜUTF-16。こういう場合はUTF-8だろう。

lhaは圧縮形式としてlh5, lh6, lh7などが選べたはず。
これが規定するレイヤーによっては、「lh8はUTF-8」という風にも

389 名前:
出来るだろうね。多分やらないだろうけど。
[]
[ここ壊れてます]



390 名前:380 mailto:sage [04/03/01 11:16.net]
>>381
追記。なぜ「やらない」かというと、lhaは歴史的な経緯では小型の
システム(DOS)で使われてきたし、現在もそういう風に使われている
(マザーボードのBIOSとかね)。ここでUnicodeをサポートために巨大な
変換テーブルを持たせるのは、lhaの方向性にあわないだろう。
そういうのが必要なら、もっと富豪なアルゴリズムを持つ書庫の仕様に
含めればいいのだ。

391 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 03:34.net]
>>380
> それだとASCIIな人と日本語な人以外は困るから、
日本人以外は使ってないので困らない。

> アーカイブ形式に形式のバージョンを持てないの?
持てません。

392 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 03:41.net]
>>381
> これが規定するレイヤーによっては、「lh8はUTF-8」という風にも
面白いアイデアだと思うけど、
全く問題無しってわけにもいかないと思うよ。

例えば この新仕様に対応してないバージョンで、
書庫->書庫で圧縮されたファイルコピーする際に
SJIS(元書庫)->EUC(中間処理用)->SJIS(先書庫) みたいな変換
食らった場合、元書庫で UTF-8 使ってると化ける可能性がある。

393 名前:381 mailto:sage [04/03/02 09:04.net]
おっと、382を書いたのは381だ。名

394 名前:O欄は間違い。 []
[ここ壊れてます]

395 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 09:27.net]
>>384
「規定するレイヤー」っていうのは、「lh5, lh6, lh7などが書庫の形式のレイヤーを
規定しているなら」って意味で書いた。でもどうやらファイル一つ一つの圧縮方法
にしかすぎないようだね。というわけで俺の案は没。理由は384の言うとおり。

396 名前:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ [04/03/05 10:17.net]
( ゚Д゚)<呼ばれた気がした

397 名前:名無しさん@お腹いっぱい。 [04/03/05 20:23.net]
>今現役でSJISつかってるのMSくらいだし。

NTはunicodeだろ。
むしろsjisもjisもeucも無くなれ
uncode以外のコードは要らん

398 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/05 20:57.net]
>>388はMarkus Kuhn

399 名前:名無しさん@お腹いっぱい。 mailto:sage; まぁ俺より金も名誉もあるけどな [04/03/06 14:12.net]
Markus キター。
アイツは頭がオカシイとしか思えん。



400 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/06 20:10.net]
388 が欲しいのは
「うんこーど」。
Markus とベクトルは違えど頭がオカシイのです。

401 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 08:40.net]
>>388
普通のプリンタの内部コードはJISだろ。そうじゃないのもあるのかな?

402 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 11:51.net]
>>389
Markus KuhnとMarkus Scherer(@IBM)は別人なんだね。混同してた。
Markus Kuhnのいかれたエピソード希望。語ってください。

403 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 12:27.net]
i18n@XFree86.orgで「UTF-8以外のlocaleを廃止してしまえ。」とか言ってた。
この人の辞書にはsoft landingという言葉はないと思われ。


404 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 12:33.net]
>>394
> i18n@XFree86.orgで「UTF-8以外のlocaleを廃止してしまえ。」とか言ってた。
> この人の辞書にはsoft landingという言葉はないと思われ。

なんだその程度か。いいんでない? 俺もそう思ってるし。
「漢字なんて絵文字。使ってる奴らはバカ」くらい言ってるのかと思ってた。

405 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 13:52.net]
> なんだその程度か。いいんでない? 俺もそう思ってるし。

今は随分状況が改善されてるけど、3年くらい前にこんなこと言われたら
正直たまらんですよ。まあそれはそれとしてこんなのもあった。

ttp://slashdot.jp/journal.pl?op=display&uid=64&id=40155
ttp://slashdot.jp/comments.pl?sid=51843&cid=188174


406 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 14:00.net]
返す返すも中国がうらやましい

407 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 14:09.net]
>>396
昔の i18n-ML 読めないんだな。
特に 4.0.2 リリースの頃の発言とか、迷言ばかりだったと思うんだが。

> 今は随分状況が改善されてるけど、3年くらい前にこんなこと言われたら
> 正直たまらんですよ。
改善?
本質を理解せずに、国際化・多言語化はとりあえず Unicode にしとけ、
なんて間違った認識が広まりすぎただけだと思うが。


408 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 14:13.net]
>>396
おー、ありがとう。読んでみた。
まぁ気持ちは分かる。
そもそもターミナルエミュレータは右から左に書くことを想定して作られて
いないんだから、もっとリッチな環境でのみサポートしろってことだよな。
「不合理な宗教的な理由で使われている」っていうのは滅茶苦茶だが。
関係ないけど、縦書きターミナルエミュレータってあるのかなぁ。

409 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 14:29.net]
mlterm は縦表示できますよ。



410 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 15:45.net]
>>398
日本語のロケールとしてUTF-8を採用するかという話では
ないのですか

411 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 15:57.net]
>>401
(゚Д゚)?

412 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 16:03.net]
>>401
XUtf8*系のAPIを突っ込もうとしていたときの話。(*1)
つか、UTF-8以外のlocaleを捨てるなら、そもそもそんなものを突っ込む
必要あるのかよと小一時間(ry

*1) 結局4.0.2というマイナーリリースに駆け込みで突っ込まれた。
正直「XFree86のリリースマネージメント終わってるな」と思ったが。




413 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 21:45.net]
禿げどう

414 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 23:49.net]
うに

415 名前:アん最強 []
[ここ壊れてます]

416 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/09 11:07.net]
>>401みたいな的外れなレスが付くあたり、原理主義者の布教は上手く行ったんだろうな。

417 名前:401 mailto:sage [04/03/12 15:37.net]
> 今は随分状況が改善されてるけど、
についてだったんだが

418 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/13 15:09.net]
誰か XF86 fork して Xutf8* 消して CSI xterm 入れてくれYO。


419 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/13 15:25.net]
>>408
それってまんまOpenI18Nじゃね?



420 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/13 21:24.net]
>>409
openi18n.orgって規格団体みたいのじゃないの?
他に同名のがあるの?


421 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/16 16:27.net]
>>410
openi18n.orgでXLib-I18Nとitermが開発されている。
XLib-I18NはXFree86のクライアントライブラリのfork。
itermはCSIなターミナルでフレームバッファ版とX11版がある。


422 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/16 21:31.net]
debian では xiterm って名前なのか。
今まで探してもなかったわけだ…

423 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/17 09:09.net]
それと fbiterm とにわかれてるからなあ。


424 名前:410 mailto:sage [04/03/18 06:32.net]
>>411
thx


425 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/23 18:55.net]
SJIS2000ってのが有るんだな。
これってどうよ?

426 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/23 21:05.net]
>>415
それってJIS X 0213をねじ込んだShift JISのこと?
何年前の話題だ……。

427 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/24 00:43.net]
2000つーぐらいだから少なくとも4年以上前?

428 名前:\ mailto:\ [04/04/16 18:22.net]
\

429 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/17 00:09.net]
>>417
2000は、JIS X 0213 2000の2000ね。
JIS X 0213をJIS2000って言う人もいるらしい。(俺は聴いたことないけど)
seclan.dll.jp/ccjx0213.htm

JIS X 0212(補助漢字)の方の埋め込みを使っていたシステムあるのか?




430 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/17 09:38.net]
つーかOS Xのクリップボードのテキストはまさに
JISX0213をねじ込んだShift_JISなわけだが

431 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/17 17:18.net]
OS X って UTF-8 じゃなかったっけ ?
それともクリップボードだけ Shift JIS なん ?

432 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/18 10:53.net]
>>419
JIS X 0213は今年2月に改正されたんで、今後はJIS2004とでも呼ぶのかな?

でもってシフトJIS方式の符号化は Shift_JIS-2004 てな名前になったわけ
ですが。(附属書1)


433 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/18 16:42.net]
JISX0213イラネ

434 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/18 21:12.net]
まあしかし国内で規格化しておいた方が、
その中の文字がUnicode.orgで採用されやすいし。

435 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/23 12:37.net]
>>422
IANAへの登録マダー? (AAry

436 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/23 14:33.net]
まず厨房mohtaをどうにかしないと。

437 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/24 07:38.net]
登録申請ってRFC2978の手続きに従ってietf-charsetsにメールを投げれば
誰でもできるんじゃないの?

438 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/24 18:09.net]
その手続きを踏むこともロクにできなかったmohta氏って・・・

439 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/25 01:01.net]
mohtaなんか無視して必要だと思う奴が登録申請すればいいじゃん。
漏れはUnicodeでいいと思うからやらないけど



440 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/07 15:22.net]
ねぇねぇ、なんでいつまでも文字コードだけ貧乏くさい発想の元でやってるの?

441 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/07 15:54.net]
>>430
貧乏くさい発想ってのは何をさしてるの?

442 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/08 03:03.net]
一文字に 32bit なり 64bit なりをババーンと割り当ててしまえってことだろ。

443 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/08 05:46.net]
とりあえずおれが今まで書いた文章全部ババーンと変換してよ。

444 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/08 11:20.net]
重複符号化や異体字検索のデータベースもババーンと作ってよ
空間だけならISO 10646はすでに31ビットあるし

445 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/12 05:09.net]
S−JIS・EUCなんて糞

今後はGB2312だ

446 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/12 13:07.net]
大陸でも捨てられたものを使えとは…

447 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/13 01:48.net]
ISO 2022もTRONも中国語に関してはGB2312に毛が生えたレベル

448 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/17 03:24.net]
1文字64bit固定
1言語につき100,000,000文字分のスペース
後はお好きに

これでどこからも異論の声は上がらない

449 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/17 11:42.net]
> これでどこからも異論の声は上がらない
誰も実装しないまま消えていくおかげでな(w



450 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/17 19:46.net]
誰も実装できないのか
駄目だな

451 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/20 00:10.net]
「たった」47000字くらいのExtension Bすらろくに実装されてないもんな

452 名前:名無しさん@お腹いっぱい。 mailto:sage [04/05/21 06:03.net]
42711字だった

453 名前:名無しさん@お腹いっぱい。 mailto:sage [04/06/18 16:03.net]
>>438
これいいな。採用!

454 名前:名無しさん@お腹いっぱい。 mailto:sage [04/06/19 01:33.net]
少しは過去ログ嫁よ。
これだから漢字文化圏の連中は(ry

455 名前: mailto:sage [04/06/22 15:54.net]
.

456 名前:名無しさん@お腹いっぱい。 [04/07/08 23:41.net]
EUC使いたがるプログラマは目的と手段が入れ替わった発想しかできなくなってる

457 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/02 11:13.net]



458 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/02 13:13.net]
.

459 名前: mailto:sage [04/11/05 18:39:19.net]





460 名前: mailto:sage [05/01/07 12:57:00.net]



461 名前:名無しさん@お腹いっぱい。 [05/01/17 16:39:56 .net]
>>125
># 中国語だと今度は発音の違いもcollationの対象かぁ(w

ウリナラのKSコードは同じ字体でも発音ごとに違うコードを割り当ててる<丶`∀´>ニダ
そのへんがチョッパリの文字コードやメリケンのユニコードとは違う。

462 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/18 16:04:56 .net]
全角チルダ化け何とかしてくれ

463 名前:名無しさん@お腹いっぱい。 mailto:sage [05/02/20 02:28:59 .net]
>>451
フィッシング詐欺にはもってこいですね

# 実際には統合漢字と正規等価だから使えないけど

464 名前:名無しさん@お腹いっぱい。 mailto:sage [05/02/20 02:32:24 .net]
あーあと北チョソが、今のUnicodeのハングルの並びは科学的じゃないから
より合理的なウリナラの配列に変更するニダとか超愉快な要求も出してたなあ。
もちろん却下されたけど

465 名前:名無しさん@お腹いっぱい。 [2005/07/14(木) 11:55:46 .net]
保守

466 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/07/18(月) 23:33:56 .net]
nihonjin kanji tukauna!
hirakana katakana only.
The great country is China!

467 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/20(火) 16:44:11 .net]
KPS9566にすりゃいいじゃん

468 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/20(火) 17:09:47 .net]
( ゚∀゚)アハハ八八ノヽノヽノヽノ \ / \ /  \ /  \ /  \ /  \

469 名前:名無しさん@お腹いっぱい。 [2006/05/24(水) 19:48:34 .net]
今や、世界の標準になりつつある。
en.wikipedia.org/wiki/Shift_JIS_art




470 名前:ISO2022原理主義者 [2006/05/29(月) 18:21:43 .net]
UTFやめてiso-2022-jp-*復活希望。
UNICODEの文字セットも呼出せるESCシーケンスも定義すれば良い。

471 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/31(水) 00:23:28 .net]
>>460
すでにあるんだけど...ちゃんと仕様書読みな。

コーラン読まないイスラム原理主義者はただのDQNテロリストだよん。

472 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/31(水) 02:49:35 .net]
共産党員は全員共産党宣言だのなんだのを読んでるんだよもん?


473 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/31(水) 05:35:08 .net]
>>462
頭悪そうな突っ込みw

474 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/31(水) 10:21:40 .net]
どこがどう頭悪そうか書かない奴も同程度。


475 名前:名無しさん@お腹いっぱい。 [2006/06/02(金) 16:52:15 .net]
>>438
人類の生活圏が全宇宙に広がった頃には足りなくなります

476 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/02(金) 20:20:03 .net]
2ちゃんねるって SJIS だよな。
てか、Windows-31j かな。


477 名前:名無しさん@お腹いっぱい。 [2006/06/09(金) 02:35:13 .net]
SJISって嫌われてるの?
自作printf作った時は2byte文字コードが追っかけやすくて便利だった記憶があるんだけど?

478 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/09(金) 06:25:50 .net]
0x5cが2byte文字中に入る時点で嫌だ。

479 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/14(水) 22:28:57 .net]
つうか、Unicode でいいじゃん



480 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/15(木) 06:59:54 .net]
だから、SJISを撲滅するんだろ?

481 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/16(金) 10:28:11 .net]
UTF-8/UTF-16/UTF-32
があるのだから

UTF-64が出てもおかしくないな。

482 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/16(金) 23:04:28 .net]
>>471はUTF-5を使ってください。

483 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/20(火) 09:58:48 .net]
SJIS撲殺天使

484 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/19(水) 23:43:22 .net]
UTF-65536

485 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/23(日) 22:49:52 .net]
UTF-37564

486 名前:名無しさん@お腹いっぱい。 [2008/04/01(火) 23:40:15 .net]
まあまあ、そうあわてなさんな。
今にSJISを拡張して、4バイトコードにするから。

エスケープシーケンスの候補は 0xFD, 0xFE, 0xFF。



487 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/11(金) 09:33:40 .net]
エスケープシーケンスって何
キーボードで入力できないの?

488 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/12(土) 00:13:00 .net]
もう、日本語禁止な!><;

489 名前:名無しさん@お腹いっぱい。 [2008/04/12(土) 20:22:59 .net]
おいおい、エスケープシーケンスも知らずにマルチバイト文字の話かよ。
まったくゆとり教育ってやつぁ...




490 名前:名無しさん@お腹いっぱい。 [2008/04/26(土) 12:20:47 .net]
SJIS 2.0 スペック
0xFD [0xA1-0xFC] [0xA1-0xFC]
0xFE [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC]
0xFF [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC]
を基本路線とし、2バイト目に 0x5C が入らないようにする


491 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/27(日) 11:24:19 .net]
まずはSJISを撲滅する。話はそれからだ

492 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/28(月) 07:07:00 .net]
eyeD3 --help | grep "\--set-encoding"

--set-encoding=latin1|utf8|utf16-BE|utf16-LE

ざまあ

493 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/28(月) 23:18:02 .net]
>>482
eyeD3だからだろ...常識的に考えて。
どうせSJIS突っ込む奴は latin1 に突っ込むし。

494 名前:名無しさん@お腹いっぱい。 [2008/07/13(日) 22:27:05 .net]
>>481
ほぉう、それをSJISで書くのか君は。



495 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/14(月) 22:49:01 .net]
ス、ヲ、ハ、ホ、ォ?サタキ、ヒMozilla1.7b、ホハクサ・ウ。シ・ノタ゚ト熙UTF-8、ヒ、ケ、□ネクタ、ヲヒスオ、ヒスミ、ニ、゚、□」
、ヌ、□、チ、网、タ、ネ。ヨSJIS、ヌチ、テ、ニ、ッ、タ、オ、、。ラ、テ、ニ・ィ・鬘シ、ヒ、ハ、□、ク、网ハ、、?
(、ヒ、キ、ニ、篦セ、ャイス、ア、ケ、ョ、ニクォカ□キ、ケ、ョ、□ト)

496 名前:名無しさん@お腹いっぱい。 [2008/07/22(火) 21:56:14 .net]
>>485
もっかいSJISで頼む。



497 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/03(日) 16:18:05 .net]
タイ語だのBiDiだので苦労している人達から見れば、
0x5cがどうの、包摂がどうのなんてあまりに贅沢な悩みだろ。
Markus Kuhnが>>396みたいなことを言い出すのも非常にうなずける。
ヨーロッパ人もMとiが同じ幅になるとかハイフネーション出来ないとかを
我慢しながら使っているわけだし。

498 名前:名無しさん@お腹いっぱい。 [2008/08/04(月) 21:29:09 .net]
SJISっていつの時代も現実解でいいよね


499 名前:名無しさん@お腹いっぱい。 [2008/08/08(金) 03:43:43 .net]
>>487

すまそ。Mとiが同じ幅になることとSJIS(ないしSJIS撲滅運動)
との関係が分からんが、SJIS万歳でOK?



500 名前:名無しさん@お腹いっぱい。 [2008/08/08(金) 07:10:06 .net]
いまさら文字コードなんか気にする必要ないじゃーん

501 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/08(金) 10:47:33 .net]
>>487
> ヨーロッパ人もMとiが同じ幅になるとかハイフネーション出来ないとかを
> 我慢しながら使っているわけだし。

1950年代にタイムスリップかよ

502 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/09(土) 18:31:30 .net]
もしかしてヨーロッパ人は今でもダム端使って、2chとかみ

503 名前:てんの?

[]
[ここ壊れてます]

504 名前:名無しさん@お腹いっぱい。 [2010/01/31(日) 14:50:00 .net]
文字コードの問題は今後30年たっても解決していない。

505 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/01/31(日) 14:56:08 .net]
文字コードはさらに増えるね

506 名前:名無しさん@お腹いっぱい。 [2010/02/07(日) 16:28:12 .net]
世界の文字コードを統一することに失敗したので、今度は
世界中の単語に統一したコードを振ってみるのはどうだろう?

もちろん同じ意味の単語に同じ値を割り振るわけだ。
多義語の場合はどういう意味で使っているのかを選択する
必要がある。多義語は多値になることもある。

今度は最初から32ビットでいくけどいいよね?


507 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/07(日) 21:24:07 .net]
PSOのワードセレクトみたいなものだね
日常で使う単語なら32ビットもあれば十分だろうね

508 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/07(日) 21:33:12 .net]
16x16のイメージととみなした256ビットをそのままコードにして必要な時は
on the flyでOCR処理しよう。これで全て解決。

509 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/07(日) 22:49:36 .net]
非字形文字はどうすんの?



510 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/07(日) 22:50:18 .net]
非図形だった。
制御文字とか各種スペース類とか。

511 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/08(月) 14:15:25 .net]
16x16 で全ての文字が表せると思っている時点で
16ビットもあれば充分と思ってたのと同程度


512 名前:名無しさん@お腹いっぱい。 [2010/02/17(水) 00:57:45 .net]
>>497

で、そのやり方の場合、OCR 結果は何コードにするの?

# まるでうちの社長レベルだな

513 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/02/17(水) 13:31:26 .net]
>>501
え?UTF-256 じゃないの?


514 名前:名無しさん@お腹いっぱい。 [2010/03/20(土) 22:15:41 .net]
>>502

いいえ。シフトJISです。


515 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/03/22(月) 13:25:24 .net]
撲滅マダー

516 名前:名無しさん@お腹いっぱい。 [2010/05/23(日) 03:24:10 .net]
>>495
lojban の1200の基礎語彙のことか.

lojban:
・文化的に中立の人工言語
・語彙は1200の語根の合成語としていくらでも拡張できる
・同音異義語が存在しえないよう構成されている

いいアイディアをもらった.

517 名前:名無しさん@お腹いっぱい。 [2010/09/26(日) 21:31:38 .net]
撲滅マダー

518 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/10/23(土) 15:16:26 .net]
大手プロバイダのトップページは大多数がshift_jisだね。
まだまだ安泰だ。

ちなみにyahooはトップはutf-8に変えたけど、
その他ほとんどのページやwebメールはeuc_jpのまま。

519 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/10/24(日) 15:29:05 .net]
>>1

つ Samba



520 名前: 忍法帖【Lv=40,xxxPT】(1+0:8) 【37.8m】 電脳プリオン ◆3YKmpu7JR7Ic mailto:sage [2012/10/20(土) 14:20:16.04 BE:121623326-PLT(12079).net]
撲滅されそうにないな

521 名前:名無しさん@お腹いっぱい。 [2013/04/13(土) 02:48:10.27 .net]
UnicodeでもUTF-16は廃止してもいいと思うな。
UTF-16はUCS-4に置き換えたほうがいい。

522 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/04/13(土) 16:09:47.04 .net]
合成文字あれば、UTF-32(UCS-4)でも64bit以上必要になるぜ?

523 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/04/21(日) 04:16:11.83 .net]
正規化すると64bitでも足りないということか

524 名前:名無しさん@お腹いっぱい。 mailto:sage [2014/10/22(水) 13:51:16.97 .net]
>>495
遊方僧とか来ちゃったよ?

525 名前:名無しさん@お腹いっぱい。 mailto:sage [2014/11/05(水) 08:51:56.10 .net]
半角カナさえ無ければSJISも出てこなかった

526 名前:名無しさん@お腹いっぱい。 [2015/02/16(月) 07:37:16.99 .net]
今日すごいのかなー。1000円へ

527 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/21(土) 22:35:51.38 .net]
よく歴史を知らないんだが、SJISが初期の頃にすぐさま圧倒的シェア取ったのに、
なんでUNIXではEUCに固執した馬鹿たちが大勢いたの?

528 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/24(火) 10:12:42.43 .net]
ほぼ無改造で大半のソフトが動いたから。SJISはそうはいかなかった。

529 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/26(木) 18:49:35.33 .net]
昔の人は日本語テキストを英語しか想定してないソフトで処理しようとしたのか。

今も昔も日本のUinxerは自分でコードが書けないんだな。



530 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/27(金) 07:41:27.33 .net]
しかしsendmailみたいな8ビット目を落とすソフトウェアまで出てきたりして、
ISO-2022-JPを制定してメールはそちらを使うようになった。
結果として多くの日本語を扱うソフトは3種類のエンコーディングをサポート
する羽目になった。
今はそれに加えてUTF-8もあるし大変だ。

531 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/27(金) 09:54:28.60 .net]
Sendmailが悪いわけじゃないし
「8ビット目を落とすソフトウェアが出てきた」わけじゃない。
7ビットがデフォルトだったところに
8ビットも使えるソフトウェアが出てきた。

532 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/02/27(金) 18:34:09.85 .net]
それに比べてとMSの対応は素晴らしい。
早期にOS内部はunicodeで統一し、APIを二つ用意して、マクロでラップ。
あらゆる言語をターゲットにしてたOSだけはあるな。

533 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/07/23(木) 11:23:39.14 .net]
あとはwindowsとともに滅びゆくのみ
長く苦しい戦いだった

534 名前:. mailto:sage [2015/08/26(水) 12:22:34.09 .net]
EUCも撲滅しろ

535 名前:名無しさん@お腹いっぱい。 mailto:sage [2015/08/26(水) 13:30:24.73 .net]
自分でやれ

536 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<124KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef