[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2ch.scのread.cgiへ]
Update time : 04/11 14:45 / Filesize : 124 KB / Number-of Response : 537
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

SJIS撲滅運動



1 名前:ほげ [02/01/30 04:51.net]
UNICODEかEUCに統一してほしい。今現役でSJISつかってるのMSくらいだし。MacもOS-XからほぼEUCとUNICODEだし。
MP3のIDタグが統一できなくて困る!
SJISで書かれたperlとか置かれたら管理しにくくて困る!
タマにはUNIXでも日本語ファイルを堂々とつかってみたい!




282 名前:272 mailto:sage [03/10/13 03:18.net]
ISO-2022-JP、EUC-JPの場合:
使ってはいけない理由の根本はISO/IEC 2022にあります。JISでいうとJIS X
0202。「7.5 図形文字の一意な符号化」にはこう書かれています。
----ここから引用----
同じ文字が8ビット又は7ビットの符号の符号要素のG0, G1, G2及びG3として、指
示される複数の図形文字集合に現れることがある。このような文字は、二つの集
合を定義する仕様又はISO符号化文字集合の国際登録簿で同じ名前をもつ場合、
同じ文字とみなされる。
同一の文字が複数の集合に割り当てられている場合、その文字は、その文字が割
り当てられた任意の符号要素のG0, G1, G2又はG3から取り出された符号化表現で
表現されてよい。
この規格を適用する場合、情報交換の際にすべての文字が一意の符号化表現をも
つことを要求されるとき、符号の版の規定(10.1参照)で、その制限を明らかにし
なければならない。
符号の一意化の制限を適用した場合、その文字が割り当てられた最下位番号の符
号要素(G0, G1, G2及びG3の順)から符号化表現が表現される。この場合、たとえ、
高位番号の符号要素が既に呼び出されていて、かつ、その文字が割り当てられて
いる下位番号の符号要素が呼び出されていないときでも、高位番号の符号要素の
文字の符号化表現は、使用しない。
----ここまで引用----

「二つの集合を定義する仕様」というのはこの場合JIS X 0201とJIS X 0208です。
さて、例の「使うとまずい文字」の名称はどうなっているか? なんとJIS X 0201
とJIS X 0208でまったく同じです。たとえば「ア」は両方とも「KATAKANA
LETTER A」ですし「?」は「QUESTION MARK」です。つまり半角と全角の二つの文
字があるのではなく、「ア」という文字があってそれが二つの集合に存在するわ
けです。続きを読みます。

283 名前:272 mailto:sage [03/10/13 03:19.net]
・一意の符号化表現が要求された場合はG0〜G3のうち、若い数字の方を使う。
・そうでなければG0〜G3のどれを使っても良い。

ISO-2022-JPはASCII、JIS X 0201 ラテン、JIS X 0208をG0に指示して使います。
EUC-JPはASCIIをG0、JIS X 0208をG1、JIS X 0201 片仮名をG2、JIS X 0212をG3
にあらかじめ指示してあります。ですから、EUC-JPで一意の符号化表現が要求さ
れた場合は、JIS X 0201 片仮名とJIS X 0208の一部は使えません。
ところで、ISO-2022-JPはそもそもJIS X 0201 片仮名を含んでいません。なので
ISO-2022-JPでJIS X 0201 片仮名を使おうとするのは「論外」です。ちなみに
ISO-2022-JP-2、ISO-2022-JP-3にも含まれていません……。
閑話休題。実は、ISO-2022-JPやEUC-JP自身は一意の符号化表現を要求していま
せん。よってかぶっている文字はJIS X 0201とJIS X 0208のどちらを使ってもか
まわないわけです。結局同じ文字なのですから、そもそも使い分け自体が無意味。
日本語を処理したり表示するときには、二つともまったく同じ文字として扱わな
ければいけません。現存する処理系は壊滅状態ですね。
さて本当にどちらを使ってもいいのかというと、これはJISで決まっていて、JIS
X 0208のかぶっている方については「過去との互換性が要求されるとき以外は使
うな」と書いてあります(JIS X 0208の7.2, 7.3, 9.2)。

まとめますと、
ISO-2022-JP……全角英数は使えない。半角カナは存在しないので論外。
EUC-JP……全角英数は使えない。半角カナは一意の符号化表現が要求されない場
合問題ない。ただし、その場合は全角カナとまったく同じ表示・処理にすること。
しかし、実現出来ていない現状では半角カナは使わない方がいいと思います。

Shift JISの場合:
JIS X 0208の4.2, 4.3, 4.5に書いてあります。「全角英数・半角カナは使うな」
あとJIS X 0201 片仮名の割り当ては削除の予定だそうです。

284 名前:272 mailto: []
[ここ壊れてます]

285 名前: mailto:03/10/13 03:20.net [ 例外として、ISO-2022-JP、Shift JIS、EUC-JPで過去との互換を目的として、二
つの文字を区別したい場合はどうするか。JIS X 0208の付属書5にあるように、
JIS X 0201 片仮名にHALFWIDTH、JIS X 0208 数字・ラテン文字・特殊文字に
FULLWIDTHをつけた代替名称を使って区別します。この場合のみ、かぶっている
二つの文字は別物として扱うことが出来ます。

Unicodeの場合:
○East Asian Scripts
・Halfwidth and Fullwidth Forms: U+FF00?U+FFEF
(省略)
As with other compatibility characters, the preferred Unicode encoding
is to use the nominal counterparts of these characters and use rich text
font or style bindings to select the appropriate glyph size and width.
まずい方の文字は使うな、ということです。ただし全角・半角は別物として扱う
ようです。
]
[ここ壊れてます]

286 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 07:21.net]
>>272
> UTF-8もUTF-16も。

こりゃ言い過ぎだ。

287 名前:名無しさん@Emacs mailto:sage [03/10/13 14:18.net]
>>276-279
理想論をただ書き連ねただけのオナニーだな。

実際のアプリケーションでは、過去の文書データと
一切関わりなく使用されるようなことはまずない。
「過去との互換性が要求されるとき以外は使うな」というのは
文字コードの世界ではほとんど意味のない制限だ。
UnicodeもCP932も、いわゆる「半角カナ」も「機種依存文字」も
既に存在しているものであり、技術者の一方的な都合で
「なかったこと」にすることはできない。

288 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 14:22.net]
>>281

> UnicodeもCP932も、いわゆる「半角*カナ*」も「機種依存文字」も

今あなたが書いたのは「新規」のものだろう。
どこに必要性があるんだ。使うなよ。


289 名前:281 mailto:sage [03/10/13 15:00.net]
>>282
いやあ、スマンスマン。
本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。

「文字コード」ってのは、コミュニケーションの手段である文章を
どうやってデジタルデータに落とすかって話の一部でしかなく、
規格書に記述されていることが全てではない。

半角カナを使って煽りの気持ちを表現したり、
Ascii artのように文字のグリフだけに意味を持たせたりと、
そういう規格書では定義されていない「文化」が
既にあちこちで使われている。

そういう背景を無視して、機械的に「半角カナ→全角カナ」のような
フィルタをかけ、(行間じゃなく)文字コードの間に込められた意味を
消してしまうのは、技術者のエゴじゃないかなと漏れは思うわけよ。

290 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:11.net]
>>283

そういうのは上のレイヤーでやるべきことで、文字自身にもたせるものではないんです。
所詮、フォントを変えただけで消し飛ぶようなものですから。



291 名前:281 mailto:sage [03/10/13 15:22.net]
>>284
> そういうのは上のレイヤーでやるべきことで、文字自身にもたせるものではないんです。
> 所詮、フォントを変えただけで消し飛ぶようなものですから。

もちろん漏れも技術者のはしくれなんで、そういう「理想論」は理解できる。
# つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ただ、そういう事情を理解した上で、
「結局、『理想論』は理想論でしかない。」
と言いたいわけよ。

292 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
>>285

> # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
JISは読みましたか?

> ただ、そういう事情を理解した上で、

全然理解してないですね。

> いやあ、スマンスマン。
> 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。

こんなことを書く程度ですし。

293 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
手書きでも半角カタカナとか全角英数字を浸透させちゃえばいいんだよ。

294 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:39.net]
四半角仮名や四倍角英数字が Unicode に入るのはいつですか?

295 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:47.net]
>>286
かっかし過ぎ。

296 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:59.net]
>>289
かっかしてるわけじゃなくてね、>>281 程度の認識しか持たない人が
しばしば愚かなことを書くからガッカリしてるの。>>281 程度の話は、
今まで数え切れないほど行われてきた。>>276-279 を読めば、こちらが
もっと上のレベルの話をしたいってことは分かると思うんだけどね……

本当は >>276 の人と意見を交換したくて、がんばって長文を書いたんだけど
出てこないかなぁ。

297 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:01.net]
>>290
> もっと上のレベルの
レイヤは上かもしれないが
レベルは上じゃねーよ。
過去の実装を無視して規格だけこねくりまわしても無意味。

298 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:03.net]
>>291
そういうのは規格を読んでから言ってね。

299 名前:292 mailto:sage [03/10/13 16:11.net]
> そういうのは規格を読んでから言ってね。
こんなことを書くと、またアホが「規格規格とうるさい原理主義者」とか言いかねないので
補足しておく。まともな技術者なら、なにかを実装したりする場合一次情報にあたるのは
当然のことなんだ。たとえばHTMLを扱うならW3Cの勧告を読むのは当然だし、もしかすると
HTTPのRFCを読まないといけないかもしれない。
こちらが言っているのは、「規格は至上のものである」ということじゃなくて、日本語の処理を
するなら、読んで当然だってことなんだ。

300 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:13.net]
厨な質問ですいませんが、たとえば、2ちゃんねるなんかは、
「半角カナ」と「全角カタカナ」の使い分けが当然のように行われているわけですが、
これは「過去との互換性が要求されるとき」に合致するのではないの?



301 名前:291 mailto:sage [03/10/13 16:31.net]
「だけ」と書いたのが読めんのか。

302 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:39.net]
>>295
だから、規格さえ読んでない人は論外なんだって。

303 名前:281 mailto:sage [03/10/13 17:28.net]
>>286
> > # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。
> ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
> JISは読みましたか?
当然読んでいる。
技術者として、JISやW3Cなどの規格を読むのが
最低限必要なことなのは言われなくてもわかっている。

おそらく、>>286はHTML3.2などで(規格に厳密に従った場合)
日本語を使用することができないってことなどを言いたいんだと思うが、
そういう国際化の規格が決まる前から多くの実装で
日本語を含むHTMLを扱うことができていた。

規格ってのは、その実装ができる前から(もしくはリファレンス実装の作成と並行して)
作られるものもあるが、現状の実装を後追いする形で決まるものも多い。
そのような実装の後追いで決まった規格を使う場合は、
過去の実装や慣例についても十分考慮する必要がある。

特に文字コードのように、「非技術者」に対する影響も非常に大きい分野では、
「規格で推奨されていないから」という理由だけで
過去の慣例を排除するのは、現状を見ていない技術者のエゴでしかない。
# 完全に技術的分野で閉じた話なら構わんと思うがね。

> > いやあ、スマンスマン。
> > 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。
> こんなことを書く程度ですし。
じゃあ、>>281のはじめの一文は
「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
とでも書くべきだったのか?
俺は「2chでの慣習」に従った書き方をしているだけだ。

304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 17:55.net]
>>297
> そのような実装の後追いで決まった規格を使う場合は、
> 過去の実装や慣例についても十分考慮する必要がある。

はい、そのとおりです。
しかしながらまだその先があります。
たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
ようするに過去の実装より、規格の方を重視すべきなのです。
もちろんこれは原則にすぎず、他のシステムとやりとりである以上、可能な限り
データ交換可能なものにするべきです。

つまり、「規格より過去の実装の方が重要」という点が間違っているということ
です。規格の重みづけをする場合、過去の実装以外にも考慮しなければいけない
要素がある、ということ。

> 「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
> とでも書くべきだったのか?

「煽り」とか書いてる時点で人間的にどうかと思います。
それは置いておくとしても、

> 俺は「2chでの慣習」に従った書き方をしているだけだ。

これはただの責任転嫁ですよ。

305 名前:281 mailto:sage [03/10/13 19:09.net]
>>298
> たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
> る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
> また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
> このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
> ようするに過去の実装より、規格の方を重視すべきなのです。

それが現実を見ていない理想論に過ぎないと言いたいわけ。
GNU libiconvにcp932パッチがあるのは何故だ?
過去の実装や慣習を無視して新たな規格や実装を作っても、
それは新たな混乱を招くだけ。

306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:00.net]
>>299

ちゃんと >>298 を読みましたか?
あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
低すぎるといっているのです。「過去の実装との互換性」以外にも、規格
の重みづけの要素はあるんだよ、と。

> GNU libiconvにcp932パッチがあるのは何故だ?

Microsoftが他者(他社・Unicodeコンソーシアム)と協調してShift JISの
マッピングテーブルを決めるべきところを、無視して独自に実装したためです。
Microsoftのテーブルは個人的には現実的だと思っていますが、まさに

> 過去の実装や慣習を無視して新たな規格や実装を作っても、
> それは新たな混乱を招くだけ。

こういうことです。

307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:58.net]
そういえば、どっかの携帯会社が規格の予約領域を勝手に使っていましたね。

308 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:17.net]
で、何番の発言が AoiMoe なの?

309 名前:281 mailto:sage [03/10/13 22:42.net]
>>300
> あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
> 低すぎるといっているのです。

そうか? 別に規格をないがしろにしている気はないのだが。

ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の
文字のグリフが、JIS X 0208の部分のものの半分の横幅になると
期待すること」および「そういう表示のされ方を期待して、
JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は
慣習として既に広まっていることだし、
今更目くじらを立てることではないと思っているのだが。

> > GNU libiconvにcp932パッチがあるのは何故だ?

これは俺の表現がまずかった。
俺が言いたかったのは、「何故cp932パッチが本家に統合されずに
別々に配布されなきゃならんのか」ってこと。

確かに>>300の言う通り、cp932のマッピングテーブルはMicrosoftが
勝手に決めてしまったもの。そのためGNU libiconv本家は
cp932パッチの統合をかたくなに拒んでいる。
しかし、日本でiconvを使う場合、cp932のサポートは
もはや必須と言えるため、日本の多くのユーザが
GNU libiconvにわざわざcp932パッチを当てて使っている。

規格至上主義に走り過ぎると、かえってユーザの利便性が
損なわれることがあるって例のつもりだったんだけどね。

310 名前:281 mailto:sage [03/10/13 22:46.net]
>>302
少なくとも俺は違うぞ。(w



311 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:48.net]
>>303
> 確かに>>300の言う通り、cp932のマッピングテーブルはMicrosoftが
> 勝手に決めてしまったもの。そのためGNU libiconv本家は
> cp932パッチの統合をかたくなに拒んでいる。

少し前に、libiconvのCVSの方に入ってます。


312 名前:281 mailto:sage [03/10/13 22:52.net]
>>305
> 少し前に、libiconvのCVSの方に入ってます。

おお、それは良かった。
1.9.1にも入らなかったから、もうダメかなとあきらめていたんだけど。

パッチのマージに尽力された方々にこの場を借りてお礼を申し上げます。

313 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:34.net]
>>303
> ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の
> 文字のグリフが、JIS X 0208の部分のものの半分の横幅になると
> 期待すること」および「そういう表示のされ方を期待して、
> JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は
> 慣習として既に広まっていることだし、

広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか?
そんな期待はフォントが違うだけで無意味になる程度のものです。

> 今更目くじらを立てることではないと思っているのだが。

やれやれ……
あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。

予想では今後、Unicodeへの移行によってさらに種は増えるでしょう。

・CJK間で、かなり異なったグリフの漢字が統合されていることによる問題。
上のレイヤーで解決すればいいのですが(たとえばHTMLのlang指定)、
安易な方法としてUnicodeの言語タグを使って実装されてしまう。
言語タグの使用は推奨されていません。

・JIS X 0208の和字間隔、いわゆる全角空白の扱い。
存在が微妙なので、実装のされ方に互換性が無くなる可能性があります。

> 規格至上主義に走り過ぎると、

不適切な例でしたね。こちらは至上主義じゃないって言ってるのに。

予想(>>290)どおりの愚かな展開(平行線)になってしまった。
規格自身について話を振っているのに、「規格なんて二の次だ」なんて的はずれな
返事を返すなんて……。もうちょっと認識のある人の意見を望みます。

314 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:44.net]
>>281
> 技術者の一方的な都合で「なかったこと」にすることはできない。

日本文藝家協会の方ですか?

315 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 01:35.net]
>>307
> 返事を返すなんて……。もうちょっと認識のある人の意見を望みます。
気持ちはわかるが、そういう書き方をするから不毛なやり合いになる。

316 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 12:42.net]
>たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
>る可能性があるわけです。改訂版では過去との互換性があるとは限りません。

日本で作られたソフトは、まず無いと思う。
今までそれが行われていれば、今のような状況とは違ったと思うが。

もっとも、JIS X 0208:1983 やら、うにコードのように、
規格自体が腐ってる事が多い

317 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 13:12.net]
>>307 あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。
どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事ができるでしょうか。

今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では
否定しているという話にすぎない訳です。(その後は主観の争いになってますが…)
JISは中国のGB18030とは違い、何の強制力もありません。「いけません」と言ったところで、
結局はどこかに落ち着かなければ使い物にならないのが現実ですよね。

318 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 14:21.net]
>>311
とはいっても、>>307が言うように、
fullwidth/halfwidthは過去のものにすべく努力していくべきだろ?

319 名前:フグ/ハリセン本について mailto:sage [03/10/14 16:48.net]
フグ/ハリセン本について

CJKV日中韓越情報処理
Ken Lunde著
2002年12月発行 12,800円
www.oreilly.co.jp/BOOK/cjkv/

Data Table & Sample Code
examples.oreilly.com/cjkvinfo/

Ken Lunde's Home Page
www.praxagora.com/lunde/

320 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 04:31.net]
>>311
> 今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では
> 否定しているという話にすぎない訳です。

そ、それで終わりですか?
あの話は掘り下げるところがまだまだあると思うのですが……

> (その後は主観の争いになってますが…)

人の意見・主調なんてすべて主観です。問題はその妥当性。

> どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事が
> できるでしょうか。

普通、実装をするまえに規格を洗って、それを整理しますよね。
それをおざなりにして、いきなり実装をしてもまともなものは出来ないでしょう。
過去の実装との互換性があればいい、という適当な考えならいざしらず。

> JISは中国のGB18030とは違い、何の強制力もありません。

強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。
例えばある通信プロトコルで、RFC違反のデータを送受信することは簡単です。互換性
などの理由で、やらざるをえないこともあるでしょう。しかしそれは基本的には「やるべきで
はない」のです。理由は分かりますよね?



321 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 23:26.net]
>>314
>強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。

「使うべきではない文字」ってのを誰がどうやって決めるかっていうと、それは
情報の送り手と受け手、両者の合意によるわけだ。
「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける
手間を省くためのものだし。

322 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 02:21.net]
通信かよ!?

323 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 07:44.net]
通信だよ

324 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 12:34.net]
問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、
いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。

325 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/18 20:41.net]
いまだにJEFつかってる銀行なんか多いくらいなので、、、

やっぱ変更せずに走らせるケースが多いのでは?


326 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:00.net]
> 嘘があったり
「使うべきでない」を「使ってはいけない」と表現したり
まさかMUSTとSHOULDの区別も付かないわけじゃないですよね
> 重要なことが抜けてたりするので
「過去との互換を目的として」とかの例外事項を無視して
「使ってはいけない」としか書かなかったり
しかも知ってて抜かすんだからより悪質ですね

327 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:03.net]
文字コードが通信が終わったら端から消えていくなら
実装を変えればそれで終わりだろうけど実際には
データとしてどんどん蓄積されていくから途中で変えて
はいおしまい、過去のデータは全部捨ててください
なんて簡単に言えるわけない。

328 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:43.net]
そういえば>>232の何が結局「嘘」なのかも説明してませんね。

329 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:06.net]
> 「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける
> 手間を省くためのものだし。

はい、そのとおりです。

> 問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、
> いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。

実装の話が好きですね……。
さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの
くだりがあるわけだし。したいのなら止めませんが。


330 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:08.net]
> 「使うべきでない」を「使ってはいけない」と表現したり
> まさかMUSTとSHOULDの区別も付かないわけじゃないですよね

「使うべきではない」ものを、相当の理由なく使おうとしている場合、
「使ってはいけない」と伝えても問題ないでしょう。

> 「過去との互換を目的として」とかの例外事項を無視して
> 「使ってはいけない」としか書かなかったり
> しかも知ってて抜かすんだからより悪質ですね

また低レベルな、平行線の話を繰り返したいのですね。

> はいおしまい、過去のデータは全部捨ててください
> なんて簡単に言えるわけない。

どうして捨てる必要があるのでしょうか?
新規で使わなければいいだけなのに。

> そういえば>>232の何が結局「嘘」なのかも説明してませんね。

>>277-279 を読みましたか? 読んでも分かりませんか?
そこに含めてあるんですが……



331 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:55.net]
>>324
> 新規で使わなければいいだけなのに。
"今まで使えてただろ! どうにかしろ !"

332 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:56.net]
> "今まで使えてただろ! どうにかしろ !"

そんな人いますか?

333 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 01:28.net]
とりあえず、既存の規格を無視するやつをなんとかしろよ。
docomo とか。

334 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 07:05.net]
わざと無死してるわけですが

335 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/26 03:22.net]
>>326
います


336 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:01.net]
> 「使うべきではない」ものを、相当の理由なく使おうとしている場合、
誰がそんなことしてるんですか?

> また低レベルな、平行線の話を繰り返したいのですね。
そもそも>>272が低レベルな煽りから始まっているのです。
そういうのを自業自得といいます。

> どうして捨てる必要があるのでしょうか?
新しい実装で読めないからです。

337 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:04.net]
> さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの
> くだりがあるわけだし。
それこそがまさに「相当の理由」でしょうが。

338 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:11.net]
> >>277-279 を読みましたか? 読んでも分かりませんか?
> そこに含めてあるんですが……
順番に検証してみようか。
>>276
リンク先のどこにも「JIS X 0201のカタカナ」が特殊なカタカナだ
なんて一言も書いてない。自分以外の愚民は使うべきでないものを
使いたくて使いたくてたまらないから「JIS X 0201のカタカナ」と
書かれていたらそれは即特殊な意味を持たせていてそれ以外の
解釈はありえないとか妄想したけりゃしてもいいけど。

339 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:16.net]
> ISO-2022-JPで
リンク先は「ISO-2022-JPで」使うなんて話はしていない。
7bit-JISの話なら出てくるけど。
> EUC-JP
> Shift JIS
そもそも「使ってはいけない」が嘘だから論外

340 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:20.net]
> Unicodeの場合:
リンク先にはUnicodeの話などまったく出てこないが。
そもそもJIS X 0201の話をしてるのにUnicodeが出てくること自体
ヘンだとお前さんが自分で言ってるだろ。
>



341 名前:勘違いの典型は、「UnicodeでJIS X 0201の片仮名は使えますか?」などと
> いう質問で、

総論:
リンク先とは無関係な、誰に言ってるのかも不明な論を
一方的にまくし立ててるだけ。
> 6:一見関係ありそうで関係ない話を始める

で、どこが嘘なの?
[]
[ここ壊れてます]

342 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:26.net]
> 広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか?
> そんな期待はフォントが違うだけで無意味になる程度のものです。

区別しない実装が存在することは区別しない慣習が存在することの
否定にはならない。単に区別しない場合もあれば(規格上区別する
理由はないんだから当然だが)慣習上区別する場合もあるという
だけのこと。

だいたい使い分ける慣習が本当に存在しないならあんたの
大好きな規格書はありもしない慣習との互換性に配慮するために
わざわざページを割いてるの?

こんな初歩的な詭弁にすらツッコミが入らないようじゃ
確かにレベル低いかもね

343 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:40.net]
> 区別しない実装が存在することは区別しない慣習が存在することの
訂正
区別しない実装が存在することは区別する慣習が存在することの

344 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 20:50.net]
とりあえず引用トークはムカつくっつーことだけは
よ〜くわかった。

345 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 21:13.net]
>>337
> とりあえず引用トークはムカつくっつーことだけは
fjを思い浮かべるからかな。


などと引用してみるテスト。

346 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:53.net]
>> また低レベルな、平行線の話を繰り返したいのですね。
>そもそも>>272が低レベルな煽りから始まっているのです。
> そういうのを自業自得といいます。

責任転嫁をしないように。
低レベルな話を持ち込んだのは、あなた自身の責任です。

さて、>>330-336 には、簡単に分かる間違いがいくつかあります。

・認識不足による誤解・間違いが4つ
・引用部分とは関連のない話を持ち出して、返答しているのが1つ

それぞれどこでしょう。
>>330-336 の人は分からないでしょうから、他の方で結構です。
考えてみてください。

それから、>>330-336 を書いた人への課題も出しておきます。

>> ISO-2022-JPで
> リンク先は「ISO-2022-JPで」使うなんて話はしていない。
> 7bit-JISの話なら出てくるけど。

「7bit-JIS」とは?


347 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:57.net]
間違い探しクイズなんてしてないでハッキリ言う方が良いのでは?
と傍観者は思うのでした。

348 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 04:04.net]
死めよ。おぬーら。

349 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 18:58.net]
>>340

論理的思考が出来ない人間とのメタ議論は、しばしば発散するからです。


350 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 22:26.net]
>>341
はっきり言いすぎですYO!




351 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:18.net]
すんません! この系統に関してはドシロウトなんですが...
o コードセットとグリフの関係とか
o ウニコードとステートフル(ってゆうのか?)なコード体系の関係
とか
に関して, そこそこまとまった資料って, どこ参照すればええんで
すか?
# グリフの合理的指定方法があれば何とかなるもんちゃうの???



352 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:32.net]
>>339
手抜きせずに書いてやれよ。

>>276>>277-279 はあきらかに別人。

>>333-334>>272 の↓部分の補足であるものを、リンク先についての言及だと
曲解している。

>たいていの場合、JIS X 0201の片仮名用図形文字集合(いわゆる半角カタカナ)は
>使ってはいけない。ISO-2022(例外あり)もISO-2022-JPもShift JISもEUC-JPも
>UTF-8もUTF-16も。
>同様にJIS X 0208の一部の文字(いわゆる全角英数)も使ってはいけない。
>「?」や「/」のJIS X 0208の方もダメ。

>>335 に対しては、互換性が残されているのは、文字幅の慣習とは無関係。

あと >>272>>232 のリンク先について誤解していると思う。
あのページは誤りであることを承知の上で、JIS コード(と言われている文字コード)で
JIS X0201 の文字集合を使う方法を紹介している。
232氏はネタのつもりだったのでは。

353 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 01:59.net]
質問
jisx0213の文字って全部unicodeに反映されたの?

354 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 02:13.net]
されてない


355 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 10:49.net]
>>347
どの程度反映されてるんでせうか?それともまったく?

356 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 00:02.net]
補助漢字にある奴は全部あるでしょ。
丸付き数字のような合成文字系は全部拒絶されてんじゃない?

357 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:48.net]
丸付き数字系は全て追加されました。


358 名前:名無しさん@お腹いっぱい。 [03/11/02 01:55.net]
>>349-350
つーことは一部を覗いてほとんど入れられてるって事ですか。
ありがとうございました。

359 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:56.net]
sage忘れた…すいません。

360 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:59.net]
確か追加されてないのはひらがなとアクセント付きの発音記号だけだったと思う。




361 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 13:58.net]
Unicodeでの外字の扱いってどうなってんの?
使えんの?

362 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 16:55.net]
PUAでいいんじゃね?

363 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 22:55.net]
>>353
ひらがなってのは、'ん'+'゛'みたいなやつのこと?

364 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/06 17:00.net]
>>353
Unicode側の言い分では「全部入れた」ことになっているんだろうけどね。
「合成で済むだろゴルァ」って感じで。


365 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/08 11:28.net]
結局混乱を増しただけだと思うんだけどなー。
あぁ、日本以外じゃ困らんから、テキトーな国際化には役に立っとるんか。

366 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:35.net]
pc2.2ch.net/test/read.cgi/software/1044162360/
>>874
格納がしっかりしてれば文字コードが必ずSJISになり
どの文字コードで格納するか調べる必要も無いでしょう。

>>875
予想だろうがそれが根拠で問題だと『俺は』思う。
俺の思う理由を聞いておいてそれは無いだろう。

367 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:47.net]
>>876
その必要が有る人のみ守ってるだけでは?
普通は日本語使わないけどね。

>>877
殆どはASCIIで書かれてるからな。ASCIIはSJISで無いぞ。
稀に見かける日本語を使った書庫ではeucを使ってる。
でもSJISを使ってるのは見たこと無いとも書いたが。

>>878
作者は仕様を守るべきなんじゃない?
それが出来ないなら作らなければ良いだけ。
仕様を制定するのが自分なら殆ど負担は無いだろう。

368 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:19.net]
>UNIX上でも SJIS 使ったのしか見たこと無いね。
俺は無いな、少なくとも配布されてるものに関しては。

>仕様を制定したのと、UNIX版作ってる人は別人。
>同一人物でも仕様をコロコロ変えるのはどーかと思われ。
これは誤解を生んじゃったな。
lhaの事じゃなくソフトウェア作者の苦労の事を書いただけだから
その辺の事は分かってるし同意。

>仕様が無い場合という仮定の話なので文字コードは SJIS とは限らない。
格納をしっかりすれば仮定の話は何の意味も無い。



369 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:35.net]
>それらの書庫はファイル名に関する仕様を守ってる。
日本語ファイル名を格納してる書庫の話でしょうが。
ASCIIファイル名は日本語扱うときはSJISでって仕様を満たしている訳じゃない。

>必要がある人は自力で実装すれば良い、
>という事のどこに問題があるのかサッパリわからん。
それじゃぁ自力で実装する力の無い人、そもそもそんな事考えて無い人が作った
書庫は不正書庫になってしまうじゃないか。
大抵の人はlhaにそんな仕様が有る事すら知らないだろう。
何べんも書くけど守られない仕様は仕様の機能を果たさない。
仕様がしっかり守られるならば解凍時の文字コードも気にしなくて良い。

370 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:38.net]
>ファイル名に関する仕様が無い場合、
>UTF-8 でも SJIS でも EUC でも仕様的に問題なく「しっかり格納」できる。
lhaはSJISで格納すると言う仕様が有るんでしょ。勝手になくさないで。



371 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:59.net]
>ファイル名に関する仕様は満たしてる。
日本語のファイル名の話をしてるんだから・・・。
関係ない話を持ち出さない。

>何べんも書くけど仕様は概ね守られてる。
>例えば、信号無視する人間が延べで 5%居た場合、信号は機能を果たしてないのか?

たとえ話は嫌いだが、、、この場合その5%は必ず事故るわけだから信号の機能を果たしてるとは言いがたい。


372 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:30.net]
向こうで暴れてる困ったちゃんをどうにかしろよ

373 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:44.net]
lhaの書庫はパス名にShift JISを使うって仕様だったのか。知らなかった。
どこに書いてあるんだろう。

374 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 17:57.net]
>>365
ここで暴れてる困ったちゃんもどうにかしてください。

375 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 08:55.net]
>>366
昔のlhaのドキュメント

376 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 09:36.net]
>>368
Vectorにある吉崎氏の実行ファイルとソースのアーカイブ内には
そういう記述はみあたらなかった。
www.vector.co.jp/vpack/browse/person/an000224.html
「昔のlha」は持ってないしなぁ。

ただ、UTIL.Cにiskanji(c)というマクロがあって、それはShift JISを
想定しているっぽい。

#define iskanji(c) ((uchar)(c) >= 0x80 && (uchar)(c) <= 0x9f || \
(uchar)(c) >= 0xe0 && (uchar)(c) <= 0xfd)


377 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 11:18.net]
>>369
lha for UNIXの方だったかもしれん。
だったらそんなに昔じゃないなスマソ


378 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 15:56.net]
詳しくは知らんが、YosshiがSysopやってたflaboでは
過去ログ(LZHで固めた奴)にSJISファイル名使ってたような…

379 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:35.net]
いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
どっかでそれを仕様として確定したと思うんだよ。
それがlha for UNIX以前か以後かがよー分からん。

380 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:40.net]
よーわからんけどlha for UNIX以前か以後かって区分は重要なの?



381 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:57.net]
>>372
> いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
だろうね。

> どっかでそれを仕様として確定したと思うんだよ。
これが、「誰が」「どこで」確定したのか情報希望。

382 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 18:46.net]
よーわからんけど「誰が」はともかく「どこで」は重要なの?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<124KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef