1 名前:ほげ [02/01/30 04:51.net] UNICODEかEUCに統一してほしい。今現役でSJISつかってるのMSくらいだし。MacもOS-XからほぼEUCとUNICODEだし。 MP3のIDタグが統一できなくて困る! SJISで書かれたperlとか置かれたら管理しにくくて困る! タマにはUNIXでも日本語ファイルを堂々とつかってみたい!
302 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:39.net] >>295 だから、規格さえ読んでない人は論外なんだって。
303 名前:281 mailto:sage [03/10/13 17:28.net] >>286 > > # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。 > ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。 > JISは読みましたか? 当然読んでいる。 技術者として、JISやW3Cなどの規格を読むのが 最低限必要なことなのは言われなくてもわかっている。 おそらく、>>286 はHTML3.2などで(規格に厳密に従った場合) 日本語を使用することができないってことなどを言いたいんだと思うが、 そういう国際化の規格が決まる前から多くの実装で 日本語を含むHTMLを扱うことができていた。 規格ってのは、その実装ができる前から(もしくはリファレンス実装の作成と並行して) 作られるものもあるが、現状の実装を後追いする形で決まるものも多い。 そのような実装の後追いで決まった規格を使う場合は、 過去の実装や慣例についても十分考慮する必要がある。 特に文字コードのように、「非技術者」に対する影響も非常に大きい分野では、 「規格で推奨されていないから」という理由だけで 過去の慣例を排除するのは、現状を見ていない技術者のエゴでしかない。 # 完全に技術的分野で閉じた話なら構わんと思うがね。 > > いやあ、スマンスマン。 > > 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。 > こんなことを書く程度ですし。 じゃあ、>>281 のはじめの一文は 「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」 とでも書くべきだったのか? 俺は「2chでの慣習」に従った書き方をしているだけだ。
304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 17:55.net] >>297 > そのような実装の後追いで決まった規格を使う場合は、 > 過去の実装や慣例についても十分考慮する必要がある。 はい、そのとおりです。 しかしながらまだその先があります。 たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく る可能性があるわけです。改訂版では過去との互換性があるとは限りません。 また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。 このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。 ようするに過去の実装より、規格の方を重視すべきなのです。 もちろんこれは原則にすぎず、他のシステムとやりとりである以上、可能な限り データ交換可能なものにするべきです。 つまり、「規格より過去の実装の方が重要」という点が間違っているということ です。規格の重みづけをする場合、過去の実装以外にも考慮しなければいけない 要素がある、ということ。 > 「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」 > とでも書くべきだったのか? 「煽り」とか書いてる時点で人間的にどうかと思います。 それは置いておくとしても、 > 俺は「2chでの慣習」に従った書き方をしているだけだ。 これはただの責任転嫁ですよ。
305 名前:281 mailto:sage [03/10/13 19:09.net] >>298 > たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく > る可能性があるわけです。改訂版では過去との互換性があるとは限りません。 > また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。 > このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。 > ようするに過去の実装より、規格の方を重視すべきなのです。 それが現実を見ていない理想論に過ぎないと言いたいわけ。 GNU libiconvにcp932パッチがあるのは何故だ? 過去の実装や慣習を無視して新たな規格や実装を作っても、 それは新たな混乱を招くだけ。
306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:00.net] >>299 ちゃんと >>298 を読みましたか? あなたは「過去の実装」だけしか考えていないので、規格の重みづけが 低すぎるといっているのです。「過去の実装との互換性」以外にも、規格 の重みづけの要素はあるんだよ、と。 > GNU libiconvにcp932パッチがあるのは何故だ? Microsoftが他者(他社・Unicodeコンソーシアム)と協調してShift JISの マッピングテーブルを決めるべきところを、無視して独自に実装したためです。 Microsoftのテーブルは個人的には現実的だと思っていますが、まさに > 過去の実装や慣習を無視して新たな規格や実装を作っても、 > それは新たな混乱を招くだけ。 こういうことです。
307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:58.net] そういえば、どっかの携帯会社が規格の予約領域を勝手に使っていましたね。
308 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:17.net] で、何番の発言が AoiMoe なの?
309 名前:281 mailto:sage [03/10/13 22:42.net] >>300 > あなたは「過去の実装」だけしか考えていないので、規格の重みづけが > 低すぎるといっているのです。 そうか? 別に規格をないがしろにしている気はないのだが。 ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の 文字のグリフが、JIS X 0208の部分のものの半分の横幅になると 期待すること」および「そういう表示のされ方を期待して、 JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は 慣習として既に広まっていることだし、 今更目くじらを立てることではないと思っているのだが。 > > GNU libiconvにcp932パッチがあるのは何故だ? これは俺の表現がまずかった。 俺が言いたかったのは、「何故cp932パッチが本家に統合されずに 別々に配布されなきゃならんのか」ってこと。 確かに>>300 の言う通り、cp932のマッピングテーブルはMicrosoftが 勝手に決めてしまったもの。そのためGNU libiconv本家は cp932パッチの統合をかたくなに拒んでいる。 しかし、日本でiconvを使う場合、cp932のサポートは もはや必須と言えるため、日本の多くのユーザが GNU libiconvにわざわざcp932パッチを当てて使っている。 規格至上主義に走り過ぎると、かえってユーザの利便性が 損なわれることがあるって例のつもりだったんだけどね。
310 名前:281 mailto:sage [03/10/13 22:46.net] >>302 少なくとも俺は違うぞ。(w
311 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:48.net] >>303 > 確かに>>300 の言う通り、cp932のマッピングテーブルはMicrosoftが > 勝手に決めてしまったもの。そのためGNU libiconv本家は > cp932パッチの統合をかたくなに拒んでいる。 少し前に、libiconvのCVSの方に入ってます。
312 名前:281 mailto:sage [03/10/13 22:52.net] >>305 > 少し前に、libiconvのCVSの方に入ってます。 おお、それは良かった。 1.9.1にも入らなかったから、もうダメかなとあきらめていたんだけど。 パッチのマージに尽力された方々にこの場を借りてお礼を申し上げます。
313 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:34.net] >>303 > ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の > 文字のグリフが、JIS X 0208の部分のものの半分の横幅になると > 期待すること」および「そういう表示のされ方を期待して、 > JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は > 慣習として既に広まっていることだし、 広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか? そんな期待はフォントが違うだけで無意味になる程度のものです。 > 今更目くじらを立てることではないと思っているのだが。 やれやれ…… あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。 予想では今後、Unicodeへの移行によってさらに種は増えるでしょう。 ・CJK間で、かなり異なったグリフの漢字が統合されていることによる問題。 上のレイヤーで解決すればいいのですが(たとえばHTMLのlang指定)、 安易な方法としてUnicodeの言語タグを使って実装されてしまう。 言語タグの使用は推奨されていません。 ・JIS X 0208の和字間隔、いわゆる全角空白の扱い。 存在が微妙なので、実装のされ方に互換性が無くなる可能性があります。 > 規格至上主義に走り過ぎると、 不適切な例でしたね。こちらは至上主義じゃないって言ってるのに。 予想(>>290 )どおりの愚かな展開(平行線)になってしまった。 規格自身について話を振っているのに、「規格なんて二の次だ」なんて的はずれな 返事を返すなんて……。もうちょっと認識のある人の意見を望みます。
314 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 23:44.net] >>281 > 技術者の一方的な都合で「なかったこと」にすることはできない。 日本文藝家協会の方ですか?
315 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 01:35.net] >>307 > 返事を返すなんて……。もうちょっと認識のある人の意見を望みます。 気持ちはわかるが、そういう書き方をするから不毛なやり合いになる。
316 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 12:42.net] >たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく >る可能性があるわけです。改訂版では過去との互換性があるとは限りません。 日本で作られたソフトは、まず無いと思う。 今までそれが行われていれば、今のような状況とは違ったと思うが。 もっとも、JIS X 0208:1983 やら、うにコードのように、 規格自体が腐ってる事が多い
317 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 13:12.net] >>307 あなたのような適当な考えによる実装が、今の混乱を引き起こしているのです。 どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事ができるでしょうか。 今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では 否定しているという話にすぎない訳です。(その後は主観の争いになってますが…) JISは中国のGB18030とは違い、何の強制力もありません。「いけません」と言ったところで、 結局はどこかに落ち着かなければ使い物にならないのが現実ですよね。
318 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/14 14:21.net] >>311 とはいっても、>>307 が言うように、 fullwidth/halfwidthは過去のものにすべく努力していくべきだろ?
319 名前:フグ/ハリセン本について mailto:sage [03/10/14 16:48.net] フグ/ハリセン本について CJKV日中韓越情報処理 Ken Lunde著 2002年12月発行 12,800円 www.oreilly.co.jp/BOOK/cjkv/ Data Table & Sample Code examples.oreilly.com/cjkvinfo/ Ken Lunde's Home Page www.praxagora.com/lunde/
320 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 04:31.net] >>311 > 今まで 272 さんは「規格の話をしている」と仰ってました。その通り、276-279 は規格では > 否定しているという話にすぎない訳です。 そ、それで終わりですか? あの話は掘り下げるところがまだまだあると思うのですが…… > (その後は主観の争いになってますが…) 人の意見・主調なんてすべて主観です。問題はその妥当性。 > どのような考えによる、どのような実装が、規格にもなるべく沿いつつ現実的である事が > できるでしょうか。 普通、実装をするまえに規格を洗って、それを整理しますよね。 それをおざなりにして、いきなり実装をしてもまともなものは出来ないでしょう。 過去の実装との互換性があればいい、という適当な考えならいざしらず。 > JISは中国のGB18030とは違い、何の強制力もありません。 強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。 例えばある通信プロトコルで、RFC違反のデータを送受信することは簡単です。互換性 などの理由で、やらざるをえないこともあるでしょう。しかしそれは基本的には「やるべきで はない」のです。理由は分かりますよね?
321 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/16 23:26.net] >>314 >強制力とかそんなのはどうでもよくて、使うべきではない文字は使うべきではないのです。 「使うべきではない文字」ってのを誰がどうやって決めるかっていうと、それは 情報の送り手と受け手、両者の合意によるわけだ。 「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける 手間を省くためのものだし。
322 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 02:21.net] 通信かよ!?
323 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 07:44.net] 通信だよ
324 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/17 12:34.net] 問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、 いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。
325 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/18 20:41.net] いまだにJEFつかってる銀行なんか多いくらいなので、、、 やっぱ変更せずに走らせるケースが多いのでは?
326 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:00.net] > 嘘があったり 「使うべきでない」を「使ってはいけない」と表現したり まさかMUSTとSHOULDの区別も付かないわけじゃないですよね > 重要なことが抜けてたりするので 「過去との互換を目的として」とかの例外事項を無視して 「使ってはいけない」としか書かなかったり しかも知ってて抜かすんだからより悪質ですね
327 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:03.net] 文字コードが通信が終わったら端から消えていくなら 実装を変えればそれで終わりだろうけど実際には データとしてどんどん蓄積されていくから途中で変えて はいおしまい、過去のデータは全部捨ててください なんて簡単に言えるわけない。
328 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 01:43.net] そういえば>>232 の何が結局「嘘」なのかも説明してませんね。
329 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:06.net] > 「規格」というのも結局、すべての二者関係毎に個別に合意を取り付ける > 手間を省くためのものだし。 はい、そのとおりです。 > 問題は、技術者だけではなく、ソフトウェアの顧客がそのことを理解して、 > いわゆる半角カナを JIS X 0208コードに修正する費用と時間を出してくれるかということもある。 実装の話が好きですね……。 さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの くだりがあるわけだし。したいのなら止めませんが。
330 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 20:08.net] > 「使うべきでない」を「使ってはいけない」と表現したり > まさかMUSTとSHOULDの区別も付かないわけじゃないですよね 「使うべきではない」ものを、相当の理由なく使おうとしている場合、 「使ってはいけない」と伝えても問題ないでしょう。 > 「過去との互換を目的として」とかの例外事項を無視して > 「使ってはいけない」としか書かなかったり > しかも知ってて抜かすんだからより悪質ですね また低レベルな、平行線の話を繰り返したいのですね。 > はいおしまい、過去のデータは全部捨ててください > なんて簡単に言えるわけない。 どうして捨てる必要があるのでしょうか? 新規で使わなければいいだけなのに。 > そういえば>>232 の何が結局「嘘」なのかも説明してませんね。 >>277-279 を読みましたか? 読んでも分かりませんか? そこに含めてあるんですが……
331 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:55.net] >>324 > 新規で使わなければいいだけなのに。 "今まで使えてただろ! どうにかしろ !"
332 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/24 21:56.net] > "今まで使えてただろ! どうにかしろ !" そんな人いますか?
333 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 01:28.net] とりあえず、既存の規格を無視するやつをなんとかしろよ。 docomo とか。
334 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/25 07:05.net] わざと無死してるわけですが
335 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/26 03:22.net] >>326 います
336 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:01.net] > 「使うべきではない」ものを、相当の理由なく使おうとしている場合、 誰がそんなことしてるんですか? > また低レベルな、平行線の話を繰り返したいのですね。 そもそも>>272 が低レベルな煽りから始まっているのです。 そういうのを自業自得といいます。 > どうして捨てる必要があるのでしょうか? 新しい実装で読めないからです。
337 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:04.net] > さかのぼって修正する必要はないんでは? そのために「過去との互換性」うんぬんの > くだりがあるわけだし。 それこそがまさに「相当の理由」でしょうが。
338 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:11.net] > >>277-279 を読みましたか? 読んでも分かりませんか? > そこに含めてあるんですが…… 順番に検証してみようか。 >>276 リンク先のどこにも「JIS X 0201のカタカナ」が特殊なカタカナだ なんて一言も書いてない。自分以外の愚民は使うべきでないものを 使いたくて使いたくてたまらないから「JIS X 0201のカタカナ」と 書かれていたらそれは即特殊な意味を持たせていてそれ以外の 解釈はありえないとか妄想したけりゃしてもいいけど。
339 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:16.net] > ISO-2022-JPで リンク先は「ISO-2022-JPで」使うなんて話はしていない。 7bit-JISの話なら出てくるけど。 > EUC-JP > Shift JIS そもそも「使ってはいけない」が嘘だから論外
340 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:20.net] > Unicodeの場合: リンク先にはUnicodeの話などまったく出てこないが。 そもそもJIS X 0201の話をしてるのにUnicodeが出てくること自体 ヘンだとお前さんが自分で言ってるだろ。 >
341 名前:勘違いの典型は、「UnicodeでJIS X 0201の片仮名は使えますか?」などと > いう質問で、 総論: リンク先とは無関係な、誰に言ってるのかも不明な論を 一方的にまくし立ててるだけ。 > 6:一見関係ありそうで関係ない話を始める で、どこが嘘なの? [] [ここ壊れてます]
342 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:26.net] > 広まってませんよ。WindowsのMS UI Gothicを使ったことはありますか? > そんな期待はフォントが違うだけで無意味になる程度のものです。 区別しない実装が存在することは区別しない慣習が存在することの 否定にはならない。単に区別しない場合もあれば(規格上区別する 理由はないんだから当然だが)慣習上区別する場合もあるという だけのこと。 だいたい使い分ける慣習が本当に存在しないならあんたの 大好きな規格書はありもしない慣習との互換性に配慮するために わざわざページを割いてるの? こんな初歩的な詭弁にすらツッコミが入らないようじゃ 確かにレベル低いかもね
343 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 17:40.net] > 区別しない実装が存在することは区別しない慣習が存在することの 訂正 区別しない実装が存在することは区別する慣習が存在することの
344 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 20:50.net] とりあえず引用トークはムカつくっつーことだけは よ〜くわかった。
345 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/27 21:13.net] >>337 > とりあえず引用トークはムカつくっつーことだけは fjを思い浮かべるからかな。 などと引用してみるテスト。
346 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:53.net] >> また低レベルな、平行線の話を繰り返したいのですね。 >そもそも>>272 が低レベルな煽りから始まっているのです。 > そういうのを自業自得といいます。 責任転嫁をしないように。 低レベルな話を持ち込んだのは、あなた自身の責任です。 さて、>>330-336 には、簡単に分かる間違いがいくつかあります。 ・認識不足による誤解・間違いが4つ ・引用部分とは関連のない話を持ち出して、返答しているのが1つ それぞれどこでしょう。 >>330-336 の人は分からないでしょうから、他の方で結構です。 考えてみてください。 それから、>>330-336 を書いた人への課題も出しておきます。 >> ISO-2022-JPで > リンク先は「ISO-2022-JPで」使うなんて話はしていない。 > 7bit-JISの話なら出てくるけど。 「7bit-JIS」とは?
347 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 03:57.net] 間違い探しクイズなんてしてないでハッキリ言う方が良いのでは? と傍観者は思うのでした。
348 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 04:04.net] 死めよ。おぬーら。
349 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 18:58.net] >>340 論理的思考が出来ない人間とのメタ議論は、しばしば発散するからです。
350 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 22:26.net] >>341 はっきり言いすぎですYO!
351 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:18.net] すんません! この系統に関してはドシロウトなんですが... o コードセットとグリフの関係とか o ウニコードとステートフル(ってゆうのか?)なコード体系の関係 とか に関して, そこそこまとまった資料って, どこ参照すればええんで すか? # グリフの合理的指定方法があれば何とかなるもんちゃうの???
352 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/29 23:32.net] >>339 手抜きせずに書いてやれよ。 >>276 と >>277-279 はあきらかに別人。 >>333-334 は >>272 の↓部分の補足であるものを、リンク先についての言及だと 曲解している。 >たいていの場合、JIS X 0201の片仮名用図形文字集合(いわゆる半角カタカナ)は >使ってはいけない。ISO-2022(例外あり)もISO-2022-JPもShift JISもEUC-JPも >UTF-8もUTF-16も。 >同様にJIS X 0208の一部の文字(いわゆる全角英数)も使ってはいけない。 >「?」や「/」のJIS X 0208の方もダメ。 >>335 に対しては、互換性が残されているのは、文字幅の慣習とは無関係。 あと >>272 は >>232 のリンク先について誤解していると思う。 あのページは誤りであることを承知の上で、JIS コード(と言われている文字コード)で JIS X0201 の文字集合を使う方法を紹介している。 232氏はネタのつもりだったのでは。
353 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 01:59.net] 質問 jisx0213の文字って全部unicodeに反映されたの?
354 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 02:13.net] されてない
355 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/30 10:49.net] >>347 どの程度反映されてるんでせうか?それともまったく?
356 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 00:02.net] 補助漢字にある奴は全部あるでしょ。 丸付き数字のような合成文字系は全部拒絶されてんじゃない?
357 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:48.net] 丸付き数字系は全て追加されました。
358 名前:名無しさん@お腹いっぱい。 [03/11/02 01:55.net] >>349-350 つーことは一部を覗いてほとんど入れられてるって事ですか。 ありがとうございました。
359 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:56.net] sage忘れた…すいません。
360 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/02 01:59.net] 確か追加されてないのはひらがなとアクセント付きの発音記号だけだったと思う。
361 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 13:58.net] Unicodeでの外字の扱いってどうなってんの? 使えんの?
362 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 16:55.net] PUAでいいんじゃね?
363 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/03 22:55.net] >>353 ひらがなってのは、'ん'+'゛'みたいなやつのこと?
364 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/06 17:00.net] >>353 Unicode側の言い分では「全部入れた」ことになっているんだろうけどね。 「合成で済むだろゴルァ」って感じで。
365 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/08 11:28.net] 結局混乱を増しただけだと思うんだけどなー。 あぁ、日本以外じゃ困らんから、テキトーな国際化には役に立っとるんか。
366 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:35.net] pc2.2ch.net/test/read.cgi/software/1044162360/ >>874 格納がしっかりしてれば文字コードが必ずSJISになり どの文字コードで格納するか調べる必要も無いでしょう。 >>875 予想だろうがそれが根拠で問題だと『俺は』思う。 俺の思う理由を聞いておいてそれは無いだろう。
367 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 00:47.net] >>876 その必要が有る人のみ守ってるだけでは? 普通は日本語使わないけどね。 >>877 殆どはASCIIで書かれてるからな。ASCIIはSJISで無いぞ。 稀に見かける日本語を使った書庫ではeucを使ってる。 でもSJISを使ってるのは見たこと無いとも書いたが。 >>878 作者は仕様を守るべきなんじゃない? それが出来ないなら作らなければ良いだけ。 仕様を制定するのが自分なら殆ど負担は無いだろう。
368 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:19.net] >UNIX上でも SJIS 使ったのしか見たこと無いね。 俺は無いな、少なくとも配布されてるものに関しては。 >仕様を制定したのと、UNIX版作ってる人は別人。 >同一人物でも仕様をコロコロ変えるのはどーかと思われ。 これは誤解を生んじゃったな。 lhaの事じゃなくソフトウェア作者の苦労の事を書いただけだから その辺の事は分かってるし同意。 >仕様が無い場合という仮定の話なので文字コードは SJIS とは限らない。 格納をしっかりすれば仮定の話は何の意味も無い。
369 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:35.net] >それらの書庫はファイル名に関する仕様を守ってる。 日本語ファイル名を格納してる書庫の話でしょうが。 ASCIIファイル名は日本語扱うときはSJISでって仕様を満たしている訳じゃない。 >必要がある人は自力で実装すれば良い、 >という事のどこに問題があるのかサッパリわからん。 それじゃぁ自力で実装する力の無い人、そもそもそんな事考えて無い人が作った 書庫は不正書庫になってしまうじゃないか。 大抵の人はlhaにそんな仕様が有る事すら知らないだろう。 何べんも書くけど守られない仕様は仕様の機能を果たさない。 仕様がしっかり守られるならば解凍時の文字コードも気にしなくて良い。
370 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:38.net] >ファイル名に関する仕様が無い場合、 >UTF-8 でも SJIS でも EUC でも仕様的に問題なく「しっかり格納」できる。 lhaはSJISで格納すると言う仕様が有るんでしょ。勝手になくさないで。
371 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 01:59.net] >ファイル名に関する仕様は満たしてる。 日本語のファイル名の話をしてるんだから・・・。 関係ない話を持ち出さない。 >何べんも書くけど仕様は概ね守られてる。 >例えば、信号無視する人間が延べで 5%居た場合、信号は機能を果たしてないのか? たとえ話は嫌いだが、、、この場合その5%は必ず事故るわけだから信号の機能を果たしてるとは言いがたい。
372 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:30.net] 向こうで暴れてる困ったちゃんをどうにかしろよ
373 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 16:44.net] lhaの書庫はパス名にShift JISを使うって仕様だったのか。知らなかった。 どこに書いてあるんだろう。
374 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/25 17:57.net] >>365 ここで暴れてる困ったちゃんもどうにかしてください。
375 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 08:55.net] >>366 昔のlhaのドキュメント
376 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 09:36.net] >>368 Vectorにある吉崎氏の実行ファイルとソースのアーカイブ内には そういう記述はみあたらなかった。 www.vector.co.jp/vpack/browse/person/an000224.html 「昔のlha」は持ってないしなぁ。 ただ、UTIL.Cにiskanji(c)というマクロがあって、それはShift JISを 想定しているっぽい。 #define iskanji(c) ((uchar)(c) >= 0x80 && (uchar)(c) <= 0x9f || \ (uchar)(c) >= 0xe0 && (uchar)(c) <= 0xfd)
377 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 11:18.net] >>369 lha for UNIXの方だったかもしれん。 だったらそんなに昔じゃないなスマソ
378 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 15:56.net] 詳しくは知らんが、YosshiがSysopやってたflaboでは 過去ログ(LZHで固めた奴)にSJISファイル名使ってたような…
379 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:35.net] いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、 どっかでそれを仕様として確定したと思うんだよ。 それがlha for UNIX以前か以後かがよー分からん。
380 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:40.net] よーわからんけどlha for UNIX以前か以後かって区分は重要なの?
381 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 16:57.net] >>372 > いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、 だろうね。 > どっかでそれを仕様として確定したと思うんだよ。 これが、「誰が」「どこで」確定したのか情報希望。
382 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 18:46.net] よーわからんけど「誰が」はともかく「どこで」は重要なの?
383 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 23:01.net] ☆ チン マチクタビレタ〜 マチクタビレタ〜 ☆ チン 〃 ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ヽ ___\(\・∀・) < 「誰が」「どこで」確定したのか情報まだ〜? \_/⊂ ⊂_ ) \________ / ̄ ̄ ̄ ̄ ̄ ̄ /| | ̄ ̄ ̄ ̄ ̄ ̄ ̄| | | .愛媛みかん. |/
384 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/26 23:06.net] >>375 > よーわからんけど「誰が」はともかく「どこで」は重要なの? 必ずしも吉崎氏が策定する必要は無いんだよ。 仮に「LHA Open Group」でもいいわけだし。 そういう意味の「どこで」ってこと。
385 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/27 00:38.net] >>377 > 仮に「LHA Open Group」でもいいわけだし。 それは「誰が」だと思うんだが… まぁどっちでも良いけど。 ところで「LHA Open Group」って実在する組織なん?
386 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/27 00:40.net] >>378 > ところで「LHA Open Group」って実在する組織なん? いやー俺の脳内団体だよ。「誰が」だけだと「吉崎氏に決まってるだろ」と なりかねないので書いたのだけれど、よけい混乱させちゃったみたいで 申し訳ない。
387 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/01 10:58.net] 過去の経緯としてはShift JISが仕様だったのかもしれないが、 # 補助漢字や第三/四水準はどうなっているのだ? それだとASCIIな人と日本語な人以外は困るから、 アーカイブ内のパス名はUTF-16で保存することにして、 システムごと、あるいはロケールごとに、iconvして展開するのがいいんじゃないの? アーカイブ形式に形式のバージョンを持てないの? 大体、今やWindowsやMac OS Xだって、 UTF-8のパス名持てるんだから、Shift JISのままじゃ困るんじゃないの?
388 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/01 11:06.net] >>380 そこでなぜUTF-16。こういう場合はUTF-8だろう。 lhaは圧縮形式としてlh5, lh6, lh7などが選べたはず。 これが規定するレイヤーによっては、「lh8はUTF-8」という風にも
389 名前: 出来るだろうね。多分やらないだろうけど。 [] [ここ壊れてます]
390 名前:380 mailto:sage [04/03/01 11:16.net] >>381 追記。なぜ「やらない」かというと、lhaは歴史的な経緯では小型の システム(DOS)で使われてきたし、現在もそういう風に使われている (マザーボードのBIOSとかね)。ここでUnicodeをサポートために巨大な 変換テーブルを持たせるのは、lhaの方向性にあわないだろう。 そういうのが必要なら、もっと富豪なアルゴリズムを持つ書庫の仕様に 含めればいいのだ。
391 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 03:34.net] >>380 > それだとASCIIな人と日本語な人以外は困るから、 日本人以外は使ってないので困らない。 > アーカイブ形式に形式のバージョンを持てないの? 持てません。
392 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 03:41.net] >>381 > これが規定するレイヤーによっては、「lh8はUTF-8」という風にも 面白いアイデアだと思うけど、 全く問題無しってわけにもいかないと思うよ。 例えば この新仕様に対応してないバージョンで、 書庫->書庫で圧縮されたファイルコピーする際に SJIS(元書庫)->EUC(中間処理用)->SJIS(先書庫) みたいな変換 食らった場合、元書庫で UTF-8 使ってると化ける可能性がある。
393 名前:381 mailto:sage [04/03/02 09:04.net] おっと、382を書いたのは381だ。名
394 名前:O欄は間違い。 [] [ここ壊れてます]
395 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/02 09:27.net] >>384 「規定するレイヤー」っていうのは、「lh5, lh6, lh7などが書庫の形式のレイヤーを 規定しているなら」って意味で書いた。でもどうやらファイル一つ一つの圧縮方法 にしかすぎないようだね。というわけで俺の案は没。理由は384の言うとおり。
396 名前:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ [04/03/05 10:17.net] ( ゚Д゚)<呼ばれた気がした
397 名前:名無しさん@お腹いっぱい。 [04/03/05 20:23.net] >今現役でSJISつかってるのMSくらいだし。 NTはunicodeだろ。 むしろsjisもjisもeucも無くなれ uncode以外のコードは要らん
398 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/05 20:57.net] >>388 はMarkus Kuhn
399 名前:名無しさん@お腹いっぱい。 mailto:sage; まぁ俺より金も名誉もあるけどな [04/03/06 14:12.net] Markus キター。 アイツは頭がオカシイとしか思えん。
400 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/06 20:10.net] 388 が欲しいのは 「うんこーど」。 Markus とベクトルは違えど頭がオカシイのです。
401 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 08:40.net] >>388 普通のプリンタの内部コードはJISだろ。そうじゃないのもあるのかな?
402 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/08 11:51.net] >>389 Markus KuhnとMarkus Scherer(@IBM)は別人なんだね。混同してた。 Markus Kuhnのいかれたエピソード希望。語ってください。