[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2ch.scのread.cgiへ]
Update time : 04/11 14:45 / Filesize : 124 KB / Number-of Response : 537
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

SJIS撲滅運動



1 名前:ほげ [02/01/30 04:51.net]
UNICODEかEUCに統一してほしい。今現役でSJISつかってるのMSくらいだし。MacもOS-XからほぼEUCとUNICODEだし。
MP3のIDタグが統一できなくて困る!
SJISで書かれたperlとか置かれたら管理しにくくて困る!
タマにはUNIXでも日本語ファイルを堂々とつかってみたい!




210 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 14:58.net]
>>206
日本にルーズソックスを履いて棲息しているという噂を耳にしたことが
あります。

211 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 16:22.net]
>>205
全角の「?」使うなよ...

JIS X 0208 読んだこと無いのか?
はっきり「使うな」って書いてある。


212 名前:!205 mailto:sage [03/01/03 16:36.net]
>>205 そうなんだ? 知らなかったよ。

213 名前:209 mailto:sage [03/01/03 16:37.net]
s/205/208

214 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 16:45.net]
>>209 >>210

> そうなんだ? 知らなかったよ。
面白くないよ。

> s/205/208
一文字足りないのでは?

215 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 17:31.net]
>>200
utf-8-emacsか。-emacsを付けるところはやっぱり偉いね。

216 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 19:27.net]
>>204
書いてない事を憶測されても困るんですが、、、
単にFYIでリンクを貼っただけで、何らかの主張があるならそれも書きますってば。

217 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 20:47.net]
現状で問題なし。っていう人がマジョリティでしょ。

218 名前:209 [03/01/04 03:08.net]
>>211
最近 sed 使ってないから忘れてたよ。vim だとそれでオツケイなんだけどね。



219 名前:名無しさん@お腹いっぱい。 [03/01/04 04:02.net]
結局 Han unification の問題はどうなったんですか?
日本と中国の漢字を違う glyph で表示できるんでしょうか.

>>200
utf-8-emacs が内部的に使われるとなると,
iso2022 で実現できていた multi encoding 環境は
どうなるんですかね. 従来のも使えると書いてあるから
かわらないのかな.

220 名前:名無しさん@お腹いっぱい。 [03/01/04 21:38.net]
どれでもいいから一つにしてくれ・・・

221 名前:山崎渉 mailto:(^^)sage [03/01/15 13:03.net]
(^^)

222 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/24 13:10.net]
「Shit JIS」でググると結構な数ヒットするんですが、
みなさん、故意に書いてるんですかね?

223 名前:糞JIS撲滅 mailto:sage [03/01/24 13:49.net]
DoCoMo 用の CGI のコメントに故意に書いたことならあります。

224 名前:山崎渉 mailto:(^^) [03/03/13 17:30.net]
(^^)

225 名前: mailto:sage [03/03/14 00:28.net]


226 名前:半角カナのないコードは糞! []
[ここ壊れてます]

227 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/20 00:05.net]
とりあえず、2ch見ているうちは半カナは必須かな?と言ってみる。

228 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 02:49.net]
>>222
半角カナのないコードってあるの?



229 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 04:09.net]
jis ってあったっけ?
そういえば unicode はどうなの?

230 名前:224 mailto:sage [03/03/21 07:16.net]
>>225
ISO-2022-JP も EUC-JP も Unicode も半角カナあると思うんだけど?

231 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 08:12.net]
それはねこみみです

232 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 10:17.net]
>>226 では ISO-2022-JP で「半角カナ」を使う方法を教えてください。

233 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 10:52.net]
>>228
カナの幅が高さの半分くらいのフォントを使う。

234 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 11:34.net]
はい次。

235 名前:224 mailto:sage [03/03/21 15:44.net]
>>228
すいません、勘違いをしておりました。
JIS で定義されてる ESC ( I は、ISO-2022-JP (RFC1468) には無いのでつね。

236 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 02:08.net]
>>228
www2d.biglobe.ne.jp/~msyk/charcode/jisx0201kana/

237 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 03:18.net]
ISO−2022−JP 【通信用語:情報符号編】
[アイエスオウにーまるにーにージェイピー] (ISO-2022-JP) 〔固有名詞/+規格〕
/COMP/MARK/CHR/CODE/ENC/JA … 日本語
◇複数の言語文字 (文字集合) を切り替えて利用する ISO-2022 のサブセット規格で,
日本語文字コードの符号化を規定した仕様. RFC 1468 で規定されている.
◇JIS X0201 前半の英数記号と, JIS X0208 第 1・2 水準漢字, そして旧 JIS 漢字
集合の JIS C6226 互換 (JIS X0208:1973) をサポートしている. つまり, JIS X0201
後半のカナ (通称半角カナ) はサポートされていない.
◇この後継仕様に, ISO-2022-JP-1 (RFC 2237) や ISO-2022-JP-2 (RFC 1554) など
がある.

※コラム(サポートする文字集合)
reg# character set ESC sequence designated to
─────────────────────────────────
6 ASCII ESC 2/8 4/2 ESC ( B G0
14 JIS X0201-Roman ESC 2/8 4/10 ESC ( J G0
42 JIS C6226:1978 ESC 2/4 4/0 ESC $ @ G0
87 JIS X0208:1983 ESC 2/4 4/2 ESC $ B G0
─────────────────────────────────


238 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 03:20.net]
jis もいっぱいあって、わかんないよ!!!



239 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 01:34.net]
ネジの規格もJISだしね!!!

240 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 02:51.net]
iso2022 の G0 とか G1 とか GR とか GL とか、
わけわかんない概念はどっからきたの?

241 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 04:14.net]
フォントロード可能な文字端末

別にわけわかんないことはないでしょ?
ただ今となっては一段間接が余分だね。


242 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 04:15.net]
あ、フォントロード可能なプリンタもね。

243 名前:山崎渉 mailto:(^^) [03/04/17 12:23.net]
(^^)

244 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

245 名前:名無しさん@Emacs [03/04/27 01:20.net]
お前ら、新しいエサですよ。

Unicode 4.0 Released!
www.unicode.org/versions/Unicode4.0.0/

246 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

247 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/27 02:28.net]
変なのが食いついてるよ。

248 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん



249 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/14 17:09.net]
I hate UNICODE :-)

250 名前:名無しさん@お腹いっぱい。 [03/07/01 02:39.net]
unicodeで表示できてJIS系で表示できない漢字はなにがありますか?

251 名前:名無しさん@お腹いっぱい。 [03/07/01 06:18.net]
JIS X 0221:2001はExtension Bが未収録(Unicode 3.2未対応)なので、
ざっと45,000字ぐらいは表示どころか扱うこともできねい筈だす

252 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 14:01.net]
>>246
とりあえずマルチポストいくない。
必要なければ UTF-8 にする事はお勧めしない。

253 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 21:51.net]
>>246
表示つーのがもうどう答えていいもんだか分からないけど、
JISで定義されてない漢字はJIS系では扱えないだろ。大陸の奴とか。

>>247
それ、JIS X 0221:2001で扱えるけど、Unicodeだと扱えない漢字(だけじゃないけど)じゃん。
丸つき数字なんかは永久に入らないんだろうな。
第3,4水準南無〜

254 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 22:02.net]
Unicode って字を組み合わせる規格なかったっけ?
〇と 1 とか。

255 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 22:46.net]
あるけどさ。
口{〇, 1} こんな感じで三文字に。(丸付き一)
口{〇, ‖{3, 4}} こんな感じで四文字に。(丸付き三十四)
こういうので済むなら、丸つき数字を文字集合に含める必要ないしな。
白抜きがどうにもならんし。

256 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

257 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

258 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 07:57.net]
へーこんな仕組みできたなんて知らなかった。
管直人もいろいろ工夫してるもんだね。なにが条件になってるんだろう?



259 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

260 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 17:05.net]
SJISよりも関西弁を撲滅してください

261 名前:名無しさん@Emacs mailto:sage [03/08/15 01:19.net]
>>256
なんでやねん?


262 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

263 名前:あぼーん mailto:あぼーん [あぼーん.net]
あぼーん

264 名前:ヽ(´ー`)ノ mailto:sage [03/08/18 11:21.net]
>>254
山崎渉って From に書くと fushianasan になるんじゃなかったっけ?


265 名前:名無しさん@お腹いっぱい。 [03/10/09 04:56.net]
www.cbook24.com/bm_detail.asp?sku=4901676156

266 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/09 23:45.net]
SJISはいいけどCP932を撲滅しる。

267 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/10 17:57.net]
互換性がなくなるから無理

268 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 00:36.net]
つーかCP932が非互換の元凶。



269 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 02:02.net]
うにコードだって、別にUTF-8だけじゃないしなぁ・・・









いわゆる駄スレってこれのことか?

270 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 13:43.net]
UCS-4 で満足だとでも?

271 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 14:25.net]
ゼロから作りなおさないかぎり Unicode はすべてクソ。

272 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 14:39.net]
>>267
ゼロは無だと思うから「作りなおす」ことはできない
ゼロから作りあげるが適切

273 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 21:41.net]
UnicodeはBOMがウザい。誰だよあんな余計なもの考えた奴は。

まぁ、実際は文字コード以上に改行コードの違いがウザい訳だが。

274 名前:名無しさん@お腹いっぱい。 [03/10/12 02:43.net]
www.alanwood.net/

275 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 13:05.net]
どれでもいいからひとつにしてくれ・・・マジで

276 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 23:18.net]
>>232
> www2d.biglobe.ne.jp/~msyk/charcode/jisx0201kana/

そのWebサイトに書いてあることは嘘があったり重要なことが抜けてたりするので
あまり参考にしない方がいい。

たいていの場合、JIS X 0201の片仮名用図形文字集合(いわゆる半角カタカナ)は
使ってはいけない。ISO-2022(例外あり)もISO-2022-JPもShift JISもEUC-JPも
UTF-8もUTF-16も。
同様にJIS X 0208の一部の文字(いわゆる全角英数)も使ってはいけない。
「?」や「/」のJIS X 0208の方もダメ。

277 名前:名無しさん@お腹いっぱい。 mailto:hage [03/10/12 23:40.net]
UTF-8撲滅sage

278 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 23:55.net]
>>272
で、使ってはいけない理由を言おうとはしないわけですね。



279 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 00:11.net]
>>272
> そのWebサイトに書いてあることは嘘があったり重要なことが抜けてたりするので
たとえばどの辺ですか?

280 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 00:30.net]
「半角片仮名」という言葉が間違いで「JIS X 0201片仮名」というのが
正しいのだ、と覚えた人には、単に言葉を置き換えればよいと思って
いる場合があるようだ。これは肝心なところを誤解している。

何が誤解かというと、JIS X 0201に含まれる片仮名は、普通の「片仮名」
なのであって、「半角片仮名」でもなければ「『JIS X 0201の片仮名』
という名の特殊な片仮名」でもないということ。普通の片仮名なのだから、
JIS X 0208に含まれている片仮名と何の違いもない。

つまり、シフトJISのようにJIS X 0201と0208を組み合わせたコードでは、
同じ「ア」という文字に対して(1バイトと2バイトの)ふたつの異なる
符号化表現を割り当てている(重複符号化)のであって、「半角ア」と
「全角ア」という(あるいは「JIS X 0201のア」などと呼ぶにせよ)

281 名前:
2つの異なる文字があるのではないということ。ここを勘違いした議論は、
どこまでいっても勘違いに終わっている。

勘違いの典型は、「UnicodeでJIS X 0201の片仮名は使えますか?」などと
いう質問で、「JIS X 0201の片仮名」などという特殊な片仮名がこの世に
存在しない以上、「Unicodeには片仮名はありますよ」と答えるほかない。
(意地悪な答えだけど)
[]
[ここ壊れてます]

282 名前:272 mailto:sage [03/10/13 03:18.net]
ISO-2022-JP、EUC-JPの場合:
使ってはいけない理由の根本はISO/IEC 2022にあります。JISでいうとJIS X
0202。「7.5 図形文字の一意な符号化」にはこう書かれています。
----ここから引用----
同じ文字が8ビット又は7ビットの符号の符号要素のG0, G1, G2及びG3として、指
示される複数の図形文字集合に現れることがある。このような文字は、二つの集
合を定義する仕様又はISO符号化文字集合の国際登録簿で同じ名前をもつ場合、
同じ文字とみなされる。
同一の文字が複数の集合に割り当てられている場合、その文字は、その文字が割
り当てられた任意の符号要素のG0, G1, G2又はG3から取り出された符号化表現で
表現されてよい。
この規格を適用する場合、情報交換の際にすべての文字が一意の符号化表現をも
つことを要求されるとき、符号の版の規定(10.1参照)で、その制限を明らかにし
なければならない。
符号の一意化の制限を適用した場合、その文字が割り当てられた最下位番号の符
号要素(G0, G1, G2及びG3の順)から符号化表現が表現される。この場合、たとえ、
高位番号の符号要素が既に呼び出されていて、かつ、その文字が割り当てられて
いる下位番号の符号要素が呼び出されていないときでも、高位番号の符号要素の
文字の符号化表現は、使用しない。
----ここまで引用----

「二つの集合を定義する仕様」というのはこの場合JIS X 0201とJIS X 0208です。
さて、例の「使うとまずい文字」の名称はどうなっているか? なんとJIS X 0201
とJIS X 0208でまったく同じです。たとえば「ア」は両方とも「KATAKANA
LETTER A」ですし「?」は「QUESTION MARK」です。つまり半角と全角の二つの文
字があるのではなく、「ア」という文字があってそれが二つの集合に存在するわ
けです。続きを読みます。

283 名前:272 mailto:sage [03/10/13 03:19.net]
・一意の符号化表現が要求された場合はG0〜G3のうち、若い数字の方を使う。
・そうでなければG0〜G3のどれを使っても良い。

ISO-2022-JPはASCII、JIS X 0201 ラテン、JIS X 0208をG0に指示して使います。
EUC-JPはASCIIをG0、JIS X 0208をG1、JIS X 0201 片仮名をG2、JIS X 0212をG3
にあらかじめ指示してあります。ですから、EUC-JPで一意の符号化表現が要求さ
れた場合は、JIS X 0201 片仮名とJIS X 0208の一部は使えません。
ところで、ISO-2022-JPはそもそもJIS X 0201 片仮名を含んでいません。なので
ISO-2022-JPでJIS X 0201 片仮名を使おうとするのは「論外」です。ちなみに
ISO-2022-JP-2、ISO-2022-JP-3にも含まれていません……。
閑話休題。実は、ISO-2022-JPやEUC-JP自身は一意の符号化表現を要求していま
せん。よってかぶっている文字はJIS X 0201とJIS X 0208のどちらを使ってもか
まわないわけです。結局同じ文字なのですから、そもそも使い分け自体が無意味。
日本語を処理したり表示するときには、二つともまったく同じ文字として扱わな
ければいけません。現存する処理系は壊滅状態ですね。
さて本当にどちらを使ってもいいのかというと、これはJISで決まっていて、JIS
X 0208のかぶっている方については「過去との互換性が要求されるとき以外は使
うな」と書いてあります(JIS X 0208の7.2, 7.3, 9.2)。

まとめますと、
ISO-2022-JP……全角英数は使えない。半角カナは存在しないので論外。
EUC-JP……全角英数は使えない。半角カナは一意の符号化表現が要求されない場
合問題ない。ただし、その場合は全角カナとまったく同じ表示・処理にすること。
しかし、実現出来ていない現状では半角カナは使わない方がいいと思います。

Shift JISの場合:
JIS X 0208の4.2, 4.3, 4.5に書いてあります。「全角英数・半角カナは使うな」
あとJIS X 0201 片仮名の割り当ては削除の予定だそうです。

284 名前:272 mailto: []
[ここ壊れてます]

285 名前: mailto:03/10/13 03:20.net [ 例外として、ISO-2022-JP、Shift JIS、EUC-JPで過去との互換を目的として、二
つの文字を区別したい場合はどうするか。JIS X 0208の付属書5にあるように、
JIS X 0201 片仮名にHALFWIDTH、JIS X 0208 数字・ラテン文字・特殊文字に
FULLWIDTHをつけた代替名称を使って区別します。この場合のみ、かぶっている
二つの文字は別物として扱うことが出来ます。

Unicodeの場合:
○East Asian Scripts
・Halfwidth and Fullwidth Forms: U+FF00?U+FFEF
(省略)
As with other compatibility characters, the preferred Unicode encoding
is to use the nominal counterparts of these characters and use rich text
font or style bindings to select the appropriate glyph size and width.
まずい方の文字は使うな、ということです。ただし全角・半角は別物として扱う
ようです。
]
[ここ壊れてます]

286 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 07:21.net]
>>272
> UTF-8もUTF-16も。

こりゃ言い過ぎだ。

287 名前:名無しさん@Emacs mailto:sage [03/10/13 14:18.net]
>>276-279
理想論をただ書き連ねただけのオナニーだな。

実際のアプリケーションでは、過去の文書データと
一切関わりなく使用されるようなことはまずない。
「過去との互換性が要求されるとき以外は使うな」というのは
文字コードの世界ではほとんど意味のない制限だ。
UnicodeもCP932も、いわゆる「半角カナ」も「機種依存文字」も
既に存在しているものであり、技術者の一方的な都合で
「なかったこと」にすることはできない。

288 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 14:22.net]
>>281

> UnicodeもCP932も、いわゆる「半角*カナ*」も「機種依存文字」も

今あなたが書いたのは「新規」のものだろう。
どこに必要性があるんだ。使うなよ。




289 名前:281 mailto:sage [03/10/13 15:00.net]
>>282
いやあ、スマンスマン。
本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。

「文字コード」ってのは、コミュニケーションの手段である文章を
どうやってデジタルデータに落とすかって話の一部でしかなく、
規格書に記述されていることが全てではない。

半角カナを使って煽りの気持ちを表現したり、
Ascii artのように文字のグリフだけに意味を持たせたりと、
そういう規格書では定義されていない「文化」が
既にあちこちで使われている。

そういう背景を無視して、機械的に「半角カナ→全角カナ」のような
フィルタをかけ、(行間じゃなく)文字コードの間に込められた意味を
消してしまうのは、技術者のエゴじゃないかなと漏れは思うわけよ。

290 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:11.net]
>>283

そういうのは上のレイヤーでやるべきことで、文字自身にもたせるものではないんです。
所詮、フォントを変えただけで消し飛ぶようなものですから。

291 名前:281 mailto:sage [03/10/13 15:22.net]
>>284
> そういうのは上のレイヤーでやるべきことで、文字自身にもたせるものではないんです。
> 所詮、フォントを変えただけで消し飛ぶようなものですから。

もちろん漏れも技術者のはしくれなんで、そういう「理想論」は理解できる。
# つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ただ、そういう事情を理解した上で、
「結局、『理想論』は理想論でしかない。」
と言いたいわけよ。

292 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
>>285

> # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。

ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
JISは読みましたか?

> ただ、そういう事情を理解した上で、

全然理解してないですね。

> いやあ、スマンスマン。
> 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。

こんなことを書く程度ですし。

293 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:33.net]
手書きでも半角カタカナとか全角英数字を浸透させちゃえばいいんだよ。

294 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:39.net]
四半角仮名や四倍角英数字が Unicode に入るのはいつですか?

295 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:47.net]
>>286
かっかし過ぎ。

296 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:59.net]
>>289
かっかしてるわけじゃなくてね、>>281 程度の認識しか持たない人が
しばしば愚かなことを書くからガッカリしてるの。>>281 程度の話は、
今まで数え切れないほど行われてきた。>>276-279 を読めば、こちらが
もっと上のレベルの話をしたいってことは分かると思うんだけどね……

本当は >>276 の人と意見を交換したくて、がんばって長文を書いたんだけど
出てこないかなぁ。

297 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:01.net]
>>290
> もっと上のレベルの
レイヤは上かもしれないが
レベルは上じゃねーよ。
過去の実装を無視して規格だけこねくりまわしても無意味。

298 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:03.net]
>>291
そういうのは規格を読んでから言ってね。



299 名前:292 mailto:sage [03/10/13 16:11.net]
> そういうのは規格を読んでから言ってね。
こんなことを書くと、またアホが「規格規格とうるさい原理主義者」とか言いかねないので
補足しておく。まともな技術者なら、なにかを実装したりする場合一次情報にあたるのは
当然のことなんだ。たとえばHTMLを扱うならW3Cの勧告を読むのは当然だし、もしかすると
HTTPのRFCを読まないといけないかもしれない。
こちらが言っているのは、「規格は至上のものである」ということじゃなくて、日本語の処理を
するなら、読んで当然だってことなんだ。

300 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:13.net]
厨な質問ですいませんが、たとえば、2ちゃんねるなんかは、
「半角カナ」と「全角カタカナ」の使い分けが当然のように行われているわけですが、
これは「過去との互換性が要求されるとき」に合致するのではないの?

301 名前:291 mailto:sage [03/10/13 16:31.net]
「だけ」と書いたのが読めんのか。

302 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 16:39.net]
>>295
だから、規格さえ読んでない人は論外なんだって。

303 名前:281 mailto:sage [03/10/13 17:28.net]
>>286
> > # つーか、仕事でも文字コード関連の問題には何度もぶち当たっているし。
> ぶつかるだけなら日本語を含むHTMLを書くだけでもぶつかります。
> JISは読みましたか?
当然読んでいる。
技術者として、JISやW3Cなどの規格を読むのが
最低限必要なことなのは言われなくてもわかっている。

おそらく、>>286はHTML3.2などで(規格に厳密に従った場合)
日本語を使用することができないってことなどを言いたいんだと思うが、
そういう国際化の規格が決まる前から多くの実装で
日本語を含むHTMLを扱うことができていた。

規格ってのは、その実装ができる前から(もしくはリファレンス実装の作成と並行して)
作られるものもあるが、現状の実装を後追いする形で決まるものも多い。
そのような実装の後追いで決まった規格を使う場合は、
過去の実装や慣例についても十分考慮する必要がある。

特に文字コードのように、「非技術者」に対する影響も非常に大きい分野では、
「規格で推奨されていないから」という理由だけで
過去の慣例を排除するのは、現状を見ていない技術者のエゴでしかない。
# 完全に技術的分野で閉じた話なら構わんと思うがね。

> > いやあ、スマンスマン。
> > 本当は「オナニー」の部分も半角カナで書くつもりだったんだけどね。
> こんなことを書く程度ですし。
じゃあ、>>281のはじめの一文は
「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
とでも書くべきだったのか?
俺は「2chでの慣習」に従った書き方をしているだけだ。

304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 17:55.net]
>>297
> そのような実装の後追いで決まった規格を使う場合は、
> 過去の実装や慣例についても十分考慮する必要がある。

はい、そのとおりです。
しかしながらまだその先があります。
たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
ようするに過去の実装より、規格の方を重視すべきなのです。
もちろんこれは原則にすぎず、他のシステムとやりとりである以上、可能な限り
データ交換可能なものにするべきです。

つまり、「規格より過去の実装の方が重要」という点が間違っているということ
です。規格の重みづけをする場合、過去の実装以外にも考慮しなければいけない
要素がある、ということ。

> 「<煽り>理想論をただ書き連ねただけのオナニーだな。</煽り>」
> とでも書くべきだったのか?

「煽り」とか書いてる時点で人間的にどうかと思います。
それは置いておくとしても、

> 俺は「2chでの慣習」に従った書き方をしているだけだ。

これはただの責任転嫁ですよ。

305 名前:281 mailto:sage [03/10/13 19:09.net]
>>298
> たとえば既存の実装が規格とずれていた場合、次の改訂の際に規格に合わせてく
> る可能性があるわけです。改訂版では過去との互換性があるとは限りません。
> また未知・未来の実装は、基本的に規格どおりに実装する可能性が高いでしょう。
> このとき、自分が確認して合わせた実装との互換性をとってくれるとは限りません。
> ようするに過去の実装より、規格の方を重視すべきなのです。

それが現実を見ていない理想論に過ぎないと言いたいわけ。
GNU libiconvにcp932パッチがあるのは何故だ?
過去の実装や慣習を無視して新たな規格や実装を作っても、
それは新たな混乱を招くだけ。

306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:00.net]
>>299

ちゃんと >>298 を読みましたか?
あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
低すぎるといっているのです。「過去の実装との互換性」以外にも、規格
の重みづけの要素はあるんだよ、と。

> GNU libiconvにcp932パッチがあるのは何故だ?

Microsoftが他者(他社・Unicodeコンソーシアム)と協調してShift JISの
マッピングテーブルを決めるべきところを、無視して独自に実装したためです。
Microsoftのテーブルは個人的には現実的だと思っていますが、まさに

> 過去の実装や慣習を無視して新たな規格や実装を作っても、
> それは新たな混乱を招くだけ。

こういうことです。

307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 20:58.net]
そういえば、どっかの携帯会社が規格の予約領域を勝手に使っていましたね。

308 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 22:17.net]
で、何番の発言が AoiMoe なの?



309 名前:281 mailto:sage [03/10/13 22:42.net]
>>300
> あなたは「過去の実装」だけしか考えていないので、規格の重みづけが
> 低すぎるといっているのです。

そうか? 別に規格をないがしろにしている気はないのだが。

ただ、「Shift JISにおいてJIS X 0201片仮名が割り当てられている部分の
文字のグリフが、JIS X 0208の部分のものの半分の横幅になると
期待すること」および「そういう表示のされ方を期待して、
JIS X 0201片仮名とJIS X 0208片仮名を使いわけること」は
慣習として既に広まっていることだし、
今更目くじらを立てることではないと思っているのだが。

> > GNU libiconvにcp932パッチがあるのは何故だ?

これは俺の表現がまずかった。
俺が言いたかったのは、「何故cp932パッチが本家に統合されずに
別々に配布されなきゃならんのか」ってこと。

確かに>>300の言う通り、cp932のマッピングテーブルはMicrosoftが
勝手に決めてしまったもの。そのためGNU libiconv本家は
cp932パッチの統合をかたくなに拒んでいる。
しかし、日本でiconvを使う場合、cp932のサポートは
もはや必須と言えるため、日本の多くのユーザが
GNU libiconvにわざわざcp932パッチを当てて使っている。

規格至上主義に走り過ぎると、かえってユーザの利便性が
損なわれることがあるって例のつもりだったんだけどね。

310 名前:281 mailto:sage [03/10/13 22:46.net]
>>302
少なくとも俺は違うぞ。(w






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<124KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef