EUCボクメツ委員会

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2ch.scのread.cgiへ]
Update time : 11/30 16:27 / Filesize : 244 KB / Number-of Response : 873
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

EUCボクメツ委員会

1 名前：ﾓ･ｸ･ﾍ･ｹ菽ｦｯ [01/10/16 00:18 ID:ZujZqkcr.net]: Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたＹＯ
せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ
意味ないじゃん！
Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO
Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。
267 名前：login:Penguin [02/02/07 20:40 ID:txThOpuJ.net]: よーしパパ LASER5 7.2exp の不具合張っちゃうぞ。
www.laser5.co.jp/support/l5linux/faq/72exp/index.html (Q6)

使う使わない、個人の好みの問題は別にして
ちゃんとサポートしれ。
268 名前：login:Penguin [02/02/09 16:35 ID:CI8k4gxh.net]: まあ、Shift-JISみたいな腐れフォント使ってる奴は死ねってことで。
269 名前：login:Penguin mailto:sage [02/02/09 16:37 ID:9Rjes/Sh.net]: フォント関係あんの？
270 名前：おむこさん志望 ◆GqCwfDSA mailto:sage [02/02/09 17:18 ID:QaOYgbNI.net]: >>267
ShiftJISはフォントじゃなくてエンコーディング。
自分でsjisロケールを生成してやればja_JP.SJISでも使える。
271 名前：login:Penguin mailto:sage [02/02/09 18:12 ID:KVJYho4s.net]: まあ、UTF-16 みたいな腐れエンコーディング使ってるOSは氏ねってことで。
272 名前：login:Penguin mailto:sage [02/02/09 21:57 ID:gwaFMMy6.net]: >X向けのcharsetはISO 2022だったよね。
何度も何度も何度も何度もガイシュツなように、2022はcharsetではありません。
encoding schemeです。萎えsage
273 名前：login:Penguin mailto:sage [02/02/09 23:19 ID:5njPVTaC.net]: HTTP で charset= に encoding を書かせるのが誤解をうむ
元だよな...
274 名前：login:Penguin mailto:sage [02/02/11 23:09 ID:X+cO8gdB.net]: 元はMIME。
275 名前：login:Penguin [02/02/16 22:54 ID:KpHa2nOV.net]: age
276 名前：login:Penguin mailto:sage [02/02/16 22:58 ID:wiE/aMYf.net]: >>265
Solarisでは、インストール時にUnicode・EUC・SJISのどれかを選択しなきゃいけない。よって、defaultなんてありません。
277 名前：login:Penguin [02/02/19 18:13 ID:E1V3iarF.net]: age
278 名前：login:Penguin mailto:sage [02/02/20 02:17 ID:D4zYH0HU.net]: もう面倒だから全部UCS-4で処理しませんか？
279 名前：login:Penguin mailto:sage [02/02/20 02:47 ID:NRixr7wa.net]: >>272
ふと思ったけど、その表記ってISO-8859圏の人間だけが利用するのを想定してるっぽいな。
ISO-8859系列って、文字集合＝文字エンコーディングだから。
280 名前：login:Penguin mailto:sage [02/02/20 08:09 ID:E3jll45S.net]: もう面倒だから全部256ビットで処理しませんか？
1文字 16x16 ドットで。
281 名前：login:Penguin mailto:sage [02/02/20 14:11 ID:dIlnqa5O.net]: >>279
それは便利だ。
けど、そうすると検索性に劣る等の副作用も含む諸刃の剣。

議論が堂々巡りするなぁ、本当にこの話題は…

固定長でエスケープシーケンス無しのエンコードだと拡張性に劣る
↓
エスケープシーケンスで自由に文字集合を切替えられるようにすれば可能性は無限
↓
そうすると、文字列の任意のバイト列を取り出しても判別不能、
最初から最後まで嘗めなければ処理できなくなり、
プログラマの負担増大
↓
じゃあ、いっそ巨大な平面に全部の文字を詰めて固定長で全部処理しよう
↓
異体字を無限に許すことになり、テキストデータ等が溜っても後から検索できない
↓
じゃあ、平面を狭めよう
↓
最初に戻る (ﾟдﾟ)ｳﾏｰ
282 名前：login:Penguin [02/02/21 19:15 ID:WoLsJseW.net]: >>278
>>272にあるようにMIMEが源だけど、
MIMEってheaderに使うencodingでの空白の扱いが、
単語を空白で区切る分かち書きの世界しか意識してないじゃん。
それって結局ISO-8859圏なわけでしょ。

MIMEとUnicodeは日本からの働きかけに失敗した例だね。
283 名前：login:Penguin [02/02/27 10:34 ID:Fz3oNkse.net]: >>279
256ビットでは、異体字が多くなり易過ぎて検索が辛いです。
64ビットにしましょう。1文字8x8ドットで充分。少なくともX0208の区別は付くし。
区別が付かない文字は、包括すれば問題無し。（ｗ
284 名前：login:Penguin [02/02/27 12:57 ID:5Le7VrIb.net]: >>282
包括もそれはそれで問題だと思うぞ。
既にJISでもさんざん問題になっているが。
285 名前：login:Penguin [02/02/27 12:59 ID:EMez+aas.net]: 全角英数とか半角カナとか、なんで廃止しないの？
ネット上のゴミにしかなってないんじゃ。。。
286 名前：login:Penguin [02/02/27 13:01 ID:2qxooejq.net]: 全角英数はよく見る。需要はあんでしょ。
287 名前：login:Penguin mailto:sage [02/02/27 13:05 ID:Fv8Z2UaF.net]: 「包摂」?
288 名前：login:Penguin [02/02/27 13:07 ID:5Le7VrIb.net]: >>285
見るか見ないかじゃなくて、必要かどうかを言いたいんではないかと。
意味合いも用途も同じなのに別のコードが割り当てられてるのは
プログラム上で同一に扱いたいとき面倒なだけでメリットが何もないし。

# まぁ、いまさら廃止したとしてもユーザが使い続けてる限り
# 撲滅はできないとは思うけども。。。
289 名前：login:Penguin mailto:sage [02/02/27 13:24 ID:HUK2U80k.net]: 全角英数はデータ入力でも有害だから、
(データ処理側で変換するとしても)
IMEではdefaultで半角英数にしておけばいいのにね。

WindowsのPPP接続の電話番号設定ではよくあるトラブルの一つだな。
Dailup widzardが半角変換しないから。ユーザ名とかも。
290 名前：login:Penguin mailto:sage [02/02/27 23:41 ID:xsQ6CV0u.net]: >>280
そういや，
[0x80～0xFF]x任意個＋[0x00～0x7F]で１文字を表すようなコードって
誰も提案しないの？
＃まあ，UTF-8の変形ですかね．
これだったら任意数の文字を表現できるけど，プログラム処理は
そんなに大変にならないと思うんだけど．
291 名前：289 mailto:sage [02/02/27 23:48 ID:xsQ6CV0u.net]: 自己レス
\とか/とか:とかのコードは外さないと危ないじゃん．
逝ってきます……
292 名前：login:Penguin [02/02/28 01:40 ID:tMYcWs/N.net]: 文字コードとグリフを別々に管理するような
テキストの規格が普及してれば
全角と半角とで苦労したりしなくてすむのに。

ascii と JISX0208 で意味的に重なっている記号を
同一視するとかの問題もなくなるし。
293 名前：login:Penguin [02/02/28 03:52 ID:hiYdbzc9.net]: 全角英数と半角カナはさっさと逝くべき存在。
「メールで半角カナは良くない」っていうのが広まる直前に、
DoCoMoのアホ共が!
ISO-2022-JPに含まれてねーだろ<JIS X 0201カナ集合
294 名前：292の続き [02/02/28 03:56 ID:hiYdbzc9.net]: IMEも罪重い。
上でも書いてる人いるけど、何故デフォで全角英数にする?
Justsystem何考えてるんじゃー。
それともなんらかのメリットがあるのか?
295 名前：login:Penguin [02/02/28 04:51 ID:WilwHU5r.net]: >>292
電話会社は今でもどんどん絵文字増やしてるね。

まあencoding schemeが滅茶苦茶なのはもう諦めるから、
せめてcharacter setをちゃんと登録して、
そのcode pointくらい発表して欲しい。
296 名前：292 [02/02/28 05:01 ID:hiYdbzc9.net]: >>294
絵文字は論外だと俺は思う。

しかしこれは彼女の話なんだが、
「絵文字をセンス良く使う人は好感がもてる」
有効性(?)って点からは、iモードの絵文字は功罪半ばするところだ。

DoCoMoの絵文字コードポイントは
www.nttdocomo.co.jp/mc-user/i/tag/emoji/
もうふやさんでほしい……
297 名前：login:Penguin [02/02/28 07:02 ID:3yJTluRp.net]: 全角英数は、意味のある使われ方もしてますからねえ。
縦書きの時に、縦に書く文字と横に書く文字の違いとして使われている事がある。
そんなのは書式で表現するべきとの意見もあるでしょうが、書式で表現するべき違いか、キャラクターセットで違いを出すべきかは、文化による要素が大きい。

たとえば「…」は、英文の「...」という三点リーダ表現を日本語に取り入れ、縦書きの時に中央揃えになった記号です。
ですので横書きの時には、同じと見なされるべき文字なのです。
さらに「……」と「‥‥‥」という、日本で
298 名前：発達した六点リーダの表現方法が２種類あるキャラクターセットとなってしまっています。 これらに対して、書式で表現するべきで、キャラクターセットが間違っている、と言っても仕方無い話です。 全角英数字も同じ事ですよ。利用実体を認めないと、無意味な議論でしかないです。。 []: [ここ壊れてます]
299 名前：292 [02/02/28 09:10 ID:hiYdbzc9.net]: >>296
後半は勉強になった。ありがとう

全角英数・半角カナは静かに消えていくべきものなんだから、
新しく「存在理由」を与えないで欲しい。
・(半角かなの場合)メールに文字をたくさん詰め込める
・複数行アスキーアートで使い分け
鬱……
300 名前：login:Penguin mailto:sage [02/02/28 09:49 ID:qz/FHA4q.net]: >>295
絵文字自体の存在意義と文字コードの割り当ては同一視すべきではないと思うよん。

漢字や平仮名等の文字よりも遙かに流行り廃れの激しい領域だから、
コードを割り振って一般的に使えるようになった頃にはもう必要なく
なっているという事態ではないかと思われるけど。
（それは画像として送ってくれってこと）

結局のところアナログな「表情」や「意志」をデジタルな文字として
表わすこと自体に無理があるといえばそうなんだけど。
301 名前：292 [02/02/28 11:12 ID:hiYdbzc9.net]: >>298
DoCoMoがSMTPをコミュニケーションの手段として選んだため、
画像を文章に混ぜるのは(不可能ではないが)難しい。
となると、既存の文字を組み合わせて作る「顔文字」という
方法があるわけだが、端末の画面サイズが決めうちため送信者の
意図通りに表示されないことが多々ありえる。
そのため(問題はあるが)「絵文字」を定義するのが一番コストが少ない。

上は俺の推測。
だから、DoCoMoが勝手に絵文字をぶち込んだのは理解できる。
# むろん納得はできないがな

しかしそれより問題なのは半角カナだ。先のことを考えたなら、
メリットよりデメリットの方が大きいと思うんだが……
302 名前：login:Penguin [02/03/01 00:46 ID:9t6ixOpM.net]: 絵文字は文字コードとしては実際どこに
格納されてるの? sjis の空き?
303 名前：292 [02/03/01 05:04 ID:rxMXOdIk.net]: >>300
ユーザ定義文字(外字)用の領域のうち、後ろから10%弱に
つっこまれてる
304 名前：login:Penguin mailto:sage [02/03/01 11:27 ID:LxuMhOts.net]: >>300
>>295のURLを見よ。
305 名前：login:Penguin mailto:age [02/03/23 12:57 ID:qVojErfB.net]: 保全age
306 名前：login:Penguin mailto:age [02/04/12 22:58 ID:ee9Vglvq.net]: age
307 名前：login:Penguin [02/04/19 17:08 ID:IRZ7c+3a.net]: age
308 名前：login:Penguin [02/05/19 00:25 ID:SEv2YXyA.net]: 新coding-system提案：
iso-2022-2ch

世界初！各文字の文字幅比まで規定したcoding-system!
0x7e は tilda だが、何故か0x5cは円マークのこと。（藁

＃保全age。
309 名前：unagi [02/05/19 00:34 ID:HWW5oL9x.net]: unagi
310 名前：login:Penguin mailto:sage [02/05/19 03:01 ID:mYPYUKFp.net]: これどうよ
Coventive独自のGiga-Character-Set
www.coventive.co.jp/gcswhite.html
311 名前：login:Penguin [02/05/27 00:32 ID:NWrtA+hm.net]: 文字符号の歴史－アジア編－(ISBN4-320-12040-X)
三上喜貴著Ｂ5変型判，384頁，7500円
kyoritsu-pub.topica.ne.jp/shinkan/shin0203_03.html

こんなん出るんだね。
312 名前：login:Penguin [02/06/03 22:25 ID:SlwuhY0T.net]: ・1文字32ビットにする(Charactor Set = Encodingにする)
・UCS4を最初から作り直す

これで
313 名前：全てOKだよ。互換性問題以外は。 []: [ここ壊れてます]
314 名前：login:Penguin [02/07/02 02:05 ID:zRK+hHNj.net]: 賛成。１文字を４バイト（４オクテット）にすればよい。
C言語の文字を表す型名char をバイトサイズのデータ型と混同して
プログラミングで使うというスタイルが実に良くない。
既存のCで書かれたソースをすべてchar を byte という型名で置き換え、
Charという型名でもって、４オクテット文字をあらわす型名とし、
従来のアスキーコードは右端のバイトに埋め込み、Charが符号無しか
符号付であるかによって左の３バイトはオールゼロにするか、
あるいは右端のアスキーコードの符号付延長とする。
GCCを改造して、文字は４オクテットとして、データ―タイプbyteを
導入する。たとえばCのソース中に 'a' と文字が書かれていたら、
それは４バイトのデータになるし、"ABCD"と文字列がかかれていたら
それは全部で２０バイトになるという具合だ。
デバイスドライバーや通信プログラムには、従来の
コードとの変換フィルターを作ったりする必要があるかもしれない。
内部コードのみ４バイトとして、通信コードにはJISを用いたり、
必要に応じて圧縮をするべきかもしれない。。。。
ともかく、文字が４バイトの固定長であって、（出来れば符号無しか
符号付かをも含めて統一すべきだ）くれれば、ものごとは
実に単純明快になる。
315 名前：login:Penguin mailto:sage [02/07/02 04:50 ID:yx04ZA8s.net]: 超漢字でつかってる文字集合って4byteで表せるの？
316 名前：login:Penguin [02/07/02 05:34 ID:W8RRbPwE.net]: >>311

１文字４バイトで、"ABCD"がなぜに２０バイト？
１６バイト？　それとも俺って何かぬかしてる・・・？
文字列終端のNULLも４バイトってこと？
317 名前：login:Penguin mailto:sage [02/07/02 10:11 ID:J9ewXkSU.net]: >>313
そだろ。
なにか問題でも？高々4倍だろ。しかも、中はスカスカだから、
圧縮率高いし。
318 名前：login:Penguin mailto:sage [02/07/03 23:19 ID:4sQNVHL5.net]: レス間隔が広いな（わ

Unicodeだのいう前に「シフトJIS」統一してくれ…。
せめて名前の峻別だけでも…頼むよ。
319 名前：login:Penguin mailto:sage [02/07/04 02:20 ID:oPs3IW0a.net]: CP932でいいじゃん。
320 名前：　　　 [02/07/17 00:41 ID:TeaEgqOV.net]: ４バイト文字コードのオープンソース、あるいはGPLのライセンスによる
OSとコンパイラが完成して広まれば、それが各国の言語で共通に使える
プラットホームとなりうる。相違点は、入力フロントエンドとか、
ワープロの文則、禁則の処理の仕様とか、かな？
＃
もしも３バイトで全世界の文字が十分に利用可能であるならば、
上の１バイトは書体をあらわす指定にすることもできるかもしれないな。
（ただ、そういうことをあまやらないほうがいいという考え方もあるな）
321 名前：login:Penguin mailto:sage [02/07/17 00:45 ID:TK6Nax3r.net]: >>317
できたら教えて。
322 名前：login:Penguin mailto:sage [02/07/17 03:31 ID:tpoiTIS/.net]: トンパ文字は3バイトで収まりきるのか？
323 名前：login:Penguin [02/07/17 14:34 ID:ru8f1smn.net]: >>319
超漢字で使えるやつ？
324 名前：login:Penguin mailto:sage [02/07/17 23:45 ID:kNSTOrUx.net]: >>319 日本玄米茶？「コシヒカリっ！」
325 名前：login:Penguin mailto:sage [02/07/19 02:49 ID:PgHw/Khc.net]: なんで半角カナはあるのに半角ひらがながないんですか？
326 名前：login:Penguin mailto:sage [02/07/20 00:52 ID:b3Zy3R0n.net]: >>322
なんでだと思いますか？
327 名前：login:Penguin [02/07/21 09:46 ID:9P133XK7.net]: >>315
いちおう、JISの1997年版で各社の違いが比較され、
JIS版のShift-JISが定義されますが？
328 名前：login:Penguin mailto:sage [02/07/21 12:27 ID:h3ICbItJ.net]: はるかな未来：

文字コードは 64bit
16bit 種類のベンダーが勝手に決めるコード体系に 32bit 種類の文字／グリフと 16bit 種類のフォント表現
ベンダーの管理するサーバが常時稼動
文書記述したいときは IME にどの語にどの読みとどのベンダーのどのグリフ列を与えるかの辞書を使い
文書を視認したいときはローカルなフォントでなくサーバからその都度フォントを引っ張ってキャッシュ

コード内の各グリフ、各コード間の各グリフで「同じ」か「違う」かを変換するサーバを用意
しかしハイフン様の文字、「か゜」と「が」、AとＡとАとΑを同じとするかどうかのポリシーは
ベンダーが勝手に決めてその多数決、ユーザー有志も常に多数決に投票可
マッチングのたんびに多数決の結果がどうなってるかサーバに問い合わせ

ｱﾋｬﾋｬﾋｬ
329 名前：login:Penguin mailto:sage [02/07/21 20:00 ID:TcSW6VAc.net]: >>325
多数決より、 option で指定できた方が良いな…
異体字の同一視とかも、その都度指定したい。
330 名前：login:Penguin mailto:sage [02/07/22 03:01 ID:Wv+UJQXs.net]: >>322
X68000にはあったはず。
1/4角文字とかも。
331 名前：login:Penguin mailto:sage [02/07/22 21:51 ID:ZW0bDY+f.net]: >>322

MSX にもあったぞ
332 名前：login:Penguin mailto:sage [02/07/24 01:18 ID:6Xasd6b0.net]: >>315
JIS X 0208:1997附属書1ですね。

せめて「増補改訂 JIS漢字字典」に収録の縮刷版でいいからJIS X0208と
JIS X0213を読んでから書き込んでくれ…頼むよ。
333 名前：　　　 [02/07/26 15:10 ID:hqzfU9HA.net]: 確かに、プロ―ドバンドで動画がやりとりできる時代には、
たとえ漢字全体の字の形状データ―といえども、
それほどたいしたデータ―量ではないな。
DNSのシステムのように、各国にその国のコードの体系と字形を
収めたルートサーバーがいくつかあって、階層的にキャッシュ
がされていて、最終的にはローカルマシン、あるいはその直上
にはその会社のフォントキャッシュサーバーへアクセスに
いけばよいということになるかな。文字が64ビットコードであるか
32ビットコードであるかはともかくとして、昔の磁気テープの
ANSIラベルのように、ファイルにはそれに付属したラベルが
あって、そこにどのコード体系（いつの時点、バージョンであるかも
ふくめて）で記述されているかを512オクテット程度の量で指定
したものを、外部公開用のファイルの基本のやり方とすると、
１０年２０年後に、古文章を開くときに、どの文字コードで読めば
よいかということを試行錯誤しなくてよいはずだ。
334 名前：login:Penguin mailto:sage [02/07/27 09:31 ID:aH8wXR91.net]: >>330
古文書だと、 server の維持が大変そう…
減多に使われないけど、無くなったら誰も其の言語の file を読めなくなっちゃう…
廃れて行く言語って、結構有るみたいだし…

大きさを気にしないなら、全部画像にしちゃった方が良いんじゃないかな。
font が無くても、見る事だけは出来るから。
335 名前：login:Penguin [02/08/06 08:27 ID:mZ95nMRZ.net]: ruby-talk(Rubyの英語ML)で面白い奴ハケン

www.ruby-talk.com/blade/45931
www.ruby-talk.com/blade/45933
以下同スレで発言多数

RubyのUNICODE対応に関するスレッドの中で、
Rubyを離れて日本人のUNICODE嫌いについて文句を言っている
I18Nにはそれなりに詳しくて経験あるようだが、
妙に鋭い所とアメ人特有の無神経さが同居しているような気がする

このスレのエラい人にこの人の意見に対する見解キボーン
336 名前：login:Penguin [02/08/06 16:58 ID:wkw+ALMi.net]: 横槍すまソ
私的には、UNICODEはでっかいEUCとして使う利便性だけ得られるかと
実装はUNICODEのアホンダラ!!!!!
337 名前：login:Penguin [02/08/06 23:39 ID:5RFCcanm.net]: そしてEBCDIC+JISへの回帰

っていうか、[GI] [GO] マンセー
338 名前：login:Penguin [02/08/07 20:46 ID:q4PusX4L.net]: >> 332
UNICODEって、Ver 1とVer 3の間に互換性がなかったような…
339 名前：login:Penguin mailto:sage [02/08/07 21:12 ID:1ua9JQMr.net]: そう言えば「電」はどうなった?
340 名前：login:Penguin [02/08/08 20:45 ID:h5Ite4hL.net]: とにかくだれかが、１文字＝３２ビット、もしくは６４ビットとして
内部処理されるLinuxOSカーネルとGnu-Cコンパイラを作って、それのブート
イメージあるいはブートストラップCDイメージを作ってくれれば、案外する
するっと文字コードは固定長３２ビット・６４ビットに技術が突然シフトして
移行するかもね。きわめて自然だし、へんなUNICODEのようなアメリカ帝国主義
的な要素がないから。あとはGPLだし。
341 名前：login:Penguin mailto:sage [02/08/08 21:05 ID:vwpNtz+m.net]: >>337
ワイドキャラクタって知ってる?このスレの上のほうでも出てきているんだけど。
342 名前：login:Penguin mailto:sage [02/08/09 00:28 ID:8e06bABa.net]: >>338
使い物にならないことは知ってる。
343 名前：login:Penguin mailto:sage [02/08/09 00:45 ID:K7okXid5.net]: >>339
(ﾟДﾟ)ﾊｧ?

ワイドキャラクタとは一文字の大きさが固定の文字列のことだぞ。

例えば、gtk-1.2.x & GNOME-1.xはシステム標準のワイドキャラクタを使って
国際化されているし、QT-2.x, 3.x & KDE-2.x, 3.xはQStringという独自のワイド
キャラクタ文字列を全面的に採用して国際化している。

どの辺が使い物にならないか言ってみそ。
344 名前：login:Penguin mailto:sage [02/08/09 00:50 ID:K7okXid5.net]: 別な言い方をすると、

>>337とDIS10646.1あたりをワイドキャラクタの文字コ－ドに採用したのと
どう違うの?さらに言えば、UCS-4/UTF-32なワイドキャラクタを採用している
現行のglibc-2.xと>>337はどう違うんだ?
345 名前：login:Penguin mailto:sage [02/08/09 01:15 ID:8e06bABa.net]: > どの辺が使い物にならないか言ってみそ。

それぞれが独自にやりすぎちゃって互換性もクソもない。
346 名前：login:Penguin mailto:sage [02/08/09 01:28 ID:K7okXid5.net]: >>342
（　ﾟдﾟ）ﾎﾟｶｰﾝ（　ﾟдﾟ）ﾎﾟｶｰﾝ（　ﾟдﾟ）ﾎﾟｶｰﾝ

もう一度書こう。
ワイドキャラクタとは一文字の大きさが固定の文字のことだぞ。

ワイドキャラクタ関係の関数はISO Cで標準化されているし、そもそも本来はワイド
キャラクタの文字コ－ドに依存しないように書かなくてはならない。さらに、C99で
新しく定義したマクロにより、ワイドキャラクタの表現をISO10646として扱っても
よいことになった。

真っ当に国際化されているUNIXのどのシステムでどう独自にやっていてその結果
どう問題が生じたか具体的に言え。
347 名前：login:Penguin [02/08/09 01:47 ID:K7okXid5.net]: ちなみに、独自のワイドキャラクタというところが、QTの変なところであり、ある
意味まともなところ。

UNICODE固定でやるならヘタにシステム標準のワイドキャラクタをいじったりせず、
独自に突っ走ってくれたほうがよかったりする。まあ、QTは閉じた体系でQT内で全部
行うライブラリだから、独自のワイドキャラクタでも問題ないんだが。

ただ、システム側でちゃんと国際化しISO Cの国際化フレームワークに基づいたワイド
キャラクタシステムが提供され、それを使って国際化するのが真っ当な道。ISO Cの
国際化フレームワークに従いISO Cで定義された標準Cライブラリを使って正しく国際化
するなら、ワイドキャラクタの扱いで問題が生じることはないし、互換性の問題もない。
348 名前：login:Penguin mailto:sage [02/08/09 02:10 ID:K7okXid5.net]: sage忘れているし。

で、>>341はどうなんだい?
349 名前：login:toor mailto:sage [02/08/09 02:24 ID:EN04GVuN.net]: >>342
www.geocities.co.jp/SiliconValley-PaloAlto/8090/
これ読んで出直せ。
350 名前：↑おまえの名前キモい。 mailto:sage [02/08/09 08:35 ID:VJ0HrLof.net]: >>342
禿同。
あんな互換性も糞も無いような物はさっさと滅べ。
そしてこれからはICUを使えといいたい。
ついでにg++のwstring周りのヘボさをVC、BCB程度には何とかしろともいいたい。
コメント如きの解析に失敗して下らんエラー吐いてんじゃねーよ。コメントだよ。コメント。
コメントなんざ開始記号に当たったらゴール記号まですっ飛ばせ。ヴォケが。
無駄な時間使わせやがって。コメントまで一々読んでんじゃねーよ。
つーか、STL周りもヘボすぎ、いっそのことSTLportを標準で採用しる。
351 名前：login:Penguin mailto:sage [02/08/09 12:16 ID:K7okXid5.net]: >>347
ワイドキャラクタうんぬん以前にSTL自体の互換性がダメダメじゃん。その
発想で逝くならSTL自体使い物にならないからさっさと滅べになるぞ。

Unicode固定ならICUでいいと思うけどね。
352 名前：login:Penguin mailto:sage [02/08/09 21:07 ID:8e06bABa.net]: あっちこっちで独自に突っ走られたおかげで、
それらに依存したプログラムが生産されてしまうのは悲しい。

gccの L"" の実装のアホさ加減はどうにかならないのかなあ。
353 名前：login:Penguin mailto:sage [02/08/09 21:13 ID:rdAeGCpP.net]: おまえがどうにかしろ >>239
354 名前：login:Penguin mailto:sage [02/08/09 21:26 ID:K7okXid5.net]: >>349
もう一度聞くが、>>341はどうなんだ?

君の逝っているのは互換性のダメダメな独自に突っ走ったワイドキャラクタの
一種だろ。違うか?
355 名前：login:Penguin mailto:sage [02/10/14 12:33 ID:JLQPtdaZ.net]: 保守
356 名前：login:Penguin [02/10/29 20:40 ID:SYhTKn3M.net]: 保守その２
357 名前：login:Penguin mailto:sage [02/10/29 21:57 ID:a4KVTkgD.net]: >>353 は Interface 12月号を買いますた
358 名前：login:Penguin mailto:　 [02/11/10 14:02 ID:KHhL1iGr.net]: 　
359 名前：login:Penguin [02/11/17 02:01 ID:roKdiGN4.net]: 日本政府も、OSのオープンソース化を図るならば、なるべく最初から
透明な４オクテットコードによる実装を実現して欲しい。
ついでに官製のフリーなフォントも充実させて欲しい。
360 名前：login:Penguin mailto:sage [02/11/18 03:47 ID:Gf2/ARBr.net]: フォント欲しいね。
adobe が acroread 用のフォントを自由に使わせてくれるといいんだが…。
361 名前：login:Penguin mailto:sage [02/11/19 04:00 ID:Bmojh6sR.net]: >>310
そいつの名前はMULTICODEで決まりですか？
362 名前：login:Penguin mailto:sage [02/11/20 03:36 ID:ycIE/NKT.net]: 1文字4オクテットにしよーが一文字で英語の一単語と同等の
情報量を持つ漢字を扱うには根本的に無理がある

ここはやはり"肛門"は"月エ門"、"姦"は"女女女"のそれぞれ合成文字として
扱う漢字文化マンセーなCESキヴォンヌ。
しかし"多"は"タタ"なのか"夕夕"なのかでJISが大揉めになるやもしれん罠。
それに合成文字はフォントが鬼門かのう。

英語圏の人間が
grep "tel" -> telephone television telnet...
とか、接頭語等で類語を検索するように、漢字圏の人間が
grep -bushu "雨" -> 雪雷雹 ...
とできるようになる日がいつになったら来るのやら。
# ってテーブル用意すりゃ今でもできるけどさ。
363 名前：login:Penguin [02/11/20 10:29 ID:YEjhkZZC.net]: >>359
言うの勝手だが実装する奴の身にもなれやボケ。
まぁ、そんなことをしたら美しい日本語フォントが消滅するわけだが。

それ、日本語知らない外国人の発想だよ。
364 名前：login:Penguin mailto:sage [02/11/20 12:34 ID:Lrodec+Q.net]: > まぁ、そんなことをしたら美しい日本語フォントが消滅するわけだが。

まぁ、>>360のようなフォント(グリフ)のエンコードと文字符号化方式が区別できんアフォにも消滅してほしいわけだが。
365 名前：login:Penguin mailto:sage [02/11/20 12:49 ID:YEjhkZZC.net]: >>361
そんなことするなら初めから1:1対応させた方が幸せになれるわけで。
366 名前：login:Penguin mailto:sage [02/11/20 13:52 ID:60UMuHNB.net]: >フォント(グリフ)のエンコードと文字符号化方式が区別できんアフォ

合成文字だとフォントが問題になるって話なのにどこを縦に読めば
こういうレスをつけられるのか
脊髄反射もええかげんにせえやヴォケが
367 名前：login:Penguin mailto:sage [02/11/20 20:10 ID:xJzR2YEl.net]: 半角ひらがなもあったな
実際は半角かなと同じなんだが…

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef