[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2ch.scのread.cgiへ]
Update time : 11/30 16:27 / Filesize : 244 KB / Number-of Response : 873
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

EUCボクメツ委員会



1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO
せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ
意味ないじゃん!
Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO
Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。

196 名前:194 [01/11/06 23:03 ID:65m4RrJp.net]
かんちがいだった。UCS-2,UCS-4はエンコーディングには使われてないですね。
確認せずに書いてスマソ。

UCS-2を変換せずそのままエンコーディングに使った場合、それは UCS-2と呼ばず、UTF-16と呼ぶ、ということだな。

197 名前:login:Penguin [01/11/06 23:30 ID:RTd7nfRF.net]
>>194
OpenType は Apple かんどるからのぅ。
ATSUI はちゃんと対応してるらしい。

ので、MS のいう「UTF-16」が、サロゲートペアも含めてフル実装されとんかいなと怪しんでたり。
BMP領域だけだったらすべて2bytesだから、内部コードとしてはとっても扱いやすいくて、昔からやってるんだと思うのね。
けど、サロゲートペアがでてきてとたんに固定長じゃなくなったところで、実装がナニになりそうとか。
XKPとやらがそうなんだっけ? < サロゲートペア実装

198 名前:login:Penguin [01/11/06 23:44 ID:KdJ6KYbO.net]
XKPは外字領域の独自運用じゃなかったっけ?

199 名前:login:Penguin [01/11/07 00:01 ID:fD9Y8+Ov.net]
>>196
でも サロゲートペアありの UTF-16って、Shift_JISみたいなもんですよね。
Shift_JISの場合、第1バイトは必ず、どの半角文字とも重ならない値が来るけど、第2バイトはASCII領域の文字も来たりする。
UTF-16の場合、サロゲートペアの最初の2バイトは、ほかのどの文字とも重ならない「最初の2バイト専用」の値しか取らないし、次の2バイトも同じく「次の2バイト専用」の値しか取らないので、Shift_JISよりは簡単なはず。

200 名前:login:Penguin [01/11/07 02:52 ID:ZhpFSFFf.net]
結局 Unicode は本格的に多国語を使うには向いていないってことですか?
CJK でそれぞれの国がそれぞれの国専用のグリフを使うってことで.

201 名前:login:Penguin mailto:sage [01/11/07 03:44 ID:2zLC4FRt.net]
>>199
どっちかというと、筋の善し悪しの話ですな。

Unicode が貶されるのは、デザインの筋が悪いからなんですね。
でも、他に多言語のことをちゃんと考えてるコード体系がほとんどないので、
今あるコード体系の中では一番多言語化に向いているとは言えよう。
# ヲレ自身は、あんな筋の悪いもんには関りたくないから
# 放置プレイだけどナー :D

202 名前:login:Penguin [01/11/07 04:56 ID:/7clxDed.net]
Unicode は han unification してまで 2byte 固定長にこだわったはずなのに、
それが不可能ってようやく判った瞬間に、壮大なる失敗としてその使命を終える
べきだった…。Unicode 3.x はやめてくれ〜。あの仕様じゃ、ISO-2022 のほう
がまだ実装が楽だぞ。

203 名前:login:Penguin [01/11/07 15:27 ID:FmMqLr+t.net]
Unicode なら大変で ISO-2022 なら楽なことなんて
ほとんどないと思うけどねえ。
Unicode で大きな breakthrough が実現するわけじゃ
ないけど、同じ苦労をするんなら、Unicode のために
労力を使ったほうが将来性があるでしょ。

204 名前:login:Penguin mailto:sage [01/11/07 15:42 ID:wu03UBOh.net]
一方で Unicode だと簡単と思っている欧米人もいるからね。
BMP だけあつかってもちゃんと実装するのは大変だと思うけど。



205 名前:login:Penguin [01/11/07 16:48 ID:FmMqLr+t.net]
Unicode ベースで、自分の言語で困らない程度の処理だけ
しておいてくれればそれでいーんですよ。
他国語も処理したい人がいたら、その人が欲しい言語に必要
な処理を加えりゃいい。8 bit through なだけのソフトを
Shift_JIS とか EUC-JP 対応に書き換えるより遙かに楽なん
じゃないか?

日本語のことだけ考えてると Unicode って楽だよね。combining
character も surrogate pair も普通はいらないだろうから。

206 名前:login:Penguin [01/11/07 17:06 ID:t1r6lxkM.net]
なんでi-modeはシフトJISになったの?

207 名前:login:Penguin mailto:sage [01/11/07 17:11 ID:o3LWW9bh.net]
半角カナが使えるから。
つーのは冗談にしても、規格考えたのがズブの素人なんじゃなかったっけか。

208 名前:login:Penguin mailto:sage [01/11/07 17:17 ID:BqexFMm1.net]
>>206
つまりドキュソが作ったドキュソ向けサービスってワケだな(w

209 名前:login:Penguin mailto:sage [01/11/07 18:29 ID:/Lwa9nOE.net]
205 名前:login:Penguin 投稿日:01/11/07 17:06 ID:t1r6lxkM
なんで2chはシフトJISになったの?

206 名前:login:Penguin 投稿日:01/11/07 17:11 ID:o3LWW9bh
半角カナが使えるから。
つーのは冗談にしても、規格考えたのがズブの素人なんじゃなかったっけか。

207 名前:login:Penguin 投稿日:01/11/07 17:17 ID:BqexFMm1
>>206
つまりドキュソが作ったドキュソ向けサービスってワケだな(w

210 名前:199 [01/11/07 19:05 ID:u4pcDQi5.net]
確かに簡単にどの国でも使える soft を書こうとか,
自国の一ヵ国語だけ使えればいいと考えると(ほとんどの人はそうだが),
Unicode も利点があるかも. 欧米人が推進するのは
簡単に internationalize できるからか.
しかしそのせいで漢字文化圏の多国語共存が余計遠のいたような気がする.

211 名前:login:Penguin [01/11/08 00:10 ID:/qmyo2E8.net]
>>187
そういえばIE5.5 以降だと、charset を指定していないウェブページはShift_JISとして
認識するのがデフォルトになってたよね、確か。
それまでは「日本語(自動選択)」だったのに、ありゃ不便。

212 名前:login:Penguin mailto:sage [01/11/08 00:33 ID:wFCDcGAs.net]
コードとソフトのマルチリンガル化は直接の関係が無いように
思うが。最近のはリソースレベルで調整効くんじゃねえの?
DQNなソース以外は。

213 名前:login:Penguin [01/11/08 00:40 ID:axW1aL0x.net]
fgetc(3), ungetc(3)レベルでも、Unicodeでいくには一工夫が必要です。

214 名前:login:Penguin mailto:sage [01/11/08 01:49 ID:RN8xlcoh.net]
イッ、イクゥー



215 名前:login:Penguin [01/11/08 01:55 ID:7e4OhXHU.net]
>>212
だーかーら、Cを使わなきゃいいの。
イヤな例だがNTでエクセルのVBAいじってる
やつらのソフトでさえあっさりUnicode.

216 名前:login:Penguin [01/11/08 03:09 ID:FiqqyvvZ.net]
>>210
そりゃアホな仕様ですな. というかもはや作意的な
脱共有プロトコル化. ゆるせんな.
super power が悪の帝国になるというのは映画の典型だが,
MS はそのまま地でいっている感じ.

217 名前:login:Penguin mailto:sage [01/11/08 07:37 ID:dq+tXvEy.net]
>>205 >>206 >>207

憶測にすぎんが、
元々の端末が内部コードとして SJIS 使ってた。

DoCoMo から imode 端末試作の要請が来て、
何も考えずに端末屋が作った。

作ったやつの実装からそのまま仕様を起こした。

ちゅう流れでは ?

DoCoMo って、
暴走する前線 (とらば〜ゆからとらば〜ゆな
前線指揮官と、売りまくりの販売店) と、
全てを放置することしかできん総司令部と、
間で苦労する兵站部 (サーバ強化したり、
ゲートウェイでいわゆる i-mode 絵文字が
外に出て行かないように〓 ( 2 区 14 点 ) に
変換したりとかさ) って構図に自分には見え

218 名前:login:Penguin mailto:sage [01/11/08 10:51 ID:kpRhpY+R.net]
>>205
Windows上でコンテンツ作成するのに楽だから。

・・・と聞いたけど、理由後づけしただけなんじゃないかって気がしてきた(w

219 名前:login:Penguin [01/11/12 19:53 ID:yqlF4e/+.net]
面白かったのに止まっちゃってやんの。

220 名前:login:Penguin [01/11/12 22:32 ID:9uypxnba.net]
>>210
IE6だとEUCなページもJISなページもちゃんと見えるぞ。
エンコードを「自動選択」にしただけで。

>>214
あっちは高度なレイヤの言語に属するものなので、裏での文字コードは
どれでも大丈夫という例ですな。Cみたいに低レイヤのI/Oが存在し得な
い(できない)し。

>>216
iモードのプロトタイプ版がWindowsアプリケーションで作られていて、
それなりに評判が良かったので裏のコード体系が何も変更されずそのま
ま広まってしまった。

221 名前:難しい… mailto:sage [01/11/13 00:46 ID:lJpK2uoN.net]
日本語基礎用語
ttp://www.geocities.co.jp/Hollywood/1751/JISknown.html
これってどうなんでしょうか。

国の公式文書はJISのみとか決まってるんですか?
日韓W杯の人達は何で文書やりとりしてるんだろう?FIFA公用語のみ?

222 名前:login:Penguin [01/11/13 02:09 ID:AR1g3sje.net]
jis っていっても文字コードとしての jis と
エンコーディング法としての通称 jis があるな.

223 名前:login:Penguin [01/11/13 02:38 ID:xnt/q9m2.net]
UnicodeだってJISだし。

224 名前:login:Penguin [01/11/13 05:11 ID:yK//wqHP.net]
どれが符号化文字集合一般の問題で、どれが Unicode 文字集合特有の問題なんですかぁ?



225 名前:login:Penguin [01/11/13 08:21 ID:UUYcq+J/.net]
>>220
たぶんこれを根拠にJISコードで官公庁向けにドキュメント(完成図書)
を提出したら「読めない」と一蹴される可能性が大きいな・・

ちなみに俺が仕事をした範囲で言うと、官公庁向けに最終的に納品する
ドキュメント(完成図書)は紙に印刷したものが基本だが、電子文書と
して納品する場合はMicrosoft WordフォーマットかAdobe Acrobatフ
ォーマットが基本で、当然の事ながらそれ以外のフォーマットで提出す
ることは官報で告示される工事仕様から外れたものとなってしまう。

226 名前:login:Penguin mailto:sage [01/11/13 08:47 ID:xshmouS0.net]
>>220
ヲレが評価を書くのは簡単だが意味ネーので。

規格票とかの 1 次文献と、ゴミ山の 2 次文献と、
ともかく片端からツキ合わせて検証するしか。

JIS はハンドブックじゃなくて規格票の方。常識

227 名前:login:Penguin mailto:sage [01/11/13 09:57 ID:55puEBGN.net]
>>225
> JIS はハンドブックじゃなくて規格票の方。常識
内容違うの?

228 名前:login:Penguin [01/11/14 01:34 ID:7VltrDCU.net]
>>226
JIS ハンドブックに規格の解説ってついていたっけ?

229 名前:login:Penguin mailto:sage [01/11/14 03:02 ID:bsExAIai.net]
>>226
ハンドブックは、規格票の抄。fontも違う(w

230 名前:名無しさん@お腹すいた。。 mailto:ハラペコ~~ [01/11/15 02:10 ID:OJKAB9zc.net]
Shift−JISウザイ!!
こんなものがあるから、厨房が増えると思う。
こんなものがあると、日本人は余計に馬鹿になると思う。

※私も Shift−JISあぼーん に1票!

しかも、MS社は商売が上手すぎるせいで、
Shift−JISが余計に普及しすぎてしまう。
もともとMS社が考えたShift-JISは、Macでも使われてきている。

自分はMS社は好きだけど、Shift−JISは嫌い。

Shifit−JISなんかよりは、Extended Unix Code(EUC)が(・∀・)イイね。
それに、インターネット上でSJISは向かない。

UNIX系のOSを使うと、本当にためになると思う。。頭よくなるよ。
逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。

Netscapeで色々なサイトを見てみることが有るけど、
IEに最適化されたページが多すぎて、Netscapeでは
正常に表示できないものがある。
それは、インターネット上に、色々なコンピュータが混在してることを
知らないような厨房がいるからだと思う。
(皆、Windows+IEにばっかりだと思っているのかなぁ?)

UNIX系のOSを使うようになってくれば、インターネット上に、
色々なコンピュータが混在していることを知ることが
できるようになるのではないだろうか?

Windowsばっかりにとらわれず、ほかのOSを使ってみるというのも良いことでしょう。
EUCという文字コードは、今まで「コンピュータ=Windows」だと思って
いた人に、「コンピュータにもいろいろ有る」ことを
意識させてくれるのではなかろうか?

自分は、まだWebページは作り終わっていませんが、
作成する時は、いろいろな環境で、正常に表示できるように
作りたいと思っています。
(日本語の文字コードは、 JIS を使う予定なのですが・・・)

おっと!長文失礼しました!
自分は、このように考えているのですが、どうでしょうか?

231 名前:login:Penguin mailto:sage [01/11/15 02:16 ID:noyWS/iX.net]
これって突っ込まれることを期待してワザとやってんの?

232 名前:login:Penguin mailto:sage [01/11/15 02:19 ID:r2ItaT6s.net]
本気でつっこんであげて下さい. >>230

233 名前:そいじゃ突っ込み mailto:sage [01/11/15 05:10 ID:PMzBmxUW.net]
> 自分はMS社は好きだけど、Shift−JISは嫌い。
> 逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。

じゃあ 229 はもう馬鹿になってるな(藁

234 名前:login:Penguin mailto:sage [01/11/15 07:53 ID:ybZRG6lR.net]
>>229

言いたいことはわからんでもないが、

世の中に出回っちまったものをそう簡単に
あぼーんできるなら、
83 or 97 JIS で誰もあんな大苦労は、
しなかったろうし、
アンチ Unicoder だってここまでの、
大騒ぎはせんよ。

ちょっと想像してみろ。もし、
JIS C 6220 の左半分が ASCII と同じで、
JIS C 6220 の右半分が JIS C 6226 の制定にあわせ
廃止になっていて、
JIS C 6226 では JIS C 6220 との互換や便利な
エンコーディングについて考慮されていて、
その後の改訂や追加も理想的になされた、として、

そして MS-DOS の日本語化が 日本語 EUC だったとして、

厨房は今よりも少ないと思うか ?

Shift-JIS が、
もし存在しなかったとしても、
エンコーディングを、
一種類しか知らず文字集合との区別も付かん、
という厨房は減らんと思う。

まぁ確かに、
俺には >>1 の意図はサパーリ理解できんのだが。



235 名前:login:Penguin [01/11/15 08:20 ID:gOrKsa2J.net]
>>229
EUCだとかSJISだとか語る前にまず真っ先に全角英数ヤメレ。
あと、JISとEUCの混在については何も語らないのか?

236 名前:login:Penguin mailto:sage [01/11/15 08:31 ID:tiluF2S6.net]
>234
Shift-JISのところだけ全角ってのは明らかにわざとだと思うが。
(それ以外もなんかアレだが。)

237 名前:login:Penguin mailto:sage [01/11/15 11:17 ID:+5dCZCCC.net]
>エンコーディングを、
>一種類しか知らず文字集合との区別も付かん、
>という厨房は減らんと思う。

229はコレだろまさに。
違うというなら区別を述べてみよ。

238 名前:login:Penguin [01/11/15 12:50 ID:UTucAaiV.net]
日本語の文章書くのにUS−ASCII(JIS X 0201)使わず
にJIX X 0208のみ使う。ただし、引用したプログラムなどでは
US−ASCIIのみ使う、というのもありかな。

main() {
printf("Hell, world\n");
}

239 名前:login:Penguin mailto:sage [01/11/15 13:38 ID:U4qiuSGu.net]
?

240 名前:login:Penguin mailto:sage [01/11/15 15:14 ID:o+BuNf25.net]
「『全角半角』というものは文字コードに含まれない」とかいいつつ
jisx0208 のアルファベットを使うと「読みにくい」って言うのはヘンじゃない?

「X−Windowsが動きません」
「違います。X Window System です。あとアルファベットや記号は...」

なんてやりとりを何回も見る。

241 名前:login:Penguin mailto:sage [01/11/15 16:32 ID:U4qiuSGu.net]
>>239
分かっていると思うが、X-Windowsなんてものは存在しない。

242 名前:login:Penguin mailto:sage [01/11/15 17:30 ID:ybZRG6lR.net]
>>239

ヘンではない。文脈が違うんだっちゅうの。

文字コードについての議論をしている時に、
全角とか半角とか関係ない概念を持ち込むな、
と言うのと、
( Unicode に FULLWIDTH LATIN CAPITAL LETTER A
とかいう連中がいてさらに話がややこしいのだが。
(コードだと FFxx の処) しかもこれ JIS X 0208 の
記号の救済になってないのよね )

日常のメッセージ交換について、ISO 646 の文字集合に
ある文字を使って構わない文字についてはそっち使え、
というのと、矛盾してないぞ。別に。

しかも >>239 が例示してるやりとりは基本的に
ローカルルールの話。混同すんなよ。

このスレには「半角カナあぼーん」を日頃広言してる
奴が多そうだが、べつにこのスレでは (使ったからって)
何も言わん、それと同じ。

見栄えの問題として“「C 言語」”を“「C言語」”に
したりする、なんてのはけっこうあると思う。

昔は個人のポリシーとして JIS X 0208 で全部書く
なんてひともいたそうだけど。

243 名前:login:Penguin mailto:sage [01/11/15 18:17 ID:SZoZtT5l.net]
>>241
mohta さんですな

244 名前:login:Penguin [01/11/15 23:44 ID:DaDunDH3.net]
日本語の proportional font ってあるんですか?



245 名前:login:Penguin mailto:sage [01/11/16 01:17 ID:SlO5AIlX.net]
>>243
スレ違い。
まぁ243は MS P Gothic でも使ってなさいってこった。

246 名前:login:Penguin [01/11/16 02:29 ID:1EP3otcQ.net]
>>225
こんな、電波受信しまくってるシロモノに検証もクソもねーだろ。
ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。

247 名前:225 mailto:sage [01/11/16 08:41 ID:WZsLOO+O.net]
>>245
>ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。

俺もそう思ったから自分で検証しなかったし、
検証してない以上、感想的評価しか書けんからね。

ちょっとたずねるが、例えば当用漢字に関わる告示を
全部、今ここで列挙してみろと言われてできるか ?

できないならその「シロモノ」に書いてある、
当用漢字に関する事項については、どこが偽で
どこが真か判断できない筈だが ?

248 名前:login:Penguin mailto:sage [01/11/16 16:59 ID:JBbeQ7F0.net]
>>246
ヘリクツはやめよーよ

249 名前:229 mailto:sage [01/11/16 21:28 ID:Aqdg8YXQ.net]
>>232-236
ご回答、ありがとうございます。。m(_ _)m
色々と参考にもなりました。

ああ、なるほど。。
文字コードが1つだけだったとしても、厨房は減るとも限らないのですね。
言われてみれば、そういう気もしました。

それから、「Shift−JIS」の部分だけ全角英数なのは、
わざとやりました。Shift−JISを馬鹿にしているという意味でもありまして。
唯、日本語OSとしては、Shift-JISは、使いやすい感じなのでしょうかねぇ?

・・・ところで、メルマガで全角英数が沢山使われている
ことについて、どのように思います?

あと、BIGLOBE でも、全角英数が結構使われていたような
気もしたのですが、なぜなんでしょうかねぇ?

250 名前:login:Penguin mailto:sage [01/11/16 22:26 ID:x9gi1zY9.net]
Unix 使っている人は全角英数を嫌う人が多いけど,
それは単なる好き嫌いの問題だと思う.
こういうことで人を馬鹿にして優越感を得るのはいかんよ.

251 名前:login:Penguin mailto:sage [01/11/16 23:16 ID:ADpYy+ve.net]
だって読みづらいし検索しづらくないか

252 名前:login:Penguin mailto:sage [01/11/16 23:24 ID:/sHDqI0/.net]
>>249
嫌われた最大の理由は
-sony-fixed-*-16- と -misc-fixed-*-14- の 0201 の書体デザインが残念すぎたから

という主張をヒソーリやってみるテスト。

253 名前:login:Penguin mailto:sage [01/11/17 07:55 ID:gZOX3LLK.net]
そういえば、かつてのk14の全角英数の書体デザインはなぜかボールド体だったな。
東雲では直っているけど。
あと、BTRON(超漢字)は、デフォルトで英数が全角だな。読みづらいと思うんだが。

254 名前:login:Penguin mailto:sage [01/11/17 08:23 ID:bbmeDPw2.net]
>>251
0208 ね ?
多分前者は s/-sony-/-jis-/ だと思うが。
JIS X 9051-1984「表示装置用16ドット字形」
ちなみに「16」が「16」でないのは、
jsa.or.jp のデータベースの頁からのコピペだから。

>>252
k14 のあれは逆に識別性を上げるために、
わざとやっているのだと自分には思われ。



255 名前:login:Penguin mailto:sage [01/11/17 08:36 ID:bbmeDPw2.net]
>>252
TRON コードには 0201 も ASCII も 646 も
入ってないんだわ。Unicode2 経由でもって一部に
あるけど。(だから 0201 カナが FFxx にあるぞ)

要するに全角文字・半角文字っていう区別の
コードレベルでのパージを意図してたんだわ。
だから「半角」は、文字拡大/縮小指定付箋で
幅 1/2 を指定して実現されてる。(TAD をダンプ
すりゃわかる) 要するに 0208 の文字を縮小
してるから「ヴ」の半角なんてのもアリ。

で、デフォルトではどんな文字でも全角で表示
しちまうんだが、一部アプリ (コンソール等)
は、0201 の左側にある文字を適当に半角にして
くれたりするんで (ブラウザの一行フォームなんかは
なんでも半角だが) 余計ややこしい。

ま、最近のブラウザとか基本文章編集とかは
プロポーショナル表示に対応しとるよ。
元々半角なのをプロポーショナルで見ると
それはそれで悲惨だが。

純粋にジャポネスクな OS を作ろうとした研究が
他にもあって (IPSJ の論文漁ってみな) それなんかは
0208 オンリーで CHAR_BIT が 16 だか sizeof(char) が
2 だかの (後者だと標準から外れるが) C言語処理系から
自分達で作ったようで識別子とかに好き放題 0208 が
使えたらしい。

256 名前:login:Penguin [01/11/18 03:14 ID:VeGGFsw1.net]
>>254
> 純粋にジャポネスクな OS を作ろうとした研究が(略)

農工大のOS omicronかな。

257 名前:login:Penguin [01/12/18 21:48 ID:61X7j+2e.net]
みんな忘れてないか?age

258 名前:login:Penguin [01/12/21 06:06 ID:o684insm.net]
良スレ age

259 名前:login:Penguin mailto:sage [01/12/21 10:58 ID:7GMumlLM.net]
>>257
クソスレだ。ageるな。

260 名前:login:Penguin mailto:age [01/12/21 11:51 ID:rzRakEP/.net]
age

261 名前:login:Penguin mailto:sage [02/02/04 12:41 ID:m17eMVoW.net]
不治痛age

262 名前:青木光恵 mailto:青木光恵 [02/02/06 01:26 ID:07Li/whj.net]
青木光恵

263 名前:login:Penguin [02/02/06 01:36 ID:+3nKE+HU.net]
ダーヤス写真集age


264 名前:login:Penguin [02/02/07 13:39 ID:12+BCoHT.net]
んー。
文字コード云々の前に「コンピュータ上で扱えたい日本語」を
全部選定(?することは既に完了してるんでしょうか?
「正」の字とかは一画ずつ全五画分必要そうだし
偏だけ、旁だけってのも将来を見通せば必要そうですけど
出来てるんですかね。



265 名前:login:Penguin [02/02/07 18:12 ID:0AxTDb5J.net]
X向けのcharsetはISO 2022だったよね。

266 名前:login:Penguin [02/02/07 20:36 ID:txThOpuJ.net]
とりあえず >>15 は嘘。
HP-UX も Solaris も日本語環境を入れる時の
default は SJIS です。

267 名前:login:Penguin [02/02/07 20:40 ID:txThOpuJ.net]
よーしパパ LASER5 7.2exp の不具合張っちゃうぞ。
www.laser5.co.jp/support/l5linux/faq/72exp/index.html (Q6)

使う使わない、個人の好みの問題は別にして
ちゃんとサポートしれ。

268 名前:login:Penguin [02/02/09 16:35 ID:CI8k4gxh.net]
まあ、Shift-JISみたいな腐れフォント使ってる奴は死ねってことで。

269 名前:login:Penguin mailto:sage [02/02/09 16:37 ID:9Rjes/Sh.net]
フォント関係あんの?

270 名前:おむこさん志望 ◆GqCwfDSA mailto:sage [02/02/09 17:18 ID:QaOYgbNI.net]
>>267
ShiftJISはフォントじゃなくてエンコーディング。
自分でsjisロケールを生成してやればja_JP.SJISでも使える。

271 名前:login:Penguin mailto:sage [02/02/09 18:12 ID:KVJYho4s.net]
まあ、UTF-16 みたいな腐れエンコーディング使ってるOSは氏ねってことで。

272 名前:login:Penguin mailto:sage [02/02/09 21:57 ID:gwaFMMy6.net]
>X向けのcharsetはISO 2022だったよね。
何度も何度も何度も何度もガイシュツなように、2022はcharsetではありません。
encoding schemeです。萎えsage




273 名前:login:Penguin mailto:sage [02/02/09 23:19 ID:5njPVTaC.net]
HTTP で charset= に encoding を書かせるのが誤解をうむ
元だよな...



274 名前:login:Penguin mailto:sage [02/02/11 23:09 ID:X+cO8gdB.net]
元はMIME。



275 名前:login:Penguin [02/02/16 22:54 ID:KpHa2nOV.net]
age

276 名前:login:Penguin mailto:sage [02/02/16 22:58 ID:wiE/aMYf.net]
>>265
Solarisでは、インストール時にUnicode・EUC・SJISのどれかを選択しなきゃいけない。よって、defaultなんてありません。


277 名前:login:Penguin [02/02/19 18:13 ID:E1V3iarF.net]
age

278 名前:login:Penguin mailto:sage [02/02/20 02:17 ID:D4zYH0HU.net]
もう面倒だから全部UCS-4で処理しませんか?

279 名前:login:Penguin mailto:sage [02/02/20 02:47 ID:NRixr7wa.net]
>>272
ふと思ったけど、その表記ってISO-8859圏の人間だけが利用するのを想定してるっぽいな。
ISO-8859系列って、文字集合=文字エンコーディングだから。

280 名前:login:Penguin mailto:sage [02/02/20 08:09 ID:E3jll45S.net]
もう面倒だから全部256ビットで処理しませんか?
1文字 16x16 ドットで。

281 名前:login:Penguin mailto:sage [02/02/20 14:11 ID:dIlnqa5O.net]
>>279
それは便利だ。
けど、そうすると検索性に劣る等の副作用も含む諸刃の剣。

議論が堂々巡りするなぁ、本当にこの話題は…


固定長でエスケープシーケンス無しのエンコードだと拡張性に劣る

エスケープシーケンスで自由に文字集合を切替えられるようにすれば可能性は無限

そうすると、文字列の任意のバイト列を取り出しても判別不能、
最初から最後まで嘗めなければ処理できなくなり、
プログラマの負担増大

じゃあ、いっそ巨大な平面に全部の文字を詰めて固定長で全部処理しよう

異体字を無限に許すことになり、テキストデータ等が溜っても後から検索できない

じゃあ、平面を狭めよう

最初に戻る (゚д゚)ウマー

282 名前:login:Penguin [02/02/21 19:15 ID:WoLsJseW.net]
>>278
>>272にあるようにMIMEが源だけど、
MIMEってheaderに使うencodingでの空白の扱いが、
単語を空白で区切る分かち書きの世界しか意識してないじゃん。
それって結局ISO-8859圏なわけでしょ。

MIMEとUnicodeは日本からの働きかけに失敗した例だね。

283 名前:login:Penguin [02/02/27 10:34 ID:Fz3oNkse.net]
>>279
256ビットでは、異体字が多くなり易過ぎて検索が辛いです。
64ビットにしましょう。1文字8x8ドットで充分。少なくともX0208の区別は付くし。
区別が付かない文字は、包括すれば問題無し。(w

284 名前:login:Penguin [02/02/27 12:57 ID:5Le7VrIb.net]
>>282
包括もそれはそれで問題だと思うぞ。
既にJISでもさんざん問題になっているが。




285 名前:login:Penguin [02/02/27 12:59 ID:EMez+aas.net]
全角英数とか半角カナとか、なんで廃止しないの?
ネット上のゴミにしかなってないんじゃ。。。

286 名前:login:Penguin [02/02/27 13:01 ID:2qxooejq.net]
全角英数はよく見る。需要はあんでしょ。

287 名前:login:Penguin mailto:sage [02/02/27 13:05 ID:Fv8Z2UaF.net]
「包摂」?

288 名前:login:Penguin [02/02/27 13:07 ID:5Le7VrIb.net]
>>285
見るか見ないかじゃなくて、必要かどうかを言いたいんではないかと。
意味合いも用途も同じなのに別のコードが割り当てられてるのは
プログラム上で同一に扱いたいとき面倒なだけでメリットが何もないし。

# まぁ、いまさら廃止したとしてもユーザが使い続けてる限り
# 撲滅はできないとは思うけども。。。


289 名前:login:Penguin mailto:sage [02/02/27 13:24 ID:HUK2U80k.net]
全角英数はデータ入力でも有害だから、
(データ処理側で変換するとしても)
IMEではdefaultで半角英数にしておけばいいのにね。

WindowsのPPP接続の電話番号設定ではよくあるトラブルの一つだな。
Dailup widzardが半角変換しないから。ユーザ名とかも。

290 名前:login:Penguin mailto:sage [02/02/27 23:41 ID:xsQ6CV0u.net]
>>280
そういや,
[0x80〜0xFF]x任意個+[0x00〜0x7F]で1文字を表すようなコードって
誰も提案しないの?
#まあ,UTF-8の変形ですかね.
これだったら任意数の文字を表現できるけど,プログラム処理は
そんなに大変にならないと思うんだけど.


291 名前:289 mailto:sage [02/02/27 23:48 ID:xsQ6CV0u.net]
自己レス
\とか/とか:とかのコードは外さないと危ないじゃん.
逝ってきます……


292 名前:login:Penguin [02/02/28 01:40 ID:tMYcWs/N.net]
文字コードとグリフを別々に管理するような
テキストの規格が普及してれば
全角と半角とで苦労したりしなくてすむのに。

ascii と JISX0208 で意味的に重なっている記号を
同一視するとかの問題もなくなるし。


293 名前:login:Penguin [02/02/28 03:52 ID:hiYdbzc9.net]
全角英数と半角カナはさっさと逝くべき存在。
「メールで半角カナは良くない」っていうのが広まる直前に、
DoCoMoのアホ共が!
ISO-2022-JPに含まれてねーだろ<JIS X 0201カナ集合


294 名前:292の続き [02/02/28 03:56 ID:hiYdbzc9.net]
IMEも罪重い。
上でも書いてる人いるけど、何故デフォで全角英数にする?
Justsystem何考えてるんじゃー。
それともなんらかのメリットがあるのか?



295 名前:login:Penguin [02/02/28 04:51 ID:WilwHU5r.net]
>>292
電話会社は今でもどんどん絵文字増やしてるね。

まあencoding schemeが滅茶苦茶なのはもう諦めるから、
せめてcharacter setをちゃんと登録して、
そのcode pointくらい発表して欲しい。

296 名前:292 [02/02/28 05:01 ID:hiYdbzc9.net]
>>294
絵文字は論外だと俺は思う。

しかしこれは彼女の話なんだが、
「絵文字をセンス良く使う人は好感がもてる」
有効性(?)って点からは、iモードの絵文字は功罪半ばするところだ。

DoCoMoの絵文字コードポイントは
www.nttdocomo.co.jp/mc-user/i/tag/emoji/
もうふやさんでほしい……






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<244KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef