[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2ch.scのread.cgiへ]
Update time : 11/30 16:27 / Filesize : 244 KB / Number-of Response : 873
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

EUCボクメツ委員会



1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO
せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ
意味ないじゃん!
Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO
Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。

220 名前:login:Penguin [01/11/12 22:32 ID:9uypxnba.net]
>>210
IE6だとEUCなページもJISなページもちゃんと見えるぞ。
エンコードを「自動選択」にしただけで。

>>214
あっちは高度なレイヤの言語に属するものなので、裏での文字コードは
どれでも大丈夫という例ですな。Cみたいに低レイヤのI/Oが存在し得な
い(できない)し。

>>216
iモードのプロトタイプ版がWindowsアプリケーションで作られていて、
それなりに評判が良かったので裏のコード体系が何も変更されずそのま
ま広まってしまった。

221 名前:難しい… mailto:sage [01/11/13 00:46 ID:lJpK2uoN.net]
日本語基礎用語
ttp://www.geocities.co.jp/Hollywood/1751/JISknown.html
これってどうなんでしょうか。

国の公式文書はJISのみとか決まってるんですか?
日韓W杯の人達は何で文書やりとりしてるんだろう?FIFA公用語のみ?

222 名前:login:Penguin [01/11/13 02:09 ID:AR1g3sje.net]
jis っていっても文字コードとしての jis と
エンコーディング法としての通称 jis があるな.

223 名前:login:Penguin [01/11/13 02:38 ID:xnt/q9m2.net]
UnicodeだってJISだし。

224 名前:login:Penguin [01/11/13 05:11 ID:yK//wqHP.net]
どれが符号化文字集合一般の問題で、どれが Unicode 文字集合特有の問題なんですかぁ?

225 名前:login:Penguin [01/11/13 08:21 ID:UUYcq+J/.net]
>>220
たぶんこれを根拠にJISコードで官公庁向けにドキュメント(完成図書)
を提出したら「読めない」と一蹴される可能性が大きいな・・

ちなみに俺が仕事をした範囲で言うと、官公庁向けに最終的に納品する
ドキュメント(完成図書)は紙に印刷したものが基本だが、電子文書と
して納品する場合はMicrosoft WordフォーマットかAdobe Acrobatフ
ォーマットが基本で、当然の事ながらそれ以外のフォーマットで提出す
ることは官報で告示される工事仕様から外れたものとなってしまう。

226 名前:login:Penguin mailto:sage [01/11/13 08:47 ID:xshmouS0.net]
>>220
ヲレが評価を書くのは簡単だが意味ネーので。

規格票とかの 1 次文献と、ゴミ山の 2 次文献と、
ともかく片端からツキ合わせて検証するしか。

JIS はハンドブックじゃなくて規格票の方。常識

227 名前:login:Penguin mailto:sage [01/11/13 09:57 ID:55puEBGN.net]
>>225
> JIS はハンドブックじゃなくて規格票の方。常識
内容違うの?

228 名前:login:Penguin [01/11/14 01:34 ID:7VltrDCU.net]
>>226
JIS ハンドブックに規格の解説ってついていたっけ?



229 名前:login:Penguin mailto:sage [01/11/14 03:02 ID:bsExAIai.net]
>>226
ハンドブックは、規格票の抄。fontも違う(w

230 名前:名無しさん@お腹すいた。。 mailto:ハラペコ~~ [01/11/15 02:10 ID:OJKAB9zc.net]
Shift−JISウザイ!!
こんなものがあるから、厨房が増えると思う。
こんなものがあると、日本人は余計に馬鹿になると思う。

※私も Shift−JISあぼーん に1票!

しかも、MS社は商売が上手すぎるせいで、
Shift−JISが余計に普及しすぎてしまう。
もともとMS社が考えたShift-JISは、Macでも使われてきている。

自分はMS社は好きだけど、Shift−JISは嫌い。

Shifit−JISなんかよりは、Extended Unix Code(EUC)が(・∀・)イイね。
それに、インターネット上でSJISは向かない。

UNIX系のOSを使うと、本当にためになると思う。。頭よくなるよ。
逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。

Netscapeで色々なサイトを見てみることが有るけど、
IEに最適化されたページが多すぎて、Netscapeでは
正常に表示できないものがある。
それは、インターネット上に、色々なコンピュータが混在してることを
知らないような厨房がいるからだと思う。
(皆、Windows+IEにばっかりだと思っているのかなぁ?)

UNIX系のOSを使うようになってくれば、インターネット上に、
色々なコンピュータが混在していることを知ることが
できるようになるのではないだろうか?

Windowsばっかりにとらわれず、ほかのOSを使ってみるというのも良いことでしょう。
EUCという文字コードは、今まで「コンピュータ=Windows」だと思って
いた人に、「コンピュータにもいろいろ有る」ことを
意識させてくれるのではなかろうか?

自分は、まだWebページは作り終わっていませんが、
作成する時は、いろいろな環境で、正常に表示できるように
作りたいと思っています。
(日本語の文字コードは、 JIS を使う予定なのですが・・・)

おっと!長文失礼しました!
自分は、このように考えているのですが、どうでしょうか?

231 名前:login:Penguin mailto:sage [01/11/15 02:16 ID:noyWS/iX.net]
これって突っ込まれることを期待してワザとやってんの?

232 名前:login:Penguin mailto:sage [01/11/15 02:19 ID:r2ItaT6s.net]
本気でつっこんであげて下さい. >>230

233 名前:そいじゃ突っ込み mailto:sage [01/11/15 05:10 ID:PMzBmxUW.net]
> 自分はMS社は好きだけど、Shift−JISは嫌い。
> 逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。

じゃあ 229 はもう馬鹿になってるな(藁

234 名前:login:Penguin mailto:sage [01/11/15 07:53 ID:ybZRG6lR.net]
>>229

言いたいことはわからんでもないが、

世の中に出回っちまったものをそう簡単に
あぼーんできるなら、
83 or 97 JIS で誰もあんな大苦労は、
しなかったろうし、
アンチ Unicoder だってここまでの、
大騒ぎはせんよ。

ちょっと想像してみろ。もし、
JIS C 6220 の左半分が ASCII と同じで、
JIS C 6220 の右半分が JIS C 6226 の制定にあわせ
廃止になっていて、
JIS C 6226 では JIS C 6220 との互換や便利な
エンコーディングについて考慮されていて、
その後の改訂や追加も理想的になされた、として、

そして MS-DOS の日本語化が 日本語 EUC だったとして、

厨房は今よりも少ないと思うか ?

Shift-JIS が、
もし存在しなかったとしても、
エンコーディングを、
一種類しか知らず文字集合との区別も付かん、
という厨房は減らんと思う。

まぁ確かに、
俺には >>1 の意図はサパーリ理解できんのだが。

235 名前:login:Penguin [01/11/15 08:20 ID:gOrKsa2J.net]
>>229
EUCだとかSJISだとか語る前にまず真っ先に全角英数ヤメレ。
あと、JISとEUCの混在については何も語らないのか?

236 名前:login:Penguin mailto:sage [01/11/15 08:31 ID:tiluF2S6.net]
>234
Shift-JISのところだけ全角ってのは明らかにわざとだと思うが。
(それ以外もなんかアレだが。)

237 名前:login:Penguin mailto:sage [01/11/15 11:17 ID:+5dCZCCC.net]
>エンコーディングを、
>一種類しか知らず文字集合との区別も付かん、
>という厨房は減らんと思う。

229はコレだろまさに。
違うというなら区別を述べてみよ。

238 名前:login:Penguin [01/11/15 12:50 ID:UTucAaiV.net]
日本語の文章書くのにUS−ASCII(JIS X 0201)使わず
にJIX X 0208のみ使う。ただし、引用したプログラムなどでは
US−ASCIIのみ使う、というのもありかな。

main() {
printf("Hell, world\n");
}



239 名前:login:Penguin mailto:sage [01/11/15 13:38 ID:U4qiuSGu.net]
?

240 名前:login:Penguin mailto:sage [01/11/15 15:14 ID:o+BuNf25.net]
「『全角半角』というものは文字コードに含まれない」とかいいつつ
jisx0208 のアルファベットを使うと「読みにくい」って言うのはヘンじゃない?

「X−Windowsが動きません」
「違います。X Window System です。あとアルファベットや記号は...」

なんてやりとりを何回も見る。

241 名前:login:Penguin mailto:sage [01/11/15 16:32 ID:U4qiuSGu.net]
>>239
分かっていると思うが、X-Windowsなんてものは存在しない。

242 名前:login:Penguin mailto:sage [01/11/15 17:30 ID:ybZRG6lR.net]
>>239

ヘンではない。文脈が違うんだっちゅうの。

文字コードについての議論をしている時に、
全角とか半角とか関係ない概念を持ち込むな、
と言うのと、
( Unicode に FULLWIDTH LATIN CAPITAL LETTER A
とかいう連中がいてさらに話がややこしいのだが。
(コードだと FFxx の処) しかもこれ JIS X 0208 の
記号の救済になってないのよね )

日常のメッセージ交換について、ISO 646 の文字集合に
ある文字を使って構わない文字についてはそっち使え、
というのと、矛盾してないぞ。別に。

しかも >>239 が例示してるやりとりは基本的に
ローカルルールの話。混同すんなよ。

このスレには「半角カナあぼーん」を日頃広言してる
奴が多そうだが、べつにこのスレでは (使ったからって)
何も言わん、それと同じ。

見栄えの問題として“「C 言語」”を“「C言語」”に
したりする、なんてのはけっこうあると思う。

昔は個人のポリシーとして JIS X 0208 で全部書く
なんてひともいたそうだけど。

243 名前:login:Penguin mailto:sage [01/11/15 18:17 ID:SZoZtT5l.net]
>>241
mohta さんですな

244 名前:login:Penguin [01/11/15 23:44 ID:DaDunDH3.net]
日本語の proportional font ってあるんですか?

245 名前:login:Penguin mailto:sage [01/11/16 01:17 ID:SlO5AIlX.net]
>>243
スレ違い。
まぁ243は MS P Gothic でも使ってなさいってこった。

246 名前:login:Penguin [01/11/16 02:29 ID:1EP3otcQ.net]
>>225
こんな、電波受信しまくってるシロモノに検証もクソもねーだろ。
ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。

247 名前:225 mailto:sage [01/11/16 08:41 ID:WZsLOO+O.net]
>>245
>ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。

俺もそう思ったから自分で検証しなかったし、
検証してない以上、感想的評価しか書けんからね。

ちょっとたずねるが、例えば当用漢字に関わる告示を
全部、今ここで列挙してみろと言われてできるか ?

できないならその「シロモノ」に書いてある、
当用漢字に関する事項については、どこが偽で
どこが真か判断できない筈だが ?

248 名前:login:Penguin mailto:sage [01/11/16 16:59 ID:JBbeQ7F0.net]
>>246
ヘリクツはやめよーよ



249 名前:229 mailto:sage [01/11/16 21:28 ID:Aqdg8YXQ.net]
>>232-236
ご回答、ありがとうございます。。m(_ _)m
色々と参考にもなりました。

ああ、なるほど。。
文字コードが1つだけだったとしても、厨房は減るとも限らないのですね。
言われてみれば、そういう気もしました。

それから、「Shift−JIS」の部分だけ全角英数なのは、
わざとやりました。Shift−JISを馬鹿にしているという意味でもありまして。
唯、日本語OSとしては、Shift-JISは、使いやすい感じなのでしょうかねぇ?

・・・ところで、メルマガで全角英数が沢山使われている
ことについて、どのように思います?

あと、BIGLOBE でも、全角英数が結構使われていたような
気もしたのですが、なぜなんでしょうかねぇ?

250 名前:login:Penguin mailto:sage [01/11/16 22:26 ID:x9gi1zY9.net]
Unix 使っている人は全角英数を嫌う人が多いけど,
それは単なる好き嫌いの問題だと思う.
こういうことで人を馬鹿にして優越感を得るのはいかんよ.

251 名前:login:Penguin mailto:sage [01/11/16 23:16 ID:ADpYy+ve.net]
だって読みづらいし検索しづらくないか

252 名前:login:Penguin mailto:sage [01/11/16 23:24 ID:/sHDqI0/.net]
>>249
嫌われた最大の理由は
-sony-fixed-*-16- と -misc-fixed-*-14- の 0201 の書体デザインが残念すぎたから

という主張をヒソーリやってみるテスト。

253 名前:login:Penguin mailto:sage [01/11/17 07:55 ID:gZOX3LLK.net]
そういえば、かつてのk14の全角英数の書体デザインはなぜかボールド体だったな。
東雲では直っているけど。
あと、BTRON(超漢字)は、デフォルトで英数が全角だな。読みづらいと思うんだが。

254 名前:login:Penguin mailto:sage [01/11/17 08:23 ID:bbmeDPw2.net]
>>251
0208 ね ?
多分前者は s/-sony-/-jis-/ だと思うが。
JIS X 9051-1984「表示装置用16ドット字形」
ちなみに「16」が「16」でないのは、
jsa.or.jp のデータベースの頁からのコピペだから。

>>252
k14 のあれは逆に識別性を上げるために、
わざとやっているのだと自分には思われ。

255 名前:login:Penguin mailto:sage [01/11/17 08:36 ID:bbmeDPw2.net]
>>252
TRON コードには 0201 も ASCII も 646 も
入ってないんだわ。Unicode2 経由でもって一部に
あるけど。(だから 0201 カナが FFxx にあるぞ)

要するに全角文字・半角文字っていう区別の
コードレベルでのパージを意図してたんだわ。
だから「半角」は、文字拡大/縮小指定付箋で
幅 1/2 を指定して実現されてる。(TAD をダンプ
すりゃわかる) 要するに 0208 の文字を縮小
してるから「ヴ」の半角なんてのもアリ。

で、デフォルトではどんな文字でも全角で表示
しちまうんだが、一部アプリ (コンソール等)
は、0201 の左側にある文字を適当に半角にして
くれたりするんで (ブラウザの一行フォームなんかは
なんでも半角だが) 余計ややこしい。

ま、最近のブラウザとか基本文章編集とかは
プロポーショナル表示に対応しとるよ。
元々半角なのをプロポーショナルで見ると
それはそれで悲惨だが。

純粋にジャポネスクな OS を作ろうとした研究が
他にもあって (IPSJ の論文漁ってみな) それなんかは
0208 オンリーで CHAR_BIT が 16 だか sizeof(char) が
2 だかの (後者だと標準から外れるが) C言語処理系から
自分達で作ったようで識別子とかに好き放題 0208 が
使えたらしい。

256 名前:login:Penguin [01/11/18 03:14 ID:VeGGFsw1.net]
>>254
> 純粋にジャポネスクな OS を作ろうとした研究が(略)

農工大のOS omicronかな。

257 名前:login:Penguin [01/12/18 21:48 ID:61X7j+2e.net]
みんな忘れてないか?age

258 名前:login:Penguin [01/12/21 06:06 ID:o684insm.net]
良スレ age



259 名前:login:Penguin mailto:sage [01/12/21 10:58 ID:7GMumlLM.net]
>>257
クソスレだ。ageるな。

260 名前:login:Penguin mailto:age [01/12/21 11:51 ID:rzRakEP/.net]
age

261 名前:login:Penguin mailto:sage [02/02/04 12:41 ID:m17eMVoW.net]
不治痛age

262 名前:青木光恵 mailto:青木光恵 [02/02/06 01:26 ID:07Li/whj.net]
青木光恵

263 名前:login:Penguin [02/02/06 01:36 ID:+3nKE+HU.net]
ダーヤス写真集age


264 名前:login:Penguin [02/02/07 13:39 ID:12+BCoHT.net]
んー。
文字コード云々の前に「コンピュータ上で扱えたい日本語」を
全部選定(?することは既に完了してるんでしょうか?
「正」の字とかは一画ずつ全五画分必要そうだし
偏だけ、旁だけってのも将来を見通せば必要そうですけど
出来てるんですかね。

265 名前:login:Penguin [02/02/07 18:12 ID:0AxTDb5J.net]
X向けのcharsetはISO 2022だったよね。

266 名前:login:Penguin [02/02/07 20:36 ID:txThOpuJ.net]
とりあえず >>15 は嘘。
HP-UX も Solaris も日本語環境を入れる時の
default は SJIS です。

267 名前:login:Penguin [02/02/07 20:40 ID:txThOpuJ.net]
よーしパパ LASER5 7.2exp の不具合張っちゃうぞ。
www.laser5.co.jp/support/l5linux/faq/72exp/index.html (Q6)

使う使わない、個人の好みの問題は別にして
ちゃんとサポートしれ。

268 名前:login:Penguin [02/02/09 16:35 ID:CI8k4gxh.net]
まあ、Shift-JISみたいな腐れフォント使ってる奴は死ねってことで。



269 名前:login:Penguin mailto:sage [02/02/09 16:37 ID:9Rjes/Sh.net]
フォント関係あんの?

270 名前:おむこさん志望 ◆GqCwfDSA mailto:sage [02/02/09 17:18 ID:QaOYgbNI.net]
>>267
ShiftJISはフォントじゃなくてエンコーディング。
自分でsjisロケールを生成してやればja_JP.SJISでも使える。

271 名前:login:Penguin mailto:sage [02/02/09 18:12 ID:KVJYho4s.net]
まあ、UTF-16 みたいな腐れエンコーディング使ってるOSは氏ねってことで。

272 名前:login:Penguin mailto:sage [02/02/09 21:57 ID:gwaFMMy6.net]
>X向けのcharsetはISO 2022だったよね。
何度も何度も何度も何度もガイシュツなように、2022はcharsetではありません。
encoding schemeです。萎えsage




273 名前:login:Penguin mailto:sage [02/02/09 23:19 ID:5njPVTaC.net]
HTTP で charset= に encoding を書かせるのが誤解をうむ
元だよな...



274 名前:login:Penguin mailto:sage [02/02/11 23:09 ID:X+cO8gdB.net]
元はMIME。

275 名前:login:Penguin [02/02/16 22:54 ID:KpHa2nOV.net]
age

276 名前:login:Penguin mailto:sage [02/02/16 22:58 ID:wiE/aMYf.net]
>>265
Solarisでは、インストール時にUnicode・EUC・SJISのどれかを選択しなきゃいけない。よって、defaultなんてありません。


277 名前:login:Penguin [02/02/19 18:13 ID:E1V3iarF.net]
age

278 名前:login:Penguin mailto:sage [02/02/20 02:17 ID:D4zYH0HU.net]
もう面倒だから全部UCS-4で処理しませんか?



279 名前:login:Penguin mailto:sage [02/02/20 02:47 ID:NRixr7wa.net]
>>272
ふと思ったけど、その表記ってISO-8859圏の人間だけが利用するのを想定してるっぽいな。
ISO-8859系列って、文字集合=文字エンコーディングだから。

280 名前:login:Penguin mailto:sage [02/02/20 08:09 ID:E3jll45S.net]
もう面倒だから全部256ビットで処理しませんか?
1文字 16x16 ドットで。

281 名前:login:Penguin mailto:sage [02/02/20 14:11 ID:dIlnqa5O.net]
>>279
それは便利だ。
けど、そうすると検索性に劣る等の副作用も含む諸刃の剣。

議論が堂々巡りするなぁ、本当にこの話題は…


固定長でエスケープシーケンス無しのエンコードだと拡張性に劣る

エスケープシーケンスで自由に文字集合を切替えられるようにすれば可能性は無限

そうすると、文字列の任意のバイト列を取り出しても判別不能、
最初から最後まで嘗めなければ処理できなくなり、
プログラマの負担増大

じゃあ、いっそ巨大な平面に全部の文字を詰めて固定長で全部処理しよう

異体字を無限に許すことになり、テキストデータ等が溜っても後から検索できない

じゃあ、平面を狭めよう

最初に戻る (゚д゚)ウマー

282 名前:login:Penguin [02/02/21 19:15 ID:WoLsJseW.net]
>>278
>>272にあるようにMIMEが源だけど、
MIMEってheaderに使うencodingでの空白の扱いが、
単語を空白で区切る分かち書きの世界しか意識してないじゃん。
それって結局ISO-8859圏なわけでしょ。

MIMEとUnicodeは日本からの働きかけに失敗した例だね。

283 名前:login:Penguin [02/02/27 10:34 ID:Fz3oNkse.net]
>>279
256ビットでは、異体字が多くなり易過ぎて検索が辛いです。
64ビットにしましょう。1文字8x8ドットで充分。少なくともX0208の区別は付くし。
区別が付かない文字は、包括すれば問題無し。(w

284 名前:login:Penguin [02/02/27 12:57 ID:5Le7VrIb.net]
>>282
包括もそれはそれで問題だと思うぞ。
既にJISでもさんざん問題になっているが。


285 名前:login:Penguin [02/02/27 12:59 ID:EMez+aas.net]
全角英数とか半角カナとか、なんで廃止しないの?
ネット上のゴミにしかなってないんじゃ。。。

286 名前:login:Penguin [02/02/27 13:01 ID:2qxooejq.net]
全角英数はよく見る。需要はあんでしょ。

287 名前:login:Penguin mailto:sage [02/02/27 13:05 ID:Fv8Z2UaF.net]
「包摂」?

288 名前:login:Penguin [02/02/27 13:07 ID:5Le7VrIb.net]
>>285
見るか見ないかじゃなくて、必要かどうかを言いたいんではないかと。
意味合いも用途も同じなのに別のコードが割り当てられてるのは
プログラム上で同一に扱いたいとき面倒なだけでメリットが何もないし。

# まぁ、いまさら廃止したとしてもユーザが使い続けてる限り
# 撲滅はできないとは思うけども。。。




289 名前:login:Penguin mailto:sage [02/02/27 13:24 ID:HUK2U80k.net]
全角英数はデータ入力でも有害だから、
(データ処理側で変換するとしても)
IMEではdefaultで半角英数にしておけばいいのにね。

WindowsのPPP接続の電話番号設定ではよくあるトラブルの一つだな。
Dailup widzardが半角変換しないから。ユーザ名とかも。

290 名前:login:Penguin mailto:sage [02/02/27 23:41 ID:xsQ6CV0u.net]
>>280
そういや,
[0x80〜0xFF]x任意個+[0x00〜0x7F]で1文字を表すようなコードって
誰も提案しないの?
#まあ,UTF-8の変形ですかね.
これだったら任意数の文字を表現できるけど,プログラム処理は
そんなに大変にならないと思うんだけど.


291 名前:289 mailto:sage [02/02/27 23:48 ID:xsQ6CV0u.net]
自己レス
\とか/とか:とかのコードは外さないと危ないじゃん.
逝ってきます……


292 名前:login:Penguin [02/02/28 01:40 ID:tMYcWs/N.net]
文字コードとグリフを別々に管理するような
テキストの規格が普及してれば
全角と半角とで苦労したりしなくてすむのに。

ascii と JISX0208 で意味的に重なっている記号を
同一視するとかの問題もなくなるし。


293 名前:login:Penguin [02/02/28 03:52 ID:hiYdbzc9.net]
全角英数と半角カナはさっさと逝くべき存在。
「メールで半角カナは良くない」っていうのが広まる直前に、
DoCoMoのアホ共が!
ISO-2022-JPに含まれてねーだろ<JIS X 0201カナ集合


294 名前:292の続き [02/02/28 03:56 ID:hiYdbzc9.net]
IMEも罪重い。
上でも書いてる人いるけど、何故デフォで全角英数にする?
Justsystem何考えてるんじゃー。
それともなんらかのメリットがあるのか?

295 名前:login:Penguin [02/02/28 04:51 ID:WilwHU5r.net]
>>292
電話会社は今でもどんどん絵文字増やしてるね。

まあencoding schemeが滅茶苦茶なのはもう諦めるから、
せめてcharacter setをちゃんと登録して、
そのcode pointくらい発表して欲しい。

296 名前:292 [02/02/28 05:01 ID:hiYdbzc9.net]
>>294
絵文字は論外だと俺は思う。

しかしこれは彼女の話なんだが、
「絵文字をセンス良く使う人は好感がもてる」
有効性(?)って点からは、iモードの絵文字は功罪半ばするところだ。

DoCoMoの絵文字コードポイントは
www.nttdocomo.co.jp/mc-user/i/tag/emoji/
もうふやさんでほしい……

297 名前:login:Penguin [02/02/28 07:02 ID:3yJTluRp.net]
全角英数は、意味のある使われ方もしてますからねえ。
縦書きの時に、縦に書く文字と横に書く文字の違いとして使われている事がある。
そんなのは書式で表現するべきとの意見もあるでしょうが、書式で表現するべき違いか、キャラクターセットで違いを出すべきかは、文化による要素が大きい。

たとえば「…」は、英文の「...」という三点リーダ表現を日本語に取り入れ、縦書きの時に中央揃えになった記号です。
ですので横書きの時には、同じと見なされるべき文字なのです。
さらに「……」と「‥‥‥」という、日本で

298 名前:発達した六点リーダの表現方法が2種類あるキャラクターセットとなってしまっています。
これらに対して、書式で表現するべきで、キャラクターセットが間違っている、と言っても仕方無い話です。
全角英数字も同じ事ですよ。利用実体を認めないと、無意味な議論でしかないです。。
[]
[ここ壊れてます]



299 名前:292 [02/02/28 09:10 ID:hiYdbzc9.net]
>>296
後半は勉強になった。ありがとう

全角英数・半角カナは静かに消えていくべきものなんだから、
新しく「存在理由」を与えないで欲しい。
・(半角かなの場合)メールに文字をたくさん詰め込める
・複数行アスキーアートで使い分け
鬱……

300 名前:login:Penguin mailto:sage [02/02/28 09:49 ID:qz/FHA4q.net]
>>295
絵文字自体の存在意義と文字コードの割り当ては同一視すべきではないと思うよん。

漢字や平仮名等の文字よりも遙かに流行り廃れの激しい領域だから、
コードを割り振って一般的に使えるようになった頃にはもう必要なく
なっているという事態ではないかと思われるけど。
(それは画像として送ってくれってこと)

結局のところアナログな「表情」や「意志」をデジタルな文字として
表わすこと自体に無理があるといえばそうなんだけど。


301 名前:292 [02/02/28 11:12 ID:hiYdbzc9.net]
>>298
DoCoMoがSMTPをコミュニケーションの手段として選んだため、
画像を文章に混ぜるのは(不可能ではないが)難しい。
となると、既存の文字を組み合わせて作る「顔文字」という
方法があるわけだが、端末の画面サイズが決めうちため送信者の
意図通りに表示されないことが多々ありえる。
そのため(問題はあるが)「絵文字」を定義するのが一番コストが少ない。

上は俺の推測。
だから、DoCoMoが勝手に絵文字をぶち込んだのは理解できる。
# むろん納得はできないがな

しかしそれより問題なのは半角カナだ。先のことを考えたなら、
メリットよりデメリットの方が大きいと思うんだが……


302 名前:login:Penguin [02/03/01 00:46 ID:9t6ixOpM.net]
絵文字は文字コードとしては実際どこに
格納されてるの? sjis の空き?

303 名前:292 [02/03/01 05:04 ID:rxMXOdIk.net]
>>300
ユーザ定義文字(外字)用の領域のうち、後ろから10%弱に
つっこまれてる

304 名前:login:Penguin mailto:sage [02/03/01 11:27 ID:LxuMhOts.net]
>>300
>>295のURLを見よ。

305 名前:login:Penguin mailto:age [02/03/23 12:57 ID:qVojErfB.net]
保全age

306 名前:login:Penguin mailto:age [02/04/12 22:58 ID:ee9Vglvq.net]
age

307 名前:login:Penguin [02/04/19 17:08 ID:IRZ7c+3a.net]
age

308 名前:login:Penguin [02/05/19 00:25 ID:SEv2YXyA.net]
新coding-system提案:
iso-2022-2ch

世界初!各文字の文字幅比まで規定したcoding-system!
0x7e は tilda だが、何故か0x5cは円マークのこと。(藁

#保全age。



309 名前:unagi [02/05/19 00:34 ID:HWW5oL9x.net]
unagi

310 名前:login:Penguin mailto:sage [02/05/19 03:01 ID:mYPYUKFp.net]
これどうよ
Coventive独自のGiga-Character-Set
www.coventive.co.jp/gcswhite.html

311 名前:login:Penguin [02/05/27 00:32 ID:NWrtA+hm.net]
文字符号の歴史 −アジア編−(ISBN4-320-12040-X)
三上喜貴著 B5変型判,384頁,7500円
kyoritsu-pub.topica.ne.jp/shinkan/shin0203_03.html

こんなん出るんだね。


312 名前:login:Penguin [02/06/03 22:25 ID:SlwuhY0T.net]
・1文字32ビットにする(Charactor Set = Encodingにする)
・UCS4を最初から作り直す

これで

313 名前:全てOKだよ。互換性問題以外は。 []
[ここ壊れてます]

314 名前:login:Penguin [02/07/02 02:05 ID:zRK+hHNj.net]
賛成。1文字を4バイト(4オクテット)にすればよい。
C言語の文字を表す型名char をバイトサイズのデータ型と混同して
プログラミングで使うというスタイルが実に良くない。
既存のCで書かれたソースをすべてchar を byte という型名で置き換え、
Charという型名でもって、4オクテット文字をあらわす型名とし、
従来のアスキーコードは右端のバイトに埋め込み、Charが符号無しか
符号付であるかによって左の3バイトはオールゼロにするか、
あるいは右端のアスキーコードの符号付延長とする。
GCCを改造して、文字は4オクテットとして、データ―タイプbyteを
導入する。たとえばCのソース中に 'a' と文字が書かれていたら、
それは4バイトのデータになるし、"ABCD"と文字列がかかれていたら
それは全部で20バイトになるという具合だ。
デバイスドライバーや通信プログラムには、従来の
コードとの変換フィルターを作ったりする必要があるかもしれない。
内部コードのみ4バイトとして、通信コードにはJISを用いたり、
必要に応じて圧縮をするべきかもしれない。。。。
ともかく、文字が4バイトの固定長であって、(出来れば符号無しか
符号付かをも含めて統一すべきだ)くれれば、ものごとは
実に単純明快になる。

315 名前:login:Penguin mailto:sage [02/07/02 04:50 ID:yx04ZA8s.net]
超漢字でつかってる文字集合って4byteで表せるの?

316 名前:login:Penguin [02/07/02 05:34 ID:W8RRbPwE.net]
>>311

1文字4バイトで、"ABCD"がなぜに20バイト?
16バイト? それとも俺って何かぬかしてる・・・?
文字列終端のNULLも4バイトってこと?






317 名前:login:Penguin mailto:sage [02/07/02 10:11 ID:J9ewXkSU.net]
>>313
そだろ。
なにか問題でも?高々4倍だろ。しかも、中はスカスカだから、
圧縮率高いし。

318 名前:login:Penguin mailto:sage [02/07/03 23:19 ID:4sQNVHL5.net]
レス間隔が広いな(わ

Unicodeだのいう前に「シフトJIS」統一してくれ…。
せめて名前の峻別だけでも…頼むよ。



319 名前:login:Penguin mailto:sage [02/07/04 02:20 ID:oPs3IW0a.net]
CP932でいいじゃん。

320 名前:    [02/07/17 00:41 ID:TeaEgqOV.net]
4バイト文字コードのオープンソース、あるいはGPLのライセンスによる
OSとコンパイラが完成して広まれば、それが各国の言語で共通に使える
プラットホームとなりうる。相違点は、入力フロントエンドとか、
ワープロの文則、禁則の処理の仕様とか、かな?

もしも3バイトで全世界の文字が十分に利用可能であるならば、
上の1バイトは書体をあらわす指定にすることもできるかもしれないな。
(ただ、そういうことをあまやらないほうがいいという考え方もあるな)






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<244KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef