文字コード総合スレ p ..
[2ch|▼Menu]
441:デフォルトの名無しさん
08/03/25 00:09:56
もう全部x-つけといたらいいよ。

442:デフォルトの名無しさん
08/03/25 00:16:39
つーかさー
URLリンク(mail.apps.ietf.org)
なんでMartin Duerstセンセイともあろうお方が今さらこんなこと言ってるの?
RFC 1192ご覧になったことあります? つーか
> We also wish to thank the following people who contributed in many
> ways towards this document.
> Zhang Zhoucai Martin J. Duerst
見てないはずがないんだけど。

何でcharset-extensionとcharset-editionはみんなに無視されたのに
今度はうまくいくとか無邪気に思い込めるわけ?

443:デフォルトの名無しさん
08/03/25 00:17:15
RFC 1922の間違いorz

444:デフォルトの名無しさん
08/03/25 00:23:06
>>440
いやそのドキュメントは有意義だと思うよ。
ちゃんとまとめて、読めるようにしとかないと、
独自コード乱発は加速するばかりだから。

445:デフォルトの名無しさん
08/03/25 01:19:23
>>431
CP51932 相当の IANA 名をWindows-31Jって言うんじゃね?
テキストエンコーディングが何だろうと、文字集合は同じでしょ。

446:デフォルトの名無しさん
08/03/25 11:35:01
>>445
IANA charsetの「charset」は文字集合+符号化方式のセット

447:デフォルトの名無しさん
08/03/25 11:38:59
>>440
Martinセンセイにドキュメントがないだとか色々突っ込まれて力尽きてたはず。
使いたいなら後をついで進めるといいのかもしれないけど、
必要なドキュメントをJISが握ってる以上難しい気もしないでもない。

448:デフォルトの名無しさん
08/03/25 11:56:26
流れぶった切ってすまん。
日立のEBCDIKコード表探してるんだけど、
URLリンク(www.wdic.org) とか
URLリンク(www.pleasuresky.co.jp) とかじゃなくて
日立が提示してるオリジナルがいいんだけど、どっかにないですかね?

449:デフォルトの名無しさん
08/03/25 12:01:21
URLリンク(www.pleasuresky.co.jp)

450:デフォルトの名無しさん
08/03/25 12:04:00
>>449
なにこの汚いコードは

451:デフォルトの名無しさん
08/03/25 12:13:23
文字コードの判別、変換に挫折した…
情けねぇ…

452:デフォルトの名無しさん
08/03/25 18:13:48
EBCDIC くらいは知っとこうぜ

453:デフォルトの名無しさん
08/03/25 21:14:53
>>444
ドキュメントの有意義さは否定しないけど
実際にWebページやメールでそのドキュメントの通りに使えというなら
使えるようにしてくれなきゃ話が始まらない
>>447
俺はUnicodeでいいと思ってるからなー
使いたい人ががんばってくださいとしか
がんばらないで勝手に使うという最悪の選択だけはくれぐれもやめてほしい

454:デフォルトの名無しさん
08/03/25 21:21:11
UpperCharで
小文字 0xED40 \

大文字 0xFA5C \
に変換されるのですが、この辺わかりやすく説明しているサイトないでしょうか〜


455:デフォルトの名無しさん
08/03/25 21:35:00
>>454
URLリンク(support.microsoft.com)

456:デフォルトの名無しさん
08/03/25 21:41:47
>>455
非常に勉強になったよ。
ありがとう!

457:デフォルトの名無しさん
08/03/26 02:30:15
>>453
> 実際にWebページやメールでそのドキュメントの通りに使えというなら

言ってないw

458:デフォルトの名無しさん
08/03/26 02:37:51
なるほど
> ケータイの絵文字や、CP932のIBM拡張文字など
はインターネットで使うべきでないとは書いてるけど、代わりに何を使えとは確かに
直接書いてはいない。でもそれなら何で今インターネットで使えるJIS X 0208:1997
ベースのShift_JISではなくわざわざShift_JIS-2004に言及してるの?
Shift_JIS-2004の絵文字のうち
> 「♪」以外は収録されていなかった
そうだけどそれらは使っていいの? いいならcharsetパラメータには何を指定すればいいの?

459:デフォルトの名無しさん
08/03/26 08:47:40
結局世の中の流れとしてはこんな感じ?

1. いわゆるレガシーエンコーディングの、ベンダー毎の拡張みたいのは今後積極的
にはサポートされない。
 -> 新たに IANA に登録されてたりすることはない?
 -> charset にない文字を使っているようなのは化けてもしょうがないって感じ?

2. IBM拡張漢字、絵文字等をどうしても使いたい場合は Unicode で。
 -> Windows-31J は IANA に登録されてるからアリ?

460:デフォルトの名無しさん
08/03/26 09:54:22
Windowsで扱える文字一覧みたいなものはどこかにないでしょうか?

461:デフォルトの名無しさん
08/03/26 12:14:50
コードページ毎で良ければここはどう。
URLリンク(www.microsoft.com)

462:デフォルトの名無しさん
08/03/26 13:04:19
>>460
U+0000からU+10FFFFまで扱えるよ

463:デフォルトの名無しさん
08/03/26 13:10:39
>>461
ちゃんと資料があったんですね。ありがとうございます。

464:デフォルトの名無しさん
08/03/26 13:12:18
>>462
すいません、ちゃんとフォントがあって表示できる
またはIMEから入力できるものという意味でした。

465:デフォルトの名無しさん
08/03/26 13:20:32
>>458
>> ケータイの絵文字や、CP932のIBM拡張文字など
>はインターネットで使うべきでないとは書いてるけど、代わりに何を使えとは確かに
>直接書いてはいない。
IANA charset登録済みのもの。

>でもそれなら何で今インターネットで使えるJIS X 0208:1997
>ベースのShift_JISではなくわざわざShift_JIS-2004に言及してるの?
なんでだろうねぇ。
Windows-31Jとして登録済みの「CP932」の方がマシだと思うんだけど。

>> 「♪」以外は収録されていなかった
>そうだけどそれらは使っていいの? いいならcharsetパラメータには何を指定すればいいの?
使っていい、Unicodeに登録されているんで、UTF-8を指定すればよい。
もちろん、JIS X 0213系のエンコーディングはダメ。




466:デフォルトの名無しさん
08/03/27 18:55:27
> Windows-31Jとして登録済みの「CP932」の方がマシだと思うんだけど。
他にも>>440の資料は突っ込みどころ大杉。
> JISにもUnicodeにも違反しており
未使用領域を使用禁止にしているJIS X 0208/0213と違ってUnicodeでPUAを
使うこと自体は何も規格に違反してない。いわば文字化けするのはUnicodeの仕様。
> Windows Vistaの方が、ある意味、正しい動作だと言える。
どっちかが正しい動作だと言うこと自体ミスリーディング。
規格を守っていても「字体化け」するのがJISやUnicodeの「仕様」。

もちろん安岡センセイがそんな初歩的なこと知らないはずがないので
確信犯なんだろうけど(とくに後者)。

467:デフォルトの名無しさん
08/03/27 20:05:38
しかし、文字コード関連は政治的な位置からものを書く人間が多すぎるな

468:デフォルトの名無しさん
08/03/27 20:16:54
文字コードはもともと政治の道具です

469:デフォルトの名無しさん
08/03/27 20:22:49
オタク好きするんだよ。政治というか、勢力争いの話はね。
そういうのが存在する分野の話になると、そこにばっかフォーカスすることになる。

それだけを固めた例としては、ゲーハー板。

470:デフォルトの名無しさん
08/03/28 00:04:05
>467
だったらネタ振ってくれ。例えばNew ASCII配列とか。

471:デフォルトの名無しさん
08/03/28 05:47:01
例まで絞るくらいなら、その話題を自分が振ればいいのに。

472:デフォルトの名無しさん
08/03/29 13:19:21
EBCDICとEBCDIKの違いがあるのも政治的な理由からですか?

473:デフォルトの名無しさん
08/03/29 15:58:10
メリケン野郎にはカナなんかいらんからだろ。

474:デフォルトの名無しさん
08/03/30 02:19:37
ICU のこのページ→ URLリンク(demo.icu-project.org) なんだけど、
Aliasってことは「等価な」エンコーディングって扱いなのかな?
もしそうだとすると日本語のエンコーディングに関しては鬱なような...

475:デフォルトの名無しさん
08/03/30 04:31:26
ちょっと横レスですが。

>>472-473
EBCDIKってのは日立方言だよ。
ネットではEBCDIC(カタカナ版)のことだと説明してることが多いけど、
誰かがそう書いたのをよく調べもせずに孫引きで書いている奴が多いだけ。

476:デフォルトの名無しさん
08/03/30 11:19:36
>474
「Converters with conflicting aliases」とか。
ibm-942-P12A-1999とibm-943-p15A-2003が
両方ともaliasにcp932を持ってる事の説明が付かないけど?

477:デフォルトの名無しさん
08/04/04 11:08:02
さて
Unicode 5.1のリリース予定日がやってまいりました

478:デフォルトの名無しさん
08/04/05 21:55:19
無事リリースされますた。
StandardizedVariants.htmlにIVDに関する言及が追加されますた

479:デフォルトの名無しさん
08/04/06 02:55:20
また新しい文字コードが一つ増えただけになるのか、それとも統合されるべく方向に行っているのか。
まったくこのスレのネタすら分からないけど、基本的にutf-8かutf-32?使っておけばよい?
16はなんか面倒とか聞いた覚えがあるが今はそこまで調べる気力なし…。

480:デフォルトの名無しさん
08/04/06 10:49:53
>>479
基本的に UTF-8 使っておけばよし

UTF-32、というか32ビットでの処理はアプリが内部で使う場合の話で
文字コードとして意識する必要はないよ

481:デフォルトの名無しさん
08/04/06 10:58:00
内部処理も行処理程度だとUTF-8のままってのが多いしね。

482:デフォルトの名無しさん
08/04/06 12:53:51
ユニコードで唯一の功績は UTF-8 を発明したこと。
提案したのは部外者だけど。

483:デフォルトの名無しさん
08/04/06 20:02:59
功績か?
utf-8って好き嫌いがはっきりしている気がする。

484:デフォルトの名無しさん
08/04/06 20:07:05
日本語が3〜4バイトになるからなあ。
まあ仕方が無いのは分かるが。

485:デフォルトの名無しさん
08/04/06 21:08:59
>>482
Unicodeのエンコード方式の一つとしてはそうなのかもしれんが…
一長一短な気もするけど、今後Unicode対応アプリを作る上ではUTF-8はchar*で扱える
面だけ取れば悪くはないのかも
XMLとかもさ
だけど、結局ファイルやストリームから読み取る分にはUTF-8でいいけど、1〜4バイトの
可変長ってのがね
処理内部はUTF-16として扱うのが一番楽だね1文字2バイトと単純計算できるし、
今はサロゲートペアのことを意識する必要が無いから

文字列はそもそもリソース定義すべきだから、ソース中に文字列で埋め込まないんであれば
エンコード方式さえはっきりしてればどうでもいいや
それより、SJISでコメント書いたソースをWindowsエミュレータやリビジョン管理(ClearCaseやCVS、SVN)
で使って、実機やテスト機(Linux)ではEUCだとコンパイル時にコメントが改行されてたりするんだよねw
うちんとこでは、Lunuxビルドはmakefileの中でnkfで文字コード変換されてるが…

486:デフォルトの名無しさん
08/04/06 21:19:34
> 今はサロゲートペアのことを意識する必要が無いから
いつかサロゲートペア対応に改良する暇はあるの?
初めからUTF-32にすればいいだろ。

487:デフォルトの名無しさん
08/04/06 21:26:20
ユニコードはエンコード方式がわかっても日本語とは限らないんだな。
CJKでしかないから。

488:485
08/04/06 21:33:50
>>486
Unicode 4.0を見てみたw
どう見ても、当面サロゲートペアを使う必要はなさそうだなあw
UTF-32でもいいんだけどさ、やっぱ1文字で4バイトってやだなー
特に理由ないんだけどさ
U+10000〜を使うことが明らかなら別だけど、使わないしさ

>>487
CJKというか、CJKVのようだけどね
Unicodeは言語を識別するためのものじゃないし、それは別途ISO 639なり使って
管理するとかじゃないの?

489:デフォルトの名無しさん
08/04/06 21:37:48
今の仕様書を1990年に持っていけたらもっとマシなコード体系が出来上がるんだろうなあ…

490:485
08/04/06 21:43:44
>>489
時はバブル、んな将来的なことどうでもいいとか思われそうだがw
Y2Kなんて、もっと早急に対応してればあんなに世間が騒ぐこともなかったんだし
結局何も起きなかったけどさw

491:デフォルトの名無しさん
08/04/06 21:58:14
世の中の悪い事態の多くは、そうなることが予測不能だったからではなく、
そうなるとわかっているけど対処しなかったから起こったんだ、
とつい最近どっかで読んだけど、まったくだw

492:デフォルトの名無しさん
08/04/06 22:12:38
その意味では正に、
「過去に戻れても、やはり同じようになるよ」だな。

493:デフォルトの名無しさん
08/04/06 23:09:49
>>485
>今はサロゲートペアのことを意識する必要が無いから
さすがにもう時間の問題でしょ。
そろそろ JIS X 0213 が要求に入り始めるだろうし。

494:デフォルトの名無しさん
08/04/07 01:51:07
UTF-8は大好きですよ

495:485
08/04/07 08:49:15
>>493
JIS X0213はさすがに困ったちゃんな規格を作ってくれたもんだなぁと思いつつも、いわゆる第三〜第四水準に
ようやく人名漢字として略されてたものとかが扱えるとかどうとかで恩恵を受ける人もいるんだろうか?
サロゲートペアを扱うとなると、1文字=2バイトの原則が壊れるんだよなぁ

そういや、2000年だかから中国のGB2312の拡張規格GB18030は、中国大陸における文字表示可能な機器の
全てが対応する必要があるとか訊いて社内で騒ぎになって、Windows2000ではGB18030フォンとパックやら
変なAPIで4バイト文字対応してたとおもうんだけど、こいつはUnicodeとどう親和性を取るつもりなのかな?
規格上はGB18030はISO/IEC 10646を丸ごと飲み込んじゃう規格なんだけど…

496:デフォルトの名無しさん
08/04/07 13:42:22
>>485
>今はサロゲートペアのことを意識する必要が無いから

サロゲートペア以外にも合成文字とかあるんですけど。

497:デフォルトの名無しさん
08/04/07 19:05:39
>>496
MacOS-Xの「ヒ+゜」とかね。
いつ「普通の」データとして飛び込んでくるか分かったもんじゃない。

498:デフォルトの名無しさん
08/04/07 19:12:03
何しろあれが正規形の一つだからな。

499:485
08/04/07 19:41:16
>>496
確かに…
合成文字はヤだなぁ
あと、くっつき方がキモいデーヴァナーガリー文字とかその類も…

500:デフォルトの名無しさん
08/04/07 20:01:44
>>497
Mac持ってないけど「ピ」は合成されてるの?
JISX0213の「か゜」とかじゃなくて?

501:デフォルトの名無しさん
08/04/07 20:26:25
>>500
>>413のNFD


502:デフォルトの名無しさん
08/04/07 20:46:58
>>485
もう現実を見るんだ。
固定バイトの文字コードなんて所詮夢だったんだよ。

503:デフォルトの名無しさん
08/04/07 21:20:35
それでも32bitあればなんとか…

504:デフォルトの名無しさん
08/04/07 21:25:05
HYPHEN-MINUSって文字が誕生した時からこの世はカオスさ

505:デフォルトの名無しさん
08/04/07 22:26:30
UTF-8は0x10入らないようにして欲しいなぁ。

506:485
08/04/08 09:22:27
>>502
そうか、やはりそうなのか…
固定バイトはもはや夢物語なんだなorz
合成文字といえば、ヨーロッパのラテン文字事情なんとかならんのでしょうか???
ローカライズにあたって、文字列検索の曖昧検索を行うわけなのだが、Aとキーされようと、
アクセントが付いてようとウムラウトだろうと引っかからないといけないのはまぁいいとして…
A+アクセントとかはやめて欲しいのだがw
いったい、ヨーロッパは何言語あるんだYO!

507:デフォルトの名無しさん
08/04/08 09:43:20
L10nされたあいまい検索は、各言語のネイティブの専門家によるアドバイスが
ないとムリポ。
(「エ」と「ヱ」を同一視するかどうかなんて日本人でも判断に困るだろ?)

508:485
08/04/08 11:31:51
>>507
だよねー
今月号の「NEWTON」を読んだら、ラテン語のアルファベットは当初英語で使われるものとほぼ
同じだったとか?
その後に、フランス語やらでアクセント記号が付けられたとかどうとか…
てっきり、逆だと思ってたんだが、Unicode 1.0策定時にCJKの統合に当たってルーツの異なる文字で
似ている物を同一視しようとした件、ラテン語圏でもやはりアクセント記号はそれくらい意味のある文化
の一つなんだろうか…

幸い、自分は合成文字には今のところ携わることはなさそうだが…
中国国家標準のGB 18030をどうにかしてもらいたい…
GB 2312、ASCII、ISO/IEC 10646をうまいこと包含しているという点ではうまいこと考えたなと関心
出来るんだけど、結局は1〜4バイトのマルチバイト文字ってワケで、ISO/IEC 10646を包含したとしても
変なジレンマ作ってるだけだし…
そもそも、CJKのグリフが U+3400〜U+4DFE、U+4E00〜U+9FFEまでしか割り振られてないじゃんか!
BMP面で足りるじゃんかー!

509:デフォルトの名無しさん
08/04/08 13:30:47
>>507
ラテン語ネイティブも、油断してると、
JIS X 0208のFULLWIDTH LATIN (CAPTAL) LETTER *ってのがあるしね。
自前で実装しようとするとHALFWIDTHへの正規化を忘れちゃう。

>>508
表音音文字元祖のフェニキア文字の子孫の
ギリシャ文字でさえ発音記号はないからね。

アクセント記号はcollationの時にも、
取り払ってソートするか付いたままソートするか、
国によって標準的な取り扱いが違って難しい。

510:デフォルトの名無しさん
08/04/08 20:21:30
そのへんはそのうちCollationライブラリが何とかしてくれるから問題ない。

>>GB18030
Unicodeに変換して処理するだけなんだから別に関係ないでしょ

511:デフォルトの名無しさん
08/04/08 20:49:23
他国の心配する前に日本語の処理くらいまともにやってくれ

512:485
08/04/08 21:02:50
>>510
いやいや、GB 18030は現状はUnicodeでグリフのある領域はカバーしてるけど、Unicodeに無い
民族文字やらをどんどん増やす思惑があるらしい…
だったらその思惑をUnicodeコンソーシアムで提起して貰いたいものなんだが…

>>511
俺の文章?orz
どうせローカライズ以前に、各国の文言を用意するのは翻訳チームのすることで、俺は関わってないし

513:デフォルトの名無しさん
08/04/08 21:05:12
自国で独自路線に突っ走りまくってる日本じゃないんだからお前ごときが
他国の心配しなくてもちゃんと国際提案してくるからむしろ日本NBの怠慢ぶりを
何とかしてくれってば

514:デフォルトの名無しさん
08/04/08 21:21:00
そこでJIS第五水準ですよ

515:485
08/04/08 21:46:47
>>513
これは>>513の現場もそうだろうと思うのだが、日本人のSEに限らずPMに至るまで、
日本における標準化についてまともに考えている奴っている?
C++を理解するのにISO/IEC 14882を読んだり、仕様書を書くときに主語をちゃんと
付けることを意識するとかさ?
今俺が書いてる文章なんかは支離滅裂だけどorz

>>514
JIS X0213の二の舞はやめようよw

516:デフォルトの名無しさん
08/04/08 22:14:13
>仕様書を書くときに主語をちゃんと付けることを意識するとかさ?
書かないまでも、意識していないと所謂「とんでも」文書ができあがるわけだが。
# 「マウスボタンが押すとウインドウが表示します」とか。

517:デフォルトの名無しさん
08/04/08 22:40:59
>512
UNICODE的に、新規コードポイントの追加は、
まずは国内規格、次にUNICODEって順番じゃなかったっけ?

518:デフォルトの名無しさん
08/04/08 23:31:00
だから、ウニコードやまりゃいいじゃん


519:デフォルトの名無しさん
08/04/09 00:23:03
はやくExt-C出せー

520:デフォルトの名無しさん
08/04/09 02:59:07
>>515
なんで俺の職場の話がいきなり出てくるのか意味不明だが
日本における標準化の試みは
学者が机上の空論をあーでもないこーでもないと小田原評定のごとくこねくり回した
挙げ句黒船に全部持って行かれるのが通例。
URLリンク(www.itscj.ipsj.or.jp)
の異体字アーキテクチャの検討なんて絵に描いたようだ

521:デフォルトの名無しさん
08/04/09 08:47:51
んー、
動画フォーマットとかはそうでもない気がするけど?

522:デフォルトの名無しさん
08/04/09 09:00:50
mbcs/wcs
ISLISP
IPv6, Mobile IP

この辺は日本の団体が組織的に関わってるよ。


523:デフォルトの名無しさん
08/04/09 09:29:05
個人名で論文や案を提出してレビューする形にしないと、
>>520が多い状況はなかなか改善できないと思う。
本来、案もレビューも書かない奴の意見なんて聞く必要ないんだ。

524:デフォルトの名無しさん
08/04/09 13:14:54
意味のあることを何も言えない奴って、無視されると
意味のあることを言った奴より怒るんだよね。

525:デフォルトの名無しさん
08/04/09 23:39:09
>>523-524
* Ideographic Variation Databaseという対案が明確に示されてる
* 日本は>>520を国際提案していない
話にもならんね

526:デフォルトの名無しさん
08/04/11 14:34:46
>>501
Mac OS XのHFS+は、
さらにアルファベットの大文字小文字の同一視もやってるよな。

ファイル名としては大文字小文字が保存されているけど、
比較ではcase ignoreだからFooがあればfooでopenする。
FULLWIDTHなアルファベットも同じ。

ただしFULLWIDTHとHALFWIDTHな文字は同一視しない。
WIDTH範疇が同じ場合に限り大文字小文字を区別。

527:デフォルトの名無しさん
08/04/11 15:11:34
>WIDTH範疇が同じ場合に限り大文字小文字を区別。
×区別
○同一視

こうですか?

528:デフォルトの名無しさん
08/04/11 18:52:47
>>510
>そのへんはそのうちCollationライブラリが何とかしてくれるから問題ない。

そういえば Unicode で日本語の文字列をソートした場合、普通はどんな並び順に
なるんでしょうか/なるべきなんでしょうか。Collation のライブラリ毎に違うんでしょうか。
unicode.org の TR10 とか見てみましたがよくわかりませんでした。

529:デフォルトの名無しさん
08/04/11 20:02:25
>>526
Case SensitiveなHFS+もあるよ。
同一視する文字や使えない文字はファイルシステム毎に異なるから
あるファイル名が使えるかは単純には判断出来ない。

530:デフォルトの名無しさん
08/04/12 03:00:11
>>529
既にインストーラでは選べないんじゃない?
昔使ってたが、馬鹿アプリで問題発生したので使わなくなった。
アプリ内のファイルがCapitalizedなのに、
アプリが全部大文字でアクセスしてたw

531:デフォルトの名無しさん
08/04/17 22:38:32
URLリンク(std.dkuug.dk)
トンパ文字の提案キター

532:デフォルトの名無しさん
08/04/18 06:22:15
URLリンク(std.dkuug.dk)
ARIB互換漢字についてアメリカとイギリスからIVSを使えよボケと突っ込まれてるw

533:デフォルトの名無しさん
08/04/18 21:35:34
これからIVSを積極的に導入してくなら、現在異体字なのに別のコードポイントを
与えられている文字はIVSに吸収してくるとスッキリするんだけど。
今までのしがらみで無理かな。

534:デフォルトの名無しさん
08/04/18 21:48:21
標準に入らなくても、基準とデータは有意義に使われると思うよ。

535:デフォルトの名無しさん
08/04/18 22:25:21
原規格分離規則があるから、全部統一は無理

536:デフォルトの名無しさん
08/04/19 00:09:08
原規格分離規則ってCJK Unified Ideographs領域のみ適用で、
それ以降に定義された領域では使わないっていうアレか。

537:デフォルトの名無しさん
08/04/19 03:41:26
>>533
既存の互換漢字を削除はあり得ないけど、これから追加しようとしたら突っ込まれて当然だろう

538:デフォルトの名無しさん
08/04/20 11:42:06
Uniocde 5.1の文字一覧マダー(aary
URLリンク(www.unicode.org)
予告期限は過ぎてるんだけど

あともう5.2.0のディレクトリあって吹いたw

539:デフォルトの名無しさん
08/04/26 22:57:20
TIP URLリンク(www.unicode.org) 甲骨文字


540:デフォルトの名無しさん
08/04/26 23:04:50
文字コードとグリフを同じに扱おうとしたつけだ
いいじゃねぇの?


541:デフォルトの名無しさん
08/04/27 11:10:56
>>538
来てる

542:デフォルトの名無しさん
08/04/27 20:49:59
ところでT書体はまだですか

543:デフォルトの名無しさん
08/04/28 03:56:41
>>542
URLリンク(www.sakamura-lab.org)
4月中の公開は無理そう
つーか以前は「2006年春」って言っててそれもブッチしてなかったっけ

544:デフォルトの名無しさん
08/04/28 13:30:01
URLリンク(std.dkuug.dk)
結局ARIB互換漢字の追加は受理されたようだ

545:デフォルトの名無しさん
08/04/28 14:19:01
ARIBの仕様書が公開されてた
URLリンク(www.arib.or.jp)
JIS X 0213の指示には私用終端バイトを使って
JIS X 0208の独自拡張をESC 2/4 4/2で指示するという変態仕様
逆だろ…

546:デフォルトの名無しさん
08/04/29 08:16:41
まったくの初心者です。
↓のコードは何でしょうか?
17163542

何て書いてあるのか、教えてください
よろしく


547:デフォルトの名無しさん
08/04/29 08:20:26
板違い。こちらへどうぞ
URLリンク(love6.2ch.net)

548:デフォルトの名無しさん
08/04/29 08:23:07
>>547
すみません。
文字コードじゃないんですか?


549:デフォルトの名無しさん
08/04/29 09:10:30
こちらへどうぞ。
URLリンク(google.com)

550:デフォルトの名無しさん
08/05/01 06:43:38
>>543
やっぱり無理ですた

551:デフォルトの名無しさん
08/05/17 07:02:50
とあるアプリの文字エンコーディングの挙動が変だなと思ったので
問い合わせたら、「Win上のIEの挙動と同じにしている」とのこと。

具体的にはEUC-JPで0x5cが円記号で表示されるのですが。
これってreverse solidusが正解じゃなかったでしたっけ?
確かWinだとここら辺、フォントレベルでおかしなことをしてるんでしたっけ?

しかし正直なところもはやWinやIEの挙動を無視することもできず... トホホ。

552:デフォルトの名無しさん
08/05/17 08:02:14
>>551
「円記号で表示される」だけだと、
エンコーディングレベルで何かやってるのか、
単にフォントがU+005Cを円記号で表示してるだけなのかわからんな。

後者ならフォント変えれば REVERSE SOLIDUS に見えるでしょ。

553:デフォルトの名無しさん
08/05/17 08:23:48
IEと同じというなら後者だな。
Tahomaとかの欧文フォントならバックスラッシュ、
フォントリンクでかな漢字も表示出来ていい感じ。

554:デフォルトの名無しさん
08/05/17 09:44:03
501ですが、
アプリはMac OS Xのエディタです。なんでWin上での技術的背景ではなく
ユーザーエクスペリエンスを問題にしている、とでもいいますか。
IEを「普通に」使ってる分にはEUC-JPの0x5cは円に見える訳ですよね。
あえて欧文フォントを割り当ててバックスラッシュを表示できてもそれはある意味
「化けている」のではないでしょうか。
あるいはIEはあくまでもEUC-JPの0x5cに対してU+005cを表示していて、それが
どう見えるかはフォントやユーザの設定次第、とでも理解すべきでしょうか。

でもIE、確かASCIIやUTF-8だとデフォで0x5cはバックスラッシュ... ややこしいなあ。

555:デフォルトの名無しさん
08/05/17 11:48:24
なんでエディタの名前を書かないんだろう
人の話を聞く気がないならチラシの裏にでも書き捨てろ

556:デフォルトの名無しさん
08/05/17 12:15:02
>>554
実際にIE使ってみればわかるだろクズ

557:デフォルトの名無しさん
08/05/17 12:24:31
>>554
文字コードと文字フォントは別物だよ。
だから、
> あるいはIEはあくまでもEUC-JPの0x5cに対してU+005cを表示していて、それが
> どう見えるかはフォントやユーザの設定次第、とでも理解すべきでしょうか。
でOK。EUC-JPに限らずな。

558:デフォルトの名無しさん
08/05/17 15:10:46
>>551
0x5cというかU+005Cは、ASCIIやJIS X 0213だとUniccode基準で「REVERSE SOLIDUS」でなければおかしいけど、
一般的な日本語エンコードだとJIS X 0201基準だから「YEN SIGN」が正しい。

WindowsのOS標準和文フォントだと、0x5cというかU+005Cは「YEN SIGN」で実装。
Mac OS XのOS標準和文フォントだと、0x5cというかU+005Cは「REVERSE SOLIDUS」で実装。

Windows版のSafariでも、Shift_JIS/EUC-JP/ISO-2022-JPといった日本語エンコードなHTMLでは
和文フォントでも欧文フォントでも0x5cというかU+005CがU+00A5実装Glyph(YEN SIGN)でエイリアス表示され、
それ以外(UTF-8とか)だとフォントのU+005C実装Glyphでダイレクトに表示される。

Mozilla系ブラウザソフトでも「about:config」で、
“layout.enable_japanese_specific_transform  default  boolean  false”を
“layout.enable_japanese_specific_transform  user set  boolean  true”と設定変更すると、Safariと同じ挙動になる。

559:558
08/05/17 15:18:28
>>554
Mac OS Xのエディタでも、設定で0x5cというかU+005CをフォントのU+005Cでダイレクトに表示するか
U+00A5実装Glyph(YEN SIGN)でエイリアス表示かで選択できるものがある。
URLリンク(pc.watch.impress.co.jp)
URLリンク(pc.watch.impress.co.jp)

Windowsの方が日本のローカル規格的には親和な設計ではあるけど国際基準的にはいろいろ問題がある。
Mac OS Xだと国際基準的には親和な設計ではあるけど日本のローカル規格的にはいろいろ問題がある。
だから、Mac OS XやマルチプラットフォームなアプリだとOSやアプリレベルでWindowsとは違う日本ローカル規格対処策をしているものがある。

560:デフォルトの名無しさん
08/05/18 15:24:37
>>558
> Mac OS XのOS標準和文フォントだと、
> 0x5cというかU+005Cは「REVERSE SOLIDUS」で実装。

Mac OS Xだと、
内部SJISアプリの0x5CはYEN SIGN(CMapは83pvまたは90pv)、
内部UnicodeアプリのU+005Cは(標準では)REVERSE SOLIDUS(CMapはUniJIS)。


561:デフォルトの名無しさん
08/05/18 22:56:43
>>559
親和うんぬんの段落はちょっと短絡だろ。

もともとREVERSE SOLIDUSが要求されるところで、(例えば\n)
YEN SIGNを使ったり、YEN SIGNを表示に使ったりしていた過去があるんだから、
そんな単純に割り切れないよ。

562:デフォルトの名無しさん
08/05/18 23:23:33
ESC(BとESC(Jですら同じ扱いだからねぇ。UTF-8はそれこそ・・・

563:デフォルトの名無しさん
08/05/19 20:40:22
Vistaで実装されたとかいうJISX213で使われてるSJIS2004、Unicode3.2、EUC2004ってどうなってんのわかりません

Unicodeで実装されてる第三、第四水準漢字ってSJISにちゃんとマッピングされてんですかね。
なんか規則性なく適当に散りばめてるだけな気がするんで
一文字一文字マッピングされてる場所指定する等で対応しないと対応出来ないのかな?

JISX213レベルでのUnicode-SJIS-EUC全部の対応表があれば嬉しいんですが、そんなのって無いですかね

564:デフォルトの名無しさん
08/05/19 20:48:10
VistaのはJIS X 0213にある文字がUnicodeベースで使えるというだけで、
JIS2004自体に対応しているわけじゃなかったような。

565:デフォルトの名無しさん
08/05/19 21:39:56
>>563-564
Vistaの公式ページで資料もフォントも配布されているというのに、
「されたとかいう」
「どうなってんのわかりません」
「そんなのって無いですかね」
「じゃなかったような」
とかいうヤツってナンなの?ゆとり?
URLリンク(www.microsoft.com)
URLリンク(www.microsoft.com)

566:デフォルトの名無しさん
08/05/19 21:50:06
エンコーディングの話してるのに、フォントの資料を持ってきて
何いってんだか

567:デフォルトの名無しさん
08/05/19 22:04:09
>>566
これだからゆとりは困る。
これがエンコーディングの資料ではないとでも?

・Windows Vista ならびに Windows Server 2008 における JIS2004 対応に関する詳細資料
ホワイトペーパー「Microsoft Windows Vista および Windows Server 2008 における JIS X 0213:2004 (JIS2004) 対応について」(Version 1.2) は、こちら(XPS 形式、PDF 形式) をご参照ください。

・JIS X 0213:2004 / Unicode 実装ガイド
この実装ガイドでは、JIS 文字コードが Unicode 対応の JIS X 0213:2004 へ変更されたことに伴いアプリケーションへ与える影響および対応策などについて説明します。(XPS 形式 1.88 MB、PDF 形式 1.34 MB)

568:デフォルトの名無しさん
08/05/19 22:08:01
ゆとりゆとり言う奴に限って自分では質問に答えられない。

569:デフォルトの名無しさん
08/05/19 22:59:39
>>563
Vistaの実装ではShift_JIS-2004やEUC-JIS-2004には対応していません。
JIS X 0213はUnicodeのレパートリとして実装されています。
必要なら自分で変換してください。

570:デフォルトの名無しさん
08/05/20 21:20:03
>>569
オレオレ変換はやめてくれ
Shift_JISにはマッピングされていないから無理だと思っていただいた方が将来の人が助かる

571:デフォルトの名無しさん
08/05/20 21:43:15
自ら学び自ら考える力を身に付けるための教育(笑)

572:デフォルトの名無しさん
08/05/20 22:52:15
CP932なんて使ってないしShift_JIS-2004のためにも消えてくれ。

573:デフォルトの名無しさん
08/05/20 22:58:09
>>572
お前が使っていなくても、世間が使っている。
ほんと、DOS/Windowsの呪縛の1つだな。

574:デフォルトの名無しさん
08/05/20 23:15:09
2chはCP932だとおもっていたが如何

575:デフォルトの名無しさん
08/05/20 23:15:15
>>572
青空ウンコ工作員乙

576:デフォルトの名無しさん
08/05/25 00:59:45
URLリンク(www.unicode.org)
いつの間にかUnicodeの3面をTertiary Ideographic Plane(第三漢字面)とすることが決まってた。
現時点では1字も定義されてないが古代漢字や甲骨文字を収録するみたいだ。

577:デフォルトの名無しさん
08/05/25 01:08:50
>>576
これは便利だ

578:デフォルトの名無しさん
08/05/25 16:02:10
>>539で既出

579:デフォルトの名無しさん
08/05/30 01:20:21
Unicodeって、色々バージョンがあるみたいだが。
非Unicodeな文字コードとのマッピングが変わることってある?
基本的には予約領域に新しい文字が追加されていくj形という認識で合ってるのかな?

580:デフォルトの名無しさん
08/05/30 06:35:56
各ベンダーのマッピングは文字が追加されなくてもそれぞれ違う。
そもそも一対一対応ですらない。
例えば、URLリンク(support.microsoft.com)

581:デフォルトの名無しさん
08/05/30 20:36:13
IRGの追っかけやってれば知ってるだろうけどCNS11643とのマッピングはしょっちゅう変わってる

582:デフォルトの名無しさん
08/05/31 12:20:35
資金があればいい加減に文字コードを統一したいよな。
文字コード多すぎるだろう。
10年前のシステムならばしかたがないにしても、
現代のハードウェアやソフトウェアの質を考えたら、
行動を起こしてもいいと思うんだがなあ。
ビルちゃん、気まぐれで動かないかなあ。

583:デフォルトの名無しさん
08/05/31 13:16:57
資金とかの問題じゃないような。

584:デフォルトの名無しさん
08/05/31 13:36:15
現在の世の中に存在するコンピュータでも全てがMBやGB単位のメモリを積んでる訳じゃないんだ。

585:デフォルトの名無しさん
08/05/31 14:17:36
すみません、質問させてください。
ワードで文書を作成する際に文字コードを指定されました(JIS-X0208-1982).
しかしこの意味が全くわかりません。

普通にワードの画面を開いて文書作成しただけではこのコードにならないということでしょうか?
ググってみると、記号について何年かごとに改正されてきたコードらしいのですが
1983はあっても1982がみつかりません。また、これをワードでの文書作成時に
どう使うのかが理解できません。

ワードでの文書作成時に「挿入」から記号を挿入する際に何か特殊なことをする必要が
あるのでしょうか?その場合、どうすればいいのでしょうか?
画面下にドロップダウンがあってunicode とかJISとか選べるみたいだったのでやったのですが、
この0208というが見つからないし、途方にくれています。
ズブの素人なので、わかりやすく説明していただけると助かります。おねがいします。

586:デフォルトの名無しさん
08/05/31 15:58:22
> ビルちゃん、気まぐれで動かないかなあ。

ビルちゃんはちゃんと動いているだろ。

気まぐれなのは相変わらずだが。(w

587:デフォルトの名無しさん
08/05/31 16:02:21
そのビルちゃんって、いま何兆円ぐらい持ってるの?
7ぐらい?

588:デフォルトの名無しさん
08/05/31 17:53:33
文字コードじゃなくて、文字集合を指定されただけじゃねーの。

589:デフォルトの名無しさん
08/05/31 22:17:23
>>582
> ビルちゃん、気まぐれで動かないかなあ。

一番動かないで欲しい人ですが?

590:デフォルトの名無しさん
08/06/01 00:32:59
>>585
超初心者向け質問スレがちゃんとあるというのに、こんな超廃人スレに来てるKYなヤツってナンなの?ゆとり?

【マジレス】超初心者の質問に答えるスレ93【エスパー】
スレリンク(win板)

591:デフォルトの名無しさん
08/06/01 00:49:35
プログラム技術@2ch掲示板
URLリンク(pc11.2ch.net)

この板はプログラムを作る人のための板です。

プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。
ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。
Javascript は Web 制作板、CGI は Web プログラミング板へ。
業界談義、愚痴はプログラマ板へどうぞ。
ゲーム関係の話題はゲーム製作板へどうぞ。
ネタ、板とは関係の無い話題はご遠慮ください。

592:デフォルトの名無しさん
08/06/01 02:36:02
JIS-X0208-1982はJIS X 0208:1983の間違いだろう。
いわゆる機種依存文字だけ気にしていればいいんじゃね?

>588さん
俺の予想では、文字集合を指定されたんじゃなくて、
WordがシフトJISで保存すると勘違いした奴が、1978から1983改訂の際の
文字の入れ替えについて改訂後のことだと言いたかったに一票。

593:デフォルトの名無しさん
08/06/01 03:13:41
>>592
ありがとうございます!
私もこんなこと言われたの初めてで、びっくりした上、1982なんか
ないのに驚いたんですが、1983のことですかとは聞けなくて・・・。
本当にありがとうございました。

594:デフォルトの名無しさん
08/06/01 03:30:43
>>593
「聞けなくて」じゃなくて聞けよ。プログラマーだろ?
想像でなく正確な仕様と要件にもとづいて仕事してくれ。

たとえば
URLリンク(www.webstore.jsa.or.jp)
ではX 0208の履歴に1983はありませんが、って言えばいい。

595:デフォルトの名無しさん
08/06/01 03:34:42
間違えた。
誤: 1983はありませんが
正: 1982はありませんが

つーか寝ようよ。そーゆートコだけプログラマーなのな。

596:デフォルトの名無しさん
08/06/01 11:34:51
>>594
すいません、私、プログラマーとかじゃないんですよ^^;
パソコンについては、平均的な知識しかない書類作成係でして・・・・
この指示も書類作成にあたって渡されたんです。

1983の件を聞けないのは、この指示を出した技術者が、なんというか、
瞬間湯沸かし器なので、彼のプライドを傷つけるようなことをいったら(
1983のことですか?といっただけでも)、大変なことになるので・・・


597:デフォルトの名無しさん
08/06/01 11:42:56
>>596
>>591をもう一度読んで

598:デフォルトの名無しさん
08/06/01 12:22:46
あ、ごめんね、ここの人達は専門の人達だろうから
初心者板にいる人達よりもレベルが高いと思ってきたんだ。
初心者板は起動に関してのトラブルとかばっかりだったし・・

でも、回答くれた方、ありがとう。本当に助かりました。

599:デフォルトの名無しさん
08/06/01 12:30:00
ところで、システム開発の際に>>585みたいに1983版を指定された場合、
どこで規格を入手すればいいんですかね。教えてエロい人

600:デフォルトの名無しさん
08/06/01 13:06:40
ところで、システム開発の際にVisualStudio2008を指定された場合、
どこでそれを入手すればいいんですかね。

601:デフォルトの名無しさん
08/06/01 13:41:51
ところで、システム開発の際にwin98を指定された場合、
どこでそれを入手すればいいんですかね。

602:デフォルトの名無しさん
08/06/01 15:15:12
JISも売り物なんだから買え

603:デフォルトの名無しさん
08/06/01 15:56:38
まぁ、JIS2004の文字を使うなって意味だったんだろうな

604:デフォルトの名無しさん
08/06/01 17:16:39
こっちでいくら専門家いても指示した当人と話す以上にわかるわけないだろうに。
それでもし間違ってたらどうすんだ。

605:デフォルトの名無しさん
08/06/01 22:00:59
>>594
プログラマとしてのプライドを持った奴なら、自分で「ズブの素人」なんて言うわけわけねーだろ、常識で考えて。
しかも全角数字使ってる時点で585を超初心者だと見抜けない594ってってナンなの?ゆとり?

>>598
「あ、ごめんね」じゃねーだろ。
2ちゃんねるのルールが守れないなら、2ちゃんねるに来るな。

>>600-601
それは文字コードの話じゃねーだろ。

606:デフォルトの名無しさん
08/06/01 23:04:25
何このスレ

607:デフォルトの名無しさん
08/06/01 23:05:07
サザエさんの家ににしこりが入るところに見えませんか?

608:デフォルトの名無しさん
08/06/02 03:32:03
>>602
過去の版の入手方法がわかんないってことでしょ。
URLリンク(www.jisc.go.jp)
ぱっと見たけど見つからなかった。電話番号書いてあるから訊くのが早そうだな。

>>605
>>594だが何でそこまで言われにゃならんかね。
多くのプログラマーが全角英数字を毛嫌いするのは知ってるが、個人的にはありだと思うが。
少なくとも官庁相手に出す文書は全角にしてる。「Java」とか「議事録4月10日」とか。
上のリンク先でも「JIS X 0201」とか「7ビット及び8ビットの2バイト情報」
って書いてるだろ。

ついでにプログラ「マー」って書いたら俺も超初心者扱いか。

609:デフォルトの名無しさん
08/06/02 04:45:04
ならJISの規格票でいわゆる全角英数がどういう扱い受けてるのかくらい知ってるだろ

610:デフォルトの名無しさん
08/06/02 04:49:40
半角だとFAXのとき潰れてしまうます

611:デフォルトの名無しさん
08/06/02 06:07:08
608は「全角数字使用の585を超初心者だと見抜けないためにゆとりといわれた」ことに不満を主張しているようだが、それとJISでの全角数字のあつかいとは関係なくね?
これだけ使われてるんだし。でも585が(・∀・)カエレ!なのは同意

612:デフォルトの名無しさん
08/06/02 09:35:02
このスレに居てmohtaを知らんとは言わせん

613:デフォルトの名無しさん
08/06/02 15:47:06
誰だっけ?昔うさげにいた人?

614:デフォルトの名無しさん
08/06/02 18:35:11
「うさげ」も何年かぶりに聞いた単語だな

615:デフォルトの名無しさん
08/06/02 18:49:35
ということにしたいのですね。

616:デフォルトの名無しさん
08/06/03 00:02:01
>>608
ならUnicode StandardでいわゆるEAST ASIAN WIDTHがどういう扱いを受けてるのかくらい知ってるだろ?
それなのにこの場に及んでNORMALIZATIONされていない文字をまだ「ありだと思う」と言い張るその姿勢は実に見苦しい。

>>610
半角は潰れるが全角なら潰れないだと?
そんな文字サイズなら漢字は潰れまくりじゃねーか。

>>611
全角数字の扱いだけではない。
厚顔無恥で教えて君オーラ全開な文章から585の人間性を推し量れない608の稚拙さに問題がある。

>>612
知らん。
ゆとりの俺にも教えてくれ。

617:デフォルトの名無しさん
08/06/03 00:12:58
>>616
今はアラビア数字の世の中なので。

618:デフォルトの名無しさん
08/06/03 00:24:02
EAST ASIAN WIDTHやNORMALIZATIONが何なのか理解できない617ってナンなの?ゆとり?
URLリンク(www.unicode.org)
URLリンク(www.unicode.org)

619:デフォルトの名無しさん
08/06/03 00:37:45
JIS X 208:1983の話にUNICODEもちだしてくんなよ。

620:デフォルトの名無しさん
08/06/03 00:47:49
>>619
今はユニコードの世の中なので。

621:デフォルトの名無しさん
08/06/03 01:38:20
ナンなの?ゆとり?

622:デフォルトの名無しさん
08/06/03 02:32:46
カレーはライスに限る

623:デフォルトの名無しさん
08/06/03 02:52:09
こないだのザ!鉄腕!DASH!!で新しいDASH村住人のバングラディッシュ人がカレー作ってたんだよ。
ナンみたいなヤツも作ってたんだけど確か違う名前だったような?あれってナンな(ry
URLリンク(www.ntv.co.jp)

624:デフォルトの名無しさん
08/06/03 02:59:42
全角英数字がJIS X 0208では「原則として使用しない」で、Unicode規格でも
Restrictなのはわかるが、JISとUnicode規格読んでないとゆとりなんて、
このスレ、ハードル高すぎだっての。

とりあえず次スレは
【ナンなの?】文字コード総合スレ part4【←ゆとり?】
でおねがいします。

625:デフォルトの名無しさん
08/06/03 03:09:12
>>622
カレーと云えばナン。カレーにライスは邪道。
スレリンク(curry板)

>>624
空気嫁

626:デフォルトの名無しさん
08/06/03 10:48:10
> >>612
> 知らん。
> ゆとりの俺にも教えてくれ。

URLリンク(www.imasy.or.jp)
これを書いた人

627:デフォルトの名無しさん
08/06/03 10:55:11
>>626
JP-2って名前は良くなかったな。

628:デフォルトの名無しさん
08/06/03 21:53:57
>>626
「mohta うさげ」でググってみたんだが、ゆとりの俺に状況が理解できん。

その昔、うさげというコミュニティが存在していて、そこにはmohtaと呼ばれる伝説の荒らしが常駐してた。
その荒らしがISO-2022-JP-2の規格の根本をまとめ上げたものの、荒らしが作った規格には反発が強く世間には定着しなかった・・・、ってことでおk?

それより何でこの話がㇳ突然出てきたんだ?
ISO-2022-JP-2と全角英数字と何の関係あるんだよ?
全然わかんね。



てか、ググったら木村浩一さんのサイトにこのスレがコピペされてるのを発見w
URLリンク(www.kt.rim.or.jp)

629:デフォルトの名無しさん
08/06/03 22:51:53
>>625
カレーと云えば飲み物。噛んで食べるヤツは邪道。・゚・(ノД`)・゚・。ウエエェェン
スレリンク(mnewsplus板)


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5397日前に更新/157 KB
担当:undef