[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2ch.scのread.cgiへ]
Update time : 11/30 16:27 / Filesize : 244 KB / Number-of Response : 873
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

EUCボクメツ委員会



1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net]
Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。
ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO
せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ
意味ないじゃん!
Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO
Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。

477 名前::02 ID:/M+iPP4I.net mailto: >>471
いや、出来るよ。固定16bit幅の文字エンコーディングじゃなくなっただけで。
まあ、内部的には21bitあれば、固定幅に出来るけども。
[]
[ここ壊れてます]

478 名前:山崎 渉 mailto:(^^) [03/07/15 11:28 ID:doz396Fq.net]

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

479 名前:ぼるじょあ ◆yBEncckFOU mailto:(^^) [03/08/02 05:35 ID:GfRe8vK7.net]
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ

480 名前:login:Penguin mailto:sage [03/08/07 06:03 ID:13nJB4vb.net]
ja_JP.EUC-JP って、なんか意味あるんですか?
実は ja_JP.eucJP とは微妙に違うコードセットだったりするん
でしょうか?
全く同じコードセットだとすると、また新しくlocale名の変種が
増えるだけで、ソフトウェア作成の手間が増えて不便になるだけ
のような気がするんだけど。

ひょっとして、MIMEのcharset名が全てlocaleのコードセット名と
しても使えるようになるんですか?
en_US.ISO_8859-1 とか ja_JP.CSEUCPKDFMTJAPANESE も可能に
なるの?


481 名前:476 [03/08/07 06:05 ID:13nJB4vb.net]
失礼、age忘れました。

482 名前:login:Penguin [03/08/07 17:06 ID:ZrTxZZCU.net]
lists.debian.or.jp/debian-devel/200306/msg00011.html
[debian-devel:15660] Re: ja_JP locale name

483 名前:login:Penguin mailto:sage [03/08/07 21:05 ID:13nJB4vb.net]
つまり、コードセット名は全て大文字にしなきゃいけない
ことに新しく決まったから eucJP から EUC-JP に変えるっ
てことなのか。

で、なんで全て大文字にしなきゃいけないってことになったの?
互換性を崩してまで統一するメリットってなんなんだろう?


484 名前:476 [03/08/07 21:07 ID:13nJB4vb.net]
またもage忘れ。すんません。

485 名前:login:Penguin [03/08/07 22:23 ID:OLNWypPZ.net]
んなどーでもいいことやる暇があったらja_JP.CP932でもサポートした方が良さそうだが。



486 名前:login:Penguin mailto:sage [03/08/07 22:37 ID:/bM3o4Ra.net]
>>481
ja_JP.SJISがサポートされない理由についてはBruno Haibleが
バックスラッシュがどうたらこうたら言ってたという話を
どこかで見たような気がする。

487 名前:login:Penguin [03/08/07 23:04 ID:OLNWypPZ.net]
>>482
サポートしている商用Unixもあるんだから技術的には不可能ではないと思うのだが、やっぱりめんどくさいからなのかな。

488 名前:login:Penguin [03/08/13 01:01 ID:vZiKmtQp.net]
とにかく文字はアトミックなデーターとして、内部構造に依存せずに
プログラム言語から素直に処理できるのが良い。32ビットを
1文字にするのが、絶対にいいよ。

489 名前:login:Penguin mailto:sage [03/08/13 01:49 ID:Hpn4pIg2.net]
そうは言っても、Unicodeは半角全角問題とか、
ハイフン問題とか、decomposed正規化とか、
サロゲートペアとかあって一筋縄ではイカンわな。

毛ちょっと何とかしてほしひ。


490 名前:login:Penguin mailto:sage [03/08/15 15:29 ID:CM17UZsB.net]
この文脈でのatomicの意味が分からん。
statelessなencodingのことをいってんのか
thread-safeなlocaleとwchar_t(たとえばwchar_tをUCS4にするとか)のことを
いってるのかサパーリ。
そもそも文字コードといってるのはCCSかCESどっちよ?

491 名前:login:Penguin [03/08/15 20:48 ID:d8HSbf3p.net]
↑皿仕上げ

492 名前:login:Penguin mailto:sage [03/08/15 22:05 ID:uQ1Z8d9X.net]
定期的に
www.ietf.org/rfc/rfc2130.txt
www.unicode.org/unicode/reports/tr17/
www.w3.org/TR/1999/WD-charmod-19991129/
あたりすら読まん厨がage続けるスレはここですか?

493 名前:山崎 渉 mailto:(^^) [03/08/15 22:08 ID:dil3w4kp.net]
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

494 名前:山崎 渉 mailto:(^^) [03/08/15 22:38 ID:dil3w4kp.net]
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

495 名前:login:Penguin [03/08/16 10:25 ID:+/Q/RORk.net]
ATOMICということは、その言語の通常の操作では、内部構造がなくて、
分割できない塊としてのみ操作ができるという意味だよ。

たとえばPascal言語では、整数型や実数型、文字型、ポインタ型
などのデータは、その内部構造や内部表現にはPASCAL言語としては
立ち入ることが出来ない。(もちろん普通は実数も整数も、バイト単位
で構成されていたり突き詰めれば二進数ビットで符号化されているわけだが、
言語仕様上は、そのような内部事情にはアクセス手段がない。だから
化学での原子のように扱える。内部に核があって電子があって、陽子中性子
があるというようなことはとりあえず考えないでいこうということ。)



496 名前:login:Penguin mailto:sage [03/08/17 14:20 ID:fizQt/ca.net]
で、どのレイヤを指して文字ってんのよ?

497 名前:login:Penguin mailto:sage [03/08/18 11:47 ID:qg3zTJIe.net]
超今更だが、>>37が過ちを犯している。utf-8の漢字は3byteな。

498 名前:login:Penguin mailto:sage [03/08/20 00:41 ID:mKHd8Wgb.net]
>>493
最小で3byteですが最大では6byteですよ

499 名前:login:Penguin [03/10/20 03:44 ID:Z7b4Bpl5.net]
(゜ω゜)ポカーン.....

500 名前:login:Penguin [03/11/30 01:44 ID:57WnbG8d.net]
すいませーん、
オンラインで EUC-JP の規格を参照できるようなサイトはありますか?
文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。

>> 165
結局、EUC-JP の 0x21 から 0x7E のあたりって、ASCII なんでしたっけ、
それとも JIS X 0201 ローマ字を使うんでしたっけ?
なんとなく ASCII だと思い込んでいたんですが。。。
Unicode と旧来のエンコーディングを行ったり来たりする処理を使うことが
ときどきありますが、この「ASCII か JIS X 0201 ローマ字か」でいつも
頭が痛いんです。困っているのは僕だけじゃないと思いますが....
どうにかしてくれ > 偉い人

501 名前:login:Penguin mailto:sage [03/11/30 03:21 ID:W0msD5oz.net]
muleに付いている文書、ISO2022.jaを読めば?
www.iana.org/assignments/character-sets もね。
そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?

502 名前:login:Penguin [03/12/01 03:18 ID:SviQyXwA.net]
どうもさんくすです。
> muleに付いている文書、ISO2022.jaを読めば?
これは「規格」なのかどうかはよくわかりませんが、
xemacs を調べてみると、etc/CODINGS というファイルで euc-japan は
ASCII を使うようになってるみたいですね。(僕が見方を間違えていなければ)

> www.iana.org/assignments/character-sets もね。
こちらも、ASCII っぽいですね... ってことで ASCII と思っていいのかな?

> そもそも www.unicode.org/Public/UNIDATA/ じゃないのか?
えーと Unicode の方は規格を知らないということじゃなくて、
例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、
既存のエンコーディングとのからみの話です。もはや、Unicode と既存のエン
コーディングの対応が整備/修正されるのは諦めるしかないのかなあ、なんて
思ったりして。
たぶん、これってもう何度も何度も繰り返された話題でしょうね、スマソ。

503 名前:>>497 [03/12/01 04:03 ID:YFXe237k.net]
>>498
規格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。

> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。

もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。

>>498
> 例えば Unicode -> ShiftJIS での reverse solidus 問題とかの、
> 既存のエンコーディングとのからみの話です。

風間Java国際化本読め。

大体文字使っている奴が reverse solidus として使っているか、
yen sign として使っているか、全くわからんのだから、
文章書いた奴以外完全な解決はできん。そいつも忘れてるかもしれん。

ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。

504 名前:login:Penguin mailto:sage [03/12/01 11:02 ID:bqzp7dFQ.net]
>格読みたければ、JISの規格票買えよ。Copyrightがあるからwebでは読めん。
ヴァカですか?

>風間Java国際化本読め。
営業ですか?

505 名前:login:Penguin mailto:sage [03/12/01 11:03 ID:bqzp7dFQ.net]
>格読みたければ、JISの規格票買えよ。
ヴァカですか?

>風間Java国際化本読め。
営業ですか?



506 名前:login:Penguin mailto:sage [03/12/01 11:33 ID:doVY1QDl.net]
EUC-JP って JIS に入ってたっけ?

507 名前:login:Penguin [03/12/02 04:37 ID:Ld5fw5ew.net]
>>499
>> 文字テーブル(コードvs典型的なグリフ)とかもあると助かるのですが。
>もすっきり解決するぜ。印刷に使っているfontも完璧(?)だから。
は。ちなみに Unicode だとそういうのがオンラインであるわけで、
こうやって普及に差が出るのかなあって思う。

>文章書いた奴以外完全な解決はできん。
そうです。で文章書いた奴の意図を汲むための処理 (UI 等) が必要なわけ。
でもそういう処理を用意するのは面倒だし、さらに文字コードのことを深く
知らないユーザから見たら奇異だよね。
で、それって別に原理的にそうなんじゃなくて単に規格がダメなせいでしょ、
って話。

>ただ、EUC_Japanなら 0x5c を yen sign として(間違って)使ってる奴は極少だろうがな。
kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html
euc.jp/i18n/charcode.ja.html の「5.1 EUC」
を見ると、EUC でも ISO 646(JIS X 0201 ローマ文字)はアリみたいなんで
すが。極少でも、間違いじゃないなら面倒見るべきでは。

508 名前:login:Penguin mailto:sage [03/12/02 06:54 ID:0RsR6Dsz.net]
>>503
EUC は CES ですが、EUC-JP は CCS です。
EUC-JP では、code set 0 は ASCII に決まってます。

www.iana.org/assignments/character-sets の MIBenum: 18

509 名前:login:Penguin [03/12/03 02:46 ID:UUcL758a.net]


510 名前:login:Penguin [03/12/03 14:18 ID:6d4CdMx0.net]
どっちでもいいからどっちかに統一しろや無能どもが。

511 名前:login:Penguin mailto:sage [03/12/03 16:56 ID:B3zlXzir.net]
>>506
統一したらしたで文句言うんだろう?カスが。

512 名前:login:Penguin mailto:sage [03/12/04 19:14 ID:9n6DOrlU.net]
>>504
CESとCSSはなんの略でしょうか?
教えてください。

513 名前:login:Penguin mailto:sage [03/12/05 00:06 ID:TihMjOjI.net]
Character Encoding Scheme (文字符号化方式)
Coded Character Set (符号化文字集合)

CCS は文字の集合を表現するもの。CES は一つ、あるいは複数の CCS を実際の
バイト列というかビット列というか、そういう表現に写像するもの。



514 名前:508 mailto:sage [03/12/05 04:19 ID:mdRn2HdJ.net]
>>509
ということは、EUC-JPもCESじゃないでしょうか?

私は、ISO-2022の状態遷移を持たずに済むようにしたサブセットがEUCで、
EUCの文字集合を具体的に定義したものがEUC-JPだと理解していますが
どうなんでしょうか?


515 名前:login:Penguin mailto:sage [03/12/05 21:19 ID:WmOgE02Z.net]
>>499
www.jisc.go.jp/ から読めたりしますが。
ただし「解説」は読めないみたい。

あと、JIS X 0208と0213は規格協会から出版されている
『増補改訂 JIS漢字字典』に縮刷版が入ってたりする。

0x5cが円記号か逆斜線かは、コードの由来に立ちかえれば明快。
・シフトJIS: JIS X 0201の8ビットコードの拡張なので円記号(YEN SIGN)
・EUC: ASCIIの拡張なので逆斜線 (REVERSE SOLIDUS)

>>510
CCS, CESという定義の仕方はあまりうまくないので、真面目に考えるだけ損。




516 名前:login:Penguin [04/01/04 13:24 ID:KetwKeXM.net]
なんでわざわざ規格が2つもあるんだか。普通に考えておかしいじゃん。
両方とも、他方の欠点についてくだらん言い訳をグダグダのたまうんだろうけど
結局のところこの統一されてない状態が一番不便なのがわからんのかクソども。

517 名前:login:Penguin mailto:sage [04/01/05 05:56 ID:AOcZ5fo2.net]
どんな文字コードでも使える実装をほどこせばいいんでない?
とか言うのはソフトを書くわけでもない素人の意見なのかな、やっぱり……



518 名前:login:Penguin mailto:sage [04/01/05 10:29 ID:gmkRu+uW.net]
>>513
はい。

519 名前:login:Penguin mailto:sage [04/01/12 16:06 ID:Z4GWGJfa.net]
       lヽ ノ l        l l l ヽ   ヽ
  )'ーーノ(  | |  | 、      / l| l ハヽ  |ー‐''"l
 / C  | | |/| ハ  / / ,/ /|ノ /l / l l l| l  C ヽ
 l   ・  i´ | ヽ、| |r|| | //--‐'"   `'メ、_lノ| /  ・  /
 |  S  l  トー-トヽ| |ノ ''"´`   rー-/// |  S |
 |  ・   |/     | l ||、 ''"""  j ""''/ | |ヽl  ・ |
 |  I   |       | l | ヽ,   ―   / | | l  I  |
 |   !!  |     / | | |   ` ー-‐ ' ´|| ,ノ| | |  !! |
ノー‐---、,|    / │l、l         |レ' ,ノノ ノハ、_ノヽ
 /        / ノ⌒ヾ、  ヽ    ノハ,      |
,/      ,イーf'´ /´  \ | ,/´ |ヽl      |
     /-ト、| ┼―- 、_ヽメr' , -=l''"ハ    |  l
   ,/   | ヽ  \  _,ノーf' ´  ノノ  ヽ   | |
、_    _ ‐''l  `ー‐―''" ⌒'ー--‐'´`ヽ、_   _,ノ ノ
   ̄ ̄   |           /       ̄


520 名前:login:Penguin [04/01/21 04:54 ID:l6i+YvvA.net]
Post

521 名前:login:Penguin [04/01/24 12:36 ID:OGcyA9QE.net]
GBやKSやCNSって文字名を規定するように改訂されてるんですか?
されてなかったら文字名による同定なんて絵に描いた餅だと思うんですが。
少なくともGB2312は廃止されてGB18030になったんだから
改訂版は存在しないですよね?

522 名前:login:Penguin mailto:sage [04/01/27 17:53 ID:Vqw8VTxA.net]
>>517
少なくともISO/IEC 8859シリーズやJIS X 0201/0208/0213は文字名を規定してる。
他の奴は調査のうえ報告きぼん。


523 名前:login:Penguin mailto:sage [04/01/27 18:02 ID:CYFtYKQ6.net]
>>518
それは知ってます。だからGB/KS/CNSについて聞いてみたわけです。
JIS X 0212の文字名は「参考」しか存在しないですね。

524 名前:login:Penguin mailto:sage [04/01/28 01:38 ID:yXeHWwGb.net]
GB18030の仕様書?
www.anycities.com/gb18030/standard.htm

525 名前:login:Penguin mailto:sage [04/01/28 09:30 ID:zcjMBZrl.net]
>>520
やっぱり絵に描いた餅っぽいな
JISの範囲に限定してもけっこう破綻してるし



526 名前:login:Penguin mailto:sage [04/01/31 00:53 ID:0gxSoMh4.net]
Unicode Normalization派には全ての文字集合が破綻して見える。
CSI派にはUnicodeが破綻して見える。
いじょ。

527 名前:login:Penguin mailto:sage [04/01/31 07:48 ID:uM5oI3vd.net]
CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
TRONコード?

528 名前:login:Penguin mailto:sage [04/01/31 15:12 ID:A1rPcmld.net]
> CSI派は情報交換用符号化文字集合としては何を使うんでしょうか。
CSIだから何でも有りなわけだが…

529 名前:login:Penguin mailto:sage [04/02/01 13:09 ID:N4VOvKZ9.net]
>>520
何がどう破綻してるのか意味不明。
文字名称による同定が破綻しているとすればUnicode/10646自体の失敗に近い。
Unicodeしか無い世界を想定すればそれでも良いのかもしれないけど、
そんな想定は頭の中のお花畑でしょ。


530 名前:login:Penguin mailto:sage [04/02/02 10:00 ID:hq6ctxrf.net]
>>524
内部が何でも有りでよくても外部と情報交換するときには
相手の知らないコードでは話にならないと思うんですが

531 名前:login:Penguin mailto:sage [04/02/02 10:06 ID:hq6ctxrf.net]
>>525
> 文字名称による同定が破綻
そもそも一対一の対応関係しか記述できないのが無理ありすぎ。
> Unicode/10646自体の失敗に近い。
でも国際規格との整合という名目で文字名を規定してしまった。
つーかCJKでUnicodeに一番反対しているはずの日本だけが
自国の文字集合で文字名を規定してる(らしい)ってほとんど
ギャクだな。

532 名前:login:Penguin mailto:sage [04/02/02 10:41 ID:ZMPM1Vhd.net]
>>526
何でもありと言ってもcharset repositoryに登録されてる奴だけでしょ。

533 名前:login:Penguin mailto:sage [04/02/02 22:12 ID:rBgXmwm9.net]
「相手の知らないもの」を「交換」すること事態アリエナイ、
お互いが情報を共有していれば既存の文字集合でなくても構わない。

534 名前:login:Penguin mailto:sage [04/02/12 11:08 ID:KO5Q49AN.net]
> 「相手の知らないもの」を「交換」すること事態アリエナイ、
> お互いが情報を共有していれば
どうやって共有するんですか?
そんなこと言い出したらネットワークプロトコルなんて
一切必要ないということになると思いますが。

535 名前:login:Penguin mailto:sage [04/02/13 07:42 ID:AkWuZ3md.net]
既存のコードのどれかに対する写像関数があれば
何も問題なさそうだけど。プロトコルと違って
文字コードは単純なので同じように考えることは
できないと思うけど。



536 名前:login:Penguin mailto:sage [04/02/13 10:16 ID:9tJnggCR.net]
関数が、ベンダーによって違ったり、
単射に出来なかったりで問題。

537 名前:login:Penguin mailto:sage [04/02/19 17:11 ID:HogZ/lIc.net]
とりあえずSJIS撲滅しろ

538 名前:login:Penguin mailto:sage [04/02/19 18:46 ID:wXxKmQwW.net]
   /⌒ヽ  すいません、ちょっと撲殺しますよ・・・
  / ´_ゝ`)   | | 
 と    )    | | ガッ
   Y /ノ    人
    / )    <  >_∧∩
  _/し' //. V`Д´)/
 (_フ彡        /←>>533


539 名前:login:Penguin mailto:sage [04/02/20 15:15 ID:MhppvPgK.net]
「SJIS撲滅しろ」とSJISで読ませてる矛盾…
日本製品排斥運動のプラカードを日本製筆記用具で書いてる話を思い出したよ。

540 名前:login:Penguin mailto:sage [04/02/20 15:25 ID:USABAkbG.net]
ネット上を流れる日本語の何割ぐらいがEUCなのかな。
事情がどうであれ、SJISが既に多数派だってことは
受け入れないとダメだろね<EUC派の人。

541 名前:login:Penguin mailto:sage [04/02/20 15:42 ID:HZ88v8IJ.net]
YahooはEUC-JPだよね。

542 名前:login:Penguin mailto:sage [04/02/20 15:59 ID:DuOkNDXy.net]
>>536
煽りか知らんが、それを受け入れてない香具師はいないだろ。
wwwにutf-8,16使ってるページが少ないからといってunicode推進は間違ってるという結論にはならん訳だし。


543 名前:login:Penguin mailto:sage [04/02/20 16:10 ID:HZ88v8IJ.net]
>>538
全然関係ない話だが、XHTMLがXMLの派生だと考えると、XHTMLでは
UTF-8・UTF-16を使うのが正道だと思うのだが、どう思う?
Unicode嫌いだがXHMLラブな俺。

544 名前:login:Penguin mailto:sage [04/02/20 18:02 ID:DuOkNDXy.net]
utf-16より16ビットクリーンのucs-2が乙。

545 名前:login:Penguin mailto:sage [04/02/20 18:13 ID:OGx3SqOQ.net]
> 16ビットクリーン
どういう意味? ぐぐっても0件だし。
「8ビットクリーン」の語義から類推すれば、
途中で16ビット目が壊れることはないって意味になるけど・・・



546 名前:login:Penguin mailto:sage [04/02/20 18:17 ID:HZ88v8IJ.net]
>>540
まぁUTF-16とUTF-8の二者択一で、UTF-16は選ばんな。
サロゲートペアが気持ち悪すぎる。
しかしUCS-2はどうかといわれると、それならUCS-4使いたいところ。

547 名前:542 mailto:sage [04/02/20 18:18 ID:HZ88v8IJ.net]
似たような理由でShift JISも気持ち悪い。

548 名前:login:Penguin mailto:sage [04/02/20 18:36 ID:SE61JsUR.net]
>>536
シフトJISって言っても何種類もあるしね。


549 名前:login:Penguin mailto:sage [04/02/20 18:47 ID:HZ88v8IJ.net]
>>544
たとえば?
まさか「Unicodeへのマッピングが〜」なんて言わないよね……。

550 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:YAuvVXfE.net]
どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。

551 名前:login:Penguin mailto:sage [04/02/20 19:39 ID:DuOkNDXy.net]
>>541
16ビットオンリーと言うべきだったかもしれぬ。
EUC,JIS,SJIS,UTF-8 -> 8ビットと16ビットが混在
UTF-16 -> 16ビットだけと見せかけてサロゲートがある。
UCS-2 -> 16ビットのみ(n文字目に定数時間でアクセス可能)


552 名前:login:Penguin mailto:sage [04/02/20 20:26 ID:HZ88v8IJ.net]
>>546
>どうせなら、iso-2022 の枠の中に unicode の仕様も入れちゃえばよかったんじゃないの。

文字集合の話なら、ISO国際登録簿に登録されている。


符号化も含めてなら、一応ISO-2022には「他の符号化システムの指示(DOCS)」機能がある。
これを使えばUnicode(UTF-8・UTF-16)に切り替えられる。
# UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。

553 名前:login:Penguin mailto:sage [04/02/20 20:35 ID:YAuvVXfE.net]
> # UTF-8・UTF-16のエスケープシーケンスもISO国際登録簿に登録されている。
本当だ。知らんかった。


554 名前:login:Penguin mailto:sage [04/02/20 20:37 ID:SE61JsUR.net]
>>545
Shift_JISとかMicrosoftのCP932とか

555 名前:login:Penguin mailto:sage [04/02/20 20:53 ID:HZ88v8IJ.net]
>>550
> Shift_JISとかMicrosoftのCP932とか

その二つはどこが違うの?
俺の理解では、まさに「Unicodeへのマッピング」の違いなんだが。
あと「何種類もあるしね」と書いているが、2つだけ?



556 名前:login:Penguin [04/02/21 10:55 ID:8cIti7Dp.net]
>>551
マッピングが違う時点で、別の文字コードになる。
種類も 2つではすまない。
www.opengroup.or.jp/jvc/cde/sjis.html

557 名前:login:Penguin mailto:sage [04/02/21 11:11 ID:r6ckEmFW.net]
>>552
> マッピングが違う時点で、別の文字コードになる。
ならない。
文字コードとは文字集合+符号化方式であらわされるもの。
Unicodeへのマッピングは関係ない。

> www.opengroup.or.jp/jvc/cde/sjis.html
これはまさに「文字コードの違い」と言える。
・JIS X 0201かASCIIか
・JIS X 0208は1978か1983か1990か

558 名前:login:Penguin [04/02/21 11:28 ID:QqGdeQdg.net]
アンチEUのスレはここですか?
やはりEUに対抗して大東亜共栄圏を。

559 名前:login:Penguin mailto:sage [04/02/21 11:47 ID:u/H1Y2zG.net]
いや、日本もEUに加盟しようぜ。

560 名前:login:Penguin mailto:sage [04/02/21 12:47 ID:Ij37nYR/.net]
それはブッシュ君が絶対に許しません!

561 名前:login:Penguin [04/02/22 12:06 ID:/tZPZccw.net]
m17libあげ
japan.cnet.com/news/ent/story/0,2000047623,20064400,00.htm


562 名前:login:Penguin mailto:sage [04/02/24 16:52 ID:f1XKVOzh.net]
>>553
> Unicodeへのマッピングは関係ない。
正解。

ただし、外字が入ってる時点でCP932は別の文字コードになってる罠。


563 名前:login:Penguin [04/02/25 09:17 ID:OHUltstF.net]
G2に78JISを指示して78JISの字形を出したいときだけSS2で
切り換えるような実装はISO 2022に適合しますか?

564 名前:login:Penguin mailto:sage [04/02/25 09:42 ID:QrUE0gBl.net]
>>559
ISO-2022的にはアリだと思います。

565 名前:login:Penguin mailto:sage [04/02/25 10:36 ID:OHUltstF.net]
一意な符号化を要求された場合90JISと同じ字は使用禁止に
なるし要求されなくても同じ字は同じ扱いにならなくてはいけない
(違う字形が出力されることに期待してはいけない)わけですが、
何をもって同じ字と判断するのかが悩ましいです。



566 名前:login:Penguin mailto:sage [04/02/25 11:23 ID:QrUE0gBl.net]
>>561
おっしゃるとおりです。使うのはかなりグレーだと思います。
普通にやるなら、上のレイヤーで切り替えるべきでしょうね。

そういえば、JIS X 0208:1997の付属書6を見ていて気づいたのですが、
規格票の刷によっても字形が違うのですね。
たとえば「芦」という字。1978の第4刷より前は「戸」の上部は「一」
ですが、第4刷以降は「ノ」になっています。ところが1983ではまた
「一」に戻っています。

567 名前:login:Penguin mailto:sage [04/02/25 23:19 ID:XkkFjwVk.net]
97JISの附属書6に78JIS字形として掲げられているものって結構間違い
(実際に78JISに載っていたのとは明らかにデザイン差を越えて異なると
思われるもの)がありますね。私は少なくとも3つ見つけました。
新字源番号にも明らかにおかしいところがありますし。

568 名前:login:Penguin mailto:sage [04/03/01 15:28 ID:JCvjaOH6.net]
charの内部コードはたとえばEBCDICかもしれないから
文字クラス判定を不等号で行ってはいけませんなんて言われてた
こともあるのに時代は変わったもんだ

569 名前:login:Penguin mailto:sage [04/03/01 15:36 ID:ZJ6X9SrZ.net]
JIS漢字コード表の改正について−168字の例示字形を変更−(2004.2.20)(pdf:333kB)
www.jisc.go.jp/tpk/pdf/040220kanjicode.pdf

こんなん出たらしいですよ。
「芦」なんかが変ってますね。

570 名前:login:Penguin mailto:sage [04/03/01 15:47 ID:xLYQ3+Xr.net]
>>564
変わってませんよ。今でも良くないですよね。

571 名前:login:Penguin mailto:sage [04/03/01 16:54 ID:JCvjaOH6.net]
>>566
もちろん今でもよくないけど
__STDC_ISO_10646__
なんてのもできたじゃないですか

572 名前:login:Penguin mailto:sage [04/03/01 17:07 ID:ZJ6X9SrZ.net]
「じゃないですか」かよ!?

573 名前:login:Penguin mailto:sage [04/03/01 17:39 ID:xLYQ3+Xr.net]
>>567
それでもwchar_tの中身を直接触るのは良くないことなのですよ。

574 名前:login:Penguin mailto:sage [04/03/01 22:38 ID:gv8ZeGbq.net]
sourceforgeのapacheはEUC固定だったりする。
今だにUTF-8が使えない。

575 名前:login:Penguin [04/03/03 20:36 ID:CKuIXPe4.net]
やっとこさthe m17n libraryが公開されたけど、海外の反応が全くないのが気に
なるな。というか、The Free Standards Groupのプレスリリースくらいしか情報
らしい情報は出してないもんなあ。SlashdotとかFreshmeatにアナウンス出した
方がいいと思うけど。



576 名前:login:Penguin mailto:sage [04/03/03 20:40 ID:rkyENV70.net]
>>571
m17nのメイリングリスト入ってるんだけど、一通も流れないのが不気味だ。

577 名前:login:Penguin mailto:sage [04/03/04 02:24 ID:clL2BqDq.net]
海外の人にこそ使って欲しいなあ。







[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<244KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef