- 1 名前:とりあえず立ててみた [05/02/24 00:07:38 ]
- プログラムにおける文字コードの取り扱いについて議論する統一スレッド
です。 ほぼ前スレ 【UTF8】文字コード変換【SJIS】 pc5.2ch.net/test/read.cgi/tech/1063177450/ 参考ホームページ Unicode Home Page www.unicode.org/ Java Character Encodings www.ingrid.org/java/i18n/encoding/ euc.JP: tech docs, BeOS tools euc.jp/ ISO-IR - 2.8.1 Coding systems with Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm ISO-IR - 2.8.2 Coding Systems without Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
- 477 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 14:49:08 ]
- cp932・・・Shift_JISの横領
自分以外が憎いのさ!
- 478 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 15:56:12 ]
- >>476
そうみたい。TRの規定を満たせば理論上は誰でも登録できるはず。 具体的な目的がちゃんとあるから、Language Tagみたいに申し訳程度に 規定しといて事実上誰にも使われないようなものにはならないでしょう >>477 Shift_JISってもともとMicrosoftが作ったんじゃなかったっけ? 後から互換性がないようにJISでシフト符号化文字集合を規定しておいて 「MSのシフトJIS」は附属書1と互換性がないとか言われても困るような。 独自拡張として放っておかれたままのほうがまだマシだったかも
- 479 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 17:21:39 ]
- >>478
Shift JISの制定過程はなんかややっこしいらしい。 ja.wikipedia.org/wiki/Shift_JIS ja.wikipedia.org/wiki/%E3%83%8E%E3%83%BC%E3%83%88:Shift_JIS
- 480 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 21:10:09 ]
- ja.wikipedia.org/wiki/%E3%83%8E%E3%83%BC%E3%83%88:Shift_JIS
> シフトJISはアメリカ製ソフトの日本語化に適していたので、 www.iana.org/assignments/character-sets でいうところの JIS_X0201の延長線上で、JIS X 0208の漢字を使うのに適していたので、 とした方が性格だろうな。 半角仮名(JIS X 0201 Kana)のみはそれ以前から使えていたわけだから。
- 481 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 21:11:48 ]
- それから、アスキーの担当者が昔語りしているのがどこかにあるはず。
fj.kanjiでもうpされていたような気がする。
- 482 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 21:20:04 ]
- >>480
「アメリカ製ソフトの日本語化に適してい」るのは圧倒的にEUCだからなあ。 半角カナの呪縛が大きいんだろうな。 しかし文字コードみてると、互換性を錦の御旗にレガシーなものをひっぱると 後々に禍根を残すだけだねまったく。
- 483 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 21:42:41 ]
- 当時は階層ディレクトリの区切り文字に \
(つーかISO 646 invariantじゃない文字)を使う変態なOSなんてなかったから ここまで問題になるとは思っていなかったようだ。 つーかそこはWikipediaだから直接なおしに行けばいい
- 484 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 21:46:36 ]
- 何に比べて「アメリカ製ソフトの日本語化に適していた」のかが書かれていないんだな。
おそらくJIS X 0208を単独の符号化文字集合として使ってGLに割り当てた場合だろう (実際PC-9801のテキストVRAMはそんな構造してたし)。 EUCはシフトJISの反省に立って作られた符号化方式だからシフトJISより改善されてる のはある意味当たり前だ
- 485 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 22:30:33 ]
- >>483
'が2byte目に来たらPascalのリテラル文字列で困るんじゃないか? # Cの\だってそうだけど、あまり一般的でなかったからPacalにした。 # もちろんmulti byte文字を理解しない8bit throughの処理系の話。 >>484 EUCは、ISO 2022が出た時には準備万端だぞ? JIS X 0208出た時には問題なしだろ。(それどころかC6226の頃かも)
- 486 名前:デフォルトの名無しさん mailto:sae [2005/10/18(火) 22:33:03 ]
- >>484
> 何に比べて「アメリカ製ソフトの日本語化に適していた」のかが書かれていないんだな。 いや、一番重要だったのは、既にあるJIS X 0201 Kanaを、 GRに割り当てたことを仮定しているプログラム/データ資産のはず。 PC-8001上のN-Basicで書かれたプログラムなど。 これを捨てて良ければ、EUC-JP相当のもので良かった。
- 487 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 22:48:43 ]
- >>485
GRに割り当てるのが正当化されたのは もっと後のISO 2022の改訂からじゃなかったっけ? 複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず
- 488 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 22:51:47 ]
- すくなくともX 0208より後なのは確実。X 0208とGB 2312のエスケープシーケンス
だけ他の複数バイト図形文字集合より短いのは、まさに当時 > 複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず だったからで、この制限がなくなってからも互換性のためX 0208の指示シーケンス は1バイト短いまま。
- 489 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 22:55:31 ]
- > 'が2byte目に来たらPascalのリテラル文字列で困るんじゃないか?
'はシフトJISの2バイト目に来ないので困らないと思う。 (ISO 646 invariant云々は不適切だったので忘れてくれ) つーか当時困らなかったからこれでいいと思って場当たり的に決めて 今になって困ってるわけだろ。 なんかどっかで聞いた話だな。きっと2バイトで足りるに違いな(ucs
- 490 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 23:04:55 ]
- JIS C 6228-1975
JIS C 6228-1984 のちにJIS X 0202-1984 JIS X 0202-1991 のちにJIS X 0202:1991 JIS X 0202:1998
- 491 名前:デフォルトの名無しさん mailto:sage [2005/10/18(火) 23:30:47 ]
- > 複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず
なんでそんな仕様だったかというと、単独で使うことを想定してたんだろう。 (たしかそのためにC 6226の1区はASCIIと同じ並びにするという話もあったはずだが どこ行ったんだ) ASCIIの文字を全部含んでいればASCIIを使う必要はないと。 現実にはその見通しは甘かったばかりか重複符号化に苦しめられてるわけだが。
- 492 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 00:18:06 ]
- >>490
変更があったのなら1984だろうね。1991ってことはないから。
- 493 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 14:24:54 ]
- 安岡孝一氏が日本での文字コードの歴史を書いている中で、
「シフトJIS の誕生」についても触れている。 きっちりと資料に当たって書かれている所がいい。 「日本における最新文字コード事情」 kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications/ISCIE2001.pdf
- 494 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 15:45:23 ]
- >>493
文献のところの吉田茂(内閣告示)の吉は、 士と土が混在しているけど、これはオリジナルに合わせてるのかな。
- 495 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 17:50:27 ]
- 鋭く細かい所に気づくなあ。面白い。確かに使い分けられているね。
www.aozora.gr.jp/kanji_table/touyoukanji_hyou/ ここの後の方に、当用漢字表のとき「土」になっている官報の画像版があって 確認できる。その通りにしたんだろう。 当用漢字字体表の時は「士」に変わったわけかな。 吉田茂の「吉」の字のエピソードを確かどこかで読んだけど、 あれは「JIS漢字字典」だったっけ。
- 496 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 18:44:58 ]
- 「JIS漢字字典」のコラム3、吉田茂の決断だね。
読売新聞社刊「日本語の現場」第二集の逸話だって。
- 497 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 18:50:40 ]
- >>495
こんなところに取り込んだ画像があったんだね。
- 498 名前:デフォルトの名無しさん mailto:sage [2005/10/19(水) 22:56:17 ]
- >>492
1991はSSの後の1文字をGRにすることを認める変更じゃないの。 その前年に補助漢字ができてるから。 しかしJIS X 0208改訂のきっちり1年後に必ず後を追うように改訂してるな
- 499 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 01:43:09 ]
- > AJ1-6をUnicodeで符号化するために
のソース。 www.imug.org/pastevents05.html#Jnames
- 500 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 05:03:27 ]
- >>498
SSの後の1文字がGRにできるようになったのは1998年の規格から。
- 501 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 08:59:11 ]
- >>499
ソース提供、ありがとう。 TRにないみたいなので、どこかなと思ってた。
- 502 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 20:24:00 ]
- >>500
なんと、そんなに新しかったのか。 それまで公式にはEUC-JPのSS2/SS3の使い方はISO 2022に適合してなかったのね。
- 503 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 21:16:31 ]
- >>501
さすがにTRにそんなことはモロに書かないよ 表向きの目的を掲げるだけでしょ
- 504 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 22:00:26 ]
- あのさ俺の苗字ってハシゴ高なわけだけど
郵便物とか封書とかでハシゴ高印字してくるの 水道局だけなんだ。話はそんだけ NTTは使ってないだけか?水道局はフォントがあるのか? 郵便局は出せるだろうけど、関係を作る方法が思いつかない ハシゴ高廃止してもらって構わないんだけど、 通帳とか免許とか1文字だけ手書きなのうんざり
- 505 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 22:27:27 ]
- 私の名前には巳が含まれるのだが、某証券会社では已が使われていた。
その後その証券会社が吸収されても已のままだったのにさらに吸収されたら正しく巳になった。 さて、字形がおかしかったのか、そもそもコードもおかしかったのか……
- 506 名前:デフォルトの名無しさん mailto:sage [2005/10/20(木) 22:59:37 ]
- 聡なんだが、不動産屋と契約したら、
不動産屋の死にかけのババアが勝手に聰で契約書作っていた。 不動産への登録もこっち。 更新の時に、前の人年寄だから漢字違っているけれど、 # くたばったババアはあちこちで勝手に旧字体にしていたらしい。 延長なのでこのままにしてください、ってそのままだったのが、 いつの間にか正しいのに変っていた。しかしこれ文字コード全然関係ない…
- 507 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 00:34:07 ]
- 旧字旧かな厨氏ね
- 508 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 01:00:54 ]
- どこに旧字旧かな厨がいるんだよ
意味もなく煽る藻前が(ry
- 509 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 09:16:13 ]
- 厨じゃなくて婆な
- 510 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 09:25:39 ]
- www004.upp.so-net.ne.jp/hitosen/ujina/ujina93.html
> 旧字体を通用字体に変更したい場合は、本籍地の役所で「文字更正の申し出」をすれば、 > 通用字体に変更することが可能です。手続はものすごく簡単です。 「文字更正の申し出」に当てはまらない氏名の変更は、 homepage1.nifty.com/lawsection/tisikibako/ujinohenkou.htm > 家庭裁判所に「氏の変更の許可申立書」を提出します。
- 511 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 10:54:21 ]
- 登記のための法務局提出書類にサインするとき、司法書士に
「斎」=「齋」、「斉」=「齊」、しかし「斎」≠「斉」、「齋」≠「齊」と言われた。 本当は「齋」なんだけど、めんどくさいから「斎」ですませた。 登記簿は「齋」になってた。
- 512 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 11:21:41 ]
- その時、使った実印は、オヤジが作ってたやつで「斉」だったが、
印鑑登録に字体は関係ないということか。 これ文字コードに関係あるのかな。
- 513 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 14:37:59 ]
- >>509
しかも既に亡くなっているし。
- 514 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 15:28:49 ]
- >>511
字源的には書士の言う通り。 JISとしては四つとも別の字。 >>511は特に"齋藤"とは書いてないが、「JIS漢字字典」の人名音訓を調べると、 済藤、斎藤、剤藤、斉藤、濟藤、齋藤、薺藤、齎藤、齊藤(区点順) とJISの範疇内でもこれだけのサイトーの別があるらしい。
- 515 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 16:44:53 ]
- 「人名外字1500V3」フォントの所をみると
●異体字のバリエーションもこんなに豊富です! ・斉藤の「斉」→31種類
- 516 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 22:41:33 ]
- >>511
「斎藤」は元来、藤原一門の神事担当職と言ったニュアンスの伝統的な苗字。 「一斉」の「斉」には、「斎藤」の「斎」のような「さい」という音が元々はない。 勿論、「斎」のように神事を扱うという意味合いもない。 >>512 実印は明らかに読みが違うもの以外は苗字がなく名前だけでも大抵のものが登録できる。 例えば「阿久津美莉」さんが「_」なんて実印を作ることもできる。
- 517 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 22:49:44 ]
- 今昔文字鏡の「斉」は68種。
- 518 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 23:29:36 ]
- 「斎」と書いて「キンジェー」と読むらしいが、タイの方である期間ヴェジな生活を送るという
華僑由来のイベントがあるらしい。激しくスレ違いだが。
- 519 名前:デフォルトの名無しさん mailto:sage [2005/10/21(金) 23:30:45 ]
- で、その68種類の文字を区別しなければならないんですか?
- 520 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 00:30:21 ]
- 他人事で済む奴はいつもそう言うんだ
- 521 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 01:16:01 ]
- おれには斉以外認識できない
- 522 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 03:02:47 ]
- 中国語がTraditional ChineseとSimplified Chineseで別個の文字集合になっているように、
日本語もTraditional JapaneseとSimplified Japaneseで別個の文字集合にすればよかったんだ。 といい加減なことを言ってみるテスト。
- 523 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 05:54:04 ]
- >>520
むしろ他人事で済まされなかったらたまらんからだろ 済はさんずい+済なのになんで68種類ないんですか? とか (こたえ: あまり苗字に使われない文字だから)
- 524 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 05:54:47 ]
- > さんずい+済
さんずい+斉orz
- 525 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 10:15:32 ]
- >>522
ソ連とアメリカが、東日本と西日本に分割していたら、そうなったかもね。
- 526 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 10:42:17 ]
- 唐突なやつだな。
ソ連なんて地続きの樺太でもさんざんてこずって、北方領土をかすめとるのが せいぜい、北海道にはとりつけもできなかったんだから分割なんてありえない。
- 527 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 14:40:07 ]
- 正直「社長の名前を一発で変換できるIME」みたいなしょーもない話だと思う
- 528 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 15:49:02 ]
- 日本の漢字って中国からパクったわりに発音どれもあってなさそうだよね、
日本らしくする為に名前全部ひらがな表記とかすればいい
- 529 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 18:35:02 ]
- バカなのか釣りなのか
- 530 名前:デフォルトの名無しさん mailto:sage [2005/10/22(土) 23:43:48 ]
- >>528
訓読みって知ってる?
- 531 名前:デフォルトの名無しさん mailto:sage [2005/10/23(日) 09:03:09 ]
- 中国人も自国の文字のわりに発音どれもあってなさそうだわな。
- 532 名前:デフォルトの名無しさん mailto:sage [2005/10/23(日) 09:12:33 ]
- 表意なのに形すら違うからな。
- 533 名前:デフォルトの名無しさん mailto:sage [2005/10/23(日) 22:11:11 ]
- >>530
きっと訓読みがない国の人なんだよ
- 534 名前:デフォルトの名無しさん mailto:sage [2005/10/24(月) 01:51:29 ]
- >>528
>>528 >>528 >>528 >>528
- 535 名前:デフォルトの名無しさん mailto:sage [2005/11/06(日) 13:08:33 ]
- 新人名用漢字の「たまひよ」名前ランキング
women.benesse.ne.jp/hakase/sitemap/ranking.htm
- 536 名前:デフォルトの名無しさん mailto:sage [2005/11/07(月) 20:24:40 ]
- 人気の漢字を見ると、凜と凛の入力ミス多発の予感
- 537 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 05:32:18 ]
- 「同一の字種」だからどっちでもいいのでは?
つうかよくわからん「同一の字種」。
- 538 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 09:02:17 ]
- 「1字種1字体の原則は維持するが、
例外的に1字種について2字体を認めることを排斥するものではない。」 よくわからんねえ。どっちでもいいんだか、区別せよと言うんだか
- 539 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 14:49:15 ]
- そもそも凜は凛の正字だからこちらの字体が人名用漢字として登録されたけど、
誰も使わないものだからなし崩しに凛も新人名用漢字として認められるようになった。 IMEから凜を簡単に入力できないというのも大きかったと思われ
- 540 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 16:25:27 ]
- _ ∩
( ゚∀゚)彡 包摂!包摂! ( ⊂彡 | | し ⌒J
- 541 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 16:37:04 ]
- でもって、この場合は「康熙字典」の字体の方が
俗字とされる「凛」だったりするわけで、 こっちが広く使われる由来だったりするんだろうか。これも分かりにくいなあ。
- 542 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 17:06:26 ]
- www.taishukan.co.jp/kanji/qa_shape.html#Q3048
こんな所にQ&Aがあった。 >「凛(りん)」の右下の部分が「示」ではなく「禾」になっている字が、パソコンで出ないのですが、どうしてでしょうか?
- 543 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 17:07:41 ]
- jvn.jp/jp/JVN%2318282718/006082/index.html
正規化しなきゃしないでIDNの脆弱性だフィッシングだと 何をやっても文句を言われて大変ですなあ
- 544 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 17:12:36 ]
- >>542
IMEが変換しない(少なくとも当初の)理由は83JIS以前の機器で字が出ないから 「誤って」使われないようにするためだったと思われ 実際にはJIS(X 0208)に収録されている文字でさえこうなんだから Shift_JISじゃ出せない文字なんてよほど強力に使用を推進しなきゃ 普及させられるわけないよなあ
- 545 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 18:58:48 ]
- もっともだ。この先も、90JISまでのフォントしか持っていない機器がある以上、
Vistaに新フォントが搭載されようが、JISX0213:2004の新しい文字なんて、 デフォルトの設定のままでポンポン出てくるなんて、無理な話だってことね。
- 546 名前:デフォルトの名無しさん mailto:sage [2005/11/08(火) 22:34:39 ]
- MicrosoftはIMEのデフォルト設定で印刷標準字体を優先して出すと言ってるけどね。
「2004JISでカモメの字体が訂正」とか不勉強にもほどがある記事が大真面目で IT系のニュースサイトにすら掲載されるんだから どれだけ鷗を使えることが知られていないか分かろうってもんだ
- 547 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 05:14:37 ]
- 堯槇遙および凛が人名用漢字に追加されたのに瑤と煕が追加されなかったのは
なんで?
- 548 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 05:32:30 ]
- 南堂さんが圧力をかけなかったから。
- 549 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 06:35:10 ]
- 妄想を鵜呑みにしてる奴発見
- 550 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 07:31:43 ]
- >>547
単純に頻度が足りなかっただけ
- 551 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 07:43:06 ]
- 何しろ頻度が足りていれば
糞,屍,呪,癌,姦まで追加の検討対象になったくらいだし
- 552 名前:デフォルトの名無しさん mailto:sage [2005/11/09(水) 08:58:08 ]
- パブリックコメントに出したら、糞,屍,呪,癌,姦なんて入れるな!
という批判が多く出たおかげで、やっと削除できたというほどに 「常用平易」なら入れろという最高裁判決に困ってたみたい
- 553 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 01:27:27 ]
- 俺は「常用平易なら入れろ」に賛成だけどな。
意味的に不適切な字を削除しても無意味なことは あくま君問題の結末が証明していると思うんだが。
- 554 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 09:58:09 ]
- 常用平易でも除外されてる文字があるのが謎
- 555 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 16:01:55 ]
- 南堂さんが(ry
- 556 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 18:43:07 ]
- もうそのネタは秋(ry
- 557 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 20:20:28 ]
- 「糞」や「尻」を入れるんなら同程度に頻度の高い「肛」も入れろ、
第二水準差別するなゴルァという俺のコメントは黙殺されたけどな。
- 558 名前:デフォルトの名無しさん mailto:sage [2005/11/10(木) 23:51:35 ]
- 委員「また、『やらないか?』か!」
- 559 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 00:54:57 ]
- > 同程度に頻度の高い
の根拠が不明
- 560 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 07:23:31 ]
- 膣と肛門が同程度の頻度
根拠は不明
- 561 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 13:01:36 ]
- >膣と肛門が同程度の頻度
両刀使いだから
- 562 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 14:10:21 ]
- 多くの文字コードに対応した外国産のWinアプリを使用しているのですがこのアプリで
SJISを指定して「ゾ」の文字を保存すると「ソ」、「 ] 」、16進でいうと 0x83, 0x5c, 0x5d と 3バイトで保存されてしまうのです。SJISの文字コード表でみると「ゾ」は、0x83,0x5d の ようなのでこれはバグなのでしょうか?メモ帳などでこれを開くと「ソ」、「 ] 」と2文字で 表示されます。
- 563 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 14:18:53 ]
- 転はどうですか?
- 564 名前:562 mailto:sage [2005/11/11(金) 16:30:44 ]
- >>563 レス遅れました。
「貼」「 ] 」の2文字(3バイト)になりますね。2バイト目が0x5dの文字がダメってことですか。 でも(当たり前かもしれないが)このアプリで読み込めばちゃんと「ゾ」とか「転」とか表示 されるんですよね。そもそも3バイトにエンコードってありなんでしょうか?
- 565 名前:デフォルトの名無しさん mailto:sage [2005/11/11(金) 16:48:49 ]
- どういう訳か知らんが、閉じブラケット ] (0x5d) の手前に
バックスラッシュ \ (0x5c) を入れたいんだろうな もちろんこんな処理は不正
- 566 名前:562 mailto:sage [2005/11/11(金) 17:00:49 ]
- >>565
なるほど0x5cは \ でしたか。そのアプリが ] の前に \ を入れたい 理由は分かりました。やっぱりアプリのバグのようです。 ありがとうございました。
- 567 名前:557 [2005/11/11(金) 23:40:44 ]
- 厳密に言えば、「尻」が圧倒的に多くて使用度数 3279 回 (1422位)。
続いて「肛」の 811 回 (2208位) と「糞」の 773 回 (2236位) がほとんど 同じ。上位3000位まで取って候補を選定したんだから、ずいぶん上位に 入ってることが分かると思う。 これは、表外漢字字体表の選定にも今回の人名用漢字表の選定でも決定的な 役割を果たした(新)凸版調査の順位そのものなので >>561 の推測は間違い。 ちなみに、人名漢字のパブコメは、数が多すぎて、委員は法務省のまとめを 見ただけで、個別のコメントに目を通してはいないだろうと思う。 さらに言うと、驚くべきことに「膣」(399回、2623位)よりも「腟」(820回、 2197位) の方が多かったりする。それなのに印刷標準字体が「膣」であると いうことに、この問題を理解する鍵がある。
- 568 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 01:59:37 ]
- 第二水準差別するなってそういう意味か。
第二水準の文字全部入れろとか言うよくいるアホかと思った
- 569 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 08:56:48 ]
- とりあえず「腟」は解体新書を出すときに作られた字だと言う話を思い出した。
- 570 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 09:26:40 ]
- 腟=肉+室=にくむろか。
エロイな。
- 571 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 11:34:54 ]
- >>553
> 意味的に不適切な字を削除しても無意味なことは > あくま君問題の結末が証明していると思うんだが。 糞・尻が使えなくても久素・史理で「くそ・しり」と読ませるのは 許されるのだから無意味といったこと?
- 572 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 11:39:07 ]
- かな文字もあるしな。
- 573 名前:デフォルトの名無しさん mailto:sage [2005/11/12(土) 11:57:25 ]
- ほとんど同意してしまう部分があるけど、
人名用漢字として選定する権限と責任のある仕組みの上では、 漢字は選定できても、読みは制限できないという点で別問題かも とは思ってしまう。 もっとも人名用漢字の制度を設ける必要あるかないかに直結するかな。
- 574 名前:デフォルトの名無しさん mailto:sage [2005/11/13(日) 12:07:48 ]
- 本当は怖い親権の濫用
- 575 名前:デフォルトの名無しさん mailto:sage [2005/11/13(日) 13:49:27 ]
- 地名って一水、二水の範囲で網羅してるの?
- 576 名前:デフォルトの名無しさん mailto:sage [2005/11/13(日) 23:52:13 ]
- 行政地名は網羅してるけど
地名はそれだけではない罠
- 577 名前:デフォルトの名無しさん mailto:sage [2005/11/14(月) 02:26:50 ]
- 年賀状の宛先が書けないケースもあるってこと?
それとも、歴史上の地名とかの話?
|

|