- 1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net]
- プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
- 445 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 16:51:12.98 .net]
- >>439
Unicodeすらまともにサポートしてなかったのか
- 446 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 19:49:26.19 .net]
- Adobe-Japan1フォントは、欧文がダメだからなー
- 447 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:50:40.29 .net]
- JavaScriptは仕様を巡る争いで数年無駄にしたからなあ
- 448 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:55:49.16 .net]
- 仕様を巡る争いなんてないよ。
そもそもネットスケープの独自言語だったわけだし。 単に標準化委員会が、XHTMLなんかはやらせようとしてて JavaScirptに見向きもしなかっただけ。 標準化委員会が最低限のDOM以外なにも決めようとしないので 各ブラウザベンダーは独自で便利な機能を実装していった。 この時代に標準はない。 それに業を煮やしたブラウザベンダーがJavaScriptを ふんだんに取り入れたHTML5を作り出した。 ここからやっとJavaScriptの仕様の話に入る。
- 449 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 22:58:20.53 .net]
- ECMAScript 4でググるよろし
- 450 名前:デフォルトの名無しさん mailto:sage [2013/11/01(金) 23:23:10.92 .net]
- 図解雑学文字コードは分かりやすくて良い本なので
2002年以降の動向を追加した改訂版を出してほしい。
- 451 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 03:46:05.18 .net]
- グリフ集合のデファクトを一企業に握られてるというのは
あんまり健全じゃないよな
- 452 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 12:52:30.79 .net]
- Adobeのことかー!!
- 453 名前:デフォルトの名無しさん mailto:sage [2013/11/02(土) 23:40:23.63 .net]
- Winも8.1でAJ16フォントを採用したもんなー
- 454 名前:デフォルトの名無しさん mailto:sage [2013/11/03(日) 00:24:53.83 .net]
- ん、そうなのか
- 455 名前:448 mailto:sage [2013/11/03(日) 00:26:29.81 .net]
- ノリで言っただけで
>>447がどの企業のことを指していたのかはわからないんだけどね。
- 456 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 01:31:55.84 .net]
- WG2更新されてゅぅ
でも日本に関係あるのは梵字くらいか
- 457 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 05:30:08.53 .net]
- ユニコード戦記の新古書を神田古本まつりでゲット
- 458 名前:デフォルトの名無しさん mailto:sage [2013/11/05(火) 21:37:05.50 .net]
- 安岡信者がこんなところにも
www.mishimaga.com/tonarimachi/26.html
- 459 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 01:58:32.56 .net]
- ここはお前個人の閻魔帳じゃないんだからせめて何が気に入らないのか第三者に伝わるようなレベルで具体的に説明してくれ。
- 460 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 21:30:15.62 .net]
- マジ基地のTRON信者だから、何を言っても無駄です
- 461 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 23:06:31.14 .net]
- 安岡センセイも最近はマイナンバーとタイプライターばかりだからな
- 462 名前:デフォルトの名無しさん mailto:sage [2013/11/06(水) 23:08:18.62 .net]
- 安岡は最近は2ちゃんで自分への否定的なレスを見つけては
TRON信者だ!とか騒ぐだけ
- 463 名前:デフォルトの名無しさん mailto:sage [2013/11/07(木) 01:44:24.77 .net]
- 良くも悪くも特別視することないと思うけど
別にJSC2の委員ってわけでもないし>>11
- 464 名前:デフォルトの名無しさん mailto:sage [2013/11/07(木) 11:36:23.41 .net]
- タイプライターの件で必死に噛みついてた狂信的坂村信者以外に、
安岡氏のやることなすことケチつける奴なんて考えられんw
- 465 名前:デフォルトの名無しさん [2013/11/07(木) 23:26:55.37 .net]
- >>445
4で数年も無駄にしてない。
- 466 名前:デフォルトの名無しさん mailto:sage [2013/11/08(金) 02:07:42.03 .net]
- ルーブル記号が決まったらUnicode 7.0の前に6.4が来るかな…
- 467 名前:デフォルトの名無しさん mailto:sage [2013/11/10(日) 03:44:23.37 .net]
- >>459
1997からJIS委員対反JISの戦いなんてないしな。 文句ある奴は意見出せって流れになったので。 争点としては残った包摂基準の良し悪しについても、今はIVSがあるし。 争点がほとんどないのがこのスレの伸びにも現れてる。
- 468 名前:フ名無しさん [2013/11/10(日) 20:44:11.17 .net]
- ITU定義の電話ボタンの*(star)と#(square)が、それぞれ、
U+26B9 SEXTILE U+2317 VIEWDATA SQUARE に包摂される模様。 std.dkuug.dk/JTC1/SC2/WG2/docs/n4495.pdf
- 469 名前:デフォルトの名無しさん mailto:sage [2013/11/10(日) 20:56:57.81 .net]
- しめす偏の「ネ」の字形も「示」の字形差も包摂しちゃって書体のデザイン差にしてしまえば良いのだ。
- 470 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 02:12:34.24 .net]
- >>464
いいから、その埃だらけの画像はやめてくれw
- 471 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 11:37:46.13 .net]
- >>464
一昨年の話↓が、やっと決着するのか slashdot.jp/~yasuoka/journal/537609
- 472 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 12:37:38.51 .net]
- なんと、そんな経緯が
- 473 名前:デフォルトの名無しさん [2013/11/11(月) 16:06:38.67 .net]
- 電電公社
- 474 名前:のプッシュホンの#も
a/bが凄く小さかったり、 αが90度じゃないがあるんだな。 よく見ると目の前の内線電話も#だけ傾いてるな。 [] - [ここ壊れてます]
- 475 名前:デフォルトの名無しさん mailto:sage [2013/11/11(月) 18:01:36.75 .net]
- 経緯を無視して特定の時期のデザインを基準にしちゃうのもなんだけど
今更☆と◇には戻せないしなあ。
- 476 名前:デフォルトの名無しさん [2013/11/11(月) 18:06:53.31 .net]
- IVSで好きな字形選べるしなw
- 477 名前:デフォルトの名無しさん [2013/11/13(水) 03:05:02.46 .net]
- >>167
半年ROMったがお前がクズだということがわかった とっとと死ね
- 478 名前:デフォルトの名無しさん [2013/11/13(水) 03:08:05.71 .net]
- 半年ROMれとか何様だよこの老害
まじむかついてきた くたばれ
- 479 名前:デフォルトの名無しさん mailto:sage [2013/11/13(水) 08:58:17.34 .net]
- すべったか
- 480 名前:デフォルトの名無しさん mailto:sage [2013/11/13(水) 09:48:01.75 .net]
- >>473
半万年ROMれ
- 481 名前:デフォルトの名無しさん [2013/11/14(木) 21:09:00.74 .net]
- >>464
ITU-T E.161だな。 >>469 推奨値にすぎないが、斜めになるとa/bが0.18になる。 a/bが大きいのに90度なのは、推奨ではない独自のシェイプということになる。 www.itu.int/rec/T-REC-E.161-200102-I/en ISOだと、ISO/IEC 9995-8。 どうしてa/b、90度を標準的なグリフに変更するように求めているんだろう。
- 482 名前:デフォルトの名無しさん [2013/11/14(木) 21:17:49.28 .net]
- ところでISO/IEC 9995-10に関する提案も出ているんだけど、
std.dkuug.dk/jtc1/sc2/wg2/docs/n4464.pdf std.dkuug.dk/jtc1/sc2/wg2/docs/n4444.pdf を見るとびっくりするような記号までキーボードに関連付けられているのだけど。 ドイツ人は、コンマ付きのアポストロフィとか、 ダブルレフトアングルとか、比のスラッシュとか、割り算のスラッシュとか、 いちいちキーボードのキーに割り当てていたんだね。
- 483 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:26:41.19 .net]
- 来週からIRGだってのにあまりドキュメントがポストされませんな
- 484 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:51:44.80 .net]
- U+26B9 ⚹
U+2317 ⌗
- 485 名前:デフォルトの名無しさん mailto:sage [2013/11/14(木) 23:59:48.74 .net]
- これらを含む日本語フォントがどれだけあるやら
- 486 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 01:19:13.46 .net]
- SEXTILEはWebページならスタイルシートでアスタリスクを90度回転させればいいな。
- 487 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 01:25:46.20 .net]
- いや、見た目だけでいいなら画像貼ればいいんじゃねと思う。
アスタリスクは回転させてもアスタリスクだし、なんとも中途半端じゃないかね。
- 488 名前:デフォルトの名無しさん [2013/11/15(金) 01:27:10.30 .net]
- じゃあ×もいらないな。+を45度(ry
- 489 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 02:11:51.46 .net]
- 今はWebFontで特定の文字だけ好きな埋め込みフォントで表示させられる時代ですよ奥さん
- 490 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 05:13:40.26 .net]
- 盲人用読み上げソフトや
全文検索エンジンが困るだろう。
- 491 名前:デフォルトの名無しさん mailto:sage [2013/11/15(金) 13:44:23.53 .net]
- 現段階じゃ実質的にWebFontってフォントを自作できる人にしか活用できん罠
- 492 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 01:04:14.26 .net]
- ○度回転させる制御文字をUnicodeで定義しておけばいいんじゃね?
- 493 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 01:19:07.60 .net]
- IRGN1959<AJ1・汎用電子に続く第3のIVDを登録するよ!
だって
- 494 名前:デフォルトの名無しさん [2013/11/16(土) 18:09:38.96 .net]
- IPAの文字情報基盤か。
appsrv.cse.cuhk.edu.hk/~irg/irg/irg41/IRGN1959_Japan_Activity.doc
- 495 名前:デフォルトの名無しさん [2013/11/16(土) 18:44:41.16 .net]
- なんや!
- 496 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 19:15:02.84 .net]
- ラニマル文字
- 497 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 21:30:45.57 .net]
- >>489の母体はこれかな
ttp://mojikiban.ipa.go.jp/
- 498 名前:デフォルトの名無しさん mailto:sage [2013/11/16(土) 23:52:46.10 .net]
- 議事録面白い
変体仮名の検討つづいてたんだ
- 499 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 01:23:43.73 .net]
- なんの議事録?
- 500 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 02:05:15.96 .net]
- 492の委員会活動状況ってところ
何をどう符号化するかみたいな話がのってる
- 501 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 03:12:57.30 .net]
- 変体仮名ってどんだけ使用実績あるの?
戸籍統一文字と相互変換することなんてありえないし。 またゴリ押しして複雑化するのだけはやめて欲しい。
- 502 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 11:17:00.18 .net]
- またというのは?
- 503 名前:デフォルトの名無しさん [2013/11/17(日) 11:52:59.91 .net]
- 変体仮名は和歌の世界では日常茶飯時で当然活字もある。
- 504 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 15:58:49.35 .net]
- 古典を電子化するために必要ってことだよね。
でも変体仮名ってゴシック体とか明朝体の活字が使われる頃には既に使われなくなっていたから 楷書体の字形しか無いよな? ゴシック体の変体仮名ってマヌケそう。
- 505 名前:デフォルトの名無しさん mailto:sage [2013/11/17(日) 18:52:14.42 .net]
- 散々言われ尽くしたことを何故いまさら
- 506 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 01:20:17.70 .net]
- >>500
結論出たならいいけどさ 登録するなら必要な話でしょ。 手書き限定ならそもそも活字化出来ない→誰も実装しない→登録する必要性なし って判断されるかもよ。
- 507 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 01:21:25.80 .net]
- >>498
活字なんてあったっけ?
- 508 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 02:12:31.08 .net]
- 行政で必要なものだけ符号化すりゃいいんだよ的な話になってるのは気になるけど
どのみち於可古志八みたいな有名どころは入ることになるか
- 509 名前:デフォルトの名無しさん [2013/11/18(月) 11:47:29.93 .net]
- >>502
当然あった。例えば「築地活文舎 変体仮名」でググれ。 基本的なことも知らないのだから活字には無知だろうに、 どうして「あったっけ?」なんていい方が出来るのか...
- 510 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 18:52:54.82 .net]
- この会社ならいい感じの変体仮名のフォント作れそうだな。
fontworks.co.jp/font/tsukushi/tsukushiboldmin/R.html
- 511 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 22:20:12.19 .net]
- そもそも常識的に考えて「変体仮名の活字はなかった」なんておかしいだろ
- 512 名前:デフォルトの名無しさん mailto:sage [2013/11/18(月) 23:35:43.62 .net]
- 弘道軒清朝体が出てきて懐かしくなった
- 513 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 16:23:32.63 .net]
- >>4-6
UTF-8に統一しろよって言いに来たけどテンプレ読んで頭が下がりました。 すいませんでした。
- 514 名前:デフォルトの名無しさん [2013/11/19(火) 16:51:04.04 .net]
- >>4
>・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた? テキストVRAMに書き込むのは、BIOSかコマンドの仕事。 直接書き込みたければコマンドが自分で変換する必要がある。 ちなみに1byteごとに色等の修飾属性1byteがつくから、漢字は4byte。
- 515 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:02:59.00 .net]
- 98のbiosは文字描画無いんじゃなかったっけ?
- 516 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:19:25.06 .net]
- そもそもMS-DOSはShift_JISじゃないし。
>>4の様な安岡信者は相変わらず気が触れているな。
- 517 名前:デフォルトの名無しさん mailto:sage [2013/11/19(火) 22:25:22.58 .net]
- 学参明朝などという八百長書体のせいで
字形の違いとデザイン差の問題がでたらめになってしまった。 学参明朝を撲滅せよ!
- 518 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 02:36:10.18 .net]
- >>511
安岡のおっちゃんもCP932とShift_JISくらい区別ついてるよ
- 519 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 12:01:24.92 .net]
- 安岡はCP932とShift_JISの区別は付いているけど
シフトJISとShift_JISの違いがついていなくて Shift_JISを妄信しているから困る
- 520 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 18:16:02.66 .net]
- 意味のわかんないことを一人で必死に連投してるのは何?
- 521 名前:デフォルトの名無しさん mailto:sage [2013/11/20(水) 18:52:26.42 .net]
- 勉強してきて、どうぞ
- 522 名前:デフォルトの名無しさん [2013/11/21(木) 10:41:36.55 .net]
- 「シフトJIS」なんて厳密な定義ない。>>514は馬鹿。
- 523 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 10:44:02.10 .net]
- 厳密な定義のない広義のシフトJISとShift_JISとが
区別できてないってことだろ
- 524 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 13:53:21.11 .net]
- slashdot.jp/~yasuoka/journal/334730
↑この話な
- 525 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 16:13:00.62 .net]
- MS-DOS全盛の時代にWindows-31Jがあったとは思えないんだが
- 526 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 16:49:54.99 .net]
- >>519
これ読むと
- 527 名前:誤解されてる方の意味での
「シフトJIS」ってのは EUCにふさわしい名前だな [] - [ここ壊れてます]
- 528 名前:デフォルトの名無しさん [2013/11/21(木) 17:21:16.17 .net]
- >>519
これは「シフトJIS」と「Shift_JIS」を混同している(>>514)んじゃなくて、 世間的にASCII+Microsoftが起源と思われている「シフトJIS」が 実は漢字CP/M由来であるという話の中で、 Shift JIS系のコードの総称として「シフトJIS」と言う言葉を使ってるんじゃないのかな?
- 529 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 19:02:01.88 .net]
- >Shift JIS系のコードの総称として「シフトJIS」
というのが世間の認識なんだけど、 安岡氏は代表であるMSのそれを「MS漢字コード」 という別物としてとらえている感があるような
- 530 名前:デフォルトの名無しさん mailto:sage [2013/11/21(木) 19:12:37.27 .net]
- 「完敗」って書いてるじゃん
- 531 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 03:13:57.39 .net]
- >>523
なんか前半と後半で文書繋がってないけど。 ・総称をシフトJISと呼ぶことが多い ・CP932を安岡はMS漢字コードと言ってる ・シフトJISにCP932は含まれる ってだけじゃないの。 で、スラドに書いてあるのはシフトJIS起源はどの会社かって話でしょ。 これに関しては安岡説は間違ってたと当人が認めてる。
- 532 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 08:31:16.26 .net]
- 読解力ないな
スラドのテーマは 「誤解されてる方の意味」の >「Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが >「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、 >すなわち「シフトJISコード」でした」 を言ったのはどこの会社の誰かソース出せ ってことだろ
- 533 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 09:51:05.75 .net]
- 誤解されてる方
って何だ?
- 534 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:02:46.92 .net]
- 「これを読む限りでは」って限定してるじゃん
しかも今じゃ読めないし
- 535 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:07:18.05 .net]
- 安岡はともかく>>4あたりがよく分かっていないのは間違いない
- 536 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 12:48:58.53 .net]
- 4がっつーか当時の書き込みがそのまま使われてるだけだろ
www.bookshelf.jp/2ch/tech/1143375639.html
- 537 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 15:22:40.61 .net]
- 質問なのですが
CP932のNEC選定IBM拡張漢字と、IBM拡張漢字の領域で 重複している漢字がいくつかありますが UTF8から変換した時、どちらに変換するのが正しいんでしょうか? 例) \(U+7E8A) NEC選定IMBだと 0xED40 IBMだと 0xFA5C
- 538 名前:デフォルトの名無しさん mailto:sage [2013/11/23(土) 15:37:34.29 .net]
- 自己解決しました
Wikipedia先生に答えが書いてありました > 「NEC選定IBM拡張文字」「IBM拡張文字」が重複する場合は、「IBM拡張文字」に統一 ありがとうございました
- 539 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 00:08:42.45 .net]
- ふむ
- 540 名前:デフォルトの名無しさん mailto:sage [2013/12/11(水) 00:37:39.94 .net]
- ほう
- 541 名前:デフォルトの名無しさん mailto:sage [2013/12/11(水) 03:30:11.10 .net]
- へえ
- 542 名前:デフォルトの名無しさん mailto:sage [2013/12/12(木) 16:23:27.72 .net]
- ところでPRI 259は
- 543 名前:デフォルトの名無しさん mailto:sage [2013/12/12(木) 20:41:09.81 .net]
- TwitterでNさんが夜中にキレてたね
- 544 名前:デフォルトの名無しさん mailto:sage [2013/12/14(土) 00:35:38.20 .net]
- 文字コードの判定の精度を確かめたいのですが
よく使われているテストセットみたいのってありますか?
- 545 名前:デフォルトの名無しさん mailto:sage [2013/12/14(土) 00:38:42.17 .net]
- >>536
IPAmjフォント専用みたいな感じだから 良くも悪くも一般ユーザーには関係なさそう
|

|