- 1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
- Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/ 文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/ 文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/ 文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/ 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
- 535 名前:デフォルトの名無しさん mailto:sage [2019/07/24(水) 00:37:51.21 ID:ArGZw8p9.net]
- 基本多言語面って制御文字含んでるよね。
それbaseXXの
- 536 名前:{来の意味を成してないw []
- [ここ壊れてます]
- 537 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 16:07:01.10 ID:zqR8kD3Y.net]
- W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w https://www.w3.org/People/mimasa/xmldev.html.ja.sjis
- 538 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 17:27:15.46 ID:wpOWgZAQ.net]
- 読めるけど...?
- 539 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 23:04:31.46 ID:8LEpKI7v.net]
- ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ
- 540 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 01:20:35.42 ID:JKQq3Dbg.net]
- (´・・∀・・`)ほう
- 541 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 06:07:28.33 ID:xlQPwL5+.net]
- >>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。 最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。
- 542 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 07:31:42.15 ID:SJok1opV.net]
- >>535
Firefox68には文字コード指定が残ってる 通常は無効になってるけど>>531のリンク先を表示したときは有効になって ISO-2022-JPを指定すると文字化けなしで読めた
- 543 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 08:38:57.28 ID:xlQPwL5+.net]
- ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?
- 544 名前:デフォルトの名無しさん [2019/08/20(火) 11:37:07.61 ID:zlJnj2O9.net]
- >>531
これはひどいω
- 545 名前:デフォルトの名無しさん [2019/08/20(火) 11:39:07.12 ID:zlJnj2O9.net]
- >>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ
- 546 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 18:30:12.77 ID:Gkd3xMH4.net]
- なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。 記憶障害じゃなくてよかったw https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843
- 547 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:44:07.86 ID:Y189B2BT.net]
- HTMLをiso-2022-jpにするのって
どこの文化なんだろうか? Windowsはsjisだからありえないし Linuxも昔の普通はEUC-JPだろ? iso-2022-jpはメールにしか使われてなかったはずだが
- 548 名前:デフォルトの名無しさん [2019/08/20(火) 21:47:57.43 ID:UVunetX1.net]
- >>531
イシカワ マサヤスというのは誰だろうね。
- 549 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:51:25.41 ID:Y189B2BT.net]
- イシカワ マサヤスさんでは?
- 550 名前:デフォルトの名無しさん [2019/08/20(火) 21:52:36.86 ID:UVunetX1.net]
- 石川雅康と石川哲志は親族だろうか?
どちらもICT業界から去ったのかな。
- 551 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:54:13.55 ID:Y189B2BT.net]
- またつまらんものを
- 552 名前:デフォルトの名無しさん [2019/08/20(火) 21:58:33.22 ID:UVunetX1.net]
- XHTMLが終わってしまって、そのまま放置の石川さん。
- 553 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 22:46:49.05 ID:anpoimU7.net]
- >>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい ttp://www.tohoho-web.com/lng/199801/98011002.htm
- 554 名前:デフォルトの名無しさん [2019/08/20(火) 23:01:02.75 ID:UVunetX1.net]
- >>547
http://の先頭のhを取っても付けても同じですよ。
- 555 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 23:43:43.88 ID:Gkd3xMH4.net]
- > どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html えぇ……。
- 556 名前:デフォルトの名無しさん [2019/08/21(水) 00:08:09.19 ID:/FRdjxvW.net]
- 1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。
- 557 名前:デフォルトの名無しさん mailto:sage [2019/08/21(水) 02:35:13.27 ID:GZen3C6t.net]
- >>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか? > name="GENERATOR" content="Microsoft FrontPage 2.0" > というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。
- 558 名前:デフォルトの名無しさん [2019/08/21(水) 03:44:23.93 ID:jDiMObB6.net]
- >>540
流れは似てるが今回は指摘されてるURLが問題なんだろ よりによってアイツがってやつさ
- 559 名前:551 mailto:sage [2019/08/21(水) 05:07:33.18 ID:GZen3C6t.net]
- あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし >>531は単なる文字コード変換ミスかな? https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa
- 560 名前:デフォルトの名無しさん [2019/08/21(水) 14:49:37.63 ID:ur92HW83.net]
- 拡張子付け間違いか
- 561 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:16:14.71 ID:mlpPC2JR.net]
- ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。
- 562 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:36:57.94 ID:jM8tCXZ0.net]
- だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば iso-2022-jpが使えるテキストエディタで書いたか sjisに変換すべきところをiso-2022-jpに変換してしまったということ 昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話
- 563 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 08:04:31.58 ID:jlFkmCtz.net]
- jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで
- 564 名前:デフォルトの名無しさん [2019/08/22(木) 09:50:35.92 ID:xQsiKIbM.net]
- 鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る
- 565 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:23:09.36 ID:jM8tCXZ0.net]
- >>557
拡張子はjisじゃなくてsjisな だからドキュメントの文字コードが明らかに間違ってるんだよ
- 566 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:30:34.86 ID:jM8tCXZ0.net]
- 昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。 なぜならセキュリティというかサーバー運営者がよくわかっておらず 設定変更の必要性を理解できていなかったので設定されてなかった たとえ設定変更ができるサーバーでもユーザーが理解していなかった そんな時代だからブラウザで表示できれば良し程度のレベルが普通で 今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。 たぶんこんなところ
- 567 名前:デフォルトの名無しさん [2019/08/22(木) 10:33:49.69 ID:8JJS2LZD.net]
- >>559
お前のレスの >>556 には jis って書いてあるだろω お前が原因
- 568 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:35:00.76 ID:jM8tCXZ0.net]
- >>561
単なる書き間違えじゃね? リンク先見ればわかるでしょ
- 569 名前:デフォルトの名無しさん [2019/08/22(木) 10:38:26.99 ID:8JJS2LZD.net]
- >だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jis
こういうおっちょこちょいが >>531 みたいなミス連発するんだろうな
- 570 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 15:58:03.72 ID:mlpPC2JR.net]
- 皆さん落ち着いて
- 571 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:29:19.40 ID:bWgnQwQ7.net]
- なんでUTF8以外違法になった今そんな話してんだか・・・
- 572 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:59:07.09 ID:UifFOlyJ.net]
- × 違法 ○ 非推奨
- 573 名前:デフォルトの名無しさん mailto:sage [2019/08/24(土) 00:05:20.43 ID:Ka96Zrl8.net]
- 秘宝とか緋水晶とか何の話をしてるんだ?
- 574 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 20:34:39.12 ID:++G8a3I1.net]
- ムーンプリズムパワー!メイクアップ!
- 575 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:05:01.03 ID:E2o3oeEK.net]
- タリスマン
- 576 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:36:09.44 ID:heTmUHGD.net]
- クリマタスミ
- 577 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 13:35:52.48 ID:AiVdwxrR.net]
- ひまだ
- 578 名前:デフォルトの名無しさん [2019/08/28(水) 19:19:16.62 ID:lfvHhqTB.net]
- サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。
- 579 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 20:04:07.93 ID:FG4A80Dg.net]
- じっさい32じたいそんな使わないだろw
- 580 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:28:30.40 ID:VG5IecJ5.net]
- でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。
- 581 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:42:08.11 ID:y3rrvHgi.net]
- 読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている
- 582 名前:デフォルトの名無しさん [2019/08/29(木) 18:49:00.69 ID:1ks18uap.net]
- 内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利 あとはcps932が滅ぶのを待つだけ
- 583 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:05:33.35 ID:VG5IecJ5.net]
- OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。 でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。
- 584 名前:デフォルトの名無しさん [2019/08/29(木) 19:09:37.98 ID:CAV+1+Xc.net]
- という会話を何年も前にこのスレで観た
- 585 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:11:19.48 ID:YrWceYNE.net]
- 複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない
- 586 名前:デフォルトの名無しさん [2019/08/29(木) 20:02:33.30 ID:jljmwQsV.net]
- プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。
- 587 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 21:00:32.68 ID:FJllEP/G.net]
- 【名案】0〜9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021−65018=3」ってどう書くの?
https://togetter.com/li/1396827
- 588 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 22:50:02.31 ID:azXlKn0W.net]
- UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw
漢字1文字が最大8バイト、Unicodeの「IVS」とは? https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
- 589 名前:デフォルトの名無しさん [2019/08/29(木) 23:01:38.50 ID:jljmwQsV.net]
- UTF-8だけで必要十分という結論に到達せざるをえない現実
- 590 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 23:09:19.19 ID:azXlKn0W.net]
- 逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、 UTF-32でも不便になったからUTF-8でいいでしょ? どうせ単純には扱えずライブラリ使うしか無いんだから。 という必要十分な文字コードを捨てたというのが現実
- 591 名前:デフォルトの名無しさん [2019/08/29(木) 23:11:55.32 ID:jljmwQsV.net]
- 宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。
- 592 名前:デフォルトの名無しさん [2019/08/30(金) 00:11:25.73 ID:h/StilS8.net]
- 文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw
- 593 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:01:22.62 ID:LpXSw35l.net]
- UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは
- 594 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:29:38.44 ID:/ghu33Nb.net]
- >>586
ではどうぞ御説明をどうぞw
- 595 名前:デフォルトの名無しさん [2019/08/30(金) 13:00:23.27 ID:oVszNH41.net]
- >>579
codecvtは糞だ
- 596 名前:デフォルトの名無しさん [2019/08/30(金) 13:03:12.55 ID:oVszNH41.net]
- >>580
だった まあどっちでもいいけど
- 597 名前:デフォルトの名無しさん [2019/08/30(金) 15:32:59.58 ID:6uSriybI.net]
- >>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。
- 598 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 15:56:24.57 ID:iPGqG8dk.net]
- >>591
それぐらいみんな知ってる
- 599 名前:デフォルトの名無しさん [2019/08/30(金) 17:05:21.42 ID:GEn/r+mZ.net]
- >>592
それぐらいみんな知ってる
- 600 名前:デフォルトの名無しさん [2019/08/30(金) 17:19:36.31 ID:57FOZgRt.net]
- ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。
- 601 名前:デフォルトの名無しさん [2019/08/30(金) 17:27:36.02 ID:GEn/r+mZ.net]
- 定期
貼れるんかこれ https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b
- 602 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 10:08:53.77 ID:0iGUnrw4.net]
- >>591
スレの流れみた?UTF-32の話をしてんだぞ?
- 603 名前:デフォルトの名無しさん [2019/08/31(土) 15:33:43.16 ID:SHne0DDt.net]
- >>596
そのまえ
- 604 名前:デフォルトの名無しさん [2019/08/31(土) 15:35:30.15 ID:SHne0DDt.net]
- 6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ
- 605 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:37:04.56 ID:3i1dPJsj.net]
- >>598
それは理由が書いてないから、読む価値ある?
- 606 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:45:23.47 ID:4qIvp+ND.net]
- なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ
- 607 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:56:52.05 ID:3i1dPJsj.net]
- ん?支持しなくて良いよ
- 608 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 17:12:51.44 ID:0iGUnrw4.net]
- >>597
じゃあ >>586 はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句, 碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?
- 609 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 17:59:12.56 ID:Yn5v13ie.net]
- ネットウヨw
- 610 名前:デフォルトの名無しさん [2019/08/31(土) 20:21:37.85 ID:5EL66xzp.net]
- re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。
- 611 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 22:52:53.39 ID:0iGUnrw4.net]
- 寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。
- 612 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 22:58:57.55 ID:3i1dPJsj.net]
- UTF-32対応は難しいから無理だろ
- 613 名前:デフォルトの名無しさん [2019/09/01(日) 01:36:48.58 ID:sYwYgS29.net]
- iconv禁止
- 614 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 09:07:17.74 ID:XF6G4Ohn.net]
- NKF(Network Kanji code conversion Filter)を使えば?
Ruby にも、NKF モジュールがある
- 615 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 10:46:26.40 ID:YneNC5Ev.net]
- 別にコード変換ツールを探してるわけじゃなくね?w
- 616 名前:デフォルトの名無しさん [2019/09/01(日) 10:52:49.46 ID:kCJZVLuH.net]
- どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決
- 617 名前:デフォルトの名無しさん [2019/09/01(日) 12:53:54.91 ID:k0czTyLP.net]
- 収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。 UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで 対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が 制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。 UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで 収録できるから、すべての文字を32ビットで表せて単純明快になる。
- 618 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb.net]
- >>611
いろいろ間違ってるなw まずUTF-16という仕様にはサロゲートペアが最初から含まれてる UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから 既に使われてるものを簡単に変えられるわけがない。 UTF32が21bitコードになってしまったのはUTF-8のせいだ 21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
- 619 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:11:25.72 ID:xmxF7u0H.net]
- 異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
- 620 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:35:49.57 ID:JCPxJyAV.net]
- MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
- 621 名前:デフォルトの名無しさん [2019/09/01(日) 13:40:59.73 ID:kCJZVLuH.net]
- >>612
おまいもかなり可笑しいなω
- 622 名前:デフォルトの名無しさん [2019/09/01(日) 13:42:43.07 ID:k0czTyLP.net]
- >>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。 変なものを作らずにUTF32を導入すべきだった。 >UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから >既に使われてるものを簡単に変えられるわけがない。 シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。 >UTF32が21bitコードになってしまったのはUTF-8のせいだ UTF8は可変長だから、32ビットでも表そう思えば表せる。 21ビットになったのはUTF16のせい。 >21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる 収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、 21ビットだけでは心許ない。 >>613 異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う 滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
- 623 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:01:22.04 ID:JCPxJyAV.net]
- (もしかして: フォント)
- 624 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH.net]
- >>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。 無理。UTF-8は「自由に可変にできる文字コード」ではない。 ビットパターンが決まっていて最大21bitまでしか表現できない
- 625 名前:デフォルトの名無しさん [2019/09/01(日) 14:29:25.97 ID:k0czTyLP.net]
- >>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。 UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、 UTF8もそれを超えるコードを規格外とみなすようにしただけ。
- 626 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:38:49.28 ID:5y1tL0M+.net]
- >>619
エンコードと文字コードを混ぜんな おまえみたいな奴がいるから混乱するんだよ 少しは馬鹿を自覚して黙ってろ
- 627 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:12:24.21 ID:VpClr4jS.net]
- >>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが
- 628 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH.net]
- >>614
MSがSJISやめたら、世の中の既存の文書が UTF8にでも変わると思ってんの? 魔法ですか?www
- 629 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 15:56:23.21 ID:8MncpZHQ.net]
- 魔法(圧力)
- 630 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 16:24:11.77 ID:KSSQVEnP.net]
- >>623
どこからの? セブンイレブンとか?
- 631 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 22:33:53.67 ID:8MncpZHQ.net]
- マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。 念の為言っておくとOOXML←OpenDocument、XPS←PDFね。
- 632 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 00:26:14.39 ID:EcUF0HHf.net]
- そんな圧力あったかなあ
- 633 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 06:39:22.40 ID:KovswbEV.net]
- >>625
所でLinuxもデスクトップ環境も 一つに統一したほうが良いのではないか?ん?
- 634 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 08:49:15.73 ID:/ybqtULG.net]
- MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC
- 635 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 10:21:51.94 ID:KovswbEV.net]
- PDFはアドビのプロプラフォーマットってイメージが抜けないw
|

|