- 1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
- Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/ 文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/ 文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/ 文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/ 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
- 499 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 02:44:42.35 ID:KxegnpZe.net]
- 絵文字ガチャに見えた
- 500 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 18:46:20.88 ID:1ALBmyOB.net]
- https://symbolset.com/
これとか。素晴しい発想だと思いませんこと?(お嬢様風)
- 501 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 19:55:14.68 ID:VWoLS78P.net]
- 全然
- 502 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 20:32:53.74 ID:MkBgWLvD.net]
- 見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう
- 503 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:02:05.57 ID:1ALBmyOB.net]
- >>497
実はそれを意図しているんだな、これが。 Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。 この発想はアクセシビリティの面からしてすごいと思う。 今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する), いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ 高いアクセシビリティを誇る。
- 504 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:31:19.26 ID:2juPiYlp.net]
- なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?
- 505 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 22:16:35.89 ID:MkBgWLvD.net]
- >>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象 これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、 把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。 入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、 個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし
- 506 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 23:23:56.67 ID:sPnkqdOZ.net]
- どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい
- 507 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 00:12:01.52 ID:vOsPyG+v.net]
- This is a pen.とか[ Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a guin.の誤爆避けも必要になる。
- 508 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:02.84 ID:2smzn43h.net]
- https://8beat-studio.net/how-to-use-ligaturesymbols/
とか? >>499
- 509 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:32.89 ID:2smzn43h.net]
- >>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。
- 510 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:13:03.16 ID:2smzn43h.net]
- >>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。
- 511 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 12:02:58.02 ID:liKrIWIO.net]
- SVGベタ書きがいいと思う
- 512 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 13:38:09.58 ID:Ltl936Sg.net]
- WebフォントってDL待ちでむしろ遅いイメージしかないな…
- 513 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 16:21:02.28 ID:MoEwNeEz.net]
- 日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…
- 514 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 19:16:16.83 ID:2smzn43h.net]
- >>507
>>508 絵文字リガチャフォントだと高々100個くらいだから 日本語Webフォントの常識は当て嵌らんぞ
- 515 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 21:01:31.88 ID:1h0unusf.net]
- 推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、 正直これを選ぶメリットがある局面はすごく限られてる気しかしない。
- 516 名前:デフォルトの名無しさん mailto:sage [2019/07/04(木) 14:48:01.78 ID:nXaEmuLe.net]
- ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
https://www.iso.org/standard/73773.html いつの間にか完成していた。
- 517 名前:デフォルトの名無しさん mailto:sage [2019/07/05(金) 07:31:35.09 ID:CMdnJVDV.net]
- JISにも取り込まれるかな?
- 518 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 14:32:58.64 ID:q8HbeEfz.net]
- >>97
BCってなに?
- 519 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 23:51:11.25 ID:aHiS7zOG.net]
- ブラックキャップ
- 520 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 19:08:40.33 ID:Wy302ne8.net]
- まじめに答えてほしかった。。。
- 521 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 20:43:48.97 ID:tESkaNg7.net]
- ?
- 522 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 22:47:35.97 ID:0DH1k/wL.net]
- >>516
何これ?
- 523 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 01:25:41.28 ID:cxt0+A+5.net]
- ブラックキャップ
- 524 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 09:54:29.74 ID:N6Jg+9Qo.net]
- ワロタ
- 525 名前:デフォルトの名無しさん [2019/07/14(日) 22:04:02.29 ID:GSQZGuhE.net]
- >>513
>>97じゃないから確かなことは言えないけど 「better choice」じゃないかな? つまり絵文字を「入れざるを得ない」ってことね。
- 526 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 03:44:17.27 ID:GN7I2Kmp.net]
- 単に後方互換だろ…
- 527 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 04:14:22.81 ID:GXO+LVjR.net]
- BA-90使いたいのに斑の黄顔になるのはなんだかなー
- 528 名前:デフォルトの名無しさん mailto:sage [2019/07/16(火) 23:08:05.64 ID:6ZdisLnD.net]
- IC: 相互互換性
FC: 前方互換性 BC: 後方互換性 UC: 上位互換性 LC: 下位互換性 ちい覚えた
- 529 名前:デフォルトの名無しさん [2019/07/17(水) 11:56:39.82 ID:FD/sfaX1.net]
- LeftとかRightとかCorrectは無いんか
- 530 名前:デフォルトの名無しさん mailto:sage [2019/07/17(水) 16:54:36.95 ID:Lq1+nMLH.net]
- >>524
correctはともかく左右は確実にねーだろw
- 531 名前:デフォルトの名無しさん [2019/07/18(木) 14:33:21.11 ID:44Ax18Yo.net]
- 共産とりっけんと社民社と国民主と令和革命はLC互換
- 532 名前:デフォルトの名無しさん mailto:sage [2019/07/18(木) 23:12:28.17 ID:BkvY1rKv.net]
- >>526
わろたw
- 533 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 15:56:55.39 ID:vatz3/hX.net]
- https://github.com/qntm/base65536
↑Unicodeの基本多言語面を使ったエンコード方法w
- 534 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 17:04:19.76 ID:yKl7I/yp.net]
- 高度に発達したエンコードはMojibakeと見分けがつかない
- 535 名前:デフォルトの名無しさん mailto:sage [2019/07/24(水) 00:37:51.21 ID:ArGZw8p9.net]
- 基本多言語面って制御文字含んでるよね。
それbaseXXの
- 536 名前:{来の意味を成してないw []
- [ここ壊れてます]
- 537 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 16:07:01.10 ID:zqR8kD3Y.net]
- W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w https://www.w3.org/People/mimasa/xmldev.html.ja.sjis
- 538 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 17:27:15.46 ID:wpOWgZAQ.net]
- 読めるけど...?
- 539 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 23:04:31.46 ID:8LEpKI7v.net]
- ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ
- 540 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 01:20:35.42 ID:JKQq3Dbg.net]
- (´・・∀・・`)ほう
- 541 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 06:07:28.33 ID:xlQPwL5+.net]
- >>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。 最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。
- 542 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 07:31:42.15 ID:SJok1opV.net]
- >>535
Firefox68には文字コード指定が残ってる 通常は無効になってるけど>>531のリンク先を表示したときは有効になって ISO-2022-JPを指定すると文字化けなしで読めた
- 543 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 08:38:57.28 ID:xlQPwL5+.net]
- ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?
- 544 名前:デフォルトの名無しさん [2019/08/20(火) 11:37:07.61 ID:zlJnj2O9.net]
- >>531
これはひどいω
- 545 名前:デフォルトの名無しさん [2019/08/20(火) 11:39:07.12 ID:zlJnj2O9.net]
- >>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ
- 546 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 18:30:12.77 ID:Gkd3xMH4.net]
- なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。 記憶障害じゃなくてよかったw https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843
- 547 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:44:07.86 ID:Y189B2BT.net]
- HTMLをiso-2022-jpにするのって
どこの文化なんだろうか? Windowsはsjisだからありえないし Linuxも昔の普通はEUC-JPだろ? iso-2022-jpはメールにしか使われてなかったはずだが
- 548 名前:デフォルトの名無しさん [2019/08/20(火) 21:47:57.43 ID:UVunetX1.net]
- >>531
イシカワ マサヤスというのは誰だろうね。
- 549 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:51:25.41 ID:Y189B2BT.net]
- イシカワ マサヤスさんでは?
- 550 名前:デフォルトの名無しさん [2019/08/20(火) 21:52:36.86 ID:UVunetX1.net]
- 石川雅康と石川哲志は親族だろうか?
どちらもICT業界から去ったのかな。
- 551 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:54:13.55 ID:Y189B2BT.net]
- またつまらんものを
- 552 名前:デフォルトの名無しさん [2019/08/20(火) 21:58:33.22 ID:UVunetX1.net]
- XHTMLが終わってしまって、そのまま放置の石川さん。
- 553 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 22:46:49.05 ID:anpoimU7.net]
- >>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい ttp://www.tohoho-web.com/lng/199801/98011002.htm
- 554 名前:デフォルトの名無しさん [2019/08/20(火) 23:01:02.75 ID:UVunetX1.net]
- >>547
http://の先頭のhを取っても付けても同じですよ。
- 555 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 23:43:43.88 ID:Gkd3xMH4.net]
- > どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html えぇ……。
- 556 名前:デフォルトの名無しさん [2019/08/21(水) 00:08:09.19 ID:/FRdjxvW.net]
- 1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。
- 557 名前:デフォルトの名無しさん mailto:sage [2019/08/21(水) 02:35:13.27 ID:GZen3C6t.net]
- >>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか? > name="GENERATOR" content="Microsoft FrontPage 2.0" > というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。
- 558 名前:デフォルトの名無しさん [2019/08/21(水) 03:44:23.93 ID:jDiMObB6.net]
- >>540
流れは似てるが今回は指摘されてるURLが問題なんだろ よりによってアイツがってやつさ
- 559 名前:551 mailto:sage [2019/08/21(水) 05:07:33.18 ID:GZen3C6t.net]
- あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし >>531は単なる文字コード変換ミスかな? https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa
- 560 名前:デフォルトの名無しさん [2019/08/21(水) 14:49:37.63 ID:ur92HW83.net]
- 拡張子付け間違いか
- 561 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:16:14.71 ID:mlpPC2JR.net]
- ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。
- 562 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:36:57.94 ID:jM8tCXZ0.net]
- だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば iso-2022-jpが使えるテキストエディタで書いたか sjisに変換すべきところをiso-2022-jpに変換してしまったということ 昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話
- 563 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 08:04:31.58 ID:jlFkmCtz.net]
- jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで
- 564 名前:デフォルトの名無しさん [2019/08/22(木) 09:50:35.92 ID:xQsiKIbM.net]
- 鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る
- 565 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:23:09.36 ID:jM8tCXZ0.net]
- >>557
拡張子はjisじゃなくてsjisな だからドキュメントの文字コードが明らかに間違ってるんだよ
- 566 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:30:34.86 ID:jM8tCXZ0.net]
- 昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。 なぜならセキュリティというかサーバー運営者がよくわかっておらず 設定変更の必要性を理解できていなかったので設定されてなかった たとえ設定変更ができるサーバーでもユーザーが理解していなかった そんな時代だからブラウザで表示できれば良し程度のレベルが普通で 今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。 たぶんこんなところ
- 567 名前:デフォルトの名無しさん [2019/08/22(木) 10:33:49.69 ID:8JJS2LZD.net]
- >>559
お前のレスの >>556 には jis って書いてあるだろω お前が原因
- 568 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:35:00.76 ID:jM8tCXZ0.net]
- >>561
単なる書き間違えじゃね? リンク先見ればわかるでしょ
- 569 名前:デフォルトの名無しさん [2019/08/22(木) 10:38:26.99 ID:8JJS2LZD.net]
- >だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jis
こういうおっちょこちょいが >>531 みたいなミス連発するんだろうな
- 570 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 15:58:03.72 ID:mlpPC2JR.net]
- 皆さん落ち着いて
- 571 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:29:19.40 ID:bWgnQwQ7.net]
- なんでUTF8以外違法になった今そんな話してんだか・・・
- 572 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:59:07.09 ID:UifFOlyJ.net]
- × 違法 ○ 非推奨
- 573 名前:デフォルトの名無しさん mailto:sage [2019/08/24(土) 00:05:20.43 ID:Ka96Zrl8.net]
- 秘宝とか緋水晶とか何の話をしてるんだ?
- 574 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 20:34:39.12 ID:++G8a3I1.net]
- ムーンプリズムパワー!メイクアップ!
- 575 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:05:01.03 ID:E2o3oeEK.net]
- タリスマン
- 576 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:36:09.44 ID:heTmUHGD.net]
- クリマタスミ
- 577 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 13:35:52.48 ID:AiVdwxrR.net]
- ひまだ
- 578 名前:デフォルトの名無しさん [2019/08/28(水) 19:19:16.62 ID:lfvHhqTB.net]
- サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。
- 579 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 20:04:07.93 ID:FG4A80Dg.net]
- じっさい32じたいそんな使わないだろw
- 580 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:28:30.40 ID:VG5IecJ5.net]
- でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。
- 581 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:42:08.11 ID:y3rrvHgi.net]
- 読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている
- 582 名前:デフォルトの名無しさん [2019/08/29(木) 18:49:00.69 ID:1ks18uap.net]
- 内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利 あとはcps932が滅ぶのを待つだけ
- 583 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:05:33.35 ID:VG5IecJ5.net]
- OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。 でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。
- 584 名前:デフォルトの名無しさん [2019/08/29(木) 19:09:37.98 ID:CAV+1+Xc.net]
- という会話を何年も前にこのスレで観た
- 585 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:11:19.48 ID:YrWceYNE.net]
- 複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない
- 586 名前:デフォルトの名無しさん [2019/08/29(木) 20:02:33.30 ID:jljmwQsV.net]
- プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。
- 587 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 21:00:32.68 ID:FJllEP/G.net]
- 【名案】0〜9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021−65018=3」ってどう書くの?
https://togetter.com/li/1396827
- 588 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 22:50:02.31 ID:azXlKn0W.net]
- UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw
漢字1文字が最大8バイト、Unicodeの「IVS」とは? https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
- 589 名前:デフォルトの名無しさん [2019/08/29(木) 23:01:38.50 ID:jljmwQsV.net]
- UTF-8だけで必要十分という結論に到達せざるをえない現実
- 590 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 23:09:19.19 ID:azXlKn0W.net]
- 逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、 UTF-32でも不便になったからUTF-8でいいでしょ? どうせ単純には扱えずライブラリ使うしか無いんだから。 という必要十分な文字コードを捨てたというのが現実
- 591 名前:デフォルトの名無しさん [2019/08/29(木) 23:11:55.32 ID:jljmwQsV.net]
- 宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。
- 592 名前:デフォルトの名無しさん [2019/08/30(金) 00:11:25.73 ID:h/StilS8.net]
- 文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw
- 593 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:01:22.62 ID:LpXSw35l.net]
- UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは
- 594 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:29:38.44 ID:/ghu33Nb.net]
- >>586
ではどうぞ御説明をどうぞw
- 595 名前:デフォルトの名無しさん [2019/08/30(金) 13:00:23.27 ID:oVszNH41.net]
- >>579
codecvtは糞だ
- 596 名前:デフォルトの名無しさん [2019/08/30(金) 13:03:12.55 ID:oVszNH41.net]
- >>580
だった まあどっちでもいいけど
- 597 名前:デフォルトの名無しさん [2019/08/30(金) 15:32:59.58 ID:6uSriybI.net]
- >>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。
- 598 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 15:56:24.57 ID:iPGqG8dk.net]
- >>591
それぐらいみんな知ってる
- 599 名前:デフォルトの名無しさん [2019/08/30(金) 17:05:21.42 ID:GEn/r+mZ.net]
- >>592
それぐらいみんな知ってる
|

|