- 1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
- Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/ 文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/ 文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/ 文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/ 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
- 787 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:43:02.24 ID:iwyjZSbL.net]
- 質問じゃなくて、馬鹿にしてるんだろ
え?それ面白くないよ?面白いと思ってんの?プークスクス という意味
- 788 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:53:04.27 ID:6n0WdTOH.net]
- >>780
違うと思う QZは韓国人だから答えられないんでしょ
- 789 名前: mailto:sage [2019/11/24(日) 13:04:27.62 ID:oHJXyQoT.net]
- >>779
>「なぜその質問をしたいと思ったのですか」 いやはや、私のパターンを熟知されているようでなにより、です、ちょっとうれしくなりました
- 790 名前: mailto:sage [2019/11/24(日) 13:05:00.77 ID:oHJXyQoT.net]
- >>781
なぜ韓国人だとおもったのですか?
- 791 名前: mailto:sage [2019/11/24(日) 13:09:00.29 ID:oHJXyQoT.net]
- >>779
https://medaka.5ch.net/test/read.cgi/eco/1567773760/710 https://medaka.5ch.net/test/read.cgi/eco/1567773760/712 https://medaka.5ch.net/test/read.cgi/eco/1567773760/714
- 792 名前:デフォルトの名無しさん [2019/11/24(日) 13:13:33.28 ID:BlMs70wA.net]
- 憲法9条を改正するだけじゃダメなのよ。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。
- 793 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 15:33:55.44 ID:EdYAI6jd.net]
- >>762
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ
- 794 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 17:10:15.65 ID:5wTOyTy7.net]
- >>779
竹島は日本の領土で、独島は韓国の領土だよ なぜか韓国は竹島のことを独島だと言い張ってるけど 独島は別の島ですから、残念
- 795 名前:デフォルトの名無しさん mailto:sage [2019/11/25(月) 15:25:07.92 ID:s1hiXzdE.net]
- >>787
おっとそれ以上言っちゃあいけない
- 796 名前:デフォルトの名無しさん [2019/11/30(土) 13:54:16.72 ID:eovy2x2M.net]
- 【びっくりサイエンス】 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝
https://special.sankei.com/a/life/article/20191130/0001.html 2019.11.30
- 797 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 15:03:21.41 ID:dLS32wGr.net]
- 別に「びっくり」ではないなw
- 798 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:10:49.04 ID:OkgV2S2L.net]
- それ言ったらドンキーにも延焼する
- 799 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:25:08.69 ID:mO6/udRn.net]
- ドンキーほうけーい
- 800 名前:デフォルトの名無しさん [2019/12/01(日) 17:02:36.55 ID:zxgavQqm.net]
- 今年の漢字は天
- 801 名前:デフォルトの名無しさん mailto:sage [2019/12/01(日) 17:27:44.79 ID:xqkDTdKR.net]
- いっそU+32FFと書いてほしい
- 802 名前:デフォルトの名無しさん [2019/12/03(火) 02:50:32.39 ID:TSc17kJh.net]
- 「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース
2019年12月2日 19時21分 https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html 「くずし字」解読は「文系」より「理系」向き!? 驚き! ラーメン判別の技を応用 AIの解読能力 高めるポイントは? 数億点もある難読資料 高まるAIへの期待 歴史資料の研究者からも期待の声
- 803 名前:デフォルトの名無しさん [2019/12/03(火) 12:56:42 ID:dBsSbed7.net]
- 可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。 でもそれは圧縮機構を別途に設けたのではだめなのか?
- 804 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 14:48:10.41 ID:32eP5DBa.net]
- 異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか
- 805 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:19:10.13 ID:9x1aaywv.net]
- 倍角、四倍角も入れて
- 806 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:35:57 ID:IUIY88nX.net]
- HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw
- 807 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 17:26:32 ID:Y2nmLwy/.net]
- Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき
- 808 名前:デフォルトの名無しさん [2019/12/04(水) 16:24:48 ID:IlQO2KEp.net]
- 黒板太字 - Wikipedia
https://ja.wikipedia.org/wiki/黒板太字 とかはかなりスタイル要素入ってると思うな。 てか数学用分野だけやけに優遇されてない?
- 809 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 19:52:55.02 ID:sxQF45hm.net]
- 連続してないからあくまでも記号扱いなんだろうな。
- 810 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 20:23:19.21 ID:bwCWk38v.net]
- 発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
- 811 名前:デフォルトの名無しさん mailto:sage [2019/12/05(Thu) 15:53:38 ID:1Yvcqq3b.net]
- >>801
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。 例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど, これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
- 812 名前:デフォルトの名無しさん [2019/12/05(木) 16:32:04.91 ID:IbmhSLeW.net]
- IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ
- 813 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 14:18:04 ID:CxS2VDwU.net]
- >>805
IMEってMS-IMEのこと? それともかな漢字変換全般?
- 814 名前:デフォルトの名無しさん [2019/12/06(金) 23:32:11.23 ID:Ob0T3VF2.net]
- SKK使ってるからだけどそんな印象は全く無い
- 815 名前:デフォルトの名無しさん mailto:sage [2019/12/10(火) 22:31:10.24 ID:zD6aLrgM.net]
- SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。
- 816 名前:デフォルトの名無しさん [2020/01/01(水) 02:03:31.89 ID:ZBRDXVGi.net]
- あけましておめでとう!
今年もこのスレの皆さんに多幸感がありますように!
- 817 名前:デフォルトの名無しさん [2020/01/01(水) 11:19:22.03 ID:tqBP4ADq.net]
- 字にはヒラギノ〜ル♪
- 818 名前:デフォルトの名無しさん [2020/01/01(水) 22:58:15.38 ID:fGGzsdYV.net]
- あけましておめでとうございます
ISO/IEC 10646の新版は今年中に出るかな〜?
- 819 名前:デフォルトの名無しさん [2020/01/03(金) 06:32:52.61 ID:wMN1Z8Zd.net]
- Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。
まぁ、文字コードの問題ではないんだが。
- 820 名前:デフォルトの名無しさん [2020/01/03(金) 10:33:29.05 ID:lHIykz7y.net]
- 特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ
- 821 名前:デフォルトの名無しさん [2020/01/03(金) 22:33:53.11 ID:wMN1Z8Zd.net]
- >>813
レスありがとう。どのOSにもそういう仕組みはないと思う。 よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。 一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
- 822 名前:デフォルトの名無しさん [2020/01/07(火) 14:48:29.36 ID:lPDbYu1J.net]
- どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE
https://gigazine.net/news/20200106-which-emoji-scissors-close/ 面白い
- 823 名前:デフォルトの名無しさん [2020/01/07(火) 15:01:40.99 ID:2Dq0zKSW.net]
- 左利き用のはさみも用意汁ωωω
- 824 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 15:12:21.25 ID:dfBogwvq.net]
- ちなみによく切れるはさみはここが曲線
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
- 825 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 16:36:04.95 ID:g+gnVlWv.net]
- はさみディレクションセレクター
- 826 名前:デフォルトの名無しさん mailto:sage [2020/01/18(土) 12:49:25 ID:jQMC+jX5.net]
- ぷにコードに関するチラ裏
localghost👻ってかわいくね? →今まで危険そうで敬遠してたIDNに興味をもつ →WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる →エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる →正規化する必要のある文字がどんどんふえる →idn2とpythonのidnaってかなり違わくね?? <-イマココ idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
- 827 名前:デフォルトの名無しさん mailto:sage [2020/01/24(金) 09:35:27 ID:jBJ9cIqM.net]
- 6月のWG2は高松になったのか
また国外から来にくそうな
- 828 名前:デフォルトの名無しさん mailto:sage [2020/01/26(日) 00:45:55.40 ID:C+NhYhXj.net]
- 道後温泉に行くか
- 829 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 14:46:03 ID:WswUNrPx.net]
- Unicode Emoji 13.0 - Now final for 2020
blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
- 830 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 16:08:26 ID:m1itn91m.net]
- 今更タピ岡かい
- 831 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 12:43:23.65 ID:G4fIlptF.net]
- Unicodeは完全にコンソーシアムのおもちゃになってんな
- 832 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 15:08:09 ID:OCbveUqO.net]
- タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。
- 833 名前:◆QZaw55cn4c mailto:sage [2020/01/31(金) 19:55:14 ID:tTpxWp9S.net]
- >>825
詰将棋用に上下逆の漢字を入れて欲しかった
- 834 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 22:55:44.99 ID:GHfVRZCY.net]
- G入れるのまじやめて
- 835 名前:デフォルトの名無しさん mailto:sage [2020/02/01(土) 00:49:18.17 ID:6vnUAWit.net]
- 要するに新種の漢字なんだな
国ごとに生活が違うから、結局何万種必要になる
- 836 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 00:50:49.11 ID:wzqxdRGo.net]
- 将棋の駒は多分誰も提案書を出さないせい
- 837 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:02:15 ID:0w4OLLiX.net]
- それ通ったらドンジャラ提案するわ
- 838 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:17:07.29 ID:Vi9q8JVy.net]
- 漢字の扱いは本当に難しい
手書きの分析しているソフトは本当に賢いと思うわ まああれは面倒な文字はそもそも判定せず、 主要な文字から似たものを選んでいるだけではあるが・・・
- 839 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 01:41:22 ID:qflv74w2.net]
- テスト٩( 'ω' )و
- 840 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 08:57:05 ID:uSBWqXrE.net]
- 825だが、将棋の駒がダメな理由は、>>469 にある通り、
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。 ということらしいが、なら、タピオカミルクティーにインラインテキスト中で 使われている用例があるのか、と言いたい。だから納得できない。
- 841 名前:デフォルトの名無しさん [2020/02/03(月) 11:59:58 ID:62FLJlST.net]
- 解説本だと普通に使われてるよな
- 842 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 13:40:49 ID:yHobSnyY.net]
- タピオカが使われているのかと誤読
- 843 名前:デフォルトの名無しさん [2020/02/03(月) 13:47:35 ID:62FLJlST.net]
- 読み手のリテラシーが問われます
- 844 名前:デフォルトの名無しさん [2020/02/03(月) 13:54:08 ID:eKPmxfCz.net]
- 天使を天便と読み取ったまま放置するとか割とマジ。
- 845 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:56:08 ID:KZTuy2Ys.net]
- 架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。
- 846 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:59:18 ID:wgq762c2.net]
- 漢字以前の象形文字モドキの再発明だからなぁ
取捨選択もなく全然洗練されないまま数だけ増えてる
- 847 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 23:33:42 ID:s4V/Vj8i.net]
- そのうち抽象化が進んでいくのか
- 848 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:26:51.57 ID:gTERf/2s.net]
- 政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ
- 849 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:28:31.24 ID:c6iCZcrL.net]
- コーヒー、お茶、タクシー、台風もほしい
- 850 名前:デフォルトの名無しさん [2020/02/04(火) 20:12:02 ID:U7azh68T.net]
- >>841
政治的に正しい仏教徒とは何ですかね? アホな創価学会員が言いそうな発言ですが。
- 851 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 21:29:49 ID:t1/0lpTx.net]
- 絵文字ってここにどう書き込めばいいんです?
☸️ ↓ ☸ 専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆
- 852 名前:態でうまく表示されない… []
- [ここ壊れてます]
- 853 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 08:47:40.80 ID:fZOBAWLP.net]
- >>842
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
- 854 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:08:51 ID:So1jciyU.net]
- 🍵 you know me.
- 855 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:23:19.19 ID:MS9bo9CR.net]
- 固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが 結局のところ使用されているフォントで決まるような気がします となるとCLIアプリが表示する前に判別する方法はないような 表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
- 856 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:24:42 ID:MS9bo9CR.net]
- 固定フォントじゃなくて等幅フォントでした
- 857 名前:デフォルトの名無しさん [2020/02/05(水) 16:23:36 ID:2rKdW1Ec.net]
- てすと
☸
- 858 名前:デフォルトの名無しさん [2020/02/05(水) 16:24:56 ID:2rKdW1Ec.net]
- >>844
うちのChromeはちゃんと出てる ffでも問題なし
- 859 名前:デフォルトの名無しさん [2020/02/05(水) 16:28:36 ID:2rKdW1Ec.net]
- >>847
前にpythonで書いたときは unicodedata.east_asian_width() 使ったと思う Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う
- 860 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 16:30:38 ID:So1jciyU.net]
- ☸ 法輪ラブ ☸
- 861 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 18:34:07 ID:qBm/0cTb.net]
- >>847
・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている ・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1 ・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない ・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる) ・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない ・linuxカーネルでは全ての文字が(全角も)幅1扱い ・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる ・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる ・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる ・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認) ・↑により、文字が重なったり変な隙間ができたりすることがある ・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか) ・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない ・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい) ・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる ・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
- 862 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 20:43:09 ID:f5dE3Mu+.net]
- >>853
詳しい解説サンクス
- 863 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 23:12:39 ID:zWcxLf4u.net]
- >>853
あざす やっぱり混沌としてるのですね とりあえず一度ターミナルの中を追ってみようかな
- 864 名前:デフォルトの名無しさん mailto:sage [2020/02/06(Thu) 00:00:39 ID:SQAVqXtr.net]
- >>844うちでも見れた
- 865 名前:デフォルトの名無しさん mailto:sage [2020/02/07(金) 22:23:32 ID:DCA95dh2.net]
- 継ぎ接ぎだらけの一貫してない仕様だからな
- 866 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:47:47 ID:hv0txQ7A.net]
- Unicodeの時代に今更だけど、
シフトJISの第2バイトがA0〜FFでなく 40〜FCにしたのは何でだろう
- 867 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:48:29 ID:hv0txQ7A.net]
- 訂正
×A0〜FF 〇80〜FF
- 868 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 18:36:07.73 ID:zjMP9HD4.net]
- JISの区点は1区あたり94点
0x40開始で0x7Fを避けて2区分取ると0xFCになる
- 869 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 12:59:57 ID:tCetl5aZ.net]
- やっぱ漢字1文字は2バイトの方がいい
- 870 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 15:51:09 ID:gml78nRc.net]
- >>858
半角カナのせいで80〜FFでは足りないから
- 871 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:30:21 ID:tCetl5aZ.net]
- シフトJISはもう少し工夫すれば
JISコードの変換式もより簡単にでき 2バイト目もASCII領域を使わずにダメ文字も発生せず 補助漢字も全て入れられた
- 872 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:32:13 ID:tCetl5aZ.net]
- 補助漢字は半角カナと排他だけど
- 873 名前:デフォルトの名無しさん [2020/02/10(月) 16:27:01 ID:TGcYvj29.net]
- EUCで良かったんよ
- 874 名前:デフォルトの名無しさん mailto:sage [2020/02/10(月) 19:14:50 ID:hRmPfOYI.net]
- EUCだと半角カナも補助漢字もバイト数が増えるからな...
- 875 名前: mailto:sage [2020/02/10(月) 21:20:39.00 ID:3bnN/FFY.net]
- >>863
あのスペースの狭さでは、それは無理だったのでは? どうするのがよかったのですか?具体的にいってみてよ
- 876 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 08:36:25.76 ID:K5Jxm44G.net]
- 非漢字_:[81-98] [80-9F]
第1水準:[80-9F] [A1-FE] 第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F] 補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F] 補助漢字は半角カナと排他利用
- 877 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 17:40:51 ID:Sh/x76Zj.net]
- >>868
それは結局半角カナを潰しただけのことでは?
- 878 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 18:51:44 ID:K5Jxm44G.net]
- >>869
補助漢字6000字近くを使えるというメリットがあれば 半角カナをフェードアウトするには十分な機会になっただろう 補助漢字(JIS X 0212)が制定されたのは1990年だから その翌年の1991年に発売されたMS-DOS 5.0あたりで KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば 従来のテキストファイルの読み込みなども対応できる
- 879 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 19:27:04 ID:Sh/x76Zj.net]
- >>870
文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね
- 880 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 01:19:59.31 ID:l8Pmdafn.net]
- いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる
- 881 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 02:15:22.28 ID:H21UjGBC.net]
- なくならない
合成文字はなくせない
- 882 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 05:02:58 ID:K3E1Z6OS.net]
- >>871
コンテンツ側でなくユーザー側
- 883 名前:デフォルトの名無しさん [2020/02/12(水) 10:06:52 ID:a1w2Xqz0.net]
- 1文字=64bitやろ
- 884 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:30:20 ID:KzEjZzkq.net]
- >>875
イングランドの旗はUnicodeで7コードポイント必要なので64bitでは無理 128bitで
- 885 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:32:59.34 ID:yKNbCROk.net]
- 👽 全宇宙の未知なる知的生命体の使用言語を網羅しなきゃならないのだから可変長は必須
- 886 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 20:36:54 ID:ytylQgpT.net]
- >>876
え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの
- 887 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 21:06:37.28 ID:Kml/rCmZ.net]
- >>878がおもしろいことを言った
|

|