1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net] Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。 プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/ 文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/ 文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/ 文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/ 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
801 名前:デフォルトの名無しさん mailto:sage [2019/12/01(日) 17:27:44.79 ID:xqkDTdKR.net] いっそU+32FFと書いてほしい
802 名前:デフォルトの名無しさん [2019/12/03(火) 02:50:32.39 ID:TSc17kJh.net] 「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース 2019年12月2日 19時21分 https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html 「くずし字」解読は「文系」より「理系」向き!? 驚き! ラーメン判別の技を応用 AIの解読能力 高めるポイントは? 数億点もある難読資料 高まるAIへの期待 歴史資料の研究者からも期待の声
803 名前:デフォルトの名無しさん [2019/12/03(火) 12:56:42 ID:dBsSbed7.net] 可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字 データのやりとりやファイルサイズが小さくなるのは理解できるけれども。 でもそれは圧縮機構を別途に設けたのではだめなのか?
804 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 14:48:10.41 ID:32eP5DBa.net] 異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか
805 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:19:10.13 ID:9x1aaywv.net] 倍角、四倍角も入れて
806 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:35:57 ID:IUIY88nX.net] HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw
807 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 17:26:32 ID:Y2nmLwy/.net] Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき
808 名前:デフォルトの名無しさん [2019/12/04(水) 16:24:48 ID:IlQO2KEp.net] 黒板太字 - Wikipedia https://ja.wikipedia.org/wiki/黒板太字 とかはかなりスタイル要素入ってると思うな。 てか数学用分野だけやけに優遇されてない?
809 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 19:52:55.02 ID:sxQF45hm.net] 連続してないからあくまでも記号扱いなんだろうな。
810 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 20:23:19.21 ID:bwCWk38v.net] 発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
811 名前:デフォルトの名無しさん mailto:sage [2019/12/05(Thu) 15:53:38 ID:1Yvcqq3b.net] >>801 「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。 例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど, これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
812 名前:デフォルトの名無しさん [2019/12/05(木) 16:32:04.91 ID:IbmhSLeW.net] IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ
813 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 14:18:04 ID:CxS2VDwU.net] >>805 IMEってMS-IMEのこと? それともかな漢字変換全般?
814 名前:デフォルトの名無しさん [2019/12/06(金) 23:32:11.23 ID:Ob0T3VF2.net] SKK使ってるからだけどそんな印象は全く無い
815 名前:デフォルトの名無しさん mailto:sage [2019/12/10(火) 22:31:10.24 ID:zD6aLrgM.net] SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。
816 名前:デフォルトの名無しさん [2020/01/01(水) 02:03:31.89 ID:ZBRDXVGi.net] あけましておめでとう! 今年もこのスレの皆さんに多幸感がありますように!
817 名前:デフォルトの名無しさん [2020/01/01(水) 11:19:22.03 ID:tqBP4ADq.net] 字にはヒラギノ〜ル♪
818 名前:デフォルトの名無しさん [2020/01/01(水) 22:58:15.38 ID:fGGzsdYV.net] あけましておめでとうございます ISO/IEC 10646の新版は今年中に出るかな〜?
819 名前:デフォルトの名無しさん [2020/01/03(金) 06:32:52.61 ID:wMN1Z8Zd.net] Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。 まぁ、文字コードの問題ではないんだが。
820 名前:デフォルトの名無しさん [2020/01/03(金) 10:33:29.05 ID:lHIykz7y.net] 特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ
821 名前:デフォルトの名無しさん [2020/01/03(金) 22:33:53.11 ID:wMN1Z8Zd.net] >>813 レスありがとう。どのOSにもそういう仕組みはないと思う。 よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。 一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
822 名前:デフォルトの名無しさん [2020/01/07(火) 14:48:29.36 ID:lPDbYu1J.net] どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE https://gigazine.net/news/20200106-which-emoji-scissors-close/ 面白い
823 名前:デフォルトの名無しさん [2020/01/07(火) 15:01:40.99 ID:2Dq0zKSW.net] 左利き用のはさみも用意汁ωωω
824 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 15:12:21.25 ID:dfBogwvq.net] ちなみによく切れるはさみはここが曲線 https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
825 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 16:36:04.95 ID:g+gnVlWv.net] はさみディレクションセレクター
826 名前:デフォルトの名無しさん mailto:sage [2020/01/18(土) 12:49:25 ID:jQMC+jX5.net] ぷにコードに関するチラ裏 localghost👻ってかわいくね? →今まで危険そうで敬遠してたIDNに興味をもつ →WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる →エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる →正規化する必要のある文字がどんどんふえる →idn2とpythonのidnaってかなり違わくね?? <-イマココ idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
827 名前:デフォルトの名無しさん mailto:sage [2020/01/24(金) 09:35:27 ID:jBJ9cIqM.net] 6月のWG2は高松になったのか また国外から来にくそうな
828 名前:デフォルトの名無しさん mailto:sage [2020/01/26(日) 00:45:55.40 ID:C+NhYhXj.net] 道後温泉に行くか
829 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 14:46:03 ID:WswUNrPx.net] Unicode Emoji 13.0 - Now final for 2020 blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
830 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 16:08:26 ID:m1itn91m.net] 今更タピ岡かい
831 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 12:43:23.65 ID:G4fIlptF.net] Unicodeは完全にコンソーシアムのおもちゃになってんな
832 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 15:08:09 ID:OCbveUqO.net] タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。
833 名前:◆QZaw55cn4c mailto:sage [2020/01/31(金) 19:55:14 ID:tTpxWp9S.net] >>825 詰将棋用に上下逆の漢字を入れて欲しかった
834 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 22:55:44.99 ID:GHfVRZCY.net] G入れるのまじやめて
835 名前:デフォルトの名無しさん mailto:sage [2020/02/01(土) 00:49:18.17 ID:6vnUAWit.net] 要するに新種の漢字なんだな 国ごとに生活が違うから、結局何万種必要になる
836 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 00:50:49.11 ID:wzqxdRGo.net] 将棋の駒は多分誰も提案書を出さないせい
837 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:02:15 ID:0w4OLLiX.net] それ通ったらドンジャラ提案するわ
838 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:17:07.29 ID:Vi9q8JVy.net] 漢字の扱いは本当に難しい 手書きの分析しているソフトは本当に賢いと思うわ まああれは面倒な文字はそもそも判定せず、 主要な文字から似たものを選んでいるだけではあるが・・・
839 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 01:41:22 ID:qflv74w2.net] テスト٩( 'ω' )و
840 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 08:57:05 ID:uSBWqXrE.net] 825だが、将棋の駒がダメな理由は、>>469 にある通り、 > インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。 ということらしいが、なら、タピオカミルクティーにインラインテキスト中で 使われている用例があるのか、と言いたい。だから納得できない。
841 名前:デフォルトの名無しさん [2020/02/03(月) 11:59:58 ID:62FLJlST.net] 解説本だと普通に使われてるよな
842 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 13:40:49 ID:yHobSnyY.net] タピオカが使われているのかと誤読
843 名前:デフォルトの名無しさん [2020/02/03(月) 13:47:35 ID:62FLJlST.net] 読み手のリテラシーが問われます
844 名前:デフォルトの名無しさん [2020/02/03(月) 13:54:08 ID:eKPmxfCz.net] 天使を天便と読み取ったまま放置するとか割とマジ。
845 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:56:08 ID:KZTuy2Ys.net] 架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。
846 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:59:18 ID:wgq762c2.net] 漢字以前の象形文字モドキの再発明だからなぁ 取捨選択もなく全然洗練されないまま数だけ増えてる
847 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 23:33:42 ID:s4V/Vj8i.net] そのうち抽象化が進んでいくのか
848 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:26:51.57 ID:gTERf/2s.net] 政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ
849 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:28:31.24 ID:c6iCZcrL.net] コーヒー、お茶、タクシー、台風もほしい
850 名前:デフォルトの名無しさん [2020/02/04(火) 20:12:02 ID:U7azh68T.net] >>841 政治的に正しい仏教徒とは何ですかね? アホな創価学会員が言いそうな発言ですが。
851 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 21:29:49 ID:t1/0lpTx.net] 絵文字ってここにどう書き込めばいいんです? ☸️ ↓ ☸ 専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆
852 名前:態でうまく表示されない… [] [ここ壊れてます]
853 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 08:47:40.80 ID:fZOBAWLP.net] >>842 全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
854 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:08:51 ID:So1jciyU.net] 🍵 you know me.
855 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:23:19.19 ID:MS9bo9CR.net] 固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか? Unicode前提です Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが 結局のところ使用されているフォントで決まるような気がします となるとCLIアプリが表示する前に判別する方法はないような 表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
856 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:24:42 ID:MS9bo9CR.net] 固定フォントじゃなくて等幅フォントでした
857 名前:デフォルトの名無しさん [2020/02/05(水) 16:23:36 ID:2rKdW1Ec.net] てすと ☸
858 名前:デフォルトの名無しさん [2020/02/05(水) 16:24:56 ID:2rKdW1Ec.net] >>844 うちのChromeはちゃんと出てる ffでも問題なし
859 名前:デフォルトの名無しさん [2020/02/05(水) 16:28:36 ID:2rKdW1Ec.net] >>847 前にpythonで書いたときは unicodedata.east_asian_width() 使ったと思う Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う
860 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 16:30:38 ID:So1jciyU.net] ☸ 法輪ラブ ☸
861 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 18:34:07 ID:qBm/0cTb.net] >>847 ・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている ・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1 ・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない ・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる) ・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない ・linuxカーネルでは全ての文字が(全角も)幅1扱い ・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる ・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる ・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる ・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認) ・↑により、文字が重なったり変な隙間ができたりすることがある ・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか) ・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない ・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい) ・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる ・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
862 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 20:43:09 ID:f5dE3Mu+.net] >>853 詳しい解説サンクス
863 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 23:12:39 ID:zWcxLf4u.net] >>853 あざす やっぱり混沌としてるのですね とりあえず一度ターミナルの中を追ってみようかな
864 名前:デフォルトの名無しさん mailto:sage [2020/02/06(Thu) 00:00:39 ID:SQAVqXtr.net] >>844うちでも見れた
865 名前:デフォルトの名無しさん mailto:sage [2020/02/07(金) 22:23:32 ID:DCA95dh2.net] 継ぎ接ぎだらけの一貫してない仕様だからな
866 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:47:47 ID:hv0txQ7A.net] Unicodeの時代に今更だけど、 シフトJISの第2バイトがA0〜FFでなく 40〜FCにしたのは何でだろう
867 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:48:29 ID:hv0txQ7A.net] 訂正 ×A0〜FF 〇80〜FF
868 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 18:36:07.73 ID:zjMP9HD4.net] JISの区点は1区あたり94点 0x40開始で0x7Fを避けて2区分取ると0xFCになる
869 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 12:59:57 ID:tCetl5aZ.net] やっぱ漢字1文字は2バイトの方がいい
870 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 15:51:09 ID:gml78nRc.net] >>858 半角カナのせいで80〜FFでは足りないから
871 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:30:21 ID:tCetl5aZ.net] シフトJISはもう少し工夫すれば JISコードの変換式もより簡単にでき 2バイト目もASCII領域を使わずにダメ文字も発生せず 補助漢字も全て入れられた
872 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:32:13 ID:tCetl5aZ.net] 補助漢字は半角カナと排他だけど
873 名前:デフォルトの名無しさん [2020/02/10(月) 16:27:01 ID:TGcYvj29.net] EUCで良かったんよ
874 名前:デフォルトの名無しさん mailto:sage [2020/02/10(月) 19:14:50 ID:hRmPfOYI.net] EUCだと半角カナも補助漢字もバイト数が増えるからな...
875 名前: mailto:sage [2020/02/10(月) 21:20:39.00 ID:3bnN/FFY.net] >>863 あのスペースの狭さでは、それは無理だったのでは? どうするのがよかったのですか?具体的にいってみてよ
876 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 08:36:25.76 ID:K5Jxm44G.net] 非漢字_:[81-98] [80-9F] 第1水準:[80-9F] [A1-FE] 第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F] 補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F] 補助漢字は半角カナと排他利用
877 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 17:40:51 ID:Sh/x76Zj.net] >>868 それは結局半角カナを潰しただけのことでは?
878 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 18:51:44 ID:K5Jxm44G.net] >>869 補助漢字6000字近くを使えるというメリットがあれば 半角カナをフェードアウトするには十分な機会になっただろう 補助漢字(JIS X 0212)が制定されたのは1990年だから その翌年の1991年に発売されたMS-DOS 5.0あたりで KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば 従来のテキストファイルの読み込みなども対応できる
879 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 19:27:04 ID:Sh/x76Zj.net] >>870 文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね
880 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 01:19:59.31 ID:l8Pmdafn.net] いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる
881 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 02:15:22.28 ID:H21UjGBC.net] なくならない 合成文字はなくせない
882 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 05:02:58 ID:K3E1Z6OS.net] >>871 コンテンツ側でなくユーザー側
883 名前:デフォルトの名無しさん [2020/02/12(水) 10:06:52 ID:a1w2Xqz0.net] 1文字=64bitやろ
884 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:30:20 ID:KzEjZzkq.net] >>875 イングランドの旗はUnicodeで7コードポイント必要なので64bitでは無理 128bitで
885 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:32:59.34 ID:yKNbCROk.net] 👽 全宇宙の未知なる知的生命体の使用言語を網羅しなきゃならないのだから可変長は必須
886 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 20:36:54 ID:ytylQgpT.net] >>876 え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの
887 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 21:06:37.28 ID:Kml/rCmZ.net] >>878 がおもしろいことを言った
888 名前:デフォルトの名無しさん mailto:sage [2020/02/13(木) 15:10:18.42 ID:Xqo24CtP.net] ウェールズ「俺は?」
889 名前:デフォルトの名無しさん mailto:sage [2020/02/13(Thu) 21:26:26 ID:KYt0SeFn.net] Google、絵文字を組み合わせた「ハート付きうんち」などを使える「Emoji Kitchen」開始 https://www.itmedia.co.jp/news/articles/2002/13/news068.html
890 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 11:14:07.77 ID:SoYJxWJg.net] そんな文字要らんわ
891 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 13:42:19 ID:4TN7y+1I.net] グーグルってしょっちゅう意味のわからんことするよな
892 名前:デフォルトの名無しさん [2020/02/14(金) 14:22:25 ID:WtuYdkw5.net] MSやAppleだって訳判らんことするときもある
893 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 14:26:10 ID:MCgyW5To.net] 実行ファイルがテキストとデータで構成されるように、絵文字表現もテキストとデータを組み合わせた文法が出てきそう。
894 名前:デフォルトの名無しさん [2020/02/14(金) 17:14:21 ID:CPLKNT1n.net] 顔文字より正規表現のためのメタ文字とかあったほうが良いのにね。 まあGoogleじゃ無理か。
895 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 21:11:02 ID:qxpoECq4.net] (.*_*)
896 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 22:37:55 ID:cKxgCMj+.net] そのメタ文字にマッチしたい正規表現を書く日が来るぞ
897 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 00:14:12 ID:W/mb2gir.net] \
898 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 05:28:54.23 ID:uhBKJdO0.net] 規格名:JIS X 0215 文字数:15000字超(非漢字:1700字超,漢字:13300字超) 区点域:0〜127区,0〜127点(最大16384字収納) 通 称:いちごJIS
899 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 14:33:03 ID:MAyK0RyJ.net] https://twitter.com/akinomyoga/status/1230127240806985728 修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。 何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ https://gitlab.freedesktop.org/terminal-wg/specifications/issues/9#note_406682 因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。 曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか… https://github.com/microsoft/terminal/issues/4345#issuecomment-578434025 (deleted an unsolicited ad)
900 名前:デフォルトの名無しさん [2020/02/21(金) 15:07:53.93 ID:5cQWFY2c.net] 糸 色 女 子 言 周