[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/02 16:40 / Filesize : 221 KB / Number-of Response : 1012
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ Part12



1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/

725 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 17:29:35.02 ID:mthfJT/n.net]
なんかUnicodeのサイト分裂した?

726 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 18:37:57.14 ID:FCkKS+Hu.net]
青っぽいデザイン変更で入口が使いにくくなってる辺り?

727 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 00:29:12.62 ID:DVVulqOc.net]
なにそれこわい

728 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 16:20:42.34 ID:A7Naqht0.net]
https://home.unicode.org/#
これやな。
なんか謎の意匠がw

729 名前:デフォルトの名無しさん mailto:sage [2019/11/01(金) 01:07:36.40 ID:iOCNEHbC.net]
結局見つかったのは何なの

730 名前:デフォルトの名無しさん mailto:sage [2019/11/01(金) 01:07:53.40 ID:iOCNEHbC.net]
書くとこ間違えた失礼

731 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 19:48:26.91 ID:CD4iEOnB.net]
文を書くときに?や()などの半角にも全角にもある文字はどっちを使うべきなのか迷う。
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか

732 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 21:21:21.06 ID:NIGKt6uf.net]
特に拘りが無いならNFKCに倣う

733 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 23:13:58.98 ID:csRpQu7P.net]
JIS X 0208 を 0201 のスーパーセットにしなかったのが諸悪の根源



734 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 23:28:13.72 ID:69Rrw1ZJ.net]
そもそも世界中の文字を一つの体系で包括できると考えたりしたのが…ブツブツ

735 名前:デフォルトの名無しさん mailto:sage [2019/11/16(土) 09:13:00.94 ID:0g4G1zYO.net]
サル共がコンピュータを使わなければ面倒がないのに
とか思われてるよ

736 名前:デフォルトの名無しさん [2019/11/16(土) 10:56:43.05 ID:t6zcY+AG.net]
ASCII に含まれてる記号は半角で入力してる
っていうか IME で半角優先にしてるのでそっちばっかりになる
IME ON の状態であってもスペースももちろん半角だ

737 名前:デフォルトの名無しさん mailto:sage [2019/11/17(日) 00:12:46.29 ID:ZZ8XSzBD.net]
チルダとかハイフンマイナス、引用符あたりは迷う。
これらは単に全角と半角の関係ではないんじゃないかという気がする。

738 名前:デフォルトの名無しさん [2019/11/19(火) 22:24:19.13 ID:lA4rVXxm.net]
0-9A-Za-z は半角だけどその他はちょっと迷うかな
! や ? は書いてるのが日本語漢字仮名交じり文なら全角にするかも

739 名前:デフォルトの名無しさん [2019/11/20(水) 09:53:23.76 ID:grCkJCm3.net]
公文書の「,」なぜ? 半世紀以上、見直し検討
2019 11 18
https://www.sankei.com/life/news/191118/lif1911180006-n1.html

740 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 16:10:59.78 ID:0qs1xY5M.net]
俺は「,」のほうが寧ろ収まりがいいように見えるけどな。
感性で判断するんじゃなくて,論理的根拠をもって「,」か「、」かを決めるべきよね。

741 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 18:03:44.71 ID:oVdD3irj.net]
日本語の文章は分かち書きをするわけではないから、
点があるのにコンマのような後ろにスペースを要する記号を使うのはおかしいと思う。
丸の代わりにピリオドを使うのも同じ。

それにしても、公文書の混ぜこぜの用法はどっちつかずだよな。
もともと、和文タイプライターで使われていた用法なのではないか?

742 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 18:06:42.91 ID:oVdD3irj.net]
使ったこと無いからわからなかったが、全角コンマなんてのがあるんだな。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。

743 名前:デフォルトの名無しさん [2019/11/21(木) 19:11:00.69 ID:wlMAy4t9.net]
>>733
フォント次第ながらも「,」は半角カンマ「,」と一目で見分けることができない。
一方「、」は全角しかない。よって誤植の起きにくい「、」で統一するべき。



744 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:10:52.53 ID:cn6yPDJX.net]
>>736
半角の、だってあるだろ
AAとかでよく使われる

745 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:14:37.01 ID:gyc1+QC+.net]
見分けられないで言い切られたらコーヒー噴くしかない

746 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:51:21.49 ID:HJrbCtCI.net]
文字コードスレなのにいまだに「全角」とか言う奴いるんだな

747 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 22:11:40.82 ID:Ht1weGMK.net]
ここまで無知だと辛いどころか辛さも感じないほどにアホなんだろうな
739は

748 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 22:27:48.86 ID:T5O6V3Nl.net]
カッコは半角と全角でベースラインが違うフォントも少なくないんで
囲う文字に合わせてる

749 名前:デフォルトの名無しさん [2019/11/22(金) 00:27:47.62 ID:5/IABJQJ.net]
そもそも日本語は句読点は使っていなくて使われ始めたのが
欧米のカンマやピリオドの影響で明治後期くらいからだからな

750 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 01:42:56 ID:1ACgXjue.net]
FULLWIDTHとか出てくるのを全角以外にどう呼べと

751 名前:デフォルトの名無しさん [2019/11/22(金) 01:49:03 ID:VSWkIrxm.net]
句点の代わりに「候(そうろう)」を使ってたんでしょ、昔の人は。

752 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 02:26:32 ID:7JxndsMv.net]
日本はもともと縦書きで「,」なんて使ってなかっただろ?
縦書きでどの位置に「,」を打てばいいのよ?

753 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 03:23:33 ID:QBgvTUOv.net]
縦書きは、を使って横書きは,を使えばいいじゃん
なんで臨機応変に対応できないんだろう?



754 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 03:31:46.87 ID:7JxndsMv.net]
臨機応変に縦書きと横書きを変換するからだよ
ウェブ上では横書き、本にしたら縦書きとかな

755 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 15:56:12.49 ID:WtZSxTNA.net]
漢文で書かれた本の中には、句点は、文字の横に○をつけていたものがる。
江戸時代のくずし字でかられた読み本は、句読点なし。読む人が判断することになっている。

756 名前:デフォルトの名無しさん [2019/11/22(金) 18:59:44.59 ID:VSWkIrxm.net]
教科書フォントに慣れ切って高卒レベルの古典教養しかない現代人は「くずし字」の原書をほとんど読めない問題。

757 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 19:10:33.77 ID:+ybPmekP.net]
筆で書かないと身につかんよ

758 名前:デフォルトの名無しさん [2019/11/22(金) 19:31:16.58 ID:VSWkIrxm.net]
中学高校の古典の授業で、原書を写真印刷した文書を読ませる機会を与えるべきだろう。
活字慣れした現代人は太平洋戦争中の日記や戦場から送られてきた手紙さえ読めない。

759 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 20:55:41.01 ID:QBgvTUOv.net]
厨二満載の文集が他人に読まれなくなる日も近いんだな
よかったワープロが普及する前で

760 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 21:23:42.16 ID:SnsQ0S1X.net]
アメリカでも筆記体が廃れつつあるんじゃなかったか
せいぜいサインする時に使うくらい

761 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 22:42:29.42 ID:+ybPmekP.net]
ラテン文字は筆を選ばないでも問題無いが
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道

762 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 23:50:42.29 ID:1ACgXjue.net]
墨汁ドバー

763 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 09:52:15.28 ID:StIP5iHr.net]
ん? 江戸時代から句読点はあったよ。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。



764 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 10:17:05.69 ID:LEhIlmd1.net]
>>756
一般に使われ出したのは明治でしょ

765 名前:デフォルトの名無しさん [2019/11/23(土) 10:53:20.31 ID:cBKKqL2b.net]
>>749-750
今年の漢字の季節ですね

766 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 14:16:40.50 ID:SCQQhBmf.net]
風か水かって感じかなあ
災とかはこの前使ったよね

767 名前:デフォルトの名無しさん [2019/11/23(土) 14:20:31.57 ID:Lev/ciM6.net]
金とか何回か選ばれてるのはあるな
二年連続とかは知らん

768 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 15:30:58.21 ID:OKqvuGhi.net]


769 名前:デフォルトの名無しさん [2019/11/23(土) 16:40:21.39 ID:l4WHmfnE.net]
もうそろそろコンピュータの世界では
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?

770 名前: mailto:sage [2019/11/23(土) 16:48:42.87 ID:bse8qODO.net]
>>762
ascii 的な世界(合衆国界隈とか)が発狂するので、utf-8 がつくられたのだと思います
まあコード内では utf-32 で統一するのがスマートですね

771 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 17:45:30.08 ID:ExB3uxT/.net]
C言語がASCII前提としていたので、
UTF16やUTF32では互換性を保てなかったのが理由

772 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:02:19.00 ID:UeuUKNdC.net]
32bitで足りるんか?

773 名前:デフォルトの名無しさん [2019/11/23(土) 18:05:22.65 ID:Lev/ciM6.net]
今のところ32bitっつってもスカスカだろ



774 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:45:44.31 ID:KvoIJqUR.net]
文字が4億も存在するんかいな。

775 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:46:53.89 ID:k/QFWxVo.net]
じゃけん戸籍に登録されてる異字体全部収録しましょうね〜(鬼畜)

776 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:51:31.87 ID:KvoIJqUR.net]
旧字体はIPAがマップしたんじゃなかったっけ?

777 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 20:53:37.67 ID:x1VOKq1M.net]
固定長好きな人が定期的に出てくるのはなんでなの?

セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに

778 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 21:03:09.45 ID:pGKd1Nh3.net]
21bitもの空間与えたら要らん文字まで突っ込みまくってごみ溜めみたいになってしまったじゃないか。

779 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 21:12:47.43 ID:LYBJTBw0.net]
絵文字は特に漢字に馴染みが無い連中が嬉しがってるけど、象形文字の発明前に戻ったようだよ
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった

780 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 23:04:09.59 ID:uD1YCxhq.net]
>769
ipaは都合約6万字ある

781 名前:デフォルトの名無しさん [2019/11/24(日) 00:15:00.98 ID:daL/rw2X.net]
16bit固定なら世界中の文字が記述できるとして始まったのがそもそものUnicodeだからな

782 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 07:48:18.59 ID:wAZlnZnW.net]
>>757
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。

783 名前:デフォルトの名無しさん [2019/11/24(日) 11:58:02.36 ID:bBACDgxb.net]
>>772
ちんちんの絵文字は
剥けちんと包茎と勃起前とか勃起後とか色々バリエーション必要ですし



784 名前: mailto:sage [2019/11/24(日) 12:05:35.45 ID:oHJXyQoT.net]
>>776
おもしろいと思っていってるの?

785 名前:デフォルトの名無しさん [2019/11/24(日) 12:07:46.48 ID:bBACDgxb.net]
QZさんからレスもらえるとは思わなかった

786 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:30:57.16 ID:4a4z1fkQ.net]
>>777
竹島はどこの国の領土ですか?
注意:「なぜその質問をしたいと思ったのですか」みたいな
質問を質問で返すようなクズな真似はしないこと

787 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:43:02.24 ID:iwyjZSbL.net]
質問じゃなくて、馬鹿にしてるんだろ

え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味

788 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:53:04.27 ID:6n0WdTOH.net]
>>780
違うと思う
QZは韓国人だから答えられないんでしょ

789 名前: mailto:sage [2019/11/24(日) 13:04:27.62 ID:oHJXyQoT.net]
>>779
>「なぜその質問をしたいと思ったのですか」
いやはや、私のパターンを熟知されているようでなにより、です、ちょっとうれしくなりました

790 名前: mailto:sage [2019/11/24(日) 13:05:00.77 ID:oHJXyQoT.net]
>>781
なぜ韓国人だとおもったのですか?

791 名前: mailto:sage [2019/11/24(日) 13:09:00.29 ID:oHJXyQoT.net]
>>779
https://medaka.5ch.net/test/read.cgi/eco/1567773760/710
https://medaka.5ch.net/test/read.cgi/eco/1567773760/712
https://medaka.5ch.net/test/read.cgi/eco/1567773760/714

792 名前:デフォルトの名無しさん [2019/11/24(日) 13:13:33.28 ID:BlMs70wA.net]
憲法9条を改正するだけじゃダメなのよ。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。

793 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 15:33:55.44 ID:EdYAI6jd.net]
>>762
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ



794 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 17:10:15.65 ID:5wTOyTy7.net]
>>779
竹島は日本の領土で、独島は韓国の領土だよ
なぜか韓国は竹島のことを独島だと言い張ってるけど
独島は別の島ですから、残念

795 名前:デフォルトの名無しさん mailto:sage [2019/11/25(月) 15:25:07.92 ID:s1hiXzdE.net]
>>787
おっとそれ以上言っちゃあいけない

796 名前:デフォルトの名無しさん [2019/11/30(土) 13:54:16.72 ID:eovy2x2M.net]
【びっくりサイエンス】 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30

797 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 15:03:21.41 ID:dLS32wGr.net]
別に「びっくり」ではないなw

798 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:10:49.04 ID:OkgV2S2L.net]
それ言ったらドンキーにも延焼する

799 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:25:08.69 ID:mO6/udRn.net]
ドンキーほうけーい

800 名前:デフォルトの名無しさん [2019/12/01(日) 17:02:36.55 ID:zxgavQqm.net]
今年の漢字は天

801 名前:デフォルトの名無しさん mailto:sage [2019/12/01(日) 17:27:44.79 ID:xqkDTdKR.net]
いっそU+32FFと書いてほしい

802 名前:デフォルトの名無しさん [2019/12/03(火) 02:50:32.39 ID:TSc17kJh.net]
「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声

803 名前:デフォルトの名無しさん [2019/12/03(火) 12:56:42 ID:dBsSbed7.net]
可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?



804 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 14:48:10.41 ID:32eP5DBa.net]
異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか

805 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:19:10.13 ID:9x1aaywv.net]
倍角、四倍角も入れて

806 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:35:57 ID:IUIY88nX.net]
HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw

807 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 17:26:32 ID:Y2nmLwy/.net]
Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき

808 名前:デフォルトの名無しさん [2019/12/04(水) 16:24:48 ID:IlQO2KEp.net]
黒板太字 - Wikipedia
https://ja.wikipedia.org/wiki/黒板太字

とかはかなりスタイル要素入ってると思うな。
てか数学用分野だけやけに優遇されてない?

809 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 19:52:55.02 ID:sxQF45hm.net]
連続してないからあくまでも記号扱いなんだろうな。

810 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 20:23:19.21 ID:bwCWk38v.net]
発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ

811 名前:デフォルトの名無しさん mailto:sage [2019/12/05(Thu) 15:53:38 ID:1Yvcqq3b.net]
>>801
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。

812 名前:デフォルトの名無しさん [2019/12/05(木) 16:32:04.91 ID:IbmhSLeW.net]
IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ

813 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 14:18:04 ID:CxS2VDwU.net]
>>805
IMEってMS-IMEのこと?
それともかな漢字変換全般?



814 名前:デフォルトの名無しさん [2019/12/06(金) 23:32:11.23 ID:Ob0T3VF2.net]
SKK使ってるからだけどそんな印象は全く無い

815 名前:デフォルトの名無しさん mailto:sage [2019/12/10(火) 22:31:10.24 ID:zD6aLrgM.net]
SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。

816 名前:デフォルトの名無しさん [2020/01/01(水) 02:03:31.89 ID:ZBRDXVGi.net]
あけましておめでとう!
今年もこのスレの皆さんに多幸感がありますように!����������

817 名前:デフォルトの名無しさん [2020/01/01(水) 11:19:22.03 ID:tqBP4ADq.net]
字にはヒラギノ〜ル♪

818 名前:デフォルトの名無しさん [2020/01/01(水) 22:58:15.38 ID:fGGzsdYV.net]
あけましておめでとうございます
ISO/IEC 10646の新版は今年中に出るかな〜?

819 名前:デフォルトの名無しさん [2020/01/03(金) 06:32:52.61 ID:wMN1Z8Zd.net]
Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。
まぁ、文字コードの問題ではないんだが。

820 名前:デフォルトの名無しさん [2020/01/03(金) 10:33:29.05 ID:lHIykz7y.net]
特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ

821 名前:デフォルトの名無しさん [2020/01/03(金) 22:33:53.11 ID:wMN1Z8Zd.net]
>>813
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。

822 名前:デフォルトの名無しさん [2020/01/07(火) 14:48:29.36 ID:lPDbYu1J.net]
どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE
https://gigazine.net/news/20200106-which-emoji-scissors-close/

面白い

823 名前:デフォルトの名無しさん [2020/01/07(火) 15:01:40.99 ID:2Dq0zKSW.net]
左利き用のはさみも用意汁ωωω



824 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 15:12:21.25 ID:dfBogwvq.net]
ちなみによく切れるはさみはここが曲線
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg

825 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 16:36:04.95 ID:g+gnVlWv.net]
はさみディレクションセレクター

826 名前:デフォルトの名無しさん mailto:sage [2020/01/18(土) 12:49:25 ID:jQMC+jX5.net]
ぷにコードに関するチラ裏

localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ

idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた

827 名前:デフォルトの名無しさん mailto:sage [2020/01/24(金) 09:35:27 ID:jBJ9cIqM.net]
6月のWG2は高松になったのか
また国外から来にくそうな

828 名前:デフォルトの名無しさん mailto:sage [2020/01/26(日) 00:45:55.40 ID:C+NhYhXj.net]
道後温泉に行くか

829 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 14:46:03 ID:WswUNrPx.net]
Unicode Emoji 13.0 - Now final for 2020
blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html

830 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 16:08:26 ID:m1itn91m.net]
今更タピ岡かい

831 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 12:43:23.65 ID:G4fIlptF.net]
Unicodeは完全にコンソーシアムのおもちゃになってんな

832 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 15:08:09 ID:OCbveUqO.net]
タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。

833 名前:◆QZaw55cn4c mailto:sage [2020/01/31(金) 19:55:14 ID:tTpxWp9S.net]
>>825
詰将棋用に上下逆の漢字を入れて欲しかった



834 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 22:55:44.99 ID:GHfVRZCY.net]
G入れるのまじやめて

835 名前:デフォルトの名無しさん mailto:sage [2020/02/01(土) 00:49:18.17 ID:6vnUAWit.net]
要するに新種の漢字なんだな
国ごとに生活が違うから、結局何万種必要になる

836 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 00:50:49.11 ID:wzqxdRGo.net]
将棋の駒は多分誰も提案書を出さないせい

837 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:02:15 ID:0w4OLLiX.net]
それ通ったらドンジャラ提案するわ

838 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:17:07.29 ID:Vi9q8JVy.net]
漢字の扱いは本当に難しい
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・

839 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 01:41:22 ID:qflv74w2.net]
テスト٩( 'ω' )و

840 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 08:57:05 ID:uSBWqXrE.net]
825だが、将棋の駒がダメな理由は、>>469 にある通り、
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。

841 名前:デフォルトの名無しさん [2020/02/03(月) 11:59:58 ID:62FLJlST.net]
解説本だと普通に使われてるよな

842 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 13:40:49 ID:yHobSnyY.net]
タピオカが使われているのかと誤読

843 名前:デフォルトの名無しさん [2020/02/03(月) 13:47:35 ID:62FLJlST.net]
読み手のリテラシーが問われます



844 名前:デフォルトの名無しさん [2020/02/03(月) 13:54:08 ID:eKPmxfCz.net]
天使を天便と読み取ったまま放置するとか割とマジ。

845 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:56:08 ID:KZTuy2Ys.net]
架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。

846 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:59:18 ID:wgq762c2.net]
漢字以前の象形文字モドキの再発明だからなぁ
取捨選択もなく全然洗練されないまま数だけ増えてる

847 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 23:33:42 ID:s4V/Vj8i.net]
そのうち抽象化が進んでいくのか

848 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:26:51.57 ID:gTERf/2s.net]
政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ

849 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:28:31.24 ID:c6iCZcrL.net]
コーヒー、お茶、タクシー、台風もほしい

850 名前:デフォルトの名無しさん [2020/02/04(火) 20:12:02 ID:U7azh68T.net]
>>841
政治的に正しい仏教徒とは何ですかね?

アホな創価学会員が言いそうな発言ですが。

851 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 21:29:49 ID:t1/0lpTx.net]
絵文字ってここにどう書き込めばいいんです?
&#9784;&#65039;


専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆

852 名前:態でうまく表示されない… []
[ここ壊れてます]

853 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 08:47:40.80 ID:fZOBAWLP.net]
>>842
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。



854 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:08:51 ID:So1jciyU.net]
🍵 you know me.

855 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:23:19.19 ID:MS9bo9CR.net]
固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが

856 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:24:42 ID:MS9bo9CR.net]
固定フォントじゃなくて等幅フォントでした

857 名前:デフォルトの名無しさん [2020/02/05(水) 16:23:36 ID:2rKdW1Ec.net]
てすと


858 名前:デフォルトの名無しさん [2020/02/05(水) 16:24:56 ID:2rKdW1Ec.net]
>>844
うちのChromeはちゃんと出てる
ffでも問題なし

859 名前:デフォルトの名無しさん [2020/02/05(水) 16:28:36 ID:2rKdW1Ec.net]
>>847
前にpythonで書いたときは
unicodedata.east_asian_width()
使ったと思う
Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う

860 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 16:30:38 ID:So1jciyU.net]
☸ 法輪ラブ ☸

861 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 18:34:07 ID:qBm/0cTb.net]
>>847

・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1

・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)

・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる

・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)

・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)

・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる

862 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 20:43:09 ID:f5dE3Mu+.net]
>>853
詳しい解説サンクス

863 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 23:12:39 ID:zWcxLf4u.net]
>>853
あざす
やっぱり混沌としてるのですね
とりあえず一度ターミナルの中を追ってみようかな



864 名前:デフォルトの名無しさん mailto:sage [2020/02/06(Thu) 00:00:39 ID:SQAVqXtr.net]
>>844うちでも見れた

865 名前:デフォルトの名無しさん mailto:sage [2020/02/07(金) 22:23:32 ID:DCA95dh2.net]
継ぎ接ぎだらけの一貫してない仕様だからな

866 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:47:47 ID:hv0txQ7A.net]
Unicodeの時代に今更だけど、
シフトJISの第2バイトがA0〜FFでなく
40〜FCにしたのは何でだろう

867 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:48:29 ID:hv0txQ7A.net]
訂正
×A0〜FF
〇80〜FF

868 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 18:36:07.73 ID:zjMP9HD4.net]
JISの区点は1区あたり94点
0x40開始で0x7Fを避けて2区分取ると0xFCになる

869 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 12:59:57 ID:tCetl5aZ.net]
やっぱ漢字1文字は2バイトの方がいい

870 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 15:51:09 ID:gml78nRc.net]
>>858
半角カナのせいで80〜FFでは足りないから

871 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:30:21 ID:tCetl5aZ.net]
シフトJISはもう少し工夫すれば
JISコードの変換式もより簡単にでき
2バイト目もASCII領域を使わずにダメ文字も発生せず
補助漢字も全て入れられた

872 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:32:13 ID:tCetl5aZ.net]
補助漢字は半角カナと排他だけど

873 名前:デフォルトの名無しさん [2020/02/10(月) 16:27:01 ID:TGcYvj29.net]
EUCで良かったんよ



874 名前:デフォルトの名無しさん mailto:sage [2020/02/10(月) 19:14:50 ID:hRmPfOYI.net]
EUCだと半角カナも補助漢字もバイト数が増えるからな...

875 名前: mailto:sage [2020/02/10(月) 21:20:39.00 ID:3bnN/FFY.net]
>>863
あのスペースの狭さでは、それは無理だったのでは?
どうするのがよかったのですか?具体的にいってみてよ

876 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 08:36:25.76 ID:K5Jxm44G.net]
非漢字_:[81-98] [80-9F]
第1水準:[80-9F] [A1-FE]
第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F]
補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F]
補助漢字は半角カナと排他利用

877 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 17:40:51 ID:Sh/x76Zj.net]
>>868
それは結局半角カナを潰しただけのことでは?

878 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 18:51:44 ID:K5Jxm44G.net]
>>869
補助漢字6000字近くを使えるというメリットがあれば
半角カナをフェードアウトするには十分な機会になっただろう
補助漢字(JIS X 0212)が制定されたのは1990年だから
その翌年の1991年に発売されたMS-DOS 5.0あたりで
KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば
従来のテキストファイルの読み込みなども対応できる

879 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 19:27:04 ID:Sh/x76Zj.net]
>>870
文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね

880 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 01:19:59.31 ID:l8Pmdafn.net]
いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる

881 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 02:15:22.28 ID:H21UjGBC.net]
なくならない
合成文字はなくせない

882 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 05:02:58 ID:K3E1Z6OS.net]
>>871
コンテンツ側でなくユーザー側

883 名前:デフォルトの名無しさん [2020/02/12(水) 10:06:52 ID:a1w2Xqz0.net]
1文字=64bitやろ



884 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:30:20 ID:KzEjZzkq.net]
>>875
イングランドの旗はUnicodeで7コードポイント必要なので64bitでは無理
128bitで

885 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:32:59.34 ID:yKNbCROk.net]
👽 全宇宙の未知なる知的生命体の使用言語を網羅しなきゃならないのだから可変長は必須

886 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 20:36:54 ID:ytylQgpT.net]
>>876
え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの

887 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 21:06:37.28 ID:Kml/rCmZ.net]
>>878がおもしろいことを言った

888 名前:デフォルトの名無しさん mailto:sage [2020/02/13(木) 15:10:18.42 ID:Xqo24CtP.net]
ウェールズ「俺は?」

889 名前:デフォルトの名無しさん mailto:sage [2020/02/13(Thu) 21:26:26 ID:KYt0SeFn.net]
Google、絵文字を組み合わせた「ハート付きうんち」などを使える「Emoji Kitchen」開始
https://www.itmedia.co.jp/news/articles/2002/13/news068.html

890 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 11:14:07.77 ID:SoYJxWJg.net]
そんな文字要らんわ

891 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 13:42:19 ID:4TN7y+1I.net]
グーグルってしょっちゅう意味のわからんことするよな

892 名前:デフォルトの名無しさん [2020/02/14(金) 14:22:25 ID:WtuYdkw5.net]
MSやAppleだって訳判らんことするときもある

893 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 14:26:10 ID:MCgyW5To.net]
実行ファイルがテキストとデータで構成されるように、絵文字表現もテキストとデータを組み合わせた文法が出てきそう。



894 名前:デフォルトの名無しさん [2020/02/14(金) 17:14:21 ID:CPLKNT1n.net]
顔文字より正規表現のためのメタ文字とかあったほうが良いのにね。
まあGoogleじゃ無理か。

895 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 21:11:02 ID:qxpoECq4.net]
(.*_*)

896 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 22:37:55 ID:cKxgCMj+.net]
そのメタ文字にマッチしたい正規表現を書く日が来るぞ

897 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 00:14:12 ID:W/mb2gir.net]
\��

898 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 05:28:54.23 ID:uhBKJdO0.net]
規格名:JIS X 0215
文字数:15000字超(非漢字:1700字超,漢字:13300字超)
区点域:0〜127区,0〜127点(最大16384字収納)
通 称:いちごJIS

899 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 14:33:03 ID:MAyK0RyJ.net]
https://twitter.com/akinomyoga/status/1230127240806985728

修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。
何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ
https://gitlab.freedesktop.org/terminal-wg/specifications/issues/9#note_406682

因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。
曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか…
https://github.com/microsoft/terminal/issues/4345#issuecomment-578434025
(deleted an unsolicited ad)

900 名前:デフォルトの名無しさん [2020/02/21(金) 15:07:53.93 ID:5cQWFY2c.net]







901 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 20:47:45 ID:cxQoHGS6.net]
半角と全角の区別付かなくなると困るから元の半角文字はさらに半分で表示したらどうかな

902 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 22:45:17 ID:gYJx2Nw8.net]
まぁ、全部全角にすれば万事解決なんだけどな。

903 名前:デフォルトの名無しさん mailto:sage [2020/02/22(土) 03:15:16.13 ID:s2EVAxz+.net]
絵文字っていわゆる全角よね



904 名前:デフォルトの名無しさん mailto:sage [2020/03/02(月) 02:11:23 ID:dBpw1NjL.net]
いわゆるって何を指してる?

905 名前:デフォルトの名無しさん mailto:sage [2020/03/02(月) 16:54:16.25 ID:HI7PDIWr.net]
公式定義ではなく現実によく目にする幅、かな

906 名前:デフォルトの名無しさん [2020/03/02(月) 17:38:15.13 ID:glnmwhpK.net]
最近は倍角とか4倍角とか聴かなくなったな

907 名前:デフォルトの名無しさん mailto:sage [2020/03/07(土) 16:24:06 ID:dtD2Xrrp.net]
Microsoft、Shift_JISや外字からUnicodeへの移行を呼びかけ | スラド
https://srad.jp/story/20/03/06/1237211/

Windows と日本語のテキストについて - Windows Blog for Japan
https://blogs.windows.com/japan/2020/02/20/about-windows-and-japanese-text/

908 名前:デフォルトの名無しさん mailto:sage [2020/03/07(土) 18:02:03 ID:8MkGFgNt.net]
外字というと丸囲みの数字が?〜?以外にもほしくて
21以降も外字で作ってしまっていた事務所を思い出す

何度かPCを入れ替えるうちに使わなくなり、忘れ去られ、
久々に古い文書を引っ張り出して来たら謎の文字化けで外字の存在が発覚
外字が何故か?から始まってたり途中に別の字が挟まってたりしてもはや解読作業

909 名前:デフォルトの名無しさん mailto:sage [2020/03/08(日) 21:08:48.53 ID:LYEGO22Q.net]


910 名前:デフォルトの名無しさん mailto:sage [2020/03/08(日) 22:48:15.28 ID:NQM2xZbu.net]
今は㊿まであるんだな、知らんかったわ

911 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 05:26:10.28 ID:z9inAChS.net]
(0)とか黒丸の小文字英字とか白丸のンとか黒丸の仮名とかは
Unicodeですら未だに無いんだよな...

912 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 14:12:03.27 ID:A2Epg0dL.net]
それはわいせつだからでは

913 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 14:20:33.44 ID:o76Az6W+.net]
わいせつだって文字情報じゃないか!
それともなにか君は辞書から陰茎とか陰核という単語を削除せよというのか!



914 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 16:04:20 ID:5ouitKt0.net]
��

915 名前:デフォルトの名無しさん [2020/03/09(月) 17:52:27 ID:T4gz2l9R.net]
>>903
◎と字形が同じとかで一緒にされそう

あと将棋の駒(上下とか白黒)も欲しいとか言ってた人?

916 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 20:31:39 ID:D+UZfSM4.net]
お城マークってある?
凸の下辺がないようなやつ

917 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 21:26:52.19 ID:bpMBC8cG.net]
>>902
50まで作るんだったら、99まで作れば良かったのに。
できれば、100まで欲しかった。

918 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 22:01:13 ID:d9MHF8Nm.net]
>>908


919 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 23:06:46.00 ID:5OM/DcPa.net]
ゴリッパだな

920 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 07:55:14.17 ID:LhHy3+ze.net]
>>900
Unicodeがまさにそんな感じだよ
符号位置なんて空いてりゃなんでも詰め込んでくる

921 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 09:32:00.64 ID:Ae1RdIX3.net]
一方場所が足りない云々でCJK統合漢字爆誕

922 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 12:18:50 ID:QGyf5BSI.net]
アレはUNICODEが16ビットだったときの産物だからなー

囲み付き文字は合字でなんぼでも表示できるんじゃなかったのか?
黒字に白抜きはないか。

923 名前:デフォルトの名無しさん mailto:sage [2020/03/11(水) 00:27:59 ID:GChSseC+.net]
⓿と🄌は何が違うのこれ



924 名前:デフォルトの名無しさん mailto:sage [2020/03/12(木) 14:56:02.24 ID:PErtSW6n.net]
Announcing The Unicode$#174; Standard, Version 13.0
https://home.unicode.org/announcing-the-unicode-standard-version-13-0/

925 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 04:51:42.81 ID:XfurYgbf.net]
要らん文字ばっか増えていくな

926 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 07:25:49 ID:YqqN4LBM.net]
う、うん…

927 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 20:00:06.77 ID:gnCwby5S.net]
Unicode 13.0.0
www.unicode.org/versions/Unicode13.0.0/
Components of Unicode 13.0.0
www.unicode.org/versions/components-13.0.0.html
Core Specification (PDF)
www.unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf
Code Charts (PDF・110 MB)
www.unicode.org/Public/13.0.0/charts/CodeCharts.pdf

928 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 20:29:09.67 ID:No4fNSBg.net]
でっかいPDFだなあ

929 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 22:24:02.25 ID:4HcCQorc.net]
あれ、もうUnicode 13.0.0出たの?
改訂するのは確か毎年6月ねって決めたんじゃ……と思ったら去年から3月だった。

930 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 04:49:42 ID:vXPyxgSI.net]
Win10は頻繁にバージョンアップしてるけど、
使ってるUnicodeは2015年に出た8.0のままなんだよな...

931 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 05:08:58.28 ID:3vkWqFOe.net]
そーそー
新しいフォント入れてもリンクが効かんという...
全部入りフォント作るにゃ16bitの壁

932 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 16:17:25.81 ID:Vl0/NIrd.net]
え、そうなんだ
そんな罠が

933 名前:デフォルトの名無しさん mailto:sage [2020/03/18(水) 09:00:29 ID:z60BWivb.net]
高松もキャンセルなのかな
それともISO/IECはまた別の判断か
https://www.iso.org/covid-19.html



934 名前:デフォルトの名無しさん mailto:sage [2020/04/09(木) 14:28:17.94 ID:+HIZu5X+.net]
Unicode 14.0 Delayed for 6 Months
blog.unicode.org/2020/04/unicode-140-delayed-for-6-months.html

Due to COVID-19, the Unicode Consortium has

935 名前:decided to postpone the release of version 14.0 of the Unicode Standard by 6 months, from March to September of 2021.
This delay will also impact related specifications and data, such as new emoji characters.

This announcement does not affect the new emoji included in Unicode Standard version 13.0 announced on March 10, 2020.
[]
[ここ壊れてます]

936 名前:デフォルトの名無しさん mailto:sage [2020/04/09(Thu) 17:31:08 ID:gZ/Igrwb.net]
せっかくだから細菌��とは別にウイルスの絵文字つくってくれ

937 名前:デフォルトの名無しさん mailto:sage [2020/04/09(Thu) 23:42:25 ID:V4nj16/7.net]
コロナ菌入れるの?

938 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 03:17:26 ID:8l6zYGEZ.net]
��マスク
��トイレットペーパー

939 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 14:38:09 ID:4/xjxgO5.net]
細菌の絵文字なんてあるのか
🦠

940 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 15:29:18 ID:CRpi4reg.net]
最近出来た

941 名前:デフォルトの名無しさん mailto:sage [2020/04/11(土) 06:13:53.13 ID:AQJyoftj.net]
外人が絵文字大好きなのは勝手だけど、既存コードの部分もちゃんとして欲しい

942 名前:デフォルトの名無しさん mailto:sage [2020/04/11(土) 16:23:43.45 ID:c2aeXPYf.net]
e門司

943 名前:デフォルトの名無しさん [2020/04/18(土) 12:50:14 ID:VYQrLT4k.net]
最近出来た細菌の絵文字・・・



944 名前:デフォルトの名無しさん mailto:sage [2020/04/18(土) 14:58:29 ID:7V75MQ+C.net]
なるほど、最近と細菌がかかってる、とこういうわけですな

945 名前:デフォルトの名無しさん mailto:sage [2020/05/07(Thu) 16:04:22 ID:yKMQxEI8.net]
するってえと何かい?
最近と細菌がかかってるというわけかい?

946 名前:デフォルトの名無しさん mailto:sage [2020/05/08(金) 15:47:36 ID:5Vn36V2D.net]
ウィルスの絵文字も頼むわ

947 名前:デフォルトの名無しさん mailto:sage [2020/05/09(土) 15:44:09 ID:c4xb28ev.net]
corona emoji ��

948 名前:デフォルトの名無しさん mailto:sage [2020/05/20(水) 21:19:51 ID:KtsKIWM6.net]
https://lister.tokyo/emoji/unicode_emoji.php?emoji=%F0%9F%A6%A0

絵文字
🦠

意味
微生物
【類似・説明】細菌、ウイルス、アメーバなどを表す

949 名前:デフォルトの名無しさん mailto:sage [2020/05/21(Thu) 14:54:55 ID:iHD0We8W.net]
ちょっといくらなんでも雑やな

950 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 00:52:38.66 ID:JDT7oTvt.net]
ウィルスを生物扱いする悪い子はここか?

951 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 21:40:13 ID:Olq8ijH/.net]
ゴブリン��&オーガ��

952 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:24:55.95 ID:vzEBoOvQ.net]
>>891
超遅レスだが、全角半角問題の亡霊が絵文字とかで再燃してる感じ?

そっか絵文字ってサロゲートの領域のやつ以外にVSを使ってるのもあるのか。面倒だな。

>>897
Unicodeには公式定義があるでしょ

話は違うが、外人は絵文字をEmotional Iconかなんかの略だと思ってる感があって
そこはどうなんだという。

953 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:46:42.29 ID:p75lHsHl.net]
ひらがなの'あ'よりも'W'のほうが幅広だったり、
★マークが半角幅だったりするフォントが溢れてるのに、
半角全角区別しても仕方ないだろ



954 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 21:34:59.63 ID:IMDB9vKB.net]
まあだからそこはターミナルとか限られた環境の話で。
フォントもそれ用のを選ぶし。

そろそろ全角半角なんてのをやめて、文字のカラム位置を揃えたいならフォントの
メトリックスの方で調整すればいいだけ、かもしれないけど。

955 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 00:33:45 ID:MWbXBJfF.net]
>>943
絵文字の幅って公式定義があるの?

956 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 14:21:00.23 ID:la0O1Akk.net]
>>946
Unicodeに収録された文字には文字幅のプロパティがある、という意味で。

957 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 00:32:43.95 ID:DUn6aEuN.net]
>>947
かみ合ってないやん
>>894からの流れなんだから

958 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 19:13:13.28 ID:Y25pVs1y.net]
>>894 ? 知らんがなw
そもそも「全部」ってどういう意味だ? 全部の文字? 全部のターミナルに関わるソフトの挙動?

959 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 20:41:37 ID:NxxL+RwQ.net]
発端は>>891だろう

960 名前:デフォルトの名無しさん mailto:sage [2020/06/23(火) 00:16:31.95 ID:regXwJpa.net]
既存定義とは違う新しい定義の話題に
「既存定義があるぞ」は全然かみ合ってないし
知らんがなと笑われてもそれこそ知らんがな

961 名前:デフォルトの名無しさん [2020/06/23(火) 10:14:55.66 ID:4kHZmTBE.net]
倍角と2倍角は違うんだっけ
4倍角もあったような

962 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 00:49:18.29 ID:U0shKhxD.net]
倍角って横だよね
縦倍角ってのもあった気がする

963 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 02:37:42.69 ID:Qbz2qwLg.net]
〴〳
〵〵

これの有効活用をしたい



964 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:14:26.52 ID:deVcUtEo.net]
>>951
というかどういうレベルの話をしているのか掴みかねてね。

「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。

リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。

965 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:28:35.59 ID:deVcUtEo.net]
と思ったがまたそのうちw

966 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 13:08:49.76 ID:Qbz2qwLg.net]
どこまでもかみあわんやっちゃな

967 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 19:38:46.76 ID:e6Wuxio/.net]
というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。

全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw

968 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 22:24:49.91 ID:N310/pVU.net]
んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅

969 名前:デフォルトの名無しさん mailto:sage [2020/06/25(木) 18:59:45.90 ID:xHxuQznk.net]
>>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。

で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw

個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。

970 名前:デフォルトの名無しさん mailto:sage [2020/06/25(Thu) 22:37:41 ID:5bjWZftZ.net]
曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?

971 名前:デフォルトの名無しさん [2020/06/26(金) 13:02:51 ID:PjbtVFt+.net]
%s の文字数とかで文字列の幅調整出来ないんだよな

972 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:34:46.91 ID:gjCuj5Av.net]
しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。

同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw

973 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:59:35.95 ID:7oUp4uPe.net]
そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ



974 名前: mailto:sage [2020/06/26(金) 21:31:32.20 ID:9IxUvn/4.net]
>>964
それはグレートチャイナ様が抵抗してくださるのでは?

975 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 22:11:14.85 ID:7oUp4uPe.net]
彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ

976 名前: mailto:sage [2020/06/26(金) 22:22:00.35 ID:9IxUvn/4.net]
>>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました

977 名前:デフォルトの名無しさん [2020/06/27(土) 00:33:35.05 ID:swJlVBV3.net]
簡字体は半角でも行けそう感あるな

978 名前:デフォルトの名無しさん [2020/06/27(土) 01:47:56.80 ID:9wE9An+g.net]
斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか

979 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 01:53:30.16 ID:2VXy+TcG.net]
ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。

980 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:06:13.19 ID:a36N+BtR.net]
>>969
これは一緒にしろよと思うことはある
文献で必要だから分けて欲しいが、明治の戸籍作成時の書き間違いまで
大事に引き継ぐ必要はないだろ

981 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:22:38.17 ID:n/FbqQvh.net]
そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな

982 名前:デフォルトの名無しさん [2020/06/27(土) 02:25:59.19 ID:cFHckwkh.net]
カンジカナヘンカン(キリッ

983 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 03:48:57.43 ID:N26qrFyY.net]
でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね

いずれにしてももう入れちゃったから永久保存だね



984 名前:◆QZaw55cn4c mailto:sage [2020/06/27(土) 03:56:37 ID:5JNhQ0LT.net]
はしご高とくち高は無理やり統合されちゃって有耶無耶らしいのですが…

985 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:30:57.19 ID:fTkQtmqM.net]
>>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。

986 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:59:10 ID:8YWxnx/1.net]
>>969
> 斎と斉と齊と齋は一緒だから一つにしろとかな

しっかり区別できない限り、乃木坂ファンにはなれない。

987 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:13:49.81 ID:wwwZDyDi.net]
イタイ痔でイタイ字
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° &deg; ° &#x00B0;
± &plusmn; ± &#x00B1;
² &sup2; ² &#x00B2;
³ &sup3; ³ &#x00B3;

988 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:39:39.53 ID:twDHZDh4.net]
>>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw

989 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:58:34.18 ID:g61E5/Hd.net]
>>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。

でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。

なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。

あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。

おっと誰か来たようだ

990 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 14:15:22 ID:bBs10q1N.net]
表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。

991 名前:デフォルトの名無しさん [2020/06/27(土) 15:22:20.76 ID:QSLeN3Uh.net]
ขอบคุณค่ะ

992 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 19:08:33.76 ID:g61E5/Hd.net]
なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。

993 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 11:00:01.09 ID:9sOk9wG3.net]
>>982
5chの文字コードスレで数値参照か?
男は黙ってShift_JISだろ。
Shift_JISとは何かを考えるいいきっかけにもなる(ならなくていいかw)



994 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 20:30:07 ID:PNBTsuo1.net]
参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない

995 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 17:25:24.99 ID:MDN2nnZZ.net]
俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。

996 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 19:30:44.51 ID:V8kaCwil.net]
つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?

997 名前:デフォルトの名無しさん [2020/07/01(水) 19:32:49.62 ID:IfUrt5hg.net]
面って旧字体か知らんけど内側が口の字もあるんだね

998 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 22:04:25.91 ID:21fnQhh9.net]
「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。

「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。

999 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 05:58:14.56 ID:29pTsVv7.net]
>>989
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?

Unicodeで別になってて嬉しい人は台湾に感謝しないとw

1000 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 20:52:25.00 ID:Ia6zfvih.net]
��野家

1001 名前: mailto:sage [2020/07/02(木) 21:29:50.29 ID:L13EtRzW.net]
>>989
>「高」と「」
CP932 では区別されているのですか?

1002 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 23:07:28.07 ID:NYHAh4sv.net]
>>992
区別されてるよ。
「マイクロソフト標準キャラクタセット」で検索すると、
詳しい情報が出てくるよ。

1003 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 01:39:17.36 ID:I4sf0FL7.net]
いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw



1004 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 02:49:52.70 ID:C0o/qkVy.net]
そのせいじゃないだろう

1005 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 08:00:38.22 ID:I4sf0FL7.net]
私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。

1006 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 09:38:17.14 ID:oXZRCloQ.net]
自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?

1007 名前:デフォルトの名無しさん [2020/07/03(金) 11:53:19 ID:6268sYfp.net]

?

1008 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:11:53.17 ID:/+uSoVK/.net]
ア崎

1009 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:13:13.87 ID:/+uSoVK/.net]
↑ホントだ変換入力してるのに文字化けする

1010 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒

1011 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<221KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef