- 1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
- Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。 UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/ 文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/ 文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/ 文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/ 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
- 945 名前:デフォルトの名無しさん mailto:sage [2020/05/07(Thu) 16:04:22 ID:yKMQxEI8.net]
- するってえと何かい?
最近と細菌がかかってるというわけかい?
- 946 名前:デフォルトの名無しさん mailto:sage [2020/05/08(金) 15:47:36 ID:5Vn36V2D.net]
- ウィルスの絵文字も頼むわ
- 947 名前:デフォルトの名無しさん mailto:sage [2020/05/09(土) 15:44:09 ID:c4xb28ev.net]
- corona emoji
- 948 名前:デフォルトの名無しさん mailto:sage [2020/05/20(水) 21:19:51 ID:KtsKIWM6.net]
- https://lister.tokyo/emoji/unicode_emoji.php?emoji=%F0%9F%A6%A0
絵文字 🦠 意味 微生物 【類似・説明】細菌、ウイルス、アメーバなどを表す
- 949 名前:デフォルトの名無しさん mailto:sage [2020/05/21(Thu) 14:54:55 ID:iHD0We8W.net]
- ちょっといくらなんでも雑やな
- 950 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 00:52:38.66 ID:JDT7oTvt.net]
- ウィルスを生物扱いする悪い子はここか?
- 951 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 21:40:13 ID:Olq8ijH/.net]
- ゴブリン&オーガ
- 952 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:24:55.95 ID:vzEBoOvQ.net]
- >>891
超遅レスだが、全角半角問題の亡霊が絵文字とかで再燃してる感じ? そっか絵文字ってサロゲートの領域のやつ以外にVSを使ってるのもあるのか。面倒だな。 >>897 Unicodeには公式定義があるでしょ 話は違うが、外人は絵文字をEmotional Iconかなんかの略だと思ってる感があって そこはどうなんだという。
- 953 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:46:42.29 ID:p75lHsHl.net]
- ひらがなの'あ'よりも'W'のほうが幅広だったり、
★マークが半角幅だったりするフォントが溢れてるのに、 半角全角区別しても仕方ないだろ
- 954 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 21:34:59.63 ID:IMDB9vKB.net]
- まあだからそこはターミナルとか限られた環境の話で。
フォントもそれ用のを選ぶし。 そろそろ全角半角なんてのをやめて、文字のカラム位置を揃えたいならフォントの メトリックスの方で調整すればいいだけ、かもしれないけど。
- 955 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 00:33:45 ID:MWbXBJfF.net]
- >>943
絵文字の幅って公式定義があるの?
- 956 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 14:21:00.23 ID:la0O1Akk.net]
- >>946
Unicodeに収録された文字には文字幅のプロパティがある、という意味で。
- 957 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 00:32:43.95 ID:DUn6aEuN.net]
- >>947
かみ合ってないやん >>894からの流れなんだから
- 958 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 19:13:13.28 ID:Y25pVs1y.net]
- >>894 ? 知らんがなw
そもそも「全部」ってどういう意味だ? 全部の文字? 全部のターミナルに関わるソフトの挙動?
- 959 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 20:41:37 ID:NxxL+RwQ.net]
- 発端は>>891だろう
- 960 名前:デフォルトの名無しさん mailto:sage [2020/06/23(火) 00:16:31.95 ID:regXwJpa.net]
- 既存定義とは違う新しい定義の話題に
「既存定義があるぞ」は全然かみ合ってないし 知らんがなと笑われてもそれこそ知らんがな
- 961 名前:デフォルトの名無しさん [2020/06/23(火) 10:14:55.66 ID:4kHZmTBE.net]
- 倍角と2倍角は違うんだっけ
4倍角もあったような
- 962 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 00:49:18.29 ID:U0shKhxD.net]
- 倍角って横だよね
縦倍角ってのもあった気がする
- 963 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 02:37:42.69 ID:Qbz2qwLg.net]
- 〴〳
〵〵 これの有効活用をしたい
- 964 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:14:26.52 ID:deVcUtEo.net]
- >>951
というかどういうレベルの話をしているのか掴みかねてね。 「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。 リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。 ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。 でもフォローしてみよう。
- 965 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:28:35.59 ID:deVcUtEo.net]
- と思ったがまたそのうちw
- 966 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 13:08:49.76 ID:Qbz2qwLg.net]
- どこまでもかみあわんやっちゃな
- 967 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 19:38:46.76 ID:e6Wuxio/.net]
- というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。 全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの 文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中 如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w? みたいな問題意識を共有? できるならば話はできるかもw
- 968 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 22:24:49.91 ID:N310/pVU.net]
- んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅
- 969 名前:デフォルトの名無しさん mailto:sage [2020/06/25(木) 18:59:45.90 ID:xHxuQznk.net]
- >>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと? SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。 で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw 個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。 その根拠は... 省略w ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、 いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
- 970 名前:デフォルトの名無しさん mailto:sage [2020/06/25(Thu) 22:37:41 ID:5bjWZftZ.net]
- 曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?
- 971 名前:デフォルトの名無しさん [2020/06/26(金) 13:02:51 ID:PjbtVFt+.net]
- %s の文字数とかで文字列の幅調整出来ないんだよな
- 972 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:34:46.91 ID:gjCuj5Av.net]
- しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。 VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。 同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
- 973 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:59:35.95 ID:7oUp4uPe.net]
- そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ
- 974 名前: mailto:sage [2020/06/26(金) 21:31:32.20 ID:9IxUvn/4.net]
- >>964
それはグレートチャイナ様が抵抗してくださるのでは?
- 975 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 22:11:14.85 ID:7oUp4uPe.net]
- 彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする そのとき中国の一般人民が使ってるのが絵文字だよ
- 976 名前: mailto:sage [2020/06/26(金) 22:22:00.35 ID:9IxUvn/4.net]
- >>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
- 977 名前:デフォルトの名無しさん [2020/06/27(土) 00:33:35.05 ID:swJlVBV3.net]
- 簡字体は半角でも行けそう感あるな
- 978 名前:デフォルトの名無しさん [2020/06/27(土) 01:47:56.80 ID:9wE9An+g.net]
- 斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか
- 979 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 01:53:30.16 ID:2VXy+TcG.net]
- ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、 異体字はひとつにまとめようとするひどい話だ。
- 980 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:06:13.19 ID:a36N+BtR.net]
- >>969
これは一緒にしろよと思うことはある 文献で必要だから分けて欲しいが、明治の戸籍作成時の書き間違いまで 大事に引き継ぐ必要はないだろ
- 981 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:22:38.17 ID:n/FbqQvh.net]
- そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな
- 982 名前:デフォルトの名無しさん [2020/06/27(土) 02:25:59.19 ID:cFHckwkh.net]
- カンジカナヘンカン(キリッ
- 983 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 03:48:57.43 ID:N26qrFyY.net]
- でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね いずれにしてももう入れちゃったから永久保存だね
- 984 名前:◆QZaw55cn4c mailto:sage [2020/06/27(土) 03:56:37 ID:5JNhQ0LT.net]
- はしご高とくち高は無理やり統合されちゃって有耶無耶らしいのですが…
- 985 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:30:57.19 ID:fTkQtmqM.net]
- >>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
- 986 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:59:10 ID:8YWxnx/1.net]
- >>969
> 斎と斉と齊と齋は一緒だから一つにしろとかな しっかり区別できない限り、乃木坂ファンにはなれない。
- 987 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:13:49.81 ID:wwwZDyDi.net]
- イタイ痔でイタイ字
ミミズ腫れでミミズ字 老眼でヨタヨタ字震え字 ギャル文字マルモジオタ字ハングル文字 ° ° ° ° ± ± ± ± ² ² ² ² ³ ³ ³ ³
- 988 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:39:39.53 ID:twDHZDh4.net]
- >>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
- 989 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:58:34.18 ID:g61E5/Hd.net]
- >>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。 でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ? ここら辺はいいのか? 大騒ぎしてる奴ら。 なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。 あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。 唇が分厚いorその逆のセレクタとか。 おっと誰か来たようだ
- 990 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 14:15:22 ID:bBs10q1N.net]
- 表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。
- 991 名前:デフォルトの名無しさん [2020/06/27(土) 15:22:20.76 ID:QSLeN3Uh.net]
- ขอบคุณค่ะ
- 992 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 19:08:33.76 ID:g61E5/Hd.net]
- なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。
- 993 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 11:00:01.09 ID:9sOk9wG3.net]
- >>982
5chの文字コードスレで数値参照か? 男は黙ってShift_JISだろ。 Shift_JISとは何かを考えるいいきっかけにもなる(ならなくていいかw)
- 994 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 20:30:07 ID:PNBTsuo1.net]
- 参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない
- 995 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 17:25:24.99 ID:MDN2nnZZ.net]
- 俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
- 996 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 19:30:44.51 ID:V8kaCwil.net]
- つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?
- 997 名前:デフォルトの名無しさん [2020/07/01(水) 19:32:49.62 ID:IfUrt5hg.net]
- 面って旧字体か知らんけど内側が口の字もあるんだね
- 998 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 22:04:25.91 ID:21fnQhh9.net]
- 「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で 書く場合と、二画で書く場合があるが、それは「同一の文字であって 字体が異なるだけ」とみなすのが「包摂」ということ。 「高」と「」は別の文字と考えられ、「包摂」されていない。 すなわち文字コードも分けられている。これは、unicodeで規定された 以上、もう変えることはできない。
- 999 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 05:58:14.56 ID:29pTsVv7.net]
- >>989
(1) 日本(JIS)では包摂されてた (2) 台湾では包摂されてなかった -> Unicode で採用 (参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな? Unicodeで別になってて嬉しい人は台湾に感謝しないとw
- 1000 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 20:52:25.00 ID:Ia6zfvih.net]
- 野家
- 1001 名前: mailto:sage [2020/07/02(木) 21:29:50.29 ID:L13EtRzW.net]
- >>989
>「高」と「」 CP932 では区別されているのですか?
- 1002 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 23:07:28.07 ID:NYHAh4sv.net]
- >>992
区別されてるよ。 「マイクロソフト標準キャラクタセット」で検索すると、 詳しい情報が出てくるよ。
- 1003 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 01:39:17.36 ID:I4sf0FL7.net]
- いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。 口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
- 1004 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 02:49:52.70 ID:C0o/qkVy.net]
- そのせいじゃないだろう
- 1005 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 08:00:38.22 ID:I4sf0FL7.net]
- 私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
- 1006 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 09:38:17.14 ID:oXZRCloQ.net]
- 自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。 なんか基準が変わったのか?
- 1007 名前:デフォルトの名無しさん [2020/07/03(金) 11:53:19 ID:6268sYfp.net]
- 嵜
?
- 1008 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:11:53.17 ID:/+uSoVK/.net]
- ア崎
- 1009 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:13:13.87 ID:/+uSoVK/.net]
- ↑ホントだ変換入力してるのに文字化けする
- 1010 名前:1001 [Over 1000 Thread.net]
- このスレッドは1000を超えました。
新しいスレッドを立ててください。 life time: 565日 1時間 34分 59秒
- 1011 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|

|