[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/02 16:40 / Filesize : 221 KB / Number-of Response : 1012
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ Part12



1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/

403 名前:デフォルトの名無しさん [2019/06/02(日) 20:25:46.71 ID:A9OZ+7QR.net]
鼻濁音を表す仮名か゜、き゜、く゜、け゜、こ゜、カ゜、キ゜、ク゜、ケ゜、コ゜は
JIS X 0213ではそれぞれ1文字としてコードが割り当てられたのに、Unicodeでは
半濁点なしの仮名と半濁点の2文字で表さなければいけない。Unicodeにも1文字として
収録してもらいたい。

辞書に使われる記号 [名]、[形]、(単)、(複) など ([ ]は角丸正方形、( )は丸囲み文字) も
欲しい。

404 名前:デフォルトの名無しさん mailto:sage [2019/06/02(日) 20:47:27.41 ID:SX5hebJf.net]
>>399
鼻濁音はUnicodeにちゃんと提案したら通りそう。

辞書で使われる記号は外字や私的領域に配置するしかないんじゃないかな。

405 名前:デフォルトの名無しさん [2019/06/02(日) 20:57:42.19 ID:gW1x1cZy.net]
NHKの情報番組によると、最近スマホに移行した役者の役所広司さんはガラケーの絵文字が好きでスマホの絵文字が不満らしい。

406 名前:デフォルトの名無しさん [2019/06/02(日) 21:05:37.93 ID:A9OZ+7QR.net]
>>400
テレビ番組表で使われる記号[字]、[ニ]、[多]、[声]、[吹]、[演]など ([ ]は正方形囲み文字) は
Enclosed Ideographic Supplement (U+1F2xx) として収録されたから、同じブロックの
空き領域に辞書用の記号も追加してもらいたい。

407 名前:デフォルトの名無しさん mailto:sage [2019/06/02(日) 21:16:20.35 ID:GqRagKZH.net]
よくわからん
合成文字ではいけない理由って今時ある?

408 名前:デフォルトの名無しさん [2019/06/02(日) 21:22:49.71 ID:gW1x1cZy.net]
池江 璃花子さんのツイート
https://twitter.com/rikakoikee/status/1135127518258667520
 ポップコーンが美味しかった。
 美味しいチャーハン食べたい。
 チーズドックもマックのポテトも食べたい…🍟
 美味しいお寿司🍣アボカド🥑
 と、からみチキン
 食べたいものと行きたいとこが多すぎる🐭🏰
(deleted an unsolicited ad)

409 名前:デフォルトの名無しさん [2019/06/03(月) 12:00:01.49 ID:ZJy6OnVg.net]
絵文字専用スレの分離独立を提案します

410 名前:デフォルトの名無しさん mailto:sage [2019/06/03(月) 12:14:25.26 ID:C5QZ8dlg.net]
それはよくない

411 名前:デフォルトの名無しさん [2019/06/03(月) 17:14:50.77 ID:9GoUaP2A.net]
さもる。とは?



412 名前:デフォルトの名無しさん mailto:sage [2019/06/03(月) 18:10:06.92 ID:waosREqi.net]
この板に絵文字スレを別に作るのはいい案だとは思えない。一緒に扱ったほうがいい。
他の、スマホ系やネット文化系の板で絵文字スレを立てるのはそっちの文脈での必要に応じてやればいいが。

413 名前:デフォルトの名無しさん [2019/06/04(火) 04:29:34.76 ID:34q0LBOl.net]
板的には絵文字禁止で

414 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 09:25:30.78 ID:mdhyHdfA.net]
絵文字はただのコードポイントだからなあ

415 名前:デフォルトの名無しさん [2019/06/04(火) 10:53:27.04 ID:uvNmGZET.net]
このスレが絵文字の話題で埋まるのは勘弁

416 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 11:53:04.76 ID:mdhyHdfA.net]
これまでのところ埋まってないぞ

417 名前:デフォルトの名無しさん [2019/06/04(火) 20:23:40.45 ID:gwjuh1zM.net]
>>403
それを言ったら、漢字も合字で構わなくないか? 1文字ずつコードを割り当てずに、
パーツ(部首など)に分解し、パーツと配置方法をコードで指定するIDS方式にする。
ハングルも音素に分解する。そうすれば、CJKが占めていた膨大なコード領域が
明け渡され、Unicodeを16ビットに戻せる。非CJK圏の人々はそれを望んでいそう。

漢字は情報伝達効率がとても良くて、字 2バイトで character 18バイトと同等の
情報を伝達できる。IDS上下, ウ冠, 子 の6バイトで表しても、18バイトの3分の1しか
まだない。

418 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 20:34:02.28 ID:XXr8i2SB.net]
shit


419 名前:

そうか?
[]
[ここ壊れてます]

420 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 20:35:22.41 ID:XXr8i2SB.net]
バイトでいうならそうか…
画数で無駄だなぁって思っちゃった

421 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 22:15:09.20 ID:S8UlmLic.net]
>>413
それを言ったら、がよくわからんが
現状で漢字は個別、>>399の仮名は合成で表現する仕組みになってるもんをそれぞれわざわざややこしくするメリットある?
あと今更ひっくり返して形だけ16bitとか言語圏関係なく望んでないと思う



422 名前:デフォルトの名無しさん mailto:sage [2019/06/04(火) 23:31:18.83 ID:sg371bFW.net]
>>399で書かれてる辞書で使われるような丸囲みとか四角囲みはU+20DDやU+20DEと組み合わせて表せばいい。
例えば[名]はU+540D U+20DE、(単)はU+5358 U20DDで表せる。

423 名前:デフォルトの名無しさん mailto:sage [2019/06/05(水) 21:51:36.51 ID:uJguGtrO.net]
>>413
俺もそういうのがいいとは思うけど
同じ手偏でも幅が微妙に違ったりするじゃん。
そういうのって計算というより正直 美的感覚に基づくものだから,
結局 一字一字に「手偏の幅」とかいったパラメータを与える必要が出てきそう。

424 名前:デフォルトの名無しさん [2019/06/05(水) 22:43:55.33 ID:U4lYdkMb.net]
>>413
字形まで自動合成する必要はないだろ。字形は1字ずつデザインするが、それを呼び出すのに
IDSコードを使うだけ。

425 名前:デフォルトの名無しさん mailto:sage [2019/06/06(木) 11:04:53.81 ID:NifDLxm9.net]
>>419
418だがそれはいいね。

426 名前:デフォルトの名無しさん mailto:sage [2019/06/06(木) 13:09:21.77 ID:V+RhrtBc.net]
正直IPAmjにだけ入ってるクラスの漢字見てるとこれIDSでどうすんのって思うよ。今更どうしようもないと思う。

427 名前:蟻人間 mailto:sage [2019/06/06(木) 13:32:02.81 ID:8KYXjatA.net]
台湾に漢字の部首を組み合わせてフォントを合成する技術があるらしい。

428 名前:デフォルトの名無しさん mailto:sage [2019/06/06(木) 19:13:54.79 ID:NifDLxm9.net]
>>422
それってソフトウェアやライブラリとして提供されてたりする?
もしよければ教えてほしい

429 名前:蟻人間 mailto:sage [2019/06/06(木) 19:56:27.90 ID:W0KBfnTD.net]
https://www.dynacw.co.jp/about/about_history.aspx
これ。

430 名前:デフォルトの名無しさん mailto:sage [2019/06/06(木) 23:21:56.20 ID:mU5eCwwC.net]
技術も何もメイリオあたりもそういうのじゃなかったっけ
結局調整が必要になるっぽいけど

431 名前:デフォルトの名無しさん mailto:sage [2019/06/07(金) 08:07:16.78 ID:rFfmCjQx.net]
なんか思ってた技術と違うわ。
IDSの組合せをそれが表現する漢字と対応させるんかと思ってた。



432 名前:デフォルトの名無しさん [2019/06/07(金) 11:40:10.92 ID:nJu+ZeI9.net]
糸冬



433 名前:デフォルトの名無しさん mailto:sage [2019/06/09(日) 18:38:42.78 ID:+hAUN3Ld.net]
漢字構成記述文字列って複数の記述文字の組み合わせとそもそもの複数の文字とをどうやって区別するんだろう。
「⿰山⿱上下」という並びが「峠」を意味するのか「山𠧗」を意味するのか区別できなくね?

434 名前:デフォルトの名無しさん [2019/06/09(日) 20:33:00.79 ID:SSgQq8CW.net]
頻出度?

435 名前:デフォルトの名無しさん mailto:sage [2019/06/09(日) 22:49:36.82 ID:lml609nH.net]
1文字になる以外の解釈が可能な定義にはなってないように見えるが

436 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 00:45:55.32 ID:/7QyuKh+.net]
というかもともとそういうもんじゃない?
あれは人間が読むことを前提にした文中で説明を簡素にするために使う記号であって
合成とか機械処理とかをやることははなから考えてないと思う。

437 名前:デフォルトの名無しさん [2019/06/10(月) 11:07:15.11 ID:g6tidy/F.net]
⿰山⿱上下 → 山𠧗

⿰⿱山上下 → 峠

438 名前:デフォルトの名無しさん [2019/06/10(月) 11:10:17.22 ID:g6tidy/F.net]
違うな
>>430 が正しい

⿰山⿱上下 → 峠 (正しい)
⿰山⿱上下 → 山𠧗 (不正)
山⿱上下 → 山𠧗 (正しい)

⿰⿱山上下 → 峠 (知らんがな)

439 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 11:14:02.36 ID:DwfAnHcn.net]
>>433
最後のは不正では。
⿰⿱山上下なら
↓こんな文字になっちゃう
o.8ch.net/1gwka.png

440 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 13:25:56.68 ID:ujTvUCPf.net]
カッコなしで誤解釈の余地なくやるにはRPNにすればよいのでは?

441 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 14:05:24.64 ID:DwfAnHcn.net]
括弧なしでも漢字構成記述文字列は一意に定まるぞ。
曖昧さの余地はない筈。



442 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 14:06:48.56 ID:DwfAnHcn.net]
ていうかそもそも漢字構成記述文字列自体がポーランド記法っぽい性格を持ってる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434みたいな字形になる。

443 名前:デフォルトの名無しさん [2019/06/10(月) 14:17:40.77 ID:g6tidy/F.net]
同じ文字を二通り以上の表現方法があるのはセキュリティ上やばいと爺さんが言ってた
UTF-8みたいなやつ

444 名前:デフォルトの名無しさん [2019/06/10(月) 14:19:52.70 ID:g6tidy/F.net]
例えば

⿰男⿰女男

⿰⿰男女男

445 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 14:43:12.52 ID:VjrzvIQA.net]
男女 男

右端は俺orz

446 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 14:45:35.90 ID:AYc4wpPC.net]
全然関係ないが男女男男女女男女男女を思い出した。おっさんだな、俺。

447 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 14:55:32.08 ID:DwfAnHcn.net]
>>439
嬲は「⿲男女男」じゃないの?

448 名前:デフォルトの名無しさん [2019/06/10(月) 14:56:33.42 ID:g6tidy/F.net]
だから複数あるっていう意味で書いたんだが

正規化で一つにっていうのは判る

449 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 20:42:06.03 ID:QC59E/Dz.net]
表現意図としては比が2:1:1と1:1:2と1:1:1で違いがあるような

450 名前:デフォルトの名無しさん mailto:sage [2019/06/10(月) 23:11:41.70 ID:rO86gbFX.net]
>>399-400
鼻濁音付き仮名文字は日本NBから提案したけど蹴られて今の姿になった。
std.dkuug.dk/JTC1/SC2/WG2/docs/n2092.pdf

仮名文字に限らずシーケンスで表現可能な文字に単体の文字コードを割り振ってもらうのは
相当説得力のある理由が要る。

逆に辞書用の記号は提案書を出せば通る可能性ありそう。

451 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 01:59:35.04 ID:SK3ydrDR.net]
ぽげむたは?



452 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 04:13:44.44 ID:Yb3f0IhW.net]
>>443
いや、>>444も言っている通り嬲は「⿲男女男」以外で表わせないと思うよ。

453 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 08:44:46.66 ID:GW+sQhXS.net]
将棋好きのおいらとしては、ひっくり返った「玉」「飛」「歩」とかも
登録してほしいと思うのだが。

454 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 10:41:29.12 ID:Yb3f0IhW.net]
>>448
Unicodeってそもそも将棋の駒 全部登録されてないんじゃ?

455 名前:デフォルトの名無しさん [2019/06/11(火) 11:48:29.98 ID:9Qw6sZwd.net]
笑→ケケ夭
とか
禁→木木示
とか
哭→口口犬
とか

畿→糸糸田戈
は同じ表現?

456 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 12:18:11.06 ID:Yb3f0IhW.net]
>>450
まあ機械処理向けの言語じゃないから
人が「分解できる」と思うかどうかだよね
ちなみに「畿」の部首って「田」なんだな。すげー意外。

457 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 12:35:42.68 ID:GW+sQhXS.net]
>>449

ないよ。黒塗り五角形と白ヌキ五角形だけ。

458 名前:デフォルトの名無しさん [2019/06/11(火) 14:57:42.64 ID:Y18rXsQw.net]
文字表現ってことで
●●構えっていうと門しか思い出せないし
●●囲いっていうと口しか思い出せないけど
将棋の駒の白抜き五角形は囲いなんだろうか

459 名前:デフォルトの名無しさん mailto:sage [2019/06/11(火) 17:55:27.24 ID:Yb3f0IhW.net]
いっそのことCombining Diacritical Marks for Symbolsあたりに将棋の駒の枠線を登録してもらえればいい

460 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 00:03:22.24 ID:82Q6hISi.net]
>>424
そこ日本の会社

461 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 01:16:49.13 ID:ynCJAfYS.net]
>>454
枠線の中に複数文字入れるのどうするとか
中に「と」みたいなのを表示したい場合それは本当に「と」で表現するのかとかいろいろややこしくなりそう
将棋みたいに中身が決まってるやつは一通り個別に並べてもらったほうがシンプルじゃないのかな…



462 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 01:57:37.00 ID:qj/fM2VI.net]
https://www.unicode.org/L2/L2018/18170-shogi.pdf

逆さのまではなくてもいいと思うがなあ

463 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 07:01:32.61 ID:XwhNnAHz.net]
あ、すでに議論の対象にはなってるのか。

464 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 08:39:27.70 ID:QJXYMRLU.net]
>>453
黒と白で、先手と後手を表しているだけだよ。

465 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 09:02:03.43 ID:om/mzkP2.net]
文章中に書くなら白黒五角形で十分だと思うが、なんで盤面まで表現したがるかな。

466 名前:デフォルトの名無しさん [2019/06/12(水) 11:21:19.79 ID:tqvE0DW+.net]
歩の裏の「と」があるべき位置に
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?

467 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 12:54:03.65 ID:QJXYMRLU.net]

三 みたいなやつ?

全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。

468 名前:デフォルトの名無しさん [2019/06/12(水) 13:18:58.92 ID:tqvE0DW+.net]
Tも三も金なんですね

469 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 17:24:29.90 ID:XwhNnAHz.net]
どうでもいいけどそのレスを見て
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない

470 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 17:54:37.18 ID:o59LDmQW.net]
歩兵の裏は金と同じ読みの今(きん)の崩し字をあてたので
「と」と極めて似た文字になったという説がある

471 名前:デフォルトの名無しさん [2019/06/12(水) 23:56:15.89 ID:4S3+zhe0.net]
T



なんでこれで金になるのかさっぱり判らん
https://blogimg.goo.ne.jp/user_image/50/8a/03ddf56cb868756327fb330bdd9e5231.jpg

あと
|
とか

とか
謎のが多すぎ



472 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:03:53.78 ID:WD6Kvaf7.net]
崩し字はむずかしうてわからん

473 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:05:01.31 ID:WD6Kvaf7.net]
崩し字というかバラし字?

474 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:11:22.08 ID:uH0MzXQS.net]
>>457
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
www.unicode.org/L2/L2018/18183.htm のe.5

で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.

インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。

475 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:32:11.84 ID:domb7+if.net]
なるほどなあ。
チェストーはインラインで使ったりするもんなんだろうか

476 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 06:29:39.15 ID:IV8IxRGq.net]
日本NBが後押しすれば10646に入りそうな気がするけどね
漢字以外は興味持たないだろうって見透かされてるんだろうな

477 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 11:32:49.03 ID:BMAIfRwQ.net]
まあ言いたかないけど 欧米が制定した企画だからね……。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。

478 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 12:45:36.88 ID:AVMOMmmV.net]
https://nixeneko.hatenablog.com/entry/2018/03/04/140000
モンゴル文字のことはよくわからんが、ここに書いてあることによると、

> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。

> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。

ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。

479 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 12:54:39.24 ID:AVMOMmmV.net]
ただ、似たようなものは英文にもあるわけで、fish や office のように、
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。

しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。

480 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 13:00:53.97 ID:AVMOMmmV.net]
ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。

481 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 21:13:23.45 ID:bakZpKUF.net]
ガチャーン合体!



482 名前:デフォルトの名無しさん mailto:sage [2019/06/15(土) 12:06:26.17 ID:s4HbSmAb.net]
>>466
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。

483 名前:デフォルトの名無しさん mailto:sage [2019/06/15(土) 21:00:26.68 ID:dgVxOSWc.net]
わけわからんまで崩していくのは日本独特?

484 名前:デフォルトの名無しさん [2019/06/16(日) 11:45:02.01 ID:NdAq/MEw.net]
これもなんで金になるのか判らんやつ

でいいのに
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRN0np1ZmeG8ZgXTV8K1Vjx-yF9KCNZgu3AKkiOYyYxdnnl-wk7

485 名前:デフォルトの名無しさん mailto:sage [2019/06/16(日) 13:03:35.22 ID:8f8EXiHl.net]
木天火土水で6人目のゴールドは光です・・・

486 名前:デフォルトの名無しさん mailto:sage [2019/06/16(日) 17:16:00.47 ID:UaT4ATnR.net]
>>479-480
わらったw

487 名前:デフォルトの名無しさん [2019/06/18(火) 06:18:41.06 ID:3nOE2mBA.net]
プログラム板にキチガイ降臨中!botに一晩も反応する異常さ
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
https://mevius.5ch.net/test/read.cgi/tech/1559872586/

142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。

488 名前:デフォルトの名無しさん mailto:sage [2019/06/22(土) 01:57:21.14 ID:t+lz7b+S.net]
>>482
釣られて そのスレ見に行ったけど
寧ろそのa4っていう小手の人が被害に遭ってるように思えたけどな

489 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 03:50:40.53 ID:wcrPNuwW.net]
ヲシテ文字って使えないの?

490 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 05:40:01.35 ID:DXMPLOPq.net]
Unicode協会が配布してるプログラムでシェルスクリプトでUTF-8文字列を扱えるデータってないかな。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。

491 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 06:09:39.19 ID:1JIWmrxD.net]
にほんごでおk



492 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 06:42:32.78 ID:DXMPLOPq.net]
CLDR for shellみたいなのがないかなと。

493 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 13:49:53.45 ID:takEpFxW.net]
Unicode協会って書かれると、アグネスがやってるパチモンに見えてくる

494 名前:デフォルトの名無しさん mailto:sage [2019/06/28(金) 22:59:11.92 ID:NkHCwivq.net]
使えないよ
その手の文字が登録されたことはあるのかな

495 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 01:02:31.02 ID:P81PdZpf.net]
Dohentaiyagana

496 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 01:49:55.29 ID:LWdOpl9S.net]
神代VSでまとめてしまおう

497 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 02:20:12.41 ID:g9Pe6ky6.net]
最近Kenのツイートが酷い
LunaticとかAdobe的にいいのか

498 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 02:04:42.75 ID:1ALBmyOB.net]
絵文字をリガチャとして実装するという話を聞いたことがあるが
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。

499 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 02:44:42.35 ID:KxegnpZe.net]
絵文字ガチャに見えた

500 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 18:46:20.88 ID:1ALBmyOB.net]
https://symbolset.com/
これとか。素晴しい発想だと思いませんこと?(お嬢様風)

501 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 19:55:14.68 ID:VWoLS78P.net]
全然



502 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 20:32:53.74 ID:MkBgWLvD.net]
見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう

503 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:02:05.57 ID:1ALBmyOB.net]
>>497
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。

504 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:31:19.26 ID:2juPiYlp.net]
なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?

505 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 22:16:35.89 ID:MkBgWLvD.net]
>>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。

入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし

506 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 23:23:56.67 ID:sPnkqdOZ.net]
どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい

507 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 00:12:01.52 ID:vOsPyG+v.net]
This is a pen��.とか[�� Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a ��guin.の誤爆避けも必要になる。

508 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:02.84 ID:2smzn43h.net]
https://8beat-studio.net/how-to-use-ligaturesymbols/
とか? >>499

509 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:32.89 ID:2smzn43h.net]
>>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。

510 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:13:03.16 ID:2smzn43h.net]
>>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。

511 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 12:02:58.02 ID:liKrIWIO.net]
SVGベタ書きがいいと思う



512 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 13:38:09.58 ID:Ltl936Sg.net]
WebフォントってDL待ちでむしろ遅いイメージしかないな…

513 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 16:21:02.28 ID:MoEwNeEz.net]
日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…

514 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 19:16:16.83 ID:2smzn43h.net]
>>507
>>508
絵文字リガチャフォントだと高々100個くらいだから
日本語Webフォントの常識は当て嵌らんぞ

515 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 21:01:31.88 ID:1h0unusf.net]
推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。

516 名前:デフォルトの名無しさん mailto:sage [2019/07/04(木) 14:48:01.78 ID:nXaEmuLe.net]
ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
https://www.iso.org/standard/73773.html

いつの間にか完成していた。

517 名前:デフォルトの名無しさん mailto:sage [2019/07/05(金) 07:31:35.09 ID:CMdnJVDV.net]
JISにも取り込まれるかな?

518 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 14:32:58.64 ID:q8HbeEfz.net]
>>97
BCってなに?

519 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 23:51:11.25 ID:aHiS7zOG.net]
ブラックキャップ

520 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 19:08:40.33 ID:Wy302ne8.net]
まじめに答えてほしかった。。。

521 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 20:43:48.97 ID:tESkaNg7.net]
����?



522 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 22:47:35.97 ID:0DH1k/wL.net]
>>516
何これ?

523 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 01:25:41.28 ID:cxt0+A+5.net]
ブラックキャップ

524 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 09:54:29.74 ID:N6Jg+9Qo.net]
ワロタ

525 名前:デフォルトの名無しさん [2019/07/14(日) 22:04:02.29 ID:GSQZGuhE.net]
>>513
>>97じゃないから確かなことは言えないけど
「better choice」じゃないかな?
つまり絵文字を「入れざるを得ない」ってことね。

526 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 03:44:17.27 ID:GN7I2Kmp.net]
単に後方互換だろ…

527 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 04:14:22.81 ID:GXO+LVjR.net]
BA-90使いたいのに斑の黄顔になるのはなんだかなー

528 名前:デフォルトの名無しさん mailto:sage [2019/07/16(火) 23:08:05.64 ID:6ZdisLnD.net]
IC: 相互互換性
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた

529 名前:デフォルトの名無しさん [2019/07/17(水) 11:56:39.82 ID:FD/sfaX1.net]
LeftとかRightとかCorrectは無いんか

530 名前:デフォルトの名無しさん mailto:sage [2019/07/17(水) 16:54:36.95 ID:Lq1+nMLH.net]
>>524
correctはともかく左右は確実にねーだろw

531 名前:デフォルトの名無しさん [2019/07/18(木) 14:33:21.11 ID:44Ax18Yo.net]
共産とりっけんと社民社と国民主と令和革命はLC互換



532 名前:デフォルトの名無しさん mailto:sage [2019/07/18(木) 23:12:28.17 ID:BkvY1rKv.net]
>>526
わろたw

533 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 15:56:55.39 ID:vatz3/hX.net]
https://github.com/qntm/base65536
↑Unicodeの基本多言語面を使ったエンコード方法w

534 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 17:04:19.76 ID:yKl7I/yp.net]
高度に発達したエンコードはMojibakeと見分けがつかない

535 名前:デフォルトの名無しさん mailto:sage [2019/07/24(水) 00:37:51.21 ID:ArGZw8p9.net]
基本多言語面って制御文字含んでるよね。
それbaseXXの

536 名前:{来の意味を成してないw []
[ここ壊れてます]

537 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 16:07:01.10 ID:zqR8kD3Y.net]
W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
https://www.w3.org/People/mimasa/xmldev.html.ja.sjis

538 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 17:27:15.46 ID:wpOWgZAQ.net]
読めるけど...?

539 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 23:04:31.46 ID:8LEpKI7v.net]
ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ

540 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 01:20:35.42 ID:JKQq3Dbg.net]
(´・・∀・・`)ほう

541 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 06:07:28.33 ID:xlQPwL5+.net]
>>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。
最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。



542 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 07:31:42.15 ID:SJok1opV.net]
>>535
Firefox68には文字コード指定が残ってる
通常は無効になってるけど>>531のリンク先を表示したときは有効になって
ISO-2022-JPを指定すると文字化けなしで読めた

543 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 08:38:57.28 ID:xlQPwL5+.net]
ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?

544 名前:デフォルトの名無しさん [2019/08/20(火) 11:37:07.61 ID:zlJnj2O9.net]
>>531
これはひどいω

545 名前:デフォルトの名無しさん [2019/08/20(火) 11:39:07.12 ID:zlJnj2O9.net]
>>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ

546 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 18:30:12.77 ID:Gkd3xMH4.net]
なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843

547 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:44:07.86 ID:Y189B2BT.net]
HTMLをiso-2022-jpにするのって
どこの文化なんだろうか?

Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?

iso-2022-jpはメールにしか使われてなかったはずだが

548 名前:デフォルトの名無しさん [2019/08/20(火) 21:47:57.43 ID:UVunetX1.net]
>>531
イシカワ マサヤスというのは誰だろうね。

549 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:51:25.41 ID:Y189B2BT.net]
イシカワ マサヤスさんでは?

550 名前:デフォルトの名無しさん [2019/08/20(火) 21:52:36.86 ID:UVunetX1.net]
石川雅康と石川哲志は親族だろうか?

どちらもICT業界から去ったのかな。

551 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:54:13.55 ID:Y189B2BT.net]
またつまらんものを



552 名前:デフォルトの名無しさん [2019/08/20(火) 21:58:33.22 ID:UVunetX1.net]
XHTMLが終わってしまって、そのまま放置の石川さん。

553 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 22:46:49.05 ID:anpoimU7.net]
>>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
ttp://www.tohoho-web.com/lng/199801/98011002.htm

554 名前:デフォルトの名無しさん [2019/08/20(火) 23:01:02.75 ID:UVunetX1.net]
>>547
http://の先頭のhを取っても付けても同じですよ。

555 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 23:43:43.88 ID:Gkd3xMH4.net]
> どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html
えぇ……。

556 名前:デフォルトの名無しさん [2019/08/21(水) 00:08:09.19 ID:/FRdjxvW.net]
1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。

557 名前:デフォルトの名無しさん mailto:sage [2019/08/21(水) 02:35:13.27 ID:GZen3C6t.net]
>>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?

> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。

558 名前:デフォルトの名無しさん [2019/08/21(水) 03:44:23.93 ID:jDiMObB6.net]
>>540
流れは似てるが今回は指摘されてるURLが問題なんだろ
よりによってアイツがってやつさ

559 名前:551 mailto:sage [2019/08/21(水) 05:07:33.18 ID:GZen3C6t.net]
あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か

sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?

https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa

560 名前:デフォルトの名無しさん [2019/08/21(水) 14:49:37.63 ID:ur92HW83.net]
拡張子付け間違いか

561 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:16:14.71 ID:mlpPC2JR.net]
ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。



562 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:36:57.94 ID:jM8tCXZ0.net]
だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば

iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話

563 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 08:04:31.58 ID:jlFkmCtz.net]
jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで

564 名前:デフォルトの名無しさん [2019/08/22(木) 09:50:35.92 ID:xQsiKIbM.net]
鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る

565 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:23:09.36 ID:jM8tCXZ0.net]
>>557
拡張子はjisじゃなくてsjisな
だからドキュメントの文字コードが明らかに間違ってるんだよ

566 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:30:34.86 ID:jM8tCXZ0.net]
昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。

なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった

そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。

たぶんこんなところ

567 名前:デフォルトの名無しさん [2019/08/22(木) 10:33:49.69 ID:8JJS2LZD.net]
>>559
お前のレスの >>556 には jis って書いてあるだろω
お前が原因

568 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:35:00.76 ID:jM8tCXZ0.net]
>>561
単なる書き間違えじゃね?
リンク先見ればわかるでしょ

569 名前:デフォルトの名無しさん [2019/08/22(木) 10:38:26.99 ID:8JJS2LZD.net]
>だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jis

こういうおっちょこちょいが >>531 みたいなミス連発するんだろうな

570 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 15:58:03.72 ID:mlpPC2JR.net]
皆さん落ち着いて

571 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:29:19.40 ID:bWgnQwQ7.net]
なんでUTF8以外違法になった今そんな話してんだか・・・



572 名前:デフォルトの名無しさん mailto:sage [2019/08/23(金) 17:59:07.09 ID:UifFOlyJ.net]
× 違法 ○ 非推奨

573 名前:デフォルトの名無しさん mailto:sage [2019/08/24(土) 00:05:20.43 ID:Ka96Zrl8.net]
秘宝とか緋水晶とか何の話をしてるんだ?

574 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 20:34:39.12 ID:++G8a3I1.net]
ムーンプリズムパワー!メイクアップ!

575 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:05:01.03 ID:E2o3oeEK.net]
タリスマン

576 名前:デフォルトの名無しさん mailto:sage [2019/08/25(日) 22:36:09.44 ID:heTmUHGD.net]
クリマタスミ

577 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 13:35:52.48 ID:AiVdwxrR.net]
ひまだ

578 名前:デフォルトの名無しさん [2019/08/28(水) 19:19:16.62 ID:lfvHhqTB.net]
サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。

579 名前:デフォルトの名無しさん mailto:sage [2019/08/28(水) 20:04:07.93 ID:FG4A80Dg.net]
じっさい32じたいそんな使わないだろw

580 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:28:30.40 ID:VG5IecJ5.net]
でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。

581 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 18:42:08.11 ID:y3rrvHgi.net]
読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている



582 名前:デフォルトの名無しさん [2019/08/29(木) 18:49:00.69 ID:1ks18uap.net]
内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利
あとはcps932が滅ぶのを待つだけ

583 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:05:33.35 ID:VG5IecJ5.net]
OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。
でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。

584 名前:デフォルトの名無しさん [2019/08/29(木) 19:09:37.98 ID:CAV+1+Xc.net]
という会話を何年も前にこのスレで観た

585 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 19:11:19.48 ID:YrWceYNE.net]
複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない

586 名前:デフォルトの名無しさん [2019/08/29(木) 20:02:33.30 ID:jljmwQsV.net]
プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。

587 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 21:00:32.68 ID:FJllEP/G.net]
【名案】0〜9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021−65018=3」ってどう書くの?
https://togetter.com/li/1396827

588 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 22:50:02.31 ID:azXlKn0W.net]
UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw

漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/

589 名前:デフォルトの名無しさん [2019/08/29(木) 23:01:38.50 ID:jljmwQsV.net]
UTF-8だけで必要十分という結論に到達せざるをえない現実

590 名前:デフォルトの名無しさん mailto:sage [2019/08/29(木) 23:09:19.19 ID:azXlKn0W.net]
逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、
UTF-32でも不便になったからUTF-8でいいでしょ?
どうせ単純には扱えずライブラリ使うしか無いんだから。
という必要十分な文字コードを捨てたというのが現実

591 名前:デフォルトの名無しさん [2019/08/29(木) 23:11:55.32 ID:jljmwQsV.net]
宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。



592 名前:デフォルトの名無しさん [2019/08/30(金) 00:11:25.73 ID:h/StilS8.net]
文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw

593 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:01:22.62 ID:LpXSw35l.net]
UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは

594 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 01:29:38.44 ID:/ghu33Nb.net]
>>586
ではどうぞ御説明をどうぞw

595 名前:デフォルトの名無しさん [2019/08/30(金) 13:00:23.27 ID:oVszNH41.net]
>>579
codecvtは糞だ

596 名前:デフォルトの名無しさん [2019/08/30(金) 13:03:12.55 ID:oVszNH41.net]
>>580
だった
まあどっちでもいいけど

597 名前:デフォルトの名無しさん [2019/08/30(金) 15:32:59.58 ID:6uSriybI.net]
>>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。

598 名前:デフォルトの名無しさん mailto:sage [2019/08/30(金) 15:56:24.57 ID:iPGqG8dk.net]
>>591
それぐらいみんな知ってる

599 名前:デフォルトの名無しさん [2019/08/30(金) 17:05:21.42 ID:GEn/r+mZ.net]
>>592
それぐらいみんな知ってる

600 名前:デフォルトの名無しさん [2019/08/30(金) 17:19:36.31 ID:57FOZgRt.net]
ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。

601 名前:デフォルトの名無しさん [2019/08/30(金) 17:27:36.02 ID:GEn/r+mZ.net]
定期
貼れるんかこれ
https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b



602 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 10:08:53.77 ID:0iGUnrw4.net]
>>591
スレの流れみた?UTF-32の話をしてんだぞ?

603 名前:デフォルトの名無しさん [2019/08/31(土) 15:33:43.16 ID:SHne0DDt.net]
>>596
そのまえ

604 名前:デフォルトの名無しさん [2019/08/31(土) 15:35:30.15 ID:SHne0DDt.net]
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ

605 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:37:04.56 ID:3i1dPJsj.net]
>>598
それは理由が書いてないから、読む価値ある?

606 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:45:23.47 ID:4qIvp+ND.net]
なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ

607 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 15:56:52.05 ID:3i1dPJsj.net]
ん?支持しなくて良いよ

608 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 17:12:51.44 ID:0iGUnrw4.net]
>>597
じゃあ >>586 はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句,
碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?

609 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 17:59:12.56 ID:Yn5v13ie.net]
ネットウヨw

610 名前:デフォルトの名無しさん [2019/08/31(土) 20:21:37.85 ID:5EL66xzp.net]
re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。

611 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 22:52:53.39 ID:0iGUnrw4.net]
寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。



612 名前:デフォルトの名無しさん mailto:sage [2019/08/31(土) 22:58:57.55 ID:3i1dPJsj.net]
UTF-32対応は難しいから無理だろ

613 名前:デフォルトの名無しさん [2019/09/01(日) 01:36:48.58 ID:sYwYgS29.net]
iconv禁止

614 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 09:07:17.74 ID:XF6G4Ohn.net]
NKF(Network Kanji code conversion Filter)を使えば?

Ruby にも、NKF モジュールがある

615 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 10:46:26.40 ID:YneNC5Ev.net]
別にコード変換ツールを探してるわけじゃなくね?w

616 名前:デフォルトの名無しさん [2019/09/01(日) 10:52:49.46 ID:kCJZVLuH.net]
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決

617 名前:デフォルトの名無しさん [2019/09/01(日) 12:53:54.91 ID:k0czTyLP.net]
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。

618 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb.net]
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

619 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:11:25.72 ID:xmxF7u0H.net]
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。

620 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 13:35:49.57 ID:JCPxJyAV.net]
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ

621 名前:デフォルトの名無しさん [2019/09/01(日) 13:40:59.73 ID:kCJZVLuH.net]
>>612
おまいもかなり可笑しいなω



622 名前:デフォルトの名無しさん [2019/09/01(日) 13:42:43.07 ID:k0czTyLP.net]
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。

623 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:01:22.04 ID:JCPxJyAV.net]
(もしかして: フォント)

624 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH.net]
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない

625 名前:デフォルトの名無しさん [2019/09/01(日) 14:29:25.97 ID:k0czTyLP.net]
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。

626 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 14:38:49.28 ID:5y1tL0M+.net]
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ

627 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:12:24.21 ID:VpClr4jS.net]
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが

628 名前:デフォルトの名無しさん mailto:sage [2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH.net]
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www

629 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 15:56:23.21 ID:8MncpZHQ.net]
魔法(圧力)

630 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 16:24:11.77 ID:KSSQVEnP.net]
>>623
どこからの?
セブンイレブンとか?

631 名前:デフォルトの名無しさん mailto:sage [2019/09/02(月) 22:33:53.67 ID:8MncpZHQ.net]
マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。



632 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 00:26:14.39 ID:EcUF0HHf.net]
そんな圧力あったかなあ

633 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 06:39:22.40 ID:KovswbEV.net]
>>625
所でLinuxもデスクトップ環境も
一つに統一したほうが良いのではないか?ん?

634 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 08:49:15.73 ID:/ybqtULG.net]
MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある

https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC

635 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 10:21:51.94 ID:KovswbEV.net]
PDFはアドビのプロプラフォーマットってイメージが抜けないw

636 名前:デフォルトの名無しさん [2019/09/03(火) 10:34:53.29 ID:gWEsYspA.net]
JavaだってSunのプロプラ言語だぞ

637 名前:667 mailto:667 [2019/09/03(火) 12:40:23.25 ID:JzHlK+VD.net]
今は違うけどね

638 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 15:04:07.63 ID:jfAsT/N5.net]
そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる

639 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 15:40:05.81 ID:KovswbEV.net]
Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる

640 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 16:56:31.60 ID:MR8tgZNH.net]
>>627
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。

641 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 16:58:35.78 ID:MR8tgZNH.net]
>>628
当時PDFは国際標準にこそなってなかったが,
オープンフォーマットだったし,様々な場面で使われてた。
ただ描画ソフトがクソ重たいのしかなかった記憶がw



642 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 17:26:28.25 ID:KovswbEV.net]
>>634
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ

643 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 17:35:15.54 ID:KovswbEV.net]
>>635
> オープンフォーマットだったし
PDFはオープンではありませんでした。
プロプライエタリだって言ってるだろ

644 名前:デフォルトの名無しさん [2019/09/03(火) 19:23:12.90 ID:i0SweFPn.net]
>>633
いつの知識なのかw

Windowsは表面的にはSJISで、内部ではUTF-16だ。

645 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 19:25:28.03 ID:KovswbEV.net]
> Windowsは表面的にはSJISで
ほらな、SJISじゃないって言ってんのにSJISだっていう
潜在意識レベルでそう思い込んでるから治しようがないw

646 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 19:51:10.42 ID:9BNoj6TJ.net]
WindowsというよりWindowsアプリが特定のOEMコードページやANSIコードページに決め打ちして作られてる物があるということだろ
他言語の状況は知らんけど日本語以外でも似たようなものだろうな

647 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:04:34.10 ID:VgehgunL.net]
Linuxの思想自体は多様性を重んじるのかもしれんが、ユーザーはそれに反して
「UTF-8以外死ね」みたいに言う奴多いよな。

648 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:08:34.33 ID:KovswbEV.net]
そうはいってもLinuxはASCIIと互換性がない文字コード(例 UTF-32)は死ねだからw
影響範囲が大きすぎて、LinuxはUTF-16とかUTF-32には事実上対応できないんだよね

649 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 21:51:19.99 ID:kvsGhJj2.net]
文字集合を符号化するのは、文字の区切れが判断できないからって解釈してんだけどあってる?

650 名前:デフォルトの名無しさん mailto:sage [2019/09/03(火) 22:15:09.34 ID:18+sQUYN.net]
>>634
>多様性を重んじる。俺はそっちのほうが好きかな。

ところでホモにつきまとわれたらどうする?

651 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 01:38:53.56 ID:Gs/bLtCt.net]
一橋大学アウティング事件でググれ



652 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 04:00:00.76 ID:xGPrnpMI.net]
>>644
ホモであることは否定しないが、ホモは嫌いという俺の感情も尊重していただきたい
これが多様性だ!

653 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 09:16:30.39 ID:n47u8TF1.net]
>>645
ホモにつきまとわれて困ると友人にこぼしたら、
性癖を暴露されたとか言われて更に嫌がらせで自殺された事件?
ああいうの見てると、ホモの権利拡大とかしちゃいかんよなって思うよなあ

654 名前:デフォルトの名無しさん [2019/09/04(水) 18:11:05.05 ID:gX5VYMvu.net]
>>639
Windowsが作るシステムファイルもSJISですよ?

655 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 18:12:22.94 ID:vwhL3cv7.net]
>>648
そういうネタはいらんから

656 名前:デフォルトの名無しさん [2019/09/04(水) 18:52:19.95 ID:gX5VYMvu.net]
>>649
延々と嘘を書くのはやめてもらえませんか?

657 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 19:01:15.19 ID:vwhL3cv7.net]
ネタにネタをかぶせてもつまらんで

658 名前:デフォルトの名無しさん [2019/09/04(水) 19:24:35.38 ID:gX5VYMvu.net]
妄想か

659 名前:デフォルトの名無しさん mailto:sage [2019/09/04(水) 22:41:17.45 ID:n47u8TF1.net]
まあWindowsはNTカーネルとは限らないからな

660 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 00:35:42.74 ID:rtvg+Hab.net]
>>653はNTカーネルに限ると完全Unicode対応って意味やで

661 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 00:50:59.59 ID:5i/MxHnj.net]
ここでUnicodeといっちゃうあたりの頭の弱さよ



662 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 01:09:51.35 ID:rtvg+Hab.net]
補足すると、Unicodeは文字列集合で
符号化方式がUTF-16やUTF-8など
どの符号化方式であってもUnicodeといえる

>>655
さて、何か言い返したい言葉は有るかね?

663 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 01:11:05.81 ID:rtvg+Hab.net]
どうせ言い返す言葉は無いだろうから
待ってても時間の無駄なので先に言っておくと
何も言わない or 捨て台詞はくだけ なら俺に喧嘩売らなければいいのにw

664 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 04:37:49.32 ID:5ZYYoPpa.net]
完全Unicode対応ならどの符号化方式も対応してなきゃダメだろ

665 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 05:59:20.80 ID:rtvg+Hab.net]
※ LinuxはUTF-16、UTF-32に対応していません

666 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:00:04.95 ID:rtvg+Hab.net]
※ MacもUTF-16、UTF-32に対応していません

667 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:48:35.75 ID:5ZYYoPpa.net]
他者を貶めたところで>>654が真実になることはない

668 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 06:54:53.66 ID:rtvg+Hab.net]
他者を貶めるってなんのこと?

669 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 07:53:38.03 ID:5ZYYoPpa.net]
>>662
NTカーネル以外のものは他者だろ

670 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 08:02:45.45 ID:rtvg+Hab.net]
じゃあNTカーネルに限ってはUnicodeっていうのは正しいってこと?

671 名前:デフォルトの名無しさん mailto:sage [2019/09/05(木) 12:58:50.41 ID:5R9ffMew.net]
どーしても我流を貫きたいんだなw
まあ他人の人生だから干渉するつもりはないが,そういう生き方は苦労すると思うぞ?



672 名前:デフォルトの名無しさん [2019/09/11(水) 17:58:19.49 ID:quHYHgkx.net]
FEFF
https://en.wikipedia.org/wiki/FEFF

673 名前:デフォルトの名無しさん mailto:sage [2019/09/12(木) 12:27:59.62 ID:umd/llTn.net]
全然関係ないけどWPへのリンクはMWの短縮URLが使える。
https://w.wiki/8Ew

674 名前:デフォルトの名無しさん mailto:sage [2019/09/12(木) 12:43:49.99 ID:vEKot6kT.net]
本当に短縮したいところは日本語ページのパーセントエンコードされたところだがうまくいかないもんだな

675 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 09:23:49.73 ID:rpBkWpcK.net]
日本語のページも短縮URLにできるんだけど,そうじゃなくて?

676 名前:デフォルトの名無しさん [2019/09/13(金) 10:11:35.77 ID:wKEqF87n.net]
文字通り文字コードのエンコードを間違えてるんだろう

677 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 16:18:49.47 ID:nYKvQkSU.net]
[%E5は無効なエンコードです。メインページに戻る。]

678 名前:デフォルトの名無しさん mailto:sage [2019/09/13(金) 17:19:54.63 ID:PF759nqS.net]
当たり前だけど問題ないな
https://w.wiki/8Hy

679 名前:デフォルトの名無しさん mailto:sage [2019/09/14(土) 00:14:10.89 ID:UZ9Fxxpp.net]
これ使われた順に生成されていくの?
そのうち4文字になるんかな

680 名前:デフォルトの名無しさん [2019/09/14(土) 00:23:57.48 ID:FV8dJ/wR.net]
絵文字などサロゲートペアが必要な領域をUTF-7で表現するとUTF-32よりもバイトサイズが大きくなる。まめな。

681 名前:デフォルトの名無しさん [2019/09/14(土) 11:56:27.23 ID:mIZ3m ]
[ここ壊れてます]



682 名前:5oP.net mailto: utf-7が使われてる環境とかデータとか出会ったことが無い []
[ここ壊れてます]

683 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 03:21:10.57 ID:TEajZO+5.net]
見せたろか

684 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 04:11:30.07 ID:LMFjfaUx.net]
見せて!

685 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 04:14:52.61 ID:vhYJbDpr.net]
utf7ってasciiじゃないっけ?

686 名前:デフォルトの名無しさん mailto:sage [2019/09/15(日) 05:00:59.65 ID:cvkFPip1.net]
ここにはない

687 名前:デフォルトの名無しさん [2019/09/15(日) 10:05:21.58 ID:tu3q64lr.net]
>>678
違う

君の理屈だと中国はチベットの一部ということになる

688 名前:デフォルトの名無しさん mailto:sage [2019/09/16(月) 06:54:09.51 ID:vTAkg/qq.net]
じゃ,そういうことじゃん

689 名前:デフォルトの名無しさん mailto:sage [2019/09/21(土) 16:46:43.93 ID:7QW0JGF+.net]
UTF-8もUTF-7も「ASCII互換にしようと思えばできる」文字符号化方式で
UTF-16/32は端から過去互換性を捨ててるっていう理解OK?

690 名前:デフォルトの名無しさん [2019/09/21(土) 17:12:22.41 ID:icgczTg/.net]
互換の意味判ってるか?

691 名前:デフォルトの名無しさん mailto:sage [2019/09/21(土) 17:13:19.94 ID:AMltcnvP.net]
>>682
ちゃんと仕様読め



692 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 02:18:18.82 ID:tTe+mIIa.net]
>>682
意味がわからない

693 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 11:35:45.78 ID:LQCFANDg.net]
>>682
OK

694 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 12:48:42.82 ID:Uxh+z88Q.net]
684デフォルトの名無しさん2019/09/21(土) 17:13:19.94ID:AMltcnvP
>>682
ちゃんと仕様読め

685デフォルトの名無しさん2019/09/22(日) 02:18:18.82ID:tTe+mIIa
>>682
意味がわからない

686デフォルトの名無しさん2019/09/22(日) 11:35:45.78ID:LQCFANDg
>>682
OK

----
どういうことなの…

695 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 15:28:59.04 ID:yDiw/0G9.net]
教訓:5chで情報収集するな

696 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 21:23:59.11 ID:rg/me2jP.net]
互換って何なの

697 名前:デフォルトの名無しさん [2019/09/22(日) 22:18:40.20 ID:sBc79exV.net]
揚げ足取り終了。

質問。皆さんが普段使っている文字コード変換ライブラリでおススメはなんですか。

698 名前:デフォルトの名無しさん mailto:sage [2019/09/22(日) 23:28:10.21 ID:JTFkWMft.net]
お勧めもなにもiconvかICUで大体用は足りる
それで満足しなきゃ自分で作るしかない

699 名前:デフォルトの名無しさん mailto:sage [2019/09/23(月) 08:58:26.51 ID:10n0KRvd.net]
文字コードの変換だけ?
いまどきのまともな言語環境なら変換元のエンコーディングさえ分かってれば標準機能で出来るだろうに
それとも全角⇔半角の変換みたいなのをやりたいってこと?

700 名前:デフォルトの名無しさん [2019/09/23(月) 11:35:21.05 ID:3qdqqJ07.net]
こっちはだめ
https://ja.cppreference.com/w/cpp/string/multibyte/wcstombs
https://ja.cppreference.com/w/cpp/string/multibyte/mbstowcs

これ使え
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/mbstowcs-s-mbstowcs-s-l?view=vs-2019
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/wcstombs-s-wcstombs-s-l?view=vs-2019

701 名前:デフォルトの名無しさん [2019/09/23(月) 14:54:10.02 ID:FPxFvDjY.net]
Windows SDK付属のデバッグ用ソースを見たところmbstowcs_sの文字コード変換は、Win32APIであるMultiByteToWideCharを使っているようですね。



702 名前:デフォルトの名無しさん [2019/09/23(月) 15:08:29.22 ID:3qdqqJ07.net]
MultiByteToWideChar / WideCharToMultiByte 最強

703 名前: mailto:sage [2019/09/23(月) 15:53:59.08 ID:ZLX7TvLd.net]
>>695
確かに便利でありがたかったです
https://mevius.5ch.net/test/read.cgi/tech/1434079972/53

704 名前:デフォルトの名無しさん mailto:sage [2019/09/23(月) 16:01:34.44 ID:51KZjw6P.net]
null-terminatedとそうでない場合の仕様の違いをちゃんと理解してなくて
バグった挙句によけいな1byte追加しちゃったりした思い出。

705 名前:デフォルトの名無しさん [2019/09/23(月) 16:24:42.75 ID:3qdqqJ07.net]
奇遇ですね
https://www.vector.co.jp/soft/dl/winnt/net/se472641.html

706 名前:デフォルトの名無しさん mailto:sage [2019/09/24(火) 00:23:12.23 ID:FsJR6FDp.net]
長い上にださい略し方だ…

707 名前:デフォルトの名無しさん [2019/09/24(火) 14:25:04.46 ID:oiN+60ax.net]
python3でlogging使ってsyslogに出力すると
ASCIIで出力してもなぜか最後に\0が付いてログが残る
鯖側のsyslogdの方で付いてるのかと思ったが
そうじゃなくてpython3が勝手に付けてるみたい
python3のstringがunicode化したときにバグ入ったんかな
python2のときはそんなこと無かった気がする

708 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 12:14:01.12 ID:9XZAk7bA.net]
ttps://bugs.python.org/issue12168

709 名前:デフォルトの名無しさん [2019/09/25(水) 13:11:07.39 ID:BmMtZLRv.net]
深い闇を垣間見た気がする

handler.log_format_string = '<%d>%s'
だと no attribute

handler.setFormatter(logging.Formatter('%(message)s'))
だと結局 \0 付いたままでした

710 名前:デフォルトの名無しさん [2019/09/25(水) 13:18:01.66 ID:BmMtZLRv.net]
コンストラクタ呼ぶ前に
logging.handlers.SysLogHandler.append_nul = False
で解決しました
thx!

711 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 14:09:59.51 ID:sdHp2tVC.net]
エンコードされた文字のバイト並びが
utf-8 と cp832 で同じ(にみえる)ものってどんなのがあります?
そもそも 3bytes と 2bytes なのは仕方ないのですが
utf-8 だと (xx yy zz)
みたいなのが
cp932 だと (xx yy) 00
逆に
cp932 だと (uu vv) (ww xx) (yy zz)
みたいなのが
utf-8 だと (uu vv ww) (xx yy zz)
みたいなのでも良いです
そもそもありえない?



712 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 14:11:59.88 ID:cBdVtg+x.net]
cp932 ってことはいわゆる半角カナも入れて良いのカナ

713 名前:デフォルトの名無しさん [2019/09/25(水) 14:14:32.79 ID:sdHp2tVC.net]
出来れば「美乳」みたいなクオリティ高いのが良いです

714 名前:デフォルトの名無しさん mailto:sage [2019/09/25(水) 16:32:05.43 ID:vuS5tsH7.net]
美乳ってどういう特長を持ってたんだっけ?
エージェントが読み込んだときに確実にShift JISだって判定できるんだっけか。

715 名前:デフォルトの名無しさん [2019/09/25(水) 23:44:33.31 ID:2M81F3EH.net]
PC初心者です。
あるexeファイルをコマンドウインドウで開く。ということをしなきゃならないんだけどシフト+右クリックしてもコマンドウインドウで開くというのがありませんでした
調べたら、コマンドウインドウで開くを表示したい場合メモ帳で名前を付けて保存の時に文字コードをUnicodeにして保存し実行したらレジストリがどうたら書いてあったんでしようとしたら、文字コードにUnicodeがありませんでした。
どうしたら良いですか?

716 名前:デフォルトの名無しさん mailto:sage [2019/09/26(木) 00:04:19.37 ID:Gir9qHZJ.net]
↓最高に面白い回答

717 名前:デフォルトの名無しさん mailto:sage [2019/09/26(木) 00:06:20.67 ID:1IaRoLf+.net]
>>708
>どうしたら良いですか?

諦める
高望みするから人間は苦しむんだよ

718 名前:デフォルトの名無しさん mailto:sage [2019/09/26(木) 01:58:07.64 ID:MW37nPtB.net]
>>704
ASCII以外ではたぶん無いんじゃないかな
cp932としてもutf-8としても正しいバイト列で
それぞれが別の単語になるケースを探したことがあるけど、
それでも両方が意味のある単語になる例は見つけられかった

どういう目的でそういう例を探してるの?

719 名前:デフォルトの名無しさん mailto:sage [2019/09/26(木) 08:30:15.09 ID:NQV5DCT+.net]
>>708
cmdにd&dかバッチファイル作れ
これ以上はスレチ

720 名前:デフォルトの名無しさん mailto:sage [2019/10/08(火) 14:05:40.55 ID:yxEiS4UK.net]
ブログラムソースをUTF16やUTF32で書いてる人いるの?
ブログラム内の文字列のデータじゃなくてブログラムの地の部分

721 名前:デフォルトの名無しさん mailto:sage [2019/10/08(火) 14:10:33.38 ID:J68M6wrj.net]
そんなゴリホーモおらんやろ



722 名前:デフォルトの名無しさん mailto:sage [2019/10/08(火) 15:33:52.08 ID:Dgw8eufS.net]
誰が読むんだ

723 名前:デフォルトの名無しさん mailto:sage [2019/10/23(水) 21:57:19.58 ID:CiGuyy89.net]
まるでUTF-16文書は読むのに向かないかのような発言やな
まともなエディタなら読めて当然。

724 名前:デフォルトの名無しさん [2019/10/23(水) 23:42:00.06 ID:/s0IRa9G.net]
ICUなんてほぼほぼUTF-16ですよ。

725 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 17:29:35.02 ID:mthfJT/n.net]
なんかUnicodeのサイト分裂した?

726 名前:デフォルトの名無しさん mailto:sage [2019/10/24(木) 18:37:57.14 ID:FCkKS+Hu.net]
青っぽいデザイン変更で入口が使いにくくなってる辺り?

727 名前:デフォルトの名無しさん mailto:sage [2019/10/27(日) 00:29:12.62 ID:DVVulqOc.net]
なにそれこわい

728 名前:デフォルトの名無しさん mailto:sage [2019/10/29(火) 16:20:42.34 ID:A7Naqht0.net]
https://home.unicode.org/#
これやな。
なんか謎の意匠がw

729 名前:デフォルトの名無しさん mailto:sage [2019/11/01(金) 01:07:36.40 ID:iOCNEHbC.net]
結局見つかったのは何なの

730 名前:デフォルトの名無しさん mailto:sage [2019/11/01(金) 01:07:53.40 ID:iOCNEHbC.net]
書くとこ間違えた失礼

731 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 19:48:26.91 ID:CD4iEOnB.net]
文を書くときに?や()などの半角にも全角にもある文字はどっちを使うべきなのか迷う。
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか



732 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 21:21:21.06 ID:NIGKt6uf.net]
特に拘りが無いならNFKCに倣う

733 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 23:13:58.98 ID:csRpQu7P.net]
JIS X 0208 を 0201 のスーパーセットにしなかったのが諸悪の根源

734 名前:デフォルトの名無しさん mailto:sage [2019/11/15(金) 23:28:13.72 ID:69Rrw1ZJ.net]
そもそも世界中の文字を一つの体系で包括できると考えたりしたのが…ブツブツ

735 名前:デフォルトの名無しさん mailto:sage [2019/11/16(土) 09:13:00.94 ID:0g4G1zYO.net]
サル共がコンピュータを使わなければ面倒がないのに
とか思われてるよ

736 名前:デフォルトの名無しさん [2019/11/16(土) 10:56:43.05 ID:t6zcY+AG.net]
ASCII に含まれてる記号は半角で入力してる
っていうか IME で半角優先にしてるのでそっちばっかりになる
IME ON の状態であってもスペースももちろん半角だ

737 名前:デフォルトの名無しさん mailto:sage [2019/11/17(日) 00:12:46.29 ID:ZZ8XSzBD.net]
チルダとかハイフンマイナス、引用符あたりは迷う。
これらは単に全角と半角の関係ではないんじゃないかという気がする。

738 名前:デフォルトの名無しさん [2019/11/19(火) 22:24:19.13 ID:lA4rVXxm.net]
0-9A-Za-z は半角だけどその他はちょっと迷うかな
! や ? は書いてるのが日本語漢字仮名交じり文なら全角にするかも

739 名前:デフォルトの名無しさん [2019/11/20(水) 09:53:23.76 ID:grCkJCm3.net]
公文書の「,」なぜ? 半世紀以上、見直し検討
2019 11 18
https://www.sankei.com/life/news/191118/lif1911180006-n1.html

740 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 16:10:59.78 ID:0qs1xY5M.net]
俺は「,」のほうが寧ろ収まりがいいように見えるけどな。
感性で判断するんじゃなくて,論理的根拠をもって「,」か「、」かを決めるべきよね。

741 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 18:03:44.71 ID:oVdD3irj.net]
日本語の文章は分かち書きをするわけではないから、
点があるのにコンマのような後ろにスペースを要する記号を使うのはおかしいと思う。
丸の代わりにピリオドを使うのも同じ。

それにしても、公文書の混ぜこぜの用法はどっちつかずだよな。
もともと、和文タイプライターで使われていた用法なのではないか?



742 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 18:06:42.91 ID:oVdD3irj.net]
使ったこと無いからわからなかったが、全角コンマなんてのがあるんだな。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。

743 名前:デフォルトの名無しさん [2019/11/21(木) 19:11:00.69 ID:wlMAy4t9.net]
>>733
フォント次第ながらも「,」は半角カンマ「,」と一目で見分けることができない。
一方「、」は全角しかない。よって誤植の起きにくい「、」で統一するべき。

744 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:10:52.53 ID:cn6yPDJX.net]
>>736
半角の、だってあるだろ
AAとかでよく使われる

745 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:14:37.01 ID:gyc1+QC+.net]
見分けられないで言い切られたらコーヒー噴くしかない

746 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 21:51:21.49 ID:HJrbCtCI.net]
文字コードスレなのにいまだに「全角」とか言う奴いるんだな

747 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 22:11:40.82 ID:Ht1weGMK.net]
ここまで無知だと辛いどころか辛さも感じないほどにアホなんだろうな
739は

748 名前:デフォルトの名無しさん mailto:sage [2019/11/21(木) 22:27:48.86 ID:T5O6V3Nl.net]
カッコは半角と全角でベースラインが違うフォントも少なくないんで
囲う文字に合わせてる

749 名前:デフォルトの名無しさん [2019/11/22(金) 00:27:47.62 ID:5/IABJQJ.net]
そもそも日本語は句読点は使っていなくて使われ始めたのが
欧米のカンマやピリオドの影響で明治後期くらいからだからな

750 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 01:42:56 ID:1ACgXjue.net]
FULLWIDTHとか出てくるのを全角以外にどう呼べと

751 名前:デフォルトの名無しさん [2019/11/22(金) 01:49:03 ID:VSWkIrxm.net]
句点の代わりに「候(そうろう)」を使ってたんでしょ、昔の人は。



752 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 02:26:32 ID:7JxndsMv.net]
日本はもともと縦書きで「,」なんて使ってなかっただろ?
縦書きでどの位置に「,」を打てばいいのよ?

753 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 03:23:33 ID:QBgvTUOv.net]
縦書きは、を使って横書きは,を使えばいいじゃん
なんで臨機応変に対応できないんだろう?

754 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 03:31:46.87 ID:7JxndsMv.net]
臨機応変に縦書きと横書きを変換するからだよ
ウェブ上では横書き、本にしたら縦書きとかな

755 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 15:56:12.49 ID:WtZSxTNA.net]
漢文で書かれた本の中には、句点は、文字の横に○をつけていたものがる。
江戸時代のくずし字でかられた読み本は、句読点なし。読む人が判断することになっている。

756 名前:デフォルトの名無しさん [2019/11/22(金) 18:59:44.59 ID:VSWkIrxm.net]
教科書フォントに慣れ切って高卒レベルの古典教養しかない現代人は「くずし字」の原書をほとんど読めない問題。

757 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 19:10:33.77 ID:+ybPmekP.net]
筆で書かないと身につかんよ

758 名前:デフォルトの名無しさん [2019/11/22(金) 19:31:16.58 ID:VSWkIrxm.net]
中学高校の古典の授業で、原書を写真印刷した文書を読ませる機会を与えるべきだろう。
活字慣れした現代人は太平洋戦争中の日記や戦場から送られてきた手紙さえ読めない。

759 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 20:55:41.01 ID:QBgvTUOv.net]
厨二満載の文集が他人に読まれなくなる日も近いんだな
よかったワープロが普及する前で

760 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 21:23:42.16 ID:SnsQ0S1X.net]
アメリカでも筆記体が廃れつつあるんじゃなかったか
せいぜいサインする時に使うくらい

761 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 22:42:29.42 ID:+ybPmekP.net]
ラテン文字は筆を選ばないでも問題無いが
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道



762 名前:デフォルトの名無しさん mailto:sage [2019/11/22(金) 23:50:42.29 ID:1ACgXjue.net]
墨汁ドバー

763 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 09:52:15.28 ID:StIP5iHr.net]
ん? 江戸時代から句読点はあったよ。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。

764 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 10:17:05.69 ID:LEhIlmd1.net]
>>756
一般に使われ出したのは明治でしょ

765 名前:デフォルトの名無しさん [2019/11/23(土) 10:53:20.31 ID:cBKKqL2b.net]
>>749-750
今年の漢字の季節ですね

766 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 14:16:40.50 ID:SCQQhBmf.net]
風か水かって感じかなあ
災とかはこの前使ったよね

767 名前:デフォルトの名無しさん [2019/11/23(土) 14:20:31.57 ID:Lev/ciM6.net]
金とか何回か選ばれてるのはあるな
二年連続とかは知らん

768 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 15:30:58.21 ID:OKqvuGhi.net]


769 名前:デフォルトの名無しさん [2019/11/23(土) 16:40:21.39 ID:l4WHmfnE.net]
もうそろそろコンピュータの世界では
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?

770 名前: mailto:sage [2019/11/23(土) 16:48:42.87 ID:bse8qODO.net]
>>762
ascii 的な世界(合衆国界隈とか)が発狂するので、utf-8 がつくられたのだと思います
まあコード内では utf-32 で統一するのがスマートですね

771 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 17:45:30.08 ID:ExB3uxT/.net]
C言語がASCII前提としていたので、
UTF16やUTF32では互換性を保てなかったのが理由



772 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:02:19.00 ID:UeuUKNdC.net]
32bitで足りるんか?

773 名前:デフォルトの名無しさん [2019/11/23(土) 18:05:22.65 ID:Lev/ciM6.net]
今のところ32bitっつってもスカスカだろ

774 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:45:44.31 ID:KvoIJqUR.net]
文字が4億も存在するんかいな。

775 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:46:53.89 ID:k/QFWxVo.net]
じゃけん戸籍に登録されてる異字体全部収録しましょうね〜(鬼畜)

776 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 18:51:31.87 ID:KvoIJqUR.net]
旧字体はIPAがマップしたんじゃなかったっけ?

777 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 20:53:37.67 ID:x1VOKq1M.net]
固定長好きな人が定期的に出てくるのはなんでなの?

セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに

778 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 21:03:09.45 ID:pGKd1Nh3.net]
21bitもの空間与えたら要らん文字まで突っ込みまくってごみ溜めみたいになってしまったじゃないか。

779 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 21:12:47.43 ID:LYBJTBw0.net]
絵文字は特に漢字に馴染みが無い連中が嬉しがってるけど、象形文字の発明前に戻ったようだよ
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった

780 名前:デフォルトの名無しさん mailto:sage [2019/11/23(土) 23:04:09.59 ID:uD1YCxhq.net]
>769
ipaは都合約6万字ある

781 名前:デフォルトの名無しさん [2019/11/24(日) 00:15:00.98 ID:daL/rw2X.net]
16bit固定なら世界中の文字が記述できるとして始まったのがそもそものUnicodeだからな



782 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 07:48:18.59 ID:wAZlnZnW.net]
>>757
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。

783 名前:デフォルトの名無しさん [2019/11/24(日) 11:58:02.36 ID:bBACDgxb.net]
>>772
ちんちんの絵文字は
剥けちんと包茎と勃起前とか勃起後とか色々バリエーション必要ですし

784 名前: mailto:sage [2019/11/24(日) 12:05:35.45 ID:oHJXyQoT.net]
>>776
おもしろいと思っていってるの?

785 名前:デフォルトの名無しさん [2019/11/24(日) 12:07:46.48 ID:bBACDgxb.net]
QZさんからレスもらえるとは思わなかった

786 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:30:57.16 ID:4a4z1fkQ.net]
>>777
竹島はどこの国の領土ですか?
注意:「なぜその質問をしたいと思ったのですか」みたいな
質問を質問で返すようなクズな真似はしないこと

787 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:43:02.24 ID:iwyjZSbL.net]
質問じゃなくて、馬鹿にしてるんだろ

え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味

788 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 12:53:04.27 ID:6n0WdTOH.net]
>>780
違うと思う
QZは韓国人だから答えられないんでしょ

789 名前: mailto:sage [2019/11/24(日) 13:04:27.62 ID:oHJXyQoT.net]
>>779
>「なぜその質問をしたいと思ったのですか」
いやはや、私のパターンを熟知されているようでなにより、です、ちょっとうれしくなりました

790 名前: mailto:sage [2019/11/24(日) 13:05:00.77 ID:oHJXyQoT.net]
>>781
なぜ韓国人だとおもったのですか?

791 名前: mailto:sage [2019/11/24(日) 13:09:00.29 ID:oHJXyQoT.net]
>>779
https://medaka.5ch.net/test/read.cgi/eco/1567773760/710
https://medaka.5ch.net/test/read.cgi/eco/1567773760/712
https://medaka.5ch.net/test/read.cgi/eco/1567773760/714



792 名前:デフォルトの名無しさん [2019/11/24(日) 13:13:33.28 ID:BlMs70wA.net]
憲法9条を改正するだけじゃダメなのよ。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。

793 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 15:33:55.44 ID:EdYAI6jd.net]
>>762
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ

794 名前:デフォルトの名無しさん mailto:sage [2019/11/24(日) 17:10:15.65 ID:5wTOyTy7.net]
>>779
竹島は日本の領土で、独島は韓国の領土だよ
なぜか韓国は竹島のことを独島だと言い張ってるけど
独島は別の島ですから、残念

795 名前:デフォルトの名無しさん mailto:sage [2019/11/25(月) 15:25:07.92 ID:s1hiXzdE.net]
>>787
おっとそれ以上言っちゃあいけない

796 名前:デフォルトの名無しさん [2019/11/30(土) 13:54:16.72 ID:eovy2x2M.net]
【びっくりサイエンス】 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30

797 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 15:03:21.41 ID:dLS32wGr.net]
別に「びっくり」ではないなw

798 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:10:49.04 ID:OkgV2S2L.net]
それ言ったらドンキーにも延焼する

799 名前:デフォルトの名無しさん mailto:sage [2019/11/30(土) 21:25:08.69 ID:mO6/udRn.net]
ドンキーほうけーい

800 名前:デフォルトの名無しさん [2019/12/01(日) 17:02:36.55 ID:zxgavQqm.net]
今年の漢字は天

801 名前:デフォルトの名無しさん mailto:sage [2019/12/01(日) 17:27:44.79 ID:xqkDTdKR.net]
いっそU+32FFと書いてほしい



802 名前:デフォルトの名無しさん [2019/12/03(火) 02:50:32.39 ID:TSc17kJh.net]
「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声

803 名前:デフォルトの名無しさん [2019/12/03(火) 12:56:42 ID:dBsSbed7.net]
可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?

804 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 14:48:10.41 ID:32eP5DBa.net]
異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか

805 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:19:10.13 ID:9x1aaywv.net]
倍角、四倍角も入れて

806 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 15:35:57 ID:IUIY88nX.net]
HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw

807 名前:デフォルトの名無しさん mailto:sage [2019/12/03(火) 17:26:32 ID:Y2nmLwy/.net]
Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき

808 名前:デフォルトの名無しさん [2019/12/04(水) 16:24:48 ID:IlQO2KEp.net]
黒板太字 - Wikipedia
https://ja.wikipedia.org/wiki/黒板太字

とかはかなりスタイル要素入ってると思うな。
てか数学用分野だけやけに優遇されてない?

809 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 19:52:55.02 ID:sxQF45hm.net]
連続してないからあくまでも記号扱いなんだろうな。

810 名前:デフォルトの名無しさん mailto:sage [2019/12/04(水) 20:23:19.21 ID:bwCWk38v.net]
発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ

811 名前:デフォルトの名無しさん mailto:sage [2019/12/05(Thu) 15:53:38 ID:1Yvcqq3b.net]
>>801
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。



812 名前:デフォルトの名無しさん [2019/12/05(木) 16:32:04.91 ID:IbmhSLeW.net]
IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ

813 名前:デフォルトの名無しさん mailto:sage [2019/12/06(金) 14:18:04 ID:CxS2VDwU.net]
>>805
IMEってMS-IMEのこと?
それともかな漢字変換全般?

814 名前:デフォルトの名無しさん [2019/12/06(金) 23:32:11.23 ID:Ob0T3VF2.net]
SKK使ってるからだけどそんな印象は全く無い

815 名前:デフォルトの名無しさん mailto:sage [2019/12/10(火) 22:31:10.24 ID:zD6aLrgM.net]
SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。

816 名前:デフォルトの名無しさん [2020/01/01(水) 02:03:31.89 ID:ZBRDXVGi.net]
あけましておめでとう!
今年もこのスレの皆さんに多幸感がありますように!����������

817 名前:デフォルトの名無しさん [2020/01/01(水) 11:19:22.03 ID:tqBP4ADq.net]
字にはヒラギノ〜ル♪

818 名前:デフォルトの名無しさん [2020/01/01(水) 22:58:15.38 ID:fGGzsdYV.net]
あけましておめでとうございます
ISO/IEC 10646の新版は今年中に出るかな〜?

819 名前:デフォルトの名無しさん [2020/01/03(金) 06:32:52.61 ID:wMN1Z8Zd.net]
Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。
まぁ、文字コードの問題ではないんだが。

820 名前:デフォルトの名無しさん [2020/01/03(金) 10:33:29.05 ID:lHIykz7y.net]
特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ

821 名前:デフォルトの名無しさん [2020/01/03(金) 22:33:53.11 ID:wMN1Z8Zd.net]
>>813
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。



822 名前:デフォルトの名無しさん [2020/01/07(火) 14:48:29.36 ID:lPDbYu1J.net]
どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE
https://gigazine.net/news/20200106-which-emoji-scissors-close/

面白い

823 名前:デフォルトの名無しさん [2020/01/07(火) 15:01:40.99 ID:2Dq0zKSW.net]
左利き用のはさみも用意汁ωωω

824 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 15:12:21.25 ID:dfBogwvq.net]
ちなみによく切れるはさみはここが曲線
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg

825 名前:デフォルトの名無しさん mailto:sage [2020/01/07(火) 16:36:04.95 ID:g+gnVlWv.net]
はさみディレクションセレクター

826 名前:デフォルトの名無しさん mailto:sage [2020/01/18(土) 12:49:25 ID:jQMC+jX5.net]
ぷにコードに関するチラ裏

localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ

idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた

827 名前:デフォルトの名無しさん mailto:sage [2020/01/24(金) 09:35:27 ID:jBJ9cIqM.net]
6月のWG2は高松になったのか
また国外から来にくそうな

828 名前:デフォルトの名無しさん mailto:sage [2020/01/26(日) 00:45:55.40 ID:C+NhYhXj.net]
道後温泉に行くか

829 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 14:46:03 ID:WswUNrPx.net]
Unicode Emoji 13.0 - Now final for 2020
blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html

830 名前:デフォルトの名無しさん mailto:sage [2020/01/30(Thu) 16:08:26 ID:m1itn91m.net]
今更タピ岡かい

831 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 12:43:23.65 ID:G4fIlptF.net]
Unicodeは完全にコンソーシアムのおもちゃになってんな



832 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 15:08:09 ID:OCbveUqO.net]
タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。

833 名前:◆QZaw55cn4c mailto:sage [2020/01/31(金) 19:55:14 ID:tTpxWp9S.net]
>>825
詰将棋用に上下逆の漢字を入れて欲しかった

834 名前:デフォルトの名無しさん mailto:sage [2020/01/31(金) 22:55:44.99 ID:GHfVRZCY.net]
G入れるのまじやめて

835 名前:デフォルトの名無しさん mailto:sage [2020/02/01(土) 00:49:18.17 ID:6vnUAWit.net]
要するに新種の漢字なんだな
国ごとに生活が違うから、結局何万種必要になる

836 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 00:50:49.11 ID:wzqxdRGo.net]
将棋の駒は多分誰も提案書を出さないせい

837 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:02:15 ID:0w4OLLiX.net]
それ通ったらドンジャラ提案するわ

838 名前:デフォルトの名無しさん mailto:sage [2020/02/02(日) 01:17:07.29 ID:Vi9q8JVy.net]
漢字の扱いは本当に難しい
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・

839 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 01:41:22 ID:qflv74w2.net]
テスト٩( 'ω' )و

840 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 08:57:05 ID:uSBWqXrE.net]
825だが、将棋の駒がダメな理由は、>>469 にある通り、
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。

841 名前:デフォルトの名無しさん [2020/02/03(月) 11:59:58 ID:62FLJlST.net]
解説本だと普通に使われてるよな



842 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 13:40:49 ID:yHobSnyY.net]
タピオカが使われているのかと誤読

843 名前:デフォルトの名無しさん [2020/02/03(月) 13:47:35 ID:62FLJlST.net]
読み手のリテラシーが問われます

844 名前:デフォルトの名無しさん [2020/02/03(月) 13:54:08 ID:eKPmxfCz.net]
天使を天便と読み取ったまま放置するとか割とマジ。

845 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:56:08 ID:KZTuy2Ys.net]
架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。

846 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 22:59:18 ID:wgq762c2.net]
漢字以前の象形文字モドキの再発明だからなぁ
取捨選択もなく全然洗練されないまま数だけ増えてる

847 名前:デフォルトの名無しさん mailto:sage [2020/02/03(月) 23:33:42 ID:s4V/Vj8i.net]
そのうち抽象化が進んでいくのか

848 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:26:51.57 ID:gTERf/2s.net]
政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ

849 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 13:28:31.24 ID:c6iCZcrL.net]
コーヒー、お茶、タクシー、台風もほしい

850 名前:デフォルトの名無しさん [2020/02/04(火) 20:12:02 ID:U7azh68T.net]
>>841
政治的に正しい仏教徒とは何ですかね?

アホな創価学会員が言いそうな発言ですが。

851 名前:デフォルトの名無しさん mailto:sage [2020/02/04(火) 21:29:49 ID:t1/0lpTx.net]
絵文字ってここにどう書き込めばいいんです?
&#9784;&#65039;


専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆



852 名前:態でうまく表示されない… []
[ここ壊れてます]

853 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 08:47:40.80 ID:fZOBAWLP.net]
>>842
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。

854 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:08:51 ID:So1jciyU.net]
🍵 you know me.

855 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:23:19.19 ID:MS9bo9CR.net]
固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが

856 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 10:24:42 ID:MS9bo9CR.net]
固定フォントじゃなくて等幅フォントでした

857 名前:デフォルトの名無しさん [2020/02/05(水) 16:23:36 ID:2rKdW1Ec.net]
てすと


858 名前:デフォルトの名無しさん [2020/02/05(水) 16:24:56 ID:2rKdW1Ec.net]
>>844
うちのChromeはちゃんと出てる
ffでも問題なし

859 名前:デフォルトの名無しさん [2020/02/05(水) 16:28:36 ID:2rKdW1Ec.net]
>>847
前にpythonで書いたときは
unicodedata.east_asian_width()
使ったと思う
Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う

860 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 16:30:38 ID:So1jciyU.net]
☸ 法輪ラブ ☸

861 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 18:34:07 ID:qBm/0cTb.net]
>>847

・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1

・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)

・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる

・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)

・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)

・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる



862 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 20:43:09 ID:f5dE3Mu+.net]
>>853
詳しい解説サンクス

863 名前:デフォルトの名無しさん mailto:sage [2020/02/05(水) 23:12:39 ID:zWcxLf4u.net]
>>853
あざす
やっぱり混沌としてるのですね
とりあえず一度ターミナルの中を追ってみようかな

864 名前:デフォルトの名無しさん mailto:sage [2020/02/06(Thu) 00:00:39 ID:SQAVqXtr.net]
>>844うちでも見れた

865 名前:デフォルトの名無しさん mailto:sage [2020/02/07(金) 22:23:32 ID:DCA95dh2.net]
継ぎ接ぎだらけの一貫してない仕様だからな

866 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:47:47 ID:hv0txQ7A.net]
Unicodeの時代に今更だけど、
シフトJISの第2バイトがA0〜FFでなく
40〜FCにしたのは何でだろう

867 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 17:48:29 ID:hv0txQ7A.net]
訂正
×A0〜FF
〇80〜FF

868 名前:デフォルトの名無しさん mailto:sage [2020/02/08(土) 18:36:07.73 ID:zjMP9HD4.net]
JISの区点は1区あたり94点
0x40開始で0x7Fを避けて2区分取ると0xFCになる

869 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 12:59:57 ID:tCetl5aZ.net]
やっぱ漢字1文字は2バイトの方がいい

870 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 15:51:09 ID:gml78nRc.net]
>>858
半角カナのせいで80〜FFでは足りないから

871 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:30:21 ID:tCetl5aZ.net]
シフトJISはもう少し工夫すれば
JISコードの変換式もより簡単にでき
2バイト目もASCII領域を使わずにダメ文字も発生せず
補助漢字も全て入れられた



872 名前:デフォルトの名無しさん mailto:sage [2020/02/09(日) 19:32:13 ID:tCetl5aZ.net]
補助漢字は半角カナと排他だけど

873 名前:デフォルトの名無しさん [2020/02/10(月) 16:27:01 ID:TGcYvj29.net]
EUCで良かったんよ

874 名前:デフォルトの名無しさん mailto:sage [2020/02/10(月) 19:14:50 ID:hRmPfOYI.net]
EUCだと半角カナも補助漢字もバイト数が増えるからな...

875 名前: mailto:sage [2020/02/10(月) 21:20:39.00 ID:3bnN/FFY.net]
>>863
あのスペースの狭さでは、それは無理だったのでは?
どうするのがよかったのですか?具体的にいってみてよ

876 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 08:36:25.76 ID:K5Jxm44G.net]
非漢字_:[81-98] [80-9F]
第1水準:[80-9F] [A1-FE]
第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F]
補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F]
補助漢字は半角カナと排他利用

877 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 17:40:51 ID:Sh/x76Zj.net]
>>868
それは結局半角カナを潰しただけのことでは?

878 名前:デフォルトの名無しさん mailto:sage [2020/02/11(火) 18:51:44 ID:K5Jxm44G.net]
>>869
補助漢字6000字近くを使えるというメリットがあれば
半角カナをフェードアウトするには十分な機会になっただろう
補助漢字(JIS X 0212)が制定されたのは1990年だから
その翌年の1991年に発売されたMS-DOS 5.0あたりで
KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば
従来のテキストファイルの読み込みなども対応できる

879 名前:◆QZaw55cn4c mailto:sage [2020/02/11(火) 19:27:04 ID:Sh/x76Zj.net]
>>870
文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね

880 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 01:19:59.31 ID:l8Pmdafn.net]
いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる

881 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 02:15:22.28 ID:H21UjGBC.net]
なくならない
合成文字はなくせない



882 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 05:02:58 ID:K3E1Z6OS.net]
>>871
コンテンツ側でなくユーザー側

883 名前:デフォルトの名無しさん [2020/02/12(水) 10:06:52 ID:a1w2Xqz0.net]
1文字=64bitやろ

884 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:30:20 ID:KzEjZzkq.net]
>>875
イングランドの旗はUnicodeで7コードポイント必要なので64bitでは無理
128bitで

885 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 13:32:59.34 ID:yKNbCROk.net]
👽 全宇宙の未知なる知的生命体の使用言語を網羅しなきゃならないのだから可変長は必須

886 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 20:36:54 ID:ytylQgpT.net]
>>876
え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの

887 名前:デフォルトの名無しさん mailto:sage [2020/02/12(水) 21:06:37.28 ID:Kml/rCmZ.net]
>>878がおもしろいことを言った

888 名前:デフォルトの名無しさん mailto:sage [2020/02/13(木) 15:10:18.42 ID:Xqo24CtP.net]
ウェールズ「俺は?」

889 名前:デフォルトの名無しさん mailto:sage [2020/02/13(Thu) 21:26:26 ID:KYt0SeFn.net]
Google、絵文字を組み合わせた「ハート付きうんち」などを使える「Emoji Kitchen」開始
https://www.itmedia.co.jp/news/articles/2002/13/news068.html

890 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 11:14:07.77 ID:SoYJxWJg.net]
そんな文字要らんわ

891 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 13:42:19 ID:4TN7y+1I.net]
グーグルってしょっちゅう意味のわからんことするよな



892 名前:デフォルトの名無しさん [2020/02/14(金) 14:22:25 ID:WtuYdkw5.net]
MSやAppleだって訳判らんことするときもある

893 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 14:26:10 ID:MCgyW5To.net]
実行ファイルがテキストとデータで構成されるように、絵文字表現もテキストとデータを組み合わせた文法が出てきそう。

894 名前:デフォルトの名無しさん [2020/02/14(金) 17:14:21 ID:CPLKNT1n.net]
顔文字より正規表現のためのメタ文字とかあったほうが良いのにね。
まあGoogleじゃ無理か。

895 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 21:11:02 ID:qxpoECq4.net]
(.*_*)

896 名前:デフォルトの名無しさん mailto:sage [2020/02/14(金) 22:37:55 ID:cKxgCMj+.net]
そのメタ文字にマッチしたい正規表現を書く日が来るぞ

897 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 00:14:12 ID:W/mb2gir.net]
\��

898 名前:デフォルトの名無しさん mailto:sage [2020/02/15(土) 05:28:54.23 ID:uhBKJdO0.net]
規格名:JIS X 0215
文字数:15000字超(非漢字:1700字超,漢字:13300字超)
区点域:0〜127区,0〜127点(最大16384字収納)
通 称:いちごJIS

899 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 14:33:03 ID:MAyK0RyJ.net]
https://twitter.com/akinomyoga/status/1230127240806985728

修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。
何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ
https://gitlab.freedesktop.org/terminal-wg/specifications/issues/9#note_406682

因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。
曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか…
https://github.com/microsoft/terminal/issues/4345#issuecomment-578434025
(deleted an unsolicited ad)

900 名前:デフォルトの名無しさん [2020/02/21(金) 15:07:53.93 ID:5cQWFY2c.net]







901 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 20:47:45 ID:cxQoHGS6.net]
半角と全角の区別付かなくなると困るから元の半角文字はさらに半分で表示したらどうかな



902 名前:デフォルトの名無しさん mailto:sage [2020/02/21(金) 22:45:17 ID:gYJx2Nw8.net]
まぁ、全部全角にすれば万事解決なんだけどな。

903 名前:デフォルトの名無しさん mailto:sage [2020/02/22(土) 03:15:16.13 ID:s2EVAxz+.net]
絵文字っていわゆる全角よね

904 名前:デフォルトの名無しさん mailto:sage [2020/03/02(月) 02:11:23 ID:dBpw1NjL.net]
いわゆるって何を指してる?

905 名前:デフォルトの名無しさん mailto:sage [2020/03/02(月) 16:54:16.25 ID:HI7PDIWr.net]
公式定義ではなく現実によく目にする幅、かな

906 名前:デフォルトの名無しさん [2020/03/02(月) 17:38:15.13 ID:glnmwhpK.net]
最近は倍角とか4倍角とか聴かなくなったな

907 名前:デフォルトの名無しさん mailto:sage [2020/03/07(土) 16:24:06 ID:dtD2Xrrp.net]
Microsoft、Shift_JISや外字からUnicodeへの移行を呼びかけ | スラド
https://srad.jp/story/20/03/06/1237211/

Windows と日本語のテキストについて - Windows Blog for Japan
https://blogs.windows.com/japan/2020/02/20/about-windows-and-japanese-text/

908 名前:デフォルトの名無しさん mailto:sage [2020/03/07(土) 18:02:03 ID:8MkGFgNt.net]
外字というと丸囲みの数字が?〜?以外にもほしくて
21以降も外字で作ってしまっていた事務所を思い出す

何度かPCを入れ替えるうちに使わなくなり、忘れ去られ、
久々に古い文書を引っ張り出して来たら謎の文字化けで外字の存在が発覚
外字が何故か?から始まってたり途中に別の字が挟まってたりしてもはや解読作業

909 名前:デフォルトの名無しさん mailto:sage [2020/03/08(日) 21:08:48.53 ID:LYEGO22Q.net]


910 名前:デフォルトの名無しさん mailto:sage [2020/03/08(日) 22:48:15.28 ID:NQM2xZbu.net]
今は㊿まであるんだな、知らんかったわ

911 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 05:26:10.28 ID:z9inAChS.net]
(0)とか黒丸の小文字英字とか白丸のンとか黒丸の仮名とかは
Unicodeですら未だに無いんだよな...



912 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 14:12:03.27 ID:A2Epg0dL.net]
それはわいせつだからでは

913 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 14:20:33.44 ID:o76Az6W+.net]
わいせつだって文字情報じゃないか!
それともなにか君は辞書から陰茎とか陰核という単語を削除せよというのか!

914 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 16:04:20 ID:5ouitKt0.net]
��

915 名前:デフォルトの名無しさん [2020/03/09(月) 17:52:27 ID:T4gz2l9R.net]
>>903
◎と字形が同じとかで一緒にされそう

あと将棋の駒(上下とか白黒)も欲しいとか言ってた人?

916 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 20:31:39 ID:D+UZfSM4.net]
お城マークってある?
凸の下辺がないようなやつ

917 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 21:26:52.19 ID:bpMBC8cG.net]
>>902
50まで作るんだったら、99まで作れば良かったのに。
できれば、100まで欲しかった。

918 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 22:01:13 ID:d9MHF8Nm.net]
>>908


919 名前:デフォルトの名無しさん mailto:sage [2020/03/09(月) 23:06:46.00 ID:5OM/DcPa.net]
ゴリッパだな

920 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 07:55:14.17 ID:LhHy3+ze.net]
>>900
Unicodeがまさにそんな感じだよ
符号位置なんて空いてりゃなんでも詰め込んでくる

921 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 09:32:00.64 ID:Ae1RdIX3.net]
一方場所が足りない云々でCJK統合漢字爆誕



922 名前:デフォルトの名無しさん mailto:sage [2020/03/10(火) 12:18:50 ID:QGyf5BSI.net]
アレはUNICODEが16ビットだったときの産物だからなー

囲み付き文字は合字でなんぼでも表示できるんじゃなかったのか?
黒字に白抜きはないか。

923 名前:デフォルトの名無しさん mailto:sage [2020/03/11(水) 00:27:59 ID:GChSseC+.net]
⓿と🄌は何が違うのこれ

924 名前:デフォルトの名無しさん mailto:sage [2020/03/12(木) 14:56:02.24 ID:PErtSW6n.net]
Announcing The Unicode$#174; Standard, Version 13.0
https://home.unicode.org/announcing-the-unicode-standard-version-13-0/

925 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 04:51:42.81 ID:XfurYgbf.net]
要らん文字ばっか増えていくな

926 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 07:25:49 ID:YqqN4LBM.net]
う、うん…

927 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 20:00:06.77 ID:gnCwby5S.net]
Unicode 13.0.0
www.unicode.org/versions/Unicode13.0.0/
Components of Unicode 13.0.0
www.unicode.org/versions/components-13.0.0.html
Core Specification (PDF)
www.unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf
Code Charts (PDF・110 MB)
www.unicode.org/Public/13.0.0/charts/CodeCharts.pdf

928 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 20:29:09.67 ID:No4fNSBg.net]
でっかいPDFだなあ

929 名前:デフォルトの名無しさん mailto:sage [2020/03/13(金) 22:24:02.25 ID:4HcCQorc.net]
あれ、もうUnicode 13.0.0出たの?
改訂するのは確か毎年6月ねって決めたんじゃ……と思ったら去年から3月だった。

930 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 04:49:42 ID:vXPyxgSI.net]
Win10は頻繁にバージョンアップしてるけど、
使ってるUnicodeは2015年に出た8.0のままなんだよな...

931 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 05:08:58.28 ID:3vkWqFOe.net]
そーそー
新しいフォント入れてもリンクが効かんという...
全部入りフォント作るにゃ16bitの壁



932 名前:デフォルトの名無しさん mailto:sage [2020/03/14(土) 16:17:25.81 ID:Vl0/NIrd.net]
え、そうなんだ
そんな罠が

933 名前:デフォルトの名無しさん mailto:sage [2020/03/18(水) 09:00:29 ID:z60BWivb.net]
高松もキャンセルなのかな
それともISO/IECはまた別の判断か
https://www.iso.org/covid-19.html

934 名前:デフォルトの名無しさん mailto:sage [2020/04/09(木) 14:28:17.94 ID:+HIZu5X+.net]
Unicode 14.0 Delayed for 6 Months
blog.unicode.org/2020/04/unicode-140-delayed-for-6-months.html

Due to COVID-19, the Unicode Consortium has

935 名前:decided to postpone the release of version 14.0 of the Unicode Standard by 6 months, from March to September of 2021.
This delay will also impact related specifications and data, such as new emoji characters.

This announcement does not affect the new emoji included in Unicode Standard version 13.0 announced on March 10, 2020.
[]
[ここ壊れてます]

936 名前:デフォルトの名無しさん mailto:sage [2020/04/09(Thu) 17:31:08 ID:gZ/Igrwb.net]
せっかくだから細菌��とは別にウイルスの絵文字つくってくれ

937 名前:デフォルトの名無しさん mailto:sage [2020/04/09(Thu) 23:42:25 ID:V4nj16/7.net]
コロナ菌入れるの?

938 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 03:17:26 ID:8l6zYGEZ.net]
��マスク
��トイレットペーパー

939 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 14:38:09 ID:4/xjxgO5.net]
細菌の絵文字なんてあるのか
🦠

940 名前:デフォルトの名無しさん mailto:sage [2020/04/10(金) 15:29:18 ID:CRpi4reg.net]
最近出来た

941 名前:デフォルトの名無しさん mailto:sage [2020/04/11(土) 06:13:53.13 ID:AQJyoftj.net]
外人が絵文字大好きなのは勝手だけど、既存コードの部分もちゃんとして欲しい



942 名前:デフォルトの名無しさん mailto:sage [2020/04/11(土) 16:23:43.45 ID:c2aeXPYf.net]
e門司

943 名前:デフォルトの名無しさん [2020/04/18(土) 12:50:14 ID:VYQrLT4k.net]
最近出来た細菌の絵文字・・・

944 名前:デフォルトの名無しさん mailto:sage [2020/04/18(土) 14:58:29 ID:7V75MQ+C.net]
なるほど、最近と細菌がかかってる、とこういうわけですな

945 名前:デフォルトの名無しさん mailto:sage [2020/05/07(Thu) 16:04:22 ID:yKMQxEI8.net]
するってえと何かい?
最近と細菌がかかってるというわけかい?

946 名前:デフォルトの名無しさん mailto:sage [2020/05/08(金) 15:47:36 ID:5Vn36V2D.net]
ウィルスの絵文字も頼むわ

947 名前:デフォルトの名無しさん mailto:sage [2020/05/09(土) 15:44:09 ID:c4xb28ev.net]
corona emoji ��

948 名前:デフォルトの名無しさん mailto:sage [2020/05/20(水) 21:19:51 ID:KtsKIWM6.net]
https://lister.tokyo/emoji/unicode_emoji.php?emoji=%F0%9F%A6%A0

絵文字
🦠

意味
微生物
【類似・説明】細菌、ウイルス、アメーバなどを表す

949 名前:デフォルトの名無しさん mailto:sage [2020/05/21(Thu) 14:54:55 ID:iHD0We8W.net]
ちょっといくらなんでも雑やな

950 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 00:52:38.66 ID:JDT7oTvt.net]
ウィルスを生物扱いする悪い子はここか?

951 名前:デフォルトの名無しさん mailto:sage [2020/05/22(金) 21:40:13 ID:Olq8ijH/.net]
ゴブリン��&オーガ��



952 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:24:55.95 ID:vzEBoOvQ.net]
>>891
超遅レスだが、全角半角問題の亡霊が絵文字とかで再燃してる感じ?

そっか絵文字ってサロゲートの領域のやつ以外にVSを使ってるのもあるのか。面倒だな。

>>897
Unicodeには公式定義があるでしょ

話は違うが、外人は絵文字をEmotional Iconかなんかの略だと思ってる感があって
そこはどうなんだという。

953 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 20:46:42.29 ID:p75lHsHl.net]
ひらがなの'あ'よりも'W'のほうが幅広だったり、
★マークが半角幅だったりするフォントが溢れてるのに、
半角全角区別しても仕方ないだろ

954 名前:デフォルトの名無しさん mailto:sage [2020/06/20(土) 21:34:59.63 ID:IMDB9vKB.net]
まあだからそこはターミナルとか限られた環境の話で。
フォントもそれ用のを選ぶし。

そろそろ全角半角なんてのをやめて、文字のカラム位置を揃えたいならフォントの
メトリックスの方で調整すればいいだけ、かもしれないけど。

955 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 00:33:45 ID:MWbXBJfF.net]
>>943
絵文字の幅って公式定義があるの?

956 名前:デフォルトの名無しさん mailto:sage [2020/06/21(日) 14:21:00.23 ID:la0O1Akk.net]
>>946
Unicodeに収録された文字には文字幅のプロパティがある、という意味で。

957 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 00:32:43.95 ID:DUn6aEuN.net]
>>947
かみ合ってないやん
>>894からの流れなんだから

958 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 19:13:13.28 ID:Y25pVs1y.net]
>>894 ? 知らんがなw
そもそも「全部」ってどういう意味だ? 全部の文字? 全部のターミナルに関わるソフトの挙動?

959 名前:デフォルトの名無しさん mailto:sage [2020/06/22(月) 20:41:37 ID:NxxL+RwQ.net]
発端は>>891だろう

960 名前:デフォルトの名無しさん mailto:sage [2020/06/23(火) 00:16:31.95 ID:regXwJpa.net]
既存定義とは違う新しい定義の話題に
「既存定義があるぞ」は全然かみ合ってないし
知らんがなと笑われてもそれこそ知らんがな

961 名前:デフォルトの名無しさん [2020/06/23(火) 10:14:55.66 ID:4kHZmTBE.net]
倍角と2倍角は違うんだっけ
4倍角もあったような



962 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 00:49:18.29 ID:U0shKhxD.net]
倍角って横だよね
縦倍角ってのもあった気がする

963 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 02:37:42.69 ID:Qbz2qwLg.net]
〴〳
〵〵

これの有効活用をしたい

964 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:14:26.52 ID:deVcUtEo.net]
>>951
というかどういうレベルの話をしているのか掴みかねてね。

「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。

リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。

965 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 12:28:35.59 ID:deVcUtEo.net]
と思ったがまたそのうちw

966 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 13:08:49.76 ID:Qbz2qwLg.net]
どこまでもかみあわんやっちゃな

967 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 19:38:46.76 ID:e6Wuxio/.net]
というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。

全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw

968 名前:デフォルトの名無しさん mailto:sage [2020/06/24(水) 22:24:49.91 ID:N310/pVU.net]
んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅

969 名前:デフォルトの名無しさん mailto:sage [2020/06/25(木) 18:59:45.90 ID:xHxuQznk.net]
>>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。

で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw

個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。

970 名前:デフォルトの名無しさん mailto:sage [2020/06/25(Thu) 22:37:41 ID:5bjWZftZ.net]
曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?

971 名前:デフォルトの名無しさん [2020/06/26(金) 13:02:51 ID:PjbtVFt+.net]
%s の文字数とかで文字列の幅調整出来ないんだよな



972 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:34:46.91 ID:gjCuj5Av.net]
しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。

同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw

973 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 20:59:35.95 ID:7oUp4uPe.net]
そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ

974 名前: mailto:sage [2020/06/26(金) 21:31:32.20 ID:9IxUvn/4.net]
>>964
それはグレートチャイナ様が抵抗してくださるのでは?

975 名前:デフォルトの名無しさん mailto:sage [2020/06/26(金) 22:11:14.85 ID:7oUp4uPe.net]
彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ

976 名前: mailto:sage [2020/06/26(金) 22:22:00.35 ID:9IxUvn/4.net]
>>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました

977 名前:デフォルトの名無しさん [2020/06/27(土) 00:33:35.05 ID:swJlVBV3.net]
簡字体は半角でも行けそう感あるな

978 名前:デフォルトの名無しさん [2020/06/27(土) 01:47:56.80 ID:9wE9An+g.net]
斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか

979 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 01:53:30.16 ID:2VXy+TcG.net]
ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。

980 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:06:13.19 ID:a36N+BtR.net]
>>969
これは一緒にしろよと思うことはある
文献で必要だから分けて欲しいが、明治の戸籍作成時の書き間違いまで
大事に引き継ぐ必要はないだろ

981 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 02:22:38.17 ID:n/FbqQvh.net]
そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな



982 名前:デフォルトの名無しさん [2020/06/27(土) 02:25:59.19 ID:cFHckwkh.net]
カンジカナヘンカン(キリッ

983 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 03:48:57.43 ID:N26qrFyY.net]
でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね

いずれにしてももう入れちゃったから永久保存だね

984 名前:◆QZaw55cn4c mailto:sage [2020/06/27(土) 03:56:37 ID:5JNhQ0LT.net]
はしご高とくち高は無理やり統合されちゃって有耶無耶らしいのですが…

985 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:30:57.19 ID:fTkQtmqM.net]
>>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。

986 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 08:59:10 ID:8YWxnx/1.net]
>>969
> 斎と斉と齊と齋は一緒だから一つにしろとかな

しっかり区別できない限り、乃木坂ファンにはなれない。

987 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:13:49.81 ID:wwwZDyDi.net]
イタイ痔でイタイ字
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° &deg; ° &#x00B0;
± &plusmn; ± &#x00B1;
² &sup2; ² &#x00B2;
³ &sup3; ³ &#x00B3;

988 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:39:39.53 ID:twDHZDh4.net]
>>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw

989 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 09:58:34.18 ID:g61E5/Hd.net]
>>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。

でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。

なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。

あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。

おっと誰か来たようだ

990 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 14:15:22 ID:bBs10q1N.net]
表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。

991 名前:デフォルトの名無しさん [2020/06/27(土) 15:22:20.76 ID:QSLeN3Uh.net]
ขอบคุณค่ะ



992 名前:デフォルトの名無しさん mailto:sage [2020/06/27(土) 19:08:33.76 ID:g61E5/Hd.net]
なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。

993 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 11:00:01.09 ID:9sOk9wG3.net]
>>982
5chの文字コードスレで数値参照か?
男は黙ってShift_JISだろ。
Shift_JISとは何かを考えるいいきっかけにもなる(ならなくていいかw)

994 名前:デフォルトの名無しさん mailto:sage [2020/06/28(日) 20:30:07 ID:PNBTsuo1.net]
参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない

995 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 17:25:24.99 ID:MDN2nnZZ.net]
俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。

996 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 19:30:44.51 ID:V8kaCwil.net]
つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?

997 名前:デフォルトの名無しさん [2020/07/01(水) 19:32:49.62 ID:IfUrt5hg.net]
面って旧字体か知らんけど内側が口の字もあるんだね

998 名前:デフォルトの名無しさん mailto:sage [2020/07/01(水) 22:04:25.91 ID:21fnQhh9.net]
「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。

「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。

999 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 05:58:14.56 ID:29pTsVv7.net]
>>989
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?

Unicodeで別になってて嬉しい人は台湾に感謝しないとw

1000 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 20:52:25.00 ID:Ia6zfvih.net]
��野家

1001 名前: mailto:sage [2020/07/02(木) 21:29:50.29 ID:L13EtRzW.net]
>>989
>「高」と「」
CP932 では区別されているのですか?



1002 名前:デフォルトの名無しさん mailto:sage [2020/07/02(木) 23:07:28.07 ID:NYHAh4sv.net]
>>992
区別されてるよ。
「マイクロソフト標準キャラクタセット」で検索すると、
詳しい情報が出てくるよ。

1003 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 01:39:17.36 ID:I4sf0FL7.net]
いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw

1004 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 02:49:52.70 ID:C0o/qkVy.net]
そのせいじゃないだろう

1005 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 08:00:38.22 ID:I4sf0FL7.net]
私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。

1006 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 09:38:17.14 ID:oXZRCloQ.net]
自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?

1007 名前:デフォルトの名無しさん [2020/07/03(金) 11:53:19 ID:6268sYfp.net]

?

1008 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:11:53.17 ID:/+uSoVK/.net]
ア崎

1009 名前:デフォルトの名無しさん mailto:sage [2020/07/03(金) 14:13:13.87 ID:/+uSoVK/.net]
↑ホントだ変換入力してるのに文字化けする

1010 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒

1011 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<221KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef