[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/02 16:40 / Filesize : 221 KB / Number-of Response : 1012
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード総合スレ Part12



1 名前:デフォルトの名無しさん mailto:sage [2018/12/16(日) 12:38:15.61 ID:VlX3xGEw.net]
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/

466 名前:デフォルトの名無しさん [2019/06/12(水) 11:21:19.79 ID:tqvE0DW+.net]
歩の裏の「と」があるべき位置に
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?

467 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 12:54:03.65 ID:QJXYMRLU.net]

三 みたいなやつ?

全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。

468 名前:デフォルトの名無しさん [2019/06/12(水) 13:18:58.92 ID:tqvE0DW+.net]
Tも三も金なんですね

469 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 17:24:29.90 ID:XwhNnAHz.net]
どうでもいいけどそのレスを見て
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない

470 名前:デフォルトの名無しさん mailto:sage [2019/06/12(水) 17:54:37.18 ID:o59LDmQW.net]
歩兵の裏は金と同じ読みの今(きん)の崩し字をあてたので
「と」と極めて似た文字になったという説がある

471 名前:デフォルトの名無しさん [2019/06/12(水) 23:56:15.89 ID:4S3+zhe0.net]
T



なんでこれで金になるのかさっぱり判らん
https://blogimg.goo.ne.jp/user_image/50/8a/03ddf56cb868756327fb330bdd9e5231.jpg

あと
|
とか

とか
謎のが多すぎ

472 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:03:53.78 ID:WD6Kvaf7.net]
崩し字はむずかしうてわからん

473 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:05:01.31 ID:WD6Kvaf7.net]
崩し字というかバラし字?

474 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:11:22.08 ID:uH0MzXQS.net]
>>457
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
www.unicode.org/L2/L2018/18183.htm のe.5

で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.

インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。



475 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 01:32:11.84 ID:domb7+if.net]
なるほどなあ。
チェストーはインラインで使ったりするもんなんだろうか

476 名前:デフォルトの名無しさん mailto:sage [2019/06/13(木) 06:29:39.15 ID:IV8IxRGq.net]
日本NBが後押しすれば10646に入りそうな気がするけどね
漢字以外は興味持たないだろうって見透かされてるんだろうな

477 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 11:32:49.03 ID:BMAIfRwQ.net]
まあ言いたかないけど 欧米が制定した企画だからね……。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。

478 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 12:45:36.88 ID:AVMOMmmV.net]
https://nixeneko.hatenablog.com/entry/2018/03/04/140000
モンゴル文字のことはよくわからんが、ここに書いてあることによると、

> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。

> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。

ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。

479 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 12:54:39.24 ID:AVMOMmmV.net]
ただ、似たようなものは英文にもあるわけで、fish や office のように、
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。

しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。

480 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 13:00:53.97 ID:AVMOMmmV.net]
ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。

481 名前:デフォルトの名無しさん mailto:sage [2019/06/14(金) 21:13:23.45 ID:bakZpKUF.net]
ガチャーン合体!

482 名前:デフォルトの名無しさん mailto:sage [2019/06/15(土) 12:06:26.17 ID:s4HbSmAb.net]
>>466
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。

483 名前:デフォルトの名無しさん mailto:sage [2019/06/15(土) 21:00:26.68 ID:dgVxOSWc.net]
わけわからんまで崩していくのは日本独特?

484 名前:デフォルトの名無しさん [2019/06/16(日) 11:45:02.01 ID:NdAq/MEw.net]
これもなんで金になるのか判らんやつ

でいいのに
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRN0np1ZmeG8ZgXTV8K1Vjx-yF9KCNZgu3AKkiOYyYxdnnl-wk7



485 名前:デフォルトの名無しさん mailto:sage [2019/06/16(日) 13:03:35.22 ID:8f8EXiHl.net]
木天火土水で6人目のゴールドは光です・・・

486 名前:デフォルトの名無しさん mailto:sage [2019/06/16(日) 17:16:00.47 ID:UaT4ATnR.net]
>>479-480
わらったw

487 名前:デフォルトの名無しさん [2019/06/18(火) 06:18:41.06 ID:3nOE2mBA.net]
プログラム板にキチガイ降臨中!botに一晩も反応する異常さ
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
https://mevius.5ch.net/test/read.cgi/tech/1559872586/

142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。

488 名前:デフォルトの名無しさん mailto:sage [2019/06/22(土) 01:57:21.14 ID:t+lz7b+S.net]
>>482
釣られて そのスレ見に行ったけど
寧ろそのa4っていう小手の人が被害に遭ってるように思えたけどな

489 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 03:50:40.53 ID:wcrPNuwW.net]
ヲシテ文字って使えないの?

490 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 05:40:01.35 ID:DXMPLOPq.net]
Unicode協会が配布してるプログラムでシェルスクリプトでUTF-8文字列を扱えるデータってないかな。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。

491 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 06:09:39.19 ID:1JIWmrxD.net]
にほんごでおk

492 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 06:42:32.78 ID:DXMPLOPq.net]
CLDR for shellみたいなのがないかなと。

493 名前:デフォルトの名無しさん mailto:sage [2019/06/25(火) 13:49:53.45 ID:takEpFxW.net]
Unicode協会って書かれると、アグネスがやってるパチモンに見えてくる

494 名前:デフォルトの名無しさん mailto:sage [2019/06/28(金) 22:59:11.92 ID:NkHCwivq.net]
使えないよ
その手の文字が登録されたことはあるのかな



495 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 01:02:31.02 ID:P81PdZpf.net]
Dohentaiyagana

496 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 01:49:55.29 ID:LWdOpl9S.net]
神代VSでまとめてしまおう

497 名前:デフォルトの名無しさん mailto:sage [2019/06/29(土) 02:20:12.41 ID:g9Pe6ky6.net]
最近Kenのツイートが酷い
LunaticとかAdobe的にいいのか

498 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 02:04:42.75 ID:1ALBmyOB.net]
絵文字をリガチャとして実装するという話を聞いたことがあるが
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。

499 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 02:44:42.35 ID:KxegnpZe.net]
絵文字ガチャに見えた

500 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 18:46:20.88 ID:1ALBmyOB.net]
https://symbolset.com/
これとか。素晴しい発想だと思いませんこと?(お嬢様風)

501 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 19:55:14.68 ID:VWoLS78P.net]
全然

502 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 20:32:53.74 ID:MkBgWLvD.net]
見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう

503 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:02:05.57 ID:1ALBmyOB.net]
>>497
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。

504 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:31:19.26 ID:2juPiYlp.net]
なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?



505 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 22:16:35.89 ID:MkBgWLvD.net]
>>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。

入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし

506 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 23:23:56.67 ID:sPnkqdOZ.net]
どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい

507 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 00:12:01.52 ID:vOsPyG+v.net]
This is a pen��.とか[�� Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a ��guin.の誤爆避けも必要になる。

508 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:02.84 ID:2smzn43h.net]
https://8beat-studio.net/how-to-use-ligaturesymbols/
とか? >>499

509 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:12:32.89 ID:2smzn43h.net]
>>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。

510 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 05:13:03.16 ID:2smzn43h.net]
>>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。

511 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 12:02:58.02 ID:liKrIWIO.net]
SVGベタ書きがいいと思う

512 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 13:38:09.58 ID:Ltl936Sg.net]
WebフォントってDL待ちでむしろ遅いイメージしかないな…

513 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 16:21:02.28 ID:MoEwNeEz.net]
日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…

514 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 19:16:16.83 ID:2smzn43h.net]
>>507
>>508
絵文字リガチャフォントだと高々100個くらいだから
日本語Webフォントの常識は当て嵌らんぞ



515 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 21:01:31.88 ID:1h0unusf.net]
推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。

516 名前:デフォルトの名無しさん mailto:sage [2019/07/04(木) 14:48:01.78 ID:nXaEmuLe.net]
ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
https://www.iso.org/standard/73773.html

いつの間にか完成していた。

517 名前:デフォルトの名無しさん mailto:sage [2019/07/05(金) 07:31:35.09 ID:CMdnJVDV.net]
JISにも取り込まれるかな?

518 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 14:32:58.64 ID:q8HbeEfz.net]
>>97
BCってなに?

519 名前:デフォルトの名無しさん mailto:sage [2019/07/12(金) 23:51:11.25 ID:aHiS7zOG.net]
ブラックキャップ

520 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 19:08:40.33 ID:Wy302ne8.net]
まじめに答えてほしかった。。。

521 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 20:43:48.97 ID:tESkaNg7.net]
����?

522 名前:デフォルトの名無しさん mailto:sage [2019/07/13(土) 22:47:35.97 ID:0DH1k/wL.net]
>>516
何これ?

523 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 01:25:41.28 ID:cxt0+A+5.net]
ブラックキャップ

524 名前:デフォルトの名無しさん mailto:sage [2019/07/14(日) 09:54:29.74 ID:N6Jg+9Qo.net]
ワロタ



525 名前:デフォルトの名無しさん [2019/07/14(日) 22:04:02.29 ID:GSQZGuhE.net]
>>513
>>97じゃないから確かなことは言えないけど
「better choice」じゃないかな?
つまり絵文字を「入れざるを得ない」ってことね。

526 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 03:44:17.27 ID:GN7I2Kmp.net]
単に後方互換だろ…

527 名前:デフォルトの名無しさん mailto:sage [2019/07/15(月) 04:14:22.81 ID:GXO+LVjR.net]
BA-90使いたいのに斑の黄顔になるのはなんだかなー

528 名前:デフォルトの名無しさん mailto:sage [2019/07/16(火) 23:08:05.64 ID:6ZdisLnD.net]
IC: 相互互換性
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた

529 名前:デフォルトの名無しさん [2019/07/17(水) 11:56:39.82 ID:FD/sfaX1.net]
LeftとかRightとかCorrectは無いんか

530 名前:デフォルトの名無しさん mailto:sage [2019/07/17(水) 16:54:36.95 ID:Lq1+nMLH.net]
>>524
correctはともかく左右は確実にねーだろw

531 名前:デフォルトの名無しさん [2019/07/18(木) 14:33:21.11 ID:44Ax18Yo.net]
共産とりっけんと社民社と国民主と令和革命はLC互換

532 名前:デフォルトの名無しさん mailto:sage [2019/07/18(木) 23:12:28.17 ID:BkvY1rKv.net]
>>526
わろたw

533 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 15:56:55.39 ID:vatz3/hX.net]
https://github.com/qntm/base65536
↑Unicodeの基本多言語面を使ったエンコード方法w

534 名前:デフォルトの名無しさん mailto:sage [2019/07/23(火) 17:04:19.76 ID:yKl7I/yp.net]
高度に発達したエンコードはMojibakeと見分けがつかない



535 名前:デフォルトの名無しさん mailto:sage [2019/07/24(水) 00:37:51.21 ID:ArGZw8p9.net]
基本多言語面って制御文字含んでるよね。
それbaseXXの

536 名前:{来の意味を成してないw []
[ここ壊れてます]

537 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 16:07:01.10 ID:zqR8kD3Y.net]
W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
https://www.w3.org/People/mimasa/xmldev.html.ja.sjis

538 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 17:27:15.46 ID:wpOWgZAQ.net]
読めるけど...?

539 名前:デフォルトの名無しさん mailto:sage [2019/08/18(日) 23:04:31.46 ID:8LEpKI7v.net]
ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ

540 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 01:20:35.42 ID:JKQq3Dbg.net]
(´・・∀・・`)ほう

541 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 06:07:28.33 ID:xlQPwL5+.net]
>>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。
最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。

542 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 07:31:42.15 ID:SJok1opV.net]
>>535
Firefox68には文字コード指定が残ってる
通常は無効になってるけど>>531のリンク先を表示したときは有効になって
ISO-2022-JPを指定すると文字化けなしで読めた

543 名前:デフォルトの名無しさん mailto:sage [2019/08/19(月) 08:38:57.28 ID:xlQPwL5+.net]
ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?

544 名前:デフォルトの名無しさん [2019/08/20(火) 11:37:07.61 ID:zlJnj2O9.net]
>>531
これはひどいω



545 名前:デフォルトの名無しさん [2019/08/20(火) 11:39:07.12 ID:zlJnj2O9.net]
>>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ

546 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 18:30:12.77 ID:Gkd3xMH4.net]
なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843

547 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:44:07.86 ID:Y189B2BT.net]
HTMLをiso-2022-jpにするのって
どこの文化なんだろうか?

Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?

iso-2022-jpはメールにしか使われてなかったはずだが

548 名前:デフォルトの名無しさん [2019/08/20(火) 21:47:57.43 ID:UVunetX1.net]
>>531
イシカワ マサヤスというのは誰だろうね。

549 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:51:25.41 ID:Y189B2BT.net]
イシカワ マサヤスさんでは?

550 名前:デフォルトの名無しさん [2019/08/20(火) 21:52:36.86 ID:UVunetX1.net]
石川雅康と石川哲志は親族だろうか?

どちらもICT業界から去ったのかな。

551 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 21:54:13.55 ID:Y189B2BT.net]
またつまらんものを

552 名前:デフォルトの名無しさん [2019/08/20(火) 21:58:33.22 ID:UVunetX1.net]
XHTMLが終わってしまって、そのまま放置の石川さん。

553 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 22:46:49.05 ID:anpoimU7.net]
>>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
ttp://www.tohoho-web.com/lng/199801/98011002.htm

554 名前:デフォルトの名無しさん [2019/08/20(火) 23:01:02.75 ID:UVunetX1.net]
>>547
http://の先頭のhを取っても付けても同じですよ。



555 名前:デフォルトの名無しさん mailto:sage [2019/08/20(火) 23:43:43.88 ID:Gkd3xMH4.net]
> どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html
えぇ……。

556 名前:デフォルトの名無しさん [2019/08/21(水) 00:08:09.19 ID:/FRdjxvW.net]
1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。

557 名前:デフォルトの名無しさん mailto:sage [2019/08/21(水) 02:35:13.27 ID:GZen3C6t.net]
>>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?

> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。

558 名前:デフォルトの名無しさん [2019/08/21(水) 03:44:23.93 ID:jDiMObB6.net]
>>540
流れは似てるが今回は指摘されてるURLが問題なんだろ
よりによってアイツがってやつさ

559 名前:551 mailto:sage [2019/08/21(水) 05:07:33.18 ID:GZen3C6t.net]
あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か

sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?

https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa

560 名前:デフォルトの名無しさん [2019/08/21(水) 14:49:37.63 ID:ur92HW83.net]
拡張子付け間違いか

561 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:16:14.71 ID:mlpPC2JR.net]
ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。

562 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 06:36:57.94 ID:jM8tCXZ0.net]
だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば

iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話

563 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 08:04:31.58 ID:jlFkmCtz.net]
jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで

564 名前:デフォルトの名無しさん [2019/08/22(木) 09:50:35.92 ID:xQsiKIbM.net]
鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る



565 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:23:09.36 ID:jM8tCXZ0.net]
>>557
拡張子はjisじゃなくてsjisな
だからドキュメントの文字コードが明らかに間違ってるんだよ

566 名前:デフォルトの名無しさん mailto:sage [2019/08/22(木) 10:30:34.86 ID:jM8tCXZ0.net]
昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。

なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった

そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。

たぶんこんなところ






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<221KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef