[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 05/22 16:06 / Filesize : 183 KB / Number-of Response : 805
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは? その2



1 名前:デフォルトの名無しさん [2010/11/30(火) 09:00:05 ]
富士通だとデフォルトでは生成されない
frt -c -Am -M./ (なんとか.f90)
でいけるのではなかろうか。いずれにせよ、
frt -help | less
とかやって、"module"で検索を掛けるのが吉。


2 名前:デフォルトの名無しさん [2010/11/30(火) 10:52:07 ]
アイちゃんによる誤爆スレ立てでした

3 名前:デフォルトの名無しさん mailto:sage [2010/11/30(火) 13:18:27 ]
このスレッドは天才チンパンジー「アイちゃん」が
言語訓練のために立てたものです。

アイと研究員とのやり取りに利用するスレッドなので、
関係者以外は書きこまないで下さい。

                  京都大学霊長類研究所

4 名前:デフォルトの名無しさん mailto:sage [2010/12/09(木) 09:43:39 ]
つ゚

5 名前:デフォルトの名無しさん [2010/12/09(木) 16:52:06 ]
|                                      ,.-――――‐  、       ..|
|                                      /      ,.-――┴- 、     .|
| 以下                               /   |   /: : l、: : : ;l: : : : :\.   .|
| イカペディア創設者                      /   :! ./: : :、: :!_\;/ _V\ : |`     |
| イカ娘からの                        〈 ___V: : : :|∧|      __`|∨    |
| メッセージをお読みください                   ` ̄丁 |: |:l :| __   〃⌒V|     |
|                                         ヽ|: NV:!〃⌒__ //}|     |
|                                          /: :{_|: :|//f´   ヽ}  八    |
|                                          _/: :/:/ : ト .丶___,ノイ\_:\.  |
|                                   __,/: :_;/: /,.イ⌒ヽ!ヽ: ト、\  !: |__ |
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

6 名前:デフォルトの名無しさん mailto:sage [2010/12/15(水) 07:54:00 ]
               ,. ――- 、_
                /         \`  、
           /     ___  \  \     人類よ、よく聞け!
            //   .  ´: : : : : : : :` 、 ヽ   \   今からこのスレを
           / / ./: : : : : : : : : : : : : : : \i:    〉  人類侵略の拠点に
          / / / : : : : : : : : : : : 八: : : : : : :ヽ./   させていただくでゲソ
.       /  :i/: : : :\: __: : : : :-/―}ハ‐ : : : : : i          __
      〈   /: : : : : /\: : : : / ,x≠ミx、: :∧|      / }
       \i: : : : :/ |:|  \:/   んィハ }}V:|):{     ./  /
         |: : : : : : ト|       弋ぅり  {: :、: \__/  /__   ,. ┐
        ∨\: : :|   ,x≠   ,       ハ: : \:__:/  /: : : : : :`ン'’ ノ
               \|ヘ〃   r    ̄}  /: : \:_____/  /´ ̄ ̄/  / \
               / : : ∧    \ __ノ/L.,ィ'⌒ヽ:_/  /: ̄`ン'  / ヽ: : : :!
             /: : :〃: :,>ー;‐┬  ´   /{{ /:/   ハ:>'´  /、   j: : : |
      ___,/: ://: : :{  〃 八    / ∨/        /ヽ: : ', /: : :/
    / : : : : : : ://: : :,ハ {{ |\  __/  V:f         '⌒ヽ }: :| \: :\
  / : :/´ ̄ ̄/ : : / j : ヽ}}:!   /   |: |   {    /  /},: : / _/: : /
  {: : :{    / />くつ/: : : :リ  '.  / /  :! : 、   V´ ̄   ,.イ/ : / | : : : :|
   、: : 、   |:{   r_〉}ヽ: : :{   ∨      \: \ \― ´ /' : 〈   ! : : : : |
   \: :\  、:\__): }\:、           ` ┬ヽ._}=一'´ 〉: : 〉 ! : : : : |

7 名前:デフォルトの名無しさん mailto:sage [2010/12/16(木) 08:43:29 ]
524 名前:デフォルトの名無しさん [sage]: 2010/09/26(日) 02:22:11
BOMの扱いが決定不可能な問題について質問と言う形で出す

変な子が、ファイルサイズと文字長は違うよと言ってくる

知ってると返す

変な子が、人が扱う文字長とプログラムで扱う文字長は違うと言ってくる

知ってると返す

変な子が、いやおれの中では文字長と言えばこう定義されてるし別物なんだよと言ってくる

だから、そんな話はしていないからもうレスしなくていいよと返す

変な子が、人が扱う文字長とプログラムで扱う文字長は違うんだよ!昔からの当たり前の話だろうと言ってくる

開いた口がふさがらない

変な子が、コンピュータ処理で言う1文字と人が認識する1文字とは違うんじゃないのと、また繰り返してる

もうやだこの馬鹿 ←いまここ

8 名前:デフォルトの名無しさん mailto:sage [2010/12/16(木) 17:04:23 ]
1 名前:デフォルトの名無しさん [sage]: 2007/04/30(月) 20:02:37
ビッグインディアンとかなんとかかんとか

9 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 19:47:50 ]
           皆様へのお願い

  このスレッドは高次機能障害をもたらす
病理の臨床実験のために立てたものです。

  被験者と研究員のやり取りに使うため、
書き込み等は自重されるようお願いいたします。
もし、書き込み等をすることで不愉快な思いをされましても、
当研究所は責を負いかねます。



                      (社)京都微生物研究所

10 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 22:09:58 ]
      ,.-―― 、
     /    ,.- ┴- 、
     /.|  /:´ : : : : : : : :ヽ
.    / :! i{: : : :/\;/ V }: :ゝ
   〈.__V l:l:V-‐ ´ ‐ ,'l:/ <人間ども、昔ETという映画があったことを知らなイカ?
.     ヽ|: l: l、  ヮ_.ノ:l    <ETという宇宙人によって地球が侵略される話でゲソ
.    _/:/`,}:`ス/ ̄ ̄ ̄ ̄/ <そして、次の瞬間、貴様はキーボードのEとTを見て驚愕するでゲソー
   /: : :(__::::つ/  FMV  / カタカタ
.. ̄ ̄ ̄ ̄ ̄\/____/ ̄ ̄



11 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 22:39:28 ]
うーん、EとTを見ても驚愕すべきものがなにも見つからない。
目の前にキーボードが2台並んでいるのだが……

12 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 22:45:23 ]
EとTの間にはRがある
Rと言えば思い出すのは
そう
Ruby

13 名前:デフォルトの名無しさん mailto:sage [2010/12/18(土) 08:07:40 ]
1 名前:デフォルトの名無しさん [age]: 2010/05/27(木) 14:17:17
前スレでなんとなくわかったのですが、インディアンがどうとかいうあたりで
話について行けなくなりました。


2 名前:デフォルトの名無しさん [sage]: 2010/05/27(木) 14:20:27
次スレいるのかよw

14 名前:デフォルトの名無しさん mailto:sage [2010/12/18(土) 08:08:41 ]
117 名前:デフォルトの名無しさん [sage]: 2010/06/22(火) 08:42:27
おかしい人は相手をせず放置するのがいちばんですよ。

でもここはおかしい人隔離スレかw

15 名前:デフォルトの名無しさん mailto:sage [2010/12/18(土) 08:09:23 ]
173 名前:デフォルトの名無しさん [sage]: 2010/07/05(月) 21:18:23
>>164
文字コードと改行コードの話はキチガイ信者が集まるものだよ。
ネットニュースのうさげの時代からずっと。
そんな人達の隔離スレがここゆっくりしていってね

16 名前:デフォルトの名無しさん mailto:sage [2010/12/19(日) 12:42:03 ]
<!-- 美乳 -->

17 名前:デフォルトの名無しさん mailto:sage [2010/12/19(日) 13:44:38 ]
ここはシフトジスです。美乳はいりません。

18 名前:デフォルトの名無しさん mailto:sage [2010/12/19(日) 21:31:42 ]
<!-- 入口 -->

19 名前:デフォルトの名無しさん mailto:sage [2010/12/20(月) 08:57:56 ]
971 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:09:15
結局UnicodeとUTF-8の違いは何なのでしょうか。
符号化文字集合Unicodeにも各文字に符号が振られているのに
さらにUTF-8が符号化方式とかわけわかりません。


972 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:15:38
Unicodeは文字に番号を振っているだけ。ビットもバイトも関係ない。
そのUnicode番号を、バイト(正確にはオクテット)データの連続として
表現する方法の一つがUTF-8。


973 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 22:06:07
Unicode: 単なる「文字の表」で、あいうえお表のようなもの。
      便利にするために、文字ごとに番号がついてあるけど、
      その番号はコンピュータ上のデータとは何ら関係がない。単なる整理番号。

UTF-8, UTF-16など: Unicodeの表にある文字をコンピュータ上で表現したいとき、
      どういう手順で表せばいいかを定めた「決まりごと」。
      Unicode表の文字をコンピュータ上のデータに変換する規則、
      コンピュータ上のデータをUnicode表の文字に変換する規則が定められている。

Unicode系の規格では「文字の表」と「決まりごと」が一組そろってはじめて、文字とデータの対応付けができる。
ASCIIコードでは、表と決まりごとの区別はあんまり明確じゃない。

Shift_JIS, iso-2022-jp, euc-jpは全部「決まりごと」で、やっぱり「文字の表」がないと意味をなさない。
そいつらはUnicode表じゃなくて、JISコードって表のための決まりごと。

20 名前:デフォルトの名無しさん mailto:sage [2010/12/20(月) 08:59:50 ]
977 名前:デフォルトの名無しさん [sage]: 2010/05/25(火) 09:34:36
>>975
VB6の動作は知らないが、インディアン付きってなんだw
BOM付きか、リトルエンディアンかどっちかの勘違いだと思うけど。

エンディアン: ガリバー旅行記に出てくる、卵を尖った方から割る種族、丸い方から割る種族に由来。
    データの格納順序。例えば、16ビットデータ0xFEFFを表すとき、
    FE FFのように、桁の大きい方から表すのがビッグエンディアン
    FF FEのように、8ビットずつ区切って桁の小さい方から表すのがリトルエンディアン

    CPUによって、どっちがやりやすいかはある程度決まってくる。
    例えばx86系(パーソナルコンピュータのCPUは全部これ、と思っても特に差し支えない)は
    リトルエンディアンなCPUなので、何も考えずにUTF-16テキストを作るとリトルエンディアンになる。

BOM(Byte Order Mark): ユニコード表のU+FEFFの文字のこと。
    UTF-16で、この文字を頭に入れておくと、あら不思議。エンディアン(バイトの並び順=Byte Order)が分かっちゃう。
    より具体的には、UTF-16でU+FEFFは0xFEFFなので、
    これがFE FFのように入っていたらビッグエンディアン、FF FEのように入っていたらリトルエンディアン。

    UTF-8には、エンディアンの違いはないので、Byte Orderを示す必要がない。
    けれども、これが頭に入ってたらUTF-8だって判別しやすいよね、ということでsignature(しるし)として
    入れることが認められている。



21 名前:デフォルトの名無しさん mailto:sage [2010/12/25(土) 22:49:24 ]
>>1
本スレ>>1です。紛らわしいスレを立てないでください。
とはいえ、本スレが埋まったらまたここに来ますです。

22 名前:デフォルトの名無しさん mailto:sage [2011/01/01(土) 13:32:38 ]
unicodeはfffeのボムつきutf-16リトルエンディアン
メモ帳がそうだ

23 名前:デフォルトの名無しさん mailto:sage [2011/01/18(火) 17:52:43 ]
JIS漢字コードとシフトJISコードの違いは何でしょうか。
区点コードとシフトJISコードの違いは何でしょうか。

24 名前:デフォルトの名無しさん [2011/01/18(火) 17:54:39 ]
msdn.microsoft.com/ja-jp/library/cwe8bzh0(v=VS.100).aspx
>Unicode は 16 ビットの文字セットで、すべての言語に対する十分な表現能力を持っています。
>すべての ASCII 文字は、拡張文字として Unicode の中に含まれます。

WindowsにおけるUnicode(の文字符号化方式)とはUTF-16(またはUCS-2)の意味。

>このドキュメントでは、MBCS は、Unicode でサポートされていないすべてのマルチバイト文字を指します。
>Visual C++ では、MBCS は常に DBCS を意味します。 2 バイトを超える文字セットはサポートされていません。

WindowsにおいてはUnicodeがUTF-16(またはUSC-2)の意味なので
UTF-7やUTF-8はサポートされない。

msdn.microsoft.com/en-us/library/dd317756(VS.85).aspx
>1200 utf-16 Unicode UTF-16, little endian byte order (BMP of ISO 10646); available only to managed applications

コードページ1200(UTF-16)はネイティブなVC++では使えない。

VC++でネイティヴアプリケーションを記述する限り、
Unicodeの全文字を利用する方法はない。

これでOK?^^;

25 名前:デフォルトの名無しさん mailto:sage [2011/01/18(火) 21:38:24 ]
>>23
JIS漢字コードってなんですか。JIS X 0208 のことですか。
シフトJISコードってなんですか。シフト符号化表現のことですか。
区点コードってなんですか。区点番号のことですか。

勝手な用語を使われたら誰も何も答えられません。

26 名前:デフォルトの名無しさん mailto:sage [2011/01/18(火) 22:21:26 ]
目指してる 未来が違うwwww byシャープ
twitter.com/ozawa_yuuki/status/6549767047872513  

27 名前:デフォルトの名無しさん [2011/01/18(火) 23:27:12 ]
最近ようやくわかってきたんだ。つまり、Unicodeを扱えないのはコンソールなんだよ。

28 名前:デフォルトの名無しさん mailto:sage [2011/01/18(火) 23:52:45 ]
ええ〜〜っ!JIS漢字コードを知らないひとがいるのぉ?
ええ〜〜っ!シフトJISコードを知らないひとがいるのぉ?
ええ〜〜っ!区点コードを知らないひとがいるのぉ?

ばっかみた〜い

29 名前:デフォルトの名無しさん mailto:sage [2011/01/18(火) 23:53:27 ]
「コンソール」って何ですか?

30 名前:デフォルトの名無しさん mailto:sage [2011/01/19(水) 00:16:22 ]
command.com のことかな



31 名前:デフォルトの名無しさん mailto:sage [2011/01/19(水) 00:34:40 ]
chcp 65001

32 名前:デフォルトの名無しさん [2011/01/19(水) 00:50:05 ]
cp65001はUTF-8なので今度はVC++が対応しないね。

33 名前:デフォルトの名無しさん mailto:sage [2011/01/19(水) 01:39:24 ]
Windowsのシステムロケールを英語にしてからcp650001にすると逝ける

34 名前:デフォルトの名無しさん mailto:sage [2011/01/19(水) 10:31:45 ]
>>28 自分がバカを晒していることに気付かないバカ

35 名前:デフォルトの名無しさん mailto:sage [2011/01/26(水) 00:29:48 ]
前スレが見当たらないんだが、物凄い勢いでDAT落ち?

36 名前:デフォルトの名無しさん mailto:sage [2011/01/26(水) 00:34:53 ]
987で落ちたみたいだね
UnicodeとUTF-8の違いは? その2
hibari.2ch.net/test/read.cgi/tech/1274937437/

37 名前:デフォルトの名無しさん mailto:sage [2011/01/26(水) 16:26:32 ]
980超えて24時間書き込みがないと自動的に落ちる、だっけ。

38 名前:デフォルトの名無しさん [2011/01/28(金) 19:01:23 ]
隔離スレ浮上

39 名前:デフォルトの名無しさん mailto:sage [2011/02/01(火) 06:41:44 ]
コンソールってのは辞書を引くと「慰める」。
つまりオナニーのことだったんだよ

40 名前:デフォルトの名無しさん mailto:sage [2011/02/01(火) 07:17:12 ]
確かに肌荒れしたところに塗ると痛みが引くよね



41 名前:デフォルトの名無しさん mailto:sage [2011/02/01(火) 15:03:50 ]
  

42 名前:デフォルトの名無しさん mailto:sage [2011/02/02(水) 00:13:35 ]
珍宝に塗るのがオヌヌメ

43 名前:デフォルトの名無しさん mailto:sage [2011/02/02(水) 08:12:08 ]
>>39
琉球語で「いらっしゃい」の意味じゃなかったの?

44 名前:デフォルトの名無しさん mailto:sage [2011/02/03(木) 21:48:55 ]
>>24
>VC++でネイティヴアプリケーションを記述する限り、
>Unicodeの全文字を利用する方法はない。

どれだけ無知なんだよ。Unicode(UTF-16)版API使うに決まってんだろ。

>>25
>シフトJISコードってなんですか。シフト符号化表現のことですか。
相変わらずJIS信者はキモいな。シフトJISはシフトJISだよ。

45 名前:デフォルトの名無しさん [2011/02/03(木) 22:37:43 ]
それはWindows SDKであって、Visual C++ではないんじゃないか?

みたいなつっこみでどうでしょう。

46 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 00:22:50 ]
>>45
で、それが問題になるケースは?

47 名前:デフォルトの名無しさん [2011/02/04(金) 00:25:11 ]
ないね。2003以降はSDKにVCコンパイラくっついてるし。逆もまた真だし。

48 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 01:21:00 ]
VC++ で BOM なしで UTF-8 通るようになったら
もう完全に引っ越すんだけどな

49 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 06:57:05 ]
引っ越さない理由がわからない。BOMありで何か問題が?

50 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 07:12:45 ]
> >シフトJISコードってなんですか。シフト符号化表現のことですか。
> 相変わらずJIS信者はキモいな。シフトJISはシフトJISだよ。

CP932 とか Windows-32J で混乱して死ねばいいと思うよ。



51 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 07:21:36 ]
Unix - 「UTF-8にBOMはいらないんだよ糞が」派
Windows - 「BOMねえとエンコーディングの判別が面倒すぎるだろ糞が」派

52 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 10:50:26 ]
俺 - じゃあ、なんも悩まなくいいように全部何から何までBOMなしUTF-8にしようぜ!
   バイト列だからとかホザいてるFSもな!

53 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 11:42:13 ]
>>51
「shebang の次の行に書いておけばいいだろ」派

54 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 11:47:16 ]
Cのソースとかにまでshebang書いてたらアホだと思われるぞ
実際アホなんだろうけど

55 名前:デフォルトの名無しさん [2011/02/04(金) 19:11:35 ]
もともとUTF-8の規格にはBOMないし
BOMがあるとUTF-8の利点である1バイト部分がLaten-1互換ってのも失われちゃうし
おっぱいぱいなんじゃなかったっけ?

56 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 20:39:51 ]
綴り間違ってるし互換性なんてないし
古いエンコードでバシッと表示できる可能性がミジンコくらい有るのはASCIIだけだよ

57 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 21:56:15 ]
>>56
バックスラッシュとチルダは?

58 名前:デフォルトの名無しさん mailto:sage [2011/02/05(土) 11:35:57 ]
ASCIIだから問題ないでしょ。
JIS X 0201左面じゃないんだから。

59 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 01:07:58 ]
>>51
ファイル名に BOM 付ける訳にいかないしなぁ

60 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 02:07:45 ]
>>59
実はお前、馬鹿ですね



61 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 02:11:36 ]
>>54
shebang という事は TCC 使いなのかもね。

bellard.org/tcc/

62 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 04:33:14 ]
>>61
申し訳ございませんが
tcc と shebang の関係について私には分かり兼ねますので
ご高説賜りたく望む所存でございます

63 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 05:13:24 ]
>>61
TCCでコンパイルすると出来上がったexeにアンチウィルスソフトが反応してワロス

ここのひとも同じみたいだ
>ttp://www.mail-archive.com/tinycc-devel@nongnu.org/msg02244.html


64 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 06:51:10 ]
>>62
リンク先嫁

65 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 07:35:26 ]
>>64
># C script supported : just add '#!/usr/local/bin/tcc -run' at the first line of your C source, and execute it directly from the command line.

ありがとうございました

66 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 13:00:21 ]
>>61
TCC でも動作確認出来ました。
ttp://www1.axfc.net/uploader/Sc/so/202217.zip&key=tcc
ほんとうにありがとうございました。

67 名前:デフォルトの名無しさん [2011/02/06(日) 13:15:56 ]
>>59-60
ファイル名に BOM 付けたければ付ければ?

68 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 15:13:49 ]
RFCは規格とイコールではないし、規格だって法とイコールでもない
Unicode関連が元々どうしようもないクソ規格なんだから、適当にならざるを得ないんだよ
四角四面に適用可能なほど出来のいい規格じゃねーし

69 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 17:16:43 ]
BOMって結局>>51の言うように、「美乳」の代わりなの?
BOMのバイト列が先頭に出現する符号化方式って他に無いの?

70 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 17:18:23 ]
>>69
> BOMのバイト列が先頭に出現する符号化方式って他に無いの?
Latin-1をはじめとするシングルバイト全部



71 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 17:31:36 ]
じゃあUTF-16って言う前提が無いとダメなの?
具体的に役立つ場面が想像付かない。
あまり聞くのも迷惑だろうし、判りやすいサイトがあれば誘導してほしいです

72 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 21:07:11 ]
たしかにBOM付いてると
UTF-8でもVC++通るな

73 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 22:39:52 ]
>>71
君の疑問は君の無知から来ているわけではなく、
BOMの矛盾がそのままあなたの頭の中のモヤモヤになってるだけ。


74 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 23:03:58 ]
>>70
確かに[FE FF 41 41]のファイルはLatin-1ともUTF-16とも。
(VC#で確認したけどデフォルトではEncoding無視してBOM優先なんですね。ちょっと驚いた)

前スレも見てきたけどBOMについては賛否あるみたいなんで、
あんまり関わらないようにします。

75 名前:デフォルトの名無しさん mailto:sage [2011/02/09(水) 01:01:41 ]
>>71
偶然先頭にBOMが来ることは少ない、という前提の元では、
ファイルが、自身のエンコード方式を明確にする目的での利用にはそれなりに役に立つ。

けどBOMなしUTF-16というものもあるので、
アプリが、ファイルのエンコードを知るという目的では微妙。

76 名前:デフォルトの名無しさん mailto:sage [2011/02/09(水) 23:56:09 ]
>>73
>BOMの矛盾
何も矛盾してないだろ。矛盾とは何?
エンコーディングを確実に判断するにはメタデータが必要に決まっているし、
BOMはUnicodeを他のエンコーディングと区別できることを保障している
わけではない。

77 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:29:49 ]
>>71>>73も同レベルの無知だと思うよ

78 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:31:47 ]
じゃあ俺も!

79 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:47:30 ]
だな
>>75も無知の部類

80 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:53:16 ]
うざいなあ
低能なネタ振りは無視すれいちいちツッコミ入れるな



81 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:55:10 ]
それも無視すれば良いんじゃないの

82 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 01:55:30 ]
>>75の認識で何が間違ってる?
無知じゃない人おしえて

83 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 06:15:01 ]
------ はいはい ここまで読んだ ------

84 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 06:41:56 ]
>>75はあれだろ。
「挨拶は人間同士のコミュニケーションを円滑にするが、
挨拶しない人もいるので、挨拶の必要性を感じない」ってレベル。

85 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 08:36:09 ]
コードポイントとスカラー値の違いは何でしょうか?

86 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 09:26:48 ]
コードポイントというのは抽象的な概念で、Unicode 以外の文字集合の
(たとえば JIX X 0208 の「何区何点」)も「コードポイント」。

スカラー値というのは Unicode の概念で、コードポイントを示す具体的な
整数値。

87 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 09:48:53 ]
>>86
そういうことなんだ。
d

88 名前:デフォルトの名無しさん [2011/02/10(木) 10:16:57 ]
バカと無知の違いは何でしょうか?

89 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 10:18:13 ]
無知は知識を獲得すれば問題なくなる
バカは死ななきゃ治らない

90 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 10:37:47 ]
const int バカ = 0;
int 無知; // uninitialized



91 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 12:28:24 ]
人格的な理由によるバカならば、稀にconst_castが効くこともある

92 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 15:27:41 ]
ただし膨大なコストを伴う

93 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 20:00:10 ]
UTF-8 なファイルに BOM を付けるのは、渋谷の交差点ですれ違う人全員に挨拶するレベルかな

94 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 21:34:49 ]
的外れなたとえ話は要らん

95 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:01:51 ]
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf8">

これでじゅうぶんやん。何が不満なの?ワケがわかりません。

96 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:06:18 ]
<?xml encoding="UTF-8">

これでもいいし。まぁ煮たようなのは他にも
-*- coding: UTF-8 -*-
とか
vim:fileencoding=UTF-8
とか
use utf8;
とかあるらしいけど、実際に使った事がないから知らん。
なんでソレじゃダメなのさ?

97 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:07:04 ]
おそらく誰も明確には答えられんだろうな。

98 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:16:46 ]
<?xml encoding="UTF-8">
-*- coding: UTF-8 -*-
vim:fileencoding=UTF-8

これらは
coding="UTF-8"
coding: UTF-8
coding=UTF-8
の部分のマッチだけ見てるよ

99 名前:デフォルトの名無しさん [2011/02/11(金) 00:42:47 ]
コーディングマッチ子先生

100 名前:デフォルトの名無しさん mailto:sage [2011/02/11(金) 01:31:28 ]
その手の手法は、元来レイヤーが違うところに情報を持たせている気持ち悪さはあるな
例えば、文字コード変換との相性は明らかに良くないし、対処法も美しくない
BOMと比べてどうかはまた別の話だが



101 名前:デフォルトの名無しさん mailto:sage [2011/02/11(金) 03:51:56 ]
実際のエンコーディングと異なるエンコーディング名を指定できるし
UTF-16で破綻するしBOMより酷いと思う






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<183KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef