[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2chのread.cgiへ]
Update time : 05/09 13:54 / Filesize : 116 KB / Number-of Response : 591
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは?



1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ]
ビッグインディアンとかなんとかかんとか

552 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 22:59:54 ]
狭義のユニコードっていうのはM$が決めつけたUnicodeのことか?
例えば、ttp://msdn.microsoft.com/ja-jp/library/ms191200.aspx
>Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため


つーか、広義も狭義もねーよ。バーヤ。

553 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 00:08:21 ]
まだやる気か?

554 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 01:50:13 ]
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。

555 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 04:17:35 ]
サロゲートペア厨必死だな。無視されてんのによw

556 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:21:22 ]
サロゲートペアは、32bit wchar_tの入り口ですよ。

557 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:33:01 ]
マイクロソフトで統一すれば市場に一致して解決

558 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:38:44 ]
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん

559 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 10:57:45 ]
結論
>>1みたいなのが現れるのはMSが糞だから

560 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 11:58:30 ]
何でも他人のせい、日本のせいにする人たちみたいですね。



561 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 12:35:44 ]
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。

562 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 14:04:35 ]
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが

563 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 22:59:01 ]
少なくともパートのおばちゃんは働いてるからな
                   ^^^^^^^^^

564 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 00:51:35 ]
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。

565 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 04:22:32 ]
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。

566 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 07:01:57 ]
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。

567 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 08:34:38 ]
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

568 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 09:53:28 ]
>>567
>>557

>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

569 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 11:23:13 ]
> お前ら

たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。

570 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:07:27 ]
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。



571 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:21:53 ]
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:24:33 ]
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:39:23 ]
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:42:08 ]
>>573
メモ帳もUnicode/Unicode big endianだけど。

575 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:52:08 ]
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:01:15 ]
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:32:53 ]
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
ttp://msdn.microsoft.com/ja-jp/library/cc389880.aspx
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:51:22 ]
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 16:21:00 ]
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった

580 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 23:37:35 ]
Shift JISで悩まされてた人って多いんじゃないの?



581 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:42:19 ]
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:59:24 ]
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 05:13:31 ]
>>580
それで悩むのはUNIX屋だけ。

584 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:29:26 ]
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:57:24 ]
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 09:20:58 ]
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:57:11 ]
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 12:24:15 ]
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな〜。
氏名をカナで管理ってありえねーよ。


589 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 14:08:27 ]
むしろカナしかないだろ

590 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 22:24:23 ]
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<116KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef