UnicodeとUTF-8の違い ..
[2ch|▼Menu]
554:デフォルトの名無しさん
08/08/08 01:50:13
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。

555:デフォルトの名無しさん
08/08/08 04:17:35
サロゲートペア厨必死だな。無視されてんのによw

556:デフォルトの名無しさん
08/08/08 09:21:22
サロゲートペアは、32bit wchar_tの入り口ですよ。

557:デフォルトの名無しさん
08/08/08 09:33:01
マイクロソフトで統一すれば市場に一致して解決

558:デフォルトの名無しさん
08/08/08 09:38:44
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん

559:デフォルトの名無しさん
08/08/08 10:57:45
結論
>>1みたいなのが現れるのはMSが糞だから

560:デフォルトの名無しさん
08/08/08 11:58:30
何でも他人のせい、日本のせいにする人たちみたいですね。

561:デフォルトの名無しさん
08/08/08 12:35:44
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。

562:デフォルトの名無しさん
08/08/08 14:04:35
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが

563:デフォルトの名無しさん
08/08/08 22:59:01
少なくともパートのおばちゃんは働いてるからな
                   ^^^^^^^^^

564:デフォルトの名無しさん
08/08/09 00:51:35
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。

565:デフォルトの名無しさん
08/08/09 04:22:32
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。

566:デフォルトの名無しさん
08/08/09 07:01:57
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。

567:デフォルトの名無しさん
08/08/09 08:34:38
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

568:デフォルトの名無しさん
08/08/09 09:53:28
>>567
>>557

>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

569:デフォルトの名無しさん
08/08/09 11:23:13
> お前ら

たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。

570:デフォルトの名無しさん
08/08/09 13:07:27
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。

571:デフォルトの名無しさん
08/08/09 13:21:53
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572:デフォルトの名無しさん
08/08/09 13:24:33
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573:デフォルトの名無しさん
08/08/09 13:39:23
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574:デフォルトの名無しさん
08/08/09 13:42:08
>>573
メモ帳もUnicode/Unicode big endianだけど。

575:デフォルトの名無しさん
08/08/09 13:52:08
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576:デフォルトの名無しさん
08/08/09 15:01:15
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577:デフォルトの名無しさん
08/08/09 15:32:53
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
URLリンク(msdn.microsoft.com)
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578:デフォルトの名無しさん
08/08/09 15:51:22
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579:デフォルトの名無しさん
08/08/09 16:21:00
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった

580:デフォルトの名無しさん
08/08/09 23:37:35
Shift JISで悩まされてた人って多いんじゃないの?

581:デフォルトの名無しさん
08/08/10 02:42:19
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582:デフォルトの名無しさん
08/08/10 02:59:24
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583:デフォルトの名無しさん
08/08/10 05:13:31
>>580
それで悩むのはUNIX屋だけ。

584:デフォルトの名無しさん
08/08/10 07:29:26
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585:デフォルトの名無しさん
08/08/10 07:57:24
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586:デフォルトの名無しさん
08/08/10 09:20:58
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587:デフォルトの名無しさん
08/08/10 10:57:11
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588:デフォルトの名無しさん
08/08/10 12:24:15
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな〜。
氏名をカナで管理ってありえねーよ。


589:デフォルトの名無しさん
08/08/10 14:08:27
むしろカナしかないだろ

590:デフォルトの名無しさん
08/08/10 22:24:23
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。


最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5388日前に更新/116 KB
担当:undef