[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 07/03 06:05 / Filesize : 124 KB / Number-of Response : 631
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは?



1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ]
ビッグインディアンとかなんとかかんとか

552 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 22:59:54 ]
狭義のユニコードっていうのはM$が決めつけたUnicodeのことか?
例えば、ttp://msdn.microsoft.com/ja-jp/library/ms191200.aspx
>Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため


つーか、広義も狭義もねーよ。バーヤ。

553 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 00:08:21 ]
まだやる気か?

554 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 01:50:13 ]
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。

555 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 04:17:35 ]
サロゲートペア厨必死だな。無視されてんのによw

556 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:21:22 ]
サロゲートペアは、32bit wchar_tの入り口ですよ。

557 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:33:01 ]
マイクロソフトで統一すれば市場に一致して解決

558 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:38:44 ]
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん

559 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 10:57:45 ]
結論
>>1みたいなのが現れるのはMSが糞だから

560 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 11:58:30 ]
何でも他人のせい、日本のせいにする人たちみたいですね。



561 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 12:35:44 ]
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。

562 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 14:04:35 ]
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが

563 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 22:59:01 ]
少なくともパートのおばちゃんは働いてるからな
                   ^^^^^^^^^

564 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 00:51:35 ]
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。

565 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 04:22:32 ]
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。

566 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 07:01:57 ]
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。

567 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 08:34:38 ]
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

568 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 09:53:28 ]
>>567
>>557

>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

569 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 11:23:13 ]
> お前ら

たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。

570 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:07:27 ]
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。



571 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:21:53 ]
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:24:33 ]
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:39:23 ]
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:42:08 ]
>>573
メモ帳もUnicode/Unicode big endianだけど。

575 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:52:08 ]
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:01:15 ]
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:32:53 ]
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
ttp://msdn.microsoft.com/ja-jp/library/cc389880.aspx
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:51:22 ]
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 16:21:00 ]
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった

580 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 23:37:35 ]
Shift JISで悩まされてた人って多いんじゃないの?



581 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:42:19 ]
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:59:24 ]
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 05:13:31 ]
>>580
それで悩むのはUNIX屋だけ。

584 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:29:26 ]
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:57:24 ]
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 09:20:58 ]
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:57:11 ]
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 12:24:15 ]
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな〜。
氏名をカナで管理ってありえねーよ。


589 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 14:08:27 ]
むしろカナしかないだろ

590 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 22:24:23 ]
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。



591 名前:デフォルトの名無しさん mailto:sage [2008/08/11(月) 20:51:33 ]
氏名に漢字をつかえば
全国のグリーンピアは莫大な赤字を抱えずに済んだのだろうか?

592 名前:デフォルトの名無しさん mailto:sage [2008/08/11(月) 21:56:05 ]
グリーンピアって暴力団が接待するための専用設備だろ

593 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 00:30:44 ]
年金台帳の問題って朝鮮脳が主犯ぽいな

594 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 17:49:01 ]
>>588

昔はカタカナと英数しか印刷できないプリンタがほとんどで、
漢字やひらがなな印字できるプリンタは「漢字」プリンタとか
「日本語」プリンタとか名前が付いて特別扱いされてたのさ

595 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 17:52:16 ]
>>594
それを最初から分かってて、あえてコンピュータで管理しようとしたんだろ?
もうアフォとしか言いようが無い。

596 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 18:34:30 ]
いやいや、当時でも立派に稼動してたシステムはあるさ。

597 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 20:21:19 ]
>>595
そういう問題じゃないだろ。
アホかよw


598 名前:デフォルトの名無しさん mailto:sage [2008/08/12(火) 23:19:25 ]
>>595
現代からだったらなんとでも言えるよ。
例えば、将来DNAを登録出来る、確実に本人に紐付けられるシステムが出来たとして、
「昔は」名前を登録するだけしか出来なかったんだと。
で、
> それを最初から分かってて、あえてコンピュータで管理しようとしたんだろ?
> もうアフォとしか言いようが無い。
と言うようなもんじゃないか?

599 名前:デフォルトの名無しさん mailto:sage [2008/08/13(水) 03:49:07 ]
官公庁では今でも”「漢字」プリンタとか「日本語」プリンタとか”を使ってるね。
こないだ海上自衛隊の護衛艦を見学する機会があったが
艦内に古めかしい漢字プリンタが鎮座ましましておられた。

600 名前:デフォルトの名無しさん mailto:sage [2008/08/13(水) 03:53:16 ]
何を調達するにしても防衛スペックの準拠を求められるからね
それがかなり無茶苦茶な要求だったりするから一度通った物は三十年前の図面でもそのまま流用する。



601 名前:デフォルトの名無しさん mailto:sage [2008/08/13(水) 07:57:01 ]
いやぁ、防衛省関連はそんなもんじゃないよ。「スペックの準拠」じゃなくて他のものが要求されているんだ。判るだろ?w

602 名前:デフォルトの名無しさん mailto:sage [2008/08/19(火) 15:12:27 ]
幹部用最新PC一式(個人宅へ配送。伝票は廃棄のこと)なのか
ケツの穴なのか。

603 名前:デフォルトの名無しさん mailto:sage [2008/08/19(火) 22:39:57 ]
>>602
んにゃ、世間をにぎわした件とか、○○システムと抱き合わせとか。

604 名前:デフォルトの名無しさん mailto:sage [2008/08/31(日) 02:27:12 ]
VB6.0が受け取るコマンドラインはどんな文字コードでもいいんだろうか。
VB.NETアプリからVB6.0アプリをコマンドライン付きで呼び出すとコマンドラインはUTF-8でわだすが
しかしVB6.0はShift-Jisじゃないと扱えないし
どうなっとるんじゃ

605 名前:デフォルトの名無しさん mailto:sage [2008/08/31(日) 04:55:33 ]
>>604
VB6の内部コードはUTF-16LE
しかしエディタではsjisという素敵仕様

606 名前:デフォルトの名無しさん mailto:sage [2008/08/31(日) 10:15:36 ]
いや、それは知ってて、
とりあえず、コマンドラインでユニコード文字のトランプ図柄をVB6.0アプリに送ってみるとどうなるよ


607 名前:デフォルトの名無しさん mailto:sage [2008/08/31(日) 10:59:37 ]
VB6はそこ等辺の境界で勝手に文字コード変換しまくる
どんな仕様かはもう使ってないから忘れた

608 名前:デフォルトの名無しさん mailto:sage [2008/09/03(水) 01:22:45 ]
>VB.NETアプリからVB6.0アプリをコマンドライン付きで呼び出すとコマンドラインはUTF-8でわだすが
というか、これが訳わからん。
VB.NETのエンコーダ選択が間違っとるんでないの。

609 名前:デフォルトの名無しさん mailto:sage [2008/09/03(水) 01:50:50 ]
コマンドラインをUTF-8で渡すって言うのが俄に信じがたいな

610 名前:デフォルトの名無しさん mailto:sage [2008/09/04(木) 20:12:13 ]
VB6だろうと何だろうとエントリポイントはWinMainかwWinMainな訳で、
UTF-8なんてあり得ん。OSの仕組みをよく考えろ。
アプリがWinMainの時はOSがシフトJISで渡し、アプリがwWinMainの時は
OSがUTF-16で渡してくる。



611 名前:adsl-75-61-122-97.dsl.pltn13.sbcglobal.net mailto:sage [2008/09/22(月) 09:06:03 ]
>>610
WinMainとかを呼ぶのはランタイムだろうに……
コマンドライン取得もランタイムが GetCommandLine() で取得
してるので、OS がやっているわけではないよ。


612 名前:デフォルトの名無しさん mailto:sage [2008/09/22(月) 10:14:59 ]
>>611
専ブラ、アップデイトしろよ。

613 名前:デフォルトの名無しさん mailto:sage [2008/09/22(月) 16:03:59 ]
>>612
実はアップデートテストをかねて書きこんだんだけど
うまくいってなかったみたい :-)


614 名前:デフォルトの名無しさん mailto:sage [2008/10/30(木) 09:34:52 ]
>>100あたりでようやく判った。

www.atmarkit.co.jp/fxml/askxmlexpert/024utf/24utf.html

これも判りやすかった。

615 名前:デフォルトの名無しさん mailto:sage [2008/10/30(木) 09:51:55 ]
>>100は微妙に誤解を産む表現だぞ。
UTF-16は、16bit単位が一つか二つで一文字。
32bitじゃない。BEとLEがあるからこの違いは本質的。

616 名前:デフォルトの名無しさん mailto:sage [2008/11/01(土) 22:53:49 ]
えぇぇぇぇ?16ビット2つで32ビットじゃ無いの?
もしそうなら、128ビット暗号とか、32ビットCPUじゃ絶対に扱えないじゃん。

617 名前:デフォルトの名無しさん mailto:sage [2008/11/01(土) 22:55:27 ]
32bitの文字一文字と
16bitの文字二文字ではビットの並びが違う

という事を言いたかったんではないかと

618 名前:デフォルトの名無しさん mailto:sage [2008/11/02(日) 12:13:27 ]
>>617
釣りにマジレス

619 名前:デフォルトの名無しさん mailto:sage [2008/11/02(日) 21:53:17 ]
「ビットの並び」 なんて言ってる時点でアフォ丸出し。
同じ値をあらわす32ビットの数値であっても、
ディスクファイル上とメモリー上とCPU内部のALUとでは
ぜんぶ同じとは限らん。

620 名前:デフォルトの名無しさん mailto:sage [2008/11/02(日) 22:16:27 ]
意味がわからんならレスしなくていいよ



621 名前:デフォルトの名無しさん mailto:sage [2008/11/03(月) 00:46:47 ]
会話の粒度を間違う奴ってどうしようもないよな。
一番細かい視点に立つ自分が一番確かで賢い話をしていると勘違いするし。

622 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 02:55:18 ]
>>620
>>621
だから釣りだって

623 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 11:55:41 ]
Numberを略すとなんでNoになるん?

624 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 13:28:20 ]
>>623
Numberを略しているんじゃなくて、MiddleEnglishのnombreの略かラテン語のnumeroの略なんでしょ。

625 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 16:09:55 ]
detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1481014

626 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 21:46:18 ]
AをBにコピーできない。
AがBにコピーできない。
どちらも同じ意味?正しい日本語?

627 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 21:51:48 ]
>626
後者はあまり正しい日本語ではないね。

628 名前:デフォルトの名無しさん mailto:sage [2008/11/18(火) 23:25:51 ]
> AがBにコピーできない。

AがBにコピーされない。 
だと違和感少ないけど意味違っちゃうか。

ところでこれはスレとなんか関係あるのか?

629 名前:デフォルトの名無しさん mailto:sage [2009/01/17(土) 07:21:45 ]
hosiyu

630 名前:デフォルトの名無しさん [2009/01/18(日) 09:02:26 ]
 








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<124KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef