UnicodeとUTF-8の違い ..
446:デフォルトの名無しさん
08/07/19 15:43:26
>>445
それはないな。俺が確かめたから。
447:デフォルトの名無しさん
08/07/19 16:01:27
>>443
UTF-8というのはタイ語は含まれていないのでしょうか?
ブラウザとEmEditorではタイ語をきちんと表示しているので、タイ語のフォントはあると考えてはダメなの
でしょうか?
タイ文字をブラウザからEmEditorにコピペして、それを保存したのをバイナリエディタで見ると、UTF-8じゃ
ないみたいだ。
EmEditorのタイ語という文字コードはUTF-8とは別物ということか?
>>440さんの言っていることは、、自分の環境ではUTF-8のタイ語を表すコード領域とタイ語のフォントが
うまく結びついていないということかな?
でもブラウザではちゃんと表示されているんだよな。
よくわからん。
448:デフォルトの名無しさん
08/07/19 16:17:46
>>447
少なくともIEとFirefoxは言語別に使用するフォントの設定を持っていて、
タイ語の文字を見つけたら、タイ語用のフォントでタイ語の文字を描く。
ところがサクラエディタはそうなっていないのではないのか、ということ。
(無理に日本語フォント使って豆腐になるとか)
>UTF-8じゃないみたいだ。
保存時にデフォルトでShift_JISが選ばれるなんてことはない?
あと、試しにsakuraW_r1398.zipをダウンロードして
コピペしてみたが、うまくいっているように見えるけど。
449:デフォルトの名無しさん
08/07/19 18:15:17
>>448
>保存時にデフォルトでShift_JISが選ばれるなんてことはない?
設定を色々見ましたが、そんなのはなさそうな感じです。
EmEditorには、UTF-8の他にタイ語(Windows)という文字コードが選択できるんですよね。
1文字だけコピペして、それをタイ語(Windows)で保存。
それをバイナリエディタで見ると3バイトでした。だから多分Shift_JISではないと思います。
>>448さんではうまくいってるということは、やはり自分の環境の何かが悪いってことなんしょうね。
450:デフォルトの名無しさん
08/07/19 18:43:59
>>449
あたまだいじょうぶか
451:デフォルトの名無しさん
08/07/19 18:45:28
そもそもサクラエディタはShift_JISで扱える文字しか対応していないはず
452:デフォルトの名無しさん
08/07/19 18:47:10
>>451
Unicode版の話だといってるだろ…
よくよめよ
453:デフォルトの名無しさん
08/07/19 18:51:26
Unicode対応版を謳っていても実際に満足にUnicodeに対応している
テキストエディタはVisual Studioのエディタと秀丸くらいしかないよね。
454:デフォルトの名無しさん
08/07/19 19:22:12
>>449
タイ語(Windows)って選択肢はUNICODEとかじゃなくて、CPなんとかというコードページ
(WindowsのShift JISだと CP932)をタイ語のコードページに切り替えてるだけじゃないの?
だからコードページ切り替えに対応していないエディタでは文字化けする。
一旦EmEditorで UTF-8で保存して、そのあと他のエディタで読み込ませてみたら?
455:デフォルトの名無しさん
08/07/19 19:26:17
サクラエディタスレでやれば?
456:デフォルトの名無しさん
08/07/19 19:56:00
>>453
秀丸は合字処理がおかしい
457:デフォルトの名無しさん
08/07/19 20:23:26
>>454
UTF-8で保存して、サクラエディタと秀丸で開いてみましたが、ダメでした。
とりあえず自分の環境では、Unicodeとそれに対応するフォントがうまく対応付けされていないと
結論ずけておきます。
458:デフォルトの名無しさん
08/07/19 22:19:03
うちの秀丸は、URLリンク(th.yahoo.com) をコピペしてもぜんぜん文字化けしないよ。
もちろんタイのにょろにょろした文字が画面いっぱいな。
459:デフォルトの名無しさん
08/07/20 01:58:58
コピペがOS依存だって事忘れてるわけじゃないよな
460:デフォルトの名無しさん
08/07/20 09:59:56
>>453
おまえが知らないだけ。
461:デフォルトの名無しさん
08/07/20 13:17:41
Alphaとかいうエディタは異字体セレクタまで対応してたな。
462:デフォルトの名無しさん
08/07/20 18:24:26
Unicodeは16ビットで全ての文字が収まると早合点したことが失敗の始まりですか?
463:デフォルトの名無しさん
08/07/20 18:50:18
いいえ、全ての文字を符号化できると思ったのがそもそもの誤りでした
464:デフォルトの名無しさん
08/07/20 20:32:10
TRONや今昔文字鏡のことですね、わかります
465:デフォルトの名無しさん
08/07/20 20:58:54
もっと言えば、文字とは符号化できるものである、という前提から間違っている。
466:デフォルトの名無しさん
08/07/20 21:00:25
いや、TRONは存在自体が間違っている。
467:デフォルトの名無しさん
08/07/20 21:49:53
>>465
文字って符号じゃないの? 符号化できない文字表現という存在自体が想像付かない。
あ、一応、1:1マッピングできない(適切でない)ケースがあることくらいは想像が付く。
468:デフォルトの名無しさん
08/07/20 21:56:14
そんなネタにマジレスしなくても
469:デフォルトの名無しさん
08/07/20 22:03:45
龜甲占いの結果を写生しました/写真に撮りました。
この画像は符合ですか?
一応「龜」ですが。
「龜」と字を書きました。画像として保存しました。符合ですか?
この画像ファイルには"1.jpg"という名前をつけました。符合ですか?
「龜」の代りに<img src="1.jpg">とすることにしました。符合ですか?
470:デフォルトの名無しさん
08/07/20 22:13:02
連番をつけて符号化しようと思ったあたりが、問題なんじゃね
471:デフォルトの名無しさん
08/07/20 23:41:19
合成文字とか似ている漢字は一緒にしようとか
めんどくさい事考えるから・・
472:デフォルトの名無しさん
08/07/21 00:08:21
> 似ている漢字は一緒にしよう
これはまったくやらずに済まそうとするのは無理じゃない?
デジタル化以前には表記揺れするのがあたりまえだったんだし。
どこまでやるかを間違った、という批判ならその通りだと思うけども。
473:デフォルトの名無しさん
08/07/21 00:15:23
いや,揺れたものをそのまま保存・表示できない時点でダメ
揺れたものを対象にした論文などが表現できなくなるから
474:デフォルトの名無しさん
08/07/21 01:29:46
人間が文字の生き死にを自由にしようなんて、おこがましいとは思わんかね・・・・・・
475:デフォルトの名無しさん
08/07/21 03:09:30
本間先生?
476:デフォルトの名無しさん
08/07/21 09:22:12
結局、「国番号+JISコード」 で16ビットとか32ビットとか、みたいな形にすればよかったんじゃない?
(外国はJISコードとは言わんが、ま、その国ごとで規格化されてるコード、って理解してくれい)
変に世界中の文字をシャッフルしちゃったのが間違いだな。
477:デフォルトの名無しさん
08/07/21 09:56:33
それがサロゲートペアだろ。
478:デフォルトの名無しさん
08/07/21 10:48:55
なんでやねん
479:デフォルトの名無しさん
08/07/21 11:28:35
>>473
そいつは画像でやれよ……
一般的な用途ではある程度ユニファイされてる方がいい。
微妙な違いなんて日常的な文章には不要だし、検索とかにも不便だし。
480:デフォルトの名無しさん
08/07/21 11:53:14
>>477
(;゚д゚) ・・・
(つд⊂)ゴシゴシ
_, ._
(;゚ Д゚) …!?
481:デフォルトの名無しさん
08/07/21 13:30:19
>一般的な用途ではある程度ユニファイされてる方がいい
これはその通りだと思うけど、符号化のレベルではやらない方が良かったかと・・
もう1つ上のレイヤを用意して表記ゆれを吸収するのはそこの層がやる
とかにすればやり方を失敗してもそこの層を差し替えるとかして何とかなったのに
482:デフォルトの名無しさん
08/07/21 19:58:48
同意.一番下でマージしちゃったらどうしようもない
画像でやれって言う人は,実際に自分でやってないから
どれだけ大変かつ不便で読み難くなるか分からないんだろうな
483:デフォルトの名無しさん
08/07/21 20:39:00
実際に文字コード設計したことない人が国コード付けろとか128ビットにしろとか
妄想語るのももはやお約束ですよねー
484:デフォルトの名無しさん
08/07/21 21:19:59
UnicodeでAdobe Japan1-6互換の字形切替をする枠組みが既に正式規格化されているにも関わらず、
「みたいな形にすればよかったんじゃない?」
「もう1つ上のレイヤを用意して」
「一番下でマージしちゃったらどうしようもない」
とか言ってるヤツってナンなの?ゆとり?
URLリンク(www.unicode.org)
URLリンク(www.unicode.org)
URLリンク(appsrv.cse.cuhk.edu.hk)
URLリンク(appsrv.cse.cuhk.edu.hk)
上記PDFに書かれている対応製品以外にも、フリーソフトやフリーフォントで既に対応しているものもある。
URLリンク(alpha.sourceforge.jp)
(↑:日記の2008年1月〜に詳細記述)
URLリンク(yozvox.web.infoseek.co.jp)
(↑:掲示板の2008年1月〜に詳細記述)
てか、文字コードの話をするなら↓の方がいいだろ、常識で考えて。
文字コード総合スレ part3
スレリンク(tech板)
485:デフォルトの名無しさん
08/07/21 21:42:42
>>483
いかにも 「ワタシが文字コードを設計しました!」 って言いたげだな
486:デフォルトの名無しさん
08/07/21 21:43:44
何事にも失敗はある。
487:デフォルトの名無しさん
08/07/21 21:48:47
Unicodeは失敗
488:デフォルトの名無しさん
08/07/21 22:15:27
ROMっているだけだったが、ここが文字コードスレだと錯覚していた。
489:デフォルトの名無しさん
08/07/21 22:17:37
ゆとり教育は失敗
490:デフォルトの名無しさん
08/07/21 22:26:55
失敗したら反省が必要。そして次回はどうすべきか案を出し合う。
491:デフォルトの名無しさん
08/07/23 19:39:46
>>453
しゅーまる(何故か変換(ry)は、アラビア語ちゃんと扱えるんだ。すごい。
xyzzyはアラビア語無理なんだよなあ・・・
492:デフォルトの名無しさん
08/07/23 21:00:50
有名どころだと秀丸とEmEditorくらいだな。
493:デフォルトの名無しさん
08/07/24 09:32:45
しゅーまるぐみはやわじゃねえ!
しゅーまるぐみにはいるんだ!
494:デフォルトの名無しさん
08/07/24 10:12:30
EmEditorのフリー版のUnicode対応はイマイチだけど
有料版はいいんかな
495:デフォルトの名無しさん
08/07/24 14:54:39
Alphaはどうよ
496:デフォルトの名無しさん
08/07/24 15:03:58
>>494
たぶんエディタ部分のコードは同じだと思うよ。
497:デフォルトの名無しさん
08/07/24 15:38:06
>>495
アラビア語の結合は対応してるみたいだけど、キャレットとか選択領域の端とかと重なると切れちゃう。
ただ、いまのところシンタックスハイライティングがびみょんで、この板的な実用には向かんかなあ。
>>492
EmEditorや秀丸って右から左に表示するオプションあったっけ?
前に試したときはどっちもダメだった気がしたんだけど、それから対応したのかな。
498:デフォルトの名無しさん
08/07/24 15:48:06
直接指定するわけじゃなくて、エンコードで判断
499:デフォルトの名無しさん
08/07/24 15:59:43
>>498
それはEm? 秀丸?
でも、そうなるとUnicode系の文字コードじゃRTL文書書けないのかな。
500:デフォルトの名無しさん
08/07/24 22:25:06
>>497
> この板的な実用には向かんかなあ。
プログラム技術@2ch掲示板
URLリンク(pc11.2ch.net)
この板はプログラムを作る人のための板です。
プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。
ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。
Javascript は Web 制作板、CGI は Web プログラミング板へ。
業界談義、愚痴はプログラマ板へどうぞ。
ゲーム関係の話題はゲーム製作板へどうぞ。
ネタ、板とは関係の無い話題はご遠慮ください。
501:デフォルトの名無しさん
08/07/24 22:31:19
>>500は有名な基地外だから無視していいです
502:デフォルトの名無しさん
08/07/24 22:36:12
>>500
Alphaは、アラビア語が(比較的)まともに扱えるけど
「シンタックスハイライトが微妙」だから
「プログラムを作る人」が使うエディタとしては「実用には向かん」
って行ってる様にみえるんだけどなんでそのコピペなのか理解できません!
503:499
08/07/24 22:42:59
試してみたけど、秀もEmも右から左にする方法を見つけらんなかった…
504:デフォルトの名無しさん
08/07/24 22:43:33
夏休みだから話題が逸れる前に予防線張ろうとしたと解釈してあげよう。
505:デフォルトの名無しさん
08/07/24 23:00:11
///////
///////____________
///////  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| ̄ ̄
/////// (~) チリンチリン
/////// ノ,,
/////// ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄
/////// ( ´∀`)( 厨 ) )) < 夏だなあ〜
/////// (つ へへ つ \______
/////// //△ ヽλ ) ) 旦
////// l ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄l
/////  ̄| .| ̄ ̄ ̄ ̄ ̄ ̄ ̄| .| ̄
//// ^^^ ^^^
506:デフォルトの名無しさん
08/07/24 23:29:12
>>500
コイツ、バッチファイルのスレで誰にも相手にしてもらえないから
こんなスレを荒らしてやがる。
507:デフォルトの名無しさん
08/07/29 07:43:38
↓メタ夏厨議論どうぞ
508:デフォルトの名無しさん
08/07/30 06:59:11
Unicode は、夏厨
UTF-8 は、メタ夏厨議論
509:デフォルトの名無しさん
08/07/30 15:04:31
UNICODE: 数社の企業が決めたもの、使用できる文字とその番号を定義。
UCS: 国際標準、内容はUNICODEとほほ同じ
UTF: UNICODEやUCSをコンピュータ上に表現するための仕組み
この認識あってる?
UNICODEとUCSってのはJavaScriptとECMAScriptの関係に似てるんかねぇ。
510:デフォルトの名無しさん
08/07/30 17:01:28
コンソーシアムとその規格が Unicode
国際標準規格が ISO/IEC 10646
そしてそのそれぞれで UCS とか UTF とか定義してる
511:デフォルトの名無しさん
08/07/30 17:16:04
ISO/IEC 10646の名称(の頭文字とったもの)がUCSだろ。
509の理解で合っているぞ。
512:デフォルトの名無しさん
08/07/30 18:07:10
大は小を兼ねるんだから、
Shift-JistとEUCもこれからはUTF-8で扱えばすべて解決。
ユニックス派のカタブツはEUCにこだわるからいけない
513:デフォルトの名無しさん
08/07/30 19:32:12
文字集合は大は小を兼ねてるけど符号化方式が違ってるだろ
514:デフォルトの名無しさん
08/07/30 19:47:50
最近のUNIXなら、日本語環境でもだいたいUTF-8だと思うが。
515:デフォルトの名無しさん
08/07/30 20:54:34
>>512
むしろS-JISの方が圧倒的に量が多くて、移行できないだろ。
516:デフォルトの名無しさん
08/07/31 02:18:53
>>509
> この認識あってる?
間違ってます。
517:デフォルトの名無しさん
08/07/31 09:20:32
>>516
kwsk
518:デフォルトの名無しさん
08/07/31 13:25:21
>>517
間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無いだろ。
ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書くしな。
519:デフォルトの名無しさん
08/08/01 06:28:17
>>518
「間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無い」
「ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書く」
そう考える根拠は?
あ、そうか、根拠をはじめから書いていない奴には、詳しく説明できるほどの根拠が無いんだっけ。
ごめんごめん、訊くだけ無駄だった。
520:デフォルトの名無しさん
08/08/01 09:08:55
>>519
まあ、その、なんだ、悪かったよ…。図星つかれてレスもまともに読めなくなるほど泣く
とは思わなかったんだよ。もう言わないから勘弁してくれ、な?
521:デフォルトの名無しさん
08/08/01 09:25:39
泣かしたな悪者め
522:デフォルトの名無しさん
08/08/01 10:47:03
子ども泣かすの良くない
523:デフォルトの名無しさん
08/08/01 11:21:50
><
524:デフォルトの名無しさん
08/08/01 20:07:25
、_人_人_人_人_人_人_人_人_人_人_人_,
、_) (_
_) 夏 厨 警 報 !! (_
_) (
'⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒`
//
ヘ,(゚∀゚)y'^ アーヒャ ヒャ ヒャ ヒャ ヒャ
、 _L_;二;_.j_ , \\
 ̄ ト、~Y~,/| ̄
,|yΛ=スイ|、 アーヒャヒャヒャ _
' | | !;∀Y i| ` /##;〉
|イYト〉イY.| /  ̄
アヒャヒャ レYy'`vレ| ヽ(゚∀゚ )ノ
Vy V' (夏 )ヘ
ヽ( ゚∀゚)ノ <
( 夏)ヘ
<
525:デフォルトの名無しさん
08/08/01 20:51:53
>>520
夏のどさくさに紛れて、そういうキャラ付けで逃げるのはよくないよ。気持ち悪いし。
526:デフォルトの名無しさん
08/08/02 00:49:27
鸚鵡返し、人格攻撃はスレが機能しなくなるからやめようよ・・・
527:デフォルトの名無しさん
08/08/02 09:11:38
>>516が>>509に対して説明すれば済むだけの話。
528:516
08/08/03 21:29:00
>>509
URLリンク(pc11.2ch.net.nat.homeunix.org:65082)
529:デフォルトの名無しさん
08/08/04 01:36:40
本来は
Unicode ⊂ UTF-8
であることは明白だが、
事Windows OSではUTF-16の事を単にUnicodeと表記するので、
Windows上では
Unicode ≠ UTF-8
とも言える
530:デフォルトの名無しさん
08/08/04 10:02:52
釣りですか
531:デフォルトの名無しさん
08/08/04 14:51:21
ググれカス
532:デフォルトの名無しさん
08/08/04 21:52:42
ネタにマジレス( ´;゚;ё;゚;)きんも〜☆彡
533:デフォルトの名無しさん
08/08/05 04:13:34
【JISコード】
デコード↑/↓エンコード
シフトJIS
EUC
【ユニコード】
デコード↑/↓エンコード
UTF8
UTF16LE/UTF16GE
UTF32
【音声】
デコード↑/↓エンコード
WAV
MP3
WMA
【ビデオ】
デコード↑/↓エンコード
AVI
MPG
FLV
534:デフォルトの名無しさん
08/08/05 05:55:43
全角で書く奴って、やっぱりアレだな…
535:デフォルトの名無しさん
08/08/05 06:28:39
ときに、UTF16GEってなんだろ。
536:デフォルトの名無しさん
08/08/05 07:17:57
デコードした先がコードとは何ともかんとも
537:デフォルトの名無しさん
08/08/05 09:48:19
>>535
ゲルググエンディアン
538:デフォルトの名無しさん
08/08/05 12:00:16
あまりの非の打ち所の無い完璧な説明なため
全角や誤字しかツッコミどころが無いな。
539:デフォルトの名無しさん
08/08/05 13:13:37
確かにゲルググエンディアンは完璧だ
540:デフォルトの名無しさん
08/08/05 14:10:58
コンテナはどうなんだ
541:デフォルトの名無しさん
08/08/05 23:19:58
>>533
おい大漁だなw
やったじゃねーかw
>>533-539
釣られまくり乙
542:デフォルトの名無しさん
08/08/06 02:34:28
全角と誤字以外のツッコミは無いのかい?
543:デフォルトの名無しさん
08/08/06 11:32:08
へんなのが住みついたね
544:デフォルトの名無しさん
08/08/06 13:00:18
夏だね。
545:デフォルトの名無しさん
08/08/06 16:11:48
そろそろ秋だよ
546:デフォルトの名無しさん
08/08/06 16:16:05
暦の上でどうだろうと、今は夏真っ盛りだ
547:デフォルトの名無しさん
08/08/07 02:01:12
では、全角と誤字以外には非の打ち所の無い
カンペキな「Unicode と UTF-8 の違い」の解答という事で
無事にこのスレを閉じたいと思います。
みなさん、長い間ごくろうさまでした。
548:デフォルトの名無しさん
08/08/07 02:16:28
お疲れさまでした。
549:デフォルトの名無しさん
08/08/07 02:35:31
先生の次回作にご期待ください。
550:デフォルトの名無しさん
08/08/07 04:19:12
世 界 迷 作 劇 場
おわり
551:デフォルトの名無しさん
08/08/07 21:56:12
思ったこと。
・広義の「ユニコード」はUTF-8等の規格を含めることがあるので不正確
・>>536指摘済みだけど、音声のenc/decと、文字のenc/decを一緒にするのは
違和感あり。JISコードは既に「符号(コード)化」されてるから。
俺的には
音楽→(量子化)→PCM→(各種圧縮)→MP3 の3段階が
文字→符号化文字集合→テキストエンコーディング に対応する感じ
・AVIって格納形式の概要だけ決まってて、圧縮アルゴリズムは別じゃなかった?
552:デフォルトの名無しさん
08/08/07 22:59:54
狭義のユニコードっていうのはM$が決めつけたUnicodeのことか?
例えば、URLリンク(msdn.microsoft.com)
>Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため
つーか、広義も狭義もねーよ。バーヤ。
553:デフォルトの名無しさん
08/08/08 00:08:21
まだやる気か?
554:デフォルトの名無しさん
08/08/08 01:50:13
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。
555:デフォルトの名無しさん
08/08/08 04:17:35
サロゲートペア厨必死だな。無視されてんのによw
556:デフォルトの名無しさん
08/08/08 09:21:22
サロゲートペアは、32bit wchar_tの入り口ですよ。
557:デフォルトの名無しさん
08/08/08 09:33:01
マイクロソフトで統一すれば市場に一致して解決
558:デフォルトの名無しさん
08/08/08 09:38:44
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん
559:デフォルトの名無しさん
08/08/08 10:57:45
結論
>>1みたいなのが現れるのはMSが糞だから
560:デフォルトの名無しさん
08/08/08 11:58:30
何でも他人のせい、日本のせいにする人たちみたいですね。
561:デフォルトの名無しさん
08/08/08 12:35:44
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。
562:デフォルトの名無しさん
08/08/08 14:04:35
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが
563:デフォルトの名無しさん
08/08/08 22:59:01
少なくともパートのおばちゃんは働いてるからな
^^^^^^^^^
564:デフォルトの名無しさん
08/08/09 00:51:35
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。
565:デフォルトの名無しさん
08/08/09 04:22:32
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。
566:デフォルトの名無しさん
08/08/09 07:01:57
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。
567:デフォルトの名無しさん
08/08/09 08:34:38
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
568:デフォルトの名無しさん
08/08/09 09:53:28
>>567
>>557
>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
569:デフォルトの名無しさん
08/08/09 11:23:13
> お前ら
たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。
570:デフォルトの名無しさん
08/08/09 13:07:27
以下でOK?
・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・
・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41
エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
1. 符号化文字集合の一つ
2. 文字コードの規格
3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。
571:デフォルトの名無しさん
08/08/09 13:21:53
>>570
> よってUnicodeとは
> 1. 符号化文字集合の一つ
こんな使い方はない。
> 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
アホドキュメント、アホアプリは無視するのがいい。
572:デフォルトの名無しさん
08/08/09 13:24:33
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。
573:デフォルトの名無しさん
08/08/09 13:39:23
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
> 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。
574:デフォルトの名無しさん
08/08/09 13:42:08
>>573
メモ帳もUnicode/Unicode big endianだけど。
575:デフォルトの名無しさん
08/08/09 13:52:08
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ
576:デフォルトの名無しさん
08/08/09 15:01:15
> 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?
>>552だけ?
これってSQL Server 2005のドキュメントだよね?
577:デフォルトの名無しさん
08/08/09 15:32:53
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
URLリンク(msdn.microsoft.com)
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。
578:デフォルトの名無しさん
08/08/09 15:51:22
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。
579:デフォルトの名無しさん
08/08/09 16:21:00
抱き合わせ販売禁止
というのが文字コード氾濫を招いた。
最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった
580:デフォルトの名無しさん
08/08/09 23:37:35
Shift JISで悩まされてた人って多いんじゃないの?
581:デフォルトの名無しさん
08/08/10 02:42:19
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。
582:デフォルトの名無しさん
08/08/10 02:59:24
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ
583:デフォルトの名無しさん
08/08/10 05:13:31
>>580
それで悩むのはUNIX屋だけ。
584:デフォルトの名無しさん
08/08/10 07:29:26
>>579
えーっとどこから突っ込めば?(笑)
つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。
585:デフォルトの名無しさん
08/08/10 07:57:24
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?
586:デフォルトの名無しさん
08/08/10 09:20:58
>>584
しかも、SJIS作ったの誰だ?って話だよな。
587:デフォルトの名無しさん
08/08/10 10:57:11
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み
588:デフォルトの名無しさん
08/08/10 12:24:15
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな〜。
氏名をカナで管理ってありえねーよ。
589:デフォルトの名無しさん
08/08/10 14:08:27
むしろカナしかないだろ
590:デフォルトの名無しさん
08/08/10 22:24:23
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。
最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5383日前に更新/116 KB
担当:undef