1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ] ビッグインディアンとかなんとかかんとか
449 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:15:17 ] >>448 >保存時にデフォルトでShift_JISが選ばれるなんてことはない? 設定を色々見ましたが、そんなのはなさそうな感じです。 EmEditorには、UTF-8の他にタイ語(Windows)という文字コードが選択できるんですよね。 1文字だけコピペして、それをタイ語(Windows)で保存。 それをバイナリエディタで見ると3バイトでした。だから多分Shift_JISではないと思います。 >>448 さんではうまくいってるということは、やはり自分の環境の何かが悪いってことなんしょうね。
450 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:43:59 ] >>449 あたまだいじょうぶか
451 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:45:28 ] そもそもサクラエディタはShift_JISで扱える文字しか対応していないはず
452 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:47:10 ] >>451 Unicode版の話だといってるだろ… よくよめよ
453 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:51:26 ] Unicode対応版を謳っていても実際に満足にUnicodeに対応している テキストエディタはVisual Studioのエディタと秀丸くらいしかないよね。
454 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:22:12 ] >>449 タイ語(Windows)って選択肢はUNICODEとかじゃなくて、CPなんとかというコードページ (WindowsのShift JISだと CP932)をタイ語のコードページに切り替えてるだけじゃないの? だからコードページ切り替えに対応していないエディタでは文字化けする。 一旦EmEditorで UTF-8で保存して、そのあと他のエディタで読み込ませてみたら?
455 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:26:17 ] サクラエディタスレでやれば?
456 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:56:00 ] >>453 秀丸は合字処理がおかしい
457 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 20:23:26 ] >>454 UTF-8で保存して、サクラエディタと秀丸で開いてみましたが、ダメでした。 とりあえず自分の環境では、Unicodeとそれに対応するフォントがうまく対応付けされていないと 結論ずけておきます。
458 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 22:19:03 ] うちの秀丸は、th.yahoo.com/ をコピペしてもぜんぜん文字化けしないよ。 もちろんタイのにょろにょろした文字が画面いっぱいな。
459 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 01:58:58 ] コピペがOS依存だって事忘れてるわけじゃないよな
460 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 09:59:56 ] >>453 おまえが知らないだけ。
461 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 13:17:41 ] Alphaとかいうエディタは異字体セレクタまで対応してたな。
462 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:24:26 ] Unicodeは16ビットで全ての文字が収まると早合点したことが失敗の始まりですか?
463 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:50:18 ] いいえ、全ての文字を符号化できると思ったのがそもそもの誤りでした
464 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:32:10 ] TRONや今昔文字鏡のことですね、わかります
465 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:58:54 ] もっと言えば、文字とは符号化できるものである、という前提から間違っている。
466 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:00:25 ] いや、TRONは存在自体が間違っている。
467 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:49:53 ] >>465 文字って符号じゃないの? 符号化できない文字表現という存在自体が想像付かない。 あ、一応、1:1マッピングできない(適切でない)ケースがあることくらいは想像が付く。
468 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:56:14 ] そんなネタにマジレスしなくても
469 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:03:45 ] 龜甲占いの結果を写生しました/写真に撮りました。 この画像は符合ですか? 一応「龜」ですが。 「龜」と字を書きました。画像として保存しました。符合ですか? この画像ファイルには"1.jpg"という名前をつけました。符合ですか? 「龜」の代りに<img src="1.jpg">とすることにしました。符合ですか?
470 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:13:02 ] 連番をつけて符号化しようと思ったあたりが、問題なんじゃね
471 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 23:41:19 ] 合成文字とか似ている漢字は一緒にしようとか めんどくさい事考えるから・・
472 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:08:21 ] > 似ている漢字は一緒にしよう これはまったくやらずに済まそうとするのは無理じゃない? デジタル化以前には表記揺れするのがあたりまえだったんだし。 どこまでやるかを間違った、という批判ならその通りだと思うけども。
473 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:15:23 ] いや,揺れたものをそのまま保存・表示できない時点でダメ 揺れたものを対象にした論文などが表現できなくなるから
474 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 01:29:46 ] 人間が文字の生き死にを自由にしようなんて、おこがましいとは思わんかね・・・・・・
475 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 03:09:30 ] 本間先生?
476 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:22:12 ] 結局、「国番号+JISコード」 で16ビットとか32ビットとか、みたいな形にすればよかったんじゃない? (外国はJISコードとは言わんが、ま、その国ごとで規格化されてるコード、って理解してくれい) 変に世界中の文字をシャッフルしちゃったのが間違いだな。
477 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:56:33 ] それがサロゲートペアだろ。
478 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 10:48:55 ] なんでやねん
479 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:28:35 ] >>473 そいつは画像でやれよ…… 一般的な用途ではある程度ユニファイされてる方がいい。 微妙な違いなんて日常的な文章には不要だし、検索とかにも不便だし。
480 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:53:14 ] >>477 (;゚д゚) ・・・ (つд⊂)ゴシゴシ _, ._ (;゚ Д゚) …!?
481 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 13:30:19 ] >一般的な用途ではある程度ユニファイされてる方がいい これはその通りだと思うけど、符号化のレベルではやらない方が良かったかと・・ もう1つ上のレイヤを用意して表記ゆれを吸収するのはそこの層がやる とかにすればやり方を失敗してもそこの層を差し替えるとかして何とかなったのに
482 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 19:58:48 ] 同意.一番下でマージしちゃったらどうしようもない 画像でやれって言う人は,実際に自分でやってないから どれだけ大変かつ不便で読み難くなるか分からないんだろうな
483 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 20:39:00 ] 実際に文字コード設計したことない人が国コード付けろとか128ビットにしろとか 妄想語るのももはやお約束ですよねー
484 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:19:59 ] UnicodeでAdobe Japan1-6互換の字形切替をする枠組みが既に正式規格化されているにも関わらず、 「みたいな形にすればよかったんじゃない?」 「もう1つ上のレイヤを用意して」 「一番下でマージしちゃったらどうしようもない」 とか言ってるヤツってナンなの?ゆとり? ttp://www.unicode.org/reports/tr37/ ttp://www.unicode.org/ivd/ ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-white-paper.pdf 上記PDFに書かれている対応製品以外にも、フリーソフトやフリーフォントで既に対応しているものもある。 ttp://alpha.sourceforge.jp/ (↑:日記の2008年1月〜に詳細記述) ttp://yozvox.web.infoseek.co.jp/ (↑:掲示板の2008年1月〜に詳細記述) てか、文字コードの話をするなら↓の方がいいだろ、常識で考えて。 文字コード総合スレ part3 ttp://pc11.2ch.net/test/read.cgi/tech/1180250376/
485 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:42:42 ] >>483 いかにも 「ワタシが文字コードを設計しました!」 って言いたげだな
486 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:43:44 ] 何事にも失敗はある。
487 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:48:47 ] Unicodeは失敗
488 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:15:27 ] ROMっているだけだったが、ここが文字コードスレだと錯覚していた。
489 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:17:37 ] ゆとり教育は失敗
490 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:26:55 ] 失敗したら反省が必要。そして次回はどうすべきか案を出し合う。
491 名前:デフォルトの名無しさん [2008/07/23(水) 19:39:46 ] >>453 しゅーまる(何故か変換(ry)は、アラビア語ちゃんと扱えるんだ。すごい。 xyzzyはアラビア語無理なんだよなあ・・・
492 名前:デフォルトの名無しさん mailto:sage [2008/07/23(水) 21:00:50 ] 有名どころだと秀丸とEmEditorくらいだな。
493 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 09:32:45 ] しゅーまるぐみはやわじゃねえ! しゅーまるぐみにはいるんだ!
494 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 10:12:30 ] EmEditorのフリー版のUnicode対応はイマイチだけど 有料版はいいんかな
495 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 14:54:39 ] Alphaはどうよ
496 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:03:58 ] >>494 たぶんエディタ部分のコードは同じだと思うよ。
497 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:38:06 ] >>495 アラビア語の結合は対応してるみたいだけど、キャレットとか選択領域の端とかと重なると切れちゃう。 ただ、いまのところシンタックスハイライティングがびみょんで、この板的な実用には向かんかなあ。 >>492 EmEditorや秀丸って右から左に表示するオプションあったっけ? 前に試したときはどっちもダメだった気がしたんだけど、それから対応したのかな。
498 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:48:06 ] 直接指定するわけじゃなくて、エンコードで判断
499 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:59:43 ] >>498 それはEm? 秀丸? でも、そうなるとUnicode系の文字コードじゃRTL文書書けないのかな。
500 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:25:06 ] >>497 > この板的な実用には向かんかなあ。 プログラム技術@2ch掲示板 ttp://pc11.2ch.net/tech/ この板はプログラムを作る人のための板です。 プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。 ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。 Javascript は Web 制作板、CGI は Web プログラミング板へ。 業界談義、愚痴はプログラマ板へどうぞ。 ゲーム関係の話題はゲーム製作板へどうぞ。 ネタ、板とは関係の無い話題はご遠慮ください。
501 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:31:19 ] >>500 は有名な基地外だから無視していいです
502 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:36:12 ] >>500 Alphaは、アラビア語が(比較的)まともに扱えるけど 「シンタックスハイライトが微妙」だから 「プログラムを作る人」が使うエディタとしては「実用には向かん」 って行ってる様にみえるんだけどなんでそのコピペなのか理解できません!
503 名前:499 mailto:sage [2008/07/24(木) 22:42:59 ] 試してみたけど、秀もEmも右から左にする方法を見つけらんなかった…
504 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:43:33 ] 夏休みだから話題が逸れる前に予防線張ろうとしたと解釈してあげよう。
505 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:00:11 ] /////// ///////____________ ///////  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| ̄ ̄ /////// (~) チリンチリン /////// ノ,, /////// ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ /////// ( ´∀`)( 厨 ) )) < 夏だなあ〜 /////// (つ へへ つ \______ /////// //△ ヽλ ) ) 旦 ////// l ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄l /////  ̄| .| ̄ ̄ ̄ ̄ ̄ ̄ ̄| .| ̄ //// ^^^ ^^^
506 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:29:12 ] >>500 コイツ、バッチファイルのスレで誰にも相手にしてもらえないから こんなスレを荒らしてやがる。
507 名前:デフォルトの名無しさん [2008/07/29(火) 07:43:38 ] ↓メタ夏厨議論どうぞ
508 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 06:59:11 ] Unicode は、夏厨 UTF-8 は、メタ夏厨議論
509 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 15:04:31 ] UNICODE: 数社の企業が決めたもの、使用できる文字とその番号を定義。 UCS: 国際標準、内容はUNICODEとほほ同じ UTF: UNICODEやUCSをコンピュータ上に表現するための仕組み この認識あってる? UNICODEとUCSってのはJavaScriptとECMAScriptの関係に似てるんかねぇ。
510 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:01:28 ] コンソーシアムとその規格が Unicode 国際標準規格が ISO/IEC 10646 そしてそのそれぞれで UCS とか UTF とか定義してる
511 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:16:04 ] ISO/IEC 10646の名称(の頭文字とったもの)がUCSだろ。 509の理解で合っているぞ。
512 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 18:07:10 ] 大は小を兼ねるんだから、 Shift-JistとEUCもこれからはUTF-8で扱えばすべて解決。 ユニックス派のカタブツはEUCにこだわるからいけない
513 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:32:12 ] 文字集合は大は小を兼ねてるけど符号化方式が違ってるだろ
514 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:47:50 ] 最近のUNIXなら、日本語環境でもだいたいUTF-8だと思うが。
515 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 20:54:34 ] >>512 むしろS-JISの方が圧倒的に量が多くて、移行できないだろ。
516 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 02:18:53 ] >>509 > この認識あってる? 間違ってます。
517 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 09:20:32 ] >>516 kwsk
518 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 13:25:21 ] >>517 間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無いだろ。 ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書くしな。
519 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 06:28:17 ] >>518 「間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無い」 「ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書く」 そう考える根拠は? あ、そうか、根拠をはじめから書いていない奴には、詳しく説明できるほどの根拠が無いんだっけ。 ごめんごめん、訊くだけ無駄だった。
520 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:08:55 ] >>519 まあ、その、なんだ、悪かったよ…。図星つかれてレスもまともに読めなくなるほど泣く とは思わなかったんだよ。もう言わないから勘弁してくれ、な?
521 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:25:39 ] 泣かしたな悪者め
522 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 10:47:03 ] 子ども泣かすの良くない
523 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 11:21:50 ] ><
524 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:07:25 ] 、_人_人_人_人_人_人_人_人_人_人_人_, 、_) (_ _) 夏 厨 警 報 !! (_ _) ( '⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒` // ヘ,(゚∀゚)y'^ アーヒャ ヒャ ヒャ ヒャ ヒャ 、 _L_;二;_.j_ , \\  ̄ ト、~Y~,/| ̄ ,|yΛ=スイ|、 アーヒャヒャヒャ _ ' | | !;∀Y i| ` /##;〉 |イYト〉イY.| /  ̄ アヒャヒャ レYy'`vレ| ヽ(゚∀゚ )ノ Vy V' (夏 )ヘ ヽ( ゚∀゚)ノ < ( 夏)ヘ <
525 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:51:53 ] >>520 夏のどさくさに紛れて、そういうキャラ付けで逃げるのはよくないよ。気持ち悪いし。
526 名前:デフォルトの名無しさん [2008/08/02(土) 00:49:27 ] 鸚鵡返し、人格攻撃はスレが機能しなくなるからやめようよ・・・
527 名前:デフォルトの名無しさん mailto:sage [2008/08/02(土) 09:11:38 ] >>516 が>>509 に対して説明すれば済むだけの話。
528 名前:516 mailto:sage [2008/08/03(日) 21:29:00 ] >>509 pc11.2ch.net.nat.homeunix.org:65082/post.pl?b=tech&t=1177930957
529 名前:デフォルトの名無しさん [2008/08/04(月) 01:36:40 ] 本来は Unicode ⊂ UTF-8 であることは明白だが、 事Windows OSではUTF-16の事を単にUnicodeと表記するので、 Windows上では Unicode ≠ UTF-8 とも言える
530 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 10:02:52 ] 釣りですか
531 名前:デフォルトの名無しさん [2008/08/04(月) 14:51:21 ] ググれカス
532 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 21:52:42 ] ネタにマジレス( ´;゚;ё;゚;)きんも〜☆彡
533 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 04:13:34 ] 【JISコード】 デコード↑/↓エンコード シフトJIS EUC 【ユニコード】 デコード↑/↓エンコード UTF8 UTF16LE/UTF16GE UTF32 【音声】 デコード↑/↓エンコード WAV MP3 WMA 【ビデオ】 デコード↑/↓エンコード AVI MPG FLV
534 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 05:55:43 ] 全角で書く奴って、やっぱりアレだな…
535 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 06:28:39 ] ときに、UTF16GEってなんだろ。
536 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 07:17:57 ] デコードした先がコードとは何ともかんとも
537 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 09:48:19 ] >>535 ゲルググエンディアン
538 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 12:00:16 ] あまりの非の打ち所の無い完璧な説明なため 全角や誤字しかツッコミどころが無いな。
539 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 13:13:37 ] 確かにゲルググエンディアンは完璧だ
540 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 14:10:58 ] コンテナはどうなんだ
541 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 23:19:58 ] >>533 おい大漁だなw やったじゃねーかw >>533-539 釣られまくり乙
542 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 02:34:28 ] 全角と誤字以外のツッコミは無いのかい?
543 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 11:32:08 ] へんなのが住みついたね
544 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 13:00:18 ] 夏だね。
545 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:11:48 ] そろそろ秋だよ
546 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:16:05 ] 暦の上でどうだろうと、今は夏真っ盛りだ
547 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:01:12 ] では、全角と誤字以外には非の打ち所の無い カンペキな「Unicode と UTF-8 の違い」の解答という事で 無事にこのスレを閉じたいと思います。 みなさん、長い間ごくろうさまでした。
548 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:16:28 ] お疲れさまでした。
549 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:35:31 ] 先生の次回作にご期待ください。
550 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 04:19:12 ] 世 界 迷 作 劇 場 おわり
551 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 21:56:12 ] 思ったこと。 ・広義の「ユニコード」はUTF-8等の規格を含めることがあるので不正確 ・>>536 指摘済みだけど、音声のenc/decと、文字のenc/decを一緒にするのは 違和感あり。JISコードは既に「符号(コード)化」されてるから。 俺的には 音楽→(量子化)→PCM→(各種圧縮)→MP3 の3段階が 文字→符号化文字集合→テキストエンコーディング に対応する感じ ・AVIって格納形式の概要だけ決まってて、圧縮アルゴリズムは別じゃなかった?
552 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 22:59:54 ] 狭義のユニコードっていうのはM$が決めつけたUnicodeのことか? 例えば、ttp://msdn.microsoft.com/ja-jp/library/ms191200.aspx >Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため つーか、広義も狭義もねーよ。バーヤ。
553 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 00:08:21 ] まだやる気か?
554 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 01:50:13 ] >>552 MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。
555 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 04:17:35 ] サロゲートペア厨必死だな。無視されてんのによw
556 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:21:22 ] サロゲートペアは、32bit wchar_tの入り口ですよ。
557 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:33:01 ] マイクロソフトで統一すれば市場に一致して解決
558 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:38:44 ] けど駄目仕様に駄目実装が蔓延ると思うよ 競合いてもあれだもん
559 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 10:57:45 ] 結論 >>1 みたいなのが現れるのはMSが糞だから
560 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 11:58:30 ] 何でも他人のせい、日本のせいにする人たちみたいですね。
561 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 12:35:44 ] 批判だけならパートのおばちゃんでも出来る。 問題は、どう改善すべきか、改善するに当たって 予算・人員・スケジュールをどう工面するのか、だ。 それを何一つ提示していない。 おまいら、パートのおばちゃん以下のクズ。
562 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 14:04:35 ] その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが
563 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 22:59:01 ] 少なくともパートのおばちゃんは働いてるからな ^^^^^^^^^
564 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 00:51:35 ] >>552 マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533 からの 流れからして 協議:符号化文字集合としてのUnicode 広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格 以外の解釈はありえんと思うが。このスレ>>14 ぐらいまで読み直せ。
565 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 04:22:32 ] だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。
566 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 07:01:57 ] お前ら、紛らわしいと思わないのか? MSは正義だからOKとか、思考停止杉。
567 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 08:34:38 ] え、誰か「MSは正義」とか言ってる? その脳内設定が、お前の思考停止なんじゃないの? 思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
568 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 09:53:28 ] >>567 >>557 >思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。
569 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 11:23:13 ] > お前ら たった一人書いてただけで、「お前ら」か。 知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。
570 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:07:27 ] 以下でOK? ・(文字集合としての)Unicode 扱う文字の一覧を定めて、識別用に符号をつけたもの。 「あ」=U+3042、「A」=U+0041・・・ ・UTF-8 Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。 あA(U+3042 U+0041)→E3 81 82 41 エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。 よってUnicodeとは 1. 符号化文字集合の一つ 2. 文字コードの規格 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。
571 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:21:53 ] >>570 > よってUnicodeとは > 1. 符号化文字集合の一つ こんな使い方はない。 > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい アホドキュメント、アホアプリは無視するのがいい。
572 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:24:33 ] ×符号化文字集合 ○文字集合 だよね? MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。
573 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:39:23 ] 「マイクロソフトの」と書いているが、 まともなドキュメントもあるわけで… メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、 > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。
574 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:42:08 ] >>573 メモ帳もUnicode/Unicode big endianだけど。
575 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:52:08 ] とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ
576 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:01:15 ] > 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい 典拠は? >>552 だけ? これってSQL Server 2005のドキュメントだよね?
577 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:32:53 ] >>576 Office XP リソース キット Unicode サポートと多国語ドキュメント ttp://msdn.microsoft.com/ja-jp/library/cc389880.aspx >Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。
578 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:51:22 ] やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。 周辺技術の知識については。
579 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 16:21:00 ] 抱き合わせ販売禁止 というのが文字コード氾濫を招いた。 最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって ユーザーはいくつものコードに悩まされることがなかった
580 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 23:37:35 ] Shift JISで悩まされてた人って多いんじゃないの?
581 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:42:19 ] >>572 「符号化文字集合」でいいのでは? 文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。
582 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:59:24 ] 「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか くらいはっきりさせろ
583 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 05:13:31 ] >>580 それで悩むのはUNIX屋だけ。
584 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:29:26 ] >>579 えーっとどこから突っ込めば?(笑) つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。
585 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:57:24 ] >>583 携帯メール入れるとどのプラットフォームも悩ましいのでは?
586 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 09:20:58 ] >>584 しかも、SJIS作ったの誰だ?って話だよな。
587 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:57:11 ] 当時の状況を考えれば仕方ないかんじだろ 一文字16bitなんて贅沢の極み
588 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 12:24:15 ] 贅沢の極み。と言ってた人が、 年金記録問題を予見できなかったんだろうな〜。 氏名をカナで管理ってありえねーよ。
589 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 14:08:27 ] むしろカナしかないだろ
590 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 22:24:23 ] 仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。 略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。