1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ] ビッグインディアンとかなんとかかんとか
411 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:10:20 ] そもそもくだらんイベントに税金使うなよ。
412 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:12:01 ] Unicode関係ないだろうおまえら……。
413 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:27:16 ] >>410 でも火を消そうとはしてないんだ。 むしろさらに火を大きくしようとして発炎筒やら布切れやら持ち込んでるわけで。
414 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:31:37 ] それは始まってからじゃないとワ絡んだろ
415 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:32:28 ] .NETはたとえ完全でないのでもいいから文字コード自動判別クラスを用意すべき
416 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:33:36 ] >>414 普通に殺されかけて通報したときは「ナイフが心臓に刺さったらもう一度通報してください。」って言われるのに。
417 名前:デフォルトの名無しさん [2008/04/26(土) 21:23:08 ] 設計や管理がテケトーだから自動判別なんてのが必要なシステムになるんだ 恥を知れ!
418 名前:デフォルトの名無しさん mailto:sage [2008/05/06(火) 07:28:17 ] >>415 禿同
419 名前:デフォルトの名無しさん mailto:sage [2008/05/06(火) 09:11:19 ] >>415 間違えると「バグだ!金返せ」と言うバカの相手にいいかげんうんざりしたんだろう。
420 名前:デフォルトの名無しさん mailto:sage [2008/05/11(日) 17:40:38 ] >>410 >聖火という「設定」がどんなに馬鹿馬鹿しくても、その馬鹿設定を国際的に共有しちゃってる以上、 これは暗にUnicodeのことを言ってるんだよな? だよな?
421 名前:デフォルトの名無しさん [2008/05/11(日) 22:49:27 ] 批判くらい小学生でもできる。気に入らないなら代案を示すべき。 ここでグダグダ文句ばっかしタレてるヤツは小学生なのか?
422 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 01:07:59 ] これは暗にみんしゅとうのことを言ってるんだよな? だよな?
423 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 01:49:03 ] >>421 まぁそうなんだが、正しすぎて2ch全否定になってるな。
424 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 06:44:47 ] >>353 カーネルが1バイト目の#を見てスクリプトと機械語を 識別しているから、その前にBOMがついていたら機械語 として実行しようとして暴走するだろう
425 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 06:52:41 ] 機械語って、おまえELFとか知らんのか
426 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 07:10:45 ] COMファイルしか知らないんだよきっと
427 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 08:50:43 ] あれ?最近COMファイルって見かけないな。 使わなくなったの?
428 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 08:52:49 ] 拡張子のCOMならDOS専用だから。
429 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 09:54:42 ] もうやだこの低レベルスレ
430 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 21:25:44 ] >>428 ところがどっこい。Windowsは拡張子COMのPEを平気で実行する。 例えばNT系のformat.com
431 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 21:28:54 ] スレ違い止め止め
432 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 23:28:26 ] >>429 おこぼれを貰いに来てるだけのお前みたいな奴は、 自分じゃその下がったレベルを引き上げられないからつらいよね。 でも、おこぼれ貰いに来てるだけの奴が嘆いても、「勝手に嫌がってれば?」としかw
433 名前:427 mailto:sage [2008/05/13(火) 01:52:21 ] 俺も428と同じ認識でネタを書いたつもりだったが。動くのな。 まあ確かにMSだったら拡張子.comでも動くようにしてそうだ。
434 名前:デフォルトの名無しさん [2008/07/19(土) 10:20:15 ] タイのヤフーにアクセスするとブラウザにタイ語がきちんと表示されるけど、それをコピペして エディタに貼り付けると文字化けするのは何故でしょうか? エディタはUnicode版サクラエディタを使いました。 Yahoo! ????????? th.yahoo.com/ FrontPage - サクラエディタUNICODE化プロジェクト mofmof.nsf.tc/soft/sakura_unicode/
435 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:42:17 ] こんなところで聞くより、開発元で聞いたほうが早いと思うぞ。
436 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:45:19 ] unicode->ウニ utf-8->アワビ
437 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:47:01 ] >>432 おまえもな
438 名前:デフォルトの名無しさん [2008/07/19(土) 11:43:42 ] >>435 なるほどサクラエディタの問題なのか。 EmEditorだとタイ語というのがあったので、それでするときちんと表示されました。
439 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 12:52:32 ] たぶんクリップボードからANSI文字列として取得してるんじゃないかな。
440 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 14:13:18 ] >>434 普通に表示できたけど、フォントリンクがうまくいってないだけとかじゃないの
441 名前:デフォルトの名無しさん [2008/07/19(土) 14:21:07 ] >>439 EmEditorにコピペすると、ちゃんとタイ語で表示されたので、多分そうではないと思います。 そこで疑問がまた出てきました。 Unicodeってほぼ全文字を扱っているんですよね? EmEditorのUTF-8を選んでも、上記のタイ語は文字化け。 タイ語を選んでやっときちんと表示される。 タイ語用のUTF-8とかがあるんですかね?
442 名前:デフォルトの名無しさん [2008/07/19(土) 14:22:19 ] >>440 フォントリンクとはどういうことでしょうか??
443 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 14:29:15 ] 扱ってる文字集合にタイ文字が含まれてないせいで表示されないのか、 ただ単にフォントが足りなくて表示されないだけなのか、 問題を切り分けろっていってるんだよ。
444 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 15:27:41 ] UTF16は終端文字がNULLバイト2つだから嫌い
445 名前:439 mailto:sage [2008/07/19(土) 15:38:17 ] >>441 そういう意味じゃなくて。 サクラエディタ自体がミスってて、コピーされた文字列をAPIで取得する時に、 Unicode指定じゃなく、ANSIを指定しちゃってるかもってこと。 まあさすがにそんなことは無いだろうけど。
446 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 15:43:26 ] >>445 それはないな。俺が確かめたから。
447 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 16:01:27 ] >>443 UTF-8というのはタイ語は含まれていないのでしょうか? ブラウザとEmEditorではタイ語をきちんと表示しているので、タイ語のフォントはあると考えてはダメなの でしょうか? タイ文字をブラウザからEmEditorにコピペして、それを保存したのをバイナリエディタで見ると、UTF-8じゃ ないみたいだ。 EmEditorのタイ語という文字コードはUTF-8とは別物ということか? >>440 さんの言っていることは、、自分の環境ではUTF-8のタイ語を表すコード領域とタイ語のフォントが うまく結びついていないということかな? でもブラウザではちゃんと表示されているんだよな。 よくわからん。
448 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 16:17:46 ] >>447 少なくともIEとFirefoxは言語別に使用するフォントの設定を持っていて、 タイ語の文字を見つけたら、タイ語用のフォントでタイ語の文字を描く。 ところがサクラエディタはそうなっていないのではないのか、ということ。 (無理に日本語フォント使って豆腐になるとか) >UTF-8じゃないみたいだ。 保存時にデフォルトでShift_JISが選ばれるなんてことはない? あと、試しにsakuraW_r1398.zipをダウンロードして コピペしてみたが、うまくいっているように見えるけど。
449 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:15:17 ] >>448 >保存時にデフォルトでShift_JISが選ばれるなんてことはない? 設定を色々見ましたが、そんなのはなさそうな感じです。 EmEditorには、UTF-8の他にタイ語(Windows)という文字コードが選択できるんですよね。 1文字だけコピペして、それをタイ語(Windows)で保存。 それをバイナリエディタで見ると3バイトでした。だから多分Shift_JISではないと思います。 >>448 さんではうまくいってるということは、やはり自分の環境の何かが悪いってことなんしょうね。
450 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:43:59 ] >>449 あたまだいじょうぶか
451 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:45:28 ] そもそもサクラエディタはShift_JISで扱える文字しか対応していないはず
452 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:47:10 ] >>451 Unicode版の話だといってるだろ… よくよめよ
453 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:51:26 ] Unicode対応版を謳っていても実際に満足にUnicodeに対応している テキストエディタはVisual Studioのエディタと秀丸くらいしかないよね。
454 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:22:12 ] >>449 タイ語(Windows)って選択肢はUNICODEとかじゃなくて、CPなんとかというコードページ (WindowsのShift JISだと CP932)をタイ語のコードページに切り替えてるだけじゃないの? だからコードページ切り替えに対応していないエディタでは文字化けする。 一旦EmEditorで UTF-8で保存して、そのあと他のエディタで読み込ませてみたら?
455 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:26:17 ] サクラエディタスレでやれば?
456 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:56:00 ] >>453 秀丸は合字処理がおかしい
457 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 20:23:26 ] >>454 UTF-8で保存して、サクラエディタと秀丸で開いてみましたが、ダメでした。 とりあえず自分の環境では、Unicodeとそれに対応するフォントがうまく対応付けされていないと 結論ずけておきます。
458 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 22:19:03 ] うちの秀丸は、th.yahoo.com/ をコピペしてもぜんぜん文字化けしないよ。 もちろんタイのにょろにょろした文字が画面いっぱいな。
459 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 01:58:58 ] コピペがOS依存だって事忘れてるわけじゃないよな
460 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 09:59:56 ] >>453 おまえが知らないだけ。
461 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 13:17:41 ] Alphaとかいうエディタは異字体セレクタまで対応してたな。
462 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:24:26 ] Unicodeは16ビットで全ての文字が収まると早合点したことが失敗の始まりですか?
463 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:50:18 ] いいえ、全ての文字を符号化できると思ったのがそもそもの誤りでした
464 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:32:10 ] TRONや今昔文字鏡のことですね、わかります
465 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:58:54 ] もっと言えば、文字とは符号化できるものである、という前提から間違っている。
466 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:00:25 ] いや、TRONは存在自体が間違っている。
467 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:49:53 ] >>465 文字って符号じゃないの? 符号化できない文字表現という存在自体が想像付かない。 あ、一応、1:1マッピングできない(適切でない)ケースがあることくらいは想像が付く。
468 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:56:14 ] そんなネタにマジレスしなくても
469 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:03:45 ] 龜甲占いの結果を写生しました/写真に撮りました。 この画像は符合ですか? 一応「龜」ですが。 「龜」と字を書きました。画像として保存しました。符合ですか? この画像ファイルには"1.jpg"という名前をつけました。符合ですか? 「龜」の代りに<img src="1.jpg">とすることにしました。符合ですか?
470 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:13:02 ] 連番をつけて符号化しようと思ったあたりが、問題なんじゃね
471 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 23:41:19 ] 合成文字とか似ている漢字は一緒にしようとか めんどくさい事考えるから・・
472 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:08:21 ] > 似ている漢字は一緒にしよう これはまったくやらずに済まそうとするのは無理じゃない? デジタル化以前には表記揺れするのがあたりまえだったんだし。 どこまでやるかを間違った、という批判ならその通りだと思うけども。
473 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:15:23 ] いや,揺れたものをそのまま保存・表示できない時点でダメ 揺れたものを対象にした論文などが表現できなくなるから
474 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 01:29:46 ] 人間が文字の生き死にを自由にしようなんて、おこがましいとは思わんかね・・・・・・
475 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 03:09:30 ] 本間先生?
476 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:22:12 ] 結局、「国番号+JISコード」 で16ビットとか32ビットとか、みたいな形にすればよかったんじゃない? (外国はJISコードとは言わんが、ま、その国ごとで規格化されてるコード、って理解してくれい) 変に世界中の文字をシャッフルしちゃったのが間違いだな。
477 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:56:33 ] それがサロゲートペアだろ。
478 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 10:48:55 ] なんでやねん
479 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:28:35 ] >>473 そいつは画像でやれよ…… 一般的な用途ではある程度ユニファイされてる方がいい。 微妙な違いなんて日常的な文章には不要だし、検索とかにも不便だし。
480 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:53:14 ] >>477 (;゚д゚) ・・・ (つд⊂)ゴシゴシ _, ._ (;゚ Д゚) …!?
481 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 13:30:19 ] >一般的な用途ではある程度ユニファイされてる方がいい これはその通りだと思うけど、符号化のレベルではやらない方が良かったかと・・ もう1つ上のレイヤを用意して表記ゆれを吸収するのはそこの層がやる とかにすればやり方を失敗してもそこの層を差し替えるとかして何とかなったのに
482 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 19:58:48 ] 同意.一番下でマージしちゃったらどうしようもない 画像でやれって言う人は,実際に自分でやってないから どれだけ大変かつ不便で読み難くなるか分からないんだろうな
483 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 20:39:00 ] 実際に文字コード設計したことない人が国コード付けろとか128ビットにしろとか 妄想語るのももはやお約束ですよねー
484 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:19:59 ] UnicodeでAdobe Japan1-6互換の字形切替をする枠組みが既に正式規格化されているにも関わらず、 「みたいな形にすればよかったんじゃない?」 「もう1つ上のレイヤを用意して」 「一番下でマージしちゃったらどうしようもない」 とか言ってるヤツってナンなの?ゆとり? ttp://www.unicode.org/reports/tr37/ ttp://www.unicode.org/ivd/ ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-white-paper.pdf 上記PDFに書かれている対応製品以外にも、フリーソフトやフリーフォントで既に対応しているものもある。 ttp://alpha.sourceforge.jp/ (↑:日記の2008年1月〜に詳細記述) ttp://yozvox.web.infoseek.co.jp/ (↑:掲示板の2008年1月〜に詳細記述) てか、文字コードの話をするなら↓の方がいいだろ、常識で考えて。 文字コード総合スレ part3 ttp://pc11.2ch.net/test/read.cgi/tech/1180250376/
485 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:42:42 ] >>483 いかにも 「ワタシが文字コードを設計しました!」 って言いたげだな
486 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:43:44 ] 何事にも失敗はある。
487 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:48:47 ] Unicodeは失敗
488 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:15:27 ] ROMっているだけだったが、ここが文字コードスレだと錯覚していた。
489 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:17:37 ] ゆとり教育は失敗
490 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:26:55 ] 失敗したら反省が必要。そして次回はどうすべきか案を出し合う。
491 名前:デフォルトの名無しさん [2008/07/23(水) 19:39:46 ] >>453 しゅーまる(何故か変換(ry)は、アラビア語ちゃんと扱えるんだ。すごい。 xyzzyはアラビア語無理なんだよなあ・・・
492 名前:デフォルトの名無しさん mailto:sage [2008/07/23(水) 21:00:50 ] 有名どころだと秀丸とEmEditorくらいだな。
493 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 09:32:45 ] しゅーまるぐみはやわじゃねえ! しゅーまるぐみにはいるんだ!
494 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 10:12:30 ] EmEditorのフリー版のUnicode対応はイマイチだけど 有料版はいいんかな
495 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 14:54:39 ] Alphaはどうよ
496 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:03:58 ] >>494 たぶんエディタ部分のコードは同じだと思うよ。
497 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:38:06 ] >>495 アラビア語の結合は対応してるみたいだけど、キャレットとか選択領域の端とかと重なると切れちゃう。 ただ、いまのところシンタックスハイライティングがびみょんで、この板的な実用には向かんかなあ。 >>492 EmEditorや秀丸って右から左に表示するオプションあったっけ? 前に試したときはどっちもダメだった気がしたんだけど、それから対応したのかな。
498 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:48:06 ] 直接指定するわけじゃなくて、エンコードで判断
499 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:59:43 ] >>498 それはEm? 秀丸? でも、そうなるとUnicode系の文字コードじゃRTL文書書けないのかな。
500 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:25:06 ] >>497 > この板的な実用には向かんかなあ。 プログラム技術@2ch掲示板 ttp://pc11.2ch.net/tech/ この板はプログラムを作る人のための板です。 プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。 ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。 Javascript は Web 制作板、CGI は Web プログラミング板へ。 業界談義、愚痴はプログラマ板へどうぞ。 ゲーム関係の話題はゲーム製作板へどうぞ。 ネタ、板とは関係の無い話題はご遠慮ください。
501 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:31:19 ] >>500 は有名な基地外だから無視していいです
502 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:36:12 ] >>500 Alphaは、アラビア語が(比較的)まともに扱えるけど 「シンタックスハイライトが微妙」だから 「プログラムを作る人」が使うエディタとしては「実用には向かん」 って行ってる様にみえるんだけどなんでそのコピペなのか理解できません!
503 名前:499 mailto:sage [2008/07/24(木) 22:42:59 ] 試してみたけど、秀もEmも右から左にする方法を見つけらんなかった…
504 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:43:33 ] 夏休みだから話題が逸れる前に予防線張ろうとしたと解釈してあげよう。
505 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:00:11 ] /////// ///////____________ ///////  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| ̄ ̄ /////// (~) チリンチリン /////// ノ,, /////// ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ /////// ( ´∀`)( 厨 ) )) < 夏だなあ〜 /////// (つ へへ つ \______ /////// //△ ヽλ ) ) 旦 ////// l ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄l /////  ̄| .| ̄ ̄ ̄ ̄ ̄ ̄ ̄| .| ̄ //// ^^^ ^^^
506 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:29:12 ] >>500 コイツ、バッチファイルのスレで誰にも相手にしてもらえないから こんなスレを荒らしてやがる。
507 名前:デフォルトの名無しさん [2008/07/29(火) 07:43:38 ] ↓メタ夏厨議論どうぞ
508 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 06:59:11 ] Unicode は、夏厨 UTF-8 は、メタ夏厨議論
509 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 15:04:31 ] UNICODE: 数社の企業が決めたもの、使用できる文字とその番号を定義。 UCS: 国際標準、内容はUNICODEとほほ同じ UTF: UNICODEやUCSをコンピュータ上に表現するための仕組み この認識あってる? UNICODEとUCSってのはJavaScriptとECMAScriptの関係に似てるんかねぇ。
510 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:01:28 ] コンソーシアムとその規格が Unicode 国際標準規格が ISO/IEC 10646 そしてそのそれぞれで UCS とか UTF とか定義してる
511 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:16:04 ] ISO/IEC 10646の名称(の頭文字とったもの)がUCSだろ。 509の理解で合っているぞ。