[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2chのread.cgiへ]
Update time : 05/09 13:54 / Filesize : 116 KB / Number-of Response : 591
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは?



1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ]
ビッグインディアンとかなんとかかんとか

331 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 16:13:56 ]
UTF-32 は U+110000 以上は無いんじゃ?

332 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 16:16:36 ]
もうめんどくさいから今までの全部廃止してUTF-256とかに統一して欲しい

333 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 16:55:24 ]
まったくだな

334 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 18:30:27 ]
バイトオーダーも固定して64byteぐらいにしておけばいい。

335 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 18:50:01 ]
そうだね余裕がある事はすばらしい事だね。

336 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 19:03:36 ]
アルファベット件の馬鹿共のせいで混迷しているのだ

337 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 19:08:01 ]
そういやIPAとUnicodeの対応表みたいなのってないの?

338 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 20:25:10 ]
webos-goodies.jp/archives/51072404.html

339 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 20:34:37 ]
Microsoft Visual UTF-2008 Professional Edition



340 名前:デフォルトの名無しさん mailto:sage [2008/03/07(金) 21:22:58 ]
>>331
UCS-4もU+110000以上は使わないことになった。
>>330に「現在では」と書かれているのはそのへんの含みがあると思われる

341 名前:デフォルトの名無しさん mailto:sage [2008/03/11(火) 09:39:54 ]
Unicode識別子についての日本語資料ってない?

342 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 15:18:27 ]
UTF-8にBOMついてるとまともに動かないソフトが多すぎて嫌すぎる
もっと細分化して、細かく細部まで決めてくれないとどーしよーもないな、実際

343 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 15:41:24 ]
アンジーってサイモンとガーファンクルだったような

344 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 19:21:59 ]
UTF-8ってBOMつけるんだっけ?

345 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 19:32:18 ]
RFC 3629 の 6. を見よ

346 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 19:37:18 ]
なる、つけるべきではないのか。

347 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 19:43:49 ]
いや、ついていても受け入れるべき
MySQLみたいにそもそもUTF-8を理解してない馬鹿げたソフト多すぎ

348 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 20:25:36 ]
>>346 一般には違う。
付けるべきじゃないのは、UTF-8であることが上位層で規定されている場合。

349 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 20:28:49 ]
BOMはエンコードを判別するためのものじゃないべさ。
Byte Order Markなんだから。



350 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 20:52:02 ]
つまりメモ帳のあの動作は正しいわけか

351 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 21:18:54 ]
>>349

まぁ元々はそうだったんだけど UTF-8に於いてはUTF-8であることを
あらわすシグネチャという位置付けにされた。

まぁ1バイト文字で済む国はシグネチャなくても全然問題ないんだろうけど
マルチバイト文字使ってる国ではシグネチャない場合は、エンコード誤認の
可能性があるからな。 UTF-8決めうちのソフトならいいんだけど


352 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 21:20:13 ]
勝手に追加するのはどうかと思うが、テキストファイルの頭にBOMついてるからって
誤動作する方が確実におかしい、無視すべき

353 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 21:24:25 ]
#!/usr/bin/env hogehoge

とかをBOM付きで保存すると死ぬって本当?


354 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 22:37:41 ]
ASCIIにしか対応していないものから見たらBOMはゴミ以外の何者でもないから

355 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 22:41:24 ]
UTF-8対応してるといいながら駄目なソフトが多いって話だろ?

356 名前:デフォルトの名無しさん mailto:sage [2008/03/12(水) 23:30:28 ]
ASCIIだったらそもそもBOMは無いだろ
そしてASCII範囲外に対応してるならBOMあっても問題ないし

357 名前:デフォルトの名無しさん mailto:sage [2008/03/13(木) 02:15:31 ]
俺はドラゴンボールが揃ったらBOMを廃止する。
それからDIS 10646.1、いやごめんなんでもない

358 名前:デフォルトの名無しさん [2008/03/13(木) 03:32:52 ]
BOMよりスーパー写真塾の方がエロイよな。

359 名前:デフォルトの名無しさん mailto:sage [2008/03/13(木) 05:19:48 ]
むかしのエロ本のオンナはそのままのかおだが
いまのエロ本は整形オンナばっかり



360 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 20:31:17 ]
UTF-8にBOMなんか辞めようと
そもそも、BOM=Byte Order Mark で、UTF-16、UCS-2、UTF-32、UCS-4なんかで使うものだし
そいつ(BOM)をそのままUTF-8変換した値がBOMもどきだし

Visual Studio 2005なんかはUTF-8でソース管理出来るみたいだな
今のPRJはLinuxでUTF-16使ってるから文字列は全てリソース扱い、っつかASCIIだろうとそうすべきではあるけど
ソースコードにUTF-16をhexでどかどか書いても見づらいだけだ
だけど、データ管理はUTF-16のがいい。サロゲートペアなんて使うことはまず無いし、1文字=2バイトと見なして差し支えなければ楽でいい
UTF-8は最近ISO 10646だっけ、RFCだっけ、あれUnicode.orgだっけ?規格変更で1〜4バイトの可変長になって、それとともにUTF-32の領域も狭くなったみたいだが

XMLなんかはエンコーディング付いてるから問題ないし、ソースもSJISやEUCさえなんとかなれば別に問題らしいものはない気がする>UTF-8
UTF-8自体ASCIIコンパチだしね

361 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 20:59:22 ]
UTF-32は最初からU+10FFFFまでだよ

362 名前:デフォルトの名無しさん [2008/03/20(木) 21:01:17 ]
お前ら説明下手すぎだろ。
もっと俺にわかるように産業で説明しなさい。

363 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 21:10:47 ]
>ソースもSJISやEUCさえなんとかなれば

これがなんとかならないから UTF-8にBOMが存在しているんだろうけどね。


364 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 23:18:25 ]
>>360
>エンコーディング付いてるから問題ないし
そういう場合はBOMを付けるなとちゃんと書いてある
ttp://tools.ietf.org/html/rfc3629#section-6

BOMを付けるのはあくまでもそれがUTF-8と確定できない場合だけだから問題ないだろ
それともエンコード不明のテキストファイルを力技でエンコード推測するのが正しいとでも?
あるいはテキストファイル=UTF-8として統一するつもり?
Latin-1とかはそうそう無くならないと思うぞ

365 名前:デフォルトの名無しさん mailto:sage [2008/03/20(木) 23:24:46 ]
エンコード不明のテキストファイルを力技でエンコード推測するのが正しい

366 名前:デフォルトの名無しさん mailto:sage [2008/03/21(金) 09:46:07 ]
BOMダセエと思うが、
BOMも処理できないUnicode処理系は氏ねよ。

367 名前:デフォルトの名無しさん mailto:sage [2008/03/21(金) 16:53:25 ]
Chinaってチャイナじゃなくてシナ=支那だったのね
勉強になった

368 名前:デフォルトの名無しさん mailto:sage [2008/03/21(金) 23:53:53 ]
はい?

369 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 00:19:13 ]
いいえちがいます。



370 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 01:29:01 ]
チャイナシンドロームってどういういみ?

371 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 08:02:56 ]
何の? 一般的には原子炉のメルトダウン事故の用語だが。

372 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 11:18:00 ]
Japanてジパングじゃなくてニッポン=日本だったのね
勉強になった

373 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 14:49:25 ]
漆器のことだろ?

374 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 20:25:36 ]
sorry japanese only.

375 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 00:40:01 ]
かわいそうな日本人専用

376 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 03:26:12 ]
漆塗りのペニスキャップとか作ると
やっぱりかぶれたりするんだろうか

377 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 03:36:46 ]
漆塗りの器で唇かぶれた話とか聞いたことないけど。

378 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 09:25:29 ]
漆がかぶれるのは生(?)の漆だけじゃないかと

379 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 10:50:49 ]
シャープの芯のUniもこれが語源なん?



380 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 12:41:34 ]
ja.wikipedia.org/wiki/%E4%B8%89%E8%8F%B1%E9%89%9B%E7%AD%86

| 国内では「三菱鉛筆」と、旧財閥の三菱グループ各社と混同されないように
| 「uni」(ユニ)のブランドも使っている。「uni」は、英語で「単一の」を
| 表す接頭語「uni」から比類無き品質ということを表したもの。

381 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 13:11:50 ]
単一はmonoだったよーな
⇔pori

モノ

トリ
テトラ

382 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 14:04:20 ]
monoもuniも一つという意味

383 名前:デフォルトの名無しさん mailto:sage [2008/03/23(日) 14:11:37 ]
×pori
○poly

釣りなのかこれは

384 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 09:41:03 ]
ユニークのユニ

385 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 12:14:05 ]
ギリシャ語系のmono, di, tri, tetraと、ラテン語系のuni, bi, ter(tres, tri), quadriの違いだな。
多角形も両方の表現があって、trigon, tetragon, pentagonとするかtriangle, quadrangle, quintangleとするか。
# 尤も、アメリカ辺りだと入り混じっていて、septagon, septangle, heptagon, heptangleのどれも見かけるけど。
## ついでに言えば、polygonに対するラテン語はmultiangleになる筈だけど……

386 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 12:38:42 ]
rectangleは?

387 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 13:10:35 ]
>>386
ラテン語由来。ラテン語にも、rectangulasという言葉があるらしい。英語に直訳すると、right angleになるそうな。
つーか、m-w.comでちょっと調べれば済むことなんですが。

388 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 13:41:24 ]
都市ガスはtoshi gus だからペリーが運んできたオランダ語っぽい

389 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 13:44:07 ]
トナカイってアイヌ語だったんだな



390 名前:デフォルトの名無しさん mailto:sage [2008/03/24(月) 17:13:23 ]
ラッコもな

391 名前:デフォルトの名無しさん mailto:sage [2008/03/26(水) 03:23:13 ]
MacのZIP解凍したら濁点や半濁点で文字化けするんだけど
これの変換てどうしたらええの?

392 名前:デフォルトの名無しさん mailto:sage [2008/03/26(水) 08:26:24 ]
NFCしてください。


393 名前:デフォルトの名無しさん mailto:sage [2008/03/26(水) 11:01:30 ]
NFDとNFCの違いか。
オレもそれやらかして、Perlのモジュール使って直したなあ

394 名前:デフォルトの名無しさん mailto:sage [2008/03/26(水) 21:32:28 ]
ありがとう
一部元に戻らないトコもあるけど中身が理解できる分には戻せたよ

395 名前:デフォルトの名無しさん mailto:sage [2008/04/10(木) 09:02:55 ]
結局UTF-8みたいなASCII互換の可変長コードが主流になるんだったら、
80h〜FFhをコードページ指定にして、
その後の1〜2オクテットをまとまった文字種セットにしとけば、
すっきりしたコードになったのになあ。

396 名前:デフォルトの名無しさん mailto:sage [2008/04/10(木) 22:30:07 ]
状態持ちはイヤン

397 名前:デフォルトの名無しさん mailto:sage [2008/04/10(木) 22:39:27 ]
それなんてISO 2022?

398 名前:デフォルトの名無しさん mailto:sage [2008/04/12(土) 03:23:48 ]
>>395
Arena-i18n内部コードやん
あれは固定長だけど。

399 名前:デフォルトの名無しさん mailto:sage [2008/04/23(水) 07:54:25 ]
>>367
>Chinaってチャイナじゃなくてシナ=支那だったのね
あー!そういう意味だったのか。
支那支那っていうから判らんかった。
支那の語源がChinaなのね。



400 名前:デフォルトの名無しさん mailto:sage [2008/04/23(水) 09:52:54 ]
どちらの語源もサンスクリットの同じ単語だそうだが

401 名前:デフォルトの名無しさん mailto:sage [2008/04/23(水) 12:02:46 ]
いくつか説があるようだが
ttp://www004.upp.so-net.ne.jp/teikoku-denmo/html/history/honbun/cina2.html
は「秦」を語源としてるな
まぁJapanもニッポンがジパングを経てジャパンになったんだから
シナとチャイナ位の違いは普通か

402 名前:デフォルトの名無しさん mailto:sage [2008/04/23(水) 13:12:28 ]
日本の現代中国語読みがリーペンで、マルコポーロが東方見聞録で書いたのがジパング。
この違いがかなりデカい気がするが、どう理解すればよいのやら。
古代中国語で日本をジパングと読む?

403 名前:デフォルトの名無しさん mailto:sage [2008/04/23(水) 22:01:44 ]
ri4ben3は現代普通話でのピンイン
「日」は漢音で"ji" 「本」は呉音で"hong"

404 名前:デフォルトの名無しさん mailto:sage [2008/04/24(木) 02:02:24 ]
今の日本語で日を「ジツ」と読むのは古い中国語からきてるわけだし。
中国は現代音、中古音、古音と何度も大きな変貌を経ている。特にマルコポーロの時代である
元は中国語の発音が大きく変化した時代の一つ。

405 名前:デフォルトの名無しさん [2008/04/26(土) 03:58:14 ]
誰もそんな話は聞きたくないし。
UTF8とユニコードの違いが聞きたいし。

406 名前:デフォルトの名無しさん [2008/04/26(土) 05:29:15 ]
いやいや
>>401の話は重要だよ。

たとえば天安門。
これは自動的に排除するようにプログラムを組むことが義務付けられていて、守らなければ毒ガスの人体実験されて体を切り刻まれる。

>>401の話は、少なくとも一つのキーワードについてそれをしなくてよいと確認できる根拠だから。


407 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 10:05:46 ]
聖火リレーで旗を広げようとした人がそれを広げる間もなく大勢の警官に取り押さえられ逮捕されたけど、日本って中国並みに怖いな。


408 名前:デフォルトの名無しさん [2008/04/26(土) 10:26:45 ]
tvde.web.infoseek.co.jp/cgi-bin/jlab-dat/s/216761.jpg
tv.dee.cc/jlab-maru/s/maru1209168412846.jpg

Japanese police suppressed a member of Tibetan human rights group
日本警察によるチベット人弾圧の様子

409 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 10:57:08 ]
>>408
警官の数が異常すぎ。

「たかだか芸能人が怪我するかも」程度なのに洞爺湖サミットの何倍の警官を投入してるんだと。




410 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 11:24:17 ]
それは勘違いだよ。
この場合、芸能人の命の火が消えること以上に、聖火が消えることのほうにピリピリしてるんだよw

聖火という「設定」がどんなに馬鹿馬鹿しくても、その馬鹿設定を国際的に共有しちゃってる以上、
活動家を抑えられずに聖火消しちゃったら日本の恥だからね。

411 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:10:20 ]
そもそもくだらんイベントに税金使うなよ。

412 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:12:01 ]
Unicode関係ないだろうおまえら……。

413 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:27:16 ]
>>410
でも火を消そうとはしてないんだ。

むしろさらに火を大きくしようとして発炎筒やら布切れやら持ち込んでるわけで。


414 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:31:37 ]
それは始まってからじゃないとワ絡んだろ

415 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:32:28 ]
.NETはたとえ完全でないのでもいいから文字コード自動判別クラスを用意すべき

416 名前:デフォルトの名無しさん mailto:sage [2008/04/26(土) 12:33:36 ]
>>414
普通に殺されかけて通報したときは「ナイフが心臓に刺さったらもう一度通報してください。」って言われるのに。


417 名前:デフォルトの名無しさん [2008/04/26(土) 21:23:08 ]
設計や管理がテケトーだから自動判別なんてのが必要なシステムになるんだ

恥を知れ!

418 名前:デフォルトの名無しさん mailto:sage [2008/05/06(火) 07:28:17 ]
>>415
禿同

419 名前:デフォルトの名無しさん mailto:sage [2008/05/06(火) 09:11:19 ]
>>415
間違えると「バグだ!金返せ」と言うバカの相手にいいかげんうんざりしたんだろう。



420 名前:デフォルトの名無しさん mailto:sage [2008/05/11(日) 17:40:38 ]
>>410
>聖火という「設定」がどんなに馬鹿馬鹿しくても、その馬鹿設定を国際的に共有しちゃってる以上、

これは暗にUnicodeのことを言ってるんだよな?
だよな?

421 名前:デフォルトの名無しさん [2008/05/11(日) 22:49:27 ]
批判くらい小学生でもできる。気に入らないなら代案を示すべき。
ここでグダグダ文句ばっかしタレてるヤツは小学生なのか?

422 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 01:07:59 ]
これは暗にみんしゅとうのことを言ってるんだよな?
だよな?


423 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 01:49:03 ]
>>421
まぁそうなんだが、正しすぎて2ch全否定になってるな。

424 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 06:44:47 ]
>>353
カーネルが1バイト目の#を見てスクリプトと機械語を
識別しているから、その前にBOMがついていたら機械語
として実行しようとして暴走するだろう




425 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 06:52:41 ]
機械語って、おまえELFとか知らんのか


426 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 07:10:45 ]
COMファイルしか知らないんだよきっと

427 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 08:50:43 ]
あれ?最近COMファイルって見かけないな。
使わなくなったの?

428 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 08:52:49 ]
拡張子のCOMならDOS専用だから。

429 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 09:54:42 ]
もうやだこの低レベルスレ



430 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 21:25:44 ]
>>428
ところがどっこい。Windowsは拡張子COMのPEを平気で実行する。
例えばNT系のformat.com

431 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 21:28:54 ]
スレ違い止め止め

432 名前:デフォルトの名無しさん mailto:sage [2008/05/12(月) 23:28:26 ]
>>429
おこぼれを貰いに来てるだけのお前みたいな奴は、
自分じゃその下がったレベルを引き上げられないからつらいよね。

でも、おこぼれ貰いに来てるだけの奴が嘆いても、「勝手に嫌がってれば?」としかw

433 名前:427 mailto:sage [2008/05/13(火) 01:52:21 ]
俺も428と同じ認識でネタを書いたつもりだったが。動くのな。
まあ確かにMSだったら拡張子.comでも動くようにしてそうだ。

434 名前:デフォルトの名無しさん [2008/07/19(土) 10:20:15 ]
タイのヤフーにアクセスするとブラウザにタイ語がきちんと表示されるけど、それをコピペして
エディタに貼り付けると文字化けするのは何故でしょうか?

エディタはUnicode版サクラエディタを使いました。

Yahoo! ?????????
th.yahoo.com/

FrontPage - サクラエディタUNICODE化プロジェクト
mofmof.nsf.tc/soft/sakura_unicode/

435 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:42:17 ]
こんなところで聞くより、開発元で聞いたほうが早いと思うぞ。

436 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:45:19 ]
unicode->ウニ
utf-8->アワビ

437 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 10:47:01 ]
>>432
おまえもな

438 名前:デフォルトの名無しさん [2008/07/19(土) 11:43:42 ]
>>435
なるほどサクラエディタの問題なのか。
EmEditorだとタイ語というのがあったので、それでするときちんと表示されました。

439 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 12:52:32 ]
たぶんクリップボードからANSI文字列として取得してるんじゃないかな。



440 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 14:13:18 ]
>>434
普通に表示できたけど、フォントリンクがうまくいってないだけとかじゃないの

441 名前:デフォルトの名無しさん [2008/07/19(土) 14:21:07 ]
>>439
EmEditorにコピペすると、ちゃんとタイ語で表示されたので、多分そうではないと思います。
そこで疑問がまた出てきました。

Unicodeってほぼ全文字を扱っているんですよね?
EmEditorのUTF-8を選んでも、上記のタイ語は文字化け。
タイ語を選んでやっときちんと表示される。

タイ語用のUTF-8とかがあるんですかね?

442 名前:デフォルトの名無しさん [2008/07/19(土) 14:22:19 ]
>>440
フォントリンクとはどういうことでしょうか??

443 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 14:29:15 ]
扱ってる文字集合にタイ文字が含まれてないせいで表示されないのか、
ただ単にフォントが足りなくて表示されないだけなのか、
問題を切り分けろっていってるんだよ。

444 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 15:27:41 ]
UTF16は終端文字がNULLバイト2つだから嫌い

445 名前:439 mailto:sage [2008/07/19(土) 15:38:17 ]
>>441
そういう意味じゃなくて。
サクラエディタ自体がミスってて、コピーされた文字列をAPIで取得する時に、
Unicode指定じゃなく、ANSIを指定しちゃってるかもってこと。
まあさすがにそんなことは無いだろうけど。

446 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 15:43:26 ]
>>445
それはないな。俺が確かめたから。

447 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 16:01:27 ]
>>443
UTF-8というのはタイ語は含まれていないのでしょうか?
ブラウザとEmEditorではタイ語をきちんと表示しているので、タイ語のフォントはあると考えてはダメなの
でしょうか?

タイ文字をブラウザからEmEditorにコピペして、それを保存したのをバイナリエディタで見ると、UTF-8じゃ
ないみたいだ。

EmEditorのタイ語という文字コードはUTF-8とは別物ということか?

>>440さんの言っていることは、、自分の環境ではUTF-8のタイ語を表すコード領域とタイ語のフォントが
うまく結びついていないということかな?

でもブラウザではちゃんと表示されているんだよな。
よくわからん。

448 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 16:17:46 ]
>>447
少なくともIEとFirefoxは言語別に使用するフォントの設定を持っていて、
タイ語の文字を見つけたら、タイ語用のフォントでタイ語の文字を描く。
ところがサクラエディタはそうなっていないのではないのか、ということ。
(無理に日本語フォント使って豆腐になるとか)

>UTF-8じゃないみたいだ。
保存時にデフォルトでShift_JISが選ばれるなんてことはない?

あと、試しにsakuraW_r1398.zipをダウンロードして
コピペしてみたが、うまくいっているように見えるけど。

449 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:15:17 ]
>>448
>保存時にデフォルトでShift_JISが選ばれるなんてことはない?
設定を色々見ましたが、そんなのはなさそうな感じです。
EmEditorには、UTF-8の他にタイ語(Windows)という文字コードが選択できるんですよね。

1文字だけコピペして、それをタイ語(Windows)で保存。
それをバイナリエディタで見ると3バイトでした。だから多分Shift_JISではないと思います。

>>448さんではうまくいってるということは、やはり自分の環境の何かが悪いってことなんしょうね。



450 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:43:59 ]
>>449
あたまだいじょうぶか

451 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:45:28 ]
そもそもサクラエディタはShift_JISで扱える文字しか対応していないはず

452 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:47:10 ]
>>451
Unicode版の話だといってるだろ…
よくよめよ

453 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 18:51:26 ]
Unicode対応版を謳っていても実際に満足にUnicodeに対応している
テキストエディタはVisual Studioのエディタと秀丸くらいしかないよね。

454 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:22:12 ]
>>449

タイ語(Windows)って選択肢はUNICODEとかじゃなくて、CPなんとかというコードページ
(WindowsのShift JISだと CP932)をタイ語のコードページに切り替えてるだけじゃないの?

だからコードページ切り替えに対応していないエディタでは文字化けする。

一旦EmEditorで UTF-8で保存して、そのあと他のエディタで読み込ませてみたら?


455 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:26:17 ]
サクラエディタスレでやれば?

456 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 19:56:00 ]
>>453
秀丸は合字処理がおかしい

457 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 20:23:26 ]
>>454
UTF-8で保存して、サクラエディタと秀丸で開いてみましたが、ダメでした。
とりあえず自分の環境では、Unicodeとそれに対応するフォントがうまく対応付けされていないと
結論ずけておきます。

458 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 22:19:03 ]
うちの秀丸は、th.yahoo.com/ をコピペしてもぜんぜん文字化けしないよ。
もちろんタイのにょろにょろした文字が画面いっぱいな。

459 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 01:58:58 ]
コピペがOS依存だって事忘れてるわけじゃないよな



460 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 09:59:56 ]
>>453
おまえが知らないだけ。

461 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 13:17:41 ]
Alphaとかいうエディタは異字体セレクタまで対応してたな。

462 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:24:26 ]
Unicodeは16ビットで全ての文字が収まると早合点したことが失敗の始まりですか?

463 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 18:50:18 ]
いいえ、全ての文字を符号化できると思ったのがそもそもの誤りでした

464 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:32:10 ]
TRONや今昔文字鏡のことですね、わかります

465 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 20:58:54 ]
もっと言えば、文字とは符号化できるものである、という前提から間違っている。

466 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:00:25 ]
いや、TRONは存在自体が間違っている。

467 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:49:53 ]
>>465
文字って符号じゃないの? 符号化できない文字表現という存在自体が想像付かない。
あ、一応、1:1マッピングできない(適切でない)ケースがあることくらいは想像が付く。

468 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 21:56:14 ]
そんなネタにマジレスしなくても

469 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:03:45 ]
龜甲占いの結果を写生しました/写真に撮りました。
この画像は符合ですか?
一応「龜」ですが。

「龜」と字を書きました。画像として保存しました。符合ですか?
この画像ファイルには"1.jpg"という名前をつけました。符合ですか?
「龜」の代りに<img src="1.jpg">とすることにしました。符合ですか?




470 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 22:13:02 ]
連番をつけて符号化しようと思ったあたりが、問題なんじゃね

471 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 23:41:19 ]
合成文字とか似ている漢字は一緒にしようとか
めんどくさい事考えるから・・

472 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:08:21 ]
> 似ている漢字は一緒にしよう
これはまったくやらずに済まそうとするのは無理じゃない?
デジタル化以前には表記揺れするのがあたりまえだったんだし。

どこまでやるかを間違った、という批判ならその通りだと思うけども。

473 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 00:15:23 ]
いや,揺れたものをそのまま保存・表示できない時点でダメ
揺れたものを対象にした論文などが表現できなくなるから

474 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 01:29:46 ]
人間が文字の生き死にを自由にしようなんて、おこがましいとは思わんかね・・・・・・

475 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 03:09:30 ]
本間先生?

476 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:22:12 ]
結局、「国番号+JISコード」 で16ビットとか32ビットとか、みたいな形にすればよかったんじゃない?
(外国はJISコードとは言わんが、ま、その国ごとで規格化されてるコード、って理解してくれい)

変に世界中の文字をシャッフルしちゃったのが間違いだな。

477 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 09:56:33 ]
それがサロゲートペアだろ。

478 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 10:48:55 ]
なんでやねん

479 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:28:35 ]
>>473
そいつは画像でやれよ……

一般的な用途ではある程度ユニファイされてる方がいい。
微妙な違いなんて日常的な文章には不要だし、検索とかにも不便だし。



480 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 11:53:14 ]
>>477
(;゚д゚) ・・・
 
(つд⊂)ゴシゴシ
  _, ._
(;゚ Д゚) …!?

481 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 13:30:19 ]
>一般的な用途ではある程度ユニファイされてる方がいい
これはその通りだと思うけど、符号化のレベルではやらない方が良かったかと・・

もう1つ上のレイヤを用意して表記ゆれを吸収するのはそこの層がやる
とかにすればやり方を失敗してもそこの層を差し替えるとかして何とかなったのに

482 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 19:58:48 ]
同意.一番下でマージしちゃったらどうしようもない
画像でやれって言う人は,実際に自分でやってないから
どれだけ大変かつ不便で読み難くなるか分からないんだろうな

483 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 20:39:00 ]
実際に文字コード設計したことない人が国コード付けろとか128ビットにしろとか
妄想語るのももはやお約束ですよねー

484 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:19:59 ]
UnicodeでAdobe Japan1-6互換の字形切替をする枠組みが既に正式規格化されているにも関わらず、
「みたいな形にすればよかったんじゃない?」
「もう1つ上のレイヤを用意して」
「一番下でマージしちゃったらどうしようもない」
とか言ってるヤツってナンなの?ゆとり?
ttp://www.unicode.org/reports/tr37/
ttp://www.unicode.org/ivd/
ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf
ttp://appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-white-paper.pdf

上記PDFに書かれている対応製品以外にも、フリーソフトやフリーフォントで既に対応しているものもある。
ttp://alpha.sourceforge.jp/
(↑:日記の2008年1月〜に詳細記述)
ttp://yozvox.web.infoseek.co.jp/
(↑:掲示板の2008年1月〜に詳細記述)

てか、文字コードの話をするなら↓の方がいいだろ、常識で考えて。
文字コード総合スレ part3
ttp://pc11.2ch.net/test/read.cgi/tech/1180250376/

485 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:42:42 ]
>>483
いかにも 「ワタシが文字コードを設計しました!」 って言いたげだな

486 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:43:44 ]
何事にも失敗はある。

487 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 21:48:47 ]
Unicodeは失敗

488 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:15:27 ]
ROMっているだけだったが、ここが文字コードスレだと錯覚していた。

489 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:17:37 ]
ゆとり教育は失敗



490 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:26:55 ]
失敗したら反省が必要。そして次回はどうすべきか案を出し合う。

491 名前:デフォルトの名無しさん [2008/07/23(水) 19:39:46 ]
>>453
しゅーまる(何故か変換(ry)は、アラビア語ちゃんと扱えるんだ。すごい。
xyzzyはアラビア語無理なんだよなあ・・・

492 名前:デフォルトの名無しさん mailto:sage [2008/07/23(水) 21:00:50 ]
有名どころだと秀丸とEmEditorくらいだな。

493 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 09:32:45 ]
しゅーまるぐみはやわじゃねえ!
しゅーまるぐみにはいるんだ!

494 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 10:12:30 ]
EmEditorのフリー版のUnicode対応はイマイチだけど
有料版はいいんかな

495 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 14:54:39 ]
Alphaはどうよ

496 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:03:58 ]
>>494
たぶんエディタ部分のコードは同じだと思うよ。

497 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:38:06 ]
>>495
アラビア語の結合は対応してるみたいだけど、キャレットとか選択領域の端とかと重なると切れちゃう。
ただ、いまのところシンタックスハイライティングがびみょんで、この板的な実用には向かんかなあ。

>>492
EmEditorや秀丸って右から左に表示するオプションあったっけ?
前に試したときはどっちもダメだった気がしたんだけど、それから対応したのかな。

498 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:48:06 ]
直接指定するわけじゃなくて、エンコードで判断

499 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 15:59:43 ]
>>498
それはEm? 秀丸?

でも、そうなるとUnicode系の文字コードじゃRTL文書書けないのかな。



500 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:25:06 ]
>>497
> この板的な実用には向かんかなあ。

プログラム技術@2ch掲示板
ttp://pc11.2ch.net/tech/

この板はプログラムを作る人のための板です。

プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。
ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。
Javascript は Web 制作板、CGI は Web プログラミング板へ。
業界談義、愚痴はプログラマ板へどうぞ。
ゲーム関係の話題はゲーム製作板へどうぞ。
ネタ、板とは関係の無い話題はご遠慮ください。

501 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:31:19 ]
>>500は有名な基地外だから無視していいです

502 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:36:12 ]
>>500
Alphaは、アラビア語が(比較的)まともに扱えるけど
「シンタックスハイライトが微妙」だから
「プログラムを作る人」が使うエディタとしては「実用には向かん」
って行ってる様にみえるんだけどなんでそのコピペなのか理解できません!

503 名前:499 mailto:sage [2008/07/24(木) 22:42:59 ]
試してみたけど、秀もEmも右から左にする方法を見つけらんなかった…

504 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 22:43:33 ]
夏休みだから話題が逸れる前に予防線張ろうとしたと解釈してあげよう。

505 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:00:11 ]
     ///////
    ///////____________
    ///////  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄| ̄ ̄
   ///////              (~) チリンチリン
   ///////              ノ,,
  ///////     ∧_∧         / ̄ ̄ ̄ ̄ ̄ ̄
  ///////     ( ´∀`)( 厨 ) )) <  夏だなあ〜
 ///////      (つ へへ つ      \______
///////   //△ ヽλ  ) ) 旦
//////  l ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄l
/////    ̄| .| ̄ ̄ ̄ ̄ ̄ ̄ ̄| .| ̄
////     ^^^          ^^^

506 名前:デフォルトの名無しさん mailto:sage [2008/07/24(木) 23:29:12 ]
>>500
コイツ、バッチファイルのスレで誰にも相手にしてもらえないから
こんなスレを荒らしてやがる。

507 名前:デフォルトの名無しさん [2008/07/29(火) 07:43:38 ]
↓メタ夏厨議論どうぞ

508 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 06:59:11 ]
Unicode は、夏厨
UTF-8 は、メタ夏厨議論


509 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 15:04:31 ]
UNICODE: 数社の企業が決めたもの、使用できる文字とその番号を定義。
UCS: 国際標準、内容はUNICODEとほほ同じ
UTF: UNICODEやUCSをコンピュータ上に表現するための仕組み

この認識あってる?

UNICODEとUCSってのはJavaScriptとECMAScriptの関係に似てるんかねぇ。



510 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:01:28 ]
コンソーシアムとその規格が Unicode
国際標準規格が ISO/IEC 10646

そしてそのそれぞれで UCS とか UTF とか定義してる

511 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 17:16:04 ]
ISO/IEC 10646の名称(の頭文字とったもの)がUCSだろ。
509の理解で合っているぞ。

512 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 18:07:10 ]
大は小を兼ねるんだから、
Shift-JistとEUCもこれからはUTF-8で扱えばすべて解決。
ユニックス派のカタブツはEUCにこだわるからいけない

513 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:32:12 ]
文字集合は大は小を兼ねてるけど符号化方式が違ってるだろ

514 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 19:47:50 ]
最近のUNIXなら、日本語環境でもだいたいUTF-8だと思うが。


515 名前:デフォルトの名無しさん mailto:sage [2008/07/30(水) 20:54:34 ]
>>512
むしろS-JISの方が圧倒的に量が多くて、移行できないだろ。

516 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 02:18:53 ]
>>509
> この認識あってる?

間違ってます。

517 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 09:20:32 ]
>>516
kwsk

518 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 13:25:21 ]
>>517
間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無いだろ。
ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書くしな。


519 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 06:28:17 ]
>>518
「間違ってますなんて書くだけの奴に詳しく説明できるほどの根拠なんかあるわけ無い」
「ちゃんと根拠があって指摘してるなら>>510 のようにはじめから書く」
そう考える根拠は?

あ、そうか、根拠をはじめから書いていない奴には、詳しく説明できるほどの根拠が無いんだっけ。
ごめんごめん、訊くだけ無駄だった。



520 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:08:55 ]
>>519
まあ、その、なんだ、悪かったよ…。図星つかれてレスもまともに読めなくなるほど泣く
とは思わなかったんだよ。もう言わないから勘弁してくれ、な?


521 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 09:25:39 ]
泣かしたな悪者め

522 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 10:47:03 ]
子ども泣かすの良くない

523 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 11:21:50 ]
><

524 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:07:25 ]
   、_人_人_人_人_人_人_人_人_人_人_人_,
  、_)                       (_
   _)  夏   厨   警   報  !! (_
   _)                     (
   '⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒Y⌒`
                   //
           ヘ,(゚∀゚)y'^     アーヒャ ヒャ ヒャ ヒャ ヒャ
          、  _L_;二;_.j_  , \\
           ̄ ト、~Y~,/| ̄
             ,|yΛ=スイ|、   アーヒャヒャヒャ   _
             ' | | !;∀Y i| `          /##;〉
           |イYト〉イY.|           /  ̄
   アヒャヒャ     レYy'`vレ|     ヽ(゚∀゚ )ノ
            Vy  V'       (夏 )ヘ
   ヽ( ゚∀゚)ノ               <
     ( 夏)ヘ
     <

525 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 20:51:53 ]
>>520
夏のどさくさに紛れて、そういうキャラ付けで逃げるのはよくないよ。気持ち悪いし。

526 名前:デフォルトの名無しさん [2008/08/02(土) 00:49:27 ]
鸚鵡返し、人格攻撃はスレが機能しなくなるからやめようよ・・・

527 名前:デフォルトの名無しさん mailto:sage [2008/08/02(土) 09:11:38 ]
>>516>>509に対して説明すれば済むだけの話。

528 名前:516 mailto:sage [2008/08/03(日) 21:29:00 ]
>>509
pc11.2ch.net.nat.homeunix.org:65082/post.pl?b=tech&t=1177930957

529 名前:デフォルトの名無しさん [2008/08/04(月) 01:36:40 ]
本来は
Unicode ⊂ UTF-8
であることは明白だが、

事Windows OSではUTF-16の事を単にUnicodeと表記するので、
Windows上では
Unicode ≠ UTF-8
とも言える



530 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 10:02:52 ]
釣りですか

531 名前:デフォルトの名無しさん [2008/08/04(月) 14:51:21 ]
ググれカス

532 名前:デフォルトの名無しさん mailto:sage [2008/08/04(月) 21:52:42 ]
ネタにマジレス( ´;゚;ё;゚;)きんも〜☆彡

533 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 04:13:34 ]
   【JISコード】
デコード↑/↓エンコード
     シフトJIS
      EUC

   【ユニコード】
デコード↑/↓エンコード
     UTF8
UTF16LE/UTF16GE
     UTF32

     【音声】
デコード↑/↓エンコード
      WAV
      MP3
      WMA

    【ビデオ】
デコード↑/↓エンコード
      AVI
      MPG
      FLV

534 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 05:55:43 ]
全角で書く奴って、やっぱりアレだな…

535 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 06:28:39 ]
ときに、UTF16GEってなんだろ。

536 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 07:17:57 ]
デコードした先がコードとは何ともかんとも

537 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 09:48:19 ]
>>535
ゲルググエンディアン

538 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 12:00:16 ]
あまりの非の打ち所の無い完璧な説明なため
全角や誤字しかツッコミどころが無いな。

539 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 13:13:37 ]
確かにゲルググエンディアンは完璧だ




540 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 14:10:58 ]
コンテナはどうなんだ

541 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 23:19:58 ]
>>533
おい大漁だなw
やったじゃねーかw

>>533-539
釣られまくり乙

542 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 02:34:28 ]
全角と誤字以外のツッコミは無いのかい?

543 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 11:32:08 ]
へんなのが住みついたね

544 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 13:00:18 ]
夏だね。

545 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:11:48 ]
そろそろ秋だよ

546 名前:デフォルトの名無しさん mailto:sage [2008/08/06(水) 16:16:05 ]
暦の上でどうだろうと、今は夏真っ盛りだ

547 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:01:12 ]
では、全角と誤字以外には非の打ち所の無い
カンペキな「Unicode と UTF-8 の違い」の解答という事で
無事にこのスレを閉じたいと思います。
みなさん、長い間ごくろうさまでした。

548 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:16:28 ]
お疲れさまでした。

549 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:35:31 ]
先生の次回作にご期待ください。



550 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 04:19:12 ]



    世 界 迷 作 劇 場


                おわり

551 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 21:56:12 ]
思ったこと。
・広義の「ユニコード」はUTF-8等の規格を含めることがあるので不正確
>>536指摘済みだけど、音声のenc/decと、文字のenc/decを一緒にするのは
 違和感あり。JISコードは既に「符号(コード)化」されてるから。
 俺的には
  音楽→(量子化)→PCM→(各種圧縮)→MP3 の3段階が
  文字→符号化文字集合→テキストエンコーディング に対応する感じ
・AVIって格納形式の概要だけ決まってて、圧縮アルゴリズムは別じゃなかった?

552 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 22:59:54 ]
狭義のユニコードっていうのはM$が決めつけたUnicodeのことか?
例えば、ttp://msdn.microsoft.com/ja-jp/library/ms191200.aspx
>Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため


つーか、広義も狭義もねーよ。バーヤ。

553 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 00:08:21 ]
まだやる気か?

554 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 01:50:13 ]
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。

555 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 04:17:35 ]
サロゲートペア厨必死だな。無視されてんのによw

556 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:21:22 ]
サロゲートペアは、32bit wchar_tの入り口ですよ。

557 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:33:01 ]
マイクロソフトで統一すれば市場に一致して解決

558 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 09:38:44 ]
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん

559 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 10:57:45 ]
結論
>>1みたいなのが現れるのはMSが糞だから



560 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 11:58:30 ]
何でも他人のせい、日本のせいにする人たちみたいですね。

561 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 12:35:44 ]
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。

562 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 14:04:35 ]
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが

563 名前:デフォルトの名無しさん mailto:sage [2008/08/08(金) 22:59:01 ]
少なくともパートのおばちゃんは働いてるからな
                   ^^^^^^^^^

564 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 00:51:35 ]
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。

565 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 04:22:32 ]
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。

566 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 07:01:57 ]
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。

567 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 08:34:38 ]
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

568 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 09:53:28 ]
>>567
>>557

>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

569 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 11:23:13 ]
> お前ら

たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。



570 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:07:27 ]
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。

571 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:21:53 ]
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:24:33 ]
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:39:23 ]
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:42:08 ]
>>573
メモ帳もUnicode/Unicode big endianだけど。

575 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 13:52:08 ]
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:01:15 ]
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:32:53 ]
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
ttp://msdn.microsoft.com/ja-jp/library/cc389880.aspx
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 15:51:22 ]
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 16:21:00 ]
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった



580 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 23:37:35 ]
Shift JISで悩まされてた人って多いんじゃないの?

581 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:42:19 ]
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 02:59:24 ]
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 05:13:31 ]
>>580
それで悩むのはUNIX屋だけ。

584 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:29:26 ]
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 07:57:24 ]
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 09:20:58 ]
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:57:11 ]
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 12:24:15 ]
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな〜。
氏名をカナで管理ってありえねーよ。


589 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 14:08:27 ]
むしろカナしかないだろ



590 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 22:24:23 ]
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<116KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef