UnicodeとUTF-8の違いは？　その2

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 05/22 16:06 / Filesize : 183 KB / Number-of Response : 805
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん [2010/11/30(火) 09:00:05 ]: 富士通だとデフォルトでは生成されない
frt -c -Am -M./ (なんとか.f90)
でいけるのではなかろうか。いずれにせよ、
frt -help | less
とかやって、"module"で検索を掛けるのが吉。
75 名前：デフォルトの名無しさん mailto:sage [2011/02/09(水) 01:01:41 ]: >>71
偶然先頭にBOMが来ることは少ない、という前提の元では、
ファイルが、自身のエンコード方式を明確にする目的での利用にはそれなりに役に立つ。

けどBOMなしUTF-16というものもあるので、
アプリが、ファイルのエンコードを知るという目的では微妙。
76 名前：デフォルトの名無しさん mailto:sage [2011/02/09(水) 23:56:09 ]: >>73
>BOMの矛盾
何も矛盾してないだろ。矛盾とは何?
エンコーディングを確実に判断するにはメタデータが必要に決まっているし、
BOMはUnicodeを他のエンコーディングと区別できることを保障している
わけではない。
77 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:29:49 ]: >>71も>>73も同レベルの無知だと思うよ
78 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:31:47 ]: じゃあ俺も！
79 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:47:30 ]: だな
>>75も無知の部類
80 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:53:16 ]: うざいなあ
低能なネタ振りは無視すれいちいちツッコミ入れるな
81 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 00:55:10 ]: それも無視すれば良いんじゃないの
82 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 01:55:30 ]: >>75の認識で何が間違ってる？
無知じゃない人おしえて
83 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 06:15:01 ]: ------ はいはいここまで読んだ ------
84 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 06:41:56 ]: >>75はあれだろ。
「挨拶は人間同士のコミュニケーションを円滑にするが、
挨拶しない人もいるので、挨拶の必要性を感じない」ってレベル。
85 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 08:36:09 ]: コードポイントとスカラー値の違いは何でしょうか？
86 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 09:26:48 ]: コードポイントというのは抽象的な概念で、Unicode 以外の文字集合の
（たとえば JIX X 0208 の「何区何点」）も「コードポイント」。

スカラー値というのは Unicode の概念で、コードポイントを示す具体的な
整数値。
87 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 09:48:53 ]: >>86
そういうことなんだ。
㌧
88 名前：デフォルトの名無しさん [2011/02/10(木) 10:16:57 ]: バカと無知の違いは何でしょうか？
89 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 10:18:13 ]: 無知は知識を獲得すれば問題なくなる
バカは死ななきゃ治らない
90 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 10:37:47 ]: const int バカ = 0;
int 無知; // uninitialized
91 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 12:28:24 ]: 人格的な理由によるバカならば、稀にconst_castが効くこともある
92 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 15:27:41 ]: ただし膨大なコストを伴う
93 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 20:00:10 ]: UTF-8 なファイルに BOM を付けるのは、渋谷の交差点ですれ違う人全員に挨拶するレベルかな
94 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 21:34:49 ]: 的外れなたとえ話は要らん
95 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:01:51 ]: <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf8">

これでじゅうぶんやん。何が不満なの？ワケがわかりません。
96 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:06:18 ]: <?xml encoding="UTF-8">

これでもいいし。まぁ煮たようなのは他にも
-*- coding: UTF-8 -*-
とか
vim:fileencoding=UTF-8
とか
use utf8;
とかあるらしいけど、実際に使った事がないから知らん。
なんでソレじゃダメなのさ？
97 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:07:04 ]: おそらく誰も明確には答えられんだろうな。
98 名前：デフォルトの名無しさん mailto:sage [2011/02/10(木) 23:16:46 ]: <?xml encoding="UTF-8">
-*- coding: UTF-8 -*-
vim:fileencoding=UTF-8

これらは
coding="UTF-8"
coding: UTF-8
coding=UTF-8
の部分のマッチだけ見てるよ
99 名前：デフォルトの名無しさん [2011/02/11(金) 00:42:47 ]: コーディングマッチ子先生
100 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 01:31:28 ]: その手の手法は、元来レイヤーが違うところに情報を持たせている気持ち悪さはあるな
例えば、文字コード変換との相性は明らかに良くないし、対処法も美しくない
BOMと比べてどうかはまた別の話だが
101 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 03:51:56 ]: 実際のエンコーディングと異なるエンコーディング名を指定できるし
UTF-16で破綻するしBOMより酷いと思う
102 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 08:38:34 ]: 世の中の流れとしては
旧 HTML → media type で指定。デフォルトなし
↓ XML → デフォルトは Unicode だが指定可能
新 JSON, YAML → Unicode 以外不可

となっている。Unicode 以外不可なら BOM で判別がつく(なければ UTF-8)。
103 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 14:01:51 ]: >>84
そう解釈したのならバカ。挨拶ってのがセンスのない例えなので、違和感は出るが
挨拶しない人もいるから、挨拶してもらえるつもりでいてはいけない
の方が近い。
104 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 14:19:06 ]: >>102
昔のHTMLは、そもそも多言語対応
してなかった。
JSONは、パーサー次第だろ。

「世の中」としては、UTF-8に収束
しつつも、統合されるのはまだまだ
遠い将来、くらい？
105 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 14:26:29 ]: YAMLもUTF-8で通るライブラリと通らないのがある

>>104
>しつつも、統合されるのはまだまだ
>遠い将来、くらい？

もう目の前まで来てる
106 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 14:34:35 ]: 最初っからUCS-4なら統合も素直に喜べたんだけどねぇ
107 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 16:40:26 ]: >>104
多言語対応と複数文字コード対応は全く違う話。
108 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:05:52 ]: ＞実際のエンコーディングと異なるエンコーディング名を指定できるし

そげなことを言い始めたら話が先に進まんぜ。
シフトJISの文書ファイルにUTF-8のBOMを埋め込むことだってできる。
偽装しようと思えば何だってできるやろ。
他人の考えを否定するばかりでなく、自分で何か建設的な意見は言えんの？
109 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:12:19 ]: 動画とおんなじようにテキストファイル用のコンテナフォーマットを作って
BOMだの言語タグだのコーディング指定だのはそっちに入れるのがいい
テキストとBOMとごっちゃに規格管理しようとするから混乱する
110 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:23:42 ]: まあ安易だわな。
必須にならなくてよかったよ。
そのうち死滅するだろう。
111 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:28:41 ]: SJISにBOMを付けるなんてのは意図的に破壊しないと出てこないと思うが。少なくとも
文字コード変換と同列の問題じゃない。
実際問題、文字コード変換をしようとしたら、どれが一番楽かはともかく、データ内に
文字コード情報を埋め込むやり方は一番面倒だ。設計的には美しくない。かといって、
既存の枠組みから大幅に異なるコンテナを作ったところで誰も使わないだろう。
UTF-8で全部片付くほど綺麗な世界でもない。BMPだけなのか、UCS-4まで行ける
のか、同じUTF-8でも別扱いにしないとまずい世界が既にあるのだし。
BOM付きUTF-8への対応も進んでいるし、推奨もしないが排除する必要も無かろう。
大体、CJKなんて糞仕様を作った糞コンソーシアムに盲従する必要も全く感じない。
112 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:30:19 ]: いいかげんすぎるのも困るが、原理原則でガチガチなのも困るわな
113 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 21:48:01 ]: これだけ対応ソフトが出回ると、死滅はしないんじゃないか？
まぁ、使わなくても個人的には全く困らないっつーか、BOM無しに統一された世界なら
むしろその方が楽だから、非対応に戻すのが流行ったりしたら死滅するだろうけど。
あと、美しく新しいテキストファイルのコンテナ、とか考えていいのは中学生までだな。
114 名前：デフォルトの名無しさん mailto:sage [2011/02/11(金) 22:13:45 ]: コンテナとか難しいこと考えんでも、"\033$@" と "\033(J" で囲めばええやん
115 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 00:50:26 ]: >>108
他人の考えを否定するばかりって…ｗ
conding=UTF-8埋め込みじゃあ例えばSJISにコード変換しただけで破綻するじゃない
コード変換は普通に行われるから、それを指摘しただけなのにw
116 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 00:56:01 ]: >>115
> conding=UTF-8埋め込みじゃあ例えばSJISにコード変換しただけで破綻するじゃない
それは現状のコード変換がconding=UTF-8を認識せずにコード変換するからであって
conding=UTF-8をコード指定として認識するコード変換ツールは、変換後のコード名を
埋め込み直すんじゃないでしょうか？
117 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 02:18:01 ]: コード変換ツールは必ず coding=*** を正しく認識して埋め込み直しなさい。
ユーザーは一行目に coding *** などと間違われやすいテキストを書いてはいけない。
ユーザーはテキストエディタで開けば書き直せる状態だけど coding=*** を書き換えてはいけない。
制約が多いなあ。
118 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 02:23:36 ]: それは文字コード変換なのだろうか？

そもそも文字コード間の文字って完全に対応が決まってるわけじゃないし
どうやっても何らかの問題を含んでしまいそうだ
コンセンサンスのある文字コード変換手法が定まってればいいんだろうけど
どうせ「Windowsと同じ挙動にすること」ってなったりしそうで実装者がかわいそう
119 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 03:21:01 ]: >>108
馬鹿にかまうな
120 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 04:55:24 ]: 詭弁のガイドライン
121 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 12:43:08 ]: おまいらアフォ杉ｗ
コード変換する必要の無いように、coding=*** を埋め込むんじゃないか。
コード変換する必要があるのは、コードが不明だから。
判明してれば変換する必要は無いだろ。
122 名前：デフォルトの名無しさん [2011/02/12(土) 13:00:10 ]: >>121
アフォなプログラマ・アプリは山ほどあるぞ
123 名前：104 mailto:sage [2011/02/12(土) 14:35:09 ]: >>107
何が違うのかわかんね。

ちなみに「多言語対応」は、英語系以外の
言語の対応のつもりで書いた。
124 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 14:36:40 ]: >>105
＞もう目の前まで来てる
ガラパゴスなめんな！
125 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 20:16:29 ]: コード変換ツールは、METAタグ、XMLタグ、coding=*、using文、その他もろもろを正確に
認識しなければならない。
また、例えばプログラムのコード、ログファイル、ドキュメントなどにMETAタグがサンプル
として埋まっている場合は、それは言語コード指定ではないので変換してはならない。

アホかと。
「コード変換ツールが対応すればいい」とか言ってる奴は、一生プログラムを書くべきじゃ
ないレベルだろ。
126 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 20:22:12 ]: >>121が何を言いたいのか分からん
適当な言語で非ASCIIで破綻しない正規表現マッチングをしようとしたとして、シフトJISと
判明しているテキストが送られてきた場合、coding=Shift_JISって埋まってたら、どんな
プログラム言語でも変換せずに処理できるとでも？
127 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 20:39:57 ]: 日本語でおねがいします
128 名前：デフォルトの名無しさん mailto:sage [2011/02/12(土) 23:02:11 ]: この場合適当とは文字通り適当ということを指します
129 名前：デフォルトの名無しさん [2011/02/26(土) 09:39:55.26 ]: hibari.2ch.net/test/read.cgi/tech/1295493964/210-
130 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 12:23:31.69 ]: >>129
UTF-32は固定長でないと書いてありますが、これはどういう意味でしょうか？
合成文字があるから1文字が必ずしも32bitでないということを言っているのでしょうか？

hibari.2ch.net/test/read.cgi/tech/1295493964/228
＞228 ：デフォルトの名無しさん：2011/02/26(土) 02:22:47.15
＞いまどき、欧米人以外でUTF-32が固定長とか思ってる奴がいるんだな。
＞CJKの当事者としてもうちょっと勉強しようぜ。
131 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 14:19:42.86 ]: >>130
普通に考えたらそうだと思うけど、その人が本当に何を考えてそう発言したのかは
向こうで聞かないと分からないと思われ

コードポイントの話に反論が無かった所を見ると、まあ間違いないとは思うけどね
132 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 14:20:00.77 ]: 合成文字だろ。
133 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 15:25:56.28 ]: >>131-132
やはりそういうことですよね。
㌧
134 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 16:50:59.12 ]: CJKとかアホなことして切り詰めた意味は全く無かったよな
135 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 17:33:27.17 ]: そうだね
136 名前：デフォルトの名無しさん mailto:sage [2011/02/26(土) 18:00:45.17 ]: benlynn.blogspot.com/2011/02/utf-8-good-utf-16-bad.html

CJK を使ってなくても分かる話だよな
137 名前：デフォルトの名無しさん mailto:sage [2011/04/16(土) 07:00:33.60 ]: 突然だけど、俺、今日ソープで童貞捨ててくる。
11時に電話で予約入れた。どきどき
お前らも今時シフトジスなんて使わずMancode使えよ
138 名前：デフォルトの名無しさん [2011/04/16(土) 07:39:18.44 ]
139 名前：デフォルトの名無しさん mailto:sage [2011/04/16(土) 09:30:15.01 ]: >>137
体験レポートもよろしく。
自分の場合、マンコの中がゆるく感じて、あまり気持ちいいとは思わなかった。
140 名前：デフォルトの名無しさん [2011/04/16(土) 10:15:37.30 ]: シフトジスは最大２バイトだからしまりが良い
141 名前：137 mailto:sage [2011/04/16(土) 13:54:15.82 ]: 川崎ソプに行ってきた。
騎乗位は何故かチソコ痛いだけで苦痛だったけど
正常位はむちゃくちゃ気持ち良かった。
緊張して何話したか覚えてないけど、優しくしてもらえたよ。
お前らもMancodeなんて使ってないで。UTF-8使った方がいいよマジ
142 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 09:25:16.40 ]: 最近ＯＵＴＬＯＯＫの設定を「Unicode(UTF-8)」にしたんだけど、
相手が読めなかったり問題ある？
あとUTF-8が括弧書きされてるのはUTF-8はUnicodeの一種ってい
理解でいいのかな
143 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 13:17:17.60 ]: >UTF-8はUnicodeの一種

軽く目まいがしたぜ・・・
144 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 14:59:14.76 ]: 問題ないだろ。Unicode規格で定められたエンコーディングの一つがUTF-8。
「Unicode」が符号化文字集合の名前だなんてUnicode規格のどこにも書いてないし、
「Unicode」をUTF-16の意で使うのはマイクロソフトだけ
145 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 15:29:57.76 ]: Unicodeの一種、っていう呼び方は語弊があるな。
「魚の一種」というなら対象は魚であるべきだし
「Unicodeの一種」というなら対象はUnicode（つまり規格）であるべきなんだ
日本語の問題だな

UTF-8は規格は規格でもUnicodeの符号化方式の規格であって、言うなれば
上の例でたとえるなら「フグの白子って魚の一種ですよね？」と聞いているようなもの
フグは魚の一種だが、フグの白子は魚の一種ではない

「Unicodeの一種」と呼べるのは、例えばUnicode 1.0.1とかUnicode 6.0.0とかだな
この二つは全然違うけどどちらもUnicode
146 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 15:43:17.08 ]: まああれだ。「原材料：魚(フグの白子)」みたいなもんだ。
147 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 22:14:03.44 ]: 区点コードってJISコードの一種ですよね？
148 名前：デフォルトの名無しさん mailto:sage [2011/04/30(土) 22:45:48.73 ]: JISの文字集合のインデックスです。
149 名前：デフォルトの名無しさん mailto:sage [2011/05/01(日) 02:25:41.72 ]: とある文字集合の・・・
150 名前：デフォルトの名無しさん mailto:sage [2011/05/01(日) 06:12:28.61 ]: >>147 JISコードの定義は？
151 名前：デフォルトの名無しさん mailto:sage [2011/05/01(日) 10:30:43.79 ]: JIS X 0208文字集合
152 名前：デフォルトの名無しさん mailto:sage [2011/05/01(日) 12:36:34.07 ]: いまどきのガキはJIS26も知らんのか。
153 名前：デフォルトの名無しさん mailto:sage [2011/05/01(日) 20:50:07.03 ]: 知らん
154 名前：142 mailto:sage [2011/05/14(土) 18:23:02.15 ]: Unicodeの理解が間違ってたようですみません。
メール本文は文字化けしないようなのですが、返信メールの宛先が
「"=?utf-8?B?=" aaa@bbb」みたいになってしまいます。
相手のメールソフトがMIMEエンコードを認識できないことがあるようです。
155 名前：デフォルトの名無しさん mailto:sage [2011/05/15(日) 00:27:53.50 ]: 携帯に歩数計アプリ入れてるんだけどさ、今日は10646歩だったぜ。キリがいい
156 名前：デフォルトの名無しさん mailto:sage [2011/05/29(日) 07:37:03.28 ]: 前スレの、ISO-2022-JPがIEで文字化けする問題だけど、MSのブログはアホが多いな。
「文字コードの指定の無いページで文字化けが起こるようになりました」とか言う奴は
死んだ方がいい
157 名前：デフォルトの名無しさん mailto:sage [2011/06/02(木) 00:01:47.43 ]: 前スレとか半年越しで言われても何の話かわからん
158 名前：デフォルトの名無しさん [2011/06/02(木) 02:53:51.08 ]: 984 名前：デフォルトの名無しさん [sage]： 2011/01/23(日) 14:21:57
いや、最近IEを更新すると、
META書いてあってもISO-2022-JPが化けるようになった。

985 名前：デフォルトの名無しさん [sage]： 2011/01/23(日) 17:03:21
>>984
ISO-2022-JP は IE でも見れるって
話じゃなかったのか？
見れなくなったのか。

986 名前：デフォルトの名無しさん [sage]： 2011/01/23(日) 21:39:59
>>985
blogs.msdn.com/b/ie_jp/archive/2010/12/17/ms10-090.aspx

987 名前：デフォルトの名無しさん [sage]： 2011/01/23(日) 22:57:09
HTTPヘッダだと認識してhttp-equivで認識しないってなんだよ。
いずれにせよHTMLでのISO-2022-JPに未来はないと。
159 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 00:19:36.36 ]: Unicodeはインディアン依存で、UTF-8はインディアン無関係っていう理解でOK？
160 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 00:22:01.40 ]: 合ってるような、合ってないような
161 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 00:30:48.61 ]: 規格としてのUnicode:バイトオーダー依存のUTF-16や非依存のUTF-8を含む規格
MS用語としてのUnicode:リトルエンディアン固定のUTF-16
UTF-8: バイトオーダー非依存でおk
162 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 01:23:32.87 ]: 嘘つかない
163 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 03:17:36.76 ]: 正規化NFCとNFDって、こっちが標準形式とか決まってるものですか？
それともWinとMacでカオス？
164 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 04:26:54.21 ]: "Unicode" をUTF-16の意味で使うのは、Windowsだけじゃなくて
Javaもなんだな。
download.oracle.com/javase/1.5.0/docs/guide/intl/encoding.doc.html
165 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 20:08:59.54 ]: >>163
カオスです。

詳しいことはMacOSXの方しか知らないけど、
NFDじゃないのが紛れ込んだりすると、
フレームワークも標準アプリもとても馬鹿げた動作をする。
要するにNFDを徹底できてない。
166 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 21:12:30.76 ]: >>163
どちらも標準形式、両者を扱えないといけない。
>>165
OSXは両刀、テキスト入力とかはNFCだよ。
NFCをファイル名に渡すと自動的にNFDにnormalizeする。
変換、比較のAPIも揃ってる。
167 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 21:20:40.21 ]: MacはUTF-8(NFD)に似た独自の文字コード。
正規化できてないってことはUTF-8と呼ぶことすら問題がある
168 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 21:32:28.48 ]: >>167
それはVFSレイヤに限定した話。
専用のnormalize APIもある。
テキスト等でどんな正規化を使っても構わない、って言うか普通はNFC
169 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 21:57:45.92 ]: POSIXとかCarbon使うと簡単に破綻するけどな。
170 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 22:10:46.58 ]: >>168
>VFSレイヤに限定した話
独自コードの使用場所がファイルシステム限定っていうのは知らんかった。でも
　NFCでファイルシステムに書き込み要求→独自コードに変換される
　→lsの結果を読み込むと独自コードのまま→元のNFCと比較するとアウチ
Mac内だけで既にカオスだね
171 名前：デフォルトの名無しさん mailto:sage [2011/06/05(日) 22:41:39.84 ]: >>170
正規化無視するにしても、ファイルシステムによって使えない文字(/:とか)や
同一視される文字(大文字小文字とか)は異なるから、ファイル作ったりしたら
実際どういうファイル名になったかは確認する必要あるよ。指定した文字列が
そのまま使われる保証は無い。
172 名前：デフォルトの名無しさん mailto:sage [2011/06/06(月) 08:09:48.24 ]: VFSレイヤでやってないからそういう問題が頻発するんだろ。
VFS関係ではNFDのコードはhfs+ドライバにしかないから。
Cocoaでもうまく出来てない。
hfs+以外は全部プログラマー任せだから。
173 名前：デフォルトの名無しさん mailto:sage [2011/06/06(月) 08:52:33.29 ]: /:と文字コードとを同じにしないで欲しいな。
\が/になっても文句言わないけど、シフトJISで
書き込んだファイル名がEUC-JPになったら困るじゃないか。
174 名前：デフォルトの名無しさん mailto:sage [2011/06/06(月) 18:46:43.25 ]: >>172
>VFS関係ではNFDのコードはhfs+ドライバにしかないから。
>Cocoaでもうまく出来てない。
それは君が知らないだけ。自動変換で不十分ならUnicodeConverterを使えばHFS+ルール
でのNFD/NFC変換もできる。
>hfs+以外は全部プログラマー任せだから。
HFS+以外だと具体的に何が必要になるの？

>>173
>シフトJISで書き込んだファイル名がEUC-JPになったら困るじゃないか。
古目のWindowsのアプリはそうでしょ。ファイル名はUnicodeで保存されてるのに未だに
Shift_JISで扱ってる。zipアーカイブのファイル名をShift_JISで記録してるため、本当の
ファイル名と違うし、UTF-8使ってるOSX等unix系の物と互換性が無いのは有名な話。
175 名前：デフォルトの名無しさん [2011/06/06(月) 19:25:09.50 ]: >>174
> ファイル名はUnicodeで保存されてるのに
ダウト

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef