[表示 : 全て 最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 05/09 15:01 / Filesize : 50 KB / Number-of Response : 202
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは? その2



1 名前:デフォルトの名無しさん mailto:age [2010/05/27(木) 14:17:17 ]
前スレでなんとなくわかったのですが、インディアンがどうとかいうあたりで
話について行けなくなりました。

125 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 01:21:33 ]
>124
sjis-Unicodeのマッピングが公式に定義されて無いのは別に否定してませんが…
ただ「sjis」という文字とコードのマッピング(要はキャラセット)はIANAに登録されてるでそ。
それを無いとか言うもんだから>123を提示したまでですが。

あとメジャーかどうか知らないけど、IBMがICUっての公開してますよ。>処理系

126 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 02:13:15 ]
>>125
ちゃんと読もうよ。
わかんないことには口を出さないこと。
勘違いしてたのなら素直に謝ること。
それだけだよ。

127 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 09:44:14 ]
JIS X 0208:1997の附属書1は規格じゃないの? 「規定」って書いてるんだけど。
標準じゃなくてガラパゴスだとか?

128 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 14:45:37 ]
>>125
sjisとShift-JISとShift_JISを一緒にしないでくれ。IANAに登録されているのはShift_JIS。

>>124
また話がループするようなことを。規格化されているのはShift_JISX0213。
断じてsjisではない。

129 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 15:10:13 ]
>>123
X0201とX0208だよ。
www.iana.org/assignments/character-sets

>>124
デファクトスタンダードはやっぱりJavaでそ。

130 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 20:00:00 ]
>>128
それに関しては、もはや揚げ足取りではないのかい?
cp932とShift_JISX0213は別物だが、sjis, Shift_JIS, Shift-JIS, shiftjis, ... を
Shift_JISX0213の通称として扱っていいんじゃないの。

それともShift_JISX0213と別物で、よく似た名前の別規格or独自仕様って何かある?

131 名前:128 mailto:sage [2010/06/27(日) 22:38:28 ]
>>130
揚げ足を取るつもりはないけど。
少なくともShift_JISはIANAに登録されていて別格。狭義のシフトJISを指す。
それに対しsjis,Shift-JISは定義の無い通称で、広義のシフトJISでは?
両者は明確に区別されるべきだと思う。
少なくとも>>99のSJISがShift_JISの略っていうのは嘘。

132 名前:デフォルトの名無しさん mailto:sage [2010/06/27(日) 23:03:12 ]
>128
そこまでの厳密さを求める割に、IANAに登録されてる/されてないという流れに対して、
「Shift_JISX0213」を持ち出すのはおかしいと思わないのかい。
それJISでは正式採用されてても、IANAじゃまだドラフトのはず。

133 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 03:14:55 ]
>>131
Shift_JISって名前出しつつIANA Shift_JISと別のエンコーディングの話する場合はないといえるのかい?
俺と君との2人だけの議論だったら、単語の使い方を明確にしておくのは有効だろうが、
何人いるのかも分からないし、そのうち何人が全部のレス読んでるか分からない、単発ばかりかもしれない場所でそれをやってもろくなことにならないと思うよ。

できる限り、文脈で判断して、違いを分かってる人は必要に応じて明確に違いを明示した言葉遣いをするのが一番マシだと思うんだ。



134 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 11:17:31 ]
unicodeと関係ない話は他でやってくれ。
わかったのはCP932以外のシフトジス系はunicodeとの対応が規格化されていないってことだ。

135 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 11:21:55 ]
X0208←→Unicodeが存在して、X0208←→シフト符号化表現が存在するのに、
シフト符号化表現←→Unicodeが存在しないとはこれいかに?

136 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 12:31:41 ]
なんでこう、脊髄反射するんだろうな。

137 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 13:53:54 ]
やけどしないように、かな

138 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 21:00:17 ]
脊髄反射した結果、炎上してるのになぁ。
反省とかしないのかね。

139 名前:デフォルトの名無しさん [2010/06/28(月) 21:44:51 ]
>>135
X 0208←→Unicodeは何処に書かれてるの?おせーてくださいまし。
あとX 0201の存在もお忘れ無く・・・

140 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 21:44:58 ]
>134は「規格」を「IANAのobsoleteではない規格」に限定しないと、真にならんかと。

141 名前:デフォルトの名無しさん mailto:sage [2010/06/28(月) 23:17:23 ]
>>140
IANAじゃなくてUnicodeコンソーシアムのまちがいだよね?
あとobsoleteじゃないってのはデフォかと。

142 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 02:29:00 ]
なんだ、そしたらもう、cp932は規格通りにUnicodeと変換可能だけど、
Shift_JISもiso-2022-jpもUnicodeと変換する規格なんてないからUnicode化は諦めたらいいんじゃないの。

143 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:00:59 ]
まあそうだな。だから>>110みたいな意見が出て来るし、実際に実装が乱立している。
>>113はどのあたりが間違いだと言ってるのか気になるけど。



144 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:03:36 ]
>>143
「規格化されていないことは、マッピングが異なる理由ではない」 って書いてあるじゃん。

145 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:05:04 ]
>>143
ついでに、ここで「だから」という文脈で>>110を出してくるのはおかしい。

146 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:13:54 ]
お前ら規格にこだわりすぎ。規格がなければ変換できないかのように言うのはミスリーディング。
>>142とそれに賛同してる奴は、本気で書いてるとすればキチガイに近いレベルのバカだ。

例えば上でiconvが出てたが、あれは規格がなくてもできてる。
いくつかの記号では実装によって食い違いが出るかもしれないが、それが一体何だって言うんだ?
cp932

147 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:14:59 ]
すまん。途中でかいてしまった。

cp932じゃなくShift_JISで書かれた文章なんて、そんなに数ないだろうに。

148 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 03:57:16 ]
>>144
じゃあOracleのSJISとJavaのSJISでマッピングが異なるのは何故なの? きちんと規格化されてないからじゃないの。 

>>146
いや規格化されていないと困るだろ。マッピングが異なるなんて致命的。

149 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 09:59:33 ]
だからその致命的なことがすでに世の中に蔓延していますよ、というのが現実なのだがw

150 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 21:18:07 ]
>148
>じゃあOracleのSJISとJavaのSJISでマッピングが異なるのは何故なの? きちんと規格化されてないからじゃないの。 
各々の環境で「SJIS」が指してる規格が違うだけかと。
OracleはX0208(cp932にも変更可)で、Javaはcp932らしい。
ttp://otndnld.oracle.co.jp/skillup/oracle9i/1_1/index.html
ttp://www.ingrid.org/java/i18n/encoding/shift_jis.html
まぁ最初からきちんと規格化されてりゃ、こんな事にはならなかったんだろうけど。

151 名前:デフォルトの名無しさん mailto:sage [2010/06/29(火) 21:28:46 ]
>OracleはX0208(cp932にも変更可)
すんませんこれエンコーディングとしてcp932も選べるってだけですね。
SJISの実体をcp932に定義できる、とも読めてしまう気がしたので念のため訂正。

152 名前:デフォルトの名無しさん mailto:sage [2010/06/30(水) 00:11:26 ]
>>148
例えば、OracleのSJISが規格化されたとしたら、cp932とOracle SJISのマッピングは同じになると思うかい?
>>110が書いたのはそういうこと。

>>148
君は、PC(サーバとかじゃなくてPCだぞ)を使う上で1byteの大きさが決まっていなくて困ったことはあるかい?
例えば、この文章をUnicodeに変換するとして、何が致命的になりうる?

153 名前:デフォルトの名無しさん [2010/06/30(水) 02:41:09 ]
>>150
違うぞ。
OracleのSJISはCP932から「〜」の一文字だけ異なる独自マッピング。
JavaのSJISはCP932とはほど遠い、iconvのsjisに近いマッピング。
規格化なんて何処にもされていない。

>>148
もし規格化されてたら同じになったんじゃない?
たった1文字だけ違うなんてなかっただろう。



154 名前:デフォルトの名無しさん mailto:sage [2010/06/30(水) 09:49:58 ]
>>153
今のをそのまま規格化したとしたら?

155 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 12:03:20 ]
UTF16の1文字で表した年号って今後の年号のために
4つくらい予備をとってあるんだね。
とはいえ、これ残してると後々困ることが起きそうだねー。
結構使われてたりするんだろうか。

156 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 12:06:34 ]
予備はもう全部使いきったんじゃなかったっけ。



157 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 13:56:04 ]
UTF16の、って意味わかんないんだが。
エンコーディングを指定する意味は?

158 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 18:25:49 ]

こーゆー文字を書くためのコードはどこに載ってるの?

159 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 18:59:06 ]
ttp://www.unicode.org/

160 名前:むぎゅう [2010/07/02(金) 19:11:12 ]
>>157
細けーこたー(略

>>158
www.unicode.org/Public/5.2.0/charts/CodeCharts-noHan.pdf
10進16進の変換は自分でやれ。

161 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 21:04:21 ]
pdf・・・

162 名前:デフォルトの名無しさん mailto:sage [2010/07/02(金) 21:27:00 ]
utf・・・

163 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 04:13:53 ]
なんで2chはシフトジスなのに改行はラインフィードのみなの?



164 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 08:01:55 ]
こっちはUnicodeスレかと思ったらそうでもないのね。

165 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 10:06:08 ]
>>163
sjis使ってることと改行コードは関係ないよ。2chのサーバがUnixだからだろうけど。

166 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 14:59:38 ]
改行コード1バイトにするだけで10%近く圧縮されるからな

167 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 16:15:17 ]
それで、SJISとUTF-8の圧縮率の話に戻って・・・

168 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 16:52:56 ]
1バイトが0~255の範囲を満遍なく使ってるかどうかで言うと
SJISよりもUTF-8の方が使用効率が良いので
単純に3/2という訳にもいかんのよ

169 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 19:50:25 ]
だってシフトジスはウィンドウスが創作したわけだからCrLfだろJk

170 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 19:53:30 ]
あらあら小学生の来るところじゃありませんよw

171 名前:やんやん ◆yanyan72E. mailto:sage [2010/07/05(月) 20:04:09 ]
CP/Mが起源じゃないの?

172 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 20:28:25 ]
プリンタとかではCRとLFが別々に必要だからな

173 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 21:18:23 ]
>>164
文字コードと改行コードの話はキチガイ信者が集まるものだよ。
ネットニュースのうさげの時代からずっと。
そんな人達の隔離スレがここゆっくりしていってね



174 名前:デフォルトの名無しさん mailto:sage [2010/07/05(月) 21:34:57 ]
>>173
これまた懐かしい話を。
じゃぁ半角カナもここ?

175 名前:デフォルトの名無しさん mailto:sage [2010/07/06(火) 00:20:04 ]
>>168
満遍なく使うことだけじゃ、効率のよさの証明にはならない。

例えば次のようにしたら、ASCIIコードから、効率は悪いが範囲を満遍なく使う文字コードへの変換ができる。
00 -> 00 01 02 03 ... FF
01 -> 01 00 02 03 ... FF
...
FF -> FF 00 01 02 ... FE

176 名前:デフォルトの名無しさん mailto:sage [2010/07/08(木) 13:06:30 ]
>>174
半角ってなんですか?

177 名前:やんやん ◆yanyan72E. mailto:sage [2010/07/08(木) 13:48:06 ]
文字化けしてますよ。

178 名前:デフォルトの名無しさん mailto:sage [2010/07/08(木) 23:58:14 ]
>>176
45°


179 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/10(土) 22:47:35 ]
>>176
JIS X 0201片仮名用図形文字集合のことだ氏ねバーカ日下部もどきが。

180 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/10(土) 22:53:16 ]
そういうことにしたいのですね:)

181 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 09:19:04 ]
はつみみです

182 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 12:28:18 ]
4倍角ってなんすか

183 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 15:02:27 ]
昔むかしガラパゴス島にワープロ専用機という珍種がおっての。



184 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 16:17:41 ]
倍角   ネ申

4倍角   イ立  々
       |口  門

185 名前:名無しさん@そうだ選挙に行こう mailto:sage [2010/07/11(日) 18:44:42 ]
>183

ttp://ja.wikipedia.org/wiki/%E3%83%AF%E3%83%BC%E3%83%89%E3%83%97%E3%83%AD%E3%82%BB%E3%83%83%E3%82%B5
世界初のワードプロセッサは、1964年のIBM MT/STで、
その後もワング・ラボラトリーズ社などからいくつか
英文ワープロ専用機が登場した。

186 名前:デフォルトの名無しさん mailto:sage [2010/07/12(月) 18:32:32 ]
pc12.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part6
建てるの忘れてた。スマソ

187 名前:デフォルトの名無しさん mailto:sage [2010/07/14(水) 22:55:43 ]
ここは隔離スレだったのか。
void的にUnicodeの『Halfwidth』はどうなんだろ。あとPC9821に「2バイト半角カナ」とかあったよなぁ

188 名前:デフォルトの名無しさん mailto:sage [2010/07/15(木) 10:36:50 ]
ヘミ猫はmixiに生息しているのですか?

189 名前:デフォルトの名無しさん mailto:sage [2010/07/15(木) 23:35:42 ]
voidなら最近はtwitterだね。

190 名前:デフォルトの名無しさん mailto:sage [2010/07/16(金) 01:15:54 ]
>>189
はつみみです

191 名前:デフォルトの名無しさん [2010/07/17(土) 08:35:42 ]
くそかべととりまきチネ

192 名前:デフォルトの名無しさん mailto:sage [2010/07/17(土) 09:33:01 ]
ascii-netの時代からそうだけど、取り巻き認定ほど無意味なものはないのに未だに気付けない連中が沸くんだな。

193 名前:デフォルトの名無しさん mailto:sage [2010/07/17(土) 09:50:49 ]
怒ってた猫が急に話しかけて来たけど、ヘミ猫語だからわからない
www.nicovideo.jp/watch/sm11126185



194 名前:デフォルトの名無しさん mailto:sage [2010/07/17(土) 10:44:28 ]
mixiで暴れてたと思ったら
今はtwitterでも暴れてんのかw
常に時代の最先端を行く奴だな

195 名前:デフォルトの名無しさん mailto:sage [2010/07/17(土) 13:28:12 ]
voidはUnicodeという時代の流れについてゆけず、単なるアラシと化しました

196 名前:デフォルトの名無しさん mailto:sage [2010/07/17(土) 16:31:58 ]
>>187
groups.google.com/group/fj.kanji/browse_thread/thread/ffb260159ecd663e


197 名前:デフォルトの名無しさん mailto:sage [2010/07/20(火) 08:42:28 ]
>>192
Unicode時代になっても、あいかわらず馬鹿のやることはワンパターンだよな

198 名前:デフォルトの名無しさん mailto:sage [2010/07/20(火) 09:35:19 ]
個人スレが立っている。秀丸に対するありがたいお言葉が。

199 名前:デフォルトの名無しさん mailto:sage [2010/07/22(木) 20:30:43 ]
キャラクターってなに?

200 名前:デフォルトの名無しさん mailto:sage [2010/07/22(木) 23:09:35 ]
>>199
www.unicode.org/versions/Unicode5.2.0/ch02.pdf
2.2 Characters, Not Glyphs

201 名前:デフォルトの名無しさん mailto:sage [2010/07/22(木) 23:49:42 ]
>>199
「ATOKを入れてませんか? 」とかアンサイクロに書いてある。






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<50KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef