[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 2chのread.cgiへ]
Update time : 05/09 13:54 / Filesize : 116 KB / Number-of Response : 591
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

UnicodeとUTF-8の違いは?



1 名前:デフォルトの名無しさん mailto:sage [2007/04/30(月) 20:02:37 ]
ビッグインディアンとかなんとかかんとか

175 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 14:16:28 ]


176 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 14:29:07 ]
UTF-8

UTF8

どっちが正しい?

177 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 16:40:25 ]
前者

178 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 19:01:44 ]
どっちも正しい

179 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 19:18:30 ]
>>174
JISじゃなくてJSAだろ。

180 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 19:42:29 ]
>>176
MIME charset名としては前者

181 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 19:49:39 ]
ISO/IEC 10646の表記も、Unicode Bookの表記も前者。

182 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 05:55:00 ]
>>177-181
沢山回答頂きありがとうございます
MySQLを使っていてデフォルトを
Latin1からUTF8に変えたんですが
こいつはUTF-8じゃなくてUTF8と
書かないといけないみたいで
なんで2種類あるのかなぁと


183 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 07:43:53 ]
ハイフンはトークンの区切りになるからでしょ。



184 名前:デフォルトの名無しさん mailto:sage [2007/05/29(火) 20:09:42 ]
シフトジスは shift-jis
だけど
ジスは iso-2022-jp

こういったので迷うのは俺だけ?

185 名前:デフォルトの名無しさん mailto:sage [2007/05/29(火) 20:29:25 ]
>>184
kwsk

186 名前:デフォルトの名無しさん mailto:sage [2007/05/29(火) 20:47:39 ]
e-words.jp/w/Shift20JISE382B3E383BCE38389.html
e-words.jp/w/ISO-2022-JP.html

.NETのエンコードの話なんだけど、ジスコードの規格っていろいろあって、
iso-2022-jp 日本語 (JIS)
csISO2022JP 日本語 (JIS 1 バイト カタカナ可)
iso-2022-jp 日本語 (JIS 1 バイト カタカナ可 - SO/SI)
迷うよな

187 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 00:17:09 ]
いわゆるシフトJISだってShift_JIS, Shift_JIS-2004, CP932 (Windows-31J)と種類豊富
大体CP932以外使わないけどな

188 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 00:20:07 ]
WEBとかエンコードの柵が強いからいやだなぁ・・・
もう慣れたけど、うっかりで文字が化けたりする敏感なの何とかしてほしいな

189 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 00:33:06 ]
Unicode以外使ったら罰金。

190 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 00:38:27 ]
>>189
じゃぁ、まずシフトJISで書き込みを行った >>189 が率先して
UNICODEコンソーシアムに罰金を払ってください。

191 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 02:45:57 ]
俺専用コード

ロリコードとかだめっすか?

192 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 03:11:59 ]
>>191
ぷにコード(実在する)でも使ってなさい


193 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 07:31:56 ]
その括弧がきは馬鹿っぽく見える



194 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 07:40:08 ]
そういう演出は必要さ。 首相の「ザンキにたえない」発言と同じ。

195 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 08:41:11 ]
「ザンキにたえない」ってどういう意味なん?

196 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 08:46:01 ]
www.asahi.com/politics/update/0528/TKY200705280458.html
>首相周辺は「こういう結果に至ったことへの自らの責任を、この言葉に込めた」と解説する。


197 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 10:29:13 ]
スクリューパイルドライバーの吸い込みを防げないことだろう

198 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 13:14:37 ]
文字コードが乱用されているのはプログラマーとしてはやりづらい。
いっそのことすべてUnicodeにしてくれれば手間が省けるのにorz

199 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 14:45:29 ]
Unicode自体が何種類もある事態

200 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 15:55:44 ]
すべてUnicodeにしようってのは
そばの出前も会社の通勤も全てトラックを使おう
ってのと同じくらいナンセンス

201 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 16:18:43 ]
そのUnicodeだって、結合文字列・合成済み文字とか、文字列の向きとか
UTF-16のサロゲートペアとか、考え込むネタは尽きないわけで

202 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 18:09:49 ]
字体の扱いもおかしい
利用は辞退させて頂く


203 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 18:34:53 ]
審議中(AA略



204 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 07:56:46 ]
16bitじゃ絶対無理って最初からわかってたのに、
16bitに無理やり収めようなんて考えて自爆した欧米人は馬鹿すぎ

205 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 09:59:32 ]
8bitで十分だったから16bitにするだけでもビビってたのさ

206 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 11:37:56 ]
かれこれ20年になるのか


207 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 13:38:31 ]
アメリカに限れば、7bitででも足りてたんだよね?

208 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 14:06:20 ]
5bitでも足りるわな
ttp://www.trans-usa.com/mike/BaudCode.htm


209 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 14:58:18 ]
PCのインターフェースもパラレルからシリアルになってきたし、
文字コードも可変長なシリアルに変更しようぜ

210 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 16:59:59 ]
それとこれとは訳が違う。
しかも例えが逆だろう。

211 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 17:23:43 ]
>>209
つUTF-8

212 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 20:31:39 ]
>>201
Unicode「と」他のあらゆるコードを全部相手にするよりはマシ

213 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 00:11:51 ]
>>192
残念ながらPunycodeはピュニコードと音訳するのが近い。




214 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 05:31:51 ]
うにこーど
ゆにこーど

どっちが正しいですか?


215 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 06:57:40 ]
うにっくすとおなじくうにこーどがただしいですよ。

216 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 09:39:31 ]
ttp://www.uny.co.jp/
ここも「ウニー」だしな

217 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 09:40:30 ]
日本ウニシス

218 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 08:50:03 ]
ウではじまるとウインドーズみたいで嫌だな

219 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 08:54:13 ]
シャーペンの替え芯売ってるあのメーカってウニと読むのか

220 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 10:19:14 ]
いいえ、三菱鉛筆です。

221 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 12:07:44 ]
ウマ・サーマン?
ユマ・サーマン?

222 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 12:11:32 ]
ウマ・サーマン!

223 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 12:26:54 ]
Unimog
ja.wikipedia.org/wiki/%E3%82%A6%E3%83%8B%E3%83%A2%E3%82%B0



224 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:37:17 ]
ウナイテッド・ステイツ・オブ・アメリカ

225 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:45:19 ]
知り合いのヌーヨーカー(w)は「ヤイェヨ」は変わらないけど「ユ」は「ウ」になるって言ってた。

226 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 20:24:27 ]
Nuyork ?

227 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 21:31:38 ]
ewの発音は、元来「ユー」なんだけど、「ウー」に化けているのでnewが「ヌー」になる。

228 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 21:39:16 ]
4へぇ〜

229 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 22:47:15 ]
最初 knew を /nu:/ と発音されたときはさっぱり理解できんかったなあ。

230 名前:デフォルトの名無しさん mailto:sage [2007/06/08(金) 10:40:47 ]
TRONコードに統一しようぜ

231 名前:デフォルトの名無しさん mailto:sage [2007/06/09(土) 02:54:12 ]
TRONコードは(少なくとも現在の実装は)日本のことしか考えてません

232 名前:デフォルトの名無しさん mailto:sage [2007/06/09(土) 16:03:04 ]
>>230
pc11.2ch.net/test/read.cgi/os/1028526865/7-13

233 名前:デフォルトの名無しさん mailto:sage [2007/06/09(土) 22:50:28 ]
TRONコードに収録されてる文字のグリフはTRON文字収録センターで公開されてるけど
同定のための情報は提供されてないな。それは超漢字という製品に付けて売ってるから
公開できないだろうし



234 名前:デフォルトの名無しさん mailto:sage [2007/06/11(月) 19:41:57 ]
エスペラントでOK

235 名前:デフォルトの名無しさん mailto:sage [2007/06/12(火) 09:50:19 ]
Mi estas tre ĝoja konatiĝi kun vi.

236 名前:デフォルトの名無しさん mailto:sage [2007/06/12(火) 23:33:50 ]
>>235
これエスペラントなの?
最初スペイン語かと思った。

237 名前:デフォルトの名無しさん mailto:sage [2007/06/12(火) 23:37:08 ]
Mi estasでI amなのは覚えてる。
この辺の語彙はラテン語系から採用してるんだよな。



238 名前:デフォルトの名無しさん mailto:sage [2007/06/12(火) 23:40:10 ]
あ、やっぱりそうなんだ。

239 名前:デフォルトの名無しさん mailto:sage [2007/06/13(水) 00:05:44 ]
だから印欧語族の連中には割と覚えやすいんだよ
日本語とか圧倒的に不利
ある意味Unicodeと一緒だな

240 名前:デフォルトの名無しさん mailto:sage [2007/06/13(水) 00:07:46 ]
利用者が単語登録してもいいところとかね。

241 名前:デフォルトの名無しさん mailto:sage [2007/06/13(水) 06:27:32 ]
ところでかんじんのUnicodeとUTF-8の違いがまだ
のべられてないよね

242 名前:デフォルトの名無しさん mailto:sage [2007/06/13(水) 09:58:11 ]
それは1桁で終わったんじゃないのか

243 名前:デフォルトの名無しさん mailto:sage [2007/06/14(木) 17:39:54 ]
インディアン嘘ツカナイ



244 名前:デフォルトの名無しさん [2007/10/05(金) 16:28:22 ]
馬鹿を見ることになるぞ

245 名前:デフォルトの名無しさん mailto:sage [2007/10/06(土) 00:23:04 ]
約四ヶ月ぶりのレスがそんなでは、目が点になっちゃうだろ。 もうすこしなんかかけ。

246 名前:デフォルトの名無しさん mailto:sage [2007/10/06(土) 04:33:30 ]
けっきょくいまだにスレタイトルの疑問をだれもがなtっとくできるほどうまく解説した人があらわれない

247 名前:デフォルトの名無しさん mailto:sage [2007/10/06(土) 11:19:13 ]
>>246
>8で充分だろ。Unicodeの符号化方式の一つがUTF-8。

248 名前:デフォルトの名無しさん mailto:sage [2007/10/08(月) 01:28:21 ]
Unicode: 人々
UTF-8: 名前一覧

249 名前:デフォルトの名無しさん mailto:sage [2007/10/09(火) 18:44:37 ]
>>247
いや、Unicodeは単なる文字集合(レパートリ)ではなく、
あくまでも符号化文字集合だろ。

250 名前:デフォルトの名無しさん mailto:sage [2007/10/09(火) 19:20:19 ]
Coded Character Set: Unicode
Character Encoding Form: UTF-8, UTF-16, UTF-32
Character Encoding Scheme:
UTF-8, UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE, UTF-32LE

251 名前:デフォルトの名無しさん mailto:sage [2007/11/12(月) 04:35:06 ]
どうして
UNICODE って UNI - CODE なはずなのに
何種類もあるのはなぜ?


252 名前:デフォルトの名無しさん mailto:sage [2007/11/12(月) 10:19:13 ]
>>251
どうして>251の日本語がおかしいのはなぜ?

253 名前:デフォルトの名無しさん mailto:sage [2007/11/13(火) 08:37:12 ]
雲丹には糞という意味もあるんだぜ



254 名前:デフォルトの名無しさん mailto:sage [2007/11/13(火) 15:09:13 ]
バージョン違いを除けば、文字集合は常に唯一。
符号化の方法が色々あるだけ。

255 名前:デフォルトの名無しさん mailto:sage [2007/11/13(火) 20:32:27 ]
ハングル……いやなんでもない

256 名前:デフォルトの名無しさん mailto:sage [2007/11/13(火) 21:11:28 ]
UCS-2 ?

257 名前:デフォルトの名無しさん mailto:sage [2007/11/16(金) 02:58:10 ]
UNICODE

UNCODEI

258 名前:デフォルトの名無しさん mailto:sage [2007/12/17(月) 18:06:40 ]
hjfjgfjgj




ktykytk




hjkghkkg




j,jhjhklkgh




urtutrtu



jjkfjfg






259 名前:デフォルトの名無しさん mailto:sage [2008/02/04(月) 14:32:42 ]
unicodeとutf-8の違いは
50音と平仮名の違いと一緒だろ

260 名前:デフォルトの名無しさん mailto:sage [2008/02/04(月) 15:59:19 ]
utf-16が片仮名?

261 名前:デフォルトの名無しさん mailto:sage [2008/02/04(月) 16:08:46 ]
片仮名でもローマ字でもなんでもいいよ
一つ一つマッピングする意味は無いと思うが

262 名前:デフォルトの名無しさん mailto:sage [2008/02/05(火) 23:56:09 ]
いや一緒とは思えないから

263 名前:デフォルトの名無しさん mailto:sage [2008/02/06(水) 08:04:57 ]
50音は平仮名でも片仮名でもないだろ。
読み方を定義したのが50音で、それに割り当てるのが平仮名であったり
片仮名なんだから。




264 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 01:43:44 ]
世界中の文字を表わせる Unicodeってのを定義しました。

じゃあそれを2オクテットで表現しよう→UCS-2

でも他の文字コードと互換性ないしいちいち全部に2オクテット使うのは不便だから
よく使う文字を1オクテットに対応させて使わないのは2,3,4オクテットに分けて符号化しよう。
これでASCIIコードと互換性できたしよく使う文字は少ないオクテットで表現できる。→UTF-8

でもUnicodeって2オクテットじゃ表現しきれなくなってます。
じゃあ4オクテット(実際は31ビット)使おう。→UCS-4

4オクテットじゃ長すぎるからよく使う文字を以下略で分けて16ビット符号化しよう。
UCS-2の範囲はそのまま表わそう、不足しているUCS-4の部分はあんまり使わないし符号2つを組み合わせて32ビットで表わそう。
内部がややこしくなったけどUnicode全部表現できるからいいよね。→UTF-16

っていう感じの認識しかないな俺は。

265 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 02:55:54 ]
どっちかというとこんな感じ。

32ビット化してUCS-4/UTF-32作った。
けど、今までのUCS-2なシステムどうしよう?
じゃあマルチバイトっぽいことしよう→UTF-16

266 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 05:12:00 ]
16ビットで世界の文字を網羅出来るなんてマジで思っていたのかね

267 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 12:30:06 ]
10年も昔の環境じゃできるだけリソース消費を抑えたいってのはわかるし
3オクテットじゃ扱いにくいし4じゃ多すぎるしで話がまとまらなかったんだろうな。

268 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 21:05:02 ]
単純に中国で既にコード化されてる分で漢字の量はOKとか考えてたんじゃないか


269 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 21:49:38 ]
そもそもそのやり方じゃ足りねえと文句付けたのは中国

270 名前:デフォルトの名無しさん mailto:sage [2008/02/07(木) 23:28:49 ]
増やす気まんまんだったわけだな

271 名前:デフォルトの名無しさん [2008/02/12(火) 06:48:24 ]
UCS-2とUTF-16の違いがわからない

272 名前:デフォルトの名無しさん mailto:sage [2008/02/12(火) 08:14:34 ]
サロゲートペアでの拡張があるのがUTF-16、それがなくて16ビットだけなのがUCS-2


273 名前:デフォルトの名無しさん mailto:sage [2008/02/12(火) 10:54:25 ]
WindowsXPのメモ帳で保存しようとすると
アンジーがデフォルトになってるんだけどシフトジスってのがみあたらないんだが。でも日本語ドキュメントがうまく保存される。
つまり、
アンジー = シフトジス
だと思う。



274 名前:デフォルトの名無しさん mailto:sage [2008/02/12(火) 17:08:33 ]
メモ帳の選択肢のANSIというのは、
現在使用中の言語のANSIコードページの文字コードということ。
日本語の場合、それはコードページ932、つまりMicrosoftのShift_JIS。

言語の設定を変えれば、当然ANSIで保存するときの文字コードも変化する。

275 名前:デフォルトの名無しさん mailto:sage [2008/02/12(火) 17:30:56 ]
>>274 そういう意味だったのか !






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<116KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef