- 1 名前:デフォルトの名無しさん mailto:sage [2012/11/30(金) 13:16:02.46 .net]
- プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、 合成文字、ソート、TRON、外字コード、その他について語り合いましょう。 各言語での文字列の扱いについての質問もOKです。 基本マッターリ、ささ、茶でもどうぞ。 ■過去スレ 文字コード総合スレ part1 pc11.2ch.net/test/read.cgi/tech/1031028205/ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 pc11.2ch.net/test/read.cgi/tech/1180250376/ 文字コード総合スレ part4 pc11.2ch.net/test/read.cgi/tech/1228052369/ (スレ再利用)UnicodeとUTF-8の違いは? pc12.2ch.net/test/read.cgi/tech/1177930957/ (隔離スレ)UnicodeとUTF-8の違いは? その2 pc12.2ch.net/test/read.cgi/tech/1274937437/ 文字コード総合スレ part5 pc12.2ch.net/test/read.cgi/tech/1236529563/ 文字コード総合スレ part6 hibari.2ch.net/test/read.cgi/tech/1278923059/ 文字コード総合スレ part7 toro.2ch.net/test/read.cgi/tech/1306595564/
- 252 名前:デフォルトの名無しさん mailto:sage [2013/05/10(金) 02:10:52.50 .net]
- Open2chの文字コードは、UTF-8だ
<html lang="ja"> <head> <title>宝くじ@open2ch掲示板</title><style>body{ margin:0; padding:0;}</style> <link rel="alternate" type="application/rss+xml" title="RSS" href="http://engawa.open2ch.net/loto/index.rdf" /> <link rel="alternate" type="application/atom+xml" title="Atom" href="http://engawa.open2ch.net/loto/atom.xml" /> <script type="text/javascript" src="/lib/jquery/jquery-1.7.2.min.js"></script> <script type="text/javascript" src="/lib/common.js?v2"></script> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <link href="/lib/main.css?x" type="text/css" rel="stylesheet" /> </head><body text=#000000 link=#0000FF alink=#FF0000 vlink=#660099 background=/image/ba.gif>
- 253 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 00:29:20.32 .net]
- Old Hungarianは泥沼だな…
- 254 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 15:25:57.78 .net]
- よく知らない人でもわかるように簡単な解説希望
- 255 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 23:40:04.51 .net]
- Eversonが昔出した提案を前進させようとしたらハンガリー国内よりカウンター提案が
出てきた そっちは稚拙だったのでEversonペースで進みかけたけど、カウンター提案者が ハンガリーNBの座を獲得したので意向を無視できなくなった 以後ハンガリー国内で支持が割れて、この度ハンガリー国内から「今のEversonベースの 符号化案のまま行ってくれ」という署名リスト(N4420)と、「今の符号化案を投票から 外せ」という署名リスト(N4422)が届いた
- 256 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 23:53:19.67 .net]
- おっおおう…頭抱えたくなる状況だな
- 257 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 12:17:49.20 .net]
- なんか難しい話だな。
n4368(Everson)とn4367の戦いってことみたいだけど、 一例にdzの話を読むと、(梯子zの横に棒がついた文字) これはもともとold hungerianになかった音/文字で、 n4368は現代では使わないから必要ないって立場(n4368 1.2) n4367はこれは単なるd+zじゃないんだよ(n4367 5.4.1) 読み込めてないけど、 n4368は現代ハンガリー語に対応する正書法の提案も含まれていて、 n4367は歴史的な経緯を踏まえた提案になっている感じか。 たぶんold hungerianを、現代に復活させようとしている派(n4368)と、 歴史的な文字として登録しようとしている派(n4367)の戦いじゃないか。 n4420の"everyday use"とか、n4368 1.2の後半読むと。 学校でold hungerianを使わせる計画があるみたいだ。
- 258 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 13:54:42.87 .net]
- こういうのっていろんな分野で政治行政と歩調を合わせないといけないからほんと難しいよね。
単に自分(規格がらみ)が各方面と一対一で調整するだけじゃなくて、そいつら同士の橋渡しまで面倒見ないと何もまとまらないし。
- 259 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 17:37:20.80 .net]
- 254です。
2,3時間読んでみただけで言うのも無責任だけど、 n4367の方がよさそうな気がするなあ。 Everson版は目的を限定しすぎてて、文字数も相当少ない。 かと言って合字が定義されてるわけでもない。 最初に網羅的にやっとかないと後で公開することになるはず。 あと、n4422によれば間違いも多いと書かれている。 実際どうか検証する知識はないけど、 n4367の方が引用している資料も多いし、一文字に対する検証も徹底的。 Eversonさんは膨大なスクリプトについてUnicodeに多大な貢献があるのは事実だけど、 専門家の意見も謙虚に聴くべきではないか? まあUnicode専門家の意見も尊重しないといけないがね。
- 260 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 22:34:08.76 .net]
- >最初に網羅的にやっとかないと
日本人が言うとすごい説得力あるよねこれ
- 261 名前:デフォルトの名無しさん mailto:sage [2013/05/24(金) 01:09:40.80 ID:JuHX2I0P!.net]
- Character encoding poetry
ttps://www.facebook.com/cmb/posts/619241744770551
- 262 名前:デフォルトの名無しさん mailto:sage [2013/05/24(金) 11:45:41.18 .net]
- >>252は勘違いで、Everson案がUnicode的稚拙さで、
専門家が本格的な改正案を出してきたってところみたいだな。
- 263 名前:デフォルトの名無しさん mailto:sage [2013/06/01(土) 11:09:43.05 .net]
- そういうものなのかね
- 264 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 03:10:36.60 .net]
- 過疎ってるな
- 265 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 06:46:38.91 .net]
- ねたが無いからね
- 266 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 15:04:34.93 .net]
- 坂村健みたいな逸材が必要とされている
- 267 名前:デフォルトの名無しさん mailto:sage [2013/06/27(木) 16:58:52.16 .net]
- d.hatena.ne.jp/akane_neko/20130621/1371766405
これ読む限りだと安岡センセイもネタ切れなのかと
- 268 名前:デフォルトの名無しさん mailto:sage [2013/06/29(土) 23:43:50.69 .net]
- 安岡は基地外だから もう引退した方がいい
- 269 名前:デフォルトの名無しさん mailto:sage [2013/06/30(日) 02:05:47.38 .net]
- 最近のWG2の文書の中だとcedillaと下付commaの件が面白いな
結局下付commaの方は別途符号化することになったようだけど
- 270 名前:デフォルトの名無しさん mailto:sage [2013/06/30(日) 13:12:55.51 .net]
- >>263 >>265 まだ基地外TRON信者いたんだ
- 271 名前:デフォルトの名無しさん mailto:sage [2013/07/02(
]
- [ここ壊れてます]
- 272 名前:火) NY:AN:NY.AN .net mailto: さて []
- [ここ壊れてます]
- 273 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
- 来週の
- 274 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
- キテレツ大百科は
- 275 名前:デフォルトの名無しさん mailto:sage [2013/07/02(火) NY:AN:NY.AN .net]
- ツレテキ
- 276 名前:デフォルトの名無しさん mailto:sage [2013/07/10(水) NY:AN:NY.AN .net]
- スレが凍りついているわけだが
- 277 名前:デフォルトの名無しさん mailto:sage [2013/07/10(水) NY:AN:NY.AN .net]
- unicodeの歴史について勉強しようと思ったら初めからいきなり2バイト固定にしようとしていてズっこけた。
当時日本人はだれも突っ込まなかったんだろうか あるいは当時のマシンスペックとの妥協とか政治的な何かとか理由があった?
- 278 名前:デフォルトの名無しさん [2013/07/11(木) NY:AN:NY.AN .net]
- いろんな人が突っ込んでたよ
- 279 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
- スペックもあるだろうけどメモリが高価で容量も小さかったせいじゃないかな
当初は日常で使う字だけを符号化して特殊な字や古代の字はPUAを使わせるつもりだったとか 過去スレでそんな話題してるところがあったはず
- 280 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
- そもそもUnicodeが使われる日が来るなんてみんな本気で信じて無かった
- 281 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
- 漢字ROMと文字一覧表(本?)でおk
- 282 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
- ちょっと(かなり?)スレ違いなんだけど、
発音記号もそのうちIPA(国際音声記号)に統一されるのかしら。
- 283 名前:デフォルトの名無しさん mailto:sage [2013/07/11(木) NY:AN:NY.AN .net]
- 汎用のものとしてはIPAを改正していくのが正攻法でしょう。
2005年にも唇歯はじき音が追加。
- 284 名前:デフォルトの名無しさん mailto:sage [2013/07/12(金) NY:AN:NY.AN .net]
- 代用になるようなものもないからねえ…
- 285 名前:デフォルトの名無しさん mailto:sage [2013/07/13(土) NY:AN:NY.AN .net]
- その場しのぎの積み重ねでこんがらがった醜さはUnicodeよりも先輩だな
- 286 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
- 古文書がIPAで表されるのを想像……できん
- 287 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
- 想像してもいいんだぜ?
- 288 名前:デフォルトの名無しさん mailto:sage [2013/07/27(土) NY:AN:NY.AN .net]
- a%20%20%20a
- 289 名前:デフォルトの名無しさん mailto:sage [2013/07/28(日) NY:AN:NY.AN .net]
- (´・ω・`)?
- 290 名前:デフォルトの名無しさん mailto:sage [2013/08/01(木) NY:AN:NY.AN .net]
- ここ数ヶ月は話題なしか
- 291 名前:デフォルトの名無しさん [2013/08/14(水) NY:AN:NY.AN .net]
- www.itscj.ipsj.or.jp/domestic/sc02/hanyo-denshi/20100331/
最終更新日:2013年7月26日 情報規格調査会Webサイトの改ざんについて 6月17日(月)、情報規格調査会のサイト(www.itscj.ipsj.or.jp)が不 正と思われるアクセスを受け改ざんされたことを確認いたしましたので、直ち に当該サイトを停止いたしました。 その後の調査で当該サイトに不正な javascript が埋め込まれていることを確 認いたしました。 6月15日(土)箸キ6月17日(月)に当該サイトを閲覧された方は、直ちに最新のウイ ルス対策ソフトで感染の確認と駆除を実施いただきますよう、重ねてお願いい たします。 現在、セキュリティ専門会社に詳細な分析を依頼しており、閲覧された皆様に 新たな対策が必要となりましたとき、或いは、追加情報が得られた場合には、 改めて情報規格調査会ホームページにてご案内いたします。 当該サイトを閲覧された方、また、関係者の方々にはに多大なご迷惑をおかけ しましたことを深くお詫び申し上げます。不正アクセスへの対策を講じた後、 安全性を確認した上で再開の予定ですので、今しばらくお待ち頂きますようお 願いいたします。 情報規格調査会 委員長 伊藤 智
- 292 名前:デフォルトの名無しさん mailto:sage [2013/08/14(水) NY:AN:NY.AN .net]
- ちょっと笑った
- 293 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
- 紺屋の白袴
- 294 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
- 違うか、医者の不養生かな
- 295 名前:デフォルトの名無しさん [2013/08/20(火) NY:AN:NY.AN .net]
- おまわりさんが痴漢
- 296 名前:デフォルトの名無しさん mailto:sage [2013/08/20(火) NY:AN:NY.AN .net]
- そうか、そっちか
- 297 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 02:40:49.67 .net]
- さて
- 298 名前: 【大吉】 mailto:sage [2013/09/01(日) 13:43:28.79 .net]
- 9月になりましたが
- 299 名前:デフォルトの名無しさん [2013/09/01(日) 13:50:07.64 .net]
- 2ちゃん落ちるのって今日だっけ?
- 300 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 15:40:01.66 .net]
- うそなんでしょう?
- 301 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 17:59:04.17 .net]
- よく見ろ 3ちゃんねるに変わってるだろ
- 302 名前:デフォルトの名無しさん mailto:sage [2013/09/01(日) 18:34:41.38 .net]
- _, ._
(; ゚ _゚ ) …
- 303 名前:デフォルトの名無しさん mailto:sage [2013/09/02(月) 03:09:55.31 .net]
- >>297
めったなことを言うんじゃありません。 頑張って見る>>298のような素直な人もいるんだから。 って、勝手に文字コードの数字がズレたら嫌だな。 通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
- 304 名前:デフォルトの名無しさん mailto:sage [2013/09/08(日) 21:02:59.58 .net]
- >通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
EBCDICディスってるのか
- 305 名前:デフォルトの名無しさん mailto:sage [2013/09/08(日) 21:31:07.18 .net]
- ディスられて当然のゴミコードがどうかした?
- 306 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 00:08:59.56 .net]
- UNICODEも添字系が無茶苦茶
- 307 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 11:58:12.44 .net]
- 添字系?
- 308 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 18:23:36.13 .net]
- 字は添えるだけ。
- 309 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 20:26:20.42 .net]
- Superscripts and Subscripts
- 310 名前:デフォルトの名無しさん mailto:sage [2013/09/09(月) 21:20:07.96 .net]
- www.unicode.org/charts/PDF/U2070.pdf
これか。なるほどこれひどい
- 311 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 18:37:08.00 .net]
- 小さすぎて読めない
- 312 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 20:39:14.29 .net]
- なんでiが1の位置にあるんだろう?
「数字の1を意味する上付き文字」を全部統合するつもりだった?
- 313 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 21:22:03.40 .net]
- SuperScript 1〜3は別の場所にある。
2: U+00B2 3: U+00B3 1: U+00B9
- 314 名前:デフォルトの名無しさん mailto:sage [2013/09/10(火) 21:25:05.86 .net]
- oh....
- 315 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 04:58:45.13 .net]
- >>307ちゃんとダウンロードして拡大して見ろ>私 ゴメン
- 316 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 09:54:06.83 .net]
- まあ、前後とか上中下とか甲乙丙丁とかI II III IV V VI VII VIII IX Xとか、
特定の用法においてナンバリングに使われる文字も位置はばらばらで、 こういうのを名前に含むファイルをソートするとうわあああってなるから 実用上は似たようなもんかもしれん
- 317 名前:デフォルトの名無しさん mailto:sage [2013/09/11(水) 10:22:47.43 .net]
- 確かに前後はいつも逆になって鬱陶しい
- 318 名前:デフォルトの名無しさん mailto:sage [2013/09/12(木) 22:36:56.49 .net]
- 一九五三四七十二八六
結構イラッとくる
- 319 名前:デフォルトの名無しさん mailto:sage [2013/09/12(木) 22:54:00.51 .net]
- WikipediaのCollationのページに対応する日本語ページってないんだね
- 320 名前:デフォルトの名無しさん [2013/09/13(金) 04:14:55.98 .net]
- 欲しければ作れば?
- 321 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 07:42:40.82 .net]
- >>314
これぐらいは順番に並べて欲しいわなあ
- 322 名前:デフォルトの名無しさん [2013/09/16(月) 11:45:02.26 .net]
- >>314 >>317
だれが決めたん? センスないね
- 323 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 12:18:33.64 .net]
- あほかい。
漢字の読みの順に並んでいるんだから、寧ろ「一二三四五六七八九」の方がいらっと来るわ。
- 324 名前:デフォルトの名無しさん [2013/09/16(月) 12:23:33.36 .net]
- えぇっ!?
- 325 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:04:28.81 .net]
- >>319
確かに
- 326 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:29:36.80 .net]
- 読み順で並んでるメリットって何?
- 327 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 13:46:41.82 .net]
- 読み順以外を選ぶメリットって何?
- 328 名前:デフォルトの名無しさん mailto:sage [2013/09/16(月) 14:16:25.26 .net]
- 読み順というか文字コード順でソートしているからこうなるので、
漢数字がいい感じで並ぶ順を定義して実装して使えばいい
- 329 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 01:24:13.67 .net]
- メリットって…
他のところが音読み順なのにそこだけ変えるほうがおかしいだろ というか>>314 >>317 >>322あたりはもしかしてこの十文字が連続して並んでるとか思ってるんじゃないだろうな
- 330 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:23:12.95 .net]
- CJK Numeralsとかの別枠にしてほしかったってことでしょ
- 331 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:32:41.19 .net]
- 訓呉音漢音の優先順位あやふやにローマ字で並べてある
ような始末におえん状況よりはマシでしょ
- 332 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 02:38:15.05 .net]
- Unicodeの漢字って日本読み順なの?
- 333 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 03:24:48.54 .net]
- 読み順を選べば読み順、画数順を選べば画数順、なんじゃないの?
- 334 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 03:57:19.63 .net]
- (´‥∀‥`)?
- 335 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 05:26:00.76 .net]
- >>329は見なかったことにしといて
- 336 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 14:11:11.79 .net]
- (´・‥∀・‥`)?
- 337 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 17:35:55.62 .net]
- >>314 はJIS順なのかな
Unicode順なら 一七三九二五八六十四
- 338 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 18:49:54.69 .net]
- 漢数字を文字コードだけで機械的にソートするとか、どんだけ
- 339 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 19:46:20.12 .net]
- 0100
0100 〇一〇〇 零百 十〇 〇壱〇〇 最適解が欧文の比じゃない数有るからなあ
- 340 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 20:49:55.10 .net]
- そういうのはフリガナとかヨミガナとかのソートの種を入れますし。
- 341 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 21:07:54.19 .net]
- 1024*1024のビットマップフォントにして
黒の数でソートしようず
- 342 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 21:56:58.21 .net]
- それが黒だと誰が決めた
- 343 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 22:02:47.20 .net]
- 黄色でもいいけどよ
モノクロ二値にすんだよハゲっが
- 344 名前:デフォルトの名無しさん mailto:sage [2013/09/17(火) 23:58:51.49 .net]
- 意味ない
- 345 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 00:06:35.40 .net]
- yes
- 346 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 02:19:26.91 .net]
- 文字コードについて説明してある本が古くて使いものにならない、ってことになるとは、
最初に書いた人は想像してなかったろうな
- 347 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 03:05:07.93 .net]
- >>328
康熙字典の部首順。 だから漢数字が一七三九二五八六十四の順になったりする。
- 348 名前:デフォルトの名無しさん mailto:sage [2013/09/18(水) 03:21:07.49 .net]
- なるほど部首か
- 349 名前:デフォルトの名無しさん mailto:sage [2013/09/21(土) 00:40:43.90 .net]
- >>342
なわけねえべ。
- 350 名前:デフォルトの名無しさん [2013/09/23(月) 20:39:39.37 .net]
- 950 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 18:35:39.06 ID:i/lAwQriP
騸豚か。 951 名前:名無しの報告 投稿日:2013/09/23(月) 18:45:49.59 ID:21igwRGo0 >>950 文字実体参照、16進の数値文字参照を全板で禁止 数値文字参照は10進のみ、BBS_UNICODE=passの板で可 952 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 19:38:39.06 ID:i/lAwQriP せん馬のせんがぁあああ 953 名前:名無しの報告 投稿日:2013/09/23(月) 19:49:53.10 ID:P916m9xr0 せん馬 去勢された牡馬の性別を表す競馬用語。センとも書かれる。 せんは馬に扇で、一部の雑誌やサイトでは騙という字が当てられていることがあるが、それは間違い。 qb5.2ch.net/test/read.cgi/sec2chd/1379117300/951 【規制議論板】質問でも雑談でもOKのスレッド★359
- 351 名前:デフォルトの名無しさん mailto:sage [2013/09/23(月) 22:53:29.07 .net]
- 何で10進参照だけ生き残ったの?
- 352 名前:デフォルトの名無しさん mailto:sage [2013/09/24(火) 08:49:43.08 .net]
- 2chの運営(=バカ)にまともな理屈を期待しても無駄
|

|