文字コードの種類は何故複数あるのでしょうか？

[表示 : 全て最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 05/09 17:21 / Filesize : 41 KB / Number-of Response : 202
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [04/08/23 17:55]: 1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。
149 名前：デフォルトの名無しさん mailto:sage [2009/01/07(水) 21:31:34 ]: この板、即死に引っ掛からなければ、数か月書き込みないのはざらなほう。
150 名前：デフォルトの名無しさん mailto:sage [2009/01/08(木) 00:03:07 ]: >>147
ここを乗っ取ればいいんじゃね?
>>148
誰もExt.Cには興味ないのか…
Unicodeメーリングリストも絵文字で絶賛炎上中だしな
151 名前：デフォルトの名無しさん mailto:sage [2009/01/08(木) 22:13:20 ]: >>149
ああ、即死食らったのか

まぁ、このスレで充分な気もするけど
152 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 16:41:43 ]: www.unicode.org/mail-arch/unicode-ml/y2009-m01/0380.html
最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが
たくさんいるようだがこれはひどすぎる
日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。
それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。
それ何てKS X 1001?
153 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 19:52:02 ]: 文字コードって65000くらいあるの？
154 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 21:00:14 ]: 100万くらいあります
155 名前：デフォルトの名無しさん mailto:sage [2009/01/15(木) 00:13:07 ]: 絵文字レビュー終了のお知らせ
156 名前：デフォルトの名無しさん mailto:sage [2009/01/18(日) 23:15:58 ]: 国ごとに専用の(速度重視の)エンコーディング一つとUnicodeだけにしてほしい
157 名前：デフォルトの名無しさん mailto:sage [2009/01/18(日) 23:17:53 ]: >>157
日本は何にするの？
158 名前：デフォルトの名無しさん [2009/01/26(月) 11:26:56 ]: twitter.com/wraith13/status/1147555396
159 名前：デフォルトの名無しさん mailto:sage [2009/01/26(月) 12:52:12 ]: >>157
JIS_X201で。
160 名前：デフォルトの名無しさん mailto:sage [2009/01/26(月) 23:24:33 ]: smallbear.sakura.ne.jp/tron/btm20091.html#20090123
まるで人ごとのように書いてますけど
TRONコードでは&T224C71;と&T224C72;のどっちなんですか?
ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は
(JIS|Unicode)叩きの定番だったような気がするんですが。
ていうかTフォントマダー? (AAry
161 名前：デフォルトの名無しさん mailto:sage [2009/01/27(火) 01:10:46 ]: 「…お母さん？俺やけど…」
「…TRONか？…」
「うん…俺、包摂分離してしもて…」
「もう、包摂分離の事は気にせんでいいから、成仏して…」
162 名前：デフォルトの名無しさん mailto:sage [2009/01/27(火) 08:05:57 ]: ちなみに今昔文字鏡では*****(検閲削除されました)番と*****(検閲削除されました)番。
いや実際には調べてないけど絶対分離されてるに違いないし
163 名前：マイク ◆gZ6OoOjBU6 [2009/02/05(木) 08:39:33 ]: UnicodeだかUTF16だか知らんが
サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。
2001年頃に2ｃｈで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。
164 名前：マイク ◆gZ6OoOjBU6 [2009/02/05(木) 08:49:15 ]: これだわこれ。
blackhatコンファレンスで長谷川洋介って人だっけ？
それが発表してた文字コードに関する脆弱性に関する論文に近いもの。
見てない奴は見てみ
参考になんぞ

https://www.blackhat.com/presentations/bh-jp-08/bh-jp-08-Hasegawa/BlackHat-japan-08-Hasegawa-Char-Encoding.pdf
165 名前：デフォルトの名無しさん mailto:sage [2009/02/06(金) 15:04:05 ]: Gmailが絵文字を全世界的に公式アナウンス。

https://mail.google.com/mail/help/about_whatsnew.html

> Emoticons - they're not just for chat anymore
> Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ).
> Click the (小さい笑い顔) button when composing a message
> in "Rich formatting" mode, or choose the new emoticons tab in chat,
> and express yourself to your ハートマーク)'s desire.
> Learn more (mail.google.com/support/bin/answer.py?hl=en&answer=112518)

https://mail.google.com/mail/help/images/whatsnew/emoji_smile.gif
を絵文字アイコンに決定した模様。

「even ハエうんこ」ﾜﾛﾀ
166 名前：デフォルトの名無しさん mailto:sage [2009/02/07(土) 08:19:39 ]: Sun-ExtBが更新されて、Extension Cの正式版に対応してた。
>>165
それはちょっと前に話題になってたUnicode絵文字じゃなくてリッチテキスト方式かな
167 名前：デフォルトの名無しさん [2009/02/07(土) 09:20:45 ]: UTF-16サロゲートペアをUTF-8に変換出来ますか？
168 名前：デフォルトの名無しさん mailto:sage [2009/02/07(土) 12:12:34 ]: >>167
いったんUnicode scalar valueを求めてからUTF-8に変換してください。
サロゲートのコードポイント(D800..DFFF)をそのままUTF-8にするのは不正です。
169 名前：デフォルトの名無しさん mailto:sage [2009/02/08(日) 01:58:04 ]: 日本人になまじ技術力があったから日本製PCが一時期国内でシェアを占め
独自のPC漢字文化が創られた。これがすべての始まり。
170 名前：デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:24:01 ]: で、ケータイの世界でもまったく同じようにガラパゴスケータイがシェアを占めて
独自の絵文字文化が発達したわけですね、わかります。

進歩しろよ
171 名前：デフォルトの名無しさん mailto:sage [2009/02/10(火) 11:08:47 ]: 絵文字はユニコードに入りますよ、たぶん。
172 名前：デフォルトの名無しさん mailto:sage [2009/02/11(水) 01:08:00 ]: 日本のケータイメーカーが音頭を取って入れたわけではないけどね。
漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった
173 名前：デフォルトの名無しさん mailto:sage [2009/02/13(金) 07:51:40 ]: www.kumikomi.net/article/report/2009/01tron/01.html
> 2009年の早い時期に，
もう出す出す詐欺はいいよ
> 第1期 236,025字の一般リリース（Webからの無償ダウンロード）を予定しているという．
GT78,675字×3書体を先に出すことにしたのか
174 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 21:04:27 ]: 久しぶりにSMPのroadmapを見たらU+1B100あたりに「(Historic Kana)」というのがあった。
www.unicode.org/roadmaps/smp/
歴史的仮名遣いに必要な文字はすべて収録済みのはずだから
変体仮名の追加提案かな
175 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 21:25:54 ]: "historical"じゃないのは何故だろう?
176 名前：デフォルトの名無しさん [2009/02/17(火) 23:03:24 ]: この前提案されてたKATAKANA LETTER ORIGINAL E(片仮名の元々のア行の「エ」、「衣」に由来)もそこに入るのかも知れない。
同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、
片仮名ブロックはもう空きが無いからな。
177 名前：デフォルトの名無しさん mailto:sage [2009/02/22(日) 18:58:47 ]: fezn.exblog.jp/10234044/
一太郎ってIVS対応してたの? マジ?
178 名前：デフォルトの名無しさん mailto:sage [2009/02/23(月) 23:33:42 ]: > 今後は「出典をすべてscanデータで出すべし」という方針に。
> だが、律儀に守っているのは日本と中国ぐらい。。
> 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。
UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。
179 名前：デフォルトの名無しさん mailto:sage [2009/02/24(火) 15:45:03 ]: >>177
今後の話だろ。
180 名前：デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:50:21 ]: 今後の話だったら「ブラウザはまだ」って書いてるのが変だ
181 名前：デフォルトの名無しさん [2009/03/03(火) 22:09:24 ]: U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182 名前：デフォルトの名無しさん mailto:sage [2009/03/04(水) 00:21:44 ]: 256で足りるのｗ？
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183 名前：デフォルトの名無しさん [2009/03/04(水) 00:29:59 ]: 変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
ttp://www10.plala.or.jp/koin/koinhentaigana.html
184 名前：デフォルトの名無しさん [2009/03/04(水) 12:43:59 ]: 住基仮名だけなら256で足りるがな。
185 名前：デフォルトの名無しさん [2009/03/05(木) 07:38:01 ]: １バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低２バイト～な感じで
186 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 17:50:02 ]: 欧米人にはそれが理解できんのですよ。

たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。

３次元の世界で生活している我々が４次元の世界を理解できないのと同じく
１文字１バイト圏で生活している欧米人には、１文字が２バイト、３バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は４次元の世界なのです。
187 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 18:06:53 ]: 物理的に無理なのと一緒にされても。
188 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 19:19:15 ]: 文字コード総合の次スレはここでござるな？　しからば過去スレを貼り。

【UTF8】文字コード変換【SJIS】
pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
pc11.2ch.net/test/read.cgi/tech/1180250376/
189 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 20:24:38 ]: >>185
いきなり可変でよろしくやってるのがUTF-8です。
190 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 21:44:14 ]: >>184
たとえば「安」から「あ」へ連続的に変化していく過程の文字の数々にどうやって包摂規準を
設定するのか、とか考えると住基仮名のようなclosed setしかありえない気がする
191 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 02:01:46 ]: 変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね？
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
192 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 14:29:53 ]: U+E0100～U+E01EFは漢字専用じゃなかったっけ?
193 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:36:34 ]: それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか
194 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:27:11 ]: ・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
195 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 22:28:59 ]: 草書を標準化するところから始めないと…
196 名前：デフォルトの名無しさん mailto:sage [2009/03/08(日) 11:10:41 ]: アラビア文字がまさに草書の電子化
197 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:11:40 ]: 文字コード総合スレ part5
pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。　
即死回避に、だれか頼む。　
あと、テンプレがまだ（４０行）残ってるので。現在連投規制（5回）で書き込めないのを何とかしないといけない。
198 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:23:53 ]: ●かえ
199 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:36:52 ]: ●持ってない
取り合えず見切り発車してくれ。
200 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 22:10:13 ]: >>197
乙

どんだけ書けば即死回避するんだっけ
201 名前：デフォルトの名無しさん mailto:sage [2009/03/23(月) 19:29:17 ]: >>192
あれって漢字専用なの?
漢字とモンゴル文字以外の場合はU+FE00～FE0Fを使わないといかんの?

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef