文字コードの種類は何故複数あるのでしょうか？

[表示 : 全て最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 05/09 17:21 / Filesize : 41 KB / Number-of Response : 202
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [04/08/23 17:55]: 1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。
75 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 22:44:51 ]: UTF-8でいいんでしょ？～とか①とか大丈夫なんでしょ？
76 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 22:53:34 ]: >>75
いまのWord、ExcelはUCS-2だから、その世界に収まっている
仕事ならUTF-8でおけですよ。

でもｵﾔｸｿとかは…
77 名前：デフォルトの名無しさん [2005/11/20(日) 01:29:07 ]: やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。

絶対そうなる。
78 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 01:31:35 ]: >>76
じゃあUCS-4でいいから今すぐ統一して（　ノ＞＜）ノ
79 名前：デフォルトの名無しさん mailto:sage [2005/11/24(木) 02:30:44 ]: 常用漢字とＪＩＳが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと
80 名前：デフォルトの名無しさん mailto:sage [2005/11/24(木) 13:11:35 ]: 何か食い違ってたっけ？
81 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 21:34:50 ]: 龍の旧字体?
82 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 21:35:24 ]: 竜の旧字体? だった
龍じゃそのまんまじゃんorz
83 名前：デフォルトの名無しさん mailto:sage [2005/11/28(月) 16:44:09 ]: 「龍」の点の向きのこと？
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。
84 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 08:28:23 ]: 大体、印刷標準字体とかうざいんじゃ！
85 名前：デフォルトの名無しさん mailto:sage [2006/02/06(月) 15:57:56 ]: だって常用漢字の数とＪＩＳ漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
それより写植の文字がＪＩＳに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
86 名前：デフォルトの名無しさん mailto:sage [2006/02/06(月) 16:36:04 ]: >たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
87 名前：デフォルトの名無しさん mailto:sage [2006/03/13(月) 10:43:01 ]: いま試しに数えてみたら24個くらいあった
88 名前：デフォルトの名無しさん mailto:sage [2006/03/25(土) 09:27:36 ]: >>87 夜に数えると増えてるよ。
うちの家の階段も昼間は12段だけど
夜数えると13段ある。
89 名前：デフォルトの名無しさん mailto:sage [2006/03/26(日) 12:55:29 ]: たしかＪＩＳにあって常用漢字にない漢字とか結構なかったっけ？
90 名前：デフォルトの名無しさん mailto:sage [2006/03/27(月) 02:43:17 ]: ない。
91 名前：デフォルトの名無しさん mailto:sage [2006/05/01(月) 11:42:30 ]: お前ら大嘘つきだ。みんな嫌いだ。
92 名前：デフォルトの名無しさん mailto:sage [2006/05/04(木) 13:03:48 ]: 文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね？
93 名前：デフォルトの名無しさん mailto:sage [2006/05/05(金) 07:04:34 ]: たしかに。英語だけあれば世の中困ること無いよな。
94 名前：デフォルトの名無しさん mailto:sage [2006/05/30(火) 02:39:01 ]: そうだ。
95 名前：デフォルトの名無しさん mailto:sage [2006/06/16(金) 19:34:55 ]: >>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。
96 名前：デフォルトの名無しさん [2006/07/06(木) 04:23:37 ]: 戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。
　
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
　誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。

何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態（レイプされた後、殺害される）を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
　体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。
97 名前：デフォルトの名無しさん [2006/07/06(木) 04:24:30 ]: 少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ（フツ族民兵）か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」

変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。
98 名前：デフォルトの名無しさん [2006/07/06(木) 04:26:13 ]: 「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。

「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。
99 名前：デフォルトの名無しさん mailto:sage [2006/07/08(土) 09:12:04 ]: >>97-98
よくあること
はいりょしてくれないと
100 名前：デフォルトの名無しさん mailto:age [2006/10/31(火) 17:47:09 ]: >>1
６４ビットユニコードつかえばいいだろ
101 名前：デフォルトの名無しさん mailto:sage [2006/11/09(木) 12:34:39 ]: JISの文字コードがあれなのはそもそもが朝日新聞が適当に定めた文字だから
102 名前：デフォルトの名無しさん mailto:sage [2007/01/06(土) 11:43:23 ]: まず文字コードについてだが、コード云々の前に自然言語の整理が必要だと思う。
実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから
そういう文字はどんどん淘汰してゆくべき。
あと、字体がそっくりな文字なんかもできるだけ１つに統合してしまったほうがいい。
そのあとで国（言語種別）ごとにコード領域を分けて、すべての文字を１つのコード体系に
収めるべき。

次に改行コードだが、全部LFで統一でＯＫ。改行ごときに２バイトも必要ない。
既存のリソースは全部LFに変換してしまえばよい。
Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、
CR+LFはいずれこの世から自然消滅するだろう。

最後にエンディアンについてだが、ビッグエンディアンに統一すべき。
人間が感覚的になじみやすいほうがいいから。

これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを
考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。
103 名前：デフォルトの名無しさん [2007/01/10(水) 13:15:10 ]: バベルの塔で神の怒りに触れ文字コードの種類が沢山になった。
これは事実で、（ｒｙ
104 名前：デフォルトの名無しさん mailto:sage [2007/01/10(水) 14:26:08 ]: JISとEUCはほぼ等価だから
漏れ的には扱い安さは
EUC > JIS >>> SJIS >>>>>>> UNICODE
だと思うよ
105 名前：デフォルトの名無しさん mailto:sage [2007/01/10(水) 14:28:45 ]: 判定のしやすさで言えばJISは・・
UNICODEもそうだな、代わりにUTF-8とか使うが
106 名前：デフォルトの名無しさん mailto:sage [2007/01/10(水) 17:43:21 ]: 援交ディングと門司セットの話がない交ぜに！
107 名前：デフォルトの名無しさん [2007/01/10(水) 18:11:17 ]: UTF-128あれば大丈夫だろ？
108 名前：デフォルトの名無しさん [2007/01/10(水) 18:15:07 ]: 野球板　お約束その122
「しまってこーぜー」
↓
「まずお前が社会の窓閉めろや」
109 名前：デフォルトの名無しさん mailto:sage [2007/01/10(水) 18:15:43 ]: ミスッた
110 名前：デフォルトの名無しさん mailto:sage [2007/01/10(水) 20:06:46 ]: 言語は何故複数あるのでしょうか？
どうせなら言語も英語だけにしようよ。

ﾊﾟｽがでたー
111 名前：デフォルトの名無しさん mailto:sage [2007/01/11(木) 09:38:18 ]: 主食は何故複数あるのでしょうか？
どうせなら主食も米だけにしようよ。
112 名前：デフォルトの名無しさん mailto:sage [2007/01/11(木) 23:46:02 ]: >104
まさかとはおもうが、そのJISはCESとしてのISO-2022-JPの通称のことなのか？
それともCCSとしてのJISX208なのか。
113 名前：デフォルトの名無しさん mailto:sage [2007/01/24(水) 23:51:46 ]: だいたい文字をコード（数字）に置き換えなければならない
現代のコンピュータアーキテクチャが問題。

やっぱ文字は文字として扱えなきゃダメでしょ。
114 名前：デフォルトの名無しさん mailto:sage [2007/01/25(木) 09:34:43 ]: 「文字を文字として扱う」っていうのは具体的にどういうことよ？
115 名前：デフォルトの名無しさん mailto:sage [2007/01/25(木) 10:01:33 ]: 0から9、AからFまでの文字しか使わない
116 名前：デフォルトの名無しさん mailto:sage [2007/01/25(木) 11:25:11 ]: で、それらの文字を文字として扱うとはどういうこと?
117 名前：デフォルトの名無しさん mailto:sage [2007/02/10(土) 22:58:13 ]: あいう・・・と書かずに
a01001a01002a01003・・・
118 名前：デフォルトの名無しさん mailto:sage [2007/03/16(金) 03:44:15 ]: ベクトルデータとしてパターン認識させるとか？w
119 名前：デフォルトの名無しさん mailto:sage US-ASCII [2007/07/12(木) 19:45:19 ]: 【日本語を扱える主な文字コード（“x-” 付きのものは IANA 非登録）】

Shift_JIS
Windows-31J
x-Mac-Japanese

ISO-2022-JP
ISO-2022-JP-2
x-CP50220

EUC-JP
x-CP51932

UTF-8
x-UTF-8N
x-UTF-8-BOM

UTF-7

UTF-16
UTF-16BE
UTF-16LE
120 名前：デフォルトの名無しさん mailto:sage [2007/07/12(木) 21:01:07 ]: UTF-32系は？
121 名前：・∀・）っ-○◎● mailto:sage [2007/08/09(木) 02:10:09 ]: UTF-9は？
122 名前：デフォルトの名無しさん mailto:sage [2007/08/09(木) 16:25:42 ]: UTF-18は？
123 名前：デフォルトの名無しさん mailto:sage [2007/08/09(木) 23:52:07 ]: Punycodeは？
124 名前：デフォルトの名無しさん mailto:sage [2007/08/13(月) 14:54:27 ]: Windows上でperlのCGIを作成していて、
ファイルの保存時に、漢字コードを指定しないと
保存できないのですが、
シフトJISと
JISと
EUCと、
どれを選択したらいいのでしょうか？
作成後はFFFTPでレンタルサーバーにアップロードしますが、
そのレンタルサーバーは当然UNIXなので、
UNIXで動かすということを考えればEUCで保存したほうが
いいのですか？
あと、C5の問題（表とか）を考えれば
シフトJISだと
表￥
っていちいち書かないと文字化けしますが、
EUCだったらそんな余計なこと考えないでいいと
いう記述も見つけました。
だったらEUCで保存しようかな？と思いましたが
それだとWindows上でソースコードの変更作業するときに
漢字が文字化けしないですか？
だってWindowｓはシフトJISしか取り扱えないのだから。
結局何で保存すればいいのでしょうか？
125 名前：デフォルトの名無しさん mailto:sage [2007/08/13(月) 23:34:09 ]: >>124
・ShiftJisで書いてffftpで変換する。
・まともなエディタでEUCで書く。
126 名前：・∀・）っ-○◎● mailto:sage [2007/08/15(水) 03:02:00 ]: UNIXだからってサイトをEUCにしないといけないなんてことはない。
最近のLinuxは標準文字コードはUTF-8が多いよ。

XML対応とかも視野に入れるならできればUTF-8のほうがいい。
Shift-JISはね、HTMLだけならいいけどプログラム書くと何かとトラブルに遭いやすい。
127 名前：デフォルトの名無しさん mailto:sage [2007/08/15(水) 03:08:05 ]: そしてベンダ毎の変換表の違いやらのUnicode特有の問題になやまされるわけですね。

SJISでも機種依存文字とか、2バイト目に0x5C使ってるとか問題あるけど、
Unicode使っても薔薇色の未来が待ってるわけじゃない。
どっちかっつーと、長いものには巻かれろ的な感じの方が強い。
128 名前：デフォルトの名無しさん mailto:sage [2007/08/15(水) 10:36:44 ]: ハナからUnicode使ってれば変換表とか関係ないんじゃ？
129 名前：・∀・）っ-○◎● mailto:sage [2007/08/15(水) 23:28:24 ]: それは言える。

tDiaryでうかつにrecent-rssプラグイン使って2chのRSSを表示しようとすると
機種依存文字の関係でUNICODEの変換失敗で全部転ける。
130 名前：デフォルトの名無しさん mailto:sage [2007/08/16(木) 01:39:32 ]: >>128
ハナからUnicodeしか使って無くても、WAVE DASH使うと
Windowsのフォントでは汚くなるとかあるし無問題とはならない。
131 名前：デフォルトの名無しさん mailto:sage [2007/08/16(木) 05:24:15 ]: 世界が今すぐに全てUnicodeに変るわけじゃないから、
>>128は実現不可能な夢。

そもそも狂っている変換表があるから、
元の意味/意図と違うUnicodeのデータが溜っていっている状況。
132 名前：デフォルトの名無しさん mailto:sage [2007/08/16(木) 10:12:50 ]: ダンゴさんの居るスレは活気があるな。
133 名前：デフォルトの名無しさん mailto:sage [2007/08/20(月) 17:54:12 ]: 普通の日本語のサイトならEUC-JPかISO-2022-JPでいいだろ
ちょいと外国の文字使うくらいなら実体参照でも十分だし
Unicodeなんて混乱の極みにある物を使う気にはなれん
134 名前：デフォルトの名無しさん mailto:sage [2007/08/20(月) 20:15:12 ]: なんでウェブサイトの話になってるの？
135 名前：デフォルトの名無しさん [2007/08/26(日) 08:04:08 ]: あげ
136 名前：デフォルトの名無しさん mailto:sage [2007/08/30(木) 08:21:39 ]: ネットワークが一番文字コード問題が露呈しやすいからだろ
137 名前：デフォルトの名無しさん [2007/09/02(日) 18:33:34 ]: >>1
なんで人の言葉は複数あるんでしょうか？
138 名前：デフォルトの名無しさん mailto:sage [2007/09/04(火) 16:32:27 ]: バベルの塔を建てたから
139 名前：デフォルトの名無しさん [2007/09/08(土) 10:08:44 ]: JEFとかKEISとかその先にある厚生省系、労働省系の外字コードなんかがUnicodeに反映されていないってのがあるな
140 名前：デフォルトの名無しさん mailto:sage [2007/11/25(日) 16:28:52 ]: JISの文字コード表なんて
もうごちゃごちゃだな
80h～9Fhなんて制御文字には使わないんだから
１区１点～126区126点１つにまとめろよ
141 名前：デフォルトの名無しさん mailto:sage [2008/01/16(水) 23:18:53 ]: >>135
あるよ。
以上。
↓次の方どうぞ
142 名前：デフォルトの名無しさん [2008/05/07(水) 23:34:16 ]: age
143 名前：デフォルトの名無しさん mailto:sage [2008/05/12(月) 22:00:30 ]: sage
144 名前：デフォルトの名無しさん [2008/07/09(水) 23:50:48 ]: ２２０８
145 名前：デフォルトの名無しさん [2008/12/23(火) 07:49:06 ]: >>139
JEF KEIS IBM JIPS(E/J)
これらの拡張も含めた文字は全てUTF-8で表現できるんじゃないの？
146 名前：デフォルトの名無しさん mailto:sage [2008/12/25(木) 21:09:50 ]: プライベートエリアを私用領域とか訳しちゃうセンスが在る限り文字コードは増え続けるさ
147 名前：デフォルトの名無しさん mailto:sage [2009/01/07(水) 12:48:00 ]: だれか文字コード総合スレの新スレ立ててー。
148 名前：デフォルトの名無しさん mailto:sage [2009/01/07(水) 21:23:47 ]: >>147
前スレ、一ヶ月書き込みなくて17レスで落ちてるみたいだけど、需要ないからじゃね？
149 名前：デフォルトの名無しさん mailto:sage [2009/01/07(水) 21:31:34 ]: この板、即死に引っ掛からなければ、数か月書き込みないのはざらなほう。
150 名前：デフォルトの名無しさん mailto:sage [2009/01/08(木) 00:03:07 ]: >>147
ここを乗っ取ればいいんじゃね?
>>148
誰もExt.Cには興味ないのか…
Unicodeメーリングリストも絵文字で絶賛炎上中だしな
151 名前：デフォルトの名無しさん mailto:sage [2009/01/08(木) 22:13:20 ]: >>149
ああ、即死食らったのか

まぁ、このスレで充分な気もするけど
152 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 16:41:43 ]: www.unicode.org/mail-arch/unicode-ml/y2009-m01/0380.html
最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが
たくさんいるようだがこれはひどすぎる
日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。
それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。
それ何てKS X 1001?
153 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 19:52:02 ]: 文字コードって65000くらいあるの？
154 名前：デフォルトの名無しさん mailto:sage [2009/01/12(月) 21:00:14 ]: 100万くらいあります
155 名前：デフォルトの名無しさん mailto:sage [2009/01/15(木) 00:13:07 ]: 絵文字レビュー終了のお知らせ
156 名前：デフォルトの名無しさん mailto:sage [2009/01/18(日) 23:15:58 ]: 国ごとに専用の(速度重視の)エンコーディング一つとUnicodeだけにしてほしい
157 名前：デフォルトの名無しさん mailto:sage [2009/01/18(日) 23:17:53 ]: >>157
日本は何にするの？
158 名前：デフォルトの名無しさん [2009/01/26(月) 11:26:56 ]: twitter.com/wraith13/status/1147555396
159 名前：デフォルトの名無しさん mailto:sage [2009/01/26(月) 12:52:12 ]: >>157
JIS_X201で。
160 名前：デフォルトの名無しさん mailto:sage [2009/01/26(月) 23:24:33 ]: smallbear.sakura.ne.jp/tron/btm20091.html#20090123
まるで人ごとのように書いてますけど
TRONコードでは&T224C71;と&T224C72;のどっちなんですか?
ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は
(JIS|Unicode)叩きの定番だったような気がするんですが。
ていうかTフォントマダー? (AAry
161 名前：デフォルトの名無しさん mailto:sage [2009/01/27(火) 01:10:46 ]: 「…お母さん？俺やけど…」
「…TRONか？…」
「うん…俺、包摂分離してしもて…」
「もう、包摂分離の事は気にせんでいいから、成仏して…」
162 名前：デフォルトの名無しさん mailto:sage [2009/01/27(火) 08:05:57 ]: ちなみに今昔文字鏡では*****(検閲削除されました)番と*****(検閲削除されました)番。
いや実際には調べてないけど絶対分離されてるに違いないし
163 名前：マイク ◆gZ6OoOjBU6 [2009/02/05(木) 08:39:33 ]: UnicodeだかUTF16だか知らんが
サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。
2001年頃に2ｃｈで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。
164 名前：マイク ◆gZ6OoOjBU6 [2009/02/05(木) 08:49:15 ]: これだわこれ。
blackhatコンファレンスで長谷川洋介って人だっけ？
それが発表してた文字コードに関する脆弱性に関する論文に近いもの。
見てない奴は見てみ
参考になんぞ

https://www.blackhat.com/presentations/bh-jp-08/bh-jp-08-Hasegawa/BlackHat-japan-08-Hasegawa-Char-Encoding.pdf
165 名前：デフォルトの名無しさん mailto:sage [2009/02/06(金) 15:04:05 ]: Gmailが絵文字を全世界的に公式アナウンス。

https://mail.google.com/mail/help/about_whatsnew.html

> Emoticons - they're not just for chat anymore
> Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ).
> Click the (小さい笑い顔) button when composing a message
> in "Rich formatting" mode, or choose the new emoticons tab in chat,
> and express yourself to your ハートマーク)'s desire.
> Learn more (mail.google.com/support/bin/answer.py?hl=en&answer=112518)

https://mail.google.com/mail/help/images/whatsnew/emoji_smile.gif
を絵文字アイコンに決定した模様。

「even ハエうんこ」ﾜﾛﾀ
166 名前：デフォルトの名無しさん mailto:sage [2009/02/07(土) 08:19:39 ]: Sun-ExtBが更新されて、Extension Cの正式版に対応してた。
>>165
それはちょっと前に話題になってたUnicode絵文字じゃなくてリッチテキスト方式かな
167 名前：デフォルトの名無しさん [2009/02/07(土) 09:20:45 ]: UTF-16サロゲートペアをUTF-8に変換出来ますか？
168 名前：デフォルトの名無しさん mailto:sage [2009/02/07(土) 12:12:34 ]: >>167
いったんUnicode scalar valueを求めてからUTF-8に変換してください。
サロゲートのコードポイント(D800..DFFF)をそのままUTF-8にするのは不正です。
169 名前：デフォルトの名無しさん mailto:sage [2009/02/08(日) 01:58:04 ]: 日本人になまじ技術力があったから日本製PCが一時期国内でシェアを占め
独自のPC漢字文化が創られた。これがすべての始まり。
170 名前：デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:24:01 ]: で、ケータイの世界でもまったく同じようにガラパゴスケータイがシェアを占めて
独自の絵文字文化が発達したわけですね、わかります。

進歩しろよ
171 名前：デフォルトの名無しさん mailto:sage [2009/02/10(火) 11:08:47 ]: 絵文字はユニコードに入りますよ、たぶん。
172 名前：デフォルトの名無しさん mailto:sage [2009/02/11(水) 01:08:00 ]: 日本のケータイメーカーが音頭を取って入れたわけではないけどね。
漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった
173 名前：デフォルトの名無しさん mailto:sage [2009/02/13(金) 07:51:40 ]: www.kumikomi.net/article/report/2009/01tron/01.html
> 2009年の早い時期に，
もう出す出す詐欺はいいよ
> 第1期 236,025字の一般リリース（Webからの無償ダウンロード）を予定しているという．
GT78,675字×3書体を先に出すことにしたのか
174 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 21:04:27 ]: 久しぶりにSMPのroadmapを見たらU+1B100あたりに「(Historic Kana)」というのがあった。
www.unicode.org/roadmaps/smp/
歴史的仮名遣いに必要な文字はすべて収録済みのはずだから
変体仮名の追加提案かな
175 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 21:25:54 ]: "historical"じゃないのは何故だろう?
176 名前：デフォルトの名無しさん [2009/02/17(火) 23:03:24 ]: この前提案されてたKATAKANA LETTER ORIGINAL E(片仮名の元々のア行の「エ」、「衣」に由来)もそこに入るのかも知れない。
同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、
片仮名ブロックはもう空きが無いからな。
177 名前：デフォルトの名無しさん mailto:sage [2009/02/22(日) 18:58:47 ]: fezn.exblog.jp/10234044/
一太郎ってIVS対応してたの? マジ?
178 名前：デフォルトの名無しさん mailto:sage [2009/02/23(月) 23:33:42 ]: > 今後は「出典をすべてscanデータで出すべし」という方針に。
> だが、律儀に守っているのは日本と中国ぐらい。。
> 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。
UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。
179 名前：デフォルトの名無しさん mailto:sage [2009/02/24(火) 15:45:03 ]: >>177
今後の話だろ。
180 名前：デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:50:21 ]: 今後の話だったら「ブラウザはまだ」って書いてるのが変だ
181 名前：デフォルトの名無しさん [2009/03/03(火) 22:09:24 ]: U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182 名前：デフォルトの名無しさん mailto:sage [2009/03/04(水) 00:21:44 ]: 256で足りるのｗ？
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183 名前：デフォルトの名無しさん [2009/03/04(水) 00:29:59 ]: 変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
ttp://www10.plala.or.jp/koin/koinhentaigana.html
184 名前：デフォルトの名無しさん [2009/03/04(水) 12:43:59 ]: 住基仮名だけなら256で足りるがな。
185 名前：デフォルトの名無しさん [2009/03/05(木) 07:38:01 ]: １バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低２バイト～な感じで
186 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 17:50:02 ]: 欧米人にはそれが理解できんのですよ。

たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。

３次元の世界で生活している我々が４次元の世界を理解できないのと同じく
１文字１バイト圏で生活している欧米人には、１文字が２バイト、３バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は４次元の世界なのです。
187 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 18:06:53 ]: 物理的に無理なのと一緒にされても。
188 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 19:19:15 ]: 文字コード総合の次スレはここでござるな？　しからば過去スレを貼り。

【UTF8】文字コード変換【SJIS】
pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
pc11.2ch.net/test/read.cgi/tech/1180250376/
189 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 20:24:38 ]: >>185
いきなり可変でよろしくやってるのがUTF-8です。
190 名前：デフォルトの名無しさん mailto:sage [2009/03/05(木) 21:44:14 ]: >>184
たとえば「安」から「あ」へ連続的に変化していく過程の文字の数々にどうやって包摂規準を
設定するのか、とか考えると住基仮名のようなclosed setしかありえない気がする
191 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 02:01:46 ]: 変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね？
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
192 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 14:29:53 ]: U+E0100～U+E01EFは漢字専用じゃなかったっけ?
193 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:36:34 ]: それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか
194 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:27:11 ]: ・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
195 名前：デフォルトの名無しさん mailto:sage [2009/03/07(土) 22:28:59 ]: 草書を標準化するところから始めないと…
196 名前：デフォルトの名無しさん mailto:sage [2009/03/08(日) 11:10:41 ]: アラビア文字がまさに草書の電子化
197 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:11:40 ]: 文字コード総合スレ part5
pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。　
即死回避に、だれか頼む。　
あと、テンプレがまだ（４０行）残ってるので。現在連投規制（5回）で書き込めないのを何とかしないといけない。
198 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:23:53 ]: ●かえ
199 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:36:52 ]: ●持ってない
取り合えず見切り発車してくれ。
200 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 22:10:13 ]: >>197
乙

どんだけ書けば即死回避するんだっけ
201 名前：デフォルトの名無しさん mailto:sage [2009/03/23(月) 19:29:17 ]: >>192
あれって漢字専用なの?
漢字とモンゴル文字以外の場合はU+FE00～FE0Fを使わないといかんの?

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef