1 名前:ほげ [02/01/30 04:51.net] UNICODEかEUCに統一してほしい。今現役でSJISつかってるのMSくらいだし。MacもOS-XからほぼEUCとUNICODEだし。 MP3のIDタグが統一できなくて困る! SJISで書かれたperlとか置かれたら管理しにくくて困る! タマにはUNIXでも日本語ファイルを堂々とつかってみたい!
182 名前:名無しさん@お腹いっぱい。 [02/03/24 12:38.net] >>177 使うlibraryもShift_JISを理解する必要があることは理解しますか? e.g. printf().
183 名前:177 [02/03/25 00:35.net] >178 リテラルで「表」とかってコーディングする時、gccだとエスケープが 必要だけど、ベンダコンパイラにはオプション指定でエスケープを不要に できるものがあるでしょう? >179 セットロケールの動作の話してんの?
184 名前:名無しさん@お腹いっぱい。 mailto:sage [02/03/25 01:15.net] gccでもgcc3系はLANG見てsjisもエスケープ無しでコンパイルできるとか どっかで見たような... 手元に環境無いから確認できんけど。
185 名前:名無しさん@お腹いっぱい。 mailto:sage [02/03/25 16:16.net] >>174 悪いのは SJIS や ISO2022 ではなくフレームワークの不在。 LC_CTYPE じゃ全然不十分だし。 filter アプリなら間に合うのかもしれないが..。 eucJP なら厨房コードでも OK かというと、 そうは思わない。まあ SJIS よりは実用上マシな場合も多いのも 確かだが、そういうエンコード依存はそろそろやめにしたい。 CSIマンセー。
186 名前:名無しさん@お腹いっぱい。 mailto:sage [02/03/26 19:41.net] フレームワーク…。X11R5 の Xwc…。
187 名前:名無しさん@お腹いっぱい。 mailto:sage [02/04/01 00:44.net] Xutf...(w
188 名前:名無しさん@お腹いっぱい。 [02/06/20 23:42.net] で、JIS X 0213で追加された文字はいつUnicodeに入るの?
189 名前:名無しさん@お腹いっぱい。 mailto:sage [02/06/20 23:52.net] >>180 >>178 が言っているのはコンパイルが通っても 関数で対応してないときちんと処理されるかどうか わかんないよって言う意味でしょ。 たぶん。
190 名前:名無しさん@お腹いっぱい。 mailto:sage [02/06/21 23:17.net] >>185 もう入ってるよ。 www.unicode.org/unicode/reports/tr28
191 名前:名無しさん@お腹いっぱい。 [02/09/10 13:56.net] age
192 名前:名無しさん@お腹いっぱい。 [02/09/13 14:03.net] 半角カナの使えるロケール定義ファイルはないものだろうか?
193 名前:名無しさん@お腹いっぱい。 [02/09/13 14:04.net] Linuxでね、半角カナ使いたいんだけどさ。
194 名前:名無しさん@お腹いっぱい。 mailto:sage [02/09/13 15:08.net] ロケールつってもいろいろあるが。。。 半角カナ使いたいってのもどこでつかうのか意味不明。
195 名前:名無しさん@お腹いっぱい。 [02/09/13 15:48.net] >>189 jp_JP.eucJPで何の問題もないと思うが。 /usr/share/i18n/charmaps/EUC-JP.gz これじゃ不満なの?
196 名前:名無しさん mailto:age [03/01/03 02:11.net] / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\ Λ_Λ | 君さぁ こんなスレッド立てるから | ( ´∀`)< 厨房って言われちゃうんだよ | ( ΛΛ つ >―――――――――――――――――――‐< ( ゚Д゚) < おまえのことを必要としてる奴なんて | /つつ | いないんだからさっさと回線切って首吊れ | \____________________/ (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (∩∩) (∩∩) (∩∩) (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (∩∩) (∩∩) (∩∩) (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (∩∩) (∩∩) (∩∩)
197 名前:名無しさん@お腹いっぱい。 [03/01/03 03:08.net] 文字コードの話してるのに、どうして(いわゆる)半角カタカナや全角英数使ってるバカがいるんだろうか。
198 名前:名無しさん@お腹いっぱい。 [03/01/03 03:36.net] >>194 ウルセーバカ!
199 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 04:44.net] お前ら、自分で自分の首絞めてる印象。
200 名前:名無しさん@お腹いっぱい。 [03/01/03 12:28.net] >>195 使うなよボケ
201 名前:_ [03/01/03 12:33.net] freeweb2.kakiko.com/dengeki/indexe.htm
202 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:02.net] 唐突だけど、、Emacs(MULE)のエンコーディングの処理は優れてると思いませんか? たぶんunicodeみたいなcoded character setの統一は不可能だと思う。 で、多種多様な文字を扱うにはemacs muleみたいな内部コードを作るしかないかと。 これだったら臨機応変にcoded character setを増やしたり減らしたりできる。
203 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:11.net] >>199 savannah.gnu.org/cgi-bin/viewcvs/emacs/emacs/etc/NEWS?rev=1.613.2.1
204 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:17.net] 要するに内部コード方式が維持されればいいと思うわけで。 でもunicodeに影響され過ぎてると思うけどなぁ。 utf-8-emacs is backwards compatible with the UTF-8 encoding of Unicode. とか
205 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:20.net] ps. トンパ文字とかその他まだsetされてない文字はどうするわけ?増やした い文字なんて無尽蔵に増えるだろうに。
206 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:24.net] あ、後方互換性だから関係ないか。
207 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:27.net] >>200 は結局なにを言いたかったのかな?内部コードがunicodeのサブセットになるわけじゃない。 答えてくれ。
208 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 13:39.net] >>194 どうして使っちゃいけないの?
209 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 14:04.net] トンパ文字を使う民族がPC使うかが問題やな いくつ種類あるんだYO!
210 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 14:58.net] >>206 日本にルーズソックスを履いて棲息しているという噂を耳にしたことが あります。
211 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 16:22.net] >>205 全角の「?」使うなよ... JIS X 0208 読んだこと無いのか? はっきり「使うな」って書いてある。
212 名前:!205 mailto:sage [03/01/03 16:36.net] >>205 そうなんだ? 知らなかったよ。
213 名前:209 mailto:sage [03/01/03 16:37.net] s/205/208
214 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 16:45.net] >>209 >>210 > そうなんだ? 知らなかったよ。 面白くないよ。 > s/205/208 一文字足りないのでは?
215 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 17:31.net] >>200 utf-8-emacsか。-emacsを付けるところはやっぱり偉いね。
216 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 19:27.net] >>204 書いてない事を憶測されても困るんですが、、、 単にFYIでリンクを貼っただけで、何らかの主張があるならそれも書きますってば。
217 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/03 20:47.net] 現状で問題なし。っていう人がマジョリティでしょ。
218 名前:209 [03/01/04 03:08.net] >>211 最近 sed 使ってないから忘れてたよ。vim だとそれでオツケイなんだけどね。
219 名前:名無しさん@お腹いっぱい。 [03/01/04 04:02.net] 結局 Han unification の問題はどうなったんですか? 日本と中国の漢字を違う glyph で表示できるんでしょうか. >>200 utf-8-emacs が内部的に使われるとなると, iso2022 で実現できていた multi encoding 環境は どうなるんですかね. 従来のも使えると書いてあるから かわらないのかな.
220 名前:名無しさん@お腹いっぱい。 [03/01/04 21:38.net] どれでもいいから一つにしてくれ・・・
221 名前:山崎渉 mailto:(^^)sage [03/01/15 13:03.net] (^^)
222 名前:名無しさん@お腹いっぱい。 mailto:sage [03/01/24 13:10.net] 「Shit JIS」でググると結構な数ヒットするんですが、 みなさん、故意に書いてるんですかね?
223 名前:糞JIS撲滅 mailto:sage [03/01/24 13:49.net] DoCoMo 用の CGI のコメントに故意に書いたことならあります。
224 名前:山崎渉 mailto:(^^) [03/03/13 17:30.net] (^^)
225 名前: mailto:sage [03/03/14 00:28.net]
226 名前:半角カナのないコードは糞! [] [ここ壊れてます]
227 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/20 00:05.net] とりあえず、2ch見ているうちは半カナは必須かな?と言ってみる。
228 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 02:49.net] >>222 半角カナのないコードってあるの?
229 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 04:09.net] jis ってあったっけ? そういえば unicode はどうなの?
230 名前:224 mailto:sage [03/03/21 07:16.net] >>225 ISO-2022-JP も EUC-JP も Unicode も半角カナあると思うんだけど?
231 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 08:12.net] それはねこみみです
232 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 10:17.net] >>226 では ISO-2022-JP で「半角カナ」を使う方法を教えてください。
233 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 10:52.net] >>228 カナの幅が高さの半分くらいのフォントを使う。
234 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/21 11:34.net] はい次。
235 名前:224 mailto:sage [03/03/21 15:44.net] >>228 すいません、勘違いをしておりました。 JIS で定義されてる ESC ( I は、ISO-2022-JP (RFC1468) には無いのでつね。
236 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 02:08.net] >>228 www2d.biglobe.ne.jp/~msyk/charcode/jisx0201kana/
237 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 03:18.net] ISO−2022−JP 【通信用語:情報符号編】 [アイエスオウにーまるにーにージェイピー] (ISO-2022-JP) 〔固有名詞/+規格〕 /COMP/MARK/CHR/CODE/ENC/JA … 日本語 ◇複数の言語文字 (文字集合) を切り替えて利用する ISO-2022 のサブセット規格で, 日本語文字コードの符号化を規定した仕様. RFC 1468 で規定されている. ◇JIS X0201 前半の英数記号と, JIS X0208 第 1・2 水準漢字, そして旧 JIS 漢字 集合の JIS C6226 互換 (JIS X0208:1973) をサポートしている. つまり, JIS X0201 後半のカナ (通称半角カナ) はサポートされていない. ◇この後継仕様に, ISO-2022-JP-1 (RFC 2237) や ISO-2022-JP-2 (RFC 1554) など がある. ※コラム(サポートする文字集合) reg# character set ESC sequence designated to ───────────────────────────────── 6 ASCII ESC 2/8 4/2 ESC ( B G0 14 JIS X0201-Roman ESC 2/8 4/10 ESC ( J G0 42 JIS C6226:1978 ESC 2/4 4/0 ESC $ @ G0 87 JIS X0208:1983 ESC 2/4 4/2 ESC $ B G0 ─────────────────────────────────
238 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/24 03:20.net] jis もいっぱいあって、わかんないよ!!!
239 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 01:34.net] ネジの規格もJISだしね!!!
240 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 02:51.net] iso2022 の G0 とか G1 とか GR とか GL とか、 わけわかんない概念はどっからきたの?
241 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 04:14.net] フォントロード可能な文字端末 別にわけわかんないことはないでしょ? ただ今となっては一段間接が余分だね。
242 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/11 04:15.net] あ、フォントロード可能なプリンタもね。
243 名前:山崎渉 mailto:(^^) [03/04/17 12:23.net] (^^)
244 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
245 名前:名無しさん@Emacs [03/04/27 01:20.net] お前ら、新しいエサですよ。 Unicode 4.0 Released! www.unicode.org/versions/Unicode4.0.0/
246 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
247 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/27 02:28.net] 変なのが食いついてるよ。
248 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
249 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/14 17:09.net] I hate UNICODE :-)
250 名前:名無しさん@お腹いっぱい。 [03/07/01 02:39.net] unicodeで表示できてJIS系で表示できない漢字はなにがありますか?
251 名前:名無しさん@お腹いっぱい。 [03/07/01 06:18.net] JIS X 0221:2001はExtension Bが未収録(Unicode 3.2未対応)なので、 ざっと45,000字ぐらいは表示どころか扱うこともできねい筈だす
252 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 14:01.net] >>246 とりあえずマルチポストいくない。 必要なければ UTF-8 にする事はお勧めしない。
253 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 21:51.net] >>246 表示つーのがもうどう答えていいもんだか分からないけど、 JISで定義されてない漢字はJIS系では扱えないだろ。大陸の奴とか。 >>247 それ、JIS X 0221:2001で扱えるけど、Unicodeだと扱えない漢字(だけじゃないけど)じゃん。 丸つき数字なんかは永久に入らないんだろうな。 第3,4水準南無〜
254 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 22:02.net] Unicode って字を組み合わせる規格なかったっけ? 〇と 1 とか。
255 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/01 22:46.net] あるけどさ。 口{〇, 1} こんな感じで三文字に。(丸付き一) 口{〇, ‖{3, 4}} こんな感じで四文字に。(丸付き三十四) こういうので済むなら、丸つき数字を文字集合に含める必要ないしな。 白抜きがどうにもならんし。
256 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
257 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
258 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 07:57.net] へーこんな仕組みできたなんて知らなかった。 管直人もいろいろ工夫してるもんだね。なにが条件になってるんだろう?
259 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
260 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 17:05.net] SJISよりも関西弁を撲滅してください
261 名前:名無しさん@Emacs mailto:sage [03/08/15 01:19.net] >>256 なんでやねん?
262 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
263 名前:あぼーん mailto:あぼーん [あぼーん.net] あぼーん
264 名前:ヽ(´ー`)ノ mailto:sage [03/08/18 11:21.net] >>254 山崎渉って From に書くと fushianasan になるんじゃなかったっけ?
265 名前:名無しさん@お腹いっぱい。 [03/10/09 04:56.net] www.cbook24.com/bm_detail.asp?sku=4901676156
266 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/09 23:45.net] SJISはいいけどCP932を撲滅しる。
267 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/10 17:57.net] 互換性がなくなるから無理
268 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 00:36.net] つーかCP932が非互換の元凶。
269 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 02:02.net] うにコードだって、別にUTF-8だけじゃないしなぁ・・・ いわゆる駄スレってこれのことか?
270 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 13:43.net] UCS-4 で満足だとでも?
271 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 14:25.net] ゼロから作りなおさないかぎり Unicode はすべてクソ。
272 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 14:39.net] >>267 ゼロは無だと思うから「作りなおす」ことはできない ゼロから作りあげるが適切
273 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/11 21:41.net] UnicodeはBOMがウザい。誰だよあんな余計なもの考えた奴は。 まぁ、実際は文字コード以上に改行コードの違いがウザい訳だが。
274 名前:名無しさん@お腹いっぱい。 [03/10/12 02:43.net] www.alanwood.net/
275 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 13:05.net] どれでもいいからひとつにしてくれ・・・マジで
276 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 23:18.net] >>232 > www2d.biglobe.ne.jp/~msyk/charcode/jisx0201kana/ そのWebサイトに書いてあることは嘘があったり重要なことが抜けてたりするので あまり参考にしない方がいい。 たいていの場合、JIS X 0201の片仮名用図形文字集合(いわゆる半角カタカナ)は 使ってはいけない。ISO-2022(例外あり)もISO-2022-JPもShift JISもEUC-JPも UTF-8もUTF-16も。 同様にJIS X 0208の一部の文字(いわゆる全角英数)も使ってはいけない。 「?」や「/」のJIS X 0208の方もダメ。
277 名前:名無しさん@お腹いっぱい。 mailto:hage [03/10/12 23:40.net] UTF-8撲滅sage
278 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/12 23:55.net] >>272 で、使ってはいけない理由を言おうとはしないわけですね。
279 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 00:11.net] >>272 > そのWebサイトに書いてあることは嘘があったり重要なことが抜けてたりするので たとえばどの辺ですか?
280 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 00:30.net] 「半角片仮名」という言葉が間違いで「JIS X 0201片仮名」というのが 正しいのだ、と覚えた人には、単に言葉を置き換えればよいと思って いる場合があるようだ。これは肝心なところを誤解している。 何が誤解かというと、JIS X 0201に含まれる片仮名は、普通の「片仮名」 なのであって、「半角片仮名」でもなければ「『JIS X 0201の片仮名』 という名の特殊な片仮名」でもないということ。普通の片仮名なのだから、 JIS X 0208に含まれている片仮名と何の違いもない。 つまり、シフトJISのようにJIS X 0201と0208を組み合わせたコードでは、 同じ「ア」という文字に対して(1バイトと2バイトの)ふたつの異なる 符号化表現を割り当てている(重複符号化)のであって、「半角ア」と 「全角ア」という(あるいは「JIS X 0201のア」などと呼ぶにせよ)
281 名前: 2つの異なる文字があるのではないということ。ここを勘違いした議論は、 どこまでいっても勘違いに終わっている。 勘違いの典型は、「UnicodeでJIS X 0201の片仮名は使えますか?」などと いう質問で、「JIS X 0201の片仮名」などという特殊な片仮名がこの世に 存在しない以上、「Unicodeには片仮名はありますよ」と答えるほかない。 (意地悪な答えだけど) [] [ここ壊れてます]
282 名前:272 mailto:sage [03/10/13 03:18.net] ISO-2022-JP、EUC-JPの場合: 使ってはいけない理由の根本はISO/IEC 2022にあります。JISでいうとJIS X 0202。「7.5 図形文字の一意な符号化」にはこう書かれています。 ----ここから引用---- 同じ文字が8ビット又は7ビットの符号の符号要素のG0, G1, G2及びG3として、指 示される複数の図形文字集合に現れることがある。このような文字は、二つの集 合を定義する仕様又はISO符号化文字集合の国際登録簿で同じ名前をもつ場合、 同じ文字とみなされる。 同一の文字が複数の集合に割り当てられている場合、その文字は、その文字が割 り当てられた任意の符号要素のG0, G1, G2又はG3から取り出された符号化表現で 表現されてよい。 この規格を適用する場合、情報交換の際にすべての文字が一意の符号化表現をも つことを要求されるとき、符号の版の規定(10.1参照)で、その制限を明らかにし なければならない。 符号の一意化の制限を適用した場合、その文字が割り当てられた最下位番号の符 号要素(G0, G1, G2及びG3の順)から符号化表現が表現される。この場合、たとえ、 高位番号の符号要素が既に呼び出されていて、かつ、その文字が割り当てられて いる下位番号の符号要素が呼び出されていないときでも、高位番号の符号要素の 文字の符号化表現は、使用しない。 ----ここまで引用---- 「二つの集合を定義する仕様」というのはこの場合JIS X 0201とJIS X 0208です。 さて、例の「使うとまずい文字」の名称はどうなっているか? なんとJIS X 0201 とJIS X 0208でまったく同じです。たとえば「ア」は両方とも「KATAKANA LETTER A」ですし「?」は「QUESTION MARK」です。つまり半角と全角の二つの文 字があるのではなく、「ア」という文字があってそれが二つの集合に存在するわ けです。続きを読みます。