1 名前:デフォルトの名無しさん [2007/05/27(日) 16:19:36 ] プログラムにおける各種文字コードの処理について語りましょう♪ ■前スレ 文字コード総合スレ part2 pc11.2ch.net/test/read.cgi/tech/1143375639/ ■参考サイト Unicode Home Page www.unicode.org/ Java Character Encodings www.ingrid.org/java/i18n/encoding/ euc.JP: tech docs, BeOS tools euc.jp/ ISO-IR - 2.8.1 Coding systems with Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm ISO-IR - 2.8.2 Coding Systems without Standard return www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
591 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 00:49:35 ] プログラム技術@2ch掲示板 ttp://pc11.2ch.net/tech/ この板はプログラムを作る人のための板です。 プログラム・ソフトの使い方は PC 初心者板やソフトウェア板へ。 ウイルス、ハッキング・クラッキングを求めるような発言は禁止です。 Javascript は Web 制作板、CGI は Web プログラミング板へ。 業界談義、愚痴はプログラマ板へどうぞ。 ゲーム関係の話題はゲーム製作板へどうぞ。 ネタ、板とは関係の無い話題はご遠慮ください。
592 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 02:36:02 ] JIS-X0208-1982はJIS X 0208:1983の間違いだろう。 いわゆる機種依存文字だけ気にしていればいいんじゃね? >588さん 俺の予想では、文字集合を指定されたんじゃなくて、 WordがシフトJISで保存すると勘違いした奴が、1978から1983改訂の際の 文字の入れ替えについて改訂後のことだと言いたかったに一票。
593 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 03:13:41 ] >>592 ありがとうございます! 私もこんなこと言われたの初めてで、びっくりした上、1982なんか ないのに驚いたんですが、1983のことですかとは聞けなくて・・・。 本当にありがとうございました。
594 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 03:30:43 ] >>593 「聞けなくて」じゃなくて聞けよ。プログラマーだろ? 想像でなく正確な仕様と要件にもとづいて仕事してくれ。 たとえば www.webstore.jsa.or.jp/webstore/Com/FlowControl.jsp?lang=jp&bunsyoId=JIS+X+0208%3A1997&dantaiCd=JIS&status=1&pageNo=0 ではX 0208の履歴に1983はありませんが、って言えばいい。
595 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 03:34:42 ] 間違えた。 誤: 1983はありませんが 正: 1982はありませんが つーか寝ようよ。そーゆートコだけプログラマーなのな。
596 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 11:34:51 ] >>594 すいません、私、プログラマーとかじゃないんですよ^^; パソコンについては、平均的な知識しかない書類作成係でして・・・・ この指示も書類作成にあたって渡されたんです。 1983の件を聞けないのは、この指示を出した技術者が、なんというか、 瞬間湯沸かし器なので、彼のプライドを傷つけるようなことをいったら( 1983のことですか?といっただけでも)、大変なことになるので・・・
597 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 11:42:56 ] >>596 >>591 をもう一度読んで
598 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 12:22:46 ] あ、ごめんね、ここの人達は専門の人達だろうから 初心者板にいる人達よりもレベルが高いと思ってきたんだ。 初心者板は起動に関してのトラブルとかばっかりだったし・・ でも、回答くれた方、ありがとう。本当に助かりました。
599 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 12:30:00 ] ところで、システム開発の際に>>585 みたいに1983版を指定された場合、 どこで規格を入手すればいいんですかね。教えてエロい人
600 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 13:06:40 ] ところで、システム開発の際にVisualStudio2008を指定された場合、 どこでそれを入手すればいいんですかね。
601 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 13:41:51 ] ところで、システム開発の際にwin98を指定された場合、 どこでそれを入手すればいいんですかね。
602 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 15:15:12 ] JISも売り物なんだから買え
603 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 15:56:38 ] まぁ、JIS2004の文字を使うなって意味だったんだろうな
604 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 17:16:39 ] こっちでいくら専門家いても指示した当人と話す以上にわかるわけないだろうに。 それでもし間違ってたらどうすんだ。
605 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 22:00:59 ] >>594 プログラマとしてのプライドを持った奴なら、自分で「ズブの素人」なんて言うわけわけねーだろ、常識で考えて。 しかも全角数字使ってる時点で585を超初心者だと見抜けない594ってってナンなの?ゆとり? >>598 「あ、ごめんね」じゃねーだろ。 2ちゃんねるのルールが守れないなら、2ちゃんねるに来るな。 >>600-601 それは文字コードの話じゃねーだろ。
606 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 23:04:25 ] 何このスレ
607 名前:デフォルトの名無しさん mailto:sage [2008/06/01(日) 23:05:07 ] サザエさんの家ににしこりが入るところに見えませんか?
608 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 03:32:03 ] >>602 過去の版の入手方法がわかんないってことでしょ。 www.jisc.go.jp/jis-act/reading.html ぱっと見たけど見つからなかった。電話番号書いてあるから訊くのが早そうだな。 >>605 >>594 だが何でそこまで言われにゃならんかね。 多くのプログラマーが全角英数字を毛嫌いするのは知ってるが、個人的にはありだと思うが。 少なくとも官庁相手に出す文書は全角にしてる。「Java」とか「議事録4月10日」とか。 上のリンク先でも「JIS X 0201」とか「7ビット及び8ビットの2バイト情報」 って書いてるだろ。 ついでにプログラ「マー」って書いたら俺も超初心者扱いか。
609 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 04:45:04 ] ならJISの規格票でいわゆる全角英数がどういう扱い受けてるのかくらい知ってるだろ
610 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 04:49:40 ] 半角だとFAXのとき潰れてしまうます
611 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 06:07:08 ] 608は「全角数字使用の585を超初心者だと見抜けないためにゆとりといわれた」ことに不満を主張しているようだが、それとJISでの全角数字のあつかいとは関係なくね? これだけ使われてるんだし。でも585が(・∀・)カエレ!なのは同意
612 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 09:35:02 ] このスレに居てmohtaを知らんとは言わせん
613 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 15:47:06 ] 誰だっけ?昔うさげにいた人?
614 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 18:35:11 ] 「うさげ」も何年かぶりに聞いた単語だな
615 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 18:49:35 ] ということにしたいのですね。
616 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:02:01 ] >>608 ならUnicode StandardでいわゆるEAST ASIAN WIDTHがどういう扱いを受けてるのかくらい知ってるだろ? それなのにこの場に及んでNORMALIZATIONされていない文字をまだ「ありだと思う」と言い張るその姿勢は実に見苦しい。 >>610 半角は潰れるが全角なら潰れないだと? そんな文字サイズなら漢字は潰れまくりじゃねーか。 >>611 全角数字の扱いだけではない。 厚顔無恥で教えて君オーラ全開な文章から585の人間性を推し量れない608の稚拙さに問題がある。 >>612 知らん。 ゆとりの俺にも教えてくれ。
617 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:12:58 ] >>616 今はアラビア数字の世の中なので。
618 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:24:02 ] EAST ASIAN WIDTHやNORMALIZATIONが何なのか理解できない617ってナンなの?ゆとり? ttp://www.unicode.org/reports/tr11/ ttp://www.unicode.org/reports/tr15/
619 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:37:45 ] JIS X 208:1983の話にUNICODEもちだしてくんなよ。
620 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:47:49 ] >>619 今はユニコードの世の中なので。
621 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 01:38:20 ] ナンなの?ゆとり?
622 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 02:32:46 ] カレーはライスに限る
623 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 02:52:09 ] こないだのザ!鉄腕!DASH!!で新しいDASH村住人のバングラディッシュ人がカレー作ってたんだよ。 ナンみたいなヤツも作ってたんだけど確か違う名前だったような?あれってナンな(ry ttp://www.ntv.co.jp/dash/village/05_ryou/2008/05/
624 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 02:59:42 ] 全角英数字がJIS X 0208では「原則として使用しない」で、Unicode規格でも Restrictなのはわかるが、JISとUnicode規格読んでないとゆとりなんて、 このスレ、ハードル高すぎだっての。 とりあえず次スレは 【ナンなの?】文字コード総合スレ part4【←ゆとり?】 でおねがいします。
625 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 03:09:12 ] >>622 カレーと云えばナン。カレーにライスは邪道。 ttp://food8.2ch.net/test/read.cgi/curry/1103503719/ >>624 空気嫁
626 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 10:48:10 ] > >>612 > 知らん。 > ゆとりの俺にも教えてくれ。 ttp://www.imasy.or.jp/~yotti/rfc1554jp.txt これを書いた人
627 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 10:55:11 ] >>626 JP-2って名前は良くなかったな。
628 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 21:53:57 ] >>626 「mohta うさげ」でググってみたんだが、ゆとりの俺に状況が理解できん。 その昔、うさげというコミュニティが存在していて、そこにはmohtaと呼ばれる伝説の荒らしが常駐してた。 その荒らしがISO-2022-JP-2の規格の根本をまとめ上げたものの、荒らしが作った規格には反発が強く世間には定着しなかった・・・、ってことでおk? それより何でこの話がㇳ突然出てきたんだ? ISO-2022-JP-2と全角英数字と何の関係あるんだよ? 全然わかんね。 てか、ググったら木村浩一さんのサイトにこのスレがコピペされてるのを発見w ttp://www.kt.rim.or.jp/%7ekbk/zakkicho/08/zakkicho0806a.html#D20080602
629 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 22:51:53 ] >>625 カレーと云えば飲み物。噛んで食べるヤツは邪道。・゚・(ノД`)・゚・。ウエエェェン ttp://news24.2ch.net/test/read.cgi/mnewsplus/1212452680/
630 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 23:03:40 ] ああ、あれね、函数の引数をひとつにするやつ。
631 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 23:13:51 ] 世界で最も完成されたカレー、それは・・・ ttp://wiredvision.jp/news/200805/2008050121.html >>629 これだな ttp://mamono.2ch.net/test/read.cgi/newsplus/1212380001/
632 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 10:14:43 ] カレー食いたくなった
633 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 10:34:23 ] >>628 voidとか、lalaとか、現代版はotsuneとか、ちょっと前に言われた「モヒカン」タイプの 元祖のような奴がmohta。暴れるという形容は適用されるけど、荒らしとは違う。 mohtaの特異な点として、JIS X 0208に統一して文章を書くという性質が挙げられる。 (>>626 のRFC翻訳でもそれをやっている) Unicode化の流れに対抗したけど、というあたりは多勢に無勢というか。
634 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 10:36:12 ] ひとつ書き忘れた うさげ == fj.net.usage
635 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 10:38:43 ] 野暮な奴だなお前
636 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 13:56:27 ] >>635 fj の「3馬鹿」も mohta、 lala は聞かなくなったな… void は所を mixi に移してあいかわあらず暴れてるらしいが…
637 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 16:47:29 ] > mohtaの特異な点として、JIS X 0208に統一して文章を書く ホントだワロタ 原文: www.ietf.org/rfc/rfc1554.txt mhota訳: www.imasy.or.jp/~yotti/rfc1554jp.txt 一部メールアドレスまで全角だw
638 名前:デフォルトの名無しさん mailto:sage [2008/06/04(水) 19:30:43 ] ゆとり一歩手前の俺ですがvoidだけは見たことがある。 他はシラネ
639 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 00:10:29 ] >>633-634 ありがとう。 なんとなくわかったかも知れん。 「Unicode化の流れに対抗したけど、というあたりは多勢に無勢」とかは、青空文庫工作員と同じ構図なんだな。 つまり、全角英数字を使うヤツは「超初心者」か「極右(笑)」ってことか。 > ちょっと前に言われた「モヒカン」タイプ 知らん。 ゆとりの俺にも教えてく(ry バブル世代にとっての「ちょっと前」は、ゆとり世代にとっては「大昔」なんだが・・・。 >>638 ゆとりの俺ですがvoidという名前だけは噂に聞いたことがあるw
640 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 00:32:52 ] そんなこと知っても何のプラスにもならないから もう深追いしないほうがいいよ。
641 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 00:34:51 ] ここが「“2”ちゃんねる」なのは、このスレ的にどうなの? 「?」もこのスレでは全角の方が多いようだけど
642 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 01:16:29 ] 管理人が「2ちゃんねる」と全角数字で表記しているんだから、それをわざわざ半角にするのはおかしくね? 疑問符とか感嘆符の類はどっちでも良くね
643 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 01:44:44 ] 小腹が減ったとき食べるカレーヌードルの旨さは異常 ttp://food8.2ch.net/test/read.cgi/curry/1071495811/
644 名前:641 mailto:sage [2008/06/05(木) 01:51:37 ] えーと補足すると、全角/半角というのは単に表示側の表示の問題であって 概念的には同じ文字なので半角にNORMALIZEされた形にすべき、 ってのが昔のvoidの主張だった気がする。JIS X 0208もUnicodeも規格はそういう 考えだったと思う。それがこのスレ的にどうなのかなと。 たとえばUnicodeテキストでWinの「〜(U+2015)」とMacの「〜(U+2014)」が混ざってたら俺としては 2015に正規化したくなる。でも全角半角は事実上すべての環境で表示される字の大きさが 異なるので同じ文字としては扱いたくないなーと。
645 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 02:02:01 ] カレーパンのうた、すげぇw ttp://www.geocities.jp/jugongordie/old/curryfla/curryfla.html >>644 まぁ細かいこと気にするな ( ゚Д゚)⊃ ○ < カレーパン食え ttp://food8.2ch.net/test/read.cgi/bread/1092166761/
646 名前:644 mailto:sage [2008/06/05(木) 02:56:34 ] 間違えた。カレーパン喰ってくる。 (誤) Winの「〜(U+2015)」とMacの「〜(U+2014)」 (正) Winの「‖(U+2225)」とMacの「‖(U+2016)」 ん? いつから双柱って傾いて表示されるようになった? Vistaから?
647 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 00:53:19 ] ‖
648 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 06:36:11 ] itpro.nikkeibp.co.jp/article/COLUMN/20061221/257533/ の図12
649 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 00:31:44 ] IVS対応ATOKマダー(AAry appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1435_ivs-demo-irg30.pdf >>646 メイリオだともっと露骨に斜め45度の線2本で表示される。 まあちゃんと研究してるんだろう。角度とか
650 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 07:22:05 ] Last Resort Font www.unicode.org/policies/lastresortfont_eula.html てっきりエイプリルフールネタだと思ってたのに本気でグリフをUnicodeに収録するつもり なんだろうか
651 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 18:24:17 ] >>650 グリフをUnicodeに収録? まともかく、文字が表示されないときにそれが単にグリフがないせいなのか Unicodeの範囲に入っていないせいなのかわかるとうれしいけどね。 で前者の場合にはだいたいどこら辺の文字かもわかると。 フォントの自動置換が働く場合には特に。
652 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 22:20:54 ] appsrv.cse.cuhk.edu.hk/~irg/irg/irg30/IRGN1470KXRemainder.pdf ようやく見出し文字を全部符号化したUnicode康煕字典が作れるようになるのか。 韓国なんかUNC(緊急に必要な文字)を1万字くらい収録しる! とか無理難題言ってるのに 日本の謙虚さは異常。大漢和の未収録文字くらい提案したって罰は当たらないと 思うんだが
653 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:34:12 ] 日本語みたいにひらがなで書けばいいみたいなのができないから しゃーないのかなと思う所はある。
654 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:09 ] 韓国はハングル専用で日本より脱漢字は進んでいるはずなんだけどな
655 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:41:53 ] そのハングルが合成文字で凄まじい組み合わせ数あるから・・・
656 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:43:09 ] 今回提案されてるのは全部漢字な件
657 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:44:50 ] そうだったのか・・・
658 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 23:53:23 ] Ideographicなんとかグループだから表音文字は対象外だろjk
659 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 00:20:59 ] 表音文字の癖にコード空間を浪費するハングルは、ほんと迷惑文字。
660 名前:デフォルトの名無しさん mailto:sage [2008/06/14(土) 12:48:40 ] インド人の爪の垢を煎じて飲ませたいな (インド系文字もハングル式に実装すると数千字分くらいのコードポイントは平気で使う)
661 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:14:47 ] 俺、ハングルのことは全くと言っていいほど知らないんだが、 それ実際にやったら描画・文字幅計算とかアラビア文字みたいにややこしいことにならない?
662 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:30:44 ] いちおうOpenTypeのグリフ置換の機能を使った組合型の実装例はある (Hangeul Jamoブロックを使った奴ね) Mac OS Xは(互換漢字と一部の記号を除いて)NFDだからHFS Plusのボリューム上では ハングルはバラバラになって記録されてる
663 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 02:47:33 ] 小学生の頃はどんな漢字も部首の組み合わせで表現できると信じていたのを思い出す。
664 名前:デフォルトの名無しさん mailto:sage [2008/06/15(日) 03:32:42 ] 日本政府はわざわざ常用漢字と表外字で字体の違いを発生させて 部首の組み合わせによる表現をやりにくくしてるし
665 名前:デフォルトの名無しさん [2008/06/17(火) 12:24:24 ] ハングルは大移動なんかしないで従来のコードで表せない字母の組み合わせは U+1100〜のHangeul Jamoブロックの組み合わせで表すことにすればよかったのに。 それかどうしても全ての組み合わせのコードが必要なら追加分はBMP外にするべきだったと思う。
666 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 12:54:01 ] BMPを占有しすぎだな。 ttp://www.unicode.org/roadmaps/bmp/
667 名前:デフォルトの名無しさん mailto:sage [2008/06/17(火) 20:06:18 ] >>665 > 従来のコードで表せない字母の組み合わせは > U+1100〜のHangeul Jamoブロックの組み合わせで表す Unicode 1.1までははそうするつもりだったのに全部収録させるためだけに Hangul and ComputerがUnicode Consortiumのフルメンバーになったりしてだな www.unicode.org/history/contributors.html
668 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 10:54:24 ] JIS以降、日本の文字コードで試行錯誤したのをそのままトレースしてるようだなw
669 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 22:29:01 ] 日本がやったのは試行錯誤じゃなくて一学者によるゲリラ活動。
670 名前:デフォルトの名無しさん mailto:sage [2008/06/19(木) 23:14:36 ] 今も続く混乱を考えると一学者だけじゃないな