文字コード統一スレ 1文字目

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 20:42 / Filesize : 257 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

文字コード統一スレ 1文字目

1 名前：とりあえず立ててみた [05/02/24 00:07:38 ]: プログラムにおける文字コードの取り扱いについて議論する統一スレッド
です。

ほぼ前スレ
【UTF8】文字コード変換【SJIS】
pc5.2ch.net/test/read.cgi/tech/1063177450/

参考ホームページ
Unicode Home Page
www.unicode.org/
Java Character Encodings
www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
596 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 18:11:48 ]: ブリテンにはスコットランドもウェールズもあるからね。
597 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 18:14:56 ]: ついでに言うとアメリカも今ではスペイン語人口が多い罠。
598 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 21:14:44 ]: ASCIIには、ユーロもポンドもないからねえ。
599 名前：デフォルトの名無しさん mailto:sage [2005/11/19(土) 22:05:10 ]: つーかいい加減アメリカもメートル使えよな
いつまでもインチとかフィートとか言ってんじゃねーよ
600 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 03:28:00 ]: ASCIIにバックスラッシュが入ったのは、“/\”で and を、“\/”で or を表現したかったALGOL厨の陰謀らしい。
Latin-1に、"oeリガチャ"（フランス語で、「心臓」とかを表すのに使う。超必須）が入らなかったのは、÷を入れたかったドイツの数学者の陰謀らしい。
ちなみに、Latin-1の0xFF (y diaeresis) を使う単語は、仏語に４つしかなく、そのいずれもがほとんど一般には使われないらしい。
601 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 03:54:33 ]: つまり0xFFにoeリガチャを割り当てなかったフランス人ﾜﾛｽ、てことでFA?
602 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 04:18:55 ]: どこも日本みたいな過ち犯してんのかよ
だせーなー
603 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 06:56:21 ]: ISO-8859-1 の元になった DEC のコードでは「oeリガチャ」は確かに×÷の位置に
定義されてるね。「yダイアレシス」は今とは別の位置に定義されていて、大文字
もあったが、アイスランド語が書けるようにしようとか下手に色気を出したので、
アサッテの位置に追いだされたようだ。
604 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 08:35:02 ]: そして文字コード指定のない(あるいは欠けてしまった)ISO-8859シリーズは、
日本の場合より悪いことに、コンピュータによる推測が絶望的だったりする。

どいつもこいつも0x20～0x7Fと0xA0～0xFFを使うことに変わりはないので、
日本のように「文字コードによってはこのバイトは使わない」ということがない。
(まず使わないだろう、というヒューリスティックな推測はできるけど)

しかしどこの文字コードも主に政治の結果が色濃いのが笑えるなｗ
605 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 08:47:04 ]: Latin-1って名前もあれだよな、ドイツ語入ってんのに。
606 名前：557 mailto:sage [2005/11/20(日) 12:41:23 ]: >>600
最近某所でそんな話を不味いノンアルコールビールを飲みながら聞いたんだが…。
607 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 12:57:53 ]: そこでヨーロッパ人にとってはUTF-8サイコー
判定間違えて文字化けもしないぜウホッとなるわけですよ
608 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 14:01:01 ]: 日本は文字化け先進国
なれって怖いよねあたりまえのように数種扱い続けてる
609 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 14:20:19 ]: >>608
漢字ひらがなカタカナalphabetが混在する物を当たり前のように扱ってきたからかもしれんｗ
610 名前：デフォルトの名無しさん mailto:sage [2005/11/20(日) 14:57:13 ]: >>607
まあそれはユーロ記号の件が一番大きいんだけどな。
それ以前にも何度か混乱していた時期があると聞いたが、どうやって乗り越えたのやら。
611 名前：デフォルトの名無しさん mailto:sage [2005/11/21(月) 23:48:16 ]: 責任の一端はTeXにあるという説を提唱してみる。
やつが余計なお世話をしなければ、いかに愚鈍なヤンキーといえども
「あれ、文字、全然足りなくね？」
と即座に気づいたであろう。
612 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 03:59:16 ]: ASCIIにバックスラッシュが入ったのは、R.W.Bemerが、ALGOLのand と or を使えるようにしたかったため。
彼のホームページに経緯が詳述してあったけど、１年前に癌で死んでホームページが消されてから、
そのあたりの資料も一切合財が雲散霧消してしまった。
613 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 04:13:34 ]: le «ÿ» est utilise en gallois et en vieux francais.
On le recontre encore aujourd'hui dans des toponymes comme «l'Haÿe-les-Roese»,
des noms comme «de Croÿ», «Louÿ», or des expressions comme «kir à l'aÿ».
Cette lettre est extremement rare et son insertion dans ISO 8859-1 est pour le moins insolite.
614 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 08:13:17 ]: >>612
URLは? それが本当ならwaybackmachineに残ってそうなものだが。
615 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 08:30:02 ]: Character histories: notes on some Ascii code positions
www.cs.tut.fi/~jkorpela/latin1/ascii-hist.html

ASCIIの誕生←ここの参考文献[4]に載っているかも。
kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications/ASCII.html
616 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 21:06:40 ]: >>615
> Character histories: notes on some Ascii code positions
> www.cs.tut.fi/~jkorpela/latin1/ascii-hist.html

そっからリンクがあったんだが、ドメイン屋にのっとられてる上に
robots.txtでwayback machineが弾かれてて軒並消滅してた。
617 名前：デフォルトの名無しさん mailto:sage [2005/11/25(金) 21:42:02 ]: 作業中だったら言ってくれよ
同じ末路たどってたゴール手前
618 名前：デフォルトの名無しさん [2005/11/28(月) 21:23:52 ]: 嘆や漢の右側だけの文字って文字コードはあります？できれば、旧字体のがあればいいんですけど...
619 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 00:37:17 ]: U+26C29にある。JIS(第4水準)やUnicodeの例示字形では新字体だけど
旧字体も包摂されてるはず
620 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 01:12:43 ]: 般若心経は全部出るようになったんですかね
621 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 07:38:47 ]: もともと般若心経で JIS X 0208 になかった字は「罣」がひとつ
だけで、これは補助漢字にも X 0213 にもはいっているから
とうぜん出るでしょう。
622 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 08:00:07 ]: >>621
もうひとつ「埵」も X 0208 になかった字だけれど、
これも補助漢字・X 0213 の両方にある。
623 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 09:38:26 ]: もしかして、鳩摩羅什訳だと>>621で、玄奘三蔵訳だと>>622という違い?
624 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 17:57:43 ]: 四
圭　これは？あとどうやって出したのその漢字
625 名前：デフォルトの名無しさん mailto:sage [2005/11/29(火) 18:11:20 ]: ヒント：数値文字参照
626 名前：デフォルトの名無しさん mailto:sage [2005/12/01(木) 01:56:19 ]: >>604
ISO-8859シリーズの判別にはEncaが使えるかもしれない。
ttp://trific.ath.cx/software/enca/

EUC-JP,KR,CNとかBig5の区別をするのに各言語の文字
出現頻度を使いたいんだが、どこかにリソースないかな?
日本語のデータはメーリングリストのログ等で準備できるんだが、
中国語、韓国語なんかはgoogleすらできないんだorz
627 名前：デフォルトの名無しさん mailto:sage [2005/12/01(木) 02:11:18 ]: 完成記念

観自在菩薩行深般若波羅蜜多時照見五蘊皆空度一切苦厄
舎利子色不異空空不異色色即是空空即是色受想行識亦復如是
舎利子是諸法空相不生不滅不垢不浄不増不減是故空中無色
無受想行識無眼耳鼻舌身意無色声香味触法
無眼界乃至無意識界無無明亦無無明尽乃至無老死亦無老死尽
無苦集滅道無智亦無得以無所得故菩提薩埵依般若波羅蜜多
故心無罣礙無罣礙故無有恐怖遠離一切顛倒夢想究竟涅槃
三世諸仏依般若波羅蜜多故得阿耨多羅三藐三菩提
故知般若波羅蜜多是大神呪是大明呪是無上呪是無等等呪
能除一切苦真実不虚故説般若波羅蜜多呪即説呪曰
羯諦羯諦波羅羯諦波羅僧羯諦菩提娑婆訶
628 名前：626 mailto:sage [2005/12/01(木) 04:38:12 ]: ２年以上前に同じことを考えた人がいた。
libcharguessというのでCJKのエンコーディングは判別可能みたい。
開発が停止しているのが残念だが、いちおう使えるのでよしとするｗ

ttp://sourceforge.net/projects/libcharguess/
629 名前：デフォルトの名無しさん mailto:sage [2005/12/01(木) 09:20:34 ]: 呪と咒は異体字だったのか。
630 名前：デフォルトの名無しさん mailto:sage [2005/12/01(木) 12:10:56 ]: 般若心経と並んでポピュラーな観音経（普門品第二十五）には「虫偏に元（U+8696）」
があるんだけど、X 0213から漏れてる。

　若惡獸圍遶　利牙爪可怖　念彼觀音力　疾走無邊方
→蚖蛇及蝮蠍　氣毒煙火燃　念彼觀音力　尋聲自迴去
　雲雷鼓掣電　降雹澍大雨　念彼觀音力　應時得消散
　　　　　　　　　　　　　↑これもX 0213
631 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 07:07:45 ]: 明治以降の日本で用例が不足してたんだろう
632 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 07:44:33 ]: そういや文字コードの順番ってどうやって決めたん？
633 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 11:20:55 ]: >>630
ちゃんとはいってる補助漢字サイコー。

仏典関係でいうと「あぬるだ」の「ヌ」がExt-A(3779)で、かつ0213からも
抜けてるんだよなあ。
634 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 12:59:17 ]: >>632
第一水準は音読みの順になっている。第2水準は部首順。ほかは知らん。
635 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 17:44:38 ]: >>633
少
兔という字か。免でも同じか? フォントによって違うな。
636 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 18:11:47 ]: >>632 >>634
第一水準で1ヶ所だけ順番が狂ってるのはJIS漢字字典にもあるし結構有名？
637 名前：デフォルトの名無しさん mailto:sage [2005/12/02(金) 21:06:04 ]: >>633
仏典・漢籍は補助漢字の方が強い。
638 名前：デフォルトの名無しさん mailto:sage [2005/12/05(月) 12:05:06 ]: 「千字文」ももうJISで書けるんでしたっけ。
639 名前：デフォルトの名無しさん mailto:sage [2005/12/06(火) 00:42:50 ]: どのJISよ？

JIS X 0208: 書けない
JIS X 0212: 「清」の左側が「冫」の字がない。「清」でよければ書ける
JIS X 0213: 書ける（書けるように委員が要望したらしい）
JIS X 0221: 書ける
640 名前：デフォルトの名無しさん mailto:sage [2005/12/06(火) 09:34:53 ]: > JIS X 0213: 書ける（書けるように委員が要望したらしい）

www.l-h.co.jp/lhcontents/l-hlib/senji_newjis.html
ここを見るとそう思えますね。U+9D7E [鵾] が第4水準に入ってる。
これのテキスト、なかなか良い。
ただ、「祇」がどうも気になる。「祗」の方が適切じゃないかと。
641 名前：デフォルトの名無しさん mailto:sage [2005/12/06(火) 22:52:03 ]: ttp://tar-yan.cocolog-nifty.com/weblog/2005/11/unicode__sip_52b1.html
拡張Bのフリーフォント。たあやんのフォントは昔からお世話になってるけど
ここまでやるとは。
642 名前：デフォルトの名無しさん mailto:sage [2005/12/07(水) 00:29:58 ]: >>640
をいをい「祇」と「祗」は全然別の字だぞ。
偏のネと示は字体の違いに過ぎないしJISでも包摂されてるけど。
まともな研究者ならしめすへんが示で書かれてないから
駄目なんて言ったりしないし「祗」で代用なんてありえない。

人名用漢字に「俺の苗字がない」って騒いでる奴の多くは
結局そういう絵合わせレベルでしか漢字の異同を認識できない素人なんだよなあ
とはいえ行政がそういう素人に合わせた運用してるんだから仕方ないよな
643 名前：デフォルトの名無しさん mailto:sage [2005/12/07(水) 03:27:58 ]: >U+9D7E

JIS X 0213 に「学芸」としか書いてないのがあやしげ :-)

千字文はいろいろテキストがあるし、「祗」と「祇」は古くから混同されて
いるから、「祇」になっているテキストもあるのかも。

智永のを見たら「祗」になっていたが、「清」はさんずいだった。
644 名前：640 mailto:sage [2005/12/07(水) 09:39:28 ]: > 「祇」と「祗」は全然別の字
だから、もしかして違うんじゃないと思ったということなんだけど・・・
岩波文庫版『千字文』の意味解釈からすれば、「祗」がよさげかと。
でも、「祇」になってるテキスト、けっこうあるかもね。
645 名前：640 mailto:sage [2005/12/07(水) 09:55:15 ]: ついでに、
しめすへんが「示」か「ネ」かは、関係ないことです。
つうか、JISX0213:2004フォントで見れば、どっちも「示」でそこに差はない。
646 名前：デフォルトの名無しさん mailto:sage [2005/12/07(水) 12:23:50 ]: そういえば以前、人名用漢字の表で、「祇」が正しいのに元が「示」を使っているせいで
「祗」を入れてしまったものがあったな。
JIS X 0208 の字体で見て、勘違いしたんだろう。表外漢字字体表があれでは仕方ないな。
647 名前：GNU厨 mailto:sage [2005/12/07(水) 16:44:06 ]: >>641
> ｛転載等の注意｝フリーソフト（データ）です。
> 二次配布は作成者にｅ－ｍａｉｌにて、お問い合わせ下さい。

か。いわゆる自由なフォントではないみたいだな。
648 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 01:44:11 ]: 神津島村に祗苗島（ただなえじま）って島があるんだけど、
www2.kankyo.metro.tokyo.jp/sizen/tyoujuu/hogoku/ichiran.htm
ではわざわざ袛を使ってる。まぁそんだけなんだけども。
649 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 01:45:48 ]: 貼ってから気づいた。これ衣偏じゃんか
650 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 07:34:26 ]: >>649
またレアな字を……

マピオンの表示がちょっと受けた。
ttp://www.mapion.co.jp/c/f?uc=1&grp=all&nl=34/12/14.843&el=139/11/44.769&scl=25000&bid=Mlink
651 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 09:00:36 ]: 子のスレに隊する朝鮮だな。
652 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 09:14:57 ]: どっちでもいいんだという高等な逃げとの解釈もあるかと。
653 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 09:20:05 ]: ↓島の住民からの一言
654 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 10:08:10 ]: 京都の祇園へ行くと祇園の「祇」が正字(示氏)ではなく
JIS83の字体(ネ氏)で書いてあるのがいっぱいある。
655 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 11:32:59 ]: 「新漢語林」で引いたら、祇・祁は「ネ」の方も「示」と同字になってた。
つまり、JIS字体は俗字という扱いと違って、「同等に用いられてきた字体」とされてた。
「ネ」の示偏はかなり古くからあるのかな。
656 名前：デフォルトの名無しさん mailto:sage [2005/12/08(木) 13:04:33 ]: ていうか、楷書だったら「ネ」だろ。
657 名前：デフォルトの名無しさん mailto:sage [2005/12/09(金) 04:32:45 ]: 結局しめすへんの話になってる……。

木簡に書かれた漢隷だとだいたい「示」のようだけど、>>656 が
いうように楷書は昔から「ネ」がふつう。薦季直表（３世紀）の
「神略」の「神」はすでに「ネ」になっている。
ttp://www.nisk.jp/shodokisochishiki/shodojinbutsujiten/img/no03_ph_02_l.jpg
658 名前：デフォルトの名無しさん mailto:sage [2005/12/12(月) 21:05:59 ]: ttp://it.nikkei.co.jp/pc/news/index.aspx?i=2005121203753da
漢字12万字表示可能・東大教授らが世界最多のフォント集
東京大学の坂村健教授らは、約12万字からなる世界最多の漢字フォント集を制作した。
パソコンソフトに応用すれば、普段使わない難しい漢字や古い漢字を
パソコンで簡単に表示できるようになるという。
14日からソフト開発会社などに無償公開する。
659 名前：デフォルトの名無しさん mailto:sage [2005/12/13(火) 00:23:00 ]: 懲りない人だ。
660 名前：デフォルトの名無しさん mailto:sage [2005/12/13(火) 23:55:06 ]: まあ、フォントは利用価値もあるからいいんじゃないの?
Unicodeとのmapping tableはあるのかな。
661 名前：デフォルトの名無しさん mailto:sage [2005/12/14(水) 12:30:30 ]: 東大・坂村研究室、約35万文字の漢字フォントを無償公開
pcweb.mycom.co.jp/news/2005/12/13/023.html
662 名前：デフォルトの名無しさん mailto:sage [2005/12/14(水) 12:51:26 ]: >>661

>「宋明異体字」が34,499字
>「金文釈文文字」661字

を使うことによってどうして

>戸籍データベースの統合

の問題が解決するのか教えてくれ。
663 名前：デフォルトの名無しさん mailto:sage [2005/12/14(水) 15:18:25 ]: 文字数にこだわられてもな。
品質ってのも重要なんだけどな。
664 名前：デフォルトの名無しさん mailto:sage [2005/12/15(木) 02:15:55 ]: なんかこう、
かゆい所に手が届かなくてイライラするってカンジだよな。
665 名前：デフォルトの名無しさん [2005/12/22(木) 14:40:33 ]: 加藤弘一って有名なの？
何か、今授業で文字コード熱く語ってるんだけど。
JIS X 0213を潰した戦犯の一人として芝野に恨まれてるって言ってる。
666 名前：デフォルトの名無しさん mailto:sage [2005/12/22(木) 15:44:04 ]: >>665
南堂センセが有名だというような意味では、確かに有名。
667 名前：デフォルトの名無しさん mailto:sage [2005/12/23(金) 21:13:04 ]: >>665
文字コード界の困ったちゃん。
南堂なみに電波なら害はなかったのだろうが、中途半端にまともなのが
困ったところ。
668 名前：デフォルトの名無しさん mailto:sae [2005/12/23(金) 21:49:19 ]: サイトにあるインタビューにはいいのがあるね。
669 名前：デフォルトの名無しさん mailto:sage [2005/12/24(土) 08:01:14 ]: >>660
GTとUnicodeのマッピングなら
www.open-text.com/download.htm
のCODETBL.LZHから作れそうだけど、Extension A/Bに対応する部分はない。
670 名前：デフォルトの名無しさん [2005/12/26(月) 00:30:40 ]: Unicode 5.0β
www.unicode.org/versions/beta.html

日本に直接影響しそうな変更は今のところなさそうだが、
671 名前：デフォルトの名無しさん mailto:sage [2005/12/26(月) 00:53:03 ]: このスレの住人的に char と wchar_t ってどうなの？
672 名前：デフォルトの名無しさん mailto:sage [2005/12/26(月) 02:18:53 ]: typedef unsigned long long wchar;

#define char const wchar* const* const
673 名前：デフォルトの名無しさん mailto:sage [2005/12/26(月) 04:33:52 ]: >>670
バージョンアップ早いねえ。
674 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 00:59:19 ]: >672
俺これでいいよ
union {
char utf8;
char jis;
char euc;
char sjis;
} kyarakuta;

もうこうしない？
675 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 01:17:14 ]: せめてunsignedは付けてくれ。
676 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 01:23:27 ]: >>675
こう？

unsigned union {
char utf8;
char jis;
char euc;
char sjis;
} kyarakuta;
677 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 01:35:46 ]: ああ、もうそれでいいや。
678 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 02:20:34 ]: UTF-8＝国際連合
679 名前：デフォルトの名無しさん mailto:sage [2005/12/27(火) 22:31:46 ]: >>674-677
クスッた。でもガ板には貼らない。
680 名前：デフォルトの名無しさん mailto:sage [2005/12/28(水) 03:14:27 ]: unsigned union カワユス
681 名前：デフォルトの名無しさん mailto:sage [2006/01/04(水) 22:51:29 ]: 某所の情報によると
Windows Vistaの新しいCTPではメイリオのデフォルト字形が変わっていて
>>256-あたりの問題は解消しているらしい。
ただしＭＳゴシック/明朝には相変わらず新しいほうの字形しか入っていないらしい。
682 名前：デフォルトの名無しさん mailto:sage [2006/01/04(水) 23:41:21 ]: Shift-JISは誰が発明してたかが一部blogで話題になってるね。
slashdot.jp/~yasuoka/journal/334730
d.hatena.ne.jp/ogwata/20051229/p1
spaces.msn.com/members/furukawablog/Blog/cns!1pmWgsL289nm7Shn7cS0jHzA!2225.entry#comment

以下古川語録。

「それがまぎれもない史実であることは、当時のマイクロソフトの本社の廊下に256x256の升目と紙に切り抜いたブロックを紙片を
ずらしながら紙と鋏でマッピングの配置を山下さんが考え、それに対する助言をアスキーの西さんや、古川が求められた記憶があります。」
自分の脳内にあるから「史実」であると。古川氏ﾃﾗｵｿﾛｼｽ。

「99.99%の確立で、MSAの手書き漢字CP/Mのコード体系なる文書があるとすれば、それも山下さんの起草したものではないかと推測します。」
99.99%で論文は剽窃（他人の論文を自分の名前で発表）と断言。古川氏ﾃﾗｺﾜｽ。
683 名前：デフォルトの名無しさん mailto:sage [2006/01/05(木) 00:42:38 ]: 確率と確立を書き間違えている文章に信憑性はない。
これが定説。
684 名前：デフォルトの名無しさん mailto:sage [2006/01/05(木) 06:07:11 ]: > それがまぎれもない史実であることは、～記憶があります。
とか日本語として変だし。
つーかシフトJISの発明者なんて別に名誉でもない(むしろ孫子の代まで
文字コード関係者から祟られそうな)称号なんてどうでもいいわけだが。
685 名前：デフォルトの名無しさん mailto:sage [2006/01/05(木) 06:49:13 ]: 「本人が言ってるのだから剽窃は史実ニダ! 謝罪と賠償を請求しる!」ってことですか。
# むしろわれわれ(誰?)が謝罪と賠償を請求したい
# 3種類の文字コードに対応させたり円記号問題を回避するために
# どれだけのコストが無駄になってきたことか
686 名前：デフォルトの名無しさん mailto:sage [2006/01/05(木) 07:59:01 ]: よくまぁ、非関税障壁として訴えられなかったもんだw
687 名前：デフォルトの名無しさん mailto:sage [2006/01/05(木) 22:00:52 ]: TRONは訴えられたけどなw
やっぱ政治力の違い?
688 名前：479 mailto:sage [2006/01/07(土) 02:42:50 ]: MicrosoftのほうはMS漢字コードと呼び、デジタルリサーチのほうはシフトJISと
呼び、漢字スペースを漢字用のコードで表現するか20H２個で表現するかの
違いがあると本で読んだ気がする。
MS漢字コードは漢字スペースを20H２個で表現し、シフトJISは漢字スペースを
漢字用のコードで表現すると書いてあった記憶があるが、実際にMS-DOSを使って
みると漢字用のコードを使っていて「あれ？」と思った記憶もある。これは
古川享ブログでの話とは逆だ。
その本はアスキー出版のMS-DOSエンサイクロペディアだったような、
ちがったような、日経BYTEだったかも、あいまいな記憶しかない。
NECのPC-9800のMS-DOSのマニュアルには漢字コード体系についての名前が
見当たらなかった。Microsoft以外の人がMS漢字コードと呼んでいただけかも
しれない、一方デジタルリサーチ側は自分たちのコードにシフトJISという
名前を付けたのではないかと憶測でものを言ってみる。
で本当はどうなの？
　　　　　　　　名前　　　　漢字スペース
Microsoft　　　　　？　　　　　？
デジタルリサーチ　？　　　　　？

小形氏が『「シフトJIS」という名称を考えたのは、どなたなのでしょうか？』
と聞いているので回答があるといいなあ。
689 名前：688 mailto:sage [2006/01/07(土) 03:03:35 ]: 688です。名前の479は間違い（別スレの名前）でした。
690 名前：デフォルトの名無しさん mailto:sage [2006/01/07(土) 06:26:36 ]: > (略)と本で読んだ気がする。
>>682の安岡センセイのblogに思いっきり書いてありますがな。
チラシの裏でもせめて読んでから書けば?
691 名前：デフォルトの名無しさん mailto:sage [2006/01/07(土) 10:47:27 ]: つまり、MSAはディレクトリ区切り記号としてのバックスラッシュを意識する必要がなかった。
#CP/M(86)にディレクトリの概念がない上にUnixではスラッシュなのだから蓋し当然である。

当時はA-MSでさえディレクトリ名に漢字を使うことは想定外だったのだろう。
仮に想定していたのなら、その時点で対策をとったはずだ。
想定しつつ対策しなかったとすれば、無能である。
692 名前：デフォルトの名無しさん mailto:sage [2006/01/08(日) 00:09:52 ]: いやCP/MやMS-DOS 1.0ではディレクトリの存在自体が想定外でしたから
693 名前：デフォルトの名無しさん mailto:sage [2006/01/08(日) 00:11:55 ]: C言語がはやりだすのももっと後の時代になってからだしな
694 名前：デフォルトの名無しさん [2006/01/08(日) 01:18:49 ]: ちょいスレ違いかもしれんが質問
iconv 関数の使い方がよくわからんで困ってるんですが
GNU iconv の使い方が纏まっているサイトかMLか掲示板ってないかしら？
iconv 関数から -1 が帰ってくるのに errno が 0 になってたりでわけわからんちん
695 名前：デフォルトの名無しさん mailto:sage [2006/01/08(日) 01:43:17 ]: 自己解決
ここでどうにかなりそう
ttp://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/index.html
スレ汚しスマンコ
696 名前：デフォルトの名無しさん mailto:sage [2006/01/08(日) 03:02:40 ]: >>694
ぐぐればman pageとかひっかかるのに。
他にはThe Single UNIX(R) Specification, Version 3とか。
www.unix.org/version3/online.html

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef