1 名前:無名草子さん mailto:sage [2012/02/28(火) 21:59:25.82 ] www.aozora.gr.jp/index.html ■前スレ 青空文庫6.5棚目 toro.2ch.net/test/read.cgi/books/1284042704/
301 名前:無名草子さん mailto:sage [2012/05/27(日) 21:50:22.36 ] >>298 “「一ケ月」「保土ケ谷区」といった入力は、JISの規定から外れている。” という文章は、JISの規定から外れていませんね。内容が事実かどうかは別として。 では、 “「保土ケ谷区」のケは大きなケです” という文章はどうでしょう。 JISの規定から外れてますか?
302 名前:無名草子さん mailto:sage [2012/05/27(日) 22:12:07.95 ] > JIS規格では意味読みを考えて同定しろと規格でいっている なら、同定を含んでいない > JIS X0208 または 0213で符号化できれば、 > 第3、第4水準の文字を使えば、 単なるこういう行為は規格から外れると思う。 >“「コンピュ―タ」「コンピュー夕」といった入力は、JISの規定から外れている。” がJIS規格から外れないのは、 「コンピュ―タ」「コンピュー夕」が規格に外れている文字だと同定(意図)した上で、 JIS X0208内の「―」や「夕」で符号化が行われているから。 テキストが、入力者が意図した通りの文字で別環境でも表示される事の保証と (AAはフォントの実装に依存してるからフォントまで指定しないとダメだけど) テキストが同定行為を含めて規格に準拠した物であるかどうかは、 別問題なんじゃないかな。富田氏的には。
303 名前:無名草子さん [2012/05/28(月) 08:58:39.37 ] 遊びや芸術(アート?)でJIS漢字を利用するのは、JIS準拠というのとは 水準の違う話だろうと思う。正確な情報の交換というJISの目的からは はずれる。 文字の同定というのは規格書がうるさいほどいっているように、典拠の ある読み(これが基本)、加えて意味があることを証明することができ ることだと思う。だから档、畩といったほとんど誰も知らないような 漢字がJISX0208にあるのは、鹿児島県の地名として現実に使用されて いるからである。 結局、JIS漢字に準拠しないのはどういう場合かというと、JISでは片仮名 としてしか認めていない「ケ」を遊び心ではなく、まじめな情報伝達 の文字として、漢字だと主張することである。いいかえれば片仮名の「ケ」 には「け、こ、か、が」という4つの読みがあるという奇想天外な主張 をすることである。これがJISに準拠していないということである。 「ケ」を漢字として同定することはJIS規定違反(準拠せず)なのである。 ということは「市ケ谷(いちがや)」はJIS違反か? その通り違反である。 だからトミーは苦し紛れに「市ヶ谷」と改変した。かれだって、ちゃんと 見えている。大小の違いはわかる。無理を承知でやったのだ。だから今でも まだ吹っ切れていない。(つづく)
304 名前:無名草子さん [2012/05/28(月) 08:59:15.88 ] しかしJISに準拠しながら、なおかつ「市ケ谷」と入力してもいいという、 ツッチーの主張は無理以前、「理」のかかわる次元ではない。ただの寝言。 では現実の情報伝達として、公文書で「保土ケ谷」とか「金ケ崎」が使用 されたら違反か? 違反である。ここからが問題だ。JIS規格に違反した からと言って実際の情報伝達に使用できないとか、使用してはならない とか言うことにはならないということ。手書きなら「ケ」は漢字ですと いえるが、現実に手書きで情報伝達することはほとんどない。JIS漢字 を使うのが普通である。だったら片仮名の「ケ」で代用するしかない。 全く同じなんだから、わざわざ外字にしたりすることはない。 だから代用ではなく正真正銘の漢字だ(本人は片仮名という かただの図形だと思っているらしいが、客観的に見れば漢字 だと主張しているのと同じ)という訳のわからない主張をし て、だからJIS違反ではないとわめきつづけるちょっとおかし なやつがいるなあといった次元の話に過ぎない。
305 名前:299 mailto:sage [2012/05/28(月) 18:40:51.34 ] >>302 まったくもって仰るとおりなので、JIS X0208や0213を少し読んでみた。 結果、自分に見つけられたのは、 5.3 名前 この規格では、規定する全ての文字に対して名前を割り当てる 附属書4 g) 日本語通用名称 日本語で通用している名称の例。この欄は、参考であって規定の一部では無い。 他の箇所でも似た表現はあったけど多くなるので割愛させて欲しい。 と、>>303 の言うような >文字の同定というのは規格書がうるさいほどいっているように、典拠の >ある読み(これが基本)、加えて意味があることを証明することができ >ることだと思う とは真逆で、 規格書はうるさいほどに、意味・読みは例示に過ぎないと繰り返している ように読めた。 これほど反対に読めてしまうのはおかしいので、改めて考えて見たんだけど、 >>303 氏の上の主張(繰り返すと長いのでこれで簡便)w は、 JISの規格として、当該漢字を採用するかどうかにあたって検討した根拠に 付いて言及した部分を解釈したのではないかと思う。 >>303 氏には反論のようになって申し訳ないけれど、同定の手段として 読み・意味を用いよと、ニュアンスだけでも規格書に書かれている部分を 教えて欲しいと思う。そうすれば重点的にそこを読んで、自分の理解が どれ位浅かったか、考え直す手がかりになるので。 手間をかけさせてしまって申し訳ないけれど、お願いします。
306 名前:無名草子さん [2012/05/28(月) 19:48:11.56 ] よく読んで頂き感謝致します。反論や批判は歓迎する所です。 規格書が意味読みは例示に過ぎないとうるさいほど言うのは 事実です。私もそう思います。つまり名前というのはインデ ックスとしての名札に過ぎません。漢字の場合は多数ある読み の内の一つに過ぎません。もっともそれも索引にあるだけで、 名称はただの番号です。なぜか。それは規格書というのは、辞典 ではないからです。辞典などに到達するためのステップです。 だから例示でいいのであって、正確な読みを網羅する必要は ないわけです。だからハイフンマイナスなどというおかしな 名前もありますし、々には「ノマ」などという名前まである。 私は始めなぜ「ノマ」と読むのかと悩んだものです。 ところで、当該漢字を採用するにあたっての根拠とおっしゃる 所が、つまり同定というところにつながってきます。JIS漢字と 同じ基準でもってわれわれJIS漢字利用者も同定しなければなら ない。見た目の形だけが合っていれば、読みはどうでもよいと いった同定をしてはならないということです。JIS漢字の示す 名前や索引は例に過ぎないが、それを手がかりにして、必ず 読みで同定せよと言うことです。規格書が示す読みの問題と、 文字のもつ読みで同定するという問題とは、観点が違うので はないでしょうか。具体的に規格書のどこかにそういうことが 書かれている所はないか、ということですが、すこし時間を おかし下さい。
307 名前:無名草子さん [2012/05/29(火) 17:29:56.06 ] X0208、3.1.2空き領域 漢字を割り当てる場合、同定を補助する情報を 一つは示さなければならない。具体的には、部首、音訓、字典の 情報、地名・人名の典拠…。 ○漢字以外の図形文字の項目も有るが略。なお図形文字というのは、文字 とほぼ同義であって、普通に言う(又はツッチーの言う)図形という意味 は一切ありません。あれは制御文字をも含めた定義を全く理解しないもの です。もとにもどって、空き領域にも同定情報が必要ということは、すで に装備されている漢字にもその種の同定情報が必須と言うことです。その 場合音訓がもっとも利便性が高いので、それの索引がJIS漢字にはついて います。そういう同定情報によって同定されたものとして情報交換に 使用されることによって円滑な情報交換が可能となります。それを無視 して、見た目の図形的な一致(つまりOCR的な一致)で同定し、使用 してもよいとはいっていません。文字としての同定情報が必須だとは、 この項目以外の所でも何度か繰り返されています。文字ですよ、ここを しっかり認識して下さい。図形ではないのです。文字ならば、読み・ 意味があるのは当然です。OCRで認識して、片仮名のニと漢字の二 の誤認識が大変多いのにうんざりしませんか。ツッチーのいってる ことはそういうレベルなんです。正確な情報交換などできるわけが ありません。文字の読みや意味をよく考えて、コードを選ぶ。これが 規格書が繰り返しいっていることであり、見た目の一致で選んでもよい などとはどこにもいっていません。もしいっているというなら、示して もらいたい。
308 名前:無名草子さん mailto:sage [2012/05/30(水) 04:10:27.79 ] >>298 >“「コンピュ―タ」「コンピュー夕」といった入力は、JISの規定から外れている。” >という文章もJISの規定から外れているのですか? >○はずれません。ここに出ている二つの片仮名語は、意味を成さない >文字列の例として出ています。無意味という意味を持っていますので、 >JIS漢字の規定からはずれません。つまりJIS漢字の誤用ということに >はなりません。 それでは最初にあなたが>>204 であげた「コンピュ―タ」「コンピュー夕」も、 意味を成さない文字列の例なのだから、 実はJISの規定からは外れていなかったいうことですね。 結局、JISの規定から外れるというのは具体的にはどういう事で、 外れるとどのような困ったことが起こるのですか?
309 名前:無名草子さん mailto:sage [2012/05/30(水) 07:43:19.48 ] JIS以外の文字コードを使っている場合とかね
310 名前:無名草子さん mailto:sage [2012/05/30(水) 08:04:59.97 ] とか、じゃないんだな。 JISの規定から外れると言えるのは、JIS以外の文字コードを使っている場合だけ。
311 名前:無名草子さん [2012/05/30(水) 08:23:10.97 ] >>308 298は私ですが、204は私ではありません。ということで質問には 答えられません。意見が違いますから。 >>310 ユニコードとJISコードの第3第4水準とは大方同じです。さら にはX0208は世界のコードの大部分の基本になっているようです。 専門家ではないのでよく知りませんが。今日の公開も、あの、 底本では、ヶをケにしていますという、吐き気のするような注記が ついている。これはJISの決まりを馬鹿正直に守っているだけ。 まさしく馬鹿としか言いようがない。あんなおかしな工業規格を 絶対順守するなどとはちゃんちゃらおかしい。ごく一部のJISマニア の自己満足だろう。
312 名前:無名草子さん [2012/05/30(水) 09:04:00.66 ] JISコ−ドと他のコードをまぜて使用することもできるらしい。 こういうのは規定からはずれるというより、JISコードの部分 の文字だけは規定にあっているということではないか。つまり あうとかあわないとかは、文字単位の話で、文章の話ではない のだろう。ということで繰り返しになるが、「ケ」を漢字と して使用することは、文字単位の話として規格外であるといえる。 そしてそんな規格などはくそくらえだというのが私の立場。 それにしても、ケヶ以外の青空の注記でも、ツッチーでは ないが、非常識でむかむかするのが多すぎる。よっぽど おかしな変な偏見の持ち主の集まりなんだろう。青空の 決まりに大反対という意味では、ツチイーに同意する。 ただし、あのくだらない言葉遣いとへりくつだけは ごめんだ。
313 名前:無名草子さん [2012/05/30(水) 09:06:33.32 ] ツチイーはツッチーの誤植です。
314 名前:無名草子さん mailto:sage [2012/05/30(水) 13:39:52.79 ] その誤植はJISの規定から外れているだろうか?
315 名前:無名草子さん [2012/05/30(水) 15:57:51.70 ] 前後の流れからして意味が通じませんので、書いた本人が読み直して誤植 と判定しました。心やさしい皆さん方が通じるとおっしゃっても、本人が 誤植と言えば誤植です。ところで誤植とJIS規格準拠かそうでないかとい うのとは、問題が別ですね。もし私が、「ツチイー」の「チ」を「ッ」と 読めるとみなし、「イ」を「チ」と読めるとみなし、JIS規格は読みを規定 していないと主張すれば、規格はずれです。
316 名前:無名草子さん mailto:sage [2012/05/30(水) 22:15:34.54 ] 「コンピュータ」の「タ」を正確に入力できるのは、 「タ」がカタカナで、漢字の「夕」ではないと知っていて、 そう判断しているからですよね。 見た目だけだと間違える可能性もあります。 同様の問題として考える為に、仮に、 「ヶ」を大振りにした文字が規格に存在したとすると、 見た目だけで、「関ケ原」の「ケ」をカタカナの「ケ」ではなく 漢字由来の「ケ」と判断して、それを正確に入力できるのでしょうか? 土屋氏の見た目主義というのは、規格に大振りの「ヶ」がない事を 利用したバッドノウハウみたいな物で、例えば 「コンピュータ」を正確に入力する為のルールと不整合を起こすと思います。 ヶケ問題は同定した上でどちらで入力するかと言う問題なんじゃないでしょうか。
317 名前:299 mailto:sage [2012/05/30(水) 23:55:03.91 ] >>307 ,308 回答ありがとうございます。 その点を重点的に読んでみますが、元から少ない理解力が更に落ちてきているので 新たな疑問、意見のすりあわせのための確認にお時間を頂きたいと思います。
318 名前:299 mailto:sage [2012/05/30(水) 23:56:50.34 ] 上は安価ミスで、 >>306 ,307です。すみません。
319 名前:無名草子さん mailto:sage [2012/05/31(木) 07:43:59.31 ] ●私がケヶ指針廃止の決定と言っているのは、メーリングリストの No.6800(2008/10/25)〜No.6946(2009/3/1) にかけての話です。見てきてごらん。 メーリングリストに参加してない人でもアーカイブってみれるんだっけ?
320 名前:無名草子さん [2012/05/31(木) 08:30:34.45 ] >>316 手書きの場合は、ニと二、夕とタどころか、「シ」のつもりで「ツ」と書くの がいる。それに迎合したのか、私の認識ソフトは、「シ」と「ツ」が逆転する ことがある。土屋氏の紹介したパナソニックの「認識革命」の体験版をつかっ たが、革命どころかアンシャンレジーム。それを活字やJIS漢字はすべて正しい 文字にしてくれる。数字の二を誤認識で色つきのニと出たら、いちいち数字の 二に再変換(一括変換でもいいがたいして便利ではない)しなければならない。 何と不便なこと。手書きならどっちでもかわりはないのに。 ところで漢字のケはJIS漢字では収録不能だろう。漢字は普通片仮名より大きめ に作るのだが、今ある片仮名のケより大きめのケを製作して漢字の分野に収録 するのは現実的ではない。それほどに、現実ではヶが多用されており、ケは 片仮名として定着してしまい、関ケ原のケなどを見ると、なんだこれは? 片仮名のようで片仮名でない、それはなんだと問われたら、言われん、 言われん、だ。ちょうど変体仮名で書いた「そば屋」の暖簾のようだ。 土屋氏のように片仮名だと割り切ると楽だろうが、どう考えてもあれは 片仮名ではない。数量を示すときは「箇」又は「個」、助詞の場合は「が」 を使うように政府で指導し、固有名詞の場合は特例的に漢字の「ケ」を 認めるとかしてだんだん変えていけば、何とかなるだろうが、今の 混乱状態では(といっても言葉はいつの時代でも、またこれからも、 混乱状態が宿命)JIS漢字では手の打ちようがない。こまるのは土屋氏 のようなJIS漢字の誤解と、トミーのような変人のものしらずの片意地だ。
321 名前:無名草子さん [2012/05/31(木) 08:59:14.72 ] ツッチーがまたでたらめをこきまくっている。ヶは片仮名だとさ。規格書 をあと五回読んで、ちゃんと理解してからものを言え。レッテル万能主義者。 見た目主義だと自分でいっておきながら、批判されると、そうではないという。 責任能力欠如のあんぽんたん。∞は○が二つひっついたものには見えないん だってさ。まだ眼科へは行っていないのか? はやく行かないと手遅れになるぞ。
322 名前:無名草子さん [2012/05/31(木) 09:17:09.26 ] 「山上復有山」を「出」と読む。これはツッチーのような人間には まず理解不可能。
323 名前:無名草子さん [2012/05/31(木) 10:08:27.91 ] ツッチーよ。お前には貸しがあるぞ。ありもしないことでおれを侮辱 しただろう。そしておれは謝罪しろとはっきり言っただろう。おまえ は一山いくらの匿名人間などに人格権などないというような応対をし ただろう。卑怯ものめ。逃げどくをするつもりか。 ごまかすな。きちんと謝罪しろ。手をついてあやまれ。3日も4日も 無視してまとめて何もなかったかのように喧嘩を売り、挑発を続ける 社会のごみ。
324 名前:無名草子さん [2012/05/31(木) 18:32:19.15 ] >>321 >>322 >>323 くだらないことを書きました。取り消します。どなたか掃除して下さい。 書きすぎですのでしばらく遠慮します。
325 名前:無名草子さん mailto:sage [2012/06/01(金) 05:22:58.79 ] >>311 >298は私ですが、204は私ではありません。ということで質問には >答えられません。意見が違いますから。 なるほど。204氏はもう掲示板からいなくなったようですね。 >ユニコードとJISコードの第3第4水準とは大方同じです。さら >にはX0208は世界のコードの大部分の基本になっているようです。 このあたりの理解はすべて間違っています。 第3第4水準を含むJIS X 0213:2000の収録文字数は11,223文字ですが、 Unicode3.2だと95,221文字です。 また、世界のコードの大部分の基本になっているのは、 あえてあげるならASCIIコードでしょうか。 日本工業規格であるJIS X 0208が世界のコードの基本のわけがないです。
326 名前:無名草子さん [2012/06/01(金) 08:55:02.66 ] 「大方」と「基本」という言いまわしがまずかったようです。すべて 間違いというのは言い過ぎですね。第3第4水準はおおかたユニコード に含まれてしまうとすればいいでしょうか。 あまりによくできた日本工業規格だったので、その後の世界のコード 設計の基本になるほどの影響を与えたとしたらどうでしょうか。 この理解でもすべて間違いでしょうか。お教え願います。 昨日書かないと言って今日書いていますが、あの○○に応対すると こっちまで○○になるので、それはやめると言うことですので、 どうぞよろしく。
327 名前:無名草子さん mailto:sage [2012/06/01(金) 13:40:45.03 ] >>326 やはり間違いです。 > 第3第4水準はおおかたユニコード > に含まれてしまうとすればいいでしょうか。 第3第4水準漢字は*すべて*Unicode3.2に含まれています。 *おおかた*ではありません。 > あまりによくできた日本工業規格だったので、その後の世界のコード > 設計の基本になるほどの影響を与えたとしたらどうでしょうか。 日本工業規格が世界のコード設計に影響を与えたという事実はありません。 日本工業規格であるJIS X 0208が世界のコードの基本のわけがありません。
328 名前:無名草子さん mailto:sage [2012/06/01(金) 15:57:31.72 ] 群盲像をなでる。
329 名前:無名草子さん mailto:sage [2012/06/01(金) 16:06:18.50 ] OCRが象を誤認識したんだな
330 名前:無名草子さん [2012/06/01(金) 19:21:26.84 ] JISX0208が世界のコードの設計に影響を与えたと、今、思い出せま せんが、どこかの専門家が著書で書いていました。JISX0208には 当然英語版がありますし、そこの術語は世界中で通用するようです。 英語だから当然だし、もともと制御文字とかなんとかみな英語を訳 したものです。だから何となくletterのような感じで取る人が多い けれど、あれはcharacterのことで、あの場合の文字の概念を正し く理解するのは厄介だともいっていました。それはともかく、 X0208には欧文用の文字もほとんどあり、そういう文字のコードの 割り振りというか設計というのは世界中で通用するのではないで しょうか。JISだから日本でしか理解されないとか外国に影響する ことはないとかは考えられないですね。科学技術に国境はありません。 基本のではなくて基本になるほどの影響ですが、だめですか。
331 名前:無名草子さん [2012/06/01(金) 19:36:06.64 ] それでは含まれるを訂正して、おおかた同じであると修正します。 面句点番号とユニコードの番号とは違うからです。328さんへ、 表現がおだやかではありません。ほかの表現を考えて下さい。
332 名前:無名草子さん [2012/06/01(金) 19:52:44.60 ] ウィキペディアで泥縄しますと、ユニコードを二つ組み合わせないと 表現できないものもあるそうです。非漢字も含めての話ですが、 非漢字は第3第4水準とはいわないのでしょうか。ユニコードと いっても3.1までは第3第4水準の全部を含んでいなかったよう です。CJKとのかねあいで、コードがうじゃうじゃしている のもあるようです。「間違いです」と切って捨てるほどのこと でもないんじゃないかな。専門家ではないと始めからことわって あるから、素人にしてはよく勉強してていると自己納得しています。 要は言葉遣いですね。
333 名前:無名草子さん mailto:sage [2012/06/01(金) 22:54:44.52 ] >>326 ぞう。いや、そう。
334 名前:無名草子さん [2012/06/02(土) 08:24:44.30 ] 例の○○がわめいている。全部、規格書も理解できない、さらには日本語 のいろはもご存じない○○の言い続ける妄想だからいっさい気にすること も、まじめに読む必要もない。どこかで犬が吠えていると思えばよい。 328さんへ、あきらかに差別語ですよ。取り消した方がよろしい。
335 名前:無名草子さん [2012/06/02(土) 08:55:51.60 ] www.ricoh.co.jp/font/related_info/mail/img/20060307JIS3hikanji.pdf 第3水準非漢字というのはここにあるようなものです。
336 名前:無名草子さん [2012/06/02(土) 09:20:39.68 ] この中の半濁点付き、かきくけこカキクケコはユニコードにないということです。 つまり全部ふくまれているわけではない。ちょっと言い逃れくさいですかね。 JIS規格では、非漢字も漢字というと定義しているのですが、だれでも第3 水準の漢字といえば、非漢字はふくめないでしょうからね。 いおりてんはユニコードにあります。釈迦に説法ですか。
337 名前:無名草子さん mailto:sage [2012/06/02(土) 20:15:50.79 ] 「か°」ってなんて発音するんだ?
338 名前:無名草子さん mailto:sage [2012/06/02(土) 20:20:39.42 ] コンピュータ上での日本語処理について語るスレはこちらでしょうか?
339 名前:無名草子さん mailto:sage [2012/06/02(土) 21:35:58.19 ] >>336 またまた間違いです。 > この中の半濁点付き、かきくけこカキクケコはユニコードにないということです。 半濁点付き、かきくけこカキクケコは Unicode3.2に含まれています。 Unicodeはバージョンによって含まれる文字が異なるので、 バージョンを指定しないで議論しても無意味です。
340 名前:無名草子さん mailto:sage [2012/06/02(土) 21:39:23.03 ] >>337 「か°」は鼻濁音です。鼻に抜けるように発音します。 Wikipedia 鼻濁音 ja.wikipedia.org/wiki/%E9%BC%BB%E6%BF%81%E9%9F%B3
341 名前:無名草子さん [2012/06/02(土) 21:53:40.26 ] か°の発音はあの青空の掲示板に張り付いている○○の豚野郎による と、わからなくてもいいんで、とにかく見た目主義だから、同じ図形 が出てきたらそれで入力するだけのことだそうだ。NHKのアナウンサ ーの発音を聞くと、雨か°降るでしょうとかいってるよ。それより、 セ、ツ、トに半濁音のついたのはどう発音するんだ、全然わからねえ。 第3水準にあるんだから典拠はあるんだろ。あの○○か専門家に聞いて みてえな。アイヌ語だとかいうかな。 328よ、差別発言は削除せよ。
342 名前:無名草子さん [2012/06/02(土) 22:00:32.00 ] 329はあの○○だな。
343 名前:無名草子さん mailto:sage [2012/06/02(土) 22:17:20.64 ] アマチュアの論理 ・理想論を規範論にする ・当事者の能力や努力を知らず,無能・無責任・怠惰と批判する。 ・プロは,ミスをせず,また,変化や危険を予知できる存在と決めつけ, それに反する事故が発生すればプロ失格と批判し,時には,犯罪者にする。 ・難しいこと,危険なことを簡単に考え,「やれ」と言う=「素人の暴論」 ・成功や失敗の理由を,1〜2の要素に求め,短絡的に理解し,論じる。 特に「アイデア」,「意識」,「体質」,「制度」,「組織構造」などに求める。 ↓ ・現在の制度のデメリットのみをあげつらう。 ・新たな制度のメリットのみをアピールして提唱する。 ・新たな制度のデメリット,副作用を考えない(知らない?)。 ↓ ・新たな制度が諸問題を一気に解決すると考え,改革や革命を連呼する。 ・できない理由を,改革する想像力や意欲の不足に求める。 ・トレードオフがある課題を,同時にやれという(たとえば,迅速と的確)。 ランチェスター思考 競争戦略の基礎 (福田秀人著 東洋経済新報社刊)より
344 名前:無名草子さん mailto:sage [2012/06/02(土) 22:21:25.01 ] 詭弁の特徴15条 1:事実に対して仮定を持ち出す 2:ごくまれな反例をとりあげる 3:自分に有利な将来像を予想する 4:主観で決め付ける 5:資料を示さず自論が支持されていると思わせる 6:一見関係ありそうで関係ない話を始める 7:陰謀であると力説する 8:知能障害を起こす 9:自分の見解を述べずに人格批判をする 10:ありえない解決策を図る 11:レッテル貼りをする 12:決着した話を経緯を無視して蒸し返す 13:勝利宣言をする 14:細かい部分のミスを指摘し相手を無知と認識させる 15:新しい概念が全て正しいのだとミスリードする
345 名前:無名草子さん mailto:sage [2012/06/02(土) 22:21:36.11 ] >>339 > 半濁点付き、かきくけこカキクケコは > Unicode3.2に含まれています。 大変、勉強になりました。 Unicode3.2に含まれているという、「半濁点付き、かきくけこカキクケコ」のコードを、教えていただけますか?
346 名前:無名草子さん mailto:sage [2012/06/02(土) 22:41:46.10 ] >>345 > Unicode3.2に含まれているという、「半濁点付き、かきくけこカキクケコ」のコードを、教えていただけますか? 以下の通りです。 か゜ U+304b U+309a 半濁点付き平仮名か き゜ U+304d U+309a 半濁点付き平仮名き く゜ U+304f U+309a 半濁点付き平仮名く け゜ U+3051 U+309a 半濁点付き平仮名け こ゜ U+3053 U+309a 半濁点付き平仮名こ か゜ U+30ab U+309a 半濁点付き片仮名カ き゜ U+30ad U+309a 半濁点付き片仮名キ く゜ U+30af U+309a 半濁点付き片仮名ク け゜ U+30b1 U+309a 半濁点付き片仮名ケ こ゜ U+30b3 U+309a 半濁点付き片仮名コ Wikipedia JIS X 0213非漢字一覧 ja.wikipedia.org/wiki/JIS_X_0213%E9%9D%9E%E6%BC%A2%E5%AD%97%E4%B8%80%E8%A6%A7
347 名前:無名草子さん mailto:sage [2012/06/02(土) 22:50:02.09 ] >>346 なぜ、一つの文字に、二つのコードがあるんですか?
348 名前:無名草子さん mailto:sage [2012/06/02(土) 23:02:18.65 ] >>347 基本文字と前進を行わない文字との合成文字なので、基本文字のコード+合成用文字のコードの2つが必要なのです。 余談ですが、この合成された文字に専用のグリフ(図形)を用意するか否かはフォントデザインに依ります。 これは、普通のアルファベットでもfi やff 等の合字(リガチャ)に専用デザインを起こしているものもあれば、ないものもあるのと同じだと思ってください。 (特に余談部、誤りがありましたら遠慮無く指摘ください)
349 名前:無名草子さん mailto:sage [2012/06/02(土) 23:12:23.50 ] JIS X 0213が定義した、例えば「半濁点付き平仮名か」は、既存のひらがな「か」(U+304b)と半濁点(U+309a)の組み合わせで表現する。 つまり、Unicodeには、独立した文字としての「半濁点付き平仮名か」は収録しないということが、二つのコードポイントの意味です。
350 名前:無名草子さん mailto:sage [2012/06/03(日) 00:06:24.61 ] 某氏が強弁している図形概念について考えて見た。 まず、彼の人の聖句である「図形文字は図形概念(見た目)によるものであるので」これは部分抜き書きに更に「見た目」という単語を付加し、ミスリードを誘っているに過ぎない。この全文は、 4 定義 w) 包摂 (unification) 複数の字体を区別せずに、それらに同一の句点位置を与えることをいう。 備考 図形文字は図形概念によるものであるので、異なる文字であっても、図形概念として区別が困難なものは、この規格では、字体の包摂基準に準じて同一句点位置を与えることがある。 とある。ただし図形文字は 6.5 図形文字 で定義されているので、備考の優先度より本文の優先度が高い。 つまり、図形文字は図形概念によるもので(略)は包摂の考え方について、参考に述べているに過ぎない。 また、問題を複雑にしている図形概念という言葉が、包摂の参考にしか書かれておらず、これが誤解を生む原因だとおもわれるが、規格を読むと一番近い意味合いと思われるものは、図形文字、抽象的概念という単語を説明に含む、 i) 字体 (ZITAI) 図形文字の図形表現としての形状についての抽象的概念。 と考えるのが自然であり、字体の図形表現(ここでやっと見た目が出てくる)であるところの h) 字形(ZIKEI) 字体を、手書き、印字、画面表示などによって実際に図形として表現したもの になって、はじめて視覚的表現を持つ様になる。 以上より、「図形文字は図形概念(見た目)によるものであるので」を抜き出し、強弁するのは詭弁であると考える
351 名前:無名草子さん mailto:sage [2012/06/03(日) 01:00:16.54 ] >>343 同感。
352 名前:無名草子さん mailto:sage [2012/06/03(日) 03:34:25.58 ] かたかなの「ケ」を、物を数える「一カ年・一コ」の「箇」に代用することがあり、 近来は「一ケ・二ケ」等を、「イッケ・ニケ」等とよむようにもなった。 小学館「日本国語大辞典」より 片仮名の「ケ」を「箇」に代用することがある。 「一ケ年(=一箇年)」「一ケ月(=一箇月)」など。 三省堂「大辞林」より 个:物を数えるのに使う語。数詞と、序数を表すことの多い助数詞の 間にはさんで、序数ではなく個数を表すことを示す。 多く「个」のかわりに片仮名の「ヶ・ケ」を用いる。 新潮社「新潮日本語漢字辞典」より
353 名前:無名草子さん mailto:sage [2012/06/03(日) 03:36:30.66 ] www.bunka.go.jp/kokugo_nihongo/joho/series/37/pdf/kokugo_series_037_02.pdf (1) かなの使い方 「三ケ年」か「三か年」か 【問】 教科書では「三か年」と書いてあるところを,読み物によ っては「三ケ年」と書いてあるものがあります。「ケ」はか たかなの「ケ」なので,こどもは「三け年」と読みます。「ケ」 は「か」と読む漢字ですか。 【答】 もとは「个」と書いた漢字で,音は「カ」です。「竹」の 字の片方で,「箇」の字のもとです。 そういう字で,「三ケ年」の「ケ」は漢字のつもりで書き はじめられたのかもしれませんが,今日では漢字とは考えら れないので,「三ケ年」は「三か年」と書くように公用文で は決まっています。それを「ケ」で書くのはまだこれまでの 習慣が残っているので,おいおいに改まることと思います。
354 名前:無名草子さん mailto:sage [2012/06/03(日) 03:37:37.16 ] 地名の書き方 六、地名に「ヶ」「ッ」など小文字が入る表記は使わず、 大文字の「ケ」「ツ」などとする。ワープロは小文字を 表示することが多いので注意。 〔例〕 霞ケ関駅 槍ケ岳 茅ケ崎 八ツ場ダム 一ツ橋 共同通信社「記者ハンドブック 第11版」より
355 名前:無名草子さん mailto:sage [2012/06/03(日) 03:45:39.73 ] 「いっかげつ」の“か”は、どの“か”が正しい? www.excite.co.jp/News/bit/00091196264944.html 地名における「ケ」の研究 www7.ocn.ne.jp/~zarigani/natsuyasumi.html 龍ヶ崎市?龍ケ崎市?「ヶ」「ケ」はどちらが正しい? arc.uub.jp/arc60.html 「柳ヶ浦か?柳ケ浦か?」 www.ytv.co.jp/blog/announcers/michiura/2009/10/post-9.html
356 名前:無名草子さん mailto:sage [2012/06/03(日) 06:43:31.77 ] おやおや、匿名掲示板でコテハンを名乗らないことを非難した人が降臨したかの様なコピペの山だな
357 名前:無名草子さん [2012/06/03(日) 08:37:40.58 ] 今日青空の掲示板でトミーが門田方式をすばらしい校正方法だと宣伝 していた。本当はずいぶん以前から宣伝している。あれは機械主義の トミーの悪い癖だ。読書の楽しみをなくそうというやつだ。奉仕者を 歯車の一部と考えている。校正にしても人力で、文脈を追いながら、 ときには何度も出る誤認識を一括変換しながら、やっていってこそ 楽しい。文脈も中味もわからず、機械やソフトにお任せでまともな 校正ができるか。こういう発想があの青空の非人間的な注記群を 生み出した。青空にはもっと血の通ったあたたかい人間性が必要だ。 わからない、間違った、等々、これもまた人間性ななのだから、 上からの視線で冷たく否定するべきではない。残念ながら、 トミー、門田、その他の運営人、及び土屋とかは、暖かい人 間性がない。 >>328 よ、お前には人間性はないのか。2チャンネルには正義も法 もないのか(陳光誠氏の発言の中国を2チャンネルに置き換 える)。すぐに差別発言を削除せよ。
358 名前:無名草子さん mailto:sage [2012/06/03(日) 09:05:12.84 ] >>357 おまえが >>321 >>322 >>323 を削除してから言えよ。
359 名前:無名草子さん mailto:sage [2012/06/03(日) 09:16:06.72 ] >>357 >わからない、間違った、等々、これもまた人間性ななのだから、 上からの視線で冷たく否定するべきではない。残念ながら、 トミー、門田、その他の運営人、及び土屋とかは、暖かい人 間性がない。 文句ばかり言う※田進も加えてあげて。
360 名前:無名草子さん [2012/06/03(日) 10:33:34.59 ] 2チャンネルの約束をよく読んでから言え。359と328は同一人だろう。 人権感覚がなにもないんだろう。
361 名前:無名草子さん mailto:sage [2012/06/03(日) 10:54:45.47 ] 米の日本軍慰安婦の碑撤去の署名【期日6/9】 ikura.2ch.net/test/read.cgi/ms/1338202472/352 署名お願いします。このままだと 「日本人が韓国人を拉致して性奴隷にしていた」=真実になってしまいます。 必要なのはメールアドレスと名前だけで、 表示されるのはイニシャル名のみAkira.Sとかです。
362 名前:無名草子さん [2012/06/03(日) 11:29:46.39 ] 2チャンネルは自分の書き込みでも勝手に削除できないそうだ。 みんな書き込みには細心の注意を払おう。
363 名前:無名草子さん [2012/06/03(日) 11:30:49.99 ] 特に、人権や差別、プライバシーにかかわることなどの書き込みには 注意しよう。
364 名前:無名草子さん [2012/06/03(日) 11:31:29.61 ] 犯罪に使われてからでは遅い。
365 名前:無名草子さん mailto:sage [2012/06/03(日) 11:36:05.36 ] そんな必死になるような差別語なのかと検索してみたら、 読売新聞のランキングではB(特別な場合意外は使わない方がよい)とあった。 本当か知らないけど、このランクなら削除、削除と喚くほどのもの? 暇なのでついでに青空文庫にその言葉が収録されてないか調べてみた。 芥川龍之介の地獄変や太宰 治の惜別の図書カードには 「不適切と受け取られる可能性のある表現」とあったけど、 北大路魯山人の味覚馬鹿と原民喜の鎮魂歌の図書カードには そういう注記はなかった。 原民喜のは象を撫でるがないその単語そのものだけだけど。
366 名前:無名草子さん mailto:sage [2012/06/03(日) 12:22:34.09 ] >>363 >プライバシーにかかわることなどの書き込みには 注意しよう。 なんだぁ? おまえは名前を出しといて? 記憶能力もチンケだな
367 名前:無名草子さん [2012/06/03(日) 14:02:22.08 ] ぞくばし。批判とプライバシーもわからないじうのいてらしい。 過去と現在の人権感覚のちがいもわからない、じだいおくれの すなこんたおひすとりかる。
368 名前:無名草子さん mailto:sage [2012/06/03(日) 14:29:03.29 ] 半濁点付きの「かきくけこカキクケコ」が、Unicodeにあるか、ないかという話は、えらそうに断言口調で質問に答えている側が、事実をまったく理解していなかった。 こうした状態を的確に表す「群○象をなでる」を控えるとすると、さて、なんと言えばよいでしょう?
369 名前:無名草子さん mailto:sage [2012/06/03(日) 14:51:44.99 ] 「過去と現在の人権感覚のちがい」自体の話をしているんじゃなくて、 「過去と現在の人権感覚のちがい」に関する注記の話をしているんだけど。 その言葉と言う視点で見た場合、青空文庫に注記のあるのと無いのがある。 そもそも別の言葉に対する注記である。 →青空文庫は、現在の人権感覚でその言葉を問題視していない。 その言葉に対する注記のぶれである。 →青空文庫の人、直した方が良いんじゃないかな。
370 名前:無名草子さん mailto:sage [2012/06/03(日) 17:44:03.98 ] 刃の下に心と書いて忍と読むんじゃなかったっけ? 全然堪え忍べていない様な気がするのは気のせい? もう少し煽り耐性つけてから書き込みして欲しいものだ
371 名前:無名草子さん mailto:sage [2012/06/03(日) 19:29:33.23 ] >>369 具体的に言うと、どの作品の、何ていう言葉が問題なの?
372 名前:無名草子さん mailto:sage [2012/06/03(日) 22:17:43.49 ] >>371 差別だ、削除しろと言っている人がいる>>328 の言葉です。 どの作品というのは>>365 に書いています。 現在の感覚で削除しなければならないほどの差別語なら、 青空文庫に作品を収録するときにオリジナルの表記を尊重したというような 注記があると思いますが、328の言葉を含む収録作品には そういった注記の有る物と無い物があります。 その注記が328の言葉を指すのではなく、別の言葉を指しているなら それは表記の揺れではないので問題は感じません。 328の発言を削除しろという人の人権感覚が行き過ぎている例の1つでしょう。 ただ注記が328の言葉を指しているなら、 注記に揺れのある事は問題でないですか?
373 名前:無名草子さん mailto:sage [2012/06/03(日) 22:55:48.29 ] >>368 まだ間違いです。 > 半濁点付きの「かきくけこカキクケコ」が、Unicodeにあるか、ないかという話は、えらそうに断言口調で質問に答えている側が、事実をまったく理解していなかった。 半濁点付きの「かきくけこカキクケコ」は、Unicode3.2に含まれています。 独立した文字であろうと合成文字であろうと、Unicode3.2に含まれることには 変わりありません。 それはそれとして、 >>330 > JISX0208が世界のコードの設計に影響を与えたと、今、思い出せま > せんが、どこかの専門家が著書で書いていました。JISX0208には > 当然英語版がありますし、そこの術語は世界中で通用するようです。 で言っていた、どの専門家が何と言う著書でどう書いていたのか? ソースを出して具体的に示してください。
374 名前:無名草子さん mailto:sage [2012/06/04(月) 01:19:02.56 ] >>367 批判? 批判ねえ。 そうか、批判が下手で、悪口にしか見えない人もいるんだ。 たぶん、余計な修飾がたくさんついてるからかな。赤点。
375 名前:無名草子さん [2012/06/04(月) 08:54:10.37 ] 記事No : 5025 タイトル : Re: OCR校正のすすめ 投稿日 : 2012/06/04(Mon) 08:10:35 投稿者 : 一工作員 校正って一回上から下まで読めばそれでOKか? というと、なかなかウンとは言えないじゃないですか。やっぱり見落としありますし、商業出版だと数回やるそうですし。 そこで最低二回はやろうとすると、少しでも気軽にやれるような知恵や工夫はあるといいですね。 一回目は読む楽しみもあるとしても二回目以降はツラくって。 ○全く同感。同じ人間が2回も校正すること自体がつらい。ただし1年ほどあけると 自分のあら探し的な興味でできる。それから最近話題になっているらしいOCRを 使った校正というのは説明不足で、なにももういっぺんOCRにかけろと言うわけ ではない。だいたい誤認識の一括変換というやり方と同じなので、1回目の校正で もできるし、それで誤植が大方なくなるというわけでもない。 同じ人がつづけて2回校正することは現実的ではないが、別の人間が校正すること は大変有効である。ただし青空のような組織で校正に二人以上の手間をかけるのは 現実的ではない。かならず青空と同じ底本を使った外部の人間の誤植探しを積極的 に受け入れれば有効だが、なかなかそういう有難い人はいない。 堪忍虫の緒が切れる。トンカツソースは業務スーパーで見てきます。青空の不適切 注記はよく漏れ落ちている。それはそれ。人間のやることだから。
376 名前:無名草子さん [2012/06/04(月) 08:58:36.87 ] 堪忍虫に緒はなかったな。堪忍袋だ。最近頭の中は、とんぼやダンゴムシなど、 虫だらけなので、虫になってしまった。無視してくれ。
377 名前:無名草子さん [2012/06/04(月) 11:29:56.40 ] >>368 あのおぞましい差別発言を、別の表現で言おうとするなら、あの場合 「遼東の豕」が近似である。「鳥なき里の蝙蝠」でもいいが長すぎる。 ついでにいえばどのようにでも解釈できるような短すぎる発言はやめ た方がいい。主語も目的語も修飾語もきちんと表現しできるだけ長く 丁寧に書くべきだ。
378 名前:無名草子さん mailto:sage [2012/06/04(月) 20:45:39.08 ] 《トコ「あんどろいどでいこう」》で青空文庫が紹介されました。 Androidで名作を読んでみよう。もちろん無料 pc.nikkeibp.co.jp/article/column/20120531/1051002/
379 名前:無名草子さん mailto:sage [2012/06/04(月) 22:43:14.89 ] >>373 また、間違いですか。 合成可能な文字は、すべてUnicode3.2に含まれているというお考えなんですね。 同じ掲示板を共有できていても、我々はパラレルワールドの住人のようですね。 そっちには多分、あなた一人しかおられないでしょうが。 まあ元気に、一人でおすごしください。
380 名前:無名草子さん [2012/06/05(火) 08:29:03.96 ] 379の補足。 第4水準の漢字などを見ていると、漢字の部品(いわゆる人偏とか)がたくさん 出てくる。それは合成用ではなくて独立している。だから一字分の大きさになっ ている。なぜそういうものが必要か。それは漢字の部品として言論の対象にする ことが学問じみた話には多いからだ。普通なら「にんべん」と言えばすむ。 半濁点つき「か」は二字分の大きさになっているでしょう。本当に合成するなら 合成したあとも1字分の大きさであるべきだ。半濁点を話題にするときに必要な コードというだけだ。「句点」とも書けるが「。」とも書ける。特に半濁点つき カ行を、合成した1文字として扱って、ユニコードに存在させていても、それは JIS漢字の概念(コンセプト)とは違うから、それがあるから、JIS漢字をすべて 含んでいるとは言えない。だからあなたのは詭弁だ。 (JIS漢字的な概念で言えば、あなたの言うような合成文字は外字だ。) ちょうど青空の○○が片仮名の「ケ」には4つの読みがあるというようなもの。 まさしく「鳥なき里の蝙蝠」。
381 名前:無名草子さん [2012/06/05(火) 12:06:49.97 ] 「「ケ」「ヶ」はどちらも片仮名であると…」と規格書には書いてあると いつものように○○がいっていますが、規格書の何処にもそんなことは書 いてありません。いつものペテン、または読解力のなさの露呈です。 今までに何度もそのことは批判されているのに、全然反省しない人間の なさけない主張です。 皆さんごまかされないようにしましょう。
382 名前:無名草子さん mailto:sage [2012/06/05(火) 12:36:38.00 ] >>381 JIS X 0208:1997の規格票の45ページから、 「附属書4(規定) 仮名,特殊文字及びけい線素片」 の項目があり、 「附属書4表12 片仮名」のところで「ケ」は、 名前「KATAKANA LETTER KE」として、「ヶ」は、 名前「KATAKANA LETTER SMALL KE」として規定されている。 規格票本体は、 www.jisc.go.jp/ から検索して読める。
383 名前:無名草子さん [2012/06/05(火) 16:10:59.51 ] 期待したとおりの反応が出ました。長くなるので書きませんでしたが 織り込み済みであり、今までに。さらには、ごく最近も、説明したこ とです。いいですか、「名前」ですよ。名前は実体を厳密には定義 しません。ただの符丁です。だからレッテル万能主義ともいいました。 たとえば「明日香(あすか)」という名前の人がいたとしましょう。 だれでも女性だと思うでしょう。ところが男性もいるのです(事実 現在もいます)。だからカタカナ…と言う名前であっても、必ず カタカナというわけではありません。ほかの証拠も必要です。ケは 名前通りですが、ヶは小さいカタカナのケという名前で呼べばわか りやすいというだけで、カタカナではありません。ところで、本題 とは関係のないことですがここにレターとありますね。キャラクター とどうちがうんでしょう。 あまり長いときらわれるので、不充分ですが、あとはまたこんど。
384 名前:無名草子さん mailto:sage [2012/06/06(水) 01:13:21.86 ] >>380 >第4水準の漢字などを見ていると、漢字の部品(いわゆる人偏とか)がたくさん >出てくる。それは合成用ではなくて独立している。だから一字分の大きさになっ >ている。なぜそういうものが必要か。それは漢字の部品として言論の対象にする >ことが学問じみた話には多いからだ。普通なら「にんべん」と言えばすむ。 何を主張されてるのかよくわかりませんが。 Unicodeには,合成用半濁点と独立した半濁点と,ついでに半角半濁点がありますね。 >半濁点つき「か」は二字分の大きさになっているでしょう。 JIS規格に規定されてますか? 手元のMacのブラウザで表示すると,chromeでは2文字幅,Firefoxでは1文字幅で表示されます。 >本当に合成するなら >合成したあとも1字分の大きさであるべきだ。半濁点を話題にするときに必要な >コードというだけだ。 ええ,1文字分の大きさが正しいはずです。chromeもそのうち修正されるでしょう。 >カ行を、合成した1文字として扱って、ユニコードに存在させていても、それは >JIS漢字の概念(コンセプト)とは違うから、それがあるから、JIS漢字をすべて >含んでいるとは言えない。だからあなたのは詭弁だ。 異なるコード体系ですから,概念が違うのは当然でしょう。 一部解釈が曖昧な文字はあるものの,JIS漢字コードから全てUnicodeに変換出来るのですから, すべて含んでいると言うのは妥当では? >(JIS漢字的な概念で言えば、あなたの言うような合成文字は外字だ。) JIS漢字のどの概念を適用すると合成文字が外字扱いになりますか?
385 名前:無名草子さん [2012/06/06(水) 08:44:36.80 ] >>384 漢字の部品を話題にした言論を御存じありませんか。国語学の文字論の分野 などでは時々見ると思います。 以下の部分については、JIS漢字集合に含まれる文字は一意的に同定され、 一つのコードを割り振る、という概念で編集されているはずですが。 変換できるというのと含まれるというのとは違うと思いますね。含まれる というのは同一の状態である必要がありますが、変換できるというのは 少し解釈がゆるむんじゃないですか。拡大解釈はこのさいごめん蒙りた い。それでもといわれるなら見解の相違として下さい。外字云々はさっき 言った、一つの文字には一つのコードという概念の適用で解けます。 追記、合成が許されるなら、これからさきすべての仮名に半濁点がつく ようになっても、ユニコードでは新しいコードを作る必要はないわけ ですが、JIS漢字ではいちいち収録するかどうかどのコードをあてるか 検討しなければならない。 それから半濁点に、合成用と独立用があるということは、知りません でした。とにかく規格票とか、解説書とかユニコ−ド(部分的には ネットでも出てくるが全体を示したものはないようだ)とかそういうも のは、図書館にもないので、私のような素人では参照することができま せん。それにしても合成用まであるのに、一字分のおおきさにならな いのが普通なのは欠陥商品ですね。合成という発想そのものがコード には馴染まないのではないですか。
386 名前:無名草子さん [2012/06/06(水) 16:46:44.79 ] >>382 ヶはカタカナであるとJISx0208に書いてありました。つつしんで深くお詫び申し上げます。 ただし名前ではなく、別の部分で、この規格書は82字の平仮名と86字のカタカナを含むと はっきり数字を出して説明していました。で、その数字の中にヶも含まれていました。 そこで言いなおします。X0208がヶをカタカナであるといっているのは間違いであると。 JISはこの漢字集合は一般の日本語に対して規範性を与えるものではないと。つまりヶを カタカナにしたのはJISの誤解であって、われわれ一般の日本語使用者は全くそれに制限 されることはありません。堂々と言いましょう。ヶは漢字である。
387 名前:無名草子さん [2012/06/06(水) 16:49:38.90 ] さっそく修正、82字ではなく83字でした。カタカナは86字です。なぜカタカナの 方が多いか、あのおかしなヶ、ヵなどがあるためです。あと一つ何だったかな。
388 名前:無名草子さん [2012/06/06(水) 18:07:16.39 ] あと一つはヴでした。 うの濁点付きがなくて、ウにあるのはわかる。 ヶ、ヵに対応する小書きの平仮名がないのもわかる。 どれもX0213では増えたかな。一般世間や手書きの世界ではなんでも あるからそういうのをふやしていけばきりがないだろう。パ行以外の 半濁点などというのも普通には用のないものだ。絵文字なんてのも その部類。私は一度も使ったことがない。
389 名前:無名草子さん mailto:sage [2012/06/06(水) 21:13:08.33 ] >>385 >漢字の部品を話題にした言論を御存じありませんか。国語学の文字論の分野 >などでは時々見ると思います。 僕がわからないのは、JIS漢字集合がUnicodeに含まれるかという話とそれがなんの 関係があるのか?です。Unicodeには当然、JIS漢字にある部首も含まれています。 >以下の部分については、JIS漢字集合に含まれる文字は一意的に同定され、 >一つのコードを割り振る、という概念で編集されているはずですが。 そのような概念がJIS規格書で規定されていますか? 以前のJIS X 0208には合成用文字が含まれていましたし、 「くの字点」はペアで一つの文字では無いですか? ja.wikipedia.org/wiki/%E8%B8%8A%E3%82%8A%E5%AD%97 >変換できるというのと含まれるというのとは違うと思いますね。含まれる >というのは同一の状態である必要がありますが、変換できるというのは >少し解釈がゆるむんじゃないですか。拡大解釈はこのさいごめん蒙りた >い。それでもといわれるなら見解の相違として下さい。 今議論されている「含まれる」は「文字」であって「文字コード」では無いでしょう。 Aという文字集合に存在する文字をBという文字集合で全て表せるなら、AはBに含まれる。 それだけのことでしょう? コードを変換したら違うというのなら、UnicodeはおろかShiftJISやEUCにもJIS漢字は 一切含まれませんね。 見解の相違で誤魔化すならそれも良いでしょう。 そっちには多分、あなた一人しかおられないでしょうが。 まあ元気に、一人でおすごしください。 :-) >外字云々はさっき >言った、一つの文字には一つのコードという概念の適用で解けます。 意味がわかりません、その概念と「外字」にいったいどのような関係があるのですか? 続く
390 名前:無名草子さん mailto:sage [2012/06/06(水) 21:14:40.20 ] >>385 >追記、合成が許されるなら、これからさきすべての仮名に半濁点がつく >ようになっても、ユニコードでは新しいコードを作る必要はないわけ >ですが、JIS漢字ではいちいち収録するかどうかどのコードをあてるか >検討しなければならない。 それがなにか問題あるんですか? >それから半濁点に、合成用と独立用があるということは、知りません >でした。とにかく規格票とか、解説書とかユニコ−ド(部分的には >ネットでも出てくるが全体を示したものはないようだ)とかそういうも >のは、図書館にもないので、私のような素人では参照することができま >せん。 素人なんですか?! JIS漢字の概念をご存じの方が、またまたご謙遜を(^^ www.jisc.go.jp/app/JPS/JPSO0020.html こちらから「JIS規格番号からJISを検索」で「X 0213」を検索して下さい。 ブラウザで閲覧するだけなら無料です、お金を出せば購入も出来ます。 >それにしても合成用まであるのに、一字分のおおきさにならな >いのが普通なのは欠陥商品ですね。 現状では、ソフトのバグ、もしくは手抜き、あるいは仕様でしょう。 過渡期ですから、ソフトでの対応が進めば直りますよ。 >合成という発想そのものがコード >には馴染まないのではないですか。 コンピュータで文字コードを処理する上で合成が不都合なケースもあれば好都合なケースもありますね。 Unicodeはすべての文字を収録する目標を達成するために、合成という概念を取り入れたということです。 文字コードについて理解を深めたいのであればお勧めの書籍あげておきますね。 『プログラマのための文字コード技術入門』、『文字コード「超」研究 改訂第2版』、『ユニコード戦記 ─文字符号の国際標準化バトル』 では、また
391 名前:無名草子さん [2012/06/07(木) 08:28:40.42 ] >>390 こちらは素人ですが、そちらさんは玄人ですか。どうも玄人とは思えない 書きぶりですが。ところで紹介されたサイトは、もううんざりするほど、 恐らく10回以上は読んでいるでしょう。それがわかりませんか。読んで いなければ、規格の言う「名前」の意味とか、0208と0213の違いとか、 わからないですよ。私が言っているのは、「規格票」、その解説書、 ユニコードの全部が載っているもの、この3つです。すべて県立、 府立クラスの図書館にはありません。外の部分については、ちょっと 調子を合わす閑はありませんね。今反論しても素直には読めないでしょう。 なんか青空の掲示板がこっちに移ってきたみたいで、あの○○が侵略 の先鋒でしたね。すっかり雰囲気が変わりましたね。つつしんでおわび 申し上げます。
392 名前:無名草子さん [2012/06/07(木) 17:37:56.11 ] >>390 いちいち収録するかどうかどのコードをあてるか検討しなければならない。 それがなにか問題あるんですか? ○土屋氏とそっくりですよ。問題があるから言ってるんだが、あなたには 理解できないらしい。 ブラウザで閲覧するだけなら無料です、お金を出せば購入も出来ます。 ○これはさっき言ったな。そこまでの素人ではないと見破れないという のは、あなたも同じ程度かそれ以下の素人だな。 過渡期ですから、ソフトでの対応が進めば直りますよ。 ○まだ過渡期なんですか。出てから、また普通に装備されるようになっ てからもう3年以上ぐらいはたつんじゃないですか。要するにユニコード なんて実用にする気がないんでしょ。土屋が青空もユニコ−ドにしろとい ってもトミーはやる気がないよ。 Unicodeはすべての文字を収録する目標を達成するために、合成という概念を取り入れたということです。 ○だからJIS漢字は合成などという概念を持たない。それにすべての文字を 収録するという概念も持たない。収録するかしないか必ず選択する。どこかで だれかが言ってたかな。平仮名の踊り字は合成じゃないかと。しかしね、あの 踊り字はもともと二字分の場所をとる。だから合成じゃなくて、二字分でできる 特殊な文字だ、というか記号だ。 紹介して頂いた本はすべて県立図書館にありました。入門とか「超」研究とか、 戦記とか、いかにも軽薄な題名だし、紹介された方も、私なみの素人さんの ようなので、読まないでおこうと思います。時間の無駄。 前半つまり389のほうはまたいずれ。土屋のそっくりさん。
393 名前:無名草子さん [2012/06/07(木) 22:06:43.71 ] ?? イムニダ アンニョン ハセヨ
394 名前:無名草子さん mailto:sage [2012/06/07(木) 23:26:23.68 ] >>373 > 独立した文字であろうと合成文字であろうと、Unicode3.2に含まれることには変わりありません。 そうだったんですか! では、こんな漢字もあるんですね。 U+571F U+309a U+5C4B U+3099
395 名前:無名草子さん mailto:sage [2012/06/07(木) 23:51:35.32 ] >>392 > 前半つまり389のほうはまたいずれ。土屋のそっくりさん。 ツッチーは2ちゃんねるには来ないようです。
396 名前:無名草子さん mailto:sage [2012/06/08(金) 04:57:17.49 ] JIS漢字がUnicode3.2にすべて含まれていると Unicode3.2で表現される文字がすべてJIS漢字に含まれるは 全く別物だと思うんですけど。 手元の環境では、Windows7のIEとFirefoxで 合成文字を一文字分で表示できています。 2つを合わせればすでにある程度のシェアなのでは? 過渡期ではありますけど、 表示できる環境は増える方向にあると思います。 Webkit系はラテン文字の合成文字は表示できるんですけど・・。 関係ないですが、今は合成文字を使った顔文字とかあるんですね。 最近、初めて見たときは驚きました。 ttp://togetter.com/li/165895
397 名前:無名草子さん mailto:sage [2012/06/08(金) 06:05:00.05 ] JIS漢字コードは全てUnicodeに含まれていますよ。 JIS漢字コードに動きがあった場合はUnicodeに反映させるために、 ユニコードコンソーシアムに委員も送り込んでますから。 今時、Unicodeに無い文字はコンピュータで扱えないので、無いのと同じですからね。 件の合成文字についても、独立した符号位置を与えたかったが断念して合成文字として 収録した経緯が、どなたかが紹介していた『ユニコード戦記』という本に書かれています。 それにしても、各国のエゴと利害対立が渦巻く国際会議の最前線で必死に戦った人の 渾身のレポートを読みもせずに軽薄と切って捨てるなんて、 ひどすぎます (´;ω;`)ブワッ
398 名前:無名草子さん [2012/06/08(金) 09:03:21.99 ] 戦記とかバトルとかいう題名は軽薄ですね。出版社の責任かも知れませんが そういう軽薄な題名をつけて読む気をなくさせるのはこまったものです。 「大方含まれている」のと「すべて含まれている」のとどっちがいいのかな。 青空の掲示板にはりついている○○のような見た目主義的な、全く ハングルのように仮名を部品にばらして、また合成するといった芸当で できるものが、はたして日本語の文字の概念としてふさわしいものか。 いうまでもありませんがセジョンデーワンによるハングルはすばらしい 文字ですが、それと日本語の仮名とを同一視するようなまねは日本語を 愛する人間として違和感がある。ユニコードはハングルに押されたのでは。 サムソン(サムスンは韓国語として間違い)やacer(台湾)の方が上かね。 「すべて」というより「大方」の方がいいんじゃないかな。そういう言葉 のあやは国文学出身者として尊重したい。 青空の○○へトンカツソースは忘れただけの話。嘘ではないし答えられ ないのでもない、いつになったらげすの勘ぐりがやめられるのか、 ねっからのげすには無理なのか。忘れたにしても、なんとなく読んだ本は 、覚えているから、また報告できるだろう。おれは○○のような嘘つきで はない。○○のような腐った心は持っていない。 追記、今から40年以上前国文科にいたのにSEになろうとして入社試験を 受けに行ったのは全くふざけた話だった。未だにそのなごりかこんなところ に首を突っ込んでいる。そのころSEとはなにかほとんどわかって いなかったけれど、なにか面白そうな感じはした。
399 名前:無名草子さん mailto:sage [2012/06/08(金) 09:07:44.50 ] JIS X 0213の一部を、合成で補わざるを得なくしたことに対しては、小林龍生さんたちには、彼らなりの理屈があるでしょう。 ただ、その一方には、自国のコードを有利な形で盛り込もうと各国が強い主張を行う中で、JIS X 0213に背を向けて、みすみす不利を強いたとみる人たちもいます。 その立場空は、「国際会議の最前線で必死に戦った人」のが小林さんとは、まるで思えないでしょう。
400 名前:無名草子さん [2012/06/08(金) 17:46:14.57 ] >>389 >漢字の部品を話題にした言論を御存じありませんか。…。 僕がわからないのは、JIS漢字集合がUnicodeに含まれるかという話とそれがなんの 関係があるのか?です。Unicodeには当然、JIS漢字にある部首も含まれています。 ○合成用の部品の話でしょう?ところがJIS漢字とかにあるのは本当の部品であって 合成用ではありません。ところで合成用でもないのに、なぜあれほど多量の部品の コードがあるか?部品を話題にすることが文字(論)にはしばしばあるからです。 あなたは合成の(結合)の話をしてるんじゃないですか。自分が言ってることが わかっていないようでは、それに関する論評が関係あることかないことかわかる はずがありませんね。ざんねんながらお相手できませんね。 >JIS漢字集合に含まれる文字は一意的に同定され、一つのコードを割り振る、という概念で編集されているはずですが。 そのような概念がJIS規格書で規定されていますか? ○残念ながら規格書本体ではなく、その解説書にあるそうです。富田氏のまとめたものが 青空文庫にあります。それの孫引きです。 以前のJIS X 0208には合成用文字が含まれていましたし、 「くの字点」はペアで一つの文字では無いですか? ○これについては書きましたね。くをたてにのばしたのを鏡像にしたような踊り字 のことです。普通の紙の本では二字分の空間を取りますが、もっと降り本を見ると 3字文以上の長いのもあります。これは結合(合成)文字とは別の種類のもので もともと二字分の空間を必要とする特殊な記号です。こんなものを他の結合文字 と同一視して、一字分に縮めたら、むちゃくちゃですよ。 >変換できるというのと含まれるというのとは違うと 今議論されている…… 以下つづく。予想を言えば、用語の概念規定がむちゃくちゃなので、 論理的な文章になっていないということです。この結論であとは 省略してもいいようなものです。踊り字の/\を結合文字と同じと みなすような頭脳では無理かな。