1 名前:モ・ク・ヘ・ケ菽ヲッ [01/10/16 00:18 ID:ZujZqkcr.net] Javaとかのマルチプラットフォームなアプリでも文字コードをいじらないと化けるし。 ICQクローンで Shift_JIS<=>EUC の相互変換をするように加工とか小細工して使ってるのには泣けたYO せっかく多言語対応の環境で作られたソフトでも日本ローカルのパッチ作んなきゃいけないんじゃ 意味ないじゃん! Winに比べて少ないアプリがさらに選択肢が狭まっちゃってどうしようもないYO Linuxにおける日本語の標準コードはWinに倣いShift-JISをメインにすべきである。
175 名前:login:Penguin [01/11/03 09:09 ID:yDgQv8+0.net] 0208は0201とカナ配列の順序違うじゃん。 濁点付きカタカナだけなら後ろの31Byteでも良いが、素直に別区に追加で良いっしょ。 「あいうえお」に「゛゜」付きなど全組み合わせを用意してさ。 後から泥沼式に「か゜き゜く゜け゜こ゜」を追加する羽目になるなんて見苦しい事をせずにね。
176 名前:login:Penguin [01/11/03 10:05 ID:hLV/0wc3.net] ん〜うちの会社の人間はEUCとかSJISとかいう コードがあることじたい知らないのよ。 Linuxで生成したテキストファイル渡したら バグって言われて怒られる。 「テストしろよ!!」ってね。 #何のテストするんだよ。ただのテキストファイルなのに #その前にWinのメモ帳しか使わないってのやめて欲しい。 こういったユーザが大量にいる限りSJISとEUCが混在する 状況は続くでしょうねぇ
177 名前:login:Penguin [01/11/03 10:58 ID:mF3ySVcJ.net] >>175 バグと判断するバカは放置するとして、 テキストファイルの形式統一するのが普通であ? 最近だと、特に必要が無いかぎり SJIS、CRLF改行、拡張子.TXT にするもんでない? (多数あわせ)
178 名前:login:Penguin mailto:sage [01/11/03 11:09 ID:FDfHjWDB.net] >>176 おれは、ファイル名の最後に文字コードを入れるべきと思う。 Linuxとかなら、hoge.euc Macなら、hoge.sjis Windowsなら、hoge.ms932
179 名前:名無しさん@XEmacs mailto:sage [01/11/03 19:29 ID:Dw5uXiEf.net] >175 あはは。おいらも経験したよ。そゆこと(w そゆヤツって、なぜかエラそうなんだよな(^^; >176 うん、基本的に shift_jis-dos にしてるけど、たまーに、 うっかり euc-jp-unix で渡しちゃうコトがあったりして…
180 名前:login:Penguin [01/11/04 00:22 ID:cPtnoBo6.net] 今時のテキストファイルで、拡張子.TXTなら、SJISじゃなきゃ文句言われてもしかたないな。 知識の無い人に合わせないとトラブルばかり。 複数用意すれば、EUCが分かる人なら、拡張子.eucの方を見るでしょう。
181 名前:login:Penguin mailto:sage [01/11/04 00:26 ID:qR29LF7G.net] >>179 はぁ?
182 名前:login:Penguin mailto:sage [01/11/04 00:37 ID:cPtnoBo6.net] バグとか言っちゃう人に渡る可能性のある文書についての話。 README.TXTとかあると、無条件にダブルクリックしてんでしょ?ってね。
183 名前:login:Penguin mailto:sage [01/11/04 01:08 ID:xlW9G7Cv.net] つーか、なんでメモ帳は進化しないんだYO! コード自動認識くらいしてくれ。
184 名前:login:Penguin mailto:sage [01/11/04 02:00 ID:LLwK6UGW.net] UTF-8は自動認識するが?<メモ帳
185 名前:login:Penguin mailto:sage [01/11/04 02:11 ID:AArIKKka.net] 進化したとしても、MSがEUCなんか気にする訳ないだろ。
186 名前:login:Penguin [01/11/04 03:29 ID:ou3Z9dK2.net] MS はあえてそういうことを無視するからな. 消極的な囲い込みのようなものだ.
187 名前:login:Penguin [01/11/04 12:34 ID:L08xAyfI.net] >>174 > 濁点付きカタカナだけなら後ろの31Byteでも良いが、素直に別区に追加で良いっしょ。 > 「あいうえお」に「゛゜」付きなど全組み合わせを用意してさ。 > 後から泥沼式に「か゜き゜く゜け゜こ゜」を追加する羽目になるなんて見苦しい事をせずにね。 どういうcoding systemでそれを利用するの? >>169-170 の文脈で。 JIS X 0213はShift_JIS埋め込みが考慮されているよね? # WinもMacもUnicode化で無視されるだろうが…
188 名前:login:Penguin [01/11/04 13:29 ID:rDLRvc89.net] > MS はあえてそういうことを無視するからな. > 消極的な囲い込みのようなものだ. いや、脱共有プロトコル化をはかっている彼らとしては、 EUC排除は積極的な戦略でしょう。意地でもサポートしないと思うね。 そのうち Internet Explorer で EUCのページを 見れなくなるようにするんじゃないかとさえ思っている。 こないだの MSN締め出し騒ぎを見れば、奴らならやりかねん。どうよ?
189 名前:login:Penguin mailto:sage [01/11/04 13:44 ID:L08xAyfI.net] Microsoftがそういう戦略を取っている事は、 MS-C/Borland C、Excel/Lotus 1-2-3、MS-DOS/DR-DOS、 MS-IME/ATOK,、Java VM、ハロイン文書で明らか。 ただ、 1. 半角かなを使ったデータ、プログラム資源の継続性から、Shift_JIS開発(by ASCII) 2. Shift_JISのみの利用 3. UTF-8への段階的な移行 は、1を除いて、そんなに悪い選択ではなかったと思う。 Coding systemが一種類しかないのは楽だから。特に一般ユーザにとっては。 DOS, Win, Macに閉じ籠ればそれで済むわけだし。
190 名前:login:Penguin mailto:sage [01/11/04 16:02 ID:DGRCTWhd.net] まだLinuxでも一般ユーザ向けには、Shift_JIS用のディストリビューションが有っても良いよな。 カーネル単体で0201対応してて、半角カタカナをキー入力できるとか、 DOS/V化してあるDOSEmuやWineが最初から使えるとか、 Windowsとのマルチブートでブックマークを共有化とか、 色々敷居を低くする手法が残ってるよな。
191 名前:login:Penguin mailto:sage [01/11/05 20:53 ID:44wU12jf.net] > 3. UTF-8への段階的な移行 Windows が移行しようとしている方向は、UTF-8 じゃなくて、UTF-16 の方では? メモ帳で、「Unicode (← 実際には little endian の UTF-16」と「Unicode big endian」と「UTF-8」が併記されているのを見ると、まるで ・Unicode は、little endian の UTF-16 がデフォールトで、big endian は おまけ。 ・UTF-8 は、Unicode じゃない みたいだ。まあ、意図的にこうしているこうしているわけじゃなくて、little endian UTF-16 オンリー時代の Unicode メモ帳からの、歴史的互換性からこ うなっているんだろうけど、誤解を招くのは確か。
192 名前:login:Penguin [01/11/06 00:11 ID:7lli86vQ.net] >>190 utf-16 っていうのは utf-8 や utf-32 なんかのエンコーディングとは 意味が違うって www.euc.jp に書いてあったけど, どういうこと? utf-16 は surrogate pair のなんとかで, 他の utf-8 などと 同時に使えるって書いてあったような気がする. 僕は詳しくないので 誰か説明して.
193 名前:login:Penguin [01/11/06 00:38 ID:qHAMS4vC.net] >>190 ああ、NTが採用したころは、UCS-2で行くつもりだったわけだな。 ところで、UCS-2でなくUTF-16って名前がMicrosoftのdocumentに出てくるのー?
194 名前:login:Penguin [01/11/06 16:04 ID:lMX1zb5b.net] >> 192 UCS-2, UCS-4 は文字セット。 UTF-16 はエンコーディング。 区別しようね。 以下、説明はちょっとはしょってるので用語は不正確かもしれん。 UTF-16 ちうのは 2 バイトであらわされる範囲は UCS-4 の BMP 領域(すなわち UCS-2) の文字番号(?)をそのままコードとして採用する + それ以外はサロゲートペアで表現。 なので、混同するのは無理ないが。 まぁ、UCS-4 の BMP 以外って事実上まだなんとも、なので、現実的には UTF-16 のコード == UCS-2 の文字番号 になってるかな。 Win の UTF-16 ってサロゲートペア対応してるんだろうか?
195 名前:login:Penguin [01/11/06 22:38 ID:iIXz3U3P.net] >>191 UCS-2, UCS-4はどの文字(合字は例外)もすべて同じバイト数であらわせる。 それに対して、UTF-8というのは、文字によって、1文字1バイトだったり、1文字6バイトだったりする。 そもそも UTF = UCS Transfer Format、UCSを通信で伝送するためなどに用いる情報交換用エンコーディング。 しかし UTF-16というのは、UTFという名をしていながら通信のためのフォーマットではなくて、UTF-8とはまったく似ていない。 むしろ UCS-2に近い、というか UCS-2の拡張。 どの文字も2バイトまたは4バイトであらわせるし、BMP領域とサロゲート領域ははっきりと分かれているので、ある文字が2バイトで1文字か 4バイトで1文字かを簡単に判別できるので、内部コードに適している。 UTF-16って、UCS-16の名のほうがむしろよかったのかもね。 >>193 > UCS-2, UCS-4 は文字セット。 > UTF-16 はエンコーディング。 確かに UCS = universal CHARACTER SET だけど、UCS-2, UCS-4はエンコーディングにも使われてるよ。 >Win の UTF-16 ってサロゲートペア対応してるんだろうか? MicrosoftのサイトにあるOpenTypeのドキュメントによれば、OpenTypeは サロゲート対応してるようだ。 そもそもサロゲートペアに対応してないなら、UTF-16じゃなくてUCS-2だ。
196 名前:194 [01/11/06 23:03 ID:65m4RrJp.net] かんちがいだった。UCS-2,UCS-4はエンコーディングには使われてないですね。 確認せずに書いてスマソ。 UCS-2を変換せずそのままエンコーディングに使った場合、それは UCS-2と呼ばず、UTF-16と呼ぶ、ということだな。
197 名前:login:Penguin [01/11/06 23:30 ID:RTd7nfRF.net] >>194 OpenType は Apple かんどるからのぅ。 ATSUI はちゃんと対応してるらしい。 ので、MS のいう「UTF-16」が、サロゲートペアも含めてフル実装されとんかいなと怪しんでたり。 BMP領域だけだったらすべて2bytesだから、内部コードとしてはとっても扱いやすいくて、昔からやってるんだと思うのね。 けど、サロゲートペアがでてきてとたんに固定長じゃなくなったところで、実装がナニになりそうとか。 XKPとやらがそうなんだっけ? < サロゲートペア実装
198 名前:login:Penguin [01/11/06 23:44 ID:KdJ6KYbO.net] XKPは外字領域の独自運用じゃなかったっけ?
199 名前:login:Penguin [01/11/07 00:01 ID:fD9Y8+Ov.net] >>196 でも サロゲートペアありの UTF-16って、Shift_JISみたいなもんですよね。 Shift_JISの場合、第1バイトは必ず、どの半角文字とも重ならない値が来るけど、第2バイトはASCII領域の文字も来たりする。 UTF-16の場合、サロゲートペアの最初の2バイトは、ほかのどの文字とも重ならない「最初の2バイト専用」の値しか取らないし、次の2バイトも同じく「次の2バイト専用」の値しか取らないので、Shift_JISよりは簡単なはず。
200 名前:login:Penguin [01/11/07 02:52 ID:ZhpFSFFf.net] 結局 Unicode は本格的に多国語を使うには向いていないってことですか? CJK でそれぞれの国がそれぞれの国専用のグリフを使うってことで.
201 名前:login:Penguin mailto:sage [01/11/07 03:44 ID:2zLC4FRt.net] >>199 どっちかというと、筋の善し悪しの話ですな。 Unicode が貶されるのは、デザインの筋が悪いからなんですね。 でも、他に多言語のことをちゃんと考えてるコード体系がほとんどないので、 今あるコード体系の中では一番多言語化に向いているとは言えよう。 # ヲレ自身は、あんな筋の悪いもんには関りたくないから # 放置プレイだけどナー :D
202 名前:login:Penguin [01/11/07 04:56 ID:/7clxDed.net] Unicode は han unification してまで 2byte 固定長にこだわったはずなのに、 それが不可能ってようやく判った瞬間に、壮大なる失敗としてその使命を終える べきだった…。Unicode 3.x はやめてくれ〜。あの仕様じゃ、ISO-2022 のほう がまだ実装が楽だぞ。
203 名前:login:Penguin [01/11/07 15:27 ID:FmMqLr+t.net] Unicode なら大変で ISO-2022 なら楽なことなんて ほとんどないと思うけどねえ。 Unicode で大きな breakthrough が実現するわけじゃ ないけど、同じ苦労をするんなら、Unicode のために 労力を使ったほうが将来性があるでしょ。
204 名前:login:Penguin mailto:sage [01/11/07 15:42 ID:wu03UBOh.net] 一方で Unicode だと簡単と思っている欧米人もいるからね。 BMP だけあつかってもちゃんと実装するのは大変だと思うけど。
205 名前:login:Penguin [01/11/07 16:48 ID:FmMqLr+t.net] Unicode ベースで、自分の言語で困らない程度の処理だけ しておいてくれればそれでいーんですよ。 他国語も処理したい人がいたら、その人が欲しい言語に必要 な処理を加えりゃいい。8 bit through なだけのソフトを Shift_JIS とか EUC-JP 対応に書き換えるより遙かに楽なん じゃないか? 日本語のことだけ考えてると Unicode って楽だよね。combining character も surrogate pair も普通はいらないだろうから。
206 名前:login:Penguin [01/11/07 17:06 ID:t1r6lxkM.net] なんでi-modeはシフトJISになったの?
207 名前:login:Penguin mailto:sage [01/11/07 17:11 ID:o3LWW9bh.net] 半角カナが使えるから。 つーのは冗談にしても、規格考えたのがズブの素人なんじゃなかったっけか。
208 名前:login:Penguin mailto:sage [01/11/07 17:17 ID:BqexFMm1.net] >>206 つまりドキュソが作ったドキュソ向けサービスってワケだな(w
209 名前:login:Penguin mailto:sage [01/11/07 18:29 ID:/Lwa9nOE.net] 205 名前:login:Penguin 投稿日:01/11/07 17:06 ID:t1r6lxkM なんで2chはシフトJISになったの? 206 名前:login:Penguin 投稿日:01/11/07 17:11 ID:o3LWW9bh 半角カナが使えるから。 つーのは冗談にしても、規格考えたのがズブの素人なんじゃなかったっけか。 207 名前:login:Penguin 投稿日:01/11/07 17:17 ID:BqexFMm1 >>206 つまりドキュソが作ったドキュソ向けサービスってワケだな(w
210 名前:199 [01/11/07 19:05 ID:u4pcDQi5.net] 確かに簡単にどの国でも使える soft を書こうとか, 自国の一ヵ国語だけ使えればいいと考えると(ほとんどの人はそうだが), Unicode も利点があるかも. 欧米人が推進するのは 簡単に internationalize できるからか. しかしそのせいで漢字文化圏の多国語共存が余計遠のいたような気がする.
211 名前:login:Penguin [01/11/08 00:10 ID:/qmyo2E8.net] >>187 そういえばIE5.5 以降だと、charset を指定していないウェブページはShift_JISとして 認識するのがデフォルトになってたよね、確か。 それまでは「日本語(自動選択)」だったのに、ありゃ不便。
212 名前:login:Penguin mailto:sage [01/11/08 00:33 ID:wFCDcGAs.net] コードとソフトのマルチリンガル化は直接の関係が無いように 思うが。最近のはリソースレベルで調整効くんじゃねえの? DQNなソース以外は。
213 名前:login:Penguin [01/11/08 00:40 ID:axW1aL0x.net] fgetc(3), ungetc(3)レベルでも、Unicodeでいくには一工夫が必要です。
214 名前:login:Penguin mailto:sage [01/11/08 01:49 ID:RN8xlcoh.net] イッ、イクゥー
215 名前:login:Penguin [01/11/08 01:55 ID:7e4OhXHU.net] >>212 だーかーら、Cを使わなきゃいいの。 イヤな例だがNTでエクセルのVBAいじってる やつらのソフトでさえあっさりUnicode.
216 名前:login:Penguin [01/11/08 03:09 ID:FiqqyvvZ.net] >>210 そりゃアホな仕様ですな. というかもはや作意的な 脱共有プロトコル化. ゆるせんな. super power が悪の帝国になるというのは映画の典型だが, MS はそのまま地でいっている感じ.
217 名前:login:Penguin mailto:sage [01/11/08 07:37 ID:dq+tXvEy.net] >>205 >>206 >>207 憶測にすぎんが、 元々の端末が内部コードとして SJIS 使ってた。 ↓ DoCoMo から imode 端末試作の要請が来て、 何も考えずに端末屋が作った。 ↓ 作ったやつの実装からそのまま仕様を起こした。 ちゅう流れでは ? DoCoMo って、 暴走する前線 (とらば〜ゆからとらば〜ゆな 前線指揮官と、売りまくりの販売店) と、 全てを放置することしかできん総司令部と、 間で苦労する兵站部 (サーバ強化したり、 ゲートウェイでいわゆる i-mode 絵文字が 外に出て行かないように〓 ( 2 区 14 点 ) に 変換したりとかさ) って構図に自分には見え
218 名前:login:Penguin mailto:sage [01/11/08 10:51 ID:kpRhpY+R.net] >>205 Windows上でコンテンツ作成するのに楽だから。 ・・・と聞いたけど、理由後づけしただけなんじゃないかって気がしてきた(w
219 名前:login:Penguin [01/11/12 19:53 ID:yqlF4e/+.net] 面白かったのに止まっちゃってやんの。
220 名前:login:Penguin [01/11/12 22:32 ID:9uypxnba.net] >>210 IE6だとEUCなページもJISなページもちゃんと見えるぞ。 エンコードを「自動選択」にしただけで。 >>214 あっちは高度なレイヤの言語に属するものなので、裏での文字コードは どれでも大丈夫という例ですな。Cみたいに低レイヤのI/Oが存在し得な い(できない)し。 >>216 iモードのプロトタイプ版がWindowsアプリケーションで作られていて、 それなりに評判が良かったので裏のコード体系が何も変更されずそのま ま広まってしまった。
221 名前:難しい… mailto:sage [01/11/13 00:46 ID:lJpK2uoN.net] 日本語基礎用語 ttp://www.geocities.co.jp/Hollywood/1751/JISknown.html これってどうなんでしょうか。 国の公式文書はJISのみとか決まってるんですか? 日韓W杯の人達は何で文書やりとりしてるんだろう?FIFA公用語のみ?
222 名前:login:Penguin [01/11/13 02:09 ID:AR1g3sje.net] jis っていっても文字コードとしての jis と エンコーディング法としての通称 jis があるな.
223 名前:login:Penguin [01/11/13 02:38 ID:xnt/q9m2.net] UnicodeだってJISだし。
224 名前:login:Penguin [01/11/13 05:11 ID:yK//wqHP.net] どれが符号化文字集合一般の問題で、どれが Unicode 文字集合特有の問題なんですかぁ?
225 名前:login:Penguin [01/11/13 08:21 ID:UUYcq+J/.net] >>220 たぶんこれを根拠にJISコードで官公庁向けにドキュメント(完成図書) を提出したら「読めない」と一蹴される可能性が大きいな・・ ちなみに俺が仕事をした範囲で言うと、官公庁向けに最終的に納品する ドキュメント(完成図書)は紙に印刷したものが基本だが、電子文書と して納品する場合はMicrosoft WordフォーマットかAdobe Acrobatフ ォーマットが基本で、当然の事ながらそれ以外のフォーマットで提出す ることは官報で告示される工事仕様から外れたものとなってしまう。
226 名前:login:Penguin mailto:sage [01/11/13 08:47 ID:xshmouS0.net] >>220 ヲレが評価を書くのは簡単だが意味ネーので。 規格票とかの 1 次文献と、ゴミ山の 2 次文献と、 ともかく片端からツキ合わせて検証するしか。 JIS はハンドブックじゃなくて規格票の方。常識
227 名前:login:Penguin mailto:sage [01/11/13 09:57 ID:55puEBGN.net] >>225 > JIS はハンドブックじゃなくて規格票の方。常識 内容違うの?
228 名前:login:Penguin [01/11/14 01:34 ID:7VltrDCU.net] >>226 JIS ハンドブックに規格の解説ってついていたっけ?
229 名前:login:Penguin mailto:sage [01/11/14 03:02 ID:bsExAIai.net] >>226 ハンドブックは、規格票の抄。fontも違う(w
230 名前:名無しさん@お腹すいた。。 mailto:ハラペコ~~ [01/11/15 02:10 ID:OJKAB9zc.net] Shift−JISウザイ!! こんなものがあるから、厨房が増えると思う。 こんなものがあると、日本人は余計に馬鹿になると思う。 ※私も Shift−JISあぼーん に1票! しかも、MS社は商売が上手すぎるせいで、 Shift−JISが余計に普及しすぎてしまう。 もともとMS社が考えたShift-JISは、Macでも使われてきている。 自分はMS社は好きだけど、Shift−JISは嫌い。 Shifit−JISなんかよりは、Extended Unix Code(EUC)が(・∀・)イイね。 それに、インターネット上でSJISは向かない。 UNIX系のOSを使うと、本当にためになると思う。。頭よくなるよ。 逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。 Netscapeで色々なサイトを見てみることが有るけど、 IEに最適化されたページが多すぎて、Netscapeでは 正常に表示できないものがある。 それは、インターネット上に、色々なコンピュータが混在してることを 知らないような厨房がいるからだと思う。 (皆、Windows+IEにばっかりだと思っているのかなぁ?) UNIX系のOSを使うようになってくれば、インターネット上に、 色々なコンピュータが混在していることを知ることが できるようになるのではないだろうか? Windowsばっかりにとらわれず、ほかのOSを使ってみるというのも良いことでしょう。 EUCという文字コードは、今まで「コンピュータ=Windows」だと思って いた人に、「コンピュータにもいろいろ有る」ことを 意識させてくれるのではなかろうか? 自分は、まだWebページは作り終わっていませんが、 作成する時は、いろいろな環境で、正常に表示できるように 作りたいと思っています。 (日本語の文字コードは、 JIS を使う予定なのですが・・・) おっと!長文失礼しました! 自分は、このように考えているのですが、どうでしょうか?
231 名前:login:Penguin mailto:sage [01/11/15 02:16 ID:noyWS/iX.net] これって突っ込まれることを期待してワザとやってんの?
232 名前:login:Penguin mailto:sage [01/11/15 02:19 ID:r2ItaT6s.net] 本気でつっこんであげて下さい. >>230
233 名前:そいじゃ突っ込み mailto:sage [01/11/15 05:10 ID:PMzBmxUW.net] > 自分はMS社は好きだけど、Shift−JISは嫌い。 > 逆に、日本でWindowsを使っていると、馬鹿になる可能性がある。 じゃあ 229 はもう馬鹿になってるな(藁
234 名前:login:Penguin mailto:sage [01/11/15 07:53 ID:ybZRG6lR.net] >>229 言いたいことはわからんでもないが、 世の中に出回っちまったものをそう簡単に あぼーんできるなら、 83 or 97 JIS で誰もあんな大苦労は、 しなかったろうし、 アンチ Unicoder だってここまでの、 大騒ぎはせんよ。 ちょっと想像してみろ。もし、 JIS C 6220 の左半分が ASCII と同じで、 JIS C 6220 の右半分が JIS C 6226 の制定にあわせ 廃止になっていて、 JIS C 6226 では JIS C 6220 との互換や便利な エンコーディングについて考慮されていて、 その後の改訂や追加も理想的になされた、として、 そして MS-DOS の日本語化が 日本語 EUC だったとして、 厨房は今よりも少ないと思うか ? Shift-JIS が、 もし存在しなかったとしても、 エンコーディングを、 一種類しか知らず文字集合との区別も付かん、 という厨房は減らんと思う。 まぁ確かに、 俺には >>1 の意図はサパーリ理解できんのだが。
235 名前:login:Penguin [01/11/15 08:20 ID:gOrKsa2J.net] >>229 EUCだとかSJISだとか語る前にまず真っ先に全角英数ヤメレ。 あと、JISとEUCの混在については何も語らないのか?
236 名前:login:Penguin mailto:sage [01/11/15 08:31 ID:tiluF2S6.net] >234 Shift-JISのところだけ全角ってのは明らかにわざとだと思うが。 (それ以外もなんかアレだが。)
237 名前:login:Penguin mailto:sage [01/11/15 11:17 ID:+5dCZCCC.net] >エンコーディングを、 >一種類しか知らず文字集合との区別も付かん、 >という厨房は減らんと思う。 229はコレだろまさに。 違うというなら区別を述べてみよ。
238 名前:login:Penguin [01/11/15 12:50 ID:UTucAaiV.net] 日本語の文章書くのにUS−ASCII(JIS X 0201)使わず にJIX X 0208のみ使う。ただし、引用したプログラムなどでは US−ASCIIのみ使う、というのもありかな。 main() { printf("Hell, world\n"); }
239 名前:login:Penguin mailto:sage [01/11/15 13:38 ID:U4qiuSGu.net] ?
240 名前:login:Penguin mailto:sage [01/11/15 15:14 ID:o+BuNf25.net] 「『全角半角』というものは文字コードに含まれない」とかいいつつ jisx0208 のアルファベットを使うと「読みにくい」って言うのはヘンじゃない? 「X−Windowsが動きません」 「違います。X Window System です。あとアルファベットや記号は...」 なんてやりとりを何回も見る。
241 名前:login:Penguin mailto:sage [01/11/15 16:32 ID:U4qiuSGu.net] >>239 分かっていると思うが、X-Windowsなんてものは存在しない。
242 名前:login:Penguin mailto:sage [01/11/15 17:30 ID:ybZRG6lR.net] >>239 ヘンではない。文脈が違うんだっちゅうの。 文字コードについての議論をしている時に、 全角とか半角とか関係ない概念を持ち込むな、 と言うのと、 ( Unicode に FULLWIDTH LATIN CAPITAL LETTER A とかいう連中がいてさらに話がややこしいのだが。 (コードだと FFxx の処) しかもこれ JIS X 0208 の 記号の救済になってないのよね ) 日常のメッセージ交換について、ISO 646 の文字集合に ある文字を使って構わない文字についてはそっち使え、 というのと、矛盾してないぞ。別に。 しかも >>239 が例示してるやりとりは基本的に ローカルルールの話。混同すんなよ。 このスレには「半角カナあぼーん」を日頃広言してる 奴が多そうだが、べつにこのスレでは (使ったからって) 何も言わん、それと同じ。 見栄えの問題として“「C 言語」”を“「C言語」”に したりする、なんてのはけっこうあると思う。 昔は個人のポリシーとして JIS X 0208 で全部書く なんてひともいたそうだけど。
243 名前:login:Penguin mailto:sage [01/11/15 18:17 ID:SZoZtT5l.net] >>241 mohta さんですな
244 名前:login:Penguin [01/11/15 23:44 ID:DaDunDH3.net] 日本語の proportional font ってあるんですか?
245 名前:login:Penguin mailto:sage [01/11/16 01:17 ID:SlO5AIlX.net] >>243 スレ違い。 まぁ243は MS P Gothic でも使ってなさいってこった。
246 名前:login:Penguin [01/11/16 02:29 ID:1EP3otcQ.net] >>225 こんな、電波受信しまくってるシロモノに検証もクソもねーだろ。 ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。
247 名前:225 mailto:sage [01/11/16 08:41 ID:WZsLOO+O.net] >>245 >ASCIIが129文字あると主張してる奴の相手するだけ時間の無駄。 俺もそう思ったから自分で検証しなかったし、 検証してない以上、感想的評価しか書けんからね。 ちょっとたずねるが、例えば当用漢字に関わる告示を 全部、今ここで列挙してみろと言われてできるか ? できないならその「シロモノ」に書いてある、 当用漢字に関する事項については、どこが偽で どこが真か判断できない筈だが ?
248 名前:login:Penguin mailto:sage [01/11/16 16:59 ID:JBbeQ7F0.net] >>246 ヘリクツはやめよーよ
249 名前:229 mailto:sage [01/11/16 21:28 ID:Aqdg8YXQ.net] >>232-236 ご回答、ありがとうございます。。m(_ _)m 色々と参考にもなりました。 ああ、なるほど。。 文字コードが1つだけだったとしても、厨房は減るとも限らないのですね。 言われてみれば、そういう気もしました。 それから、「Shift−JIS」の部分だけ全角英数なのは、 わざとやりました。Shift−JISを馬鹿にしているという意味でもありまして。 唯、日本語OSとしては、Shift-JISは、使いやすい感じなのでしょうかねぇ? ・・・ところで、メルマガで全角英数が沢山使われている ことについて、どのように思います? あと、BIGLOBE でも、全角英数が結構使われていたような 気もしたのですが、なぜなんでしょうかねぇ?
250 名前:login:Penguin mailto:sage [01/11/16 22:26 ID:x9gi1zY9.net] Unix 使っている人は全角英数を嫌う人が多いけど, それは単なる好き嫌いの問題だと思う. こういうことで人を馬鹿にして優越感を得るのはいかんよ.
251 名前:login:Penguin mailto:sage [01/11/16 23:16 ID:ADpYy+ve.net] だって読みづらいし検索しづらくないか
252 名前:login:Penguin mailto:sage [01/11/16 23:24 ID:/sHDqI0/.net] >>249 嫌われた最大の理由は -sony-fixed-*-16- と -misc-fixed-*-14- の 0201 の書体デザインが残念すぎたから という主張をヒソーリやってみるテスト。
253 名前:login:Penguin mailto:sage [01/11/17 07:55 ID:gZOX3LLK.net] そういえば、かつてのk14の全角英数の書体デザインはなぜかボールド体だったな。 東雲では直っているけど。 あと、BTRON(超漢字)は、デフォルトで英数が全角だな。読みづらいと思うんだが。
254 名前:login:Penguin mailto:sage [01/11/17 08:23 ID:bbmeDPw2.net] >>251 0208 ね ? 多分前者は s/-sony-/-jis-/ だと思うが。 JIS X 9051-1984「表示装置用16ドット字形」 ちなみに「16」が「16」でないのは、 jsa.or.jp のデータベースの頁からのコピペだから。 >>252 k14 のあれは逆に識別性を上げるために、 わざとやっているのだと自分には思われ。
255 名前:login:Penguin mailto:sage [01/11/17 08:36 ID:bbmeDPw2.net] >>252 TRON コードには 0201 も ASCII も 646 も 入ってないんだわ。Unicode2 経由でもって一部に あるけど。(だから 0201 カナが FFxx にあるぞ) 要するに全角文字・半角文字っていう区別の コードレベルでのパージを意図してたんだわ。 だから「半角」は、文字拡大/縮小指定付箋で 幅 1/2 を指定して実現されてる。(TAD をダンプ すりゃわかる) 要するに 0208 の文字を縮小 してるから「ヴ」の半角なんてのもアリ。 で、デフォルトではどんな文字でも全角で表示 しちまうんだが、一部アプリ (コンソール等) は、0201 の左側にある文字を適当に半角にして くれたりするんで (ブラウザの一行フォームなんかは なんでも半角だが) 余計ややこしい。 ま、最近のブラウザとか基本文章編集とかは プロポーショナル表示に対応しとるよ。 元々半角なのをプロポーショナルで見ると それはそれで悲惨だが。 純粋にジャポネスクな OS を作ろうとした研究が 他にもあって (IPSJ の論文漁ってみな) それなんかは 0208 オンリーで CHAR_BIT が 16 だか sizeof(char) が 2 だかの (後者だと標準から外れるが) C言語処理系から 自分達で作ったようで識別子とかに好き放題 0208 が 使えたらしい。
256 名前:login:Penguin [01/11/18 03:14 ID:VeGGFsw1.net] >>254 > 純粋にジャポネスクな OS を作ろうとした研究が(略) 農工大のOS omicronかな。
257 名前:login:Penguin [01/12/18 21:48 ID:61X7j+2e.net] みんな忘れてないか?age
258 名前:login:Penguin [01/12/21 06:06 ID:o684insm.net] 良スレ age
259 名前:login:Penguin mailto:sage [01/12/21 10:58 ID:7GMumlLM.net] >>257 クソスレだ。ageるな。
260 名前:login:Penguin mailto:age [01/12/21 11:51 ID:rzRakEP/.net] age
261 名前:login:Penguin mailto:sage [02/02/04 12:41 ID:m17eMVoW.net] 不治痛age
262 名前:青木光恵 mailto:青木光恵 [02/02/06 01:26 ID:07Li/whj.net] 青木光恵
263 名前:login:Penguin [02/02/06 01:36 ID:+3nKE+HU.net] ダーヤス写真集age
264 名前:login:Penguin [02/02/07 13:39 ID:12+BCoHT.net] んー。 文字コード云々の前に「コンピュータ上で扱えたい日本語」を 全部選定(?することは既に完了してるんでしょうか? 「正」の字とかは一画ずつ全五画分必要そうだし 偏だけ、旁だけってのも将来を見通せば必要そうですけど 出来てるんですかね。
265 名前:login:Penguin [02/02/07 18:12 ID:0AxTDb5J.net] X向けのcharsetはISO 2022だったよね。
266 名前:login:Penguin [02/02/07 20:36 ID:txThOpuJ.net] とりあえず >>15 は嘘。 HP-UX も Solaris も日本語環境を入れる時の default は SJIS です。
267 名前:login:Penguin [02/02/07 20:40 ID:txThOpuJ.net] よーしパパ LASER5 7.2exp の不具合張っちゃうぞ。 www.laser5.co.jp/support/l5linux/faq/72exp/index.html (Q6) 使う使わない、個人の好みの問題は別にして ちゃんとサポートしれ。
268 名前:login:Penguin [02/02/09 16:35 ID:CI8k4gxh.net] まあ、Shift-JISみたいな腐れフォント使ってる奴は死ねってことで。
269 名前:login:Penguin mailto:sage [02/02/09 16:37 ID:9Rjes/Sh.net] フォント関係あんの?
270 名前:おむこさん志望 ◆GqCwfDSA mailto:sage [02/02/09 17:18 ID:QaOYgbNI.net] >>267 ShiftJISはフォントじゃなくてエンコーディング。 自分でsjisロケールを生成してやればja_JP.SJISでも使える。
271 名前:login:Penguin mailto:sage [02/02/09 18:12 ID:KVJYho4s.net] まあ、UTF-16 みたいな腐れエンコーディング使ってるOSは氏ねってことで。
272 名前:login:Penguin mailto:sage [02/02/09 21:57 ID:gwaFMMy6.net] >X向けのcharsetはISO 2022だったよね。 何度も何度も何度も何度もガイシュツなように、2022はcharsetではありません。 encoding schemeです。萎えsage
273 名前:login:Penguin mailto:sage [02/02/09 23:19 ID:5njPVTaC.net] HTTP で charset= に encoding を書かせるのが誤解をうむ 元だよな...
274 名前:login:Penguin mailto:sage [02/02/11 23:09 ID:X+cO8gdB.net] 元はMIME。
275 名前:login:Penguin [02/02/16 22:54 ID:KpHa2nOV.net] age