1 名前:デフォルトの名無しさん [03/09/10 16:04] 文字コード変換について語りましょう♪
445 名前:デフォルトの名無しさん mailto:sage [04/03/09 09:40] 256bitでどうだコンチクショー
446 名前:デフォルトの名無しさん mailto:sage [04/03/09 10:03] >>445 どんだけ使えば気が済むんですか。
447 名前:さっきゅん ◆GG1SfzBGbU mailto:sage [04/03/09 13:22] _ /〜ヽ (。・-・) 。oO( 最初からグリフでデータ交換すれば文字コードなんて概念消滅するんだけど ゚し-J゚
448 名前:デフォルトの名無しさん mailto:sage [04/03/09 13:29] utf-2000とかどうか。
449 名前:デフォルトの名無しさん mailto:sage [04/03/09 13:41] >>447 お前さんの言う「グリフ」ってのは「グリフイメージ」のことか?
450 名前:デフォルトの名無しさん mailto:sage [04/03/09 13:42] >>448 古い。
451 名前:デフォルトの名無しさん mailto:sage [04/03/09 14:34] 検索どうするんだよ
452 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 15:00] >>447 それだと、フォントが変えられないし、HTMLブラウザやコンパイラや インタプリタに光学文字読み取り機を内蔵しなきゃならないし。
453 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 15:02] 合成文字まで考えるとやはり、結局固定長符号でも可変長符号でやる場合と 余り手間が変わらないのかな。
454 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 15:06] 合成文字がある場合は、UCS4符号を使っていたとしても、例えば「n文字目」の ポインタを得たいとき、言わずもがな、いきなり ptr = &linebuf[n-1] みたいなことをやるわけにも行かず、普通は、カレント位置から順番にたどって 行くことになるだろうらら。
455 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 15:07] 合成文字まで考えると、結局、UTF8でも、ASCIIしか考慮していない strstr()では正しく検索できないね。
456 名前:デフォルトの名無しさん mailto:sage [04/03/09 16:59] >>444 この世の中に180京文字以上もあるのか? 1つの言語ごとに1億文字分のスペースあたえても余裕だと思うが。 >>合成文字 手抜きせず全部展開これ最強。 もっと富豪になれいつまでも貧乏性はイカン
457 名前:デフォルトの名無しさん mailto:sage [04/03/09 17:14] >>456 8文字しか表現できないと思ったのか?
458 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 17:23] >>456 >この世の中に180京文字以上もあるのか? 64BITじゃ足りないというのは、合成文字も含めてのことでは?
459 名前:デフォルトの名無しさん mailto:sage [04/03/09 19:56] Sの大きいやつとかbとか合成顔文字とか、 そんなのをどんどん含めていくとして まあそれでも一億は越えないよな。
460 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/09 23:52] 日中混合漢字テーブルを作ってみました: www.nowsmartsoft.or.tv/nws/Japanese/japan_china.htm
461 名前:デフォルトの名無しさん mailto:sage [04/03/10 01:33] 文字コード変換について語りましょう♪
462 名前:デフォルトの名無しさん mailto:sage [04/03/10 03:08] たぶん24ビット(1677万文字)もあれば、合成なしで世界中の全部の文字を収録することが 出来そうな気がするが…
463 名前:デフォルトの名無しさん mailto:sage [04/03/10 07:47] >>462 DecompositionやNFDを使うのは派生形や辞書順での扱いを容易に するためであって、文字が足りないからではない。
464 名前:デフォルトの名無しさん [04/03/10 10:37] >>463
465 名前:デフォルトの名無しさん mailto:sage [04/03/10 15:11] >>464
466 名前:デフォルトの名無しさん mailto:sage [04/03/10 15:15] >>465 ?
467 名前:デフォルトの名無しさん mailto:sage [04/03/10 18:36] >>467
468 名前:467 mailto:sage [04/03/10 18:36] _| ̄|●
469 名前:デフォルトの名無しさん [04/03/11 16:20] Webアプリでhtmlで漢字入力した場合、サーブレットを通して最終的にJSPで表示する際、 どうしても文字化けが起こってしまいます。この場合に対処する方法としての プログラムの記述の仕方を知っている方がいらっしゃたら教えてください。
470 名前:デフォルトの名無しさん mailto:sage [04/03/11 17:30] そんなDQN言語使うからだ
471 名前:デフォルトの名無しさん mailto:sage [04/03/11 18:38] 言語がDQNなのではなく(ry WebProg pc2.2ch.net/php/
472 名前:デフォルトの名無しさん mailto:sage [04/03/11 21:18] 俺の知らない新言語が出来てるのかと思った。
473 名前:デフォルトの名無しさん [04/03/12 00:38] 質問です。 VBscriptを使って 「UTF-8」→「base64」→「UTF-8」のデコードを行いたいのですが、 googleでヒットするいろいろなサンプル関数をためしましたが、例えばこれでも www.geocities.co.jp/SiliconValley/4334/unibon/asp/base64.html どれもbase64→SJISにデコしようとしてる?のか、日本語が文字化けします。 とんでもない見たこともないような特殊漢字に化けます。英数は正常です。 なんとかUTF-8にデコードする方法はありませんでしょうか。 y = decodeStreamSJIS(l, k) ' シフト JIS として解釈する場合。 ' y = decodeStreamEUC(l, k) ' EUC として解釈する場合。 の部分に、unicode(UTF-8)にデコードするものを作ればいいのですが、いかんせん知識不足です。 目的としてはエンコードがかかったファイルをvbscriptバッチをはさみデコードするというものです。 ちなみにbasp21のデコード機能でさえ文字化けしました。 どれもみなSJISには直してくれるのですが、エンコ前の元データがUTF-8で、UTF-8にもどす となると見つかりません。 なにか良い方法はないでしょうか。
474 名前:デフォルトの名無しさん [04/03/12 01:05] すみません、質問です。 JSP画面で漢字表記するために必要なセンテンスって 何でしょうか?教えてください!!
475 名前:デフォルトの名無しさん mailto:sage [04/03/12 06:29] >>473 base64ってバイナリをそのままエンコード、デコードするものだと思うのだが。 文字コードと何の関係が?
476 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/12 22:52] www.nowsmartsoft.or.tv/nws/Japanese/jpcn1.htm
477 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/12 22:55] 投稿ミス(早走)りました。↑は、JIS第1水準+中国第一級。 ↓が、JIS第1第2+中国第一級、第二級 www.nowsmartsoft.or.tv/nws/Japanese/jpcn12.htm ついでに、Unicodeが、西洋の言語にヒイキ気味なことは、↓の最後の 方に書いてあります。異論あればどうぞ。 www.nowsmartsoft.or.tv/nws/Japanese/unciode.htm
478 名前:473 [04/03/13 12:34] >>475 確かにそうなんですけど。
479 名前:デフォルトの名無しさん mailto:sage [04/03/13 12:44] >>478 VBScriptの内部コードがUTF-8だからSJIS(EUC-JP)->UTF-8変換が入ってるんじゃないか? おそらく不要なコード変換部分をカットすれば良いだけだろう
480 名前:デフォルトの名無しさん [04/03/13 13:14] あ、しまったマルチになってしまいました。 えっと>>479 www.geocities.co.jp/SiliconValley/4334/unibon/asp/base64.html を使っているのですが、見た感じ、 SJIS→UTF-8ってのは無いかんじですが、どのあたりでしょうか。
481 名前:デフォルトの名無しさん mailto:sage [04/03/13 13:26] >>480 だからUTF-8とかSJISとかは実際のところ問題ではなくて バイト列->内部コード変換をカットしろという話なんだが…
482 名前:デフォルトの名無しさん mailto:sage [04/03/13 20:41] > 455 :LightCone ◆sSJBc30S5w :04/03/09 15:07 > 合成文字まで考えると、結局、UTF8でも、ASCIIしか考慮していない > strstr()では正しく検索できないね。 お前、 wcsstr/wcswcs って知ってる?
483 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/13 20:47] >>482 あなたは全く意味分かってないね。
484 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/13 20:50] >>482 要するに、そういうものを使えば、あらゆる文字コードに対応できるのは 当たり前なので言うまでもないことなんだよ。 だけど、UTF8は、strstr()でさえも、合成文字以外は正しい結果を出すように 工夫されていると言うこと。 人を馬鹿にする前に自分が勉強すること。
485 名前:デフォルトの名無しさん mailto:sage [04/03/14 00:08] string.h、ctype.h、regex.hなどの文字(列)に関係する関数全てが UTF-8を使えば国際化されるのであれば話は別だが、strstrとか一部の結果だけ 取り上げて既存の文字コードより優れてると主張するのは、木を見て森を見ない馬鹿か Markus Kuhnのような確信犯。まあ>>484 は前者だろう。
486 名前:デフォルトの名無しさん mailto:sage [04/03/14 01:05] OS 板に帰ってくれ。
487 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 01:09] >>485 >UTF-8を使えば国際化されるのであれば話は別だが、strstrとか一部の結果だけ >取り上げて既存の文字コードより優れてると主張するのは、木を見て森を見ない馬鹿か >Markus Kuhnのような確信犯。まあ>>484 は前者だろう。 UTF8の場合、何も修正しなくても大丈夫なことが多いと言うことが言えるわけで、 それが理解できないなら、UTF8について理解できてない。
488 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 01:16] >>485 試しに、UTF8に変えたとき破綻する例上げてみなはれ。 例えば、人が解釈するなら、「文字数を出す」という関数を、 「バイト数を返す」に「意味の解釈」を修正しないと駄目だけど、 コンピュータ内部では、何も修正せずに矛盾無く辻褄が合う。 はっきり言えば、ある意味変な解釈のまま、関数同士がお互いに間違い続ける から矛盾が生じないという事になる。
489 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 01:17] 自分が理解できないのを他人のせいにするのが流行ってまんな。2chは 大体そんなものだけど(笑)。
490 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 01:32] というより、専門の「煽り屋」の仕業だな。多分。 なぜなら、こんな馬鹿で失礼な人、自分の周りではあったこと無いから。 よく考えたら、実際問題、こんな失礼な人間、町歩いて手もいないもんな(笑)。
491 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 01:33] やっぱり1chの西さんの言うように、専門の煽り屋が居るって言う噂は、 本当なんだね。
492 名前:デフォルトの名無しさん mailto:sage [04/03/14 03:00] 最近放置気味だったのが、相手にしてもらえてうれしいようだ。
493 名前:デフォルトの名無しさん mailto:sage [04/03/14 03:09] >>485 の言うとおり regex は随分変更を受けると思うが。 標準関数じゃないが、よく使われるので重大だ。 あと、1文字のバイト数が固定じゃなくなるので、 strchr は strstr で代用できるとしても、 strrchr は使えなくなってしまう。 他にも strpbrk や strtok も改変が必要。 isleadbyte も改変が必要で、 後続バイト数を返すようにする必要がある。 あとは、標準関数だけじゃなく、 独自のライブラリの関数も軒並みアウトだろうな。 まぁ、想定する文字コードが違うんだから、 1文字1文字処理していくタイプの処理が使いまわせないのは 当然っちゃー当然だけど、 Shift-JIS か EUC かって程度なら isleadbyte 使ってりゃ何とかなることを考えると UTF-8 は随分面倒だ。 UTF-8 だと日本語は3バイト以上だし、どうやっても誤魔化せないな。
494 名前:デフォルトの名無しさん mailto:sage [04/03/14 03:11] お願いします。これ以上構うと閣下の病状が極端に悪化してしまいますので このあたりで勘弁してあげてもらえませんでしょうか。。。
495 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 07:35] >>493 >strrchr は使えなくなってしまう。 ASCIIに対しては無修正で使えるので、これも人間側の解釈の問題で、 コンピュータ内部では全く問題が発生しません。 それに対して、これがもし、Shift_JISであったならばそうは行きません。 >regex は随分変更を受けると思うが。 どのように変更を受けるんでしょうか?(笑)
496 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 07:36] 多分、>>493 も、UTF8の特性を理解してませんね。 試しに、regexの修正点を上げてみて下さい。
497 名前:デフォルトの名無しさん mailto:sage [04/03/14 08:34] >>496 文字単位でマッチングしないと使い物にならないからじゃないか? mblenなどをしっかり使っていればあまり問題は出ないはずなのだが 実際のアプリではロケールの初期化すらまともにされていなかったりする
498 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 08:45] >>497 >文字単位でマッチングしないと使い物にならないからじゃないか? 何故? regexの主たる目的は置換。 それに何故、文字数が必要? バイト位置で足りるはず。 せっかく、何もしなければ辻褄が合ってるのに、mblen()なんて使うと 破綻します。
499 名前:デフォルトの名無しさん mailto:sage [04/03/14 08:50] 単純に、こんな場所で偉ぶっていい気になってる「LightCone ◆sSJBc30S5w」が 可哀相に思えるのは私だけですか?
500 名前:デフォルトの名無しさん mailto:sage [04/03/14 09:18] >>498 この界隈のコテハンは相手が誤解していると思いこむ傾向が強いように見えるけど 実際は両方が誤解している場合が多そうだよ この件も問題にしている部分が違うだけ
501 名前:デフォルトの名無しさん [04/03/14 09:37] アホコテさらしage
502 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 09:43] >>500 それは、違いますな。 何故かというと、ワテと話していて全く誤解が生じない人種と あったことがあるからです。 すんなり話が通じて楽しかった。 はっきり言って、一般人と話すのは苦手です。バカの壁を感じるから。
503 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 09:47] ワテと話していてワテが間違っていると思う人は、 まず、99.99%位、あんたの間違いだと思って大丈夫。 それに大抵の優秀な人は、深読みするのでそうそう簡単に相手の間違いを 断定しない。 はっきり言って、間違ったことを行ったときでさえ、それなりに意味の 通じる解釈をする人が多い。 2chラーで批判ばかりしている人は全くの逆で、知能の低さがすぐに分 かる。 結局、辻褄の合う解釈法が重い浮かばなくて、理解できないんだよ(笑)。 アホ
504 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 09:49] はっきり言って、邪魔になるから、そういう人達には勉強などさせずに、 遊ばせてやったらいいんじゃないかと思ってる。
505 名前:デフォルトの名無しさん mailto:sage [04/03/14 09:52] >>503 相手の発言の意図を読む意志がないと指摘しているだけなんだが 無駄な発言をして悪かったよ
506 名前:デフォルトの名無しさん mailto:sage [04/03/14 09:55] >>502 > 何故かというと、ワテと話していて全く誤解が生じない人種と > あったことがあるからです。 M-x doctorかい?
507 名前:デフォルトの名無しさん mailto:sage [04/03/14 10:00] >>503 >それに大抵の優秀な人は、深読みするのでそうそう簡単に相手の間違いを >断定しない。 > >はっきり言って、間違ったことを行ったときでさえ、それなりに意味の >通じる解釈をする人が多い。 あんたはアホウだということだね。自認しているとは謙虚なやつだ(w
508 名前:デフォルトの名無しさん mailto:sage [04/03/14 10:04] とりあえずUnicodeいらね>自分コード作ったという所らしいけどさ、中共政府並みの強制力とか 影響力がない個人でやるのはきついだろうねぇ。 LightConeて人がどういう人か知らんのでOS板見て来たら自分でOS作ってる人なんだね。 それならそこでの実装に限定してそっちで話してればいいんじゃなかろうか?って思う訳だが。 ム板に来てやってんのはどういうあれなんだろう? このスレは最初は単発質問スレっぽい雰囲気だったけども、ほとんど既存のOSの上で規格として 動いてるUnicodeとローカルエンコードの変換とかの話してたと思うんだが。 なんで、このスレなんだろう? 自分コードを自分OSに実装したよの宣伝だとしたらちょっといただけないんだが。 自分で掲示板作ってそっちでやってるもんだとばっかり思ってたんだが、ここにきて煽りに対抗 するためだけに書き込みしてるみたいでちょっと痛いぞ。 ここでやってないでそっちでちゃんとした議論してた方がいいんじゃなかろうか? 老婆心だけどね。
509 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 10:09] >>507 なんか、なんでも基準を曖昧にしたがるようだけど、取りあえず、 悪いけど、そういう人種の人たちには、ワテ自身が確信していることに 対して批判を受けたことは未だにないんだよ。 もう、答えが出てしまって、証明済みで、なんの迷いもない結論に 達しているのに、まだ反論してくる人が居るのは、ネットのみの経験 だから、違いが如実。
510 名前:デフォルトの名無しさん [04/03/14 10:13] 発作age!
511 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 10:14] はっきり言うとね、ワテだって、結構間違うことはあるんだよ。 でも、そういう場合、 「そんなことがあったんですかいな!?」 「まいった、見落としてた!!」 「また、アホなミスをしった!!」 と思うわけ。 結局、指摘が的を射てるわけなんですよ、そういう連中は。
512 名前:デフォルトの名無しさん mailto:sage [04/03/14 10:23] 宣伝なら業者みたいに黙々とコピペしまくればいいのに。
513 名前:デフォルトの名無しさん mailto:sage [04/03/14 10:48] すいません、コーンたんはこういう人なんです。 すごくやる気があります。それは確かです。 でも、いつも車輪をダウングレードして再発明する人なんです。 しかも、人の指摘や忠告を聞く気はサラサラなく、一方的に放送した挙句、 最後はいつも「おまえらアホだ、俺は正しいのに」で終わるのです。
514 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:07] 正規表現の . がある。 これは任意の1文字にマッチングする。 ASCII の1文字は1バイト固定だが、 UTF-8 の1文字は1バイトとは限らない。 sed の書き方になるが、 s/a.a/aa/g の場合、UTF-8 の "aあa" を置換しようとしても、 ASCII の regex を使うと ''あ' は3バイトなため、マッチしない。
515 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:14] 2chは、確かに引きこもりやら、学生やらが多い。(俺も学生です・・・。) 確かにろくに分かっていないことでも、分かっているように言っている人も多いだろう。 ただし問題は時々有り得ないほど知識を持った人が紛れ込んでいること。 引きこもりばっかだと思えば、イケメンやら美人やらが紛れ込んでいるという事実。 不特定多数が集う匿名掲示板である以上、言葉遣いには気をつけるべし。 「車輪の再発明」という言葉を多用して批判する人がいるが、 こいつ自分の言葉に酔っているんだなぁと思うことはある。
516 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:15] で、ライトなんたら氏は そのあり得ないほど知識を持った人だと?
517 名前:デフォルトの名無しさん [04/03/14 12:18] 声を大にしていいたい。 日本が戦争に負けたとき、マッカーサーにより 日本は日本語を廃止し、すべて英語になるべきだった。 あまりにくだらないロスがおおすぎる。 当時まさかコンピューターでこんなロスが発生するとは 考えてもいなかったろうが。 すべて英語だったら、モジコードうんぬんなんて こんなくだらない苦労しなくてすむのに。
518 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:19] 暴言キター
519 名前:らいとこうん mailto:sage [04/03/14 12:21] ワテはOSを作れるほど知識を持った優秀な人間です。
520 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 12:25] >>514 >正規表現の . がある。 >これは任意の1文字にマッチングする。 >ASCII の1文字は1バイト固定だが、 >UTF-8 の1文字は1バイトとは限らない。 なるほど、それは確かにそうです。 UTF-8でも無修正で完全対応とは行かない例の一つですね。 考えるまでもなく、「文字数」が意味を成している部分はことごとく 駄目になります。今の場合でも、1文字ではなく「任意の文字の列」 でいいなら、「a.*a」で行けると思います。つまり、1「文字」と いう「文字数を数える行為」に失敗しているのが原因なのですね。
521 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:25] >517 お前は効率のために生きてるのか? 文化には多様性が必要だと思わないのか? まあ始皇帝も文字と秤を統一したがったけど、 アメリカみたいなインチが主流の国も世の中にはあるからな。 当分ラクにはならんよ。
522 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 12:36] >>514 ついでなので、「.」以外にもありますか?
523 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:38] 文字数に関わるもの全て。 {n,m} とか。
524 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:41] あと文字種の考え方自体もunicodeとそれ以外じゃ違う。 perlunicodeとか見たらそれなりの準備されてるのがわかるはずだ。
525 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 12:45] >>523 a{2,5} とか、 (あ){2,5} とかなら問題ないのでは?
526 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:46] >525 なんすかその不自然な括弧は?
527 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:47] あまり適当なことを言うと > 484 名前:LightCone ◆sSJBc30S5w 投稿日:04/03/14 01:41 > 2chって、詳しい人が多いのかと思ってたけど、かなり勘違いみたいですね。 > > そういう勘違いが起きてしまう理由は、いくつかの可能性がありますね。 > > 一つには、来る人が多いから、全然詳しくなくて断片的な知識を持ったいさま > ざまな人が来るため、一見もの凄く詳しい人が居るように見えるだけで、実際は、 > 断片知識の烏合の衆の集まりに過ぎない可能性。 こんな事言われちゃうよw
528 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 12:48] >>526 そりゃしゃあない。
529 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:49] そのカッコをつければできるとしても、 そのカッコはつけたくないなぁ。
530 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:53] 相手にしすぎると > 515 :デフォルトの名無しさん :04/03/14 12:14 > 2chは、確かに引きこもりやら、学生やらが多い。(俺も学生です・・・。) > 確かにろくに分かっていないことでも、分かっているように言っている人も多いだろう。 > ただし問題は時々有り得ないほど知識を持った人が紛れ込んでいること。 > 引きこもりばっかだと思えば、イケメンやら美人やらが紛れ込んでいるという事実。 > > 不特定多数が集う匿名掲示板である以上、言葉遣いには気をつけるべし。 > > 「車輪の再発明」という言葉を多用して批判する人がいるが、 > こいつ自分の言葉に酔っているんだなぁと思うことはある。 こんな事言われちゃうよw
531 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:55] そして雪崩れ込むように > 517 名前:デフォルトの名無しさん 投稿日:04/03/14 12:18 > 声を大にしていいたい。 > 日本が戦争に負けたとき、マッカーサーにより > 日本は日本語を廃止し、すべて英語になるべきだった。 > あまりにくだらないロスがおおすぎる。 > > 当時まさかコンピューターでこんなロスが発生するとは > 考えてもいなかったろうが。 > すべて英語だったら、モジコードうんぬんなんて > こんなくだらない苦労しなくてすむのに。 こんな事言われちゃうよw
532 名前:デフォルトの名無しさん mailto:sage [04/03/14 12:56] >>529 つけたくないなぁと言われても。
533 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:01] 論旨は「バイト単位の正規表現モジュールでutf8も問題なく扱える」だったと思うが、 . や [] のことも考えてない「全然詳しくなくて断片的な知識を持った」人だったと。 まあ間違えたのは仕方ない。しかし間違った後にうだうだいってるのは無様だし、 間違いを書く前に自分で検証する姿勢が足りてないのが暴言の数々から読み取れる。 頭冷やしてきなよ。
534 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:01] >>525 つまり世界中のregular expressionを使ったプログラムを修正して回れってこと? 普通の人は、regular expressionのライブラリのほうを修正すると思うが。
535 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:04] LightCone様の足下にも及ばない厨房のくせにいきがってんじゃねーよ。
536 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:06] >>535 何故そこでよく分からない横槍が入るw
537 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:06] いや正規表現側で工夫してきたのが今までの日本のperl文化だからなぁ。 どこにでもあるからって理由でperl使ってた人はそこに適応するようにスクリプト側で工夫してたわけ。 それも普通じゃないってこと? まあLightCornが破綻してるのは既に明らかだが。
538 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:06] >>534 普通の人はOSなんか作らないよ! とフォローにもならない暴言を吐いてみる
539 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:09] 話は変わるけど俺はucs2よりもutf8の方が寿命が長そうだから好きだ。 何度も書き直したくないじゃん?なら可変長のエンコーディングで通した方が将来性がある。 \0があまり登場しないから既存OSとの親和性も悪くないし。
540 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:10] 既にucs2対応のOSでしか動かないとか、 システムコールの度にエンコード変換するとか、 そういうのはイヤですわ。
541 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:15] Ruby は正規表現に日本語が使えるよ! やっぱ使えたほうが便利だよ。
542 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:17] 文字コード総合スレあっても良かったんかなぁ。 このスレの主旨って元々はピンポイントに「変換」だし。
543 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:19] ひまわりなら日本語だけで書けるよ!
544 名前:LightCone ◆sSJBc30S5w mailto:sage [04/03/14 13:22] 正規表現ルーチンは、UTF8を使っても要修正でした。 すんません、訂正します。 これで気が済むんでっか?
545 名前:デフォルトの名無しさん mailto:sage [04/03/14 13:23] 自分が独りワイワイと騒いどいて何いじけてんの?子供だね。