1 名前:デフォルトの名無しさん [2008/01/16(水) 17:41:27 ] プログラミング言語Rubyについての、初心者向けスレです。質問・要望・雑談などどうぞ。 関連スレやURLは>>2-7 あたりを見てください。Ruby on Railsの質問はWebProg板のRailsスレで。 ■質問する人へ 質問する前に次の3つをすること。ここで回答を待つよりそのほうが早い。 ・ぐぐる ・マニュアルで探す www.ruby-lang.org/ja/man/ ・FAQを読む www.ruby-lang.org/ja/man/?cmd=view;name=Ruby+FAQ 質問には以下を書くこと。へたくそな質問は再提出を要求される。 ・詳しい内容(「動きません」「うまくできません」では回答しようがない) ・エラーメッセージ(なるべくそのままで) ・実行環境(OS名、Rubyのバージョン(ruby -v でわかる)) ・最終的にやりたいこと(もっとよい方法がある場合が多いので) 回答してくれた人には「ありがとう」のひとことをいってあげて。 ■回答する人へ 相手は初心者、根気よく育てるつもりで。質問がへたくそなのも大目にみてあげる。 それができないならこないこと(だって初心者スレだもん)。 ・既出な質問やFAQは「XXXを読め」でいいので、叩かない&怖がらせない。 ・わけわかな質問にもエスパー発揮で。できれば質問の仕方を教えるぐらいで。 ・自信がない回答ならその旨表明すること。誤った回答は初心者じゃ見抜けない。
388 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 17:49:12 ] >>387 要件が曖昧な気がするな。 例) 01, 02, 11, 13 これの要約表現として、 a) [0-1][1-3] b) 0[1-2]|11|13 のどちらのようなものを求めるか、もわかりにくい。 数値としての範囲を記述させようという b)のようなら、正規表現は向かないだろう。 a)のように各桁独立で、0-9範囲の文字として処理させるなら、20行もいらないと思うが。
389 名前:デフォルトの名無しさん [2008/01/29(火) 18:21:59 ] >>388 基本的には「元の正規表現と等価である」というのが要件です. a)の場合は元の数値を含んでいますが,それ以外の 03や12なども含んでしまいますから等価ではないと思います. そのあたりの厳密性が要求されるのでb)が望ましいと言えます. 思いついたアルゴリズムとしては,|で区切った数値を 全て配列に書き出して,ソートして,一つ一つ取り出して, 連続しているようなら[ - ]で繋ぐという様なアルゴリズムで やろうかなと思います.
390 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 18:32:10 ] ふくろう本(みみずく本だっけ?)にないかなあ とあてずっぽうを言ってみるテスト
391 名前:238 mailto:sage [2008/01/29(火) 19:45:54 ] 大変な遅レスです。すみません。 >>255 うう、Cygwinは捨てたくないし、Winを捨てたら Win32OLEが使えませんし、ちょ と困ります。その関数もさすがに煩雑ですし。 >>261 おお!この手があったか!ありがとうございます。さっそく読んでみます。
392 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 20:11:08 ] >>388 perlのRegexp::Assembleのソース読んでみれば。
393 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 20:20:28 ] >>389 単純なalternationだけでいいなら、 いったん全部をトライ木に突っ込むのが簡単。
394 名前:デフォルトの名無しさん [2008/01/29(火) 21:29:58 ] >>392 perlですか.勉強してみます. >>393 なるほど.トライ木ですか. ありがとうございます.
395 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 21:39:06 ] というか、出力パターンが極めて限定されていて、 正規表現として解釈する必要が本質的に無いとかいうオチは無いだろうか
396 名前:デフォルトの名無しさん mailto:sage [2008/01/29(火) 23:53:14 ] 俺も正規表現使わないほうが早いんじゃないかとちょっとだけ思った
397 名前:デフォルトの名無しさん [2008/01/29(火) 23:55:06 ] パイプで別のプログラムを呼ぶときのことで質問させてください。 Rubyはmswin32の1.8系です。 RubyからMeCab(形態素解析ツール)を呼ぼうと次のように書いたのですが、 関数内での結果受け取り部分をどう書くのがよいかわかりません。。 プロンプトでMeCabの動作は、上記のようにオプションなしに呼んだ場合、文字列の入力を促され、 入力すると複数行の結果とEOS(文字列)が返って、次の入力待ちになります。 私\t説明 の\t説明 名前\t説明 EOS ・・(入力待ち) 以下ではこの流れをそのまま書きました。(続く)
398 名前:397続き [2008/01/29(火) 23:55:58 ] def parse(str) result = [] io = open("|C:/MeCab/bin/mecab.exe", "r+") io.puts str #ここで解析結果受け取り(後述) io.close; result end result_array = parse("私の名前") #結果を配列で受け取る ここで、入力待ち状態になったところをRubyでどう受け取ってMeCabを終わらせたらいいのかわからないのです。 nilなどが返るわけじゃないみたいですし・・・ 自分なりに書いたコードは以下で、一応動いています。(上記関数内のコメント部分に入る) while 1 word = io.gets.chomp! break if /\AEOS\z/ =~ word result << word end io.puts "^C" #こんなわけないような・・・ EOSの行は不要なのでこうしたのですが、MeCab以外の場合のことを考えるとこれじゃダメですよね。 もっと一般的な書き方があったら、おしえてください。(入力待ちになったら終了、など)
399 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 00:02:55 ] >>397 一般論として、相手側がまだ出力を続けているけど遅延か何かでたまたまデータが来ないのか、はたまた出力が終わって今度は入力待ちになったのか、を知る方法はない。 今回の例だったら、EOSが来て相手の出力が終わったことはわかるんだから、もう用がないならio.closeでOK。
400 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 00:04:03 ] io.close_writeかな? あと、回答とは違うがmecab-rubyを使うという選択肢はなし?
401 名前:397 [2008/01/30(水) 00:22:58 ] >>399 >>400 ありがとうございます。入力待ちで信号が来るわけじゃないんですね。 mecab-rubyはcygwin版でないとインストールが面倒そうだったので 早々にあきらめてしまいました。 過去スレにはWin32APIを介して・・というのも出ていたのですが 自分のスキルでは未知の領域なので同様に^^;
402 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 02:41:18 ] ruby 1.8.6 (2007-03-13 patchlevel 0) [i386-cygwin] です。 まちがって終わらない Thread を作ってしまい、Cygwin を走らせている アプリごと止めたんですが、改めて実行したら deadlock エラーがでました。 しかたがないので再起動してみたんですが、それでも deadlock がおきます。 ためしに irb を起動してみたらこのようにゾンビ化した Thread が残っています。 $ irb irb(main):001:0> Thread.current => #<Thread:0x1003c978 run> これ、どうやって消すんでしょうか?
403 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 03:05:51 ] >>402 それ単なる自分のスレッドだから。 アプリでdeadlockが起こってるってのはなんかロックとして使ってるファイルでも 消してないんじゃないか?tmpとか見てみれ
404 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 03:55:40 ] >>403 > それ単なる自分のスレッドだから。 そうみたいですね。 はやとちりでした。 どうやら自分が Thread の扱い方を理解していないだけみたいです。 orz
405 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 16:09:34 ] 正規表現で前からずっと気になってたので質問。 「でっかいHTMLから<title>を抜き出す」という場合 html.scan(/<title>(.+?)<\/title>/) みたいな書き方するんだけど、これよく考えたらhtml内で</title>が終わった後もえんえんサーチしてるよね。 「ひとつ見つけたらそこで終了させる」というような指定はできない?
406 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 16:17:57 ] >>405 '123451'.scan(/(1)/){p Time.now.to_f} 1201677254.19416 1201677254.19554 ということで、マッチするものが見つかるたびにブロックを実行してるようなので '123451'.scan(/(1)/){ p $1; break} "1" 即breakすれば桶
407 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 16:18:55 ] ブロック内でbreakすればいいんじゃない?
408 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 16:23:14 ] そもそもscanを使わないというのは無しですか? p $1 if /<title>(.*?)<\/title>/ =~ html
409 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 17:08:38 ] html.scan(/<title>(.+?)<\/title>/, 1)
410 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 18:07:49 ] >>409 これなんだろうと思ってリファレンスマニュアル見たけど無いよ slice(regexp[, nth]) の間違いだな
411 名前:デフォルトの名無しさん mailto:sage [2008/01/30(水) 18:45:11 ] WinとLinux(LinuxZaurus)で動くシリアルポートを操作するツールを作りたいのですが 何か良い方法があったら教えてください シリアルポート操作クラスはあるようですがWin用だったりして WinとLinuxであまりコードを変えたくないのですが… Winでmodeコマンド&IO.openを使う方法を試しているのですが `MODE COM4 BAUD=115200 PARITY=N DATA=8 STOP=1` com = open("COM1", 'r+b') sleep(1) com.syswrite("AT@K20\r") sleep(0.1) while true $> << com.sysread(1) end com.close よろしくお願いします
412 名前:デフォルトの名無しさん [2008/01/31(木) 01:03:43 ] すみません、RDEで実行結果(コンソールウィンドウ)をUTF8Nで表示する方法教えて下さい。 いろいろ試したのですが文字化けが直りません。 (以前のPCでは表示された気がしたのですが設定方法忘れてしまいました) RDE v1.1.1 / Ruby-mswin32 v1.8.6 / WindowsXP SP2 RDE設定 ・フォント(設定&エディタ設定): MS Pゴシック、文字セット:日本語 ・Ruby通常オプション: 「-Ku」(無しでも試したがダメ) ・コードウィンドウ>文字コード変換: japanese.dll(Y SJIS)にunicode.dllを追加(Y SJIS) ・コードウィンドウ>文字コード・ 「UTF8N + 改行:LF」 コード先頭に#!○○/ruby -Kuや$KCODE = 'u'、2行目に日本語のコメントを付けてもダメでした 文字コード変換のDLLのSJISを変更しないとダメなのでしょうか?(方法が判らないです)
413 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 15:20:33 ] Rubyから実行中のDirectXのfpsを取得するライブラリーとかない? 念を押すと、fpsのみでいいんだけども。
414 名前:デフォルトの名無しさん [2008/01/31(木) 16:55:01 ] Rakefileで CXX = 'g++' CXXFLAGS = '-Wall -g' TARGET = 'hellorake.exe' SRCs = FileList['./*.cpp'] OBJs = SRCs.sub(/$/, '.o') task :default => TARGET class Rake::Task alias :preqs :prerequisites end require 'rake/clean' CLEAN.include(OBJs) CLEAN.include(TARGET) rule('.cpp.o' => [proc {|o| o.sub(/\.cpp\.o$/, '.cpp') }]) do |t| sh "#{CXX} #{CXXFLAGS} -o #{t.name} -c #{t.source}" end file TARGET => OBJs do |t| sh "#{CXX} -o #{t.name} #{t.preqs}" end だとうまくいくのですが 「rule('.cpp.o' => [proc {|o| o.sub(/\.cpp\.o$/, '.cpp') }]) do |t|」の部分をシンプルにしようと思い 「rule '.cpp.o' => '.cpp' do |t|」にしたらDon't know how to build task './hellorake.cpp.o'と言われてしまいます Matzの呪いかと思ったのですがC言語なソースにしても同じでした><
415 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 18:20:10 ] >>413 > 実行中のDirectXのfpsを取得するライブラリーとかない? うーん。見たことないな・・・ DirectXの録画ソフトだと大抵ついている機能だから、 作者に頼んでみるとか、 オープンソースのソースを見て自分で作るとか
416 名前:415 mailto:sage [2008/01/31(木) 18:27:34 ] >>413 試してないが、この辺とか Taksi: Video capture/Screen capture for 3D applications taksi.sourceforge.net/ 他にも sourceforge に似たソフトがあったと思う あと、ムービー録画するソフトに関してはこちらの方が詳しい 【鑑賞】 ムービースレッド 【作成】 part2 game14.2ch.net/test/read.cgi/gamef/1167265823/
417 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 19:22:03 ] >>414 OBJs = SRCs.sub(/\.cpp$/, '.o') rule '.o' => '.cpp' do |t| なら動くが、二重のsuffixには対応しないんじゃね?
418 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 19:50:08 ] ていうか勝手に自己解釈で縮めんなよ
419 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 19:51:22 ] >>418 ???
420 名前:デフォルトの名無しさん [2008/01/31(木) 20:37:42 ] 教えてください。 UTF8の文字列に対して、正規表現で何かする場合に、 「〜」という文字が使えない気がするのですが、何故でしょうか? Ruby1.8.6をWindowsで使ってます。
421 名前:420 [2008/01/31(木) 21:15:20 ] ごめんなさい。Kconvの問題のような感じなんですが。。 -------------------------- require 'kconv' s = "〜あはははは〜" if s =~ /〜.*〜/ then puts "Done" else puts "Failed" end if s =~ /あ.*は/ then puts "Done" else puts "Failed" end t = Kconv.tosjis(s) u = Kconv.toutf8(t) if u =~ /〜.*〜/ then puts "Done" else puts "Failed" end if u =~ /あ.*は/ then puts "Done" else puts "Failed" end ---------------------- ↑を実行すると Done Done Failed Done となります。何か間違ってるところがあるのか、教えていただければ嬉しいです。
422 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 21:27:23 ] 試さないで適当にレスするけど 正規表現の後ろにuってつけてみたらどうだ /〜/u みたいに
423 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 21:30:10 ] >>421 文字コード指定してないんだから、そりゃマッチしなくて当然だ 初期状態では、正規表現はマルチバイト文字列にマッチしないようにできてる (少なくとも確実にマッチするという保証はない) $KCODEを設定するか、あるいは正規表現に文字コード指定をつけるかしないとダメ
424 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 21:34:09 ] 「〜」であるべきコードの主力が ウエーブダッシュ:〜 全角チルダ:~ のふたつあるのが問題かなーとおもったけど、ちがうのか
425 名前:420 [2008/01/31(木) 21:44:01 ] >>422 今、やってみましたが、変化無かったです。 >>423 頭に、$KODE指定も付けてみましたが、変化無かったです。
426 名前:420 [2008/01/31(木) 21:47:28 ] >>424 それは全く知りませんでした。 今、後半の「〜」をウエーブダッシュというので、書き換えて やったらうまくいきました!! 本当に有難うございます。 ちなみにこの話っていうのはよく知られた問題なのでしょうか?
427 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 21:49:29 ] >>425 1. どんな$KCODE指定をつけたのか書くこと 2. tosjis&toutfで、正しく文字コードを変換できているかどうかをチェックすること
428 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 21:52:10 ] あーubuntuで作った文書をWinに持ってきたら 〜のつもりだった部分が全部ウェーブダッシュだったとかよくあるよな
429 名前:420 [2008/01/31(木) 22:03:02 ] >>427 1. $KCODE='UTF-8'としました。 コードのファイルはUTF-8で保存してます。 2. チェックの仕方が良く分からないので、ソースの文字コード指定で 以下のようにしましたが、変化無かったです。 t = Kconv.kconv(s, Kconv::SJIS, Kconv::UTF8) u = Kconv.kconv(t, Kconv::UTF8, Kconv::SJIS) >>428 そうなんですか!よくある問題なんですね。。勉強になります。 ホント有難うございました。こんな早くに解決するとは、、 422さん,423さんもありがとうございました。
430 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 22:06:40 ] 〜は Mac ←→ Windows でも変になることがある厄介者。
431 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 22:10:02 ] WAVE DASH 問題 でググるとあれこれ出てくるぐらい有名な問題です
432 名前:420 [2008/01/31(木) 22:16:09 ] >>430 >>431 まじすか。ウエーブダッシュというものの存在自体しりませんでしたorz 初心者スレで質問してよかった。。
433 名前:デフォルトの名無しさん mailto:sage [2008/01/31(木) 22:42:26 ] MSが〜を全角チルダで変換するのは1992年のWindows3.1登場から。 で、規格は〜をウェーブダッシュにしろといってるが、これは1994年製。 だから、互換性重視するWindowsで〜をUnicodeにするとみんな全角チルダになる。 規格通り変換テーブルを実装すると〜の変換先はウェーブダッシュになるから大変な目に Unicodeの絡みであと問題になりやすいのは、MACがファイル名をNFDして持ち出してくることかな
434 名前:86 mailto:sage [2008/01/31(木) 23:33:29 ] すいません。未だにできないので、どなたかご教授ください。 文字列の距離を求めることはできるのですが、 母音(aiueo)の挿入、置換、削除が行われたときのみ、重みを1じゃなくて2としてで距離を計算したいんです。 kasaとsasaの距離は1 kasaとkasuの距離は2 といった感じです。どなたかよろしくお願いします。
435 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 00:08:29 ] def kyori(s, t) s.split('').zip(t.split('')).inject(0){|x,y| y[0] == y[1] ? x : x += (y[0] =~ /[aiueo]/ ? 2 : 1) } end kyori('kasa', 'sasa') => 1 kyori('kasa', 'kasu') => 2
436 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 00:37:55 ] >>433 良く知らんけど、1992年にすでにCP932->Unicodeの変換表とかまであったの? kernel32.dll に MultiByteToWideChar とかのユニコード変換系APIが 追加されたのは NT3.1以降、95以降らしい。 それ以前に互換性が問題になるほど外部に公開されてたAPIとか変換表ってあったん?
437 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 00:40:19 ] >>436 もちつけ。
438 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 01:19:06 ] WAVE DASH 問題の歴史は、安岡先生の ttp://slashdot.jp/~yasuoka/journal/357074 とかかな
439 名前:デフォルトの名無しさん [2008/02/01(金) 05:37:10 ] 本に載っているとおりに実行しているのですができません。 file = open("test.txt") print file.read :in `initialize': No such file or directory - test.txt (Errno::ENOENT) in `open' と表示されます。 どなたか教えてください。
440 名前:デフォルトの名無しさん [2008/02/01(金) 05:42:36 ] >>439 そのままの意味。 test.txtがないから開けない。
441 名前:デフォルトの名無しさん [2008/02/01(金) 06:35:57 ] >>440 返答ありがとうございます。 test.txt があることは何度も確認しているのですが、 どうしても、エラー表示がでるので、他のファイルで試してみます。
442 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 06:46:11 ] おそらくファイルのせいではありません。 カレントディレクトリ、というものを意識してください。
443 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 07:34:53 ] またあれかな 'デスクトップ' の文字コードが違うとか
444 名前:デフォルトの名無しさん [2008/02/01(金) 08:43:40 ] >>442 >>443 ありがとうございます。 保存する前に実行していたので、エラーが出たようでした。 保存後実行で解決しました。
445 名前:86 mailto:sage [2008/02/01(金) 11:08:20 ] >>435 ありがとうございます。確かに距離はでましたが、 例えばyとyyyyの距離は挿入が3回行われるため距離3にしたいのです。 またuとyyyyなら距離4にしたいのです。 すいません、仕様不足でしたが、修正ソースお願いできないでしょうか?
446 名前:86 mailto:sage [2008/02/01(金) 11:13:37 ] 追加ですが、比較に使用する文字列長は最低2でした。すいません。 なのでyuとyayaなら距離は5となります。 日本語からローマ字に変換したもの同士を比較してるのですが、もし母音が一文字なのが余計でしたら 例えば変換規則をxaなどとして必ず偶数番目に母音を入れることも可能です。 きゃとかしゃも何とかします。
447 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 11:31:53 ] Rubyを学ぶ気はなさそうだな 格好よく書かなければいけないという縛りを勝手に感じることがあるがそんなもん無視しろ 望む結果を出すプログラムであることが第一だ
448 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 11:35:21 ] どうがんばっても泥臭くしか書けないものも、無くはないからな
449 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 11:46:39 ] 俺はよりよい(あるいはまともな)プログラムにするのは半年後の自分に任せてる 何かよくわからない素晴らしいメソッドを使って1行で書けるのかもしれないが、今自力で作ることのほうが重要 まあ、半年後にはRubyどころかプログラミング言語すら使ってないっていうパターンもあるだろうけどな そういう場合は自己探求に任せるのは双方にとって馬鹿らしくはある
450 名前:86 mailto:sage [2008/02/01(金) 13:28:59 ] すいません。泥臭くてもやってみたいのですが、いかんせん>>435 の s.split('').zip(t.split('')).inject(0){|x,y| y[0] == y[1] ? x : x += (y[0] =~ /[aiueo]/ ? 2 : 1) } という一文が何をしているのかよくわからなくって・・・ 動作はするのに理解できてないのがわからず、修正しようにもできないのが現状です。 ですので、もしよかったらこの一文もご教授ください。。。ググッてみましたが.zipがうまく探せないです。
451 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 13:39:13 ] このスレにはタチの悪いオナニーワンライナーが生息してるからな 初心者に自分の技術(と信じてるもの)を見せびらかして悦に浸る人種
452 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 13:46:29 ] 思考をifとeachとローカル変数にバラすのもめんどいっちゃめんどいけどな 意図的に書いてる奴は放置として、気づいた人が平易なほうに書き直すのがよいかと思われ
453 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 13:59:12 ] s.split('').zip(t.split('')).inject(0){|x,y| y[0] == y[1] ? x : x += (y[0] =~ /[aiueo]/ ? 2 : 1) } とりあえず脊髄反射的にバラしてみる s_splitted = s.split('') t_splitted = t.split('') zipped = s_splitted.zip(t_splitted) zipped.inject(0){|x,y| y[0] == if y[1] then x else x += if y[0] =~ /[aiueo]/ then 2 else 1 end end } split ttp://www.ruby-lang.org/ja/man/html/String.html#split zip ttp://www.ruby-lang.org/ja/man/html/Enumerable.html#zip inject ttp://www.ruby-lang.org/ja/man/html/Enumerable.html#inject
454 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 14:36:46 ] 元のソース読むの面倒だったから、Wikipedia読んで一から書いた class String def levenstein(other) return nil if self.empty? return nil if other.empty? # 距離行列のサイズを確定 row_size = self.size + 1 col_size = other.size + 1 dm = [] row_size.times do dm << Array.new(col_size) end # 距離行列の値を初期化 for row in 0...row_size dm[row][0] = row end for col in 0...col_size dm[0][col] = col end (↓に続く)
455 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 14:37:36 ] (続き) # 距離の計算 for row in 1...row_size for col in 1...col_size c1 = self.slice(row - 1, 1) c2 = other.slice(col - 1, 1) if c1 == c2 then cost = 0 elsif c1 =~ /[aiueo]/ then cost = 2 else cost = 1 end dm[row][col] = [ dm[row - 1][col] + 1, # 挿入 dm[row][col - 1] + 1, # 削除 dm[row - 1][col - 1] + cost # 置換 ].min end end #行列の最後の値が文字列間のレーベンシュタイン距離となる return dm.last.last end end puts 'kasa'.levenstein('sasa') #=> 1 puts 'kasa'.levenstein('kasu') #=> 2 puts 'yu'.levenstein('yaya') #=> 4
456 名前:454 mailto:sage [2008/02/01(金) 14:41:23 ] 挿入コストやら削除コストやらは面倒だったんで全部1にした あとは自分で何とかしてくれ もしコードの内容にミスがあったら、誰か突っ込んでほしい
457 名前:86 mailto:sage [2008/02/01(金) 18:54:01 ] >>453 ありがとうございます。ソースまでのっけてくださって。 本来ならここで後は組み合わせろとなるところを >>454 おかげで助かりました。 ただ、例えばauとyauuの距離が2になってしまうのでちょこっと改造しておきます。 if c1 == c2 then cost = 0 elsif c1 =~ /[aiueo]/ then cost = 2 else cost = 1 end のへんをいじってやってみます。 >>451 から>>456 にいたるまで、皆さん本当にどうもありがとうございました。
458 名前:86 mailto:sage [2008/02/01(金) 19:05:37 ] >>454 今見てやってみたら一瞬で改造できました。笑 ほんとにこんな長いソースを実ソースも見ずにやっていただいてありがとうございます。 僕も、もうちょっと勉強して、僕みたいな香具師を助ける側になれるようがんばります。
459 名前:デフォルトの名無しさん mailto:sage [2008/02/01(金) 20:00:08 ] >>450 すまんそれはネタというか冷やかしで書いたもので 挿入とか削除とかに対応してないから使えないだろうな、とは思ってた。 勿論、技術をひけらかすつもりもない。 というか俺も素人だからそんなに大したコードじゃないと思うんだが・・・ zipは二つの配列からペア配列を作るメソッド a=[:a,:b,:c] b=[1,2,3] c=a.zip(b) #=> [[:a,1],[:b,2],[:c,3]] ハッシュ作るときとかにたまに使う Hash[*c.flatten] #=> {:a=>1, :b=>2, :c=>3}
460 名前:デフォルトの名無しさん [2008/02/02(土) 00:54:44 ] rubyにはawkやperlみたいな「一行野郎」集ってないの? テキスト処理にわざわざスクリプト書きたくないんだけど。
461 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:01:47 ] こういうことを言うとおまえらから総攻撃を受けるかもしれないが 一行で書きたいならawk使ったほうがいいような気がする
462 名前:デフォルトの名無しさん [2008/02/02(土) 01:14:45 ] awkの$1、$2に相当する組み込み変数はないの?
463 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:26:22 ] >>460 ここにいますよー。 Rubyの宿題スレにもそこそこいる
464 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:27:19 ] >>462 正規表現使った時にそいつら使えるぜ
465 名前:デフォルトの名無しさん [2008/02/02(土) 01:27:59 ] ネタにマジレスで申し訳ないけど、「一行野郎」って人じゃなくてコマンドね。
466 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:31:20 ] >462 -aオプション(とゆーことは、-nか-pオプションも)付けたときだけだが $F[0]、$F[1]、……が$1、$2……相当。 $0は$_ リファレンスのコマンドラインオプションのとこ参照 ちなみにそこ読めば書いてあるが$_をフィールドセパレータで分割したのが$Fなんで$FはArray
467 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:32:30 ] ワンライナーで書くための努力は、はっきしいって無駄な努力だよ。 ワンライナーでかけたからといって、自己満足でしかない。
468 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:32:33 ] perlのawkサポートと同じオプションだな。
469 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:32:40 ] File.open('hoge.txt').each { |line| puts(line.split.join('-')) } みたいに書こうと思えば書けるが、 Perl みたいな変態的な省略は_
470 名前:デフォルトの名無しさん [2008/02/02(土) 01:37:02 ] >>466 それだ。ありがと。 フィールドセパレータはどうやって設定するんだろう。。 >>467 君ってあまりコマンドラインシェル使ったこと無いでしょ。
471 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:38:25 ] >>470 いや、トテモトテモ使ってるよ。
472 名前:デフォルトの名無しさん [2008/02/02(土) 01:41:12 ] FSは「$;」で、RSは「$/」だね。これなら使えそうだ。
473 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:45:30 ] BEGINとENDもあるな。
474 名前:デフォルトの名無しさん [2008/02/02(土) 01:47:35 ] awk互換モードが欲しいな。2.0くらいでつけてほしい。
475 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 01:53:22 ] それはawkでいいじゃんw
476 名前:デフォルトの名無しさん [2008/02/02(土) 02:08:31 ] awk的使い方でも、rubyの機能を使いたくならない?
477 名前:デフォルトの名無しさん [2008/02/02(土) 03:02:51 ] windowsのコマンドプロンプトのコマンドラインで「|」を使えないから、one linerでブロックで変数を受け取る構文が書けないよ。 どうすればいいの?
478 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 03:21:41 ] >>477 普通に書けるけど? > ruby -Ks -e "Dir.glob('*'){|x|p x}"
479 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 08:06:42 ] ^でエスケープ > ruby -Ks -e "Dir.glob('*'){^|x^|p x}"
480 名前:86 mailto:sage [2008/02/02(土) 10:00:40 ] >>459 ありがとうございます。zipに関してかなり理解できました。 けっこー使えそうなメソッドなのでばりばり使っていきます。
481 名前:デフォルトの名無しさん [2008/02/02(土) 10:04:11 ] >>478 >>479 せんくす
482 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 13:43:33 ] ネット上の、時々更新されるHTMLをパースしてハッシュにして返すメソッドを作りました。 しかし、「データがありません」という場合どうするかで悩んでます。 a) 空のハッシュ {} を返す b) 偽である nil を返す c) 自作の例外を発生させる どれが妥当でしょか。 このハッシュは別の大きなハッシュに {サイト名 => parsed_hash} のように格納される予定です。 データがありませんの大きな理由として 「過去のハッシュとの差分がゼロ」 「HTML中にパースすべき該当項目なし」 「そもそもサーバにアクセスできない」 等があります。
483 名前:デフォルトの名無しさん [2008/02/02(土) 14:05:59 ] erbについて質問があります。 下記のようなコードを書いてerbに変数ItemListの内容を出力しようと思います。 PHPのテンプレートエンジンのSmartyのようにassignメソッドがあればいいのですが どうも見当たりません。 変数のスコープの問題だと思うのですが、どうやって出力すればいいのでしょうか? def initialize @cgi=CGI.new end # 商品一覧 def doItemList @erb = ERB.new("item_list.tpl") im=ItemManager.new() itemList=im.getItemList(10) display() end # テンプレート出力 def display(contentType="text/html") print "Content-Type: #{contentType}\n\n" print @erb.result(binding) end
484 名前:デフォルトの名無しさん [2008/02/02(土) 14:49:15 ] Rubyが面白そうなので今日からRubyをはじめます(^-^) まずはダウンロードしてこなきゃ!!o(^-^)o
485 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 14:54:20 ] >>460 俺がよく書くのは > ruby -e "puts ENV['PATH'].split(';')"(sortを加えることも) だって、生のPATH記述って読み辛いんだもの…。
486 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 15:00:05 ] >>459 なんだかすごく助けられた気がする 深謝
487 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 15:09:33 ] >>483 erbを一度も使ったことのない俺がWeb上の解説を読んで適当に回答するよ! > in `display': undefined local variable or method `itemList' for #<MyCGI:0x4030ed9c> (NameError) こんなエラーが出るという質問だと推測。itemListをインスタンス変数あたりに書き変えると動いたよ! require 'erb' class MyCGI def doItemList im = ItemManager.new @itemList = im.getItemList(10) @erb = ERB.new(DATA.read) display end def display(contentType="text/html") @contentType = contentType @erb.run(binding) end end class ItemManager def getItemList(n); (1..n).to_a; end end MyCGI.new.doItemList __END__ Content-Type: <%= @contentType+"\n\n" %> <%= @itemList.join(',') %>
488 名前:デフォルトの名無しさん mailto:sage [2008/02/02(土) 15:17:35 ] @erb.runあるいは@erb.resultをするメソッドから erbスクリプト内で使ってる名前の変数が読めないとダメっぽいという話。たぶん。 だからこれでも動く。displayに引数があるのは気持ち悪いのでoutputに変更(というかdisplayはto_sの以下略) require 'erb' class MyCGI def doItemList im=ItemManager.new itemList=im.getItemList(10) @erb = ERB.new(DATA.read) output(itemList) end def output(itemList, contentType='text/html') @erb.run(binding) end end class ItemManager def getItemList(n); (1..n).to_a; end end MyCGI.new.doItemList __END__ Content-Type: <%= contentType+"\n\n" %> <%= itemList.join(',') %>