1 名前:nobodyさん [2007/01/11(木) 02:40:43 ID:uW7xEbZY] 【正規表現道場の掟】 ・言語不問 ・質問も大歓迎。使用言語を書くのを忘れずに。 正規表現と関係ない話・質問は他スレへどうぞ。
539 名前:nobodyさん mailto:sage [2009/07/15(水) 09:40:19 ID:???] 秀丸で、CSSの : までの部分を強調表示したいのですが、 どう表現すればいいのでしょうか。 以下の例だと、font-size:の部分です。 h1 { font-size: 150% !important; }
540 名前:nobodyさん mailto:sage [2009/07/15(水) 13:56:52 ID:???] >>539 CSSに数字って出るんだっけ? [\-a-za-z0-9]+[ \t]*:
541 名前:nobodyさん mailto:sage [2009/07/15(水) 14:47:39 ID:???] ありがとうございます。 見やすくなりました! :first-childや:notのセレクタで誤爆していたので [\-a-za-z0-9]+[ \t]*:(?!\first|last|not) としました。 また以下のようなものだと誤爆するみたいですが これはほとんど使わないので目をつむろうと思いますw BODY[style="width: 100%; height: 100%;"] { font-size: 150% !important; }
542 名前:nobodyさん mailto:sage [2009/07/15(水) 15:14:34 ID:???] 良く考えたらもっと一杯あった [\-a-za-z0-9]+[ \t]*:(?!first|last|not|hover|focas|active|visited|link|lang|after|before)
543 名前:nobodyさん [2009/07/15(水) 23:25:43 ID:2a7dmfqp] /(^-^;)/w(^o^)vv(-_-;)vv[^-^](^_^;)/
544 名前:nobodyさん mailto:sage [2009/07/22(水) 16:01:40 ID:???] すみません質問させてください。 正規表現初心者です。 秀丸で、正規表現を使って文字列の置換をしようとしています。 例) abcd,efag), これを最初の[,]だけを[',]に置換したいと思っています。 検索文字列: [^)], 置換文字列: ', とすると、 abc',efag), のように文字列の後ろの1文字まで消えてしまいます。 文字列が消えないように、最後尾でない[,]だけを置換するにはどのように指定すればいいでしょうか。 教えてください。
545 名前:nobodyさん mailto:sage [2009/07/24(金) 05:32:15 ID:???] 秀丸でサポートされている正規表現の機能がどれだけのものか分からんからなあ。 候補 1(質問者の方針参考) 検索文字列: ([^)]), 置換文字列: $1', 候補 2 検索文字列: ,(?!$) 置換文字列: ', 無理なら一旦「,\n」を「,」を含まない別の適当な文字列に変換して、 全ての「,」を「',」に変換してから元に戻すとか。
546 名前:nobodyさん mailto:sage [2009/08/01(土) 13:06:24 ID:???] 候補 3 検索文字列: |-^)v!! 置換文字列: (^o^)/~~
547 名前:nobodyさん mailto:sage [2009/09/01(火) 17:17:50 ID:???] PHP5で、$txtに格納された <a href="javascript:userid('123456');">テキスト</a> ※「123456」と「テキスト」は変化します といった並びの文字列からタグをぬいて 123456,テキスト, とカンマ区切りにしたいのですが、何か良い方法はないでしょうか
548 名前:nobodyさん mailto:sage [2009/09/01(火) 17:51:35 ID:???] 自己解決しました お騒がせして申し訳ありますん
549 名前:nobodyさん mailto:sage [2009/09/03(木) 10:54:41 ID:???] >>548 はだれ?
550 名前:nobodyさん [2009/09/03(木) 12:19:35 ID:54RqrMPZ] 301でサイト移動をする場合に関数に色々な値があるのをそれぞれリダイレクトさせたい場合は 一挙に書くにはどうすればいいでしょうか? 1つ1つ書くと下記のようなのを1つにしたいです。 Redirect 301 /index.php?a=1 "www.sample.jp/index?a=1 " Redirect 301 /index.php?a=2 "www.sample.jp/index?a=2 " Redirect 301 /index.php?a=3 "www.sample.jp/index?a=3 " ・ ・ ・ Redirect 301 /index.php?a=a1 "www.sample.jp/index?a=a1 " Redirect 301 /index.php?a=b2 "www.sample.jp/index?a=b2 " Redirect 301 /index.php?a=c3 "www.sample.jp/index?a=c3 " ・ ・ ・
551 名前:nobodyさん mailto:sage [2009/09/03(木) 12:27:59 ID:???] >>550 誘導元で礼も無しとか失礼な人だな
552 名前:nobodyさん [2009/09/03(木) 12:47:58 ID:54RqrMPZ] 率直に言って「スレ違い」って程のことか? と思ったので礼などは書かなかった。 どっちかというとこっちの方が適切とは思うが、 【.htaccessファイル(「分散設定ファイル」)の書き方・使い方などに関するスレです。 】 って説明のスレに書いても別に間違ってないと思う。
553 名前:nobodyさん mailto:sage [2009/09/03(木) 15:52:56 ID:???] >>550 スレ違い。 【Apache】mod_rewriteについて語るスレ pc11.2ch.net/test/read.cgi/php/1023791370/ 個人的には礼とかどうでもいいと思うけど、 マルチ質問扱いされて厄介なことになる可能性があるので、 「向こうで質問し直します」とかひとこと言っておいた方が無難とは思う。 あと、ドメインの例示に使えるのは "example.jp" ね。
554 名前:nobodyさん mailto:sage [2009/09/13(日) 17:57:11 ID:???] PHPでPerl互換のpreg_replace関数を使った置換を行おうとしているのですが、 やりたいことがうまく実現できません。 やりたいことは、 ・<tagA>という文字列と</tagA>のあいだに<tagInsert>という文字列を挿入したい ・ただし、<tagA>の中に<tagB>という文字列がある場合は、その<tagB>の下に挿入したい <失敗した正規表現> $new_str = preg_replace("/<tagA(.*?)>(.*?)(<(?!tagB).)*/", '<tagA\\1>\\2<tagInsert>\\3', $str); <実現したい例> <tagA> <tagB> <tagB> <tagC> </tagA> ↓置換実行 <tagA> <tagB> <tagB> <tagInsert> <tagC> </tagA>
555 名前:nobodyさん [2009/09/27(日) 12:15:08 ID:???] /身長:(\d+)\n体重:(\d+)/ という正規表現に対し、例えば "身長:175\n体重:67" という文字列がきたら "身長:<font color="red">175</font>\n体重:<font color="blue">67</font>" のようにHTMLタグを追加したい。 ただし "身長:100\n体重:100" のように身長と体重が同じ場合も身長は赤、体重は青にしたい。 もっと欲をいえば正規表現は身長・体重だけでなく /年齢:(\d+)\n好きな食べ物:(\S+)/ のように可変にしたい。
556 名前:nobodyさん mailto:sage [2009/09/27(日) 13:11:58 ID:???] そうですか
557 名前:555 [2009/09/27(日) 15:20:08 ID:???] どうやればいいか知恵を貸してください
558 名前:nobodyさん mailto:sage [2009/09/27(日) 16:41:20 ID:???] 環境は?
559 名前:nobodyさん [2009/09/27(日) 16:49:26 ID:???] perlでもrubyでも できるだけトリッキーでなくて普通の正規表現のパターンマッチと置換でできる範囲で
560 名前:nobodyさん mailto:sage [2009/09/27(日) 23:10:15 ID:???] 絶対正規表現だけで書かなきゃだめなの? 普通に関数作る方が現実的だと思うけど
561 名前:nobodyさん mailto:sage [2009/09/28(月) 01:47:40 ID:???] if使って分岐させれば
562 名前:nobodyさん mailto:sage [2009/09/28(月) 08:53:02 ID:???] 正規表現をかじったけどちゃんと理解するにいたってない人は 正規表現でやるとかえって面倒な事までさせようとしていらない 苦労をする傾向があるね。理解しちゃえば使った方がいいかどうか 判断つくようになるんだが。
563 名前:nobodyさん mailto:sage [2009/09/28(月) 10:18:45 ID:???] >>555 こんなのとか? html = str.sub(/(.+?)(:)(\d+)\n(.+?)(:)(\S+)/) { "#{$1}#{$2}<font color=\"red\">#{$3}</font>\n#{$4}#{$5}<font color=\"blue\">#{$6}</font>" }
564 名前:nobodyさん mailto:sage [2009/10/06(火) 22:32:03 ID:???] phpのpreg_matchなのですが 文字列の中のURLからホストを取得するのは解るのですが ホスト名とその後に続くディレクトリ名を取得する方法を教えて下さい。 $url = "hogehoge.com/hoge/index.php "; これならば hogehoge.com/hoge の部分です。 お願いいたします。
565 名前:nobodyさん [2009/10/13(火) 11:08:03 ID:8X+N74J6] phpで、いくつか特定の拡張子を持つファイルをマッチさせたいのですが、 最後を意味する$は下記のように最終的に1つでよいですか if (preg_match("/\.html|\.php|\.txt$/",$value)) { $chk = 1; } それともこのように全部に$が必要ですか? if (preg_match("/\.html$|\.php$|\.txt$/",$value)) { $chk = 1; }
566 名前:nobodyさん mailto:sage [2009/10/13(火) 11:28:58 ID:???] >>564 parse_url使うか"/(.*)\//" >>565 やってみればわかることだけど当然全部に必要 だから\.(html|php|txt)$みたいに括弧でくくるのが常套だけどマッチした値を取得する必要ないなら \.(?:html|php|txt)$と書いて少し軽くできる
567 名前:565 [2009/10/13(火) 12:34:51 ID:8X+N74J6] >>566 ありがとうございました( ^ω^)
568 名前:nobodyさん mailto:sage [2009/10/14(水) 08:58:15 ID:???] perl で, 「<と>で囲まれた文字列内の abc を def に全て置換する」 というのは正規表現でどう書けばよいでしょうか。 マッチだけならば "<asaabcasalaabca>" =~ /\<(.*?)(abc(.*?))*?\>/ のようにしてマッチさせられるのですが,繰り返しがあるので後方参照で取得できません。
569 名前:nobodyさん mailto:sage [2009/10/14(水) 09:18:20 ID:???] >>568 せっかくperlでプログラム書けるんだから、 1. 「<」と「>」に囲まれた文字列を取り出す 2. 1で取り出した文字列のabcをdefに置換 3. 2の結果を「<」「>」で挟む とやれば難しいことは何もない。
570 名前:568 [2009/10/14(水) 10:26:28 ID:6OWMkMrw] >>569 いや,確かにおっしゃるとおりなのですが, Perl互換の正規表現を採用しているエディタで文章を打っているときに, いちいち使い捨てのPerlスクリプトを作るのが面倒で, せっかくエディタに内蔵されている正規表現置換機能で置換できれば便利なのにな……と思った次第です。
571 名前:nobodyさん mailto:sage [2009/10/14(水) 10:46:05 ID:???] そりゃそのエディタの説明書に書いてあるだろ
572 名前:nobodyさん mailto:sage [2009/10/14(水) 16:45:59 ID:???] 「< と > で囲まれた文字列内のある一つの abc を def に置換する」を、 そのエディタのキーボードマクロ機能で繰り返し適用すればよくね?
573 名前:nobodyさん mailto:sage [2009/10/14(水) 17:59:48 ID:???] いや、そのエディタに正規表現での置換機能もあるだろ、普通
574 名前:nobodyさん mailto:sage [2009/10/14(水) 18:10:49 ID:???] 置換というか補完じゃね?
575 名前:572 mailto:sage [2009/10/14(水) 18:34:24 ID:???] >>573 エディタの置換機能だと複雑なことができない (この場合 < と > の間を繰り返し置換) からどうすればいいの?っていう質問だと思ったんだが、違うのかな? どのエディタ使ってるとか晒してくれるともっと的確に答えれる香具師がいそうだが。
576 名前:568 mailto:sage [2009/10/14(水) 23:09:15 ID:???] >>571-574 いえ,ですから,エディタ(Mac OS X の Jedit X です)に正規表現置換機能が備わっていることは分かっています。 その正規表現の書き方を知りたいのです。 「< と > の間の繰り返し置換」は正規表現では実現不可能,ということであれば, やむを得ずスクリプトを組みます(Perl あるいは Jedit X のマクロ言語である AppleScript)が, 可能であれば正規表現置換で実現したいのです。 やはりエディタウィンドウ内で完結するのは手軽ですので。 先読み・後読みや再帰を利用した超絶技巧的正規表現でも構いません。アイデアを求めています。
577 名前:nobodyさん mailto:sage [2009/10/15(木) 00:24:07 ID:???] >>568 =570=576 テキストエディタの実装する正規表現には方言がある。 ここで尋ねても埒が明かない可能性が大なので、新Mac板の専用スレッドに引っ越すことを推奨。 Mac用テキストエディタ Jedit X / 1.0〜4.0 pc11.2ch.net/test/read.cgi/mac/1248500724/
578 名前:nobodyさん mailto:sage [2009/10/15(木) 13:12:35 ID:???] >>576 Perlでしてみた。 そのエディタは後方参照はできるんかな? my $str = "<asaabcasalaabca>"; print $str, "\n"; $str =~ s/((?:<|\G).*?)abc(?=.*?>)/\1def/g; print $str, "\n";
579 名前:578 mailto:sage [2009/10/15(木) 13:19:37 ID:???] >>568 のケースだけなら大丈夫だけど、汎用的には不具合がありそうなので取り消し
580 名前:578 mailto:sage [2009/10/15(木) 13:37:10 ID:???] 試行錯誤した結果、以下でいけそうな感じだけど、どうだろう? $str =~ s/((?:<|\G)[^<>]*?)abc(?=[^<>]*>)/\1def/g;
581 名前:nobodyさん mailto:sage [2009/10/15(木) 13:51:05 ID:???] utf-8の文字コード内にない文字を探すにはどんな感じにすればいいんでしょうか? javascriptです。
582 名前:nobodyさん mailto:sage [2009/10/15(木) 20:38:57 ID:???] >>568 Perlだったら。 s/<(.*?)>/(my $s = $1) =~ s{abc}{def}g; "<$s>"/ges; エディタのマクロでやるのがいいかなと思うけど、ちょっと面倒。
583 名前:nobodyさん [2009/10/19(月) 23:25:42 ID:/Zspq1xO] PHPでとあるファイルを読み込んで、読み込んだファイルの中に下記の記述 があれば正規表現(preg_replace等)で空白に置き換えたいと考えています。 正規表現で正規表現を消す記述の仕方がわかりませんorz どのような正規表現を記載すればよいでしょうか。 すみませんがお分かりになられる方が居られましたらご教授よろしくお願いいたします。 ↓↓↓消したい記述その1↓↓↓ if ( /^(To|Cc): admin@admin\.com$/:h || /^(To|Cc): .*\<admin@admin\.com\>/:h ) { cc \"| /usr/bin/nextbb -c ISO-2022-JP -s 'xxxxx' -A 'From:yyyyy <admin@admin.com>' -t /home/sendmail -t\" } ↓↓↓消したい記述その2↓↓↓ /^[a-zA-Z0-9\-\.\/\[\]\(\)\{\}\|@`:<>,!?\"'#\$%&*+;\\=^_~ ]*?$/"
584 名前:nobodyさん mailto:sage [2009/10/19(月) 23:36:46 ID:???] Linuxコマンドが入力されるインプットボックスの入力チェック処理を 正規表現でやりたいのですが、どのようなチェックを行えばいいでしょうか?
585 名前:nobodyさん mailto:sage [2009/10/20(火) 09:19:58 ID:???] それはキミがどのような入力を許可したいかがわからないから答えようがない
586 名前:nobodyさん mailto:sage [2009/10/23(金) 15:06:47 ID:???] それを聞いているんじゃないのか
587 名前:nobodyさん mailto:sage [2009/10/23(金) 17:07:26 ID:???] Linuxコマンドとか、インプットボックスって何?
588 名前:nobodyさん mailto:sage [2009/10/24(土) 13:30:39 ID:???] <input>で何か入れてsubmitすると、それが実行されるのか? なんか巧妙にうまくごまかして危険なコマンド実行されそうだな。 正直俺の知識では知らん。 どんなコマンドも受け付けたくないな。 そもそもコマンドによってチェック内容は変わるんじゃないの?
589 名前:nobodyさん mailto:sage [2009/10/24(土) 18:23:59 ID:???] <input name="cmd" type="text" value="rm -rf ." />
590 名前:nobodyさん mailto:sage [2009/10/25(日) 08:12:45 ID:???] >>584 俺はこれからどのように生きていけばいいでしょうか? くらいに漠然とした質問だなこりゃ。 構文的に shell が受理可能かどうかなら Perl なら shellwords.pl 使うとかな。
591 名前:nobodyさん mailto:sage [2009/12/09(水) 19:11:48 ID:???] まだ正規表現が素人なので教えてください。 たとえば以下のように四行の文章があって それら文章の最初(一番目)の空白文字だけを検索するには どうすればいいのですか? The environment of contents industries is so drastically changing, though Japan has not fully. taken advantage of the changes to develop. its presence in the global market. The とenvironmentの間の空白文字 、though と Japanの間 taken とadvantage の間の空白文などなどです
592 名前:nobodyさん mailto:sage [2009/12/09(水) 21:08:56 ID:???] Perlで関数の括弧をドンドン入れ子にしていく正規表現書いてるだけと (\([^()]*(((\([^()]*\)[^()]*))*\)[^()]*)*)*\) ↑これに穴は無いよな!? どんなに入れ子にしても、エラーはでないかな 初めて作った正規表現なんだが。ご指南、よろ
593 名前:nobodyさん [2009/12/20(日) 20:33:27 ID:fe9ijwb+] 0*(\d+) これの意味を教えてください ()の中はわかるのですが前がよくわかりません
594 名前:nobodyさん mailto:sage [2009/12/20(日) 20:38:26 ID:???] 数字の並びから先頭の0を取り除いてる
595 名前:nobodyさん [2009/12/20(日) 20:44:43 ID:fe9ijwb+] なるほど 00200 とかの前の0を無視して検索できるという感じですか
596 名前:nobodyさん mailto:sage [2009/12/21(月) 08:18:48 ID:???] >> 0*(\d+) 0が0個以上並んだ後に、0〜9が1個以上並ぶ。
597 名前:nobodyさん mailto:sage [2009/12/21(月) 20:42:38 ID:???] >>592 見てないけど無理 (??{})あたり使えばいける
598 名前:nobodyさん [2009/12/23(水) 22:25:52 ID:Hajqsr0G] HTMLタグの <ul> <li> について、入れ子構造になっていた場合も考慮しつつ Pukiwiki等の記法に変換しようと考えています <ul> <li>1行目@1段目 <li>2行目@1段目 <ul> <li>3行目@2段目 <li>4行目@2段目 </ul> <li>5行目@1段目 </ul> これを - 1行目@1段目 - 2行目@1段目 -- 3行目@2段目 -- 4行目@2段目 - 5行目@1段目 こんな感じにしようと四苦八苦しているのですがどうにも難しく… ヒントだけでも良いのでアドバイスをお願いします。 今は、<ul>が存在する限り <ul>( <ul>以外 )<\/ul> を抜き出して その中を /<li>(.*?)<\/li>/s で置き換えて、抜き出し元と差し替えて 最初に見つかった<ul>(.*?)<\/ul>について <ul> と </ul>を削除、と考えていますが 最初の <ul>以外 の時点で既につまづいている始末です。
599 名前:nobodyさん mailto:sage [2009/12/23(水) 23:13:19 ID:???] $head= ''; $s=~ s/(<ul>)\s*|(<\/ul>)\s*|<li>(.*)(?:<\/li>)?\s*/$1?scalar($head.='-',''):$2?scalar(($head=substr($head,1)),''):"$head $3\n"/gei; print $s;
600 名前:nobodyさん [2009/12/29(火) 00:08:08 ID:F3P1tBWB] 文字列の中にある¥を除去したかったのですが、preg_replace('/¥/')や preg_replace('/¥¥/')では削除できなかったのですが、preg_replace('/¥¥¥/')だと削除できました・・・ これはなぜでしょうか。 ¥は次に有る文字をエスケープするわけですから、preg_replace('/¥¥/')でいけそうな気がするのですが。。。 正規表現初心者につき、低レベルですがご教授よろしくお願いいたします。 (上記は、あえて半角ではなく、全角の¥で説明しています。)
601 名前:nobodyさん mailto:sage [2009/12/29(火) 12:06:00 ID:???] やりたいこと自体はstr_replaceでできるだろうけどphpの正規表現がなんかおかしいな。 perlならそれで通るはずだけど。
602 名前:nobodyさん mailto:sage [2009/12/29(火) 12:38:00 ID:???] 文字列としてのエスケープと正規表現としてのエスケープは別。 '/\\/' は /\/ '/\\\/' は /\\/ '/\\\\/' も /\\/
603 名前:600 [2009/12/29(火) 22:52:30 ID:F3P1tBWB] >>601-602 なるほど!! そういうことでしたか。 ありがとうございます!
604 名前:nobodyさん mailto:sage [2009/12/30(水) 09:01:55 ID:???] ああそうか、phpだとシングルクオートで囲んでも\はエスケープに解釈されるのか。
605 名前:nobodyさん mailto:sage [2010/01/24(日) 19:36:14 ID:???] <a href="test.php?id=0001">あいうえお</a> <div class="id">0001</div> <div class="time">20100101010101</div> <div class="name">なまえ</div> <div class="body">コメント</div> 上記のタグがあったとして、 preg_match_all("/<a href=\"test.php\?id=0001\">(.*)/<\/div>\" style=\"display: none;\">/", $hoge, $data); のように書くと、指定したIDのaタグ内の文字がとれるのですが、その下の<div class="id">から<div class="body">の後の</div>までのタグ、 もしくはそのタグ内の文字列を抽出したいのですがうまくいきません。 それぞれのタグは1行でつながってるものとして、複数タグの範囲内を取るのは可能なのでしょうか?
606 名前:nobodyさん mailto:sage [2010/01/24(日) 20:12:18 ID:???] 複数ならpreg_match_all()使うけど一つならpreg_match()で以下のように preg_match('/\bid=(\d+)[^>]+>([^<]*)<\/a>.*?"id">\1<.*?"time">(\d+)<.*?"name">([^<]*)<.*?"body">([^<]*)</is', $s, $match);
607 名前:nobodyさん mailto:sage [2010/01/24(日) 21:01:02 ID:???] 有難うございます。 IDが0001以外のコメントもひろっちゃっていますが、かなり希望するのに近づいてきました。 もう少し細かく書くべきでしたが、複数のIDがあり、同じIDでのコメントも複数あった場合です。 上記のタグが一つのセットとして、いくつかある中の <a href="test.php?id=0001">あいうえお</a>のタグとコメント部分をまとめて表示させたいと思っています。 id=の部分を改変して直接0001を指定したらだめだった・・・
608 名前:nobodyさん mailto:sage [2010/01/25(月) 01:28:52 ID:???] 試行錯誤したらなんとか希望通りのものができました。 正規表現だけに囚われててプログラムがよろしくなかった…
609 名前:nobodyさん mailto:sage [2010/02/03(水) 12:34:08 ID:???] 先生質問です Rewriteで動的URLを静的URLにしたいのです やりたいことは6つのクエリを書き換えたいのですが 6つのうち1つのとき、2つのとき、・・・6つのときというように組み合わせがかなりの数になってしまうと思うのですが 順列で 6P1 + 6P2 + 6P3 + 6P4 + 6P5 + 6P6 と考えてよいのでしょうか? 6つも書き換えなんてやっぱ無理でしょうか?
610 名前:nobodyさん mailto:sage [2010/02/03(水) 13:22:42 ID:???] ちょw
611 名前:nobodyさん mailto:sage [2010/03/02(火) 21:59:18 ID:???]
612 名前:nobodyさん mailto:sage [2010/03/02(火) 22:11:34 ID:???] test
613 名前:nobodyさん mailto:sage [2010/03/08(月) 15:33:08 ID:???] MySQLダンプ内の /*------------------ここから--------------------*/ DROP TABLE IF EXISTS `table100`; /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `table100` ( `code1` varchar(5) default NULL, `zip1` varchar(7) default NULL, `address1` varchar(250) default NULL, `address2` varchar(250) default NULL, `div_1` varchar(1) default NULL, `div_2` varchar(1) default NULL, `import_date` timestamp NULL default NULL, `rec_key1` int(10) unsigned NOT NULL auto_increment, PRIMARY KEY (`rec_key1`) ) ENGINE=InnoDB AUTO_INCREMENT=121471 DEFAULT CHARSET=eucjpms; /*!40101 SET character_set_client = @saved_cs_client */; /*------------------ここまで--------------------*/ `table100` → `TABLE100` `code1` → `CODE1` など逆クォートで囲まれた小文字→大文字変換を一括で行いたいです。。 できればlinux コマンドライン、perl などでお願いします。。
614 名前:nobodyさん mailto:sage [2010/03/08(月) 18:01:54 ID:???] たぶんs/`(\w+)`/`\U$1`/g
615 名前:nobodyさん mailto:sage [2010/04/11(日) 00:10:39 ID:???] eregで半角記号のみをマッチさせてfalseを返す処理を組んでいるのですが、 何故か一部の漢字が引っ掛かってしまいます…確認した所では夕焼けの「夕」の 文字などです。 if(ereg ("[[:punct:]]",$_POST['名前'])) こんな感じです。今までは普通に機能していたんですが… どなたかアドバイス頂けないでしょうか?
616 名前:nobodyさん mailto:sage [2010/04/11(日) 02:49:42 ID:???] >>615 ereg って多バイト文字に対応してないんじゃないか?
617 名前:nobodyさん mailto:sage [2010/04/12(月) 09:23:26 ID:???] eregはPHP5.3.0から非推奨になってるので新しく書くプログラムでは 使わないほうがいいよ。perl互換正規表現(PCRE)をお使いください。
618 名前:nobodyさん mailto:sage [2010/05/02(日) 00:32:33 ID:???] :wink:, :lol:, :cry:, :evil:, :twisted:, :roll:, :idea:, :arrow:, :mrgreen:, :), :-(, :!:, :?:, :oops:, :-o,:-D,8-|,8-), :??, :x:, :-P, :ase:, =:[, :ahhh:, :star0.0:, :star0.0:, :star0.5:, :star1.0:, :!!!:, :**:, :heart:, :!!:, :hahaha:, :chin:, :[], :| こんな感じのスマイリーコードをマッチさせるのに、 $string = '{[:\*8=][(^:|*|a-zA-Z\-!?_\.\d\[)]*[(.*:)(.*\*)(.?)(:*[)(\])PoD\|]}; こんな感じのコードにしてみたけど、もっとスマートに出来ますか? しかし、正規表現はパズルみたいで面白いね。
619 名前:nobodyさん mailto:sage [2010/05/02(日) 04:08:13 ID:???] >>618 スマートさではこっちのが上だね :P (:(wink|lol|cry|evil|twisted|roll|idea|arrow|mrgreen|\!|\?|oops|x|ase|ahhh|star0.0|star0.5|star1.0|\!\!\!|\*\*|heart|\!\!|hahaha|chin):) |(:)|:-(|:-o|:-D|8-\||8-)|:??|:-P|=:[|:[]|:\|)
620 名前:nobodyさん mailto:sage [2010/05/02(日) 04:53:21 ID:???] >>619 色々バグってた my @g = $str =~ /( (?: \: (?: ahhh | arrow | ase | chin | cry | evil | hahaha | heart | idea | lol | mrgreen | oops | roll | star0\.0 | star0\.0 | star0\.5 | star1\.0 | twisted | wink | x | \!\!\! | \!\! | \! | \*\* | \? ) \:) | (?: \:-\) | \:\-\( | \:\-D | \:\-P | \:\-o | \:\?\? | \:\[\] | 8\-\| | 8\-\) | \=\:\[ ) )/gx;
621 名前:nobodyさん mailto:sage [2010/05/02(日) 10:16:16 ID:???] >>618 のだと:aaaaa:とか存在しないものまでマッチしちゃうよ? ((?:\:(?:(?:ahhh|arrow|ase|chin|cry|evil|hahaha|heart|idea|lol|mrgreen|oops|roll|star(?:0\.[05]|1\.0)|twisted|wink|x|\!{1,3}|\*{2})\:|\?[:?]|(?:\)|\[\]|\||\-[(oDP])))|(?:8\-[|)])|=\:\[)
622 名前:nobodyさん mailto:sage [2010/05/02(日) 11:44:31 ID:???] >>619-621 そうか、未来の拡張を考えて緩くしたけど、 2バイト文字以外のブログじゃ広くマッチしすぎるって事か。。。 それじゃスマイリーコードの方に厳格なルールを... なんって考えるのもユーザーに優しくないし。 折り合いつけるの難しいね :|
623 名前:nobodyさん mailto:sage [2010/05/02(日) 19:52:37 ID:???] >>622 厳格さが必要でない処理が行われるというのがイメージできんのだけど、 マッチさせてどうしたいんだ?
624 名前:nobodyさん mailto:sage [2010/05/02(日) 20:21:19 ID:???] >>623 とあるCMSで、 引用表示の時は、リンクとか画像とか取っ払う追加プログラム書いてるから。
625 名前:nobodyさん mailto:sage [2010/05/02(日) 22:35:26 ID:???] >>624 文から推測すると、前提として普通の記事の場合はスマイリーコードとやらが画像に変換されるということがあって、 その記事が引用されてる場合はそれらを除去したいということか? 前提が正しいならスマイリーコードを画像に変換する時に使ってるルールを厳格に使うべきだし、 正しくないならリンクでも画像でもないスマイリーコードを除去する必要がないと思うんだが
626 名前:nobodyさん mailto:sage [2010/05/02(日) 23:09:45 ID:???] >>625 正解です。 通常記事ではスマイリーコードが画像に変換されます。 で、引用時には、それら(改行,スペース,タブ,画像,リンク等)を除去して コンパクトにしたいのです。 引用文にスマイリーが入ってもいいんですが、 記事を丸める過程で<img>タグが邪魔したので、除去するを仕様としました。
627 名前:nobodyさん mailto:sage [2010/05/03(月) 00:05:08 ID:???] >>626 一度img要素に置換したものをベースにするというのがそもそもおかしいのでは? もしかして表示する直前に置換してるんじゃなくて、DBに突っ込む段階で置換しちゃってるとか? それだったら設計を見直したほうがいいと思うんだけど
628 名前:nobodyさん mailto:sage [2010/05/03(月) 00:07:04 ID:???] >>626 じゃあやっぱり >スマイリーコードを画像に変換する時に使ってるルールを厳格に使う が一番スマートなんじゃないか それができないなら一旦引用されていない記事として処理して、そこからimgタグを除去するとか 正規表現の話からはだいぶそれたので俺はこれ以上何も言わないことにするよ :P
629 名前:nobodyさん mailto:sage [2010/05/03(月) 00:36:11 ID:???] >>627-628 スマイリーコードが置換されるのはDBから引っ張ってからですが、 追加プログラムの導入IDによって優先順位があるので単純ではないんです。。。 で、私も正規表現から脱線しすぎなのでこれが最後。 脱線ついでに、タイムズスクウェアで爆発物を積んでた車って。。。 家の車も正規表現でマッチしちゃうwww
630 名前:nobodyさん [2010/05/19(水) 16:47:15 ID:t/z/xcK5] 質問させてください! ああああああ @ ABCD @ abcd という文字を <b>ああああああ</b> @ ABCD @ <em>abcd</em> のように置換したい時はどういう正規表現を使えばいいのでしょうか? よろしくお願いいたします
631 名前:nobodyさん mailto:sage [2010/05/19(水) 17:44:20 ID:???] その例にするための条件って何? スペース @ スペース が区切りとか?
632 名前:nobodyさん [2010/05/20(木) 19:43:15 ID:avs5qFDL] 質問させてください。 <table> <tr> <th>名称1</th> <td> 値1 </td> </tr> <tr> <th>名称2</th> <td> 値2 </td> </tr> </table> のようなHTMLがあります。 実際には全ての改行とインデントはトリムされてます。 この値1の部分をとるにはどのような正規表現を使えば良いでしょうか? <th>名称1</th><td>([^<]*)</td> のように考えてましたが値1には<img>タグが入る場合があります。 <table>や<td>が入ることはありません。
633 名前:632 mailto:sage [2010/05/20(木) 19:44:24 ID:???] 途中で投稿してしまいました。 お手数ですがご教授よろしくお願いします。 なお、当方18歳女子になります。
634 名前:nobodyさん mailto:sage [2010/05/20(木) 19:54:06 ID:???] <th>名称1</th><td>(.*?)</td>
635 名前:nobodyさん [2010/05/20(木) 20:40:36 ID:a5arSWsA] www19.atpages.jp/imagelinkget/get.php?t=v&u=www.phpbook.jp/regexp/ini/img/p1-1.png ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F1&src=regex1.png ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F8&src=regex8.png
636 名前:nobodyさん mailto:sage [2010/05/20(木) 21:13:11 ID:???] <th>名称1</th><td>(値1|<img>)</td>
637 名前:632 [2010/05/21(金) 22:05:20 ID:E8tDrX2s] ありがとうございました。 無事に解決できました。 これより踊りに行くのでこれにて失礼致します。
638 名前:nobodyさん mailto:sage [2010/05/24(月) 12:25:48 ID:???] 便乗だけど <table> <tr> <th>名称1</th> <td class="abc"> 値1 </td> </tr> <tr> <th>名称2</th> <td class="def"> 値2 </td> </tr> ...あと何個か続く この場合 <th>名称1</th><td .*>(.*?)</td> にしたのですが 何故かうまく 値1 だけ取得できません どうも .*で余計なものも取得しているようです どう書けばいいでしょうか 当方JKです。
639 名前:nobodyさん mailto:sage [2010/05/24(月) 14:40:31 ID:???] <th>名称1</th><td .*?>(.*?)</td>