正規表現道場

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 07/03 06:01 / Filesize : 179 KB / Number-of Response : 640
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

正規表現道場

1 名前：nobodyさん [2007/01/11(木) 02:40:43 ID:uW7xEbZY]: 【正規表現道場の掟】

・言語不問

・質問も大歓迎。使用言語を書くのを忘れずに。

正規表現と関係ない話・質問は他スレへどうぞ。
539 名前：nobodyさん mailto:sage [2009/07/15(水) 09:40:19 ID:???]: 秀丸で、CSSの : までの部分を強調表示したいのですが、
どう表現すればいいのでしょうか。
以下の例だと、font-size:の部分です。

h1 {
font-size: 150% !important;
}
540 名前：nobodyさん mailto:sage [2009/07/15(水) 13:56:52 ID:???]: >>539
CSSに数字って出るんだっけ？
[\-a-za-z0-9]+[ \t]*:
541 名前：nobodyさん mailto:sage [2009/07/15(水) 14:47:39 ID:???]: ありがとうございます。
見やすくなりました！
:first-childや:notのセレクタで誤爆していたので

[\-a-za-z0-9]+[ \t]*:(?!\first|last|not)

としました。

また以下のようなものだと誤爆するみたいですが
これはほとんど使わないので目をつむろうと思いますｗ

BODY[style="width: 100%; height: 100%;"] {
font-size: 150% !important;
}
542 名前：nobodyさん mailto:sage [2009/07/15(水) 15:14:34 ID:???]: 良く考えたらもっと一杯あった
[\-a-za-z0-9]+[ \t]*:(?!first|last|not|hover|focas|active|visited|link|lang|after|before)
543 名前：nobodyさん [2009/07/15(水) 23:25:43 ID:2a7dmfqp]: /(^-^;)/w(^o^)vv(-_-;)vv[^-^](^_^;)/
544 名前：nobodyさん mailto:sage [2009/07/22(水) 16:01:40 ID:???]: すみません質問させてください。
正規表現初心者です。
秀丸で、正規表現を使って文字列の置換をしようとしています。

例）
abcd,efag),

これを最初の[,]だけを[',]に置換したいと思っています。

検索文字列：　[^)],
置換文字列：　',
とすると、

abc',efag),

のように文字列の後ろの１文字まで消えてしまいます。
文字列が消えないように、最後尾でない[,]だけを置換するにはどのように指定すればいいでしょうか。
教えてください。
545 名前：nobodyさん mailto:sage [2009/07/24(金) 05:32:15 ID:???]: 秀丸でサポートされている正規表現の機能がどれだけのものか分からんからなあ。

候補 1(質問者の方針参考)
検索文字列: ([^)]),
置換文字列: $1',

候補 2
検索文字列: ,(?!$)
置換文字列: ',

無理なら一旦「,\n」を「,」を含まない別の適当な文字列に変換して、
全ての「,」を「',」に変換してから元に戻すとか。
546 名前：nobodyさん mailto:sage [2009/08/01(土) 13:06:24 ID:???]: 候補 3
検索文字列: |-^)v!!
置換文字列: (^o^)/~~
547 名前：nobodyさん mailto:sage [2009/09/01(火) 17:17:50 ID:???]: PHP5で、$txtに格納された

<a href="javascript:userid('123456');">テキスト</a>
※「123456」と「テキスト」は変化します

といった並びの文字列からタグをぬいて

123456,テキスト,

とカンマ区切りにしたいのですが、何か良い方法はないでしょうか
548 名前：nobodyさん mailto:sage [2009/09/01(火) 17:51:35 ID:???]: 自己解決しました
お騒がせして申し訳ありますん
549 名前：nobodyさん mailto:sage [2009/09/03(木) 10:54:41 ID:???]: >>548はだれ？
550 名前：nobodyさん [2009/09/03(木) 12:19:35 ID:54RqrMPZ]: 301でサイト移動をする場合に関数に色々な値があるのをそれぞれリダイレクトさせたい場合は
一挙に書くにはどうすればいいでしょうか？

１つ１つ書くと下記のようなのを１つにしたいです。

Redirect 301 /index.php?a=1 "www.sample.jp/index?a=1"
Redirect 301 /index.php?a=2 "www.sample.jp/index?a=2"
Redirect 301 /index.php?a=3 "www.sample.jp/index?a=3"
　・
　・
　・
Redirect 301 /index.php?a=a1 "www.sample.jp/index?a=a1"
Redirect 301 /index.php?a=b2 "www.sample.jp/index?a=b2"
Redirect 301 /index.php?a=c3 "www.sample.jp/index?a=c3"
　・
　・
　・
551 名前：nobodyさん mailto:sage [2009/09/03(木) 12:27:59 ID:???]: >>550
誘導元で礼も無しとか失礼な人だな
552 名前：nobodyさん [2009/09/03(木) 12:47:58 ID:54RqrMPZ]: 率直に言って「スレ違い」って程のことか？
と思ったので礼などは書かなかった。

どっちかというとこっちの方が適切とは思うが、
【.htaccessファイル(「分散設定ファイル」)の書き方・使い方などに関するスレです。】
って説明のスレに書いても別に間違ってないと思う。
553 名前：nobodyさん mailto:sage [2009/09/03(木) 15:52:56 ID:???]: >>550
スレ違い。

【Apache】mod_rewriteについて語るスレ
pc11.2ch.net/test/read.cgi/php/1023791370/

個人的には礼とかどうでもいいと思うけど、
マルチ質問扱いされて厄介なことになる可能性があるので、
「向こうで質問し直します」とかひとこと言っておいた方が無難とは思う。

あと、ドメインの例示に使えるのは "example.jp" ね。
554 名前：nobodyさん mailto:sage [2009/09/13(日) 17:57:11 ID:???]: PHPでPerl互換のpreg_replace関数を使った置換を行おうとしているのですが、
やりたいことがうまく実現できません。

やりたいことは、

・<tagA>という文字列と</tagA>のあいだに<tagInsert>という文字列を挿入したい
・ただし、<tagA>の中に<tagB>という文字列がある場合は、その<tagB>の下に挿入したい

＜失敗した正規表現＞
$new_str = preg_replace("/<tagA(.*?)>(.*?)(<(?!tagB).)*/", '<tagA\\1>\\2<tagInsert>\\3', $str);

＜実現したい例＞
<tagA>
<tagB>
<tagB>
<tagC>
</tagA>

↓置換実行
<tagA>
<tagB>
<tagB>
<tagInsert>
<tagC>
</tagA>
555 名前：nobodyさん [2009/09/27(日) 12:15:08 ID:???]: 　/身長：(\d+)\n体重：(\d+)/
という正規表現に対し、例えば
　"身長：175\n体重：67"
という文字列がきたら
　"身長：<font color="red">175</font>\n体重：<font color="blue">67</font>"
のようにHTMLタグを追加したい。

ただし
　"身長：100\n体重：100"
のように身長と体重が同じ場合も身長は赤、体重は青にしたい。

もっと欲をいえば正規表現は身長・体重だけでなく
　/年齢：(\d+)\n好きな食べ物：(\S+)/
のように可変にしたい。
556 名前：nobodyさん mailto:sage [2009/09/27(日) 13:11:58 ID:???]: そうですか
557 名前：555 [2009/09/27(日) 15:20:08 ID:???]: どうやればいいか知恵を貸してください
558 名前：nobodyさん mailto:sage [2009/09/27(日) 16:41:20 ID:???]: 環境は？
559 名前：nobodyさん [2009/09/27(日) 16:49:26 ID:???]: perlでもrubyでも
できるだけトリッキーでなくて普通の正規表現のパターンマッチと置換でできる範囲で
560 名前：nobodyさん mailto:sage [2009/09/27(日) 23:10:15 ID:???]: 絶対正規表現だけで書かなきゃだめなの？
普通に関数作る方が現実的だと思うけど
561 名前：nobodyさん mailto:sage [2009/09/28(月) 01:47:40 ID:???]: if使って分岐させれば
562 名前：nobodyさん mailto:sage [2009/09/28(月) 08:53:02 ID:???]: 正規表現をかじったけどちゃんと理解するにいたってない人は
正規表現でやるとかえって面倒な事までさせようとしていらない
苦労をする傾向があるね。理解しちゃえば使った方がいいかどうか
判断つくようになるんだが。
563 名前：nobodyさん mailto:sage [2009/09/28(月) 10:18:45 ID:???]: >>555
こんなのとか？

html = str.sub(/(.+?)(：)(\d+)\n(.+?)(：)(\S+)/) {
"#{$1}#{$2}＜font color=\"red\"＞#{$3}＜/font＞\n#{$4}#{$5}＜font color=\"blue\"＞#{$6}＜/font＞"
}
564 名前：nobodyさん mailto:sage [2009/10/06(火) 22:32:03 ID:???]: phpのpreg_matchなのですが
文字列の中のURLからホストを取得するのは解るのですが
ホスト名とその後に続くディレクトリ名を取得する方法を教えて下さい。

$url = "hogehoge.com/hoge/index.php";

これならば
hogehoge.com/hogeの部分です。

お願いいたします。
565 名前：nobodyさん [2009/10/13(火) 11:08:03 ID:8X+N74J6]: phpで、いくつか特定の拡張子を持つファイルをマッチさせたいのですが、
最後を意味する$は下記のように最終的に１つでよいですか

if (preg_match("/\.html|\.php|\.txt$/",$value)) {
$chk = 1;
}

それともこのように全部に$が必要ですか？

if (preg_match("/\.html$|\.php$|\.txt$/",$value)) {
$chk = 1;
}
566 名前：nobodyさん mailto:sage [2009/10/13(火) 11:28:58 ID:???]: >>564
parse_url使うか"/(.*)\//"

>>565
やってみればわかることだけど当然全部に必要
だから\.(html|php|txt)$みたいに括弧でくくるのが常套だけどマッチした値を取得する必要ないなら
\.(?:html|php|txt)$と書いて少し軽くできる
567 名前：565 [2009/10/13(火) 12:34:51 ID:8X+N74J6]: >>566
ありがとうございました（　＾ω＾）
568 名前：nobodyさん mailto:sage [2009/10/14(水) 08:58:15 ID:???]: perl で，
「<と>で囲まれた文字列内の abc を def に全て置換する」
というのは正規表現でどう書けばよいでしょうか。

マッチだけならば
"<asaabcasalaabca>" =~ /\<(.*?)(abc(.*?))*?\>/
のようにしてマッチさせられるのですが，繰り返しがあるので後方参照で取得できません。
569 名前：nobodyさん mailto:sage [2009/10/14(水) 09:18:20 ID:???]: >>568
せっかくperlでプログラム書けるんだから、

1. 「<」と「>」に囲まれた文字列を取り出す
2. 1で取り出した文字列のabcをdefに置換
3. 2の結果を「<」「>」で挟む

とやれば難しいことは何もない。
570 名前：568 [2009/10/14(水) 10:26:28 ID:6OWMkMrw]: >>569
いや，確かにおっしゃるとおりなのですが，
Perl互換の正規表現を採用しているエディタで文章を打っているときに，
いちいち使い捨てのPerlスクリプトを作るのが面倒で，
せっかくエディタに内蔵されている正規表現置換機能で置換できれば便利なのにな……と思った次第です。
571 名前：nobodyさん mailto:sage [2009/10/14(水) 10:46:05 ID:???]: そりゃそのエディタの説明書に書いてあるだろ
572 名前：nobodyさん mailto:sage [2009/10/14(水) 16:45:59 ID:???]: 「< と > で囲まれた文字列内のある一つの abc を def に置換する」を、
そのエディタのキーボードマクロ機能で繰り返し適用すればよくね？
573 名前：nobodyさん mailto:sage [2009/10/14(水) 17:59:48 ID:???]: いや、そのエディタに正規表現での置換機能もあるだろ、普通
574 名前：nobodyさん mailto:sage [2009/10/14(水) 18:10:49 ID:???]: 置換というか補完じゃね？
575 名前：572 mailto:sage [2009/10/14(水) 18:34:24 ID:???]: >>573
エディタの置換機能だと複雑なことができない (この場合 < と > の間を繰り返し置換)
からどうすればいいの？っていう質問だと思ったんだが、違うのかな？

どのエディタ使ってるとか晒してくれるともっと的確に答えれる香具師がいそうだが。
576 名前：568 mailto:sage [2009/10/14(水) 23:09:15 ID:???]: >>571-574
いえ，ですから，エディタ（Mac OS X の Jedit X です）に正規表現置換機能が備わっていることは分かっています。
その正規表現の書き方を知りたいのです。

「< と > の間の繰り返し置換」は正規表現では実現不可能，ということであれば，
やむを得ずスクリプトを組みます（Perl あるいは Jedit X のマクロ言語である AppleScript）が，
可能であれば正規表現置換で実現したいのです。
やはりエディタウィンドウ内で完結するのは手軽ですので。

先読み・後読みや再帰を利用した超絶技巧的正規表現でも構いません。アイデアを求めています。
577 名前：nobodyさん mailto:sage [2009/10/15(木) 00:24:07 ID:???]: >>568=570=576
テキストエディタの実装する正規表現には方言がある。
ここで尋ねても埒が明かない可能性が大なので、新Mac板の専用スレッドに引っ越すことを推奨。

Mac用テキストエディタ Jedit X / 1.0～4.0
pc11.2ch.net/test/read.cgi/mac/1248500724/
578 名前：nobodyさん mailto:sage [2009/10/15(木) 13:12:35 ID:???]: >>576
Perlでしてみた。
そのエディタは後方参照はできるんかな？

my $str = "<asaabcasalaabca>";
print $str, "\n";

$str =~ s/((?:<|\G).*?)abc(?=.*?>)/\1def/g;

print $str, "\n";
579 名前：578 mailto:sage [2009/10/15(木) 13:19:37 ID:???]: >>568のケースだけなら大丈夫だけど、汎用的には不具合がありそうなので取り消し
580 名前：578 mailto:sage [2009/10/15(木) 13:37:10 ID:???]: 試行錯誤した結果、以下でいけそうな感じだけど、どうだろう？

$str =~ s/((?:<|\G)[^<>]*?)abc(?=[^<>]*>)/\1def/g;
581 名前：nobodyさん mailto:sage [2009/10/15(木) 13:51:05 ID:???]: utf-8の文字コード内にない文字を探すにはどんな感じにすればいいんでしょうか？
javascriptです。
582 名前：nobodyさん mailto:sage [2009/10/15(木) 20:38:57 ID:???]: >>568
Perlだったら。
s/<(.*?)>/(my $s = $1) =~ s{abc}{def}g; "<$s>"/ges;

エディタのマクロでやるのがいいかなと思うけど、ちょっと面倒。
583 名前：nobodyさん [2009/10/19(月) 23:25:42 ID:/Zspq1xO]: ＰＨＰでとあるファイルを読み込んで、読み込んだファイルの中に下記の記述
があれば正規表現(preg_replace等)で空白に置き換えたいと考えています。
正規表現で正規表現を消す記述の仕方がわかりませんorz
どのような正規表現を記載すればよいでしょうか。
すみませんがお分かりになられる方が居られましたらご教授よろしくお願いいたします。

↓↓↓消したい記述その１↓↓↓
if ( /^(To|Cc): admin@admin\.com$/:h || /^(To|Cc): .*\<admin@admin\.com\>/:h )
{
cc \"| /usr/bin/nextbb -c ISO-2022-JP -s 'xxxxx' -A 'From:yyyyy <admin@admin.com>' -t
/home/sendmail -t\"
}

↓↓↓消したい記述その２↓↓↓
/^[a-zA-Z0-9\-\.\/\[\]\{\}\|@`:<>,!?\"'#\$%&*+;\\=^_~ ]*?$/"
584 名前：nobodyさん mailto:sage [2009/10/19(月) 23:36:46 ID:???]: Linuxコマンドが入力されるインプットボックスの入力チェック処理を
正規表現でやりたいのですが、どのようなチェックを行えばいいでしょうか？
585 名前：nobodyさん mailto:sage [2009/10/20(火) 09:19:58 ID:???]: それはキミがどのような入力を許可したいかがわからないから答えようがない
586 名前：nobodyさん mailto:sage [2009/10/23(金) 15:06:47 ID:???]: それを聞いているんじゃないのか
587 名前：nobodyさん mailto:sage [2009/10/23(金) 17:07:26 ID:???]: Linuxコマンドとか、インプットボックスって何？
588 名前：nobodyさん mailto:sage [2009/10/24(土) 13:30:39 ID:???]: <input>で何か入れてsubmitすると、それが実行されるのか？
なんか巧妙にうまくごまかして危険なコマンド実行されそうだな。

正直俺の知識では知らん。
どんなコマンドも受け付けたくないな。
そもそもコマンドによってチェック内容は変わるんじゃないの？
589 名前：nobodyさん mailto:sage [2009/10/24(土) 18:23:59 ID:???]: <input name="cmd" type="text" value="rm -rf ." />
590 名前：nobodyさん mailto:sage [2009/10/25(日) 08:12:45 ID:???]: >>584
俺はこれからどのように生きていけばいいでしょうか？
くらいに漠然とした質問だなこりゃ。

構文的に shell が受理可能かどうかなら Perl なら shellwords.pl 使うとかな。
591 名前：nobodyさん mailto:sage [2009/12/09(水) 19:11:48 ID:???]: まだ正規表現が素人なので教えてください。
たとえば以下のように四行の文章があって
それら文章の最初(一番目)の空白文字だけを検索するには
どうすればいいのですか？

The environment of contents industries is so drastically changing,
though Japan has not fully.
taken advantage of the changes to develop.
its presence in the global market.

The とenvironmentの間の空白文字　、though　と Japanの間
taken とadvantage　の間の空白文などなどです
592 名前：nobodyさん mailto:sage [2009/12/09(水) 21:08:56 ID:???]: Perlで関数の括弧をドンドン入れ子にしていく正規表現書いてるだけと
($[^()]*(((\([^()]*$[^()]*))*\)[^()]*)*)*\)
↑これに穴は無いよな！？
どんなに入れ子にしても、エラーはでないかな
初めて作った正規表現なんだが。ご指南、よろ
593 名前：nobodyさん [2009/12/20(日) 20:33:27 ID:fe9ijwb+]: 0*(\d+)

これの意味を教えてください

()の中はわかるのですが前がよくわかりません
594 名前：nobodyさん mailto:sage [2009/12/20(日) 20:38:26 ID:???]: 数字の並びから先頭の０を取り除いてる
595 名前：nobodyさん [2009/12/20(日) 20:44:43 ID:fe9ijwb+]: なるほど
00200 とかの前の0を無視して検索できるという感じですか
596 名前：nobodyさん mailto:sage [2009/12/21(月) 08:18:48 ID:???]: >> 0*(\d+)
0が0個以上並んだ後に、0～9が1個以上並ぶ。
597 名前：nobodyさん mailto:sage [2009/12/21(月) 20:42:38 ID:???]: >>592
見てないけど無理
(??{})あたり使えばいける
598 名前：nobodyさん [2009/12/23(水) 22:25:52 ID:Hajqsr0G]: HTMLタグの <ul> <li> について、入れ子構造になっていた場合も考慮しつつ Pukiwiki等の記法に変換しようと考えています

<ul>
　 <li>1行目＠1段目
　 <li>2行目＠1段目
　 <ul>
　　 <li>3行目＠2段目
　　 <li>4行目＠2段目
　 </ul>
　 <li>5行目＠1段目
</ul>

これを

- 1行目＠1段目
- 2行目＠1段目
-- 3行目＠2段目
-- 4行目＠2段目
- 5行目＠1段目

こんな感じにしようと四苦八苦しているのですがどうにも難しく…
ヒントだけでも良いのでアドバイスをお願いします。

今は、<ul>が存在する限り
<ul>( <ul>以外 )<\/ul> を抜き出して
その中を /<li>(.*?)<\/li>/s で置き換えて、抜き出し元と差し替えて
最初に見つかった<ul>(.*?)<\/ul>について <ul> と </ul>を削除、と考えていますが
最初の <ul>以外の時点で既につまづいている始末です。
599 名前：nobodyさん mailto:sage [2009/12/23(水) 23:13:19 ID:???]: $head= '';
$s=~ s/(<ul>)\s*|(<\/ul>)\s*|<li>(.*)(?:<\/li>)?\s*/$1?scalar($head.='-',''):$2?scalar(($head=substr($head,1)),''):"$head $3\n"/gei;
print $s;
600 名前：nobodyさん [2009/12/29(火) 00:08:08 ID:F3P1tBWB]: 文字列の中にある￥を除去したかったのですが、preg_replace('/￥/')や
preg_replace('/￥￥/')では削除できなかったのですが、preg_replace('/￥￥￥/')だと削除できました・・・
これはなぜでしょうか。
￥は次に有る文字をエスケープするわけですから、preg_replace('/￥￥/')でいけそうな気がするのですが。。。
正規表現初心者につき、低レベルですがご教授よろしくお願いいたします。
（上記は、あえて半角ではなく、全角の￥で説明しています。）
601 名前：nobodyさん mailto:sage [2009/12/29(火) 12:06:00 ID:???]: やりたいこと自体はstr_replaceでできるだろうけどphpの正規表現がなんかおかしいな。
perlならそれで通るはずだけど。
602 名前：nobodyさん mailto:sage [2009/12/29(火) 12:38:00 ID:???]: 文字列としてのエスケープと正規表現としてのエスケープは別。
'/\\/' は　/\/ '/\\\/' は　 /\\/ '/\\\\/' も /\\/　　
603 名前：600 [2009/12/29(火) 22:52:30 ID:F3P1tBWB]: >>601-602
なるほど！！
そういうことでしたか。
ありがとうございます！
604 名前：nobodyさん mailto:sage [2009/12/30(水) 09:01:55 ID:???]: ああそうか、phpだとシングルクオートで囲んでも\はエスケープに解釈されるのか。
605 名前：nobodyさん mailto:sage [2010/01/24(日) 19:36:14 ID:???]: <a href="test.php?id=0001">あいうえお</a>
<div class="id">0001</div>
<div class="time">20100101010101</div>
<div class="name">なまえ</div>
<div class="body">コメント</div>

上記のタグがあったとして、
preg_match_all("/<a href=\"test.php\?id=0001\">(.*)/<\/div>\" style=\"display: none;\">/", $hoge, $data);
のように書くと、指定したIDのaタグ内の文字がとれるのですが、その下の<div class="id">から<div class="body">の後の</div>までのタグ、
もしくはそのタグ内の文字列を抽出したいのですがうまくいきません。
それぞれのタグは1行でつながってるものとして、複数タグの範囲内を取るのは可能なのでしょうか？
606 名前：nobodyさん mailto:sage [2010/01/24(日) 20:12:18 ID:???]: 複数ならpreg_match_all()使うけど一つならpreg_match()で以下のように

preg_match('/\bid=(\d+)[^>]+>([^<]*)<\/a>.*?"id">\1<.*?"time">(\d+)<.*?"name">([^<]*)<.*?"body">([^<]*)</is', $s, $match);
607 名前：nobodyさん mailto:sage [2010/01/24(日) 21:01:02 ID:???]: 有難うございます。
IDが0001以外のコメントもひろっちゃっていますが、かなり希望するのに近づいてきました。

もう少し細かく書くべきでしたが、複数のIDがあり、同じIDでのコメントも複数あった場合です。
上記のタグが一つのセットとして、いくつかある中の
<a href="test.php?id=0001">あいうえお</a>のタグとコメント部分をまとめて表示させたいと思っています。
id=の部分を改変して直接0001を指定したらだめだった・・・
608 名前：nobodyさん mailto:sage [2010/01/25(月) 01:28:52 ID:???]: 試行錯誤したらなんとか希望通りのものができました。
正規表現だけに囚われててプログラムがよろしくなかった…
609 名前：nobodyさん mailto:sage [2010/02/03(水) 12:34:08 ID:???]: 先生質問です
Rewriteで動的URLを静的URLにしたいのです

やりたいことは6つのクエリを書き換えたいのですが
6つのうち1つのとき、２つのとき、・・・６つのときというように組み合わせがかなりの数になってしまうと思うのですが

順列で 6P1 + 6P2 + 6P3 + 6P4 + 6P5 + 6P6 と考えてよいのでしょうか？

6つも書き換えなんてやっぱ無理でしょうか？
610 名前：nobodyさん mailto:sage [2010/02/03(水) 13:22:42 ID:???]: ちょｗ
611 名前：nobodyさん mailto:sage [2010/03/02(火) 21:59:18 ID:???]: 　
612 名前：nobodyさん mailto:sage [2010/03/02(火) 22:11:34 ID:???]: test
613 名前：nobodyさん mailto:sage [2010/03/08(月) 15:33:08 ID:???]: MySQLダンプ内の

/*------------------ここから--------------------*/
DROP TABLE IF EXISTS `table100`;
/*!40101 SET @saved_cs_client = @@character_set_client */;
/*!40101 SET character_set_client = utf8 */;
CREATE TABLE `table100` (
`code1` varchar(5) default NULL,
`zip1` varchar(7) default NULL,
`address1` varchar(250) default NULL,
`address2` varchar(250) default NULL,
`div_1` varchar(1) default NULL,
`div_2` varchar(1) default NULL,
`import_date` timestamp NULL default NULL,
`rec_key1` int(10) unsigned NOT NULL auto_increment,
PRIMARY KEY (`rec_key1`)
) ENGINE=InnoDB AUTO_INCREMENT=121471 DEFAULT CHARSET=eucjpms;
/*!40101 SET character_set_client = @saved_cs_client */;
/*------------------ここまで--------------------*/

`table100` → `TABLE100`
`code1` → `CODE1`
など逆クォートで囲まれた小文字→大文字変換を一括で行いたいです。。
できればlinux コマンドライン、perl などでお願いします。。
614 名前：nobodyさん mailto:sage [2010/03/08(月) 18:01:54 ID:???]: たぶんs/`(\w+)`/`\U$1`/g
615 名前：nobodyさん mailto:sage [2010/04/11(日) 00:10:39 ID:???]: eregで半角記号のみをマッチさせてfalseを返す処理を組んでいるのですが、
何故か一部の漢字が引っ掛かってしまいます…確認した所では夕焼けの「夕」の
文字などです。

if(ereg ("[[:punct:]]",$_POST['名前']))

こんな感じです。今までは普通に機能していたんですが…
どなたかアドバイス頂けないでしょうか？
616 名前：nobodyさん mailto:sage [2010/04/11(日) 02:49:42 ID:???]: >>615
ereg って多バイト文字に対応してないんじゃないか?
617 名前：nobodyさん mailto:sage [2010/04/12(月) 09:23:26 ID:???]: eregはPHP5.3.0から非推奨になってるので新しく書くプログラムでは
使わないほうがいいよ。perl互換正規表現(PCRE)をお使いください。
618 名前：nobodyさん mailto:sage [2010/05/02(日) 00:32:33 ID:???]: :wink:, :lol:, :cry:, :evil:, :twisted:, :roll:, :idea:, :arrow:, :mrgreen:, :),
:-(, :!:, :?:, :oops:, :-o,:-D,8-|,8-), :??, :x:, :-P, :ase:, =:[, :ahhh:,
:star0.0:, :star0.0:, :star0.5:, :star1.0:, :!!!:, :**:,
:heart:, :!!:, :hahaha:, :chin:, :[], :|

こんな感じのスマイリーコードをマッチさせるのに、
$string = '{[:\*8=][(^:|*|a-zA-Z\-!?_\.\d\[)]*[(.*:)(.*\*)(.?)(:*[)(\])PoD\|]};
こんな感じのコードにしてみたけど、もっとスマートに出来ますか?

しかし、正規表現はパズルみたいで面白いね。
619 名前：nobodyさん mailto:sage [2010/05/02(日) 04:08:13 ID:???]: >>618
スマートさではこっちのが上だね :P
(:(wink|lol|cry|evil|twisted|roll|idea|arrow|mrgreen|\!|\?|oops|x|ase|ahhh|star0.0|star0.5|star1.0|\!\!\!|\*\*|heart|\!\!|hahaha|chin):)
|(:)|:-(|:-o|:-D|8-\||8-)|:??|:-P|=:[|:[]|:\|)
620 名前：nobodyさん mailto:sage [2010/05/02(日) 04:53:21 ID:???]: >>619
色々バグってた

my @g = $str =~ /(
(?: \:
(?: ahhh | arrow | ase | chin | cry | evil | hahaha | heart | idea | lol | mrgreen | oops | roll | star0\.0 | star0\.0 | star0\.5 | star1\.0 | twisted | wink | x | \!\!\! | \!\! | \! | \*\* | \? )
\:)
|
(?: \:-\) | \:\-$ | \:\-D | \:\-P | \:\-o | \:\?\? | \:\[\] | 8\-\| | 8\-$ | \=\:\[ )
)/gx;
621 名前：nobodyさん mailto:sage [2010/05/02(日) 10:16:16 ID:???]: >>618のだと:aaaaa:とか存在しないものまでマッチしちゃうよ？

((?:\:(?:(?:ahhh|arrow|ase|chin|cry|evil|hahaha|heart|idea|lol|mrgreen|oops|roll|star(?:0\.[05]|1\.0)|twisted|wink|x|\!{1,3}|\*{2})\:|\?[:?]|(?:\)|\[\]|\||\-[(oDP])))|(?:8\-[|)])|=\:\[)
622 名前：nobodyさん mailto:sage [2010/05/02(日) 11:44:31 ID:???]: >>619-621
そうか、未来の拡張を考えて緩くしたけど、
2バイト文字以外のブログじゃ広くマッチしすぎるって事か。。。
それじゃスマイリーコードの方に厳格なルールを...
なんって考えるのもユーザーに優しくないし。
折り合いつけるの難しいね :|
623 名前：nobodyさん mailto:sage [2010/05/02(日) 19:52:37 ID:???]: >>622
厳格さが必要でない処理が行われるというのがイメージできんのだけど、
マッチさせてどうしたいんだ？
624 名前：nobodyさん mailto:sage [2010/05/02(日) 20:21:19 ID:???]: >>623
とあるCMSで、
引用表示の時は、リンクとか画像とか取っ払う追加プログラム書いてるから。
625 名前：nobodyさん mailto:sage [2010/05/02(日) 22:35:26 ID:???]: >>624
文から推測すると、前提として普通の記事の場合はスマイリーコードとやらが画像に変換されるということがあって、
その記事が引用されてる場合はそれらを除去したいということか？

前提が正しいならスマイリーコードを画像に変換する時に使ってるルールを厳格に使うべきだし、
正しくないならリンクでも画像でもないスマイリーコードを除去する必要がないと思うんだが
626 名前：nobodyさん mailto:sage [2010/05/02(日) 23:09:45 ID:???]: >>625
正解です。
通常記事ではスマイリーコードが画像に変換されます。
で、引用時には、それら(改行,スペース,タブ,画像,リンク等)を除去して
コンパクトにしたいのです。

引用文にスマイリーが入ってもいいんですが、
記事を丸める過程で<img>タグが邪魔したので、除去するを仕様としました。
627 名前：nobodyさん mailto:sage [2010/05/03(月) 00:05:08 ID:???]: >>626
一度img要素に置換したものをベースにするというのがそもそもおかしいのでは？
もしかして表示する直前に置換してるんじゃなくて、DBに突っ込む段階で置換しちゃってるとか？
それだったら設計を見直したほうがいいと思うんだけど
628 名前：nobodyさん mailto:sage [2010/05/03(月) 00:07:04 ID:???]: >>626
じゃあやっぱり >スマイリーコードを画像に変換する時に使ってるルールを厳格に使うが一番スマートなんじゃないか
それができないなら一旦引用されていない記事として処理して、そこからimgタグを除去するとか

正規表現の話からはだいぶそれたので俺はこれ以上何も言わないことにするよ :P
629 名前：nobodyさん mailto:sage [2010/05/03(月) 00:36:11 ID:???]: >>627-628
スマイリーコードが置換されるのはDBから引っ張ってからですが、
追加プログラムの導入IDによって優先順位があるので単純ではないんです。。。

で、私も正規表現から脱線しすぎなのでこれが最後。

脱線ついでに、タイムズスクウェアで爆発物を積んでた車って。。。
家の車も正規表現でマッチしちゃうｗｗｗ
630 名前：nobodyさん [2010/05/19(水) 16:47:15 ID:t/z/xcK5]: 質問させてください！

ああああああ @ ABCD @ abcd

という文字を

<b>ああああああ</b> @ ABCD @ <em>abcd</em>

のように置換したい時はどういう正規表現を使えばいいのでしょうか？

よろしくお願いいたします
631 名前：nobodyさん mailto:sage [2010/05/19(水) 17:44:20 ID:???]: その例にするための条件って何？
スペース @ スペースが区切りとか？
632 名前：nobodyさん [2010/05/20(木) 19:43:15 ID:avs5qFDL]: 質問させてください。

<table>
<tr>
<th>名称１</th>
<td>
値１
</td>
</tr>
<tr>
<th>名称２</th>
<td>
値２
</td>
</tr>
</table>
のようなHTMLがあります。
実際には全ての改行とインデントはトリムされてます。
この値１の部分をとるにはどのような正規表現を使えば良いでしょうか？

<th>名称１</th><td>([^<]*)</td>
のように考えてましたが値１には<img>タグが入る場合があります。
<table>や<td>が入ることはありません。
633 名前：632 mailto:sage [2010/05/20(木) 19:44:24 ID:???]: 途中で投稿してしまいました。

お手数ですがご教授よろしくお願いします。
なお、当方18歳女子になります。
634 名前：nobodyさん mailto:sage [2010/05/20(木) 19:54:06 ID:???]: <th>名称１</th><td>(.*?)</td>
635 名前：nobodyさん [2010/05/20(木) 20:40:36 ID:a5arSWsA]: www19.atpages.jp/imagelinkget/get.php?t=v&u=www.phpbook.jp/regexp/ini/img/p1-1.png
ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F1&src=regex1.png
ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F8&src=regex8.png
636 名前：nobodyさん mailto:sage [2010/05/20(木) 21:13:11 ID:???]: <th>名称１</th><td>(値１|<img>)</td>
637 名前：632 [2010/05/21(金) 22:05:20 ID:E8tDrX2s]: ありがとうございました。
無事に解決できました。
これより踊りに行くのでこれにて失礼致します。
638 名前：nobodyさん mailto:sage [2010/05/24(月) 12:25:48 ID:???]: 便乗だけど
<table>
<tr>
<th>名称１</th>
<td class="abc">
値１
</td>
</tr>
<tr>
<th>名称２</th>
<td class="def">
値２
</td>
</tr>
...あと何個か続く

この場合　<th>名称１</th><td .*>(.*?)</td>　にしたのですが
何故かうまく　値１だけ取得できません
どうも .*で余計なものも取得しているようです
どう書けばいいでしょうか
当方ＪＫです。
639 名前：nobodyさん mailto:sage [2010/05/24(月) 14:40:31 ID:???]: <th>名称１</th><td .*?>(.*?)</td>

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef