正規表現 Part6 - 暇つぶし2ch

正規表現 Part6 at TECH

1:デフォルトの名無しさん
09/05/06 00:36:04
正規表現(Regular Expression)スレです。

質問する場合は実装言語や処理系ソフトウェア名を示しておくと話が早いです。

【前スレ】正規表現 Part5
ｽﾚﾘﾝｸ(tech板)

2:デフォルトの名無しさん
09/05/06 00:37:38
◆関連サイト
正規表現メモ
URLﾘﾝｸ(www.kt.rim.or.jp)
Perl正規表現雑技
URLﾘﾝｸ(www.din.or.jp)
Regular Expression(Riue ちゃんの正規表現講座)
URLﾘﾝｸ(www.sixnine.net)
正規表現パズル
URLﾘﾝｸ(oraclesqlpuzzle.hp.infoseek.co.jp)
詳説正規表現
URLﾘﾝｸ(www.oreilly.co.jp)
正規表現プログラミングFAQ
URLﾘﾝｸ(capslockabcjp.kitunebi.com)
JScript 正規表現の概説
URLﾘﾝｸ(msdn.microsoft.com)
.NET Framework 正規表現言語要素
URLﾘﾝｸ(msdn.microsoft.com)
【初心者】正規表現【入門】
URLﾘﾝｸ(funcchan.blog16.fc2.com)

3:デフォルトの名無しさん
09/05/06 00:40:40
◆関連スレ
[UNIX板] 正規表現
ｽﾚﾘﾝｸ(unix板)
[WebProg] 正規表現道場
ｽﾚﾘﾝｸ(php板)

◆前スレ
[1] ｽﾚﾘﾝｸ(tech板)
[2] ｽﾚﾘﾝｸ(tech板)
[3] ｽﾚﾘﾝｸ(tech板)
[4] ｽﾚﾘﾝｸ(tech板)
[5] ｽﾚﾘﾝｸ(tech板)

4:デフォルトの名無しさん
09/05/06 00:42:02
スルーされにくい質問のテンプレと例

●正規表現の使用環境
Java1.5

●検索か置換か？
検索

●説明
各行の1番目のAまでを検索したい

●対象データ
ABCA
BCAA
CABA

●希望する結果
ABCA
^
BCAA
^^^
CABA
^^

5:デフォルトの名無しさん
09/05/07 22:55:29
すいません、質問です。
(a{3}|b{3}|c{3})
と
[abc]{3}
は等しいですか？

6:トーマス
09/05/07 23:32:33
>>5
ちょっと違います

前者は aaa、bbb、ccc の3種類の文字列にしかマッチしませんが
後者は abc、cba、aab などにもマッチします

後者は3文字の文字列であれば1文字ごとに文字が変わってもいいのです

7:デフォルトの名無しさん
09/05/08 01:41:34
>>6
なるほどぉ
理解できました、ありがとうございました！

8:デフォルトの名無しさん
09/05/08 19:09:29
ｽﾚﾘﾝｸ(software板:396-397番)n
より誘導されてきました。

X-Finderは内部関連付けに正規表現を使えるのですが

foo.gz や　foo.tar.gz その他の *.gz にマッチするが
foo.xcf.gz にマッチしないものはどう書けば良いかわからず困っています。

URLﾘﾝｸ(www.din.or.jp)
ここを参考に

*.([^x]|x(c?x)*([^xc]|c[^xf]))*(x(c?x)*x?)?.gz

と書いてみましたが動きませんでした。
希望通りの動作にするにはどう書けば良いのでしょうか？

9:デフォルトの名無しさん
09/05/08 19:14:17
>>8
(?<!xcf).gz

10:デフォルトの名無しさん
09/05/08 19:52:11
>>9
レスどもです。
でも (?<!xcf).gz　と　*.(?<!xcf).gz と *(?<!xcf).gz を試してみましたがダメでした。

x-finderがどの正規表現に対応してるかわかれば良かったんですが
検索しても見つからなかったんですよね…。

11:8
09/05/08 20:22:04
x-finderの機能で別の指定方法があり
そちらで希望の動作ができましたので
質問を下げさせていただきます。お騒がせしました。

12:デフォルトの名無しさん
09/05/08 21:55:38
スレ違いでなければいいのですが…

●正規表現の使用環境
PHP4.3

●検索か置換か？
置換

●説明
html内のテキストから特定のタグ（特定のurlへのリンク）のみを削除したい

●対象データ
…テキスト<a href="a.php?id=○○">「aへのリンク」</a>テキスト<a href="b.php?id=△△">「bへのリンク」</a>テキスト<a href="c.php?id=□□">「cへのリンク」</a>テキスト…

●希望する結果
…テキスト<a href="a.php?id=○○">「aへのリンク」</a>テキスト「bへのリンク」テキスト「cへのリンク」テキスト…

このようなことは可能でしょうか？
aへのリンクのみを残して、bとcへのリンクを削除したいのですがタグとタグの間の文字は残したいのです
また動的ファイルのためパラメータがその都度変化します

13:デフォルトの名無しさん
09/05/08 23:26:26
(\<a href="[^a].+\>)「.+?」(\<\/a\>)
これで$1と$2を空白に置換でどうだろ。
今、出先なんで確認取ってないです。

14:トーマス
09/05/09 02:15:26
>>12
PHP4.3 で動くかどうかは分からないのですが、
以下の正規表現チェッカーで動いたものを貼っておきますね。

PHP正規表現チェッカー ver1.0.1
URLﾘﾝｸ(www.rider-n.sakura.ne.jp)

検索表現
<a\s[^>]*href\s*=(?!\s*"?\s*a\.php\?id=)[^>]+>(.*?)</a>

置換表現
\1

何故か置換表現を $1 と書いても動かなかったので \1 にしました。
$1 で動くのであればこれを使って下さい。

15:デフォルトの名無しさん
09/05/09 14:57:39
>>13
>>14
ありがとうございます
こちらも出先なので戻り次第確認してみようと思います

16:デフォルトの名無しさん
09/05/10 01:19:30
909 ：デフォルトの名無しさん：2009/04/17(金) 00:22:26
簡単な検証方法
<center><script> var x1, y1, x2, y2, x3, y3; var a, b, c, s, S; var S1,S2,M,N;
/*可変*/ N=1000;
document.write('<style>td,th{font-size:10;} </style><table border=1><tr>');
document.write('<th>x1 </th><th>y1 </th><th>x2 </th><th>y2 </th><th>x3 </th><th>y3 </th>');
document.write('<th>底辺ｘ高さ÷２公式<br>による面積計算結果 </th>');
document.write('<th>ヘロン公式による<br>√を使った面積計算結果 </th>');
document.write('<th>問題となる誤差<br>倍率'+M+'倍 </th> </tr>');

for(i=-N;N>=i;i++){ // 数値を自動代入
x1=0; y1=i;
x2=-1; y2=0;
x3=1; y3=0;

a=Math.abs(x1-x2)*Math.abs(y1-y2); // 底辺ｘ高さ÷２公式による面積の計算
b=Math.abs(x2-x3)*Math.abs(y2-y3);
c=Math.abs(x3-x1)*Math.abs(y3-y1);
s=(Math.max(Math.max(x1,x2),x3)-Math.min(Math.min(x1,x2),x3))
s*=(Math.max(Math.max(y1,y2),y3)-Math.min(Math.min(y1,y2),y3)); S=s-(a+b+c)/2; S1=S;

a = Math.sqrt((x2 - x1) * (x2 - x1) + (y2 - y1) * (y2 - y1)); // ヘロン公式による√を使った面積の計算
b = Math.sqrt((x3 - x2) * (x3 - x2) + (y3 - y2) * (y3 - y2));
c = Math.sqrt((x1 - x3) * (x1 - x3) + (y1 - y3) * (y1 - y3));
s = (a + b + c) / 2.0; S = Math.sqrt(s * (s - a) * (s - b) * (s - c)); S2=S;

document.write('<tr><td>　'+x1+' </td><td>　'+y1+' </td>'); // 計算結果と誤差を表示
document.write('<td>　'+x2+' </td><td>　'+y2+' </td><td>　'+x3+' </td><td>　'+y3+' </td>');
document.write('<td>　'+S1+' </td><td>　'+S2+' </td><td>　'+(S1-S2)+' </td> </tr>');
}document.write(' </table>');
</script>

17:デフォルトの名無しさん
09/05/10 01:24:06
<center><script>varx1,y1,x2,y2,x3,y3;vara,b,c,s,S;varS1,S2,M,N;
/*倍率*/M=100000000;
/*回数*/N=1000;
document.write('<style>td,th{font-size:10;}</style><tableborder=1><tr>');
document.write('<th>x1</th><th>y1</th><th>x2</th><th>y2</th><th>x3</th><th>y3</th>');
document.write('<th>底辺ｘ高さ÷２公式<br>による面積計算結果</th>');
document.write('<th>ヘロン公式による<br>√を使った面積計算結果</th>');
document.write('<th>問題となる誤差<br>倍率'+M+'倍</th></tr>');

for(i=0;N>i;i++){//数値を自動代入
x1=(Math.random()*2-1)*M;y1=(Math.random()*2-1)*M;
x2=(Math.random()*2-1)*M;y2=(Math.random()*2-1)*M;
x3=(Math.random()*2-1)*M;y3=(Math.random()*2-1)*M;

a=Math.abs(x1-x2)*Math.abs(y1-y2)/2;//底辺ｘ高さ÷２公式による面積の計算
b=Math.abs(x2-x3)*Math.abs(y2-y3)/2;
c=Math.abs(x3-x1)*Math.abs(y3-y1)/2;
s=(Math.max(Math.max(x1,x2),x3)-Math.min(Math.min(x1,x2),x3))
s*=(Math.max(Math.max(y1,y2),y3)-Math.min(Math.min(y1,y2),y3));S=s-a-b-c;S1=S;

a=Math.sqrt((x2-x1)*(x2-x1)+(y2-y1)*(y2-y1));//ヘロン公式による√を使った面積の計算
b=Math.sqrt((x3-x2)*(x3-x2)+(y3-y2)*(y3-y2));
c=Math.sqrt((x1-x3)*(x1-x3)+(y1-y3)*(y1-y3));
s=(a+b+c)/2.0;S=Math.sqrt(s*(s-a)*(s-b)*(s-c));S2=S;

document.write('<tr><td>　'+x1+'</td><td>　'+y1+'</td>');//計算結果と誤差を表示
document.write('<td>　'+x2+'</td><td>　'+y2+'</td><td>　'+x3+'</td><td>　'+y3+'</td>');
document.write('<td>　'+S1+'</td><td>　'+S2+'</td><td>　'+(S1-S2)+'</td></tr>');
}document.write('</table>');
</script>

18:デフォルトの名無しさん
09/05/10 01:31:29
<center><script>var x1,y1,x2,y2,x3,y3;var a,b,c,s,S;var S1,S2,M,N;
/*倍率*/M=100000000;
/*回数*/N=1000;
document.write('<style>td,th{font-size:10;}</style><table border=1><tr>');
document.write('<th>x1</th><th>y1</th><th>x2</th><th>y2</th><th>x3</th><th>y3</th>');
document.write('<th>底辺ｘ高さ÷２公式<br>による面積計算結果</th>');
document.write('<th>ヘロン公式による<br>√を使った面積計算結果</th>');
document.write('<th>問題となる誤差<br>倍率'+M+'倍</th></tr>');

for(i=0;N>i;i++){//数値を自動代入
x1=(Math.random()*2-1)*M;y1=(Math.random()*2-1)*M;
x2=(Math.random()*2-1)*M;y2=(Math.random()*2-1)*M;
x3=(Math.random()*2-1)*M;y3=(Math.random()*2-1)*M;

a=Math.abs(x1-x2)*Math.abs(y1-y2)/2;//底辺ｘ高さ÷２公式による面積の計算
b=Math.abs(x2-x3)*Math.abs(y2-y3)/2;
c=Math.abs(x3-x1)*Math.abs(y3-y1)/2;
s=(Math.max(Math.max(x1,x2),x3)-Math.min(Math.min(x1,x2),x3))
s*=(Math.max(Math.max(y1,y2),y3)-Math.min(Math.min(y1,y2),y3));S=s-a-b-c;S1=S;

a=Math.sqrt((x2-x1)*(x2-x1)+(y2-y1)*(y2-y1));//ヘロン公式による√を使った面積の計算
b=Math.sqrt((x3-x2)*(x3-x2)+(y3-y2)*(y3-y2));
c=Math.sqrt((x1-x3)*(x1-x3)+(y1-y3)*(y1-y3));
s=(a+b+c)/2.0;S=Math.sqrt(s*(s-a)*(s-b)*(s-c));S2=S;

document.write('<tr><td>　'+x1+'</td><td>　'+y1+'</td>');//計算結果と誤差を表示
document.write('<td>　'+x2+'</td><td>　'+y2+'</td><td>　'+x3+'</td><td>　'+y3+'</td>');
document.write('<td>　'+S1+'</td><td>　'+S2+'</td><td>　'+(S1-S2)+'</td></tr>');
}document.write('</table>');
</script>

19:デフォルトの名無しさん
09/05/10 01:40:10
JavaScriptが動く HTML実験部屋
URLﾘﾝｸ(homepage2.nifty.com)

20:デフォルトの名無しさん
09/05/10 13:46:16
<TAG xxxxxxxxxxxxxxxxxxxxx />
<TAG xxxxxxxxxxxxxxxxxxxxx >yyyyyyyyyyyyyyyyyyyyyy</TAG>

上記文字列から、x, y を一つの正規表現で抽出することは可能でしょうか？

21:デフォルトの名無しさん
09/05/10 13:49:53
>>20 >>4

22:デフォルトの名無しさん
09/05/10 14:07:14
>>20

残念ながら不可能です。

23:デフォルトの名無しさん
09/05/12 09:24:09
質問お願いしいたます。

●正規表現の使用環境
XPですFlexible Renamerなどのリネームソフトでファイル名の文字化けした箇所のみ消したいのです

●検索か置換か？
置換

●説明
半角カタカナ　ロシア文字　ハングル文字　中国語の漢字　特殊な記号　を全て置き換え
や
英数字以外全ての文字　を全て置き換え
や
日本語以外全ての文字　を全て置き換え

の方法があれば教えてください

●対象データ
File_鱈鯵⑤12345_xxﾊﾝｶｸｶﾀｶﾅﾞx①дЩ鱈賦xxx.jpg

●希望する結果
File_12345_xxxxxx.jpg

24:デフォルトの名無しさん
09/05/12 21:13:05
半角英数と[-_.]ぐらいを残すとして、Flexible Renamerを使うなら
[^-_.a-zA-Z0-9]
を検索のところに入れて、置換を空白でリネームすればどうだろうか
\Wは\wが全角も拾うっぽくてうまくいかないな

25:デフォルトの名無しさん
09/05/12 23:09:02
>>24
必要な文字の方を残して消せば良かったんですね、勘違いしてました・・・
理想的な方法が出来ましたありがとうございました！！！

[^-_.a-zA-Z0-9]
[^-_.a-zA-Z0-9ａ-ｚＡ-Ｚ０-９ァ-ヶぁ-ん～ー亜-煕一-龠]
[^-_.a-zA-Z0-9ａ-ｚＡ-Ｚ０-９ァ-ヶぁ-ん～ー亜-腕弌-熙]

26:デフォルトの名無しさん
09/05/15 08:39:43
●正規表現の使用環境
php5

●検索か置換か？
検索

●説明
画像の中に連続した数字があるか調べたい

●対象データ
F1 00 00 00 00 00 00 00 00 00 EE
DS 00 12 47 36 11 66 00 00 11 FS

●希望する結果
match or not

単純な文字列は扱えるのですが16進数からどう取り出せば良いか分かりません。
まずfile_get_contentsでファイルを読み込んでおり、\x00 == $strなどは分かりますが正規表現でどうすれば良いのかが分かりません。
どなたかご教示願いますm(__)m

27:デフォルトの名無しさん
09/05/15 09:25:50
>>26
php知らんけど、「画像の中に連続した数字」と言うのは単純に「バイト列中に特定の値が連続する」と解釈して宜しいか?
だとすれば、\x00\{2,\}でよさそうだが。

28:デフォルトの名無しさん
09/05/15 09:32:12
(.)\1*

29:デフォルトの名無しさん
09/05/15 09:33:49
同一文字の2個以上の連続は

(.)\1+

か

30:デフォルトの名無しさん
09/05/15 15:04:59
画像が１６進数ってどういうこと？>>26
画像は画像じゃん。

31:デフォルトの名無しさん
09/05/15 15:46:03
画像「データ」つまりバイナリに対してマッチさせたいという話でしょ
一瞬、画像認識かとも思ったけど

32:デフォルトの名無しさん
09/05/16 20:58:37
"連続した数字" とは何を指すんだろう。
バイナリの00も連続した数字と言えるし他の解釈の仕方も出来る。

自分の考えていることを相手に正確に伝えられない人はまず
日本語の勉強をするべき。

33:デフォルトの名無しさん
09/05/16 22:32:48
連続した数字というと1,2,3,4,5を連想してしまう。
PHPって文字列とバイナリを区別しないんじゃない。

34:デフォルトの名無しさん
09/05/17 13:34:43
テンプレの意味わかってんのかな
対象データと希望する結果がそれじゃわけわからん。

35:デフォルトの名無しさん
09/05/17 16:12:54
質問主は 16進数の意味がワカットランと思う。
もしかしたら数字の意味もワカットランと思う。
最近は学校でそゆこと教えないのか？

36:デフォルトの名無しさん
09/05/18 01:27:32
unko123.com
unko784.com
unko962.com

これらを正規表現する時
unko\d\.com と unko\d+\.com どっちが正しい？

37:デフォルトの名無しさん
09/05/18 01:31:00
\d{3}と迷うならともかく前者はありえん

38:デフォルトの名無しさん
09/05/18 01:46:11
>>37
unko\d{3}+\.com ってこと？

39:デフォルトの名無しさん
09/05/18 03:03:12
+余計だろ

40:デフォルトの名無しさん
09/05/18 09:03:05
ん、+のない\dが複数桁の数字にマッチする実装があるって事？

41:デフォルトの名無しさん
09/05/18 09:17:02
{n} で n 個の一致。 \d{3} は \d\d\d と等価。

42:デフォルトの名無しさん
09/05/18 09:39:06
ああ、39は38に宛ててか。

43:デフォルトの名無しさん
09/05/18 09:53:06
unko[0-9][0-9][0-9]\.com
unko[0-9]{3}\.com
unko[0-9]+\.com

unko.\d\d\d\.com
unko\d{3}\.com
unko\d+\.com

44:デフォルトの名無しさん
09/05/18 10:08:35
いやいや、正しくは
unko[179][286][342]\.com
だろう。

45:デフォルトの名無しさん
09/05/18 10:36:26
>>44
それなら
unko(123|784|962).com
の方が正しいだろう。

46:デフォルトの名無しさん
09/05/18 10:45:49
おまいら楽しそうだなw

47:デフォルトの名無しさん
09/05/18 16:50:19
$txt = aaa(’12165;

のような、固定文字列aaaの後ろに『(’nnnnn;』（nの部分は必ず半角数字で値と文字数は可変。’は全角）となる箇所がうじゃうじゃあり、
この文字列の数字を挟んでいる記号だけを全て削除したいのですが、しっくりくる正規表現が浮かびません
妙案ないでしょうか

php5 or 4

48:デフォルトの名無しさん
09/05/18 18:54:48
PHPってこんなんだっけ？
mb_ereg_replace("(?!aaa\\()’(\\d+);", "\\1", "aaa(’12345;");

49:デフォルトの名無しさん
09/05/18 22:22:53
8桁の10進数を文字列とみなしたとき、
下2桁が"00"でない文字列をヒットしたい。如何すればよいか？

50:デフォルトの名無しさん
09/05/18 22:40:03
/\d{6}[1-9]{2}/

51:デフォルトの名無しさん
09/05/18 22:40:57
いや、違うな。
/\d{6}(\d[1-9]|[1-9]\d)/

52:デフォルトの名無しさん
09/05/18 22:51:45
>>47
マルチかよ

53:49
09/05/18 23:29:28
>>51
ありがとう

54:デフォルトの名無しさん
09/05/20 06:57:22
/\d{6}(?!00)\d\d/

55:デフォルトの名無しさん
09/05/22 17:03:24
言語：Java

文字列：
$:hogeA;
$:hogeB;

これをpattern&matchさせるにはどうすればいいのでしょうか？

56:55
09/05/22 17:23:55
質問内容を間違えました。

文字列：
${hogeA}
${hogeB}

これをpattern&matchさせるための正規表現は \\$\{.*.} でOK?
(Eclipse 3.2 JDK 1.6でエラーが出るorz )

57:デフォルトの名無しさん
09/05/22 17:25:45
なんなのそのバックスラッシュ

58:デフォルトの名無しさん
09/05/22 18:18:22
「pettern&match」とは何ぞや？　アンド？

59:55
09/05/22 18:23:06
>>58

Patternオブジェで正規表現コンパイルして、
Matcherのfindメソッドで一致を確認したいのです。

60:デフォルトの名無しさん
09/05/22 18:27:04
$\{.+\}
javaはしらん

61:55
09/05/22 18:56:03
自己解決しました。
Matcher#groupで取得するため
(\\$\\{.*.\\})でうまくいきました。
>>60 つ旦ありがとう。

62:デフォルトの名無しさん
09/05/26 17:18:21
<img src="./topimg_0905.gif" alt="テキスト" border="0" />

PHPで上のようなイメージタグからtopimag_に続く4桁の数字とalt=""の中身のテキスト（全半角マチマチ文字列）のみを
それぞれ$gifと$altに抽出したいのですがよい方法はないでしょうか

63:デフォルトの名無しさん
09/05/27 04:14:06
そういうのはHTMLパーサ使った方がいいって言ってるだろうが。

64:デフォルトの名無しさん
09/05/27 18:16:27
UNIXで、与えられたパスが絶対パスである条件って
$(|~\S*)?/\S*
でいいですか？
思いがけないパターンがありそうで怖いんですがどうでしょうか

65:デフォルトの名無しさん
09/05/28 09:25:40
「先頭がスラッシュか」だけじゃ駄目？

66:デフォルトの名無しさん
09/05/28 10:40:58
~ユーザ名/も絶対パスとみなしたいんだろ

67:デフォルトの名無しさん
09/05/29 09:42:09
それだったら~/も含める必要がありそうな。

68:デフォルトの名無しさん
09/05/29 10:03:33
知らないならレスしないでください

69:デフォルトの名無しさん
09/05/29 18:15:39
>>67
~\S*だから入るんじゃないのか

70:デフォルトの名無しさん
09/05/29 18:16:50
^[~/]でもよさそうな気もするな

71:デフォルトの名無しさん
09/05/29 19:35:46
IMOX って空白を含むディレクトリ名ってだめだっけ？

72:デフォルトの名無しさん
09/05/29 19:36:52
困ったことに、使えるねぇ。

73:デフォルトの名無しさん
09/05/29 19:37:02
キーボードが1列ずれた。すまんｗ
IMOX じゃなくて UNIX って書きたかった

74:デフォルトの名無しさん
09/05/29 23:31:42
何事もなく返答する>>72に萌えた

75:デフォルトの名無しさん
09/05/31 17:18:03
よろしくお願いします。

現在Yahoo!pipes（URLﾘﾝｸ(pipes.yahoo.com)）を使っているのですが、
pipesの中でデータをURLエンコードしたいと思っています。
そのような機能はないので、正規表現(マニュアルによるとPerlライク)でやろうと思っているのですが、
Perlの関数を使えないのでunpackを使うやり方ができません。

純粋な正規表現のみでURLエンコードはできるものなのでしょうか。
修飾子として使えるのは「gsmi」のみです。

76:デフォルトの名無しさん
09/05/31 17:32:16
＞純粋な正規表現のみでURLエンコード
正規表現を利用してなら可能だろうだけど、正規表現のみじゃ無理
なんつーかノリも必要なペーパークラフトをハサミだけで作れって感じだ
URLっていう型紙からデータを切り抜くだけでどうやってURLエンコードを組み立てるよ

77:デフォルトの名無しさん
09/05/31 17:34:11
/\x00/%00/g
/\x01/%01/g
…
/\xFF/%FF/g

78:デフォルトの名無しさん
09/05/31 17:46:46
>>76
ですよね・・・

>>77
うおっ！

79:デフォルトの名無しさん
09/05/31 18:05:44
>>77
それやると % と 0-F の文字が置換されないか？

80:デフォルトの名無しさん
09/05/31 18:21:31
深く考えずに書いたネタにマジレスされても困るんだが、本気でこのアプローチを採用するなら、
0-9A-Fは置換する必要ないし、%を一番頭に持ってくればいい。

81:デフォルトの名無しさん
09/06/06 19:31:17
行頭から6文字目までをマッチさせるにはどう記述したらよいでしょうか？

82:デフォルトの名無しさん
09/06/06 20:29:36
^.{6}

83:デフォルトの名無しさん
09/06/06 21:22:45
>>82
助かりましたありがとうございます

84:デフォルトの名無しさん
09/06/08 23:24:52
FlashのActionScript3.0（WinXP-Pro）です。

文字列中で特定の文字列のみに色付けをしようとしていますが、目的の文字列
以外でも色が付き困っています。

例えば、『名無し』という文字列のみを青色にしようとすると、独立した文字列
　名無し
はOKなのですが、「デフォルトの名無しさん」でも『名無し』が青色になってしまい
ます。

A名無しB　という場合（前または後ろに不要な文字がある場合、つまり他の文字列
に組み込まれた場合）は対象から外し、単独の場合のみを対象したく思っています。

これに適した正規表現はありますでしょうか？

85:デフォルトの名無しさん
09/06/08 23:43:22
^名無し$

86:デフォルトの名無しさん
09/06/09 00:22:19
>>85
有難うございます。しかしながら、質問が不十分でした。
確かに独立した文字列は許可したいのすが、それ以外に　A名無しB　で
AまたはBが
１）　半角のスペースの場合
２）　半角の左括弧　（　の場合
３）　改行の場合
４）　ピリオドの場合

に名無しを青色にしたく思っています。
当初、キャラクターコードとif文で分岐しようとしましたが煩雑になったので
正規表現を利用しようと思いました。

こんな場合はどうでしょうか？

87:デフォルトの名無しさん
09/06/09 12:48:17
不特定の半角英数字と半角記号でできている半角文字列の中から (' ') に挟まれた数列だけを残して他を削除したいのですが方法はないでしょうか

例）
234hbhkltgfokdlthL+POL+PL>?*|{?('54653');
の中から54653だけを取り出し他を削除

※不特定文字列内において、　('　や　')　は取り出す予定の数列を挟む場所以外では現れません

PHP

88:デフォルトの名無しさん
09/06/09 13:17:17
('...') は複数出現するのかな？一応それを考慮して

$a = preg_replace('/(?:(?!$\').)*(?:\(\'(\d+)\'$)?/', '$1', $a);

89:87
09/06/09 13:47:46
>>88
ありがとうございます
('nnn')は1カ所しか出てきません
自分で応用できないかやってみたんですがムリでしたｗ
1カ所しかでてこないバージョンを教えてくださいｗ

90:デフォルトの名無しさん
09/06/09 15:43:57
PHPの書式は分からないけど、
$'(.+)'$
で検索して、後方参照で\1だけ残せば良いんじゃない？

91:デフォルトの名無しさん
09/06/10 10:57:23
> 　$'(.+)'$
Vサインしてるクマたんみたいでかわいい

92:デフォルトの名無しさん
09/06/10 11:32:12
submatchでグループ化したものを抜き出せば良いんでない？

93:デフォルトの名無しさん
09/06/10 13:39:54
(V)o￥o(V) フォッフォッフォ

94:デフォルトの名無しさん
09/06/13 08:14:41
（a+b) - (b - c)

みたいな文字があって
()の中をそれぞれ取り出したい場合

(.*)ってやると
一番最初の(と最後の)でも一致してしまう
させたくないんだけどどうすればいいの？

環境はVB.NET

95:デフォルトの名無しさん
09/06/13 09:05:24
>>94
特殊な意味を持つ文字は\でエスケープする

$[^)]*$ かな

96:デフォルトの名無しさん
09/06/13 09:14:48
>>94
VB.NETはよく知らんが、大体「.*」ってやると「よくばり」モードになるぞ。
「よくばり」モードはその例の場合だと途中の括弧も飲み込んじゃって、
目一杯取ってくるから、「.*?」ってやるといい。
「?」をつけると「けちけち」モードになって、必要最小限しか取ってこない。

97:デフォルトの名無しさん
09/06/13 09:55:28
>>94
最短一致でググるといいぜ

98:デフォルトの名無しさん
09/06/13 11:46:17
非欲張り、という表現が一般的じゃないかと思うのだが。

99:デフォルトの名無しさん
09/06/13 11:55:08
正しさはともかく一般的なのは「最短一致」

"最短一致" に一致する日本語のページ約 2,610 件
"非欲張り" に一致する日本語のページ約 373 件

100:デフォルトの名無しさん
09/06/13 14:21:42
欲張りマッチの事、貪欲マッチと呼ばない？

101:デフォルトの名無しさん
09/06/14 00:00:57
>>95で出来た
ついでにもう１つ
英数字の連続が５文字以上を一致させたい場合はどうすれば？

102:デフォルトの名無しさん
09/06/14 00:38:39
礼の一つも言えんのか

103:デフォルトの名無しさん
09/06/14 08:52:01
\w{5,}

104:デフォルトの名無しさん
09/06/14 16:57:22
>>95さんありがとう
連続文字は自己解決した
{}の中身を{10}ってやると１０文字以上という意味らしい
サンプルだと{10,20}みたいにしか書いてなかったから

105:デフォルトの名無しさん
09/06/14 17:11:29
カンマ忘れてるぞ

106:デフォルトの名無しさん
09/06/14 18:09:05
>>104
>>103さんが回答出してるのを無視して自己解決も何もなかろう。

107:デフォルトの名無しさん
09/06/14 21:01:48
無視したからこそ自己解決なのではないかと。

という混ぜ返しはさておき、
"\w" は（一般的な実装だと）アンダースコアも拾うけどいいのかな。

108:デフォルトの名無しさん
09/06/15 12:15:03
アンカ間違ってるだけで>>103を参考に解決したけど
全面採用じゃなかったから自己解決とかぬかしてるだけでは

109:デフォルトの名無しさん
09/06/15 12:48:38
ちがうな、恐らくは>102を受けて、「ありがとう」と書いたのだろう。
好意的に解釈すれば、>103を見る前に自己解決したのかも知れん。

110:デフォルトの名無しさん
09/06/22 11:09:00
C#です
Match match = new Regex("AAA.+?BBB").Match(html);
としてAAAとBBBの間の文字列を抽出したいのですがなぜかできません

Match match = new Regex("AAA").Match(html);
Match match = new Regex("BBB").Match(html);
この二つはうまくいくのですが正規表現の書き方おかしいですか？
ちなみにAAAとBBBはhtmlタグです

111:デフォルトの名無しさん
09/06/22 11:28:41
.+? って、1回以上の繰り返しが、あるかないか、という意味を意図してると思うんだけど、
そういう複合はできない。
0回以上の繰り返し .* でマッチさせる。

112:デフォルトの名無しさん
09/06/22 12:03:01
>>111
> .+? って、1回以上の繰り返しが、あるかないか、という意味を意図してると思う
じゃなくて最短一致だろ

113:デフォルトの名無しさん
09/06/22 12:09:27
最短一致です
("AAA".+?"BBB")は実際には
(<div id=\"comments\" style=\"margin-left:6px;margin-top:6px;\">.+?<button id=\"load_comment_button\"")
こんな感じです

114:デフォルトの名無しさん
09/06/22 12:09:34
それだと、 . が改行にマッチしない事は理解してる？

115:デフォルトの名無しさん
09/06/22 12:11:26
>>113訂正

("AAA.+?BBB")
("<div id=\"comments\" style=\"margin-left:6px;margin-top:6px;\">.+?<button id=\"load_comment_button\"")
こうです

116:デフォルトの名無しさん
09/06/22 12:15:40
>>114
そうなんですか！？
どう書き換えればよいでしょうか

117:デフォルトの名無しさん
09/06/22 12:17:44
RegexOptions.Singleline

111はどういう環境を想定してるんだろうね。

118:デフォルトの名無しさん
09/06/22 12:25:48
>>117
できました！ありがとうございました

119:デフォルトの名無しさん
09/06/24 14:14:00
●正規表現の使用環境
AutoHotkey 1.0.48.03 (Perl 5互換のPCRE)
URLﾘﾝｸ(lukewarm.s101.xrea.com)

●検索か置換か？
置換

●説明
""で囲われている箇所以外の行末コメントを除去したい。

●対象データ
key = value ; ccomment
key = "val ;lue" ; comment

●希望する結果
key = value
key = "val ;lue"

m`n)[\t ]+;.*(?=$) で無差別除去まではできたんですが後方参照とか条件分岐の方法ががわからず。
key value comment 部はそれぞれ日本語の文字が入る可能性もあるんですが
AutoHotkeyのPCRE自体は2バイト文字が考慮されません(なので[:word:]とかは使えない状態です)
よろしくお願いします。

120:デフォルトの名無しさん
09/06/26 11:50:32
単純な正規表現は分かるのですが、これはどうすればよいでしょうか？

●正規表現の使用環境
PHP4

●検索か置換か？
置換

●説明
<del>タグにはさまれた任意の文字列を、文字数ぶん●で伏せ字にしたい。

●対象データ
昨日は<del>上戸さん</del>と飲みに行ったが、<del>17,000</del>円も奢らされてしまった。

●希望する結果
昨日は<del>●●●●</del>と飲みに行ったが、<del>●●●●●●</del>円も奢らされてしまった。

121:デフォルトの名無しさん
09/06/26 12:04:54
>>120
preg_replace_callback使え。

122:デフォルトの名無しさん
09/06/26 13:13:30
>>121
そんな便利な関数があったとは、、。
ありがとうございました！

function toFuseji($matches) {
return $matches[1] . preg_replace("/./u", '●', $matches[2]) . $matches[3];
}

preg_replace_callback("/(<del>)(.+)(</del>)/", 'toFuseji', $str);

123:デフォルトの名無しさん
09/06/26 22:30:17
●正規表現の使用環境
C#2008 Regex.IsMatch

●検索か置換か？
一応検索

●説明
特定の文字列以外があるかをチェックしたい
SQLの話も混じりますが、要はSELECT文の後に
更新や変更するような命令があるかをチェックしたい
のです。
UPDATEとかそれぞれを書いていくのは漏れるかも
しれないのでSELECT、FROM、WHEREあたりを除いて
マッチさせるにはどう書いたらいいでしょうか。
試した文
^SELECT (?!.* [A-Z](?!ELECT |ROM |HERE ))

●対象データと望する結果
マッチさせたい "SELECT * FROM AAA [UPDATE]"
マッチしたくない "SELECT * FROM AAA UPDATE"

124:デフォルトの名無しさん
09/06/26 22:52:35
何らかの処理系なら、else節で処理しちゃう手もある。

125:デフォルトの名無しさん
09/06/28 15:21:44
>>123
念のため聞くけど…
まさかこれってSQLインジェクションの対処のためにやってるんじゃないよね？

126:デフォルトの名無しさん
09/06/28 19:03:21
『id059385,,』のように、固定文字列idの後にランダムな数列、その後ろにカンマがふたつ格納された変数から、最後のカンマをひとつだけ取り除きたいのですが、
for文で回ってる途中まれに同一変数に『,,,』のようにカンマが3つ連続して出てくることがあり、その場合は取り除きたくないので
原始的に(",,",",",$変数)のようなことができません
あくまで、固定文字列id、その後に数列、その後にカンマふたつという状況でのみカンマひとつ取り除く方法はないでしょうか

PHP5

127:デフォルトの名無しさん
09/06/28 19:35:50
最後に2つある時だけ取りたいならこうするかな
preg_replace('/(?<!,),,$/', ',', 'id059385,,');

128:デフォルトの名無しさん
09/06/28 19:43:04
>>119
これ難しいね。
excelなら、Instrrev使えばすぐだけど、正規表現だとどうやるんだろ。

129:デフォルトの名無しさん
09/06/29 15:35:58
>>119
Perlならこれでいけるっぽいけど、どうかな。だめかな

s/((?:[^;]*?".*?")*[^;]*)(?:.*?$)?/$1/mg

130:デフォルトの名無しさん
09/06/29 18:07:37
'"' 自体のエスケープはどうなっているのかと、 Shift_JIS への対応が気になるかな。

131:デフォルトの名無しさん
09/06/29 22:27:07
使用環境 WSH 検索
対象データ ^AAA(BBB(CCC)(ddd)))(FFF)(GGG)$

文末の、括弧記号を含まず括弧で囲われたものが連続しているもの
を検索したいけど挙動が違います。

1) /(?:$[^(]+?$)+$/ 検索結果→ (CCC)(ddd)))(FFF)(GGG)
2) /(?:$[^)]+?$)+$/ 検索結果→ (FFF)(GGG)

欲しい結果は2の方です。
文末の$を指定した時は通常とは逆に文末から左へ一文字づつ検索していると考えていいんですか？

132:デフォルトの名無しさん
09/06/30 11:23:57
>>131
そりゃ前から読んでもそうなるだろ

＞$[^(]+?$
「括弧の間に開き括弧を含まないもの」だから"(ddd)))"にもマッチする

＞「括弧記号を含まず」「括弧で囲われたものが」「連続しているもの」
/(?:$[^()]+?$){2,}/

133:デフォルトの名無しさん
09/06/30 11:24:38
「文末の」を見落としたスマン

134:デフォルトの名無しさん
09/06/30 11:51:09
> 文末の$を指定した時は通常とは逆に文末から左へ一文字づつ検索していると考えていいんですか？

そういう動作はしない。

135:デフォルトの名無しさん
09/06/30 12:48:16
/unko$/
は
/unko\r\n/
と同等と考えればわかりやすいだろう
（厳密には違うけど）

136:デフォルトの名無しさん
09/06/30 23:16:49
>>128-129
レスありがとうございます。
お礼が遅くてすみません。週末からリロードし忘れてました。

質問後自分なりに頭捻って、((".*?")|;.*(?=$)) , $2 とか無理やりやってたんですが
>129さんのでいけました。特に (?: )の使い方が参考になります。ありがとうございます。

今回の件とは直接関係ないんですが、除外文字列の表記がよくわからずいつも悩みます。
今回の例でいうとコメント文字列が「;」ではなく「 ;」(半角スペース+セミコロン)だった場合とか
(?:(".*?")|[\t ]+;.*(?=$)) , $1 みたいな方法で弾くしかないのかな。

137:デフォルトの名無しさん
09/07/01 00:15:50
いや、普通にそっちのほうがシンプルでいいよ
なんであんなに複雑い書いたのかマジ俺イミフ。しにてえ

138:デフォルトの名無しさん
09/07/01 23:41:47
.NETの話なんだけど
URLﾘﾝｸ(msdn.microsoft.com)(VS.80).aspx#BalancingGroupDefinitionExample
この例の正規表現がどうして <> の入れ子構造にマッチするのか上の解説読んでもよく分からないので誰か分かりやすく説明してください
「name2 グループと現在のグループの間隔をグループ name1 に格納します。」って文があるけど
この「name2 グループと現在のグループの間隔」っていうのはリンク先の例で言うとどこからどこまでなのかとか
格納するっていうのがつまりどういうことなのか、って言うレベルでさっぱり理解できてない・・・
最後の "(?(Open)(?!))$" にいたっては自分の中で暗号と化してるorz

139:デフォルトの名無しさん
09/07/02 03:33:28
わかりやすくは多分無理だな。

Openでカウントが増える。
Close-Open でそのそのカウントが減る。

んで、開きと閉じのアングルブラケットの数がバランスしていればカウントは0になるので

"(?(Open)(?!))$";

の条件が (?!) ではなくなる。
この(?!) というのは要するに何にもマッチしないもの。

140:123
09/07/03 21:01:48
>>124
うまく書けなかったので要素に区切ってチェックすることにしました。
>>125
SQLインジェクションって知らなかったけど、悪意のある入力の
チェックって感じかな？
入力文字はSQL文が前提で、そこまで重い意味合いのチェック
ではありませんでした。
SQLインジェクション対策って普通Regex.Escapeを通すのかな？

141:デフォルトの名無しさん
09/07/03 21:07:18
言語によるが、DB系のライブラリにバインディング機能があれば普通はそれを使う。
自作のお手製ライブラリはやめた方がいい。
DBによって攻撃の仕方が違うし、
よく知ってる人が作っていろんな人が使ってるやつの方がやっぱり圧倒的に安全。
詳しくはそれっぽいスレで聞いてくれ。

142:デフォルトの名無しさん
09/07/03 21:16:14
>>140
何のためにそんなことをしたいのか分からないが、
ユーザにSQLクエリを入力させて実行させたい、とかいう話なら、
クエリ式に対してチェックをするのではなくて、
データベースの更新が出来ないような権限でクエリを実行すべき。

143:123
09/07/03 21:16:15
>>141
そうなんですか。調べてそっちの方向に変えてみます。
よく考えたらSQL文にRegex.Escapeなんて
なんの関係もなかった・・・。

144:123
09/07/03 21:20:04
>>143
権限で～ってのは思ってたんですが、触れない事情がありまして。
普通はそうなんですね。
スレ違いになってきたのでこの辺で終わっときます。
ありがとう。

145:デフォルトの名無しさん
09/07/04 21:44:21
●正規表現の使用環境
PHP ver 5.2

●検索か置換か？
置換

●説明
カッコ書きのある文章のカッコの中身を取得したい。
たとえば、
カッコ書き前(カッコ1(カッコ2(カッコ3)カッコ2後)カッコ1後)カッコ書き後
の文章に対して、後方参照で
arr[1] = カッコ書き前()カッコ書き後
arr[2] = カッコ1()カッコ1後
arr[3] = カッコ2()カッコ2後
arr[4] = カッコ3()カッコ3後
と言った感じで取得したい。

試した文
$preTxt = 'カッコ書き前(カッコ1(カッコ2(カッコ3)カッコ2後)カッコ1後)カッコ書き後';
$match = '/.*($.*$).*/';
preg_match("$match",$preTxt,$arr);
結果
[0]= カッコ書き前(カッコ1(カッコ2(カッコ3)カッコ2後)カッコ1後)カッコ書き後
[1]= (カッコ3)カッコ2後)カッコ1後)

●対象データと望する結果
上記記載

すみません。どなたかお願いします。

146:デフォルトの名無しさん
09/07/04 22:10:12
HTMLタグの中身を抜き出すのに近いね。
別の自作関数を作っておいて、

arr[1] = \1 & \7
arr[2] = \2 & \6
arr[3] = \3 & \5
arr[4] = \4

なんてのはどうかな。
もっとスマートな方法もあるかもしれないけど、今でもこれ使って動かしてます。

147:デフォルトの名無しさん
09/07/04 22:43:50
回答ありがとうございます。
でも、多分、俺って、あなたの思っている以上の馬鹿みたい。
全くもって、理解できないんですけど・・・・・・・。
もうちょっとわかりやすくしていただけると助かります。
って、馬鹿がわかりやすい解説って、わかってる人にはかなり難しいんだと思いますけど。
すみません。わがまま言って。

148:デフォルトの名無しさん
09/07/04 23:28:20
外側から攻めていって、カッコがなくなるまでループするとか
function foo($text) {
$kekka = Array();
$match = '/^(.*?)$(.*)$(.*)/';
while (preg_match($match, $text, $arr) > 0) {
array_push($kekka, $arr[1] . "()" . $arr[3]);
$text = $arr[2];
}
array_push($kekka, $text);
return $kekka;
}
$arr=foo('カッコ書き前(カッコ1(カッコ2(カッコ3)カッコ2後)カッコ1後)カッコ書き後');
print_r($arr);

149:デフォルトの名無しさん
09/07/05 12:38:53
ありがとうございます。
完璧です。
ほんとにありがとうございました。！！

150:デフォルトの名無しさん
09/07/05 12:56:11
なるほど、賢いなぁ

151:デフォルトの名無しさん
09/07/05 14:24:31
147は138かな?

もうちょっと努力して説明してみるから少し待ってね。

152:デフォルトの名無しさん
09/07/05 15:21:42
147は145 で PHP5、.NET の138とは別の人、だと思うけど。

153:デフォルトの名無しさん
09/07/05 16:48:27
>>139,151
138です、レス遅れてすみません
自分で試しつつなんとか(?<name1>p1)+(.*)(?<name1-name2>p2)+ という表記なら
(p2にマッチした回数 - 1) 個だけ name1とname2のキャプチャを取り出して
(.*)の両端にくっ付けていく（ただし取り出すキャプチャの最大数は (p1にマッチした回数-1) 個）のかな
という感じで理解し始めてますが・・・

それと?(Open) という書き方は ? と () までも含めて、Openを文字列リテラルとしてではなく
（既に同じパターンのより先頭部分で定義されている）Openという部分パターンの
グループ名だということを示すための表記法なんでしょうか？
こっちは試し方も良く分かりません・・・

154:151
09/07/06 03:10:01
(?'Open'<)
というのは、named caputure でこの場合は < を Open という名前で捕獲するもの。
この場合は捕獲自体には意味はなくて裏で増やしているカウンタが重要。そして
(?'Close-Open'>)
この部分で Open のカウンタを1減らしている。< と > の数が同じであれば、
(?(Open)(?!))
まで来た時点で Openの値は0になっているはず。

で、この表現なんだけど (? (Open) (?!) ) が、? に続く部分正規表現が「真」であれば (?!) を
マッチの条件にするというプログラミング言語の if ～ then ～みたいなもの。

解説は
URLﾘﾝｸ(msdn.microsoft.com)(VS.80).aspx
にある。

そして Open が0でない==バランスが取れていなければ (?!) のチェックを
するのだけど、これは前回も書いたように絶対にマッチに失敗するというパターン
なので、全体を通してみるとバランスが取れていればマッチ成功。
そうでなければ失敗。という次第。

155:デフォルトの名無しさん
09/07/10 10:33:02
オライリーの「詳説正規表現第3版」を読んで疑問に思ったので質問します。

5章にある「IPアドレスへのマッチ」で、0から255の数字にマッチする正規表現のサンプルがありますが
　[01]?\d\d?|2[0-4]\d|25[0-5]

これだと、最初の選択で [01]? がオプションなので、たとえば "999" が "99" に
マッチしてしまうような気がするのですが、問題はないのでしょうか。
よろしくお願いします。

156:デフォルトの名無しさん
09/07/10 10:43:53
その後で、
　^([01]?\d\d?|2[0-4]\d|25[0-5])\. (中略) \.([01]?\d\d?|2[0-4]\d|25[0-5])$
として前後の境界を指定して利用してるから問題ないんじゃないの？

数字だけを取り出したいのであれば、例えば、
　\b([01]?\d\d?|2[0-4]\d|25[0-5])\b
みたいに前後を指定する必要があるよね。

って、そういう話ではなくて？

157:デフォルトの名無しさん
09/07/10 10:49:11
>>156
あぁ、すみません。
たしかに ^ $ で境界を指定すれば問題ありませんね。
部分式ばかり考えていて見えませんでした。

ありがとうございます。

158:デフォルトの名無しさん
09/07/22 01:41:17
これ教えてーーーーー

●正規表現の使用環境
VB.NET

●検索か置換か？
検索

●説明
タグの外の文字列を順に取得したい

●対象データ
<html1><html2>AAA<html3>BBB<html4><html5>CCC<html6>DDD<html7>
だったり
<html1>AAA<html2>BBB<html3><html4><html5><html6>CCC<html7>DDD

●希望する結果

ｒ = New Regex("(?<1>.+?)(?<2>.+?)(?<3>.+?)(?<4>.+?)" ←今こんな感じ

Console.WriteLine(m.Groups(1).Value)
で結果　AAA
Console.WriteLine(m.Groups(2).Value)
で結果　BBB
Console.WriteLine(m.Groups(3).Value)
で結果　CCC
Console.WriteLine(m.Groups(4).Value)
で結果　DDD

159:デフォルトの名無しさん
09/07/22 02:48:28
>>158
Match()一発じゃなくてMatches()で地道にいっこずつ切り出してみた。もっといい方法はあるかもしれん

Dim r As Regex = New Regex("(?:<.*?>)+(.+?)(?=<|$)")
Dim s As String = "<html1><html2>AAA<html3>BBB<html4><html5>CCC<html6>DDD<html7>"
For Each m As Match In r.Matches(s)
　　Console.WriteLine("{0}", m.Groups(1).Value)
Next

160:デフォルトの名無しさん
09/07/26 09:55:51
正規表現、特にNFAって計算量が大きいので
実用上、30～40文字ぐらいが限界だったように記憶してるのですが
NFAとDFAでの計算量ってO表記でどのぐらいでしたっけ？
wikiにそういう情報のせといて欲しい・・

161:デフォルトの名無しさん
09/07/26 10:56:30
PHPのpreg(perl互換)の話なのですけど、
/(?<=<div>)(.*?)(?=<\/div>)/is
はエラーにならなくて
/(?<=<div[^>]*>)(.*?)(?=<\/div>)/is
がエラーになる理由が分からないのですが、
なぜなのでしょうか

162:デフォルトの名無しさん
09/07/26 10:59:13
なぜと言われても・・・そう設計してあるから、としか言いようがないな

163:デフォルトの名無しさん
09/07/26 11:01:24
>>2 の「正規表現メモ」の　(?<=pattern)　の解説には

　　固定長の文字列に対してのみ働きます(処理系による。可変長の文字列を許可する処理系もあります

と書いてある。つまりそういうことだ。

164:デフォルトの名無しさん
09/07/26 11:06:41
なるほど。これは固定長のみでしたか。
ありがとうございます。
別のルートから正規表現の方法を探す事にします。

165:デフォルトの名無しさん
09/07/26 17:28:23

/(?<=<div[^>]{0,99}>)(.*?)(?=<\/div>)/is

可変長は無理でもこの書き方({0,99})がOKな処理系もあるから試してみろ

166:デフォルトの名無しさん
09/07/27 09:08:56
>>160
DFAの計算量は自明でしょ。
NFAはパターンとテキストによって違うから一概には言えないんじゃないかな。

167:デフォルトの名無しさん
09/07/27 12:33:41
適当なことばっかり言うのはやめてください

168:デフォルトの名無しさん
09/07/27 13:29:38
セルフでコンプリートすればパーフェクトですよ

169:デフォルトの名無しさん
09/07/28 16:26:27
マッチする判定じゃなくて
正規表現書いたらそれを満たす全ての文字列を生成する
プログラムを書くのは難しいですか？

170:デフォルトの名無しさん
09/07/28 16:33:47
^.*$

171:デフォルトの名無しさん
09/07/28 16:35:25
正規表現によっては終わらない可能性があるわけだな

172:デフォルトの名無しさん
09/07/28 16:37:23
>>170
それをやると遅延評価的に必要な分だけ垂れ流すんです

173:デフォルトの名無しさん
09/07/28 16:37:58
文字数限定すればできることはできる
指定字数の全ての組み合わせの文字列をその正規表現にマッチさせて
成功したものだけをリストアップすればいい

速度的にどれだけ実用になるかは不明
最適化するとなると論文レベル

174:デフォルトの名無しさん
09/07/28 16:40:11
フィルターにかけるのではなく
初めから有効な物しか生成しないものとします

175:デフォルトの名無しさん
09/07/28 16:42:08
>>174
よし、正規表現をパースすることから始めよう。

176:デフォルトの名無しさん
09/07/28 16:42:44
等価な有限オートマトンをバックトラックしながらしらみつぶしに探索するような
プログラムを書けばできそうだな。

次ページ