正規表現 Part5 - 暇つぶし2ch

正規表現 Part5 ..

175:デフォルトの名無しさん
08/08/29 11:48:35
最近は再帰的にマッチできる正規表現が出てきてるんですね
メールのコメントをみんなどうしてるのかずっと悩んでました

176:デフォルトの名無しさん
08/08/30 07:59:25
後方参照は便利だね。

177:デフォルトの名無しさん
08/08/30 10:09:57
>>175
形式言語的な意味で「正規（正則）」な言語ではなくなってるけどね

178:デフォルトの名無しさん
08/08/30 13:12:16
前ってどっちですか？
後ろってどっちですか？

179:デフォルトの名無しさん
08/08/30 15:32:26
あー、あるあるｗ
プログラムカウンタが進む方（番地が大きい方）が前っぽいのに、
前方参照っつーと番地が若い方だったり。

180:デフォルトの名無しさん
08/08/30 16:19:58
このマップが悪いのかな、マップの赤点が見づらいわ

181:デフォルトの名無しさん
08/08/30 16:20:49
誤爆ね

182:デフォルトの名無しさん
08/08/31 10:38:11
Rubyです
予め文字列を逆にしておき連続する改行の後ろだけにマッチ

/\n(?=(?:\n[^\n]+)+)$/

もっとスマートな方法があれば教えてください

183:デフォルトの名無しさん
08/08/31 11:31:48
連続する改行の後ろだけにマッチ
って事なら、リバースする前に
/[^\n]+\n(?=\n+)/
じゃダメなのかな

184:182
08/08/31 11:58:23
アホだ～
ここまで解ってるなら逆にする必要なかった

/^((?:[^\n]+\n)+)\n(.*)$/m

これで\1と\2を取り出せば良いんですよね

185:182
08/08/31 12:04:02
>>183
リバース前にそれだと前の改行にマッチしてしまいませんか?

186:デフォルトの名無しさん
08/09/01 08:28:15
最小一致の呪文を覚えた

/\A((?:.+?\n)+?)(?:\n(.*))?\z/m

最終的にこうなりました
正規表現奥が深いです

187:デフォルトの名無しさん
08/09/03 08:43:01
>>84-85
この範囲[x,y]って表現は何のことですか？java/rubyでもないんですけど・・

188:デフォルトの名無しさん
08/09/03 09:08:18
>>187
数学

189:デフォルトの名無しさん
08/09/03 09:09:23
>>187
[文字の範囲] と
{繰り返し回数} を混同してないか？

190:デフォルトの名無しさん
08/09/03 09:15:43
数学。あーそういうことですか。

　\\s(\\w)
　\\s([\\w])

の違いを調べてるんですが、同じくヒットするんですけど何か違いはあるんでしょうか。
\\w　=>　\wです。

191:デフォルトの名無しさん
08/09/03 09:19:54
ありません

192:デフォルトの名無しさん
08/09/03 09:35:50
あーそーですか。ありがとうございます。

193:デフォルトの名無しさん
08/09/03 09:37:55
数学上の範囲[a,b]は、プログラム的な表現は　a..b　　や　(a..b)　じゃないですかね？

194:デフォルトの名無しさん
08/09/03 12:48:04
Javaなんですが、強欲な数量子ってのは、欲張り表現ってのでしょうか。
デフォルトでは最長一致なんですが（c+は、c+?ではない方です）、このデフォルト
の挙動　c+　が強欲表現　c++　なんでしょうか？
いまいち　c+　と　c++　の違いがわからないのですが、何か良いサンプルはないでしょうか。
ちなみに、ネタじゃないですよ

195:デフォルトの名無しさん
08/09/03 13:21:19
>>194
「強欲な数量子」でググれ

"ab" に対して /.+b/ と /.++b/ とか

196:デフォルトの名無しさん
08/09/03 13:29:59
>>194
/c+/と/c++/単独では対した違いはないが、
強欲＝「バックトラックしない」だから、後ろに対して影響がある。
たとえば、/c+c/は"ccc"にマッチするが、/c++c/は"ccc"にマッチしない。

197:デフォルトの名無しさん
08/09/03 13:35:38
なんだバックトラックか。
rubyでも廃止予定とか言わず、サポートすればいいのに…

198:デフォルトの名無しさん
08/09/03 14:17:08
c++ってcが２の倍数分だけ得るって事か

199:デフォルトの名無しさん
08/09/03 18:21:05
>>194
c+? : non-greedy (正規表現全体がマッチする範囲で最短)
c+　: greedy "貪欲" (正規表現全体がマッチする範囲で最長)
c++ : possessive "強欲" (正規表現全体がマッチしなくなっても、とにかく最長)

200:デフォルトの名無しさん
08/09/04 00:17:26
丁寧にありがとうございます。

201:デフォルトの名無しさん
08/09/04 00:22:59
rubyの(?>　)とほぼ等価ですかね。
イマイチ使う場面に遭遇しないんですけど…
どういう整形に必要かわからないんですけど、パタン表現になるぐらいだから、ある程度は需要があるのかなと思います。
これら特殊表現は、サンプルが多く出てくると、表現を理解できて、使える人がたくさん増えてくるのかなと思います。

202:デフォルトの名無しさん
08/09/04 04:46:06
タグ処理でよくあるんですけど、

<(.+?)>
<(.+)?>

は何か差があるんでしょうか。

203:デフォルトの名無しさん
08/09/04 07:21:56
下は
<> や <abcd>>> みたいなのにもマッチするぞ

204:デフォルトの名無しさん
08/09/04 08:48:19
>>201
正規表現を最適化するのに役立つ。
つまり「バックトラックしても無駄だ」っていうことを表明できる。

205:デフォルトの名無しさん
08/09/04 08:53:47
実装はそうでしょうけど、使う方からすると気にしてませんよ。
そもそもそのバックトラックの違いで速度などの差が出るようなら、regexpライブラリ使わないでしょうし。

206:デフォルトの名無しさん
08/09/04 08:54:59
>>205
お前が気にするか気にしないかは問題じゃない

207:デフォルトの名無しさん
08/09/04 09:05:39
おまえが気にするかとかよりも、バックトラックで問題が出るなら一般的には誰も使わないんじゃないですかね？
気にしてるのは、あなたの方ですよｗ

208:デフォルトの名無しさん
08/09/04 09:13:57
だから俺は気にするといってるんだが…

209:デフォルトの名無しさん
08/09/04 10:46:12
>>203
おお、そんなところに差があったんですか！感謝です！

210:デフォルトの名無しさん
08/09/04 11:01:52
気にするって、まさか自分で実装してるんですか？
c　のstring.h程度なら自力で実装できるんですけど・・・

211:デフォルトの名無しさん
08/09/04 11:36:34
正規表現の記事なんだが
やっと読み終わったぜ
URLﾘﾝｸ(codezine.jp)

212:デフォルトの名無しさん
08/09/04 12:02:17
バックトラックの量は正規表現を利用するだけの立場でも気にするべきことですよ。

213:デフォルトの名無しさん
08/09/04 12:05:02
ところでそれ、実測しましたか？

214:デフォルトの名無しさん
08/09/04 12:30:14
$unko =~ m!-_-!m;

215:デフォルトの名無しさん
08/09/04 13:20:26
正直怖いです

216:デフォルトの名無しさん
08/09/15 09:35:05
/\w+/にマッチし
/end/にマッチしない
というのをひとつの正規表現で書くのはどうすればいいですか？

217:デフォルトの名無しさん
08/09/15 10:31:31
否定読み

218:デフォルトの名無しさん
08/09/15 10:37:40
!/\W|end/

勝手に /^\w+$/ だと思い込んでみた。

219:デフォルトの名無しさん
08/09/15 20:23:01
サンクス
!//なんて技があるのか。
でもエディタの設定に//の中だけ書かなきゃいけないから使えないっぽい･･･
\b [^] |を駆使すれば出来そうだがめんどいな。

220:デフォルトの名無しさん
08/09/15 23:02:18
//の中だけじゃ、ignoreとかのフラグはどうしてんの？

221:デフォルトの名無しさん
08/09/15 23:17:10
チェックボックスがあるんだろ

222:デフォルトの名無しさん
08/09/16 00:23:31
○○あいうえお□□１２３
○○かきくけこ○□３４５
○○あかさたな□○５６７
○○はまやらわ□□７８９
○○あいうえおかきくけこ

このような文字列の○○と□□を入れ替えるには
どうしたらいいのでしょうか？

※○□と□○はそのままにする

223:デフォルトの名無しさん
08/09/16 00:25:51
(○○)(.*)(□□)(.*)
\3\2\1\4

224:デフォルトの名無しさん
08/09/16 00:59:03
素早い返事ありがとうございます。
ただ、それだと2、3、5行目の○○が□□にならないです。

225:デフォルトの名無しさん
08/09/16 01:37:44
s/○○/dummy/;
s/□□/○○/;
s/dummy/□□/;

226:デフォルトの名無しさん
08/09/16 23:29:17
正規表現である文字を含まない行に一致させる方法はありませんでしょうか？

たとえば

あいう
えおか
きくけ

とこのようにあった場合「お」を含まない行「あいう」「きくけ」にマッチさせたいんですが

227:デフォルトの名無しさん
08/09/16 23:52:05
grep -v お n.txt

228:デフォルトの名無しさん
08/09/17 00:47:11
>226
多バイト文字に対応しているとして ^[^お]*$
だけど、大抵の正規表現処理系において >227 のように「マッチしない」を指定する方法があるので
そっちを使う方が賢明。

229:デフォルトの名無しさん
08/09/17 01:15:58
>>227
>>228
レスありがとうございます。
すみません正規表現で文字処理するマクロソフト使用でしたので処理系があまり詳しくあえいませんでした。

^は基本でしたね、無事 ^[^お]*$　ですることが出来ました
ありがとうございます。

230:デフォルトの名無しさん
08/09/17 03:31:00
しかし現行の正規表現って使いづらいよな。
読みにくく書きにくくしかも非力。もう駄目駄目。
２ｃｈの面白いレスにのみマッチするといった条件が記述できるくらい強力な
オブジェクト指向か関数型ベースの正規表現を作るべきなんだよ。

231:デフォルトの名無しさん
08/09/17 07:51:36
文字列に対してオブジェクトや関数型ベースってどういう意味？

232:デフォルトの名無しさん
08/09/18 01:50:50
ブラウザによってもjavascriptの動作変わりますよね

javascriptです。
123451234512345

このような文字列があった場合　/1[0-9]*5/g　とするとどのようにマッチするかわかりますか？
このようにして使っていたんですが、ブラウザごとに違う動作をするようでうまくいきません。
IEでは12345　　12345　　12345　と三つにマッチするみたいです。
このような曖昧なものにするとだめなのでしょうか。
対処策などありましたらお願いします。

233:デフォルトの名無しさん
08/09/18 03:36:50
いや、、、どうしたいの？

234:デフォルトの名無しさん
08/09/18 09:17:03
貪欲マッチで「12345」にしかマッチしないのは変だな。

235:デフォルトの名無しさん
08/09/18 09:53:49
Firefoxで以下を実行すると12345123451234にマッチする
javascript:alert("123451234512345".match(/1[0-9]*4/g));
もちろん
1[0-9]*5
に変えると全部にヒット
JavaScriptのエンジンまでとは言わないからせめてブラウザぐらい書いてくれ

236:デフォルトの名無しさん
08/09/18 09:57:10
IEですね、本当にすみませんでした。

237:デフォルトの名無しさん
08/09/18 10:05:11
WinME IE6では123451234512345にマッチした

238:デフォルトの名無しさん
08/09/18 10:40:46
/▶1◀▶[0-9]*◀▶5◀/
"▶1◀▶23451234512345◀"
[0-9]*で残り全部にマッチしちゃって、最後の「5」があぶれそうに思えるけど、
ちゃんと全体にマッチするんだね。自分もまだ修行が足りない。

239:232
08/09/18 12:27:11
IE7でした。IE７でも>>235さんのものを実行したら12345123451234にマッチしますね
正規表現間違っていただけかも・・

「12345」「12345」「12345」
このように3つにマッチさせたいと思ってました。

実際処理していた文字列は長いのですが
.*　これを挟んでいたのになぜか
IE7では「12345」「12345」「12345」のように最短マッチのように出ていたみたいです。firefoxでは「123451234512345」

innerHTMLでの処理だったのでIEとfirefoxとでは改行？かなにか、文字列が変わっていたことが原因だったと思われます。

/1[0-9]*?5/gのように?をつけたら同じ動作をするようになりました。
レス下さった方ありがとうございます、勉強になりました。

240:デフォルトの名無しさん
08/09/19 19:54:29
単純な知的好奇心の質問なのですが、
123456789と適当な桁数の数値があった時、先後読みだけで3桁ごとにカンマを挿入するにはどう記述したらいいのでしょうか。

preg_replace("/(?=[0-9]{3})/", ",", "123456789");
では左から3桁以下になるまでカンマが一桁ごとに入ってしまいます。
前後逆転せずにできる方法があればお願いします。

241:デフォルトの名無しさん
08/09/19 20:20:56
>>240
URLﾘﾝｸ(www.din.or.jp)

242:デフォルトの名無しさん
08/09/19 20:25:42
>>240
整数をカンマ区切りに置換
URLﾘﾝｸ(oraclesqlpuzzle.hp.infoseek.co.jp)

243:デフォルトの名無しさん
08/09/19 21:18:24
>>241-242
ありがとうございます。
自分の頭の固さを痛感しました。

{3}+$で右側が3の倍数である時のみ、という風に指定すればいいんですね。
スッキリいたしましたm(_ _)m

244:デフォルトの名無しさん
08/09/20 17:54:15
javascriptで正規表現に%記号がうまく使えません。対処法はありますでしょうか？
/%a/i にすると「%a」にマッチするんですが /%a5/i のように%の後に2文字以上続けるとマッチしなくなります。

エスケープもうまくいきませんでした。宜しくお願いします

245:244
08/09/20 17:56:09
エンコードされた文字列にマッチさせたいと思っています。

246:デフォルトの名無しさん
08/09/20 19:30:20
"\%a5".search(/%a5/i); // => 0

"%a5" という３文字にマッチさせたいんだよね？
0xA5 という文字コードの文字じゃなく。

247:デフォルトの名無しさん
08/09/20 19:57:14
ブラウザとか環境を書けって上でも

248:デフォルトの名無しさん
08/09/21 00:51:45
そうです。文字エンコードされた　%82%a0%82%a2%82%a4%82%a6　という文字列の中から特定の文字をマッチさせたいと考えています。

javascript:alert("%82%a0%82%a2%82%a4%82%a6%82%a8%82%a9%82%ab%82%ad%82%af%82%b1".match(/%82%a0/g));
このように実行してもマッチされないんですよね
IEでも狐でもやってみましたがnullになります
どこが間違っているんでしょうか

249:デフォルトの名無しさん
08/09/21 01:03:10
>>248
その式をコピペしたけど、IE8βでもFirefoxでもOperaでもマッチしたぞ。
何かテスト方法を間違えてる。

250:デフォルトの名無しさん
08/09/21 02:59:21
URLﾘﾝｸ(server)<)
　URLﾘﾝｸ(server9.www)<)

よろしくお願いします。

251:デフォルトの名無しさん
08/09/21 03:34:01
少しは自分で調べたり考えたりしたのか？

252:250
08/09/21 03:42:18
>>251
わからないならレスしないでください。
それに質問に質問で返すのは失礼です。

253:デフォルトの名無しさん
08/09/21 04:02:29
あまりにも初歩的だから>>251の気持ちもわかるｗ

254:250
08/09/21 04:51:58
難しく考え過ぎてた。
風呂入ってきたら自己解決しましま
[|\d]*

255:デフォルトの名無しさん
08/09/21 04:54:57
[| ]
これは必要なのか？

256:デフォルトの名無しさん
08/09/21 12:02:25
練馬というファイル名リネームソフトで正規表現が使えるのですが、

s/\]([^ \.].+)/\] \1/

という正規表現で何故か「従妹」が「従妹」、「ゾン」が「ゾン」という風に
関係ないところまで半角スペースが入ってしまいますが何故でしょうか？

ヘルプを見ると正規表現の仕様は BREGEXP.DLL に準拠すると書かれています
よろしくお願いします

257:デフォルトの名無しさん
08/09/21 13:33:33
そのソフトは知らんが、作者が抜けてるだけだろ。

258:デフォルトの名無しさん
08/09/21 15:52:50
従やゾの２バイト目が SJIS で ] なんだろう。
正規表現ライブラリが日本語対応してないんだろうな。

259:デフォルトの名無しさん
08/09/21 18:45:09
サンクス
他の探すか作者に聞いてみます

260:デフォルトの名無しさん
08/09/21 22:45:57
DLL差し替えればいいじゃない

261:デフォルトの名無しさん
08/09/22 00:13:26
DLL自体は更新止まってるみたいです

262:デフォルトの名無しさん
08/09/22 05:34:17
その練馬とやらを使ってみたし、DLLの説明も見たけど、
SJISとして扱うのには、 k修飾子をつけるｙぷになってるんだが
ちゃんとつけてる？

263:デフォルトの名無しさん
08/09/22 05:35:30
って>>256みるとついてないね。つけてやってみては。

264:デフォルトの名無しさん
08/09/22 11:04:27
Visual Basic 2005で正規表現の処理を入れ子にしようとしたんだけど、
これだと、henkanに「$&」が文字列としてそのまま渡されてしまいます。

str = Regex.Replace(str, "<a href="".*?"">", henkan("$&"))

perlのeオプションみたいなのは見つけられなかったのですが、
どうすればいいのでしょう？

265:デフォルトの名無しさん
08/09/22 11:22:09
php5 mb_eregを使用しています。

n個のパターンを後方参照で取得したいです。
例えば 'abcde' を
'([a-z])([a-z])([a-z])([a-z])([a-z])'
というパターンであれば 'a', 'b', 'c', 'd', 'e' ととれるのですが
'([a-z])+'
こんなパターンで取得することは不可能でしょうか？

266:256
08/09/22 17:23:44
>>262
ありがとうございます！　/kで問題なくいけました！
ちゃんと説明読んでなかった自分が恥ずかしいです・・・

267:264
08/09/22 18:03:23
自己解決したので、カキコ。

まず、文字列を評価するための宣言をする
Dim myEv As MatchEvaluator = New MatchEvaluator(AddressOf henkan)

んで、置換部分をこんな感じにする。
str = Regex.Replace(str, "<a href="".*?"">", myEv)

さらに、関数をこんな感じに作る。
Public Function henkan(ByVal url As Match) As String
　　　　Dim s As String = url.ToString()
　　　　s = Regex.Replace(s, "\\", "/")
　　　　Return s

End Function

268:デフォルトの名無しさん
08/09/23 18:48:58
>>265
mbじゃないなら
$ php -r 'preg_match_all("([a-z])","abcdef",$reg);print_r($reg);'
でできるんだよな。

でもそれはどうでもいいんだよな。

269:デフォルトの名無しさん
08/09/23 21:44:17
PHPのpreg_matchを使ってHTML文書から次の内容を検索する
正規表現で困っています。

<a href="URL">前のページ</a>　<a href="URL">次のページ</a>

ここから「次のページ」を囲んでいるAタグのURLを検索したいです

/<a href=\"(.+?)\">次ページ<\/a>/
これだと、前のページのAタグまで含んでしまい困っています。
最左から検索するのが問題だということまでは分かったのですが解決法が分かりません。

/<a href=\"(.+?)\">(?=次)次ページ<\/a>/
こんな書き方もダメでした。

ヒントでもいいので教えていただけませんか？

270:デフォルトの名無しさん
08/09/24 01:53:37
>>269
> href=\"(.+?)\"
を
href=\"([^"<>]+?)\"
にでもしたらどーでしょ。

271:デフォルトの名無しさん
08/09/29 06:47:50
始めての…表現
URLﾘﾝｸ(anond.hatelabo.jp)

272:デフォルトの名無しさん
08/09/29 19:04:52
いままでMac OS9 Jeditにて正規表現での置換をしていました．
正規表現での一括置換ができる検索置換ラクダv1.01を導入したのですが
表現方法？Perlでの書き方が違うみたいで上手く置換できません．

できればOS9環境で正規表現の連続置換がしたいので検索置換ラクダで可能な
正規表現をPerl初心者の私にどうかアドバイスというか答えを教えてください・・

「全角文字の前後の半角スペースを削除」例＝　この MPEG は　→　このMPEGは　
{[、-◯ぁ-んァ-ヶ亜-腕弌-熙]}\s　【タブ】　\1
\s{[、-◯ぁ-んァ-ヶ亜-腕弌-熙]}　【タブ】　\1

「全角文字の前後の半角カンマを全角カンマへ」例＝　あ,あ　→　あ，あ
{[、-◯ぁ-んァ-ヶ亜-腕弌-熙]},　【タブ】　\1，
, {[、-◯ぁ-んァ-ヶ亜-腕弌-熙]}　【タブ】　，\1

「行末の西暦を括弧で囲む」例＝　XX, 2005　→　XX（2005）　XX,1998　→　XX（1998）
, {200[1-9]}$　【タブ】　（\1）
,{200[1-9]}$　【タブ】　（\1）
, {19[1-9][1-9]}$ 　【タブ】　（\1）
,{19[1-9][1-9]}$ 　【タブ】　（\1）

「半角数字間の全角ピリオドをピリオドを半角ピリオドへ」例＝　1．1%　→　1.1%
{[0-9]}．{[0-9]}　【タブ】　\1.\2

273:デフォルトの名無しさん
08/09/29 19:13:47
>>272
全角文字を文字範囲で指定するのは、
文字コードに依存するからうまくいかない環境もあると思う。

274:デフォルトの名無しさん
08/09/29 20:05:20
OS9って昔の環境だよな
検索置換ラクダとやらが何だか知らんし
Perlのバージョンも分からんが、
多分、単に漢字を文字クラスの中で使えない可能性が極めて高い

例えば、. が漢字一文字にマッチするか試してみればいいが、
多分そうなっていないだろう

275:デフォルトの名無しさん
08/09/30 09:41:18
php5です

文字列
<tr>
<td colspan="2"><img height="5" src="URLﾘﾝｸ(localhost)" width="1"></td>
</tr>
<tr>
<td width="100" height="147"><a href="/aaaa/bbbb/" title="hogehoge"><img src="URLﾘﾝｸ(localhost)">

この文字列の中のaタグのすぐ後ろのimgタグのURLを取りたく

preg_match("/"<a href=\".*?\" title=\".*?\"><img src=\"(http.*?\.jpg)\">/i", $body, $match);

こうしてみましたが、マッチしません
どのように書けばよろしいでしょうか

276:デフォルトの名無しさん
08/09/30 10:48:28
>>275
imgタグの中で、srcは必ず先頭に来る前提でいいのかな。
/<a[^>]+><img src="([^"]+)/
で、$1を取り出す。

277:デフォルトの名無しさん
08/09/30 11:13:03
空白1つを含む文字列にはマッチするけど、2つ以上連続の空白でマッチしないようにするには
どうすればいいのでしょうか？

ab cd ef 　gh

この場合、"ab cd ef"にマッチ。

278:デフォルトの名無しさん
08/09/30 12:13:17
>>277
{1}

279:デフォルトの名無しさん
08/09/30 12:32:32
>>277
[^ ]+( [^ ]+)*

280:デフォルトの名無しさん
08/09/30 12:50:20
>>279
サンクス
うまくいきました

281:デフォルトの名無しさん
08/09/30 16:09:48
>>276
できました
ありがとうございました

282:デフォルトの名無しさん
08/09/30 23:00:39
質問です。

●正規表現の使用環境
サクラエディタ ver.1.6.2.0

●検索か置換か？
検索

●説明
XMLファイルのタグの中を検索したいです

●対象データ
<aaa><bbb>hogehoge</bbb></aaa>

●希望する結果
aaa と bbb と /bbb と /aaa のみ検索される

色分けをしたいのです。
おねがいしまう

283:デフォルトの名無しさん
08/09/30 23:09:21
(?<=<).*?(?=>)

284:デフォルトの名無しさん
08/09/30 23:11:00
しまうーなら答えざるを得ない

285:デフォルトの名無しさん
08/09/30 23:24:06
今回のパナソニックって
s/松下[電器産業]/パナソニック
でいいですか？

286:デフォルトの名無しさん
08/09/30 23:29:57
電波ぽいのが気になるが
s/松下(電器産業)?/パナソニック/ じゃないか

287:デフォルトの名無しさん
08/09/30 23:40:13
>>283
できました。ありがとうございました！

288:デフォルトの名無しさん
08/09/30 23:43:26
そうだｗ
()はグループ化で
[]は1文字だけか

289:282
08/10/01 00:16:25
やっと理解できたｗｗｗｗｗｗｗｗｗｗ
理解できたってか調べるのに時間かかりました
(?<=<) これで < が前に存在することを保証する
.*? 任意の文字の連続(最短)
(?=>) > が後に続くことを保証する
283は天才www
チラ裏スマソ

290:デフォルトの名無しさん
08/10/01 00:18:33
お礼よりも… 分かってんだろうなボウズ

291:デフォルトの名無しさん
08/10/01 00:19:44
>>290
わかりませんサーセン

292:デフォルトの名無しさん
08/10/01 00:25:56
さっきからチンポ出して待ってんだから… と言えば何か分かるだろ。

293:デフォルトの名無しさん
08/10/01 04:10:07
そういうのりきもいよボケ

294:デフォルトの名無しさん
08/10/01 05:53:23
>>293
お前ここは初めてか？
いいから力抜けよ。

295:デフォルトの名無しさん
08/10/01 07:12:33
>>294
むしろお前が初めてか？
空気嫁よ

296:デフォルトの名無しさん
08/10/01 09:46:51
アッー！

297:デフォルトの名無しさん
08/10/01 10:05:59
最近の腐女子は正規表現も嗜むのか。
時代は進んでるな。

298:デフォルトの名無しさん
08/10/01 11:51:08
PHP4での処理をしております

$str = preg_replace('/(<br \/>|<br>)/i', '<br />', $str);

いろいろやっているうちにチンプンカンプンでしまいには変な顔文字に見えてきて挫折しそうなので
どうかご教授お願いします

やりたい事は$strの中のbrタグが連続して２つ以上あればそれを１つに置き換えたいです
条件として、<br>と<br />を同じ文字列として考えるのと、たまにbrの間に改行コードがあります
<br>\n<br>\n<br />　→　<br />
このようにbrタグの間に改行コードがあってもbrタグは連続するものとしたいです
よろしくお願いします

299:デフォルトの名無しさん
08/10/01 12:13:59
php -r '$s="<br>\n<br>\n<br />";echo preg_replace("/((<br>|<br \/>)\n?)+/i", "<br />", $s)."\n";'

300:デフォルトの名無しさん
08/10/01 12:21:01
brタグのすぐ後ろの改行も吸収してしまうが
$s="<br>\n<br><br />\ntest<br>\n\n<br />";
$str = preg_replace("/(<br( +\/)?>\n*)+/i", "<br />", $s);

301:デフォルトの名無しさん
08/10/01 13:19:37
>>299-300
望みどおりの処理ができました
ありがとうございました

302:デフォルトの名無しさん
08/10/03 16:41:07
\d+\.\d+\.\d+\.\d+
でＩＰアドレスを取得しようとしてますが、
127.0.0.1 にだけはマッチさせたく無いです。
どうやったらいいですか？

303:デフォルトの名無しさん
08/10/03 17:16:01
(((((((((((((((([^1]*)*(1+[^2][^1]*)*)*)*(1+[^7][^1]*)*)*)*(1+[^.][^1]*)*)*)*(1+[^0][^1]*)*)*)*(1+[^.][^1]*)*)*)*(1+[^0][^1]*)*)*)*(1+[^.][^1]*)*)*)*(1+[^1][^1]*)*)*

304:デフォルトの名無しさん
08/10/03 17:16:18
不可能ではないが2段階に分けたら？
なにがなんでもひとつの正規表現でやらなきゃならない？

305:デフォルトの名無しさん
08/10/03 17:18:55
>>303
((((；ﾟДﾟ))))ｶﾞｸｶﾞｸﾌﾞﾙﾌﾞﾙ

306:デフォルトの名無しさん
08/10/03 17:23:05
>>303
そんなの死んでもイヤです！

307:デフォルトの名無しさん
08/10/03 17:28:43
まあIPアドレスなら127.まででもいいとは思うけどな。

308:デフォルトの名無しさん
08/10/03 21:02:00
文字列がIPアドレスのみなら

$str="192.168.0.1";
preg_match("/(127\.0\.0\.1)?(.*)/",$str,$m);
echo $m[2];

でいけるよな

309:デフォルトの名無しさん
08/10/03 21:29:36
127…でやってみた？

310:デフォルトの名無しさん
08/10/03 23:16:55
s/127.0.0.1/うんこ/g

/\d+\.\d+\.\d+\.\d+/gp

s/うんこ/127.0.0.1/g

311:デフォルトの名無しさん
08/10/03 23:18:12
>>309
>308の事なら中身の有無で分岐すればおk

312:デフォルトの名無しさん
08/10/03 23:19:03
ドットにエスケープなんているの？

313:デフォルトの名無しさん
08/10/03 23:23:17
可読性

314:デフォルトの名無しさん
08/10/04 00:55:36
ドットってエスケープいらないの？

315:デフォルトの名無しさん
08/10/04 01:04:01
すまない、必要だった
エスケープしないと任意の一文字でしたね

316:デフォルトの名無しさん
08/10/04 01:51:11
VC++でマルチバイト（ユニコードではない）日本語文字列を対象とした正規表現ライブラリの定番は何ですか？

317:デフォルトの名無しさん
08/10/04 09:19:23
Unicodeに変換しちゃだめなの？

318:デフォルトの名無しさん
08/10/04 21:25:17
ユニコード用しかないのか・・・。
VC++でまともな正規表現やろうと思ったら、ユニコード用の正規表現ライブラリしかないんですかね？
VBAのRegExpコントロールとか、boostのregexとか。

いますごく困ってるのは、VBAのRegExpコントロールを使ってVC++でMBCSプログラミングをしてるんですが、
MatchオブジェクトのFirstIndexプロパティが文字数単位で返ってくることなんですよ。
MBCSだと、バイト単位でどの位置なのか知りたいのに。
もちろん対象となるテキストの先頭から２バイト文字かどうかを調べていけば、
何文字目が何バイト目かを調べることはできるけど、テキストが長くなると処理速度的に満足できない。

ユニコードで何文字目→MBCSで何バイト目を高速に計算するAPIってないですか？

319:デフォルトの名無しさん
08/10/04 21:43:13
あと思いつくライブラリは鬼車だけど、どうだろう
何バイト目？ってのは結局頭から見ていくしかないので高速化も難しい
でも長いテキストでも見る開始位置を後ろに持っていくぐらいはできるかな

320:デフォルトの名無しさん
08/10/04 23:14:36
>>319
鬼車というのはちょっと見てみましたが、クセがありそうなのでやめときます。
文字数→バイト変換はやっぱり先頭から真面目にカウントするしかなさそうですね。

過去のカウント結果を保持するような文字数→バイトカウント専用のクラスを作って、
同じテキストに関するカウントの高速化をするとか工夫してみます。

321:デフォルトの名無しさん
08/10/05 10:09:25
MBCSの定番と言えばbregexp.dllじゃね？あるいは鬼車を同じIFにしたbregonig.dllとか。
鬼車以上にクセがあるが。

322:デフォルトの名無しさん
08/10/06 13:33:23
一括置換ソフトを使い、
複数のファイルにて、一括複数行置換をしたく、そのために正規表現を使わなくてはなりません。
色々と試してみてもうまく検索されないので教えてください。


<script type="text/javascript" src="URLﾘﾝｸ(x7.shidareyanagi.com)ここに９桁の英数字があります"></script>
<noscript><a href="URLﾘﾝｸ(x7.shidareyanagi.com)ここに９桁の英数字があります" target="_blank">
<img src="URLﾘﾝｸ(x7.shidareyanagi.com)ここに９桁の英数字があります" border="0"></a><br>
<span style="font-size:9px"><img style="margin:0;vertical-align:text-bottom;" src="URLﾘﾝｸ(img.shinobi.jp)" width="19" height="11">
<a href="URLﾘﾝｸ(sbc.rentalurl.net)" target="_blank">美容整形</a></span></noscript>


ファイルにより、上記の中で、「ここに９桁の英数字があります」のところがそれぞれ異なります。

その複数ファイルの中でからまで囲まれた部分を検索にかける場合、正規表現ではどう書きますでしょうか？

一括置換ソフトは
複数行置換　を使用しております。

323:デフォルトの名無しさん
08/10/06 13:37:08
>>322
.*
ではダメなの？

324:デフォルトの名無しさん
08/10/06 13:39:04
.*

325:デフォルトの名無しさん
08/10/06 13:57:09
最長一致しちゃうから、.* じゃマズいでしょ。
途中にコメントがないなら、<! を避ければいけそう。

326:デフォルトの名無しさん
08/10/06 19:16:41
.*? でいいんじゃ

327:デフォルトの名無しさん
08/10/06 21:30:13
最短一致で何か問題あるの？

328:デフォルトの名無しさん
08/10/06 21:59:53
だれもそんなことはいってないが

329:デフォルトの名無しさん
08/10/07 08:19:34
正規表現を使わなければならない、って云ってるのに
やり方が分からないってどういう事だ

330:デフォルトの名無しさん
08/10/07 09:48:57
その一括置換ソフトとやらが正規表現を使えるってことじゃ？

331:デフォルトの名無しさん
08/10/07 10:25:20
sedで、

　<a href="http://○○<br><br>○○ target="_blank">△△</a>
　<a href="http://○○○○ target="_blank">△<br><br>△</a>

にマッチングして、<br><br>を削除したいのですがどの様な記述になるのでしょうか。

332:デフォルトの名無しさん
08/10/07 10:28:10
(<br>){2,}

333:デフォルトの名無しさん
08/10/07 10:35:57
追加

　□□<a href="http://○○<br><br>○○ target="_blank">△△</a>□□
　□□<a href="http://○○○○ target="_blank">△<br><br>△</a>□□

失礼しました。<a href=""></a>の前後にも文字列があります。<a href=""></a><a hr・・・と
繰り返している可能性もあり、<a href=""></a>内で<br><br>が発生している時はsedで取り除きたいのです。

334:デフォルトの名無しさん
08/10/07 11:22:35
<a href="">.*?(<br>){2,}.*?</a>

335:デフォルトの名無しさん
08/10/07 11:33:58
>>334
有り難うございます。　<a href=".*?(<br>){2,}.*?</a>　と変更しまして、ためしましたと所、

　<a href=""></a>○○<br><br>○○<a href=""></a>　

にもマッチングしてしまいます。

336:デフォルトの名無しさん
08/10/07 14:14:50
/(<a href=.+?>.*?)<br><br>(.*?<\/a>)/$1$2/ でどうだ

337:デフォルトの名無しさん
08/10/07 14:17:50
あ、まちごうた。これでどうだ
/(<a href=.+?)<br><br>(.*?>)/$1$2/
もしくは
/(<a href=[^<>]+?)<br><br>(.*?>)/$1$2/

338:デフォルトの名無しさん
08/10/07 17:13:07
>>337
有り難うございます。
会議が入ったので取り敢えずの中間報告です。どちらも100件の小さいログサンプルでは、
<a href="○○<br><br>○○></a>にはちゃんと働いてくれました。

良い感じだったのですが、<a href="△△">○○<br><br>○○</a>□□<a href="・・・
とリンク文字間に<br><br>が有る場合は反応いたしませんでした。

339:デフォルトの名無しさん
08/10/07 20:37:43
このスレに複数のbrタグを一つにする正規表現があるから
それを活用するといいよ

340:デフォルトの名無しさん
08/10/15 17:14:42
その妙なHTMLを吐き出してる奴を修正する。

341:デフォルトの名無しさん
08/10/17 20:22:59
C#の正規表現で、「スペース（半角、空白）か改行しかない」という
条件はどう表現するのでしょうか。

^\s+\n と ^\s*$ を組み合わせる事で表現出来たような気したんですが
------

a

------
もマッチしてしまいます。

342:デフォルトの名無しさん
08/10/17 20:46:45
空白が何を指すのかちょっとわからないけど
^\s+$ か ^\s*$で通常なら事足りるはず

メソッドの使い方間違えてるかもしれないから
とりあえずC#のコード貼ってみて

343:デフォルトの名無しさん
08/10/17 21:55:13
>>342
親切に有り難う御座います。
^\s+$ で無事マッチさせる事が出来ました。
一応メソッドの方は汚いですが抜粋すると以下の様にして判定しており
buffの中に正規表現が入っていてstTargetを判定している感じです。

for (int i = 0; i < buff.Count; i++)
{
　　 bool regexCheck;
　　 try
　　 {
　　　　 regexCheck = Regex.IsMatch(stTarget, buff[i]);
　　 }
　　 catch
　　 {
　　　　 return true;
　　 }
　　 if (regexCheck == true)
　　 {
　　　　 return true;
　　 }
}

344:デフォルトの名無しさん
08/10/24 04:23:35
質問に来ました。

●正規表現の使用環境
boost regexを使用した「Flexible Renamer」というファイルリネームソフト

●検索か置換か？
置換

●説明
[aaaa][bbbb].xxx などとなっているファイル名の最初の[]だけを()に変えたい
(aaaa)[bbbb].xxx となるようにしたい

ソフトがバグっている可能性もあるのですが、いろいろやったけどできません。

345:デフォルトの名無しさん
08/10/24 04:28:04
それで質問は？

346:デフォルトの名無しさん
08/10/24 07:52:39
s/^(.*?)\[(.*?)\](.*)$/\1(\2)\3/
できないのはソフトのバグではない
じゃあ何の所為なんだろうね

347:デフォルトの名無しさん
08/10/24 11:11:02
>>346
㌧
やっぱりできませんでした
どうもソフト自体が正規表現を受け付けないみたい、説明にもヘルプにもできるって書いてあるのになー
別のフリーソフト探します

348:デフォルトの名無しさん
08/10/24 11:56:11
ちょっと触ってみたけど、高度なりネームにチェック入れたか？

349:デフォルトの名無しさん
08/10/24 12:11:36
高度なリネームにチェックして、正規表現を選択、
検索：^(.*?)\[(.*?)\](.*)$
置換：\1(\2)\3
で動作したが。

350:346
08/10/24 12:18:31
えっ、そこからなの？
ソフトの使い方とか予想外だった

351:デフォルトの名無しさん
08/10/27 09:42:10
HTMLのあるタグの中身が入れ子になっていても確実に外側にマッチできる正規表現ってありませんか？
正規表現だけに頼らず、HTMLをパースするしかないんでしょうか？

<div class="1">
あああ
<div class="2">いいい</div>
</div>
↑この、<div class="2"> があろうとなかろうと、<div class="1"> に対応する</div>までをマッチさせたい

352:デフォルトの名無しさん
08/10/27 10:23:24
たぶん、正規表現マッチのみだと、荷が重いか無理。
その例みたいに、「divのみで２重まで」とか条件があればまだしも。

353:デフォルトの名無しさん
08/10/27 11:17:41
HTMLとかXMLとか扱うのなら、たいていのケースでパーズしたほうが簡単。

354:デフォルトの名無しさん
08/10/27 13:40:07
世の中のHTMLがまともなHTMLばかりなら
それで苦労ないんだけどなw

355:デフォルトの名無しさん
08/10/28 01:02:35
ネストが狂ってたり閉じタグが無かったりなんてのはザラだからなー

356:デフォルトの名無しさん
08/10/28 01:19:07
一つの正規表現では無理だが、ループ作れば何とか。でも、自分では普通かかんよねー。
$match = '';
$str =~ /(<div class="1">)/g or die "no match";
$match .= $1;
while ($str =~ m{\G(.*?</div>)}gs) {
　$match .= $1;
　last if $1 !~ m/<div/;
}

357:デフォルトの名無しさん
08/10/28 11:17:52
現在『[\x20-\x7E]』とやって半角文字を抽出してるんですが
半角の空白のみを含まない場合は、どうやって表現したら良いでしょうか
お願いします。

358:デフォルトの名無しさん
08/10/28 12:25:44
>>357
アスキーコード表を眺めてみましょう。

359:デフォルトの名無しさん
08/10/28 12:38:16
>>358
ありがとうございました『[\x21-\x7E]』でいけました。
ところで、vb2008のRegexクラスでは、＾による否定ってできないのでしょうか

360:359
08/10/28 13:01:21
使えることがわかりました。自分の記述が悪かったみたいです。ありがとうございました。

361:デフォルトの名無しさん
08/10/29 18:31:37
C#で

数字４桁で後ろに
何もない
ハイフンが１個
ハイフンと小文字のアルファベットa-z
の３パターンにマッチするには、どう書けばいいのでしょうか

例
1234
2345-
7896-d

362:デフォルトの名無しさん
08/10/29 19:21:52
>>361
>>2あたりは一通り読んだのか？

363:デフォルトの名無しさん
08/10/29 21:45:54
優しさに泣いた

364:デフォルトの名無しさん
08/10/30 01:04:02
環境）OS：WinXP-Pro，Mem＝3GB，開発ソフト：FlashCS3-Pro（Player9.0，AS3.0）

Flash-ActionScript 3.0で正規表現を用いて、テキスト中の
　1.2345
-0.1234
10.5678

といった数値を抽出しようと思いますが、この場合の小数点の扱いはどのようになるのでしょうか？
テストで　.[0-9]　（小数点とその右の数値を抽出）を行ったところ、e1 というコードが現れ、
全く出鱈目な結果を得ました。
（ActionScript3.0で「.」は任意の１文字なので仕方ないのですが・・・）

Flashの場合に限らず、小数点を含む類似のサンプルがありましたらご紹介下さい。

365:デフォルトの名無しさん
08/10/30 01:07:55
OSとメモリに和んだ

任意の一文字を表す . を \ でエスケープすれば
. そのものになると思うよ

366:364
08/10/30 01:31:46
>>365
早速のレス有難うございます。

たった今、手元の本で見つけたのですが、　.　はAsciiコードで　\x2E と表現するということなので、
これで試しましたが駄目でした（Unicode表記　\u002E でも駄目でした）

半角マイナス（\x2D）やスラッシュ（\x2F）は問題なく抽出できたのですが・・・

367:デフォルトの名無しさん
08/10/30 02:06:44
正規表現オブジェクトをどうやって作ったのか
そのオブジェクトとどうやってマッチさせたのかわかるコードを貼ってみて

もし前者で new RegExp("\x2E[0-9]") とかしてるとややこしいことになる
正規表現リテラル /\x2E[0-9]/ や /\.\d/ なら期待通りに動くはず

368:デフォルトの名無しさん
08/10/30 02:54:50
[.][0-9]
なんて手もある。
一文字多いけど、 \ の扱いが面倒な状況だと役に立つかも。

369:364
08/10/30 22:42:15
>>367-368
試してみました。コードの構成は以下の通りで、マウスクリックでのアクションです。

var str:String = "+ +-- ** / / 0120-123-456 1.2345 -0.1234 10.5678 0.0012"; //適当な文字列

this.expBtnM0.buttonMode = true;// マウスポインタを指の形に
this.expBtnM0.addEventListener (MouseEvent.CLICK, mcClick0);
//　５個のムービークリップ　expBtnM0～expBtnM4　を押して動作

function mcClick0 (event:MouseEvent):void {
var pattern:RegExp = /\x2E[0-9]/g; // <----- ここを５種類で試す
var regObj:Object = pattern.exec(str);
trace ("0 マッチング： " + regObj); //　0 マッチング：　～　4 マッチング：
trace ("0 文字列： " + str.match(pattern)); //　0 文字列：　～　4 文字列：
trace ("");
}

結果は、　var pattern:RegExp = /\x2E[0-9]/g;　，　var pattern:RegExp = /\.\d/g;　，　
var pattern = new RegExp("[.][0-9]", "g");　および　var pattern:RegExp = /[.][0-9]/g;　の４つで可でしたが、
var pattern = new RegExp("\.\d", "g");　ではod が返されて不可でした（odの意味を調べましたが、
分かりませんでした）。
取りあえず、少数点（ドット）には　var pattern:RegExp = /～/;　の形が良いようです。

アドバイス、有難うございました。

370:デフォルトの名無しさん
08/10/31 01:02:32
今北
最後のやつはダブルクォート中のエスケープだから実態は“.d”で
任意の１文字＋dで解釈されたと思われる
それをするなら“\\.\\d”だろうか
どうも「\でエスケープ」の意図が伝わってなかった気がするね
できたんならよしとすればいいけど

371:デフォルトの名無しさん
08/10/31 06:50:23
だね。ややこしいところではある

// ASコンパイラは文字列「ドット、次に d 」と解釈
"\.\d"

// 正規表現コンパイラは文字列「ドット、次に d 」を元に正規表現を作成
// 結果、任意の一文字に続いてdが来る文字列にマッチする正規表現が出来上がる
new RegExp("\.\d", "g");

こういうのにはまったら、ASコンパイラと正規表現コンパイラの二者が
（概念的には）存在することを思い出すといいんじゃないかと思う
もちろん、とりあえず正規表現リテラル /.../ 使っとこう、でも構わない
あと >>369 のコード中の str に文字列 od が含まれていないか確認を

372:364
08/11/01 11:41:13
>>371
すいません、レス遅くなりました。

ここに貼った　var str:String　は元が長いので、途中を省略したもので、コード上の元の
文字列には確かに　od　が入っています。
AS3.0の　new RegExp("\.\d", "g");　だと、od（～d）　が対象になるのかなあ・・・・

373:デフォルトの名無しさん
08/11/03 18:48:42
●正規表現の使用環境
PHP4.3.11

●検索か置換か？
検索

●説明
CSVファイルを「,」で分離したいが、
「"」で囲まれているフィールドに関しては「,」で分離したくない

●対象データ
AB,BC,"CD,DE,EF",FG

●希望する結果
(1)AB
(2)BC
(3)"CD,DE,EF"
(4)FG

すいません、基礎的な質問かと思いますが
お分かりになる方がいらしたらよろしくお願いいたします。

374:デフォルトの名無しさん
08/11/03 19:47:44
CSVの分割は正規表現では完璧に表現できない
プログラムで対処が一般的

375:デフォルトの名無しさん
08/11/03 21:01:42
>>373
PHPなら専用の関数が元からあるだろう?

376:デフォルトの名無しさん
08/11/03 21:31:19
●正規表現の使用環境
Ruby1.8

●検索か置換か？
置換

●説明
ファイル名の頭から指定の文字列Xまでをなくす

●対象データ
例）指定の文字列X　→　"test"

ドラゴンボールtestあいうえお.txt
あああいいいtest.txt

●希望する結果
testあいうえお.txt
test.txt

377:デフォルトの名無しさん
08/11/03 21:35:30
"aaaiiitest.txt".sub(/.*?test/, "test")
"aaaiiitest.txt".slice(/test.*/)

378:デフォルトの名無しさん
08/11/03 21:40:12
ﾃﾗ早い回答ありがとうございました

379:デフォルトの名無しさん
08/11/08 09:49:48
●正規表現の使用環境
Perl v5.8.8

●検索か置換か？
検索

●説明
F1という文字列が含まれていたらヒットさせたい
ただしF1の前にFが付いている場合はヒットさせたくない

●希望する動作
"F1 ほげほげ"　→真
"FF11 ほげほげ"　→偽

[^F]F1
[^F]?F1
などと試して見ましたが失敗でした

380:デフォルトの名無しさん
08/11/08 10:11:16
自己解決
これでうまくいきました
^F1|[^F]F1

381:デフォルトの名無しさん
08/11/08 14:32:31
否定戻り読みとか使うのもいいだろう。
(?<!F)F1

382:デフォルトの名無しさん
08/11/08 14:36:05
CodeZineの記事オススメだなテンプレにいれとこうぜ

URLﾘﾝｸ(codezine.jp)
URLﾘﾝｸ(codezine.jp)

383:デフォルトの名無しさん
08/11/09 06:56:57
>>381
それは否定先読み

384:デフォルトの名無しさん
08/11/09 07:01:53
これ間違ってる？

(?<=aaa)bbb　直前にaaaがくるbbbにマッチ(先読み)。
(?<!aaa)bbb　直前にaaaがこないbbbにマッチ(否定先読み)。
aaa(?=bbb)　直後にbbbがくるaaaにマッチ(戻り読み)。
aaa(?!bbb)　直後にbbbがこないaaaにマッチ(否定戻り読み)。

385:デフォルトの名無しさん
08/11/09 07:04:38
>>383は無かったことにしてくれ

386:デフォルトの名無しさん
08/11/10 09:18:59
●正規表現の使用環境
lex
●検索か置換か？
検索？
●説明
C言語のコメントで使われるような書式の検索
/*で始まり*/で終わるような文
ただし途中で*/は出現しない
漢字コードはEUCです。
コメントが英数字だけならできそうなのですが
漢字などが入ってくるとよくわかりません。
よろしくお願いします。

387:デフォルトの名無しさん
08/11/10 10:47:44
EUCなら、漢字がバラになっても英数字とコードが重複しないから
問題ないのでは？

388:デフォルトの名無しさん
08/11/10 11:20:03
>>387
できれば正規表現を教えてもらえないでしょうか？
英数字は[a-zA-Z0-9]のようにできると思いますが
ひらがなやカタカナは[あ-んア-ン]のようにはやはりできませんよね？
文字コードで書くのでしょうか。。。。

389:デフォルトの名無しさん
08/11/10 11:21:52
>>388
この場合、正規表現にひらがなやカタカナを書く必要ないでしょう？

390:デフォルトの名無しさん
08/11/10 11:40:01
>>389
コメント/**/の中にひらがなやカタカナ、漢字、英数字がでて来ると思うのですが
必要ないのでしょうか？
例として
「/*(A|＊＊*B)*/」
Aは「*、/」以外の文字を表しBは「/」以外の文字を表す。
演算の*と混乱をさけるためアスタリスクは全角大文字にしているが
実際は半角にする。
このAとBを表したいのですが。。。。
例えば[0-9a-zA-z(漢字コード?)^/*(/と*を除く)]のようにすればいいのでしょうか？

391:デフォルトの名無しさん
08/11/10 12:15:38
後出しで条件つけるなよ・・・

392:デフォルトの名無しさん
08/11/10 13:04:37
>>390
目的は、コメント中の「＊」を「*」にすること?

393:デフォルトの名無しさん
08/11/10 13:19:29
>>391
すみません、質問の仕方が悪かったです；
>>392
いえ、「/*(A|＊＊*B)*/」の「＊」は本当は「/*(A|xx*B)*/」
とかけてC言語ではかけるの「x」は「*」で、
正規表現の0回以上繰り返す「*」とかぶってしまうため
「/*(A|***B)*/」とかかないで「/*(A|＊＊*B)*/」と書いていると思います。
何がしたいのかはlexを使って字句解析をしたいのですが
コメントの部分をスルーするための正規表現の仕方がしりたいのです。

次ページ