[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 02/20 03:08 / Filesize : 262 KB / Number-of Response : 1023
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Regular Expression(正規表現) Part16



1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net]
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降

973 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 19:00:47.89 ID:j6L5l5bH.net]
回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK

974 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 17:50:43.57 ID:Karf8A+O.net]
文字列の頭に部分一致するパターンなんですが・・・

「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。

975 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:12:27.94 ID:ctqB5947.net]
/^abcdefg/

976 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:41:54.66 ID:/mJ+eeiZ.net]
無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな

977 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:47:23.08 ID:7i/8qZTv.net]
/^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか

978 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:53:22.83 ID:4tHpE5Jq.net]
>>957
否定先読みが使えるなら^m(?!ap)かな?

979 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 15:59:06.48 ID:7i/8qZTv.net]
ありがとう

980 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 04:25:56.84 ID:gwXFy+9L.net]
特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?

981 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 06:13:31.18 ID:28WV0iMa.net]
\Eが来ると困る



982 名前:デフォルトの名無しさん [2023/11/28(火) 12:33:08.74 ID:vIU65Zk5.net]
正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?

$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]


なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?

983 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:42:04.64 ID:EkqG9ePT.net]
perlよく知らんがgとったら消える

984 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:54:45.94 ID:uy7CvN4q.net]
推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []

985 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 14:25:52.10 ID:uy7CvN4q.net]
2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?

986 名前:デフォルトの名無しさん [2023/11/28(火) 16:18:10.81 ID:vIU65Zk5.net]
>>963
gとったら消える。Rubyも同じらしい。

>>964
[]が出るってことはなにかにマッチしてるってことでしょ?

>>965
それなら最初の.*にもマッチするじゃん?
一回目にマッチしなくて、二回目にマッチする理由がわからんのよ

987 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:18:30.67 ID:JJPCdnVt.net]
仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ

988 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:20:34.59 ID:JJPCdnVt.net]
でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ

989 名前:デフォルトの名無しさん [2023/11/28(火) 16:21:19.02 ID:vIU65Zk5.net]
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]

$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]

後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?

990 名前:デフォルトの名無しさん [2023/11/28(火) 16:22:48.63 ID:vIU65Zk5.net]
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。

ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]

ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]

991 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:44:51.01 ID:wVUnEJO+.net]
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ



992 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:47:59.11 ID:uy7CvN4q.net]
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ

993 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:49:01.41 ID:CppHkuHl.net]
0文字と一致させたくなければ.*ではなく.+と書けよ

994 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:59:51.73 ID:fB6/42vV.net]
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ

個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる

995 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 17:02:27.57 ID:fB6/42vV.net]
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど

996 名前:デフォルトの名無しさん [2023/11/28(火) 17:09:04.46 ID:vIU65Zk5.net]
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん

997 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:08:10.66 ID:waKUlTL5.net]
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね

998 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:30:16.15 ID:mMoqXMUf.net]
(ハクション!

999 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 19:16:57.98 ID:6l9rHssS.net]
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん

1000 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 13:08:47.77 ID:yvH2v9xT.net]
正規表現検索は失敗しないかぎり終わらないって話では

abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了

1001 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 14:41:21.44 ID:lw8jVmFR.net]
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで



1002 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 17:53:32.44 ID:AoutXZD6.net]
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき

1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから

1003 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:01:27.70 ID:lw8jVmFR.net]
確かにその通りやな、1度目で消費しきっとるはずや

1004 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:06:42.76 ID:lw8jVmFR.net]
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ

1005 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 20:04:08.42 ID:x7bR/xfi.net]
/(.*)$(.*)$((.*)$){999}/

1006 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 22:25:25.39 ID:yvH2v9xT.net]
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?

2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど

1007 名前:デフォルトの名無しさん [2023/12/01(金) 02:37:28.94 ID:07OBAnmr.net]
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?

$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]

$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]

1008 名前:デフォルトの名無しさん mailto:sage [2023/12/01(金) 08:09:57.11 ID:RWimeGTM.net]
/^\w+|$/[$&]/

これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?

1009 名前:デフォルトの名無しさん mailto:sage [2023/12/02(土) 00:36:44.31 ID:/f7jnFb0.net]
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace

・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
 ただし空文字にマッチした場合、先へ進まなくなることを回避するために
 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
 これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる

1010 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:24:41.69 ID:Ug9Hn2aN.net]
KEEPのKはあるのにPが無い、何故?

1011 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:31:35.71 ID:Ug9Hn2aN.net]
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い



1012 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 09:57:52.47 ID:8JqB6SG/.net]
>>988
思うよ
+の後に$を置けば余計にそう思う

1013 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 13:04:54.79 ID:t3u5G9tC.net]
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない

1014 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 14:15:57.63 ID:ayXeZXuA.net]
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?

1015 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:43:26.80 ID:e6Tz3fj/.net]
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる

$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]

1016 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:44:52.66 ID:e6Tz3fj/.net]
s/バク/バグ/

1017 名前:デフォルトの名無しさん mailto:sage [2023/12/13(水) 11:48:29.08 ID:wzNHEkEB.net]
ただの仕様だよ、あほらし

次スレよろ

1018 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:00:59.04 ID:KMxF6SWS.net]
次スレ
https://mevius.5ch.net/test/read.cgi/tech/1702684760/

1019 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:36:31.90 ID:pgUnJUCg.net]
天地無用

1020 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 10:49:04.16 ID:faoSWywL.net]
>>998
ほめてつかわす

1021 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒



1022 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<262KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef