- 1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net]
- Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。 前スレ Regular Expression(正規表現) Part15 https://mevius.5ch.net/test/read.cgi/tech/1568640311/ 次スレは>>980宜しく 天ぷら等>>2以降
- 930 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:59:27.53 ID:dhg2pdyL.net]
- どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
- 931 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 18:36:44.19 ID:X00tNW2d.net]
- 今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな アルファベットが32文字だったら隙間出来なかったのに SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
- 932 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 21:57:53.63 ID:27STA2Pg.net]
- 正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる
- 933 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 09:19:33.19 ID:DBguvWIQ.net]
- . が改行にマッチしないのを失念してってのは何度もやってる
- 934 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:27.61 ID:ikHnu6pN.net]
- ●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0) ●検索か置換か? 検索 ●説明 キムラタクヤの略称を検索するために (キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました ^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$ 文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください ●マッチする文字列 キク キラク ムラタヤ ●マッチさせない文字列 キム キムラ タクヤ
- 935 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:37.53 ID:ikHnu6pN.net]
- ●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0) ●検索か置換か? 検索 ●説明 キムラタクヤの略称を検索するために (キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました ^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$ 文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください ●マッチする文字列 キク キラク ムラタヤ ●マッチさせない文字列 キム キムラ タクヤ
- 936 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 12:08:10.81 ID:oh2mJ3WA.net]
- ^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
- 937 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 14:40:34.08 ID:DBguvWIQ.net]
- 同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです
- 938 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 16:00:59.53 ID:G1jsC9Xy.net]
- じつはその人AIだよ
- 939 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:01:21.99 ID:ikHnu6pN.net]
- >>917
ありがとうございます動きました 3語以上の場合はこれでできてますか? ^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
- 940 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:03:51.95 ID:DBguvWIQ.net]
- AIと言われても違和感が無いから困る、人間だったほうがいい
サクラエディタを少し触ってみたが \r を \c- \n を \c* に書き換えてもマッチした このことは恐らくbregoing.dllの作者氏でも知らないのでは
- 941 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 18:26:59.70 ID:upaRAmPk.net]
- >>920
キムクヤにマッチするから駄目だね >>916のように自分で組み合わせを展開する以外の方法はわからないね
- 942 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 21:03:12.97 ID:bvA/YDb8.net]
- 最後で語数チェックすれば?
(?<=\S{3})$
- 943 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 22:35:57.76 ID:8ROMQdip.net]
- ^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)
^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3) ^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$ ^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
- 944 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 08:03:41.39 ID:ztJD977Y.net]
- 文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました
- 945 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 09:18:56.98 ID:/CeYlFrx.net]
- > $(?!\1|\2)
これもすごい、こんなの思い付かない 私なら(?(1))を使おうとしてグチャる こういうのを作れる人になりたかった、羨ましい限りだ
- 946 名前:デフォルトの名無しさん [2023/11/02(木) 09:22:55.91 ID:kxWwWLf8.net]
- >>910
アルファベットが32文字だったら誰も困らなかったはず
- 947 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 11:56:22.72 ID:YMFW9tw8.net]
- 各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
- 948 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 13:01:27.99 ID:eLjTHeK1.net]
- ^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
- 949 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 19:36:53.03 ID:/CeYlFrx.net]
- ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
- 950 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 08:34:37.96 ID:cY7DSC5H.net]
- ^[キムラ]{1,2}[タクヤ]{1,2}$
- 951 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 09:08:43.70 ID:PqFUo1lf.net]
- それはラキクタにマッチするからボツ(==.)
- 952 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 10:43:13.94 ID:cY7DSC5H.net]
- ラキクタにマッチしたらダメって条件にはないんだけど‥
- 953 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:44:22.65 ID:PqFUo1lf.net]
- 確かに言葉ではそんな条件は書いてないね、曖昧3cm
- 954 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:50:18.95 ID:zxzLPr4V.net]
- ^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
- 955 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:14:21.11 ID:sAJhyk0D.net]
- ^(?=A)(?=B).*$
- 956 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:18:03.55 ID:PqFUo1lf.net]
- >>916を読めば文字順通りと受け取るのが妥当だね
ちなみにもしこのコマンドがあったら簡単に書けた https://www.proxomitron.info/45/help/Matching-Commands.html#TST ^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$ perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理 dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう // \1 に日本語表記での色が代入される blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
- 957 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 13:00:30.59 ID:RnAsJxc7.net]
- >>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$ (?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3) キキムタククク
- 958 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 18:04:12.94 ID:328LomOy.net]
- キムラタクヤ人気で🌿
- 959 名前:デフォルトの名無しさん [2023/11/03(金) 19:14:55.49 ID:3J2AA+3k.net]
- >>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
- 960 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:09:52.31 ID:PqFUo1lf.net]
- 知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ
- 961 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:13:40.11 ID:/gQFYHMn.net]
- 「課す」を「はたす」って読んでるってマ?🤣
- 962 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:12:42.60 ID:PqFUo1lf.net]
- この外部コマンドを考えた方は2004年に亡くなっている
https://en.wikipedia.org/wiki/Scott_R._Lemmon 20年前にこのコマンドを実装済みだったのはやばいな perlの正規表現ですらそんなに機能が無かった時代だ
- 963 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:17:14.08 ID:N1OKG/2k.net]
- 最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
- 964 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 08:36:40.13 ID:w1sIftMp.net]
- (正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
- 965 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 11:16:01.85 ID:PZuBSK2Q.net]
- カラクリを簡単に説明しよう
1、 (?:キ?ム?ラ?) で文字順を固定 2、 その他の部分でカッコ内でマッチする文字数の制限をかけている 例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう \1が捕獲した中身は0文字に
- 966 名前:なる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる (?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない 結果的にこれが文字数制限になっている ちなみに正規表現にカウント機能があればもっと簡単に書けていた ( (?:キ$COUNT(x))? (?:ム$COUNT(x))? (?:ラ$COUNT(x))? ) $COUNT(0<x) perlは(?{code})でカウント可能、鬼車もカウント機能を実装済 [] - [ここ壊れてます]
- 967 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 14:47:51.87 ID:Xn6+uSVd.net]
- perlジジイこのスレでも自演してんのかw
- 968 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 17:37:08.01 ID:PZuBSK2Q.net]
- COBOLジジイからperlジジイにランクアップ
- 969 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:03:00.89 ID:q8heJbgz.net]
- サクラエディタ
// 1 \1(a) // 2 \k<name>(?<name>a) 2は1を名前付き括弧にしただけ 1は実行してもマッチに失敗するだけだが2はエラー これはどちらもエラーになるほうが良い
- 970 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:07:33.08 ID:q8heJbgz.net]
- ん?本当にそうか?分からん
- 971 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 15:52:16.56 ID:q8heJbgz.net]
- 2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
- 972 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 06:59:13.82 ID:j6L5l5bH.net]
- 異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから 本来動くべきサンプルを貼って>>949の件は終了とする x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK x2("(?:\\1b|(a))+", "aab", 0, 3); // OK x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
- 973 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 19:00:47.89 ID:j6L5l5bH.net]
- 回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
- 974 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 17:50:43.57 ID:Karf8A+O.net]
- 文字列の頭に部分一致するパターンなんですが・・・
「abcdefg」にマッチするパターンですが、 /^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/ と書くしかないですか? 文字列が長大な場合、ちょっと無理なんですが・・・ (文字はアルファベットとは限らず) WindowsのJScriptですが。
- 975 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:12:27.94 ID:ctqB5947.net]
- /^abcdefg/
- 976 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:41:54.66 ID:/mJ+eeiZ.net]
- 無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a) とどっちがマシかな
- 977 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:47:23.08 ID:7i/8qZTv.net]
- /^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない どう書けばいいですか
- 978 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:53:22.83 ID:4tHpE5Jq.net]
- >>957
否定先読みが使えるなら^m(?!ap)かな?
- 979 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 15:59:06.48 ID:7i/8qZTv.net]
- ありがとう
- 980 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 04:25:56.84 ID:gwXFy+9L.net]
- 特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?
- 981 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 06:13:31.18 ID:28WV0iMa.net]
- \Eが来ると困る
- 982 名前:デフォルトの名無しさん [2023/11/28(火) 12:33:08.74 ID:vIU65Zk5.net]
- 正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか? $ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"' [abc][] なんで後ろにカッコが来るん? .*に全部マッチするんだから 二個目の[]が来るなんてお菓子にゃん?
- 983 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:42:04.64 ID:EkqG9ePT.net]
- perlよく知らんがgとったら消える
- 984 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:54:45.94 ID:uy7CvN4q.net]
- 推測だが、
1) .*にabcがマッチする -> [abc] 2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
- 985 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 14:25:52.10 ID:uy7CvN4q.net]
- 2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?
- 986 名前:デフォルトの名無しさん [2023/11/28(火) 16:18:10.81 ID:vIU65Zk5.net]
- >>963
gとったら消える。Rubyも同じらしい。 >>964 []が出るってことはなにかにマッチしてるってことでしょ? >>965 それなら最初の.*にもマッチするじゃん? 一回目にマッチしなくて、二回目にマッチする理由がわからんのよ
- 987 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:18:30.67 ID:JJPCdnVt.net]
- 仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ
- 988 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:20:34.59 ID:JJPCdnVt.net]
- でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
- 989 名前:デフォルトの名無しさん [2023/11/28(火) 16:21:19.02 ID:vIU65Zk5.net]
- $ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][] $ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"' [abc][] 後ろに$入れても同じ 行末以降の何にマッチしてんのこれ?
- 990 名前:デフォルトの名無しさん [2023/11/28(火) 16:22:48.63 ID:vIU65Zk5.net]
- Rubyのコードも持ってきた。持ってきただけだから意味は知らん。
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }' [abc] ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }' [abc][]
- 991 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:44:51.01 ID:wVUnEJO+.net]
- ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
- 992 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:47:59.11 ID:uy7CvN4q.net]
- >>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは どの正規表現環境でも同じだと思うよ
- 993 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:49:01.41 ID:CppHkuHl.net]
- 0文字と一致させたくなければ.*ではなく.+と書けよ
- 994 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:59:51.73 ID:fB6/42vV.net]
- >>972
Perlの文字列はNull Terminatedされてないよ /gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ 個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね regex101で試すとRustだけが一般に期待する動作をしてる
- 995 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 17:02:27.57 ID:fB6/42vV.net]
- /(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
- 996 名前:デフォルトの名無しさん [2023/11/28(火) 17:09:04.46 ID:vIU65Zk5.net]
- >>971
探したけど見つからんかった。 どこにあった? or どうやって探した? キーワードがわからん
- 997 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:08:10.66 ID:waKUlTL5.net]
- これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
- 998 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:30:16.15 ID:mMoqXMUf.net]
- (ハクション!
- 999 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 19:16:57.98 ID:6l9rHssS.net]
- 単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
- 1000 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 13:08:47.77 ID:yvH2v9xT.net]
- 正規表現検索は失敗しないかぎり終わらないって話では
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅 残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される 残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
- 1001 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 14:41:21.44 ID:lw8jVmFR.net]
- そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや しかしこういうことに疑問を持つ人は今後伸びるで
- 1002 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 17:53:32.44 ID:AoutXZD6.net]
- >>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき 1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
- 1003 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:01:27.70 ID:lw8jVmFR.net]
- 確かにその通りやな、1度目で消費しきっとるはずや
- 1004 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:06:42.76 ID:lw8jVmFR.net]
- 分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
- 1005 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 20:04:08.42 ID:x7bR/xfi.net]
- /(.*)$(.*)$((.*)$){999}/
- 1006 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 22:25:25.39 ID:yvH2v9xT.net]
- >>985
えーと、つまり ・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能 ・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない てことかな? 2回目以降が発生するかどうかは、、どうなんだろう 前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
- 1007 名前:デフォルトの名無しさん [2023/12/01(金) 02:37:28.94 ID:07OBAnmr.net]
- sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは? $ printf 'abc' | sed 's/\(.*\)/[\1]/g' [abc] $ printf 'abc' | sed -E 's/(.*)/[\1]/g' [abc]
- 1008 名前:デフォルトの名無しさん mailto:sage [2023/12/01(金) 08:09:57.11 ID:RWimeGTM.net]
- /^\w+|$/[$&]/
これが[abc][]になるのはおかしいと感じないよね? 前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
- 1009 名前:デフォルトの名無しさん mailto:sage [2023/12/02(土) 00:36:44.31 ID:/f7jnFb0.net]
- 挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace ・1回目のマッチが "abc" すべてを消費する ・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する ただし空文字にマッチした場合、先へ進まなくなることを回避するために 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下) これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
- 1010 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:24:41.69 ID:Ug9Hn2aN.net]
- KEEPのKはあるのにPが無い、何故?
- 1011 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:31:35.71 ID:Ug9Hn2aN.net]
- (?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
- 1012 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 09:57:52.47 ID:8JqB6SG/.net]
- >>988
思うよ +の後に$を置けば余計にそう思う
- 1013 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 13:04:54.79 ID:t3u5G9tC.net]
- $は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
- 1014 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 14:15:57.63 ID:ayXeZXuA.net]
- 実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
- 1015 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:43:26.80 ID:e6Tz3fj/.net]
- .*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる $ printf 'abc' | sed -E 's/.*|$/[&]/g' [abc]
- 1016 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:44:52.66 ID:e6Tz3fj/.net]
- s/バク/バグ/
- 1017 名前:デフォルトの名無しさん mailto:sage [2023/12/13(水) 11:48:29.08 ID:wzNHEkEB.net]
- ただの仕様だよ、あほらし
次スレよろ
- 1018 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:00:59.04 ID:KMxF6SWS.net]
- 次スレ
https://mevius.5ch.net/test/read.cgi/tech/1702684760/
- 1019 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:36:31.90 ID:pgUnJUCg.net]
- 天地無用
- 1020 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 10:49:04.16 ID:faoSWywL.net]
- >>998
ほめてつかわす
- 1021 名前:1001 [Over 1000 Thread.net]
- このスレッドは1000を超えました。
新しいスレッドを立ててください。 life time: 772日 14時間 59分 3秒
- 1022 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|

|