- 1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net]
- Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。 前スレ Regular Expression(正規表現) Part15 https://mevius.5ch.net/test/read.cgi/tech/1568640311/ 次スレは>>980宜しく 天ぷら等>>2以降
- 669 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 19:44:56.00 ID:sl+3Awil.net]
- python
- 670 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 20:33:36.29 ID:waI8rtvz.net]
- つらい
- 671 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 21:06:25.43 ID:z5E2eHg0.net]
- https://regex101.com/r/abzBX8/1
- 672 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 21:29:53.48 ID:W4QVtvW8.net]
- JavaScriptで書くかな
- 673 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 23:02:23.02 ID:HlIFmrYC.net]
- 正規表現よりも「強力な」検索方法ってどう言う事?
それチェックするだけならBASICだって出来るだろうに
- 674 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 23:14:49.47 ID:aBS+jUDM.net]
- あのさあ
>>657を見た後でそんなこと言ってるの? >>657の末尾に$をつけりゃチェックできるだろうに
- 675 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 00:49:04.02 ID:HEwUJcz7.net]
- https://regex101.com/r/abzBX8/4
- 676 名前:デフォルトの名無しさん [2023/04/18(火) 01:55:03.99 ID:0xKKyM+T.net]
- wwなんじゃこの無意味なやつww
- 677 名前:デフォルトの名無しさん [2023/04/18(火) 01:55:30.29 ID:0xKKyM+T.net]
- 全くチェックできてないやんwww
- 678 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 03:16:09.61 ID:+QStg837.net]
- 正規表現だけで頑張りすぎる奴はアホ
- 679 名前:デフォルトの名無しさん [2023/04/18(火) 10:37:46.66 ID:1M+dv0CB.net]
- > 「0」と「1」を同数含む文字列にマッチする
これが部分文字列も含むのなら最初の「0111011110001100000…」のところだけでも で01, 10とか01111000, 111000, 1100, 0011とか011101111000110000とか 他にもあるけどまあ沢山あるわな こんなんチェックして何の意味があるのか知らんけど
- 680 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 11:53:15.97 ID:mLPBXdJt.net]
- >>661のは01以外の文字が存在してるのを失念してるので、少しだけ修正
^([^01]|0[^01]*?(?1)*?1|1[^01]*?(?1)*?0)++$
- 681 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 11:55:59.03 ID:mLPBXdJt.net]
- あ、すまん
>「0」と「1」からなる文字列のうち を忘れてた
- 682 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 12:04:05.08 ID:mLPBXdJt.net]
- おまけに>>666は冗長だったしね
^([^01]|0(?1)*?1|1(?1)*?0)++$
- 683 名前:デフォルトの名無しさん [2023/04/18(火) 12:07:01.90 ID:y8YzUN5p.net]
- なぜある範囲の文字列を認識できる正規表現が重用されるのでしょうか?
たとえば、文脈自由文法により生成される文字列を認識できるような検索ソフトは ないのでしょうか?
- 684 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 12:19:50.17 ID:VZPIsbzr.net]
- 何故妙な所でわざわざ改行を入れるのでしょうか?
- 685 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 15:37:27.88 ID:DhCp7Dkf.net]
- たとえばHTMLの<title>の直後だけ判定したいときに
マッチしなかったら長いページの最後まで<title>~を探し続けるの無駄だと思うんだけど <title>のところだけ見終わったら判定打ち切ることってできる?
- 686 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 17:20:57.30 ID:WqdbOhNP.net]
- https://regex101.com/r/xvZeom/1
- 687 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 18:18:09.16 ID:DhCp7Dkf.net]
- >>672
ありがとう!
- 688 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 22:28:52.49 ID:ndERcjBg.net]
- >>669
計算量が小さいことが数学的に証明されているから 文脈自由文法は計算量が大きい
- 689 名前:デフォルトの名無しさん [2023/05/10(水) 15:31:44.13 ID:7WScgW4R.net]
- 下記の文字列でナンバリングの重複
- 690 名前:を除去するにはどうすればいいですか?
かまいたちの知らんけど #37 #37 「梅沢富美男とドライブ旅!やりたいこと詰め込んだら喜ぶ、知らんけど」 [GAORA] 2023年05月10日.ts 千鳥の相席食堂 #199 #199 藤岡弘、&藤岡真威人の旅! ’田舎出身&ロケマスター芸人’の千鳥がツッ [スカイA] 2023年05月08日.ts ナンバリングが同一かどうかを考慮しなければ下記で可能かなと思うのですが、 (#[0-9]{1,})[\S\s]*(#[0-9]{1,}) ナンバリングが同一である場合に除去するってことは可能なのでしょうか? ※「正規表現は、.NET Framework で提供される正規表現の全ての機能が使えます」ってヘルプにあります [] - [ここ壊れてます]
- 691 名前:デフォルトの名無しさん [2023/05/10(水) 15:43:18.27 ID:7WScgW4R.net]
- [\S\s]* は 改行を考慮してみただけで何でもよかったので、無視してください。
- 692 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 15:49:49.18 ID:XkmajJ+H.net]
- s/(#\d+ )\1/$1/
- 693 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 15:56:15.66 ID:yXmZBCRQ.net]
- #37 #371
- 694 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:24:45.76 ID:XkmajJ+H.net]
- >>678
なんか問題ある? まあ例は基本形であって\1というものがあるということを教えればいいだけだけどね
- 695 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:34:36.66 ID:KWVZdtYA.net]
- 誤爆しないかチェックしたかったんでしょ
そんな噛み付か無くても良かろうよ
- 696 名前:デフォルトの名無しさん [2023/05/10(水) 16:44:00.86 ID:7WScgW4R.net]
- >>677
これでいけそうです、ありがとうございます \1 の働きが 何か分からないんですが、何て言葉で検索すればいいですか?
- 697 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:01.37 ID:7WScgW4R.net]
- あ、キャプションってやつですかね。
こうなか? s/(.*)(#\d+ )\2(.*)/$1 $2 $3/
- 698 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:49.70 ID:7WScgW4R.net]
- こうかな
- 699 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:57:22.57 ID:XkmajJ+H.net]
- 前後を不定長にするとバックトラックの量が半端じゃなくなるよ
数千倍数万倍それ以上の場合数にあっという間になるので どれほど爆発的に増えるか考えてみてくれ
- 700 名前:デフォルトの名無しさん [2023/05/10(水) 17:23:53.71 ID:H/PxYykp.net]
- 正規表現はChatGPTと相性いいなぁ
すげー間違ったことも返されるけど検証もさせられるしやテストケースも生成出来て超便利
- 701 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 18:11:00.72 ID:XkmajJ+H.net]
- >>682
悪い 試したらstep数は全然増えなかったね 俺の勘違いか
- 702 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 00:59:59.60 ID:GLOCdhwM.net]
- ハゲとフサの混在からハゲを排除したい
- 703 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 09:45:41.67 ID:HWVU1A6n.net]
- replace(/ハゲ/g, 'ヅラ')
- 704 名前:デフォルトの名無しさん mailto:sage [2023/05/21(日) 18:08:25.80 ID:T9C8dxe0.net]
- \Kってどうゆうときに使うんですかね?
- 705 名前:デフォルトの名無しさん mailto:sage [2023/05/22(月) 23:09:40.07 ID:lUHZhpO8.net]
- 安心して下さい\Kはいてますよ
$& = はいてますよ
- 706 名前:デフォルトの名無しさん mailto:sage [2023/05/23(火) 15:16:49.72 ID:5w9lz5Mr.net]
- そちらにはいてますか
- 707 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 21:08:35.92 ID:HxAuQBVD.net]
- 特定の文字列が2回以上なければ削除したい
$aa=~s/hoge// if $aa!~/.+hoge.+hoge.+/; 正規表現一発で出来ませんか
- 708 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 22:49:21.84 ID:Jh5M5XKC.net]
- s/\A(?![\s\S]*(砂沙美魔法少女クラブ)[\s\S]*\1)([\s\S]*)\1([\s\S]*)\z/$2$3/
- 709 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 06:07:20.35 ID:exFpSO/0.net]
- s/(hoge.*hoge)|hoge/$1/
s/hoge.*hoge\K|hoge// s/hoge.*hoge(*SKIP)(*FAIL)|hoge// s/(hoge)(.*\1\K)?// https://regex101.com/r/qoyDnZ/1
- 710 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 10:23:23.66 ID:fg1fsMga.net]
- s/みさおちゃん(?:.*みさおちゃん(*COMMIT))?//
- 711 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 12:43:42.23 ID:yjwdVP6E.net]
- 説明不足でした
$aa=~s/.+hoge.+\n// if $aa!~/hoge.+hoge/s; これなぜにかダメです $aa=~s/(hoge.+hoge)|[^\n]+hoge[^\n]+\n/$1/s;
- 712 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 14:47:06.90 ID:6Y81pqVN.net]
- ダメなのは左のhogeより先に右の[^\n]+hogeがマッチを始めるから
左が先になるように右に合わせる
- 713 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 15:02:19.22 ID:yjwdVP6E.net]
- 初歩的でしたね、ありがとうございます
- 714 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 00:20:37.60 ID:Dm7F+2f1.net]
- 「-」の無い電話番号に「-」を入れるには?
- 715 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 07:23:21.12 ID:X455hjkS.net]
- 国際電話とかあると面戸だね
- 716 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 08:55:50.76 ID:t6+qFJ/7.net]
- >>700
携帯番号以外は不可能じゃないかな
- 717 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 18:03:07.79 ID:wXMZ1Y1H.net]
- 区切り位置が変わるから全部羅列するしかないね
それも時々更新する必要がある
- 718 名前:デフォルトの名無しさん mailto:sage [2023/06/02(金) 21:23:49.13 ID:XcfIYH3W.net]
- >>701
誰か頑張れ https://www.soumu.go.jp/main_sosiki/joho_tsusin/top/tel_number/q_and_a-2000apr.html
- 719 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 16:20:02.62 ID:p6l+hu28.net]
- 固定電話
https://regex101.com/r/f9rw3E/1
- 720 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 22:05:33.82 ID:vWJZBL5V.net]
- 愛は行動。言葉だけではダメ
- 721 名前:デフォルトの名無しさん mailto:sage [2023/06/04(日) 00:25:20.56 ID:FmV4cjgS.net]
- もう冷めました
- 722 名前:デフォルトの名無しさん mailto:sage [2023/06/16(金) 20:08:06.56 ID:BLiKvBT9.net]
- Perl v5.38.0-RC1
- 723 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 00:06:22.30 ID:7IbgNtYk.net]
- NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
japan.zdnet.com/article/35205348/ perl-5.38.0-RC1 perlre.pod metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod (鬼車) 不在機能群の入れ子 の動作テスト集 github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
- 724 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 14:54:23.24 ID:PO9vLDeK.net]
- >>708
これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は 使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、 スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを 抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。 https://pastebin.com/V1DVjsQd
- 725 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:04:09.09 ID:PO9vLDeK.net]
- 訂正。>709で貼ったコードは正しく動作するががコメントに(ここに貼った際に試行錯誤した
せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。 https://pastebin.com/RQ5uj62f
- 726 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:53:25.97 ID:uv5oAAX5.net]
- >>709
URLの「正しい」ってなんですか https://en.wikipedia.org/wiki/URL#Syntax https://datatracker.ietf.org/doc/html/rfc3986#appendix-A
- 727 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:12:09.00 ID:uv5oAAX5.net]
- 「正規表現を用いた文字列抽出の例」図は「誤った正規表現」の例なんじゃないかなあ
例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう
- 728 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:13:51.73 ID:PO9vLDeK.net]
- >>711
あなたが示している[1]のsyntax diagram(構文図)[2
- 729 名前:]にあるように、? はqueryを示す文字で
path( / )以前のドメイン名部分には出てこず、最低限 / の後でなければならないはず。 [1] https://en.wikipedia.org/wiki/URL [2] https://upload.wikimedia.org/wikipedia/commons/thumb/d/d6/URI_syntax_diagram.svg/1280px-URI_syntax_diagram.svg.png [] - [ここ壊れてます]
- 730 名前:デフォルトの名無しさん mailto:sage [2023/06/19(月) 17:12:20.20 ID:a4eWUm7x.net]
- >色んな意味でおかしい
同意。本当にこの例をNTTの技術者が作ったの?と思ってしまった。 広報担当の事務員が頑張って作った例だと言われたら納得出来るw
- 731 名前:デフォルトの名無しさん mailto:sage [2023/06/20(火) 13:11:10.13 ID:AvErps2d.net]
- これは、>>712の人も言ってるように「悪い見本」か、あるいは「プレスリリース用にめっちゃ簡略化した例」のどちらかかと思う
個人的には悪い見本の方かと思う 「?」と「ID」の間のスペースとか気持ち悪いし
- 732 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 01:04:22.29 ID:LPKmcd4s.net]
- メールアドレスは誤ったアドレスを発行して運用してるところがあると対応せにゃ仕方ないけど
URLは誰もアクセスできないだけで終わるんだろうな
- 733 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:01:06.48 ID:FL3bkV8O.net]
- 質問
ある文字列の中に、4桁の数字が出た場合、文字列を区切るという目的で正規表現を使いたいです let hoge="...."; hoge.split(/\d{4}/) しかし上記の正規表現だと、例えば6桁の数字でも区切ってしまうため、これを4桁に限定するためにはどうしたらよいでしょうか?
- 734 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:36:29.87 ID:HRXsYHZK.net]
- (?<!\d)\d{4}(?!\d)
- 735 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 06:20:04.42 ID:FL3bkV8O.net]
- ありがとうございます
- 736 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:00:29.04 ID:8S43aXN3.net]
- 修正前 .*(..)?
修正後 .*?(.[^z])? "abcd"を与えて受理される文字列 修正前 "" 修正後 "ab" 受理してもらいたかった文字列 "cd" URLからIDを取り出すほうは画像に入るようにデフォルメする必要があるから おかしいURLになるのはやむを得ないと思う > (?:[&].*)? ただこれはちょっと気持ち悪い これがあっても無くても結果は変わらないから付ける必要なかった 正規表現に詳しい人が"&"を単体で文字クラスに入れることはあまりない(たまにはいる) 新技術のアプリを実際に試させてくれないかな? 提供してもらえれば無償でテストするよ
- 737 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:17:00.34 ID:Z+I+bAqU.net]
- 「abczは拒否」→「なるほど末尾zは拒否だな」
えー…
- 738 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:38:48.98 ID:SbeXWTV7.net]
- 書いてないけど前提として完全一致のつもりだったんだろうな
- 739 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 10:41:38.55 ID:8S43aXN3.net]
- jsって完全一致が前提になるオプションってある?
それがあったとしても .*?(.[^z])? はAutoだが
- 740 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 11:16:26.32 ID:ld9dVlA3.net]
- >>723
シングルラインモード(dotAll)で ^ と $ を使えば良いだけでは?
- 741 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 12:14:35.15 ID:8S43aXN3.net]
- ^と$を使うつもりなら画像の中でも使うと思う
見やすくするために省いてるだけなのかな? そうだとしても .*?(.[^z])? はAutoだが
- 742 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 22:34:06.87 ID:g2ig9yOY.net]
- ニュー速(嫌儲)で、近頃半角記号を6文字だけとかの書き込みがあります
なんとかNGを作りたいのですがうまく行きません 行頭から記号だけの文字列で4~8文字、って想定でこんなの作ってみたんですが、httpで始まるurlも引っかけてしまいます ^[ -/:-@\[-~]{4,8} 例えばこんなスレなんですが https://greta.5ch.net/test/read.cgi/poverty/1687352512/ 詳しい方、正規表現作ってもらえないでしょうか?
- 743 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:30:57.52 ID:nJDgsm3N.net]
- そういうのは専ブラのNGスレでやるべきだね、ユーザー同士で情報共有にもなるから
正規表現を適用する対象がHTMLでなくdatだったりでユーザーでないと作れない場合もある 記号だけにマッチさせたいなら[!-/:-@\[-`{-~]だが、この前後に付ける正規表現は お使いの専ブラスレで聞いてくれ
- 744 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:42:44.65 ID:TTIYA8nl.net]
- そこみる限りでは3パターンしかなくない?
何かしらの絵文字とかが化けて出てるだけとか。 (\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)
- 745 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:08:56.55 ID:L6AKAbfA.net]
- 726です
726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました 727さんのに変えたら誤動作無く動作しました ^[!-/:-@\[-`{-~]{5,11} ちなみに、android板に以下のスレを発見しました しかし、荒らされてて機能して無さそう 他にこっちの方が良いよ、っておすすめのスレはありますかね? オススメのNGワード https://egg.5ch.net/test/read.cgi/android/1576334383/
- 746 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:55:55.92 ID:nJDgsm3N.net]
- こちらはそちらが何を使ってるかも分からないので勧めようが無い件
問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う 今のままでは12文字以上記号が続いててもNGになっちゃうね
- 747 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 13:11:08.52 ID:L6AKAbfA.net]
- >>730
chmateなんです その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました ^[!-/:-@\[-`{-~]{2,11}$ ここがひどいです https://greta.5ch.net/test/read.cgi/poverty/1687400738/
- 748 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:46:12.28 ID:vRMLRvgd.net]
- 方言がひどい記述だけど(PCRE2とbregonig.dllでは大丈夫)
^ ?(((?!&gt;?|&lt;?)[[:punct:]])+|&gt;?|&lt;?){2,} ?$
- 749 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:53:40.61 ID:vRMLRvgd.net]
- >>732
はdatに対してのものだから、mateはどうなのかは知らん POSIX文字クラスが通っても、>とか行頭行末の半角スペースとか無さそうだね
- 750 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 23:53:09.33 ID:nJDgsm3N.net]
- GJ
[[:punct:]] これいいね、覚えとこ (()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから ++や(?>)を使ったほうがいいかも 正規表現エンジンの内部でも対策はしてると思うけど念のために
- 751 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 01:33:06.45 ID:gmkpJif8.net]
- >>734
+が入ってるのはダメじゃん 除いてくれ 作ってる途中で紛れ込んだものだね なおbregonig.dllだと ^ ?(?:\p{punct}|&gt;?|&lt;?){4,} ?$ ^ ?(?:[[:punct:]]|&gt;?|&lt;?){4,} ?$ でもいけちゃうんだよな ちょっと不思議
- 752 名前:デフォルトの名無しさん [2023/06/23(金) 02:02:21.28 ID:qwakAXsj.net]
- and検索みたいなのってできない?
今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい
- 753 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 02:09:08.88 ID:gmkpJif8.net]
- >>736
^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)
- 754 名前:デフォルトの名無しさん [2023/06/23(金) 02:35:28.92 ID:qwakAXsj.net]
- >>737
感謝
- 755 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 12:02:08.17 ID:2Ntzjt3B.net]
- [文章]
AAAaiueo111 xxx aaaaa AAAkakikukeko xxx b b b AAAsasisuseso ccccc AAAtatituteto000 ddd123 上記の文章で先頭がAAAの行だけ抜き出して、さらに
- 756 名前:AAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。
使用するのはサクラエディタの置換機能で、 置換前 AAA(.*)\r |.*\r\n 置換後 $1 で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。 [] - [ここ壊れてます]
- 757 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:06:42.48 ID:gnUd2/2c.net]
- AAAで始まらない1行|先頭のAAA|末尾のxxx
- 758 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:54:57.82 ID:WBrlaKRC.net]
- ^AAA|xxx$|^.*\r\n → 削除
- 759 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 15:20:23.65 ID:2Ntzjt3B.net]
- >>740
>>741 ありがとうございます。
- 760 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 19:05:48.89 ID:zWmLGOhD.net]
- ^AAA([^\r\n]*?)(?:xxx)?$|^[^\r\n]*(?:\r\n|[\r\n])?
$1 アク菌で書けませんぞテスト
- 761 名前:734 mailto:sage [2023/06/23(金) 19:21:25.94 ID:zWmLGOhD.net]
- >>735
PCRE2では\p{Punct}は存在しないんだね www.pcre.org/current/doc/html/pcre2syntax.html [\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ > + 言われてみれば+があるのはおかしいw 忘れ物だったのかw
- 762 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 21:34:05.58 ID:gmkpJif8.net]
- >>744
不思議な点は PCRE2だと、[[:punct:]]で&が先にキャッチされて&gt;のgt;が取り残されてしまうので |&gt;とあってもマッチしなくなる bregonig.dllだと &gt;にキャッチされてマッチする(punctより&gt;が優先される (PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?) これはorの記述の順序には関係なく左に(先に)&gt;を書いても結果は同じ
- 763 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:07:00.56 ID:zWmLGOhD.net]
- ここのテストサイトで regex101.com/
^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど 本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない? それで>>732に要らないはずの先読みを入れてたんだね これがマッチしないならバグかも知れない もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから
- 764 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:09:21.21 ID:zWmLGOhD.net]
- あ、&が化けちゃった
^([[:punct:]]|>|<)$ を > にマッチさせて
- 765 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:31:35.63 ID:gmkpJif8.net]
- >>746
今確認したらそのとおりだった 俺は以前一体何をやったんだろう?
- 766 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:36:28.09 ID:gmkpJif8.net]
- 今考え付くのは
^(?>[[:punct:]]|&gt;)+ とか &gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?
- 767 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:47:37.55 ID:gmkpJif8.net]
- さすがに(?>)を使って気づかないわけないから(使った覚えもないし)
恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする
- 768 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 23:16:11.04 ID:zWmLGOhD.net]
- そういうこと俺もあるから分かるわーw
頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事 間違えた原因は分からないけどとりあえずゆっくり休んでくれw
- 769 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:27:07.24 ID:X4q59utv.net]
- 勘違いした理由が分かった
^([[:punct:]]|&gt;)+ これをやると&で切れちゃうんだ s/([[:punct:]]|&gt;)+//g をやるとgtが置換されずに残る 末尾に$とか目標物を付ければ切れないんだが さてどうして切れるのか誰か教えて
|

|