1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net] Regular Expressionスレです。 質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。 前スレ Regular Expression(正規表現) Part15 https://mevius.5ch.net/test/read.cgi/tech/1568640311/ 次スレは>>980 宜しく 天ぷら等>>2 以降
696 名前:デフォルトの名無しさん [2023/05/10(水) 16:44:00.86 ID:7WScgW4R.net] >>677 これでいけそうです、ありがとうございます \1 の働きが 何か分からないんですが、何て言葉で検索すればいいですか?
697 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:01.37 ID:7WScgW4R.net] あ、キャプションってやつですかね。 こうなか? s/(.*)(#\d+ )\2(.*)/$1 $2 $3/
698 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:49.70 ID:7WScgW4R.net] こうかな
699 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:57:22.57 ID:XkmajJ+H.net] 前後を不定長にするとバックトラックの量が半端じゃなくなるよ 数千倍数万倍それ以上の場合数にあっという間になるので どれほど爆発的に増えるか考えてみてくれ
700 名前:デフォルトの名無しさん [2023/05/10(水) 17:23:53.71 ID:H/PxYykp.net] 正規表現はChatGPTと相性いいなぁ すげー間違ったことも返されるけど検証もさせられるしやテストケースも生成出来て超便利
701 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 18:11:00.72 ID:XkmajJ+H.net] >>682 悪い 試したらstep数は全然増えなかったね 俺の勘違いか
702 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 00:59:59.60 ID:GLOCdhwM.net] ハゲとフサの混在からハゲを排除したい
703 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 09:45:41.67 ID:HWVU1A6n.net] replace(/ハゲ/g, 'ヅラ')
704 名前:デフォルトの名無しさん mailto:sage [2023/05/21(日) 18:08:25.80 ID:T9C8dxe0.net] \Kってどうゆうときに使うんですかね?
705 名前:デフォルトの名無しさん mailto:sage [2023/05/22(月) 23:09:40.07 ID:lUHZhpO8.net] 安心して下さい\Kはいてますよ $& = はいてますよ
706 名前:デフォルトの名無しさん mailto:sage [2023/05/23(火) 15:16:49.72 ID:5w9lz5Mr.net] そちらにはいてますか
707 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 21:08:35.92 ID:HxAuQBVD.net] 特定の文字列が2回以上なければ削除したい $aa=~s/hoge// if $aa!~/.+hoge.+hoge.+/; 正規表現一発で出来ませんか
708 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 22:49:21.84 ID:Jh5M5XKC.net] s/\A(?![\s\S]*(砂沙美魔法少女クラブ)[\s\S]*\1)([\s\S]*)\1([\s\S]*)\z/$2$3/
709 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 06:07:20.35 ID:exFpSO/0.net] s/(hoge.*hoge)|hoge/$1/ s/hoge.*hoge\K|hoge// s/hoge.*hoge(*SKIP)(*FAIL)|hoge// s/(hoge)(.*\1\K)?// https://regex101.com/r/qoyDnZ/1
710 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 10:23:23.66 ID:fg1fsMga.net] s/みさおちゃん(?:.*みさおちゃん(*COMMIT))?//
711 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 12:43:42.23 ID:yjwdVP6E.net] 説明不足でした $aa=~s/.+hoge.+\n// if $aa!~/hoge.+hoge/s; これなぜにかダメです $aa=~s/(hoge.+hoge)|[^\n]+hoge[^\n]+\n/$1/s;
712 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 14:47:06.90 ID:6Y81pqVN.net] ダメなのは左のhogeより先に右の[^\n]+hogeがマッチを始めるから 左が先になるように右に合わせる
713 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 15:02:19.22 ID:yjwdVP6E.net] 初歩的でしたね、ありがとうございます
714 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 00:20:37.60 ID:Dm7F+2f1.net] 「-」の無い電話番号に「-」を入れるには?
715 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 07:23:21.12 ID:X455hjkS.net] 国際電話とかあると面戸だね
716 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 08:55:50.76 ID:t6+qFJ/7.net] >>700 携帯番号以外は不可能じゃないかな
717 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 18:03:07.79 ID:wXMZ1Y1H.net] 区切り位置が変わるから全部羅列するしかないね それも時々更新する必要がある
718 名前:デフォルトの名無しさん mailto:sage [2023/06/02(金) 21:23:49.13 ID:XcfIYH3W.net] >>701 誰か頑張れ https://www.soumu.go.jp/main_sosiki/joho_tsusin/top/tel_number/q_and_a-2000apr.html
719 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 16:20:02.62 ID:p6l+hu28.net] 固定電話 https://regex101.com/r/f9rw3E/1
720 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 22:05:33.82 ID:vWJZBL5V.net] 愛は行動。言葉だけではダメ
721 名前:デフォルトの名無しさん mailto:sage [2023/06/04(日) 00:25:20.56 ID:FmV4cjgS.net] もう冷めました
722 名前:デフォルトの名無しさん mailto:sage [2023/06/16(金) 20:08:06.56 ID:BLiKvBT9.net] Perl v5.38.0-RC1
723 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 00:06:22.30 ID:7IbgNtYk.net] NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表 japan.zdnet.com/article/35205348/ perl-5.38.0-RC1 perlre.pod metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod (鬼車) 不在機能群の入れ子 の動作テスト集 github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
724 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 14:54:23.24 ID:PO9vLDeK.net] >>708 これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は 使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、 スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを 抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。 https://pastebin.com/V1DVjsQd
725 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:04:09.09 ID:PO9vLDeK.net] 訂正。>709で貼ったコードは正しく動作するががコメントに(ここに貼った際に試行錯誤した せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。 https://pastebin.com/RQ5uj62f
726 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:53:25.97 ID:uv5oAAX5.net] >>709 URLの「正しい」ってなんですか https://en.wikipedia.org/wiki/URL#Syntax https://datatracker.ietf.org/doc/html/rfc3986#appendix-A
727 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:12:09.00 ID:uv5oAAX5.net] 「正規表現を用いた文字列抽出の例」図は「誤った正規表現」の例なんじゃないかなあ 例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう
728 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:13:51.73 ID:PO9vLDeK.net] >>711 あなたが示している[1]のsyntax diagram(構文図)[2
729 名前:]にあるように、? はqueryを示す文字で path( / )以前のドメイン名部分には出てこず、最低限 / の後でなければならないはず。 [1] https://en.wikipedia.org/wiki/URL [2] https://upload.wikimedia.org/wikipedia/commons/thumb/d/d6/URI_syntax_diagram.svg/1280px-URI_syntax_diagram.svg.png [] [ここ壊れてます]
730 名前:デフォルトの名無しさん mailto:sage [2023/06/19(月) 17:12:20.20 ID:a4eWUm7x.net] >色んな意味でおかしい 同意。本当にこの例をNTTの技術者が作ったの?と思ってしまった。 広報担当の事務員が頑張って作った例だと言われたら納得出来るw
731 名前:デフォルトの名無しさん mailto:sage [2023/06/20(火) 13:11:10.13 ID:AvErps2d.net] これは、>>712 の人も言ってるように「悪い見本」か、あるいは「プレスリリース用にめっちゃ簡略化した例」のどちらかかと思う 個人的には悪い見本の方かと思う 「?」と「ID」の間のスペースとか気持ち悪いし
732 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 01:04:22.29 ID:LPKmcd4s.net] メールアドレスは誤ったアドレスを発行して運用してるところがあると対応せにゃ仕方ないけど URLは誰もアクセスできないだけで終わるんだろうな
733 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:01:06.48 ID:FL3bkV8O.net] 質問 ある文字列の中に、4桁の数字が出た場合、文字列を区切るという目的で正規表現を使いたいです let hoge="...."; hoge.split(/\d{4}/) しかし上記の正規表現だと、例えば6桁の数字でも区切ってしまうため、これを4桁に限定するためにはどうしたらよいでしょうか?
734 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:36:29.87 ID:HRXsYHZK.net] (?<!\d)\d{4}(?!\d)
735 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 06:20:04.42 ID:FL3bkV8O.net] ありがとうございます
736 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:00:29.04 ID:8S43aXN3.net] 修正前 .*(..)? 修正後 .*?(.[^z])? "abcd"を与えて受理される文字列 修正前 "" 修正後 "ab" 受理してもらいたかった文字列 "cd" URLからIDを取り出すほうは画像に入るようにデフォルメする必要があるから おかしいURLになるのはやむを得ないと思う > (?:[&].*)? ただこれはちょっと気持ち悪い これがあっても無くても結果は変わらないから付ける必要なかった 正規表現に詳しい人が"&"を単体で文字クラスに入れることはあまりない(たまにはいる) 新技術のアプリを実際に試させてくれないかな? 提供してもらえれば無償でテストするよ
737 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:17:00.34 ID:Z+I+bAqU.net] 「abczは拒否」→「なるほど末尾zは拒否だな」 えー…
738 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:38:48.98 ID:SbeXWTV7.net] 書いてないけど前提として完全一致のつもりだったんだろうな
739 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 10:41:38.55 ID:8S43aXN3.net] jsって完全一致が前提になるオプションってある? それがあったとしても .*?(.[^z])? はAutoだが
740 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 11:16:26.32 ID:ld9dVlA3.net] >>723 シングルラインモード(dotAll)で ^ と $ を使えば良いだけでは?
741 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 12:14:35.15 ID:8S43aXN3.net] ^と$を使うつもりなら画像の中でも使うと思う 見やすくするために省いてるだけなのかな? そうだとしても .*?(.[^z])? はAutoだが
742 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 22:34:06.87 ID:g2ig9yOY.net] ニュー速(嫌儲)で、近頃半角記号を6文字だけとかの書き込みがあります なんとかNGを作りたいのですがうまく行きません 行頭から記号だけの文字列で4~8文字、って想定でこんなの作ってみたんですが、httpで始まるurlも引っかけてしまいます ^[ -/:-@\[-~]{4,8} 例えばこんなスレなんですが https://greta.5ch.net/test/read.cgi/poverty/1687352512/ 詳しい方、正規表現作ってもらえないでしょうか?
743 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:30:57.52 ID:nJDgsm3N.net] そういうのは専ブラのNGスレでやるべきだね、ユーザー同士で情報共有にもなるから 正規表現を適用する対象がHTMLでなくdatだったりでユーザーでないと作れない場合もある 記号だけにマッチさせたいなら[!-/:-@\[-`{-~]だが、この前後に付ける正規表現は お使いの専ブラスレで聞いてくれ
744 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:42:44.65 ID:TTIYA8nl.net] そこみる限りでは3パターンしかなくない? 何かしらの絵文字とかが化けて出てるだけとか。 (\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)
745 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:08:56.55 ID:L6AKAbfA.net] 726です 726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました 727さんのに変えたら誤動作無く動作しました ^[!-/:-@\[-`{-~]{5,11} ちなみに、android板に以下のスレを発見しました しかし、荒らされてて機能して無さそう 他にこっちの方が良いよ、っておすすめのスレはありますかね? オススメのNGワード https://egg.5ch.net/test/read.cgi/android/1576334383/
746 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:55:55.92 ID:nJDgsm3N.net] こちらはそちらが何を使ってるかも分からないので勧めようが無い件 問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う 今のままでは12文字以上記号が続いててもNGになっちゃうね
747 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 13:11:08.52 ID:L6AKAbfA.net] >>730 chmateなんです その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました ^[!-/:-@\[-`{-~]{2,11}$ ここがひどいです https://greta.5ch.net/test/read.cgi/poverty/1687400738/
748 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:46:12.28 ID:vRMLRvgd.net] 方言がひどい記述だけど(PCRE2とbregonig.dllでは大丈夫) ^ ?(((?!&gt;?|&lt;?)[[:punct:]])+|&gt;?|&lt;?){2,} ?$
749 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:53:40.61 ID:vRMLRvgd.net] >>732 はdatに対してのものだから、mateはどうなのかは知らん POSIX文字クラスが通っても、>とか行頭行末の半角スペースとか無さそうだね
750 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 23:53:09.33 ID:nJDgsm3N.net] GJ [[:punct:]] これいいね、覚えとこ (()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから ++や(?>)を使ったほうがいいかも 正規表現エンジンの内部でも対策はしてると思うけど念のために
751 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 01:33:06.45 ID:gmkpJif8.net] >>734 +が入ってるのはダメじゃん 除いてくれ 作ってる途中で紛れ込んだものだね なおbregonig.dllだと ^ ?(?:\p{punct}|&gt;?|&lt;?){4,} ?$ ^ ?(?:[[:punct:]]|&gt;?|&lt;?){4,} ?$ でもいけちゃうんだよな ちょっと不思議
752 名前:デフォルトの名無しさん [2023/06/23(金) 02:02:21.28 ID:qwakAXsj.net] and検索みたいなのってできない? 今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい
753 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 02:09:08.88 ID:gmkpJif8.net] >>736 ^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)
754 名前:デフォルトの名無しさん [2023/06/23(金) 02:35:28.92 ID:qwakAXsj.net] >>737 感謝
755 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 12:02:08.17 ID:2Ntzjt3B.net] [文章] AAAaiueo111 xxx aaaaa AAAkakikukeko xxx b b b AAAsasisuseso ccccc AAAtatituteto000 ddd123 上記の文章で先頭がAAAの行だけ抜き出して、さらに
756 名前:AAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。 使用するのはサクラエディタの置換機能で、 置換前 AAA(.*)\r |.*\r\n 置換後 $1 で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。 [] [ここ壊れてます]
757 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:06:42.48 ID:gnUd2/2c.net] AAAで始まらない1行|先頭のAAA|末尾のxxx
758 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:54:57.82 ID:WBrlaKRC.net] ^AAA|xxx$|^.*\r\n → 削除
759 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 15:20:23.65 ID:2Ntzjt3B.net] >>740 >>741 ありがとうございます。
760 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 19:05:48.89 ID:zWmLGOhD.net] ^AAA([^\r\n]*?)(?:xxx)?$|^[^\r\n]*(?:\r\n|[\r\n])? $1 アク菌で書けませんぞテスト
761 名前:734 mailto:sage [2023/06/23(金) 19:21:25.94 ID:zWmLGOhD.net] >>735 PCRE2では\p{Punct}は存在しないんだね www.pcre.org/current/doc/html/pcre2syntax.html [\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ > + 言われてみれば+があるのはおかしいw 忘れ物だったのかw
762 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 21:34:05.58 ID:gmkpJif8.net] >>744 不思議な点は PCRE2だと、[[:punct:]]で&が先にキャッチされて&gt;のgt;が取り残されてしまうので |&gt;とあってもマッチしなくなる bregonig.dllだと &gt;にキャッチされてマッチする(punctより&gt;が優先される (PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?) これはorの記述の順序には関係なく左に(先に)&gt;を書いても結果は同じ
763 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:07:00.56 ID:zWmLGOhD.net] ここのテストサイトで regex101.com/ ^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど 本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない? それで>>732 に要らないはずの先読みを入れてたんだね これがマッチしないならバグかも知れない もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから
764 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:09:21.21 ID:zWmLGOhD.net] あ、&が化けちゃった ^([[:punct:]]|>|<)$ を > にマッチさせて
765 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:31:35.63 ID:gmkpJif8.net] >>746 今確認したらそのとおりだった 俺は以前一体何をやったんだろう?
766 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:36:28.09 ID:gmkpJif8.net] 今考え付くのは ^(?>[[:punct:]]|&gt;)+ とか &gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?
767 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:47:37.55 ID:gmkpJif8.net] さすがに(?>)を使って気づかないわけないから(使った覚えもないし) 恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする
768 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 23:16:11.04 ID:zWmLGOhD.net] そういうこと俺もあるから分かるわーw 頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事 間違えた原因は分からないけどとりあえずゆっくり休んでくれw
769 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:27:07.24 ID:X4q59utv.net] 勘違いした理由が分かった ^([[:punct:]]|&gt;)+ これをやると&で切れちゃうんだ s/([[:punct:]]|&gt;)+//g をやるとgtが置換されずに残る 末尾に$とか目標物を付ければ切れないんだが さてどうして切れるのか誰か教えて
770 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:36:09.10 ID:X4q59utv.net] やっぱ左側が優先なのか (&gt;|[[:punct:]]) と入れ替えたら切れない
771 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 09:56:18.97 ID:o3ZfF1Sp.net] >>742 >>741 それだと行頭からxxxだけしかない行の改行が削除できずに残りそうだけどどうだろう ^AAA|^.*\r\n|xxx$ → 削除
772 名前:751 mailto:sage [2023/06/24(土) 11:05:23.89 ID:QPqcCtG1.net] >やっぱ左側が優先なのか 正解 ただ、同じ正規表現で&;gt;にマッチする環境もあるよ 考えられる中で最長になるマッチを探すエンジン バックトラックの動きがまだよく分かってないなら>>708 のNTTと早大の正規表現や >>743 で使ってる .* と .*? の動きも見直しておいたほうがいいかも 見た目は簡単そうに見えるけど正しくバックトラックの動きを理解してないと作れない 舐めてかかると酷い目に遭う怖いヤツだよ(過去に経験あり)
773 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:10:05.28 ID:QPqcCtG1.net] あ、NTTと早大のやつは正規表現を^と$で囲ってから動かして
774 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:21:09.38 ID:X4q59utv.net] >>755 いままで +や++での強欲のバックトラックが最長を探すのに違いがあるとは思っていなかったよ 最大の最長を探す記述ってのも欲しいな
775 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 16:54:14.04 ID:QPqcCtG1.net] >最大の最長を探す記述 ちょっと探してみたらPHPのオプションにあった www.php.net/manual/ja/function.mb-regex-set-options.php > l 最も長くマッチするものを探す この処理ってすごく重くなりそうなイメージがあったけどそうでもないのかな
776 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 17:35:54.33 ID:X4q59utv.net] PHPだけじゃなあ 結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか
777 名前:743 mailto:sage [2023/06/25(日) 11:57:31.39 ID:YeZqv3UB.net] >> 759 考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか 正規表現むずかしい >> 740 741 754 改行コードがLFやCRのみの場合に対応してない 最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない 743は両方に対応しているけど740の発想のほうがシンプルで優れてるね あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう
778 名前:デフォルトの名無しさん mailto:sage [2023/06/27(火) 21:16:47.75 ID:TnfGmDZI.net] 最長一致マッチが有効のとき、下の正規表現は何にマッチすべき? "abcd" =~ /abc\Kd|abc/; \Kの前を文字列長に含めるべきか否かを考えて下さい
779 名前:デフォルトの名無しさん mailto:sage [2023/06/28(水) 12:49:16.44 ID:vk3PbjZ1.net] 元より最左ルールに基づいてdよりabcにマッチすべきとはならんやろ
780 名前:761 mailto:sage [2023/06/28(水) 13:05:55.77 ID:m0cBggZC.net] >>762 ありがとうございます、それは正しい意見だと思います \Kの前を文字列長に含めるべきかどうかについてはどうお考えですか? 今後の参考にしたいと考えております
781 名前:デフォルトの名無しさん mailto:sage [2023/06/29(木) 11:57:49.56 ID:0JMnG4u5.net] 最長一致する正規表現が有効の場合 1、「abc」「あ」 2、「て゛」「で」 A. 前が長い B. 同じ長さ C. 後ろが長い
782 名前:デフォルトの名無しさん mailto:sage [2023/07/02(日) 20:25:06.40 ID:/BVUs+ug.net] 奥が深すぎる
783 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 13:17:43.04 ID:GbtWdAMV.net] twitter.com/k_takata/status/1676247372731662336 >正規表現技術入門が第2刷増刷 おめでとうございます bregonig.dllやonigmoにはいつもお世話になってます vimは知りませんw
784 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 17:43:12.24 ID:SQbV6Whm.net] JaneStyleであぼーんにつかいたいのですが、 アウアウウー Sa47-runv [106.131.26.222] 47 runv 131.26.222 この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?
785 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 20:37:36.61 ID:GbtWdAMV.net] Jane Styleの仕様が分からないけどこれでいける? (?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
786 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:30:05.44 ID:7Yxy824T.net] >>768 ありがとうございます! ためしてみたけれど駄目でした。 細かく分析して応用してみます!!
787 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:54:51.51 ID:7Yxy824T.net] >>768 失礼しました。勘違いをしていて、正しく設定したらこれでいけました!! 大感謝です!&正規表現の勉強になりました!! リファレンスみてなるほどとうなっています
788 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:55:53.42 ID:gWNyo9yQ.net] いやそれでいけるでしょ (?i)はデフォなので要らないけど ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで 設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか
789 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:26.50 ID:GbtWdAMV.net] 動いて良かった、正規表現の勉強頑張れーw 771さんもありがとう
790 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:33.07 ID:4RAXuAwI.net] ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから その正規表現すり抜けするかも
791 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:16:17.63 ID:gWNyo9yQ.net] (?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ
792 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:21:43.88 ID:7Yxy824T.net] >>773 (?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\] 一応、ご指摘通り改良しておきました!
793 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 00:41:55.61 ID:adSx9MnJ.net] 反対に(?i)ではSaの他にsAにもマッチしてしまうのでは? (?-i)アウアウウー Sa..-.... \[106\. これで誤爆する実例があるなら教えてほしい
794 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 13:06:44.76 ID:xew4KSRK.net] 言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う
795 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 23:28:01.04 ID:chPidFQv.net] 鬼車で(?L)と\g<0>が共存出来ないようだけど "\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする" という修正案で何か問題が起こるか分かる人いません? 例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば 共存可能になるんだけど副作用が出るのか分からない 鬼車公式) 全体オプション github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288 LだけじゃなくCとIも共存不可でした
796 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 12:38:44.00 ID:dnLGUnq0.net] >>778 "\g<0>" に取り込むときにはそのまま全て取り入れ、取り出すときに "L" や "C" や "I" を取り除く方法もあるのでは?
797 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 15:02:36.24 ID:NT/2XwNR.net] 最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った DFA的な最長だと思ってたのに
798 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 17:56:55.84 ID:dnLGUnq0.net] 最左じゃなくても良いみたい UTF-8のとき abc < abc\Kd ab < あ で < て゛ "(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする "(?C)" が捕獲無効にするから "\g<1>" は使えないし
799 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 13:05:06.30 ID:8apozFwM.net] > ab < あ マルチバイト文字を含む文字列に対して (?L) は使いにくいな 文字単位での長さで比較するようにするのは重くなる上に難易度高そう
800 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 20:06:05.30 ID:8apozFwM.net] JaneStyleが5ch.netのサポートを終了 この前NG登録出来て喜んでた人かわいそす
801 名前:デフォルトの名無しさん mailto:sage [2023/07/11(火) 10:50:26.27 ID:6DaZenCz.net] (?L)をマルチ文字対応にするのは無理だけど >"(?C)a(b|\g<0>)c" がエラーになる これを使えるように出来る人はいるんじゃないかな 夏休みで暇を持て余している大学生の皆さん、Let's try!
802 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 19:11:50.96 ID:7AgmN8D3.net] JAPANを日本、NIPPONをニッポンに、同時に置き換える JAPAN|NIPPON ↓ 日本|ニッポン
803 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 23:55:44.94 ID:OlRmyaph.net] >>785 サクラエディタ+bregonig.dllでは無理っす
804 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 00:50:54.69 ID:JHf9vJmP.net] https://www.regular-expressions.info/replaceconditional.html https://npp-user-manual.org/docs/searching/#substitution-conditionals
805 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 13:30:40.79 ID:lxqistQI.net] わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。
806 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:19:44.01 ID:nnNpViq+.net] JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?
807 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:22:35.95 ID:nnNpViq+.net] 0を含めないというのは「0より大きい正の半角数値のみ」という意味です
808 名前:デフォルトの名無しさん [2023/07/15(土) 18:39:49.26 ID:Fs/aULCy.net] 正規表現でやることじゃない
809 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:36.28 ID:vGns6WZO.net] (?!(?!<[0-9])0(?![0^9]))[0-9]+ 00とかあるんだったらダメだけど
810 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:49.29 ID:hche+KD8.net] >>789 XY問題の臭いがする その文字列を、正規表現「だけ」を使って評価したい理由でもあるの?
811 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 19:54:00.17 ID:nnNpViq+.net] >>793 全角文字と半角英字を除外したいんですよ 入力欄にこれらを入力されるとフリーズします
812 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 20:24:42.65 ID:hche+KD8.net] >>794 「正規表現だけで評価したい理由」になってない 許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可) const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);
813 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:27:34.96 ID:nnNpViq+.net] すみません 説明の仕方が悪かったです 「正の実数(少数も含む)」でした 0も含ませることにしました それでこうしました ^(0|[1-9][0-9]*)(|[.][0-9]+)$
814 名前:デフォルトの名無しさん [2023/07/15(土) 21:44:37.74 ID:Ip1+AB5X.net] そして半年後… 「誰だよこんなクソプログラム書いたやつ💢」
815 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:52:20.50 ID:G+tF3yG6.net] 滅茶苦茶わかりみ 美しくないプログラムはパッと見てうんざりする
816 名前:デフォルトの名無しさん mailto:sage [2023/07/17(月) 02:00:45.07 ID:MFjOLYv6.net] 改行厨たいさく [^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+
817 名前:デフォルトの名無しさん mailto:sage [2023/07/20(木) 17:25:16.42 ID:OqTU1F4P.net] >>785 そういうの出来るといいですけどねえ
818 名前:デフォルトの名無しさん mailto:sage [2023/07/21(金) 15:55:34.48 ID:GwV7ay2N.net] >>784 C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった C言語をちゃんと勉強しないと無理だな
819 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 00:50:40.93 ID:hdFkAV/t.net] hage【ZEN123】hoge456789 上記の【】内の全角英数字だけを半角にする 正規表現では無理なパターンの例か
820 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 05:19:55.24 ID:BnGP1dsy.net] 正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので そういう正規表現環境は既に存在してるかも? 今のテキストエディタでもマクロでなら出来るものがありそう
821 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 09:48:00.20 ID:PHWyKwrY.net] 秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね
822 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 13:07:11.02 ID:BnGP1dsy.net] 秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも? 本家の最新の鬼車の秀丸エディタからの利用方法 www2.maruo.co.jp/hidesoft/2/x39752_.html
823 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 15:10:19.87 ID:nlZnqujR.net] >>805 それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw
824 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 16:14:08.28 ID:BnGP1dsy.net] その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる
825 名前:デフォルトの名無しさん mailto:sage [2023/07/24(月) 12:53:06.11 ID:LBGWnldn.net] > 全角->半角変換 や >>785 の置換に対応 正規表現の中での表記はどういう仕様にするのがベストなのかな? 新しい予約語(?)の予感
826 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 00:28:01.42 ID:ijwgoKNu.net] 「正規表現には方言がある」 エディターを乗り換えた時に初めて気付かされたな
827 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 01:58:51.32 ID:DaPN/KaH.net] \1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう
828 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 02:10:59.59 ID:m8SWwEXi.net] \1ってあちこちにあるものだったのか EmEditorってエディタがそれでなんだこれって思ってた
829 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 16:23:19.14 ID:hmH9EM9U.net] Onigumoで検索して気持ち悪くなる定期
830 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 20:32:41.26 ID:xNvNUPTs.net] 詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない 正規表現の便利な使い方教えて!
831 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:44:23.17 ID:slvWQQxm.net] >>813 ^(?=.*正規表現)(?=.*教えて)
832 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:46:27.76 ID:slvWQQxm.net] >>813 途中で送信しちゃった ↓を専ブラのNGwordに入れて正規表現にチェックしてみ ^(?=.*正規表現)(?=.*教えて).*$
833 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:49:39.05 ID:slvWQQxm.net] >>813 すまん間違えてたこれ (?s:(?=.*正規表現)(?=.*教えて)).*$
834 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:51:07.45 ID:Z2bzRt4C.net] 俺のレス消えちゃうんじゃない? ?=がよくわからないけど後で調べとくよ
835 名前:デフォルトの名無しさん mailto:sage [2023/07/30(日) 10:33:11.68 ID:3uyXLeeN.net] テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン 検索: ^ 置換: # 選択範囲の全ての行をコメントアウト出来て便利 -------------------------------------------------------- 検索: [ \t]+$ 置換: (なし) 行末の余計なスペースを削除出来て便利
836 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:48:03.89 ID:g9Iw6FTW.net] https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。 https?://(?:[!-~]+.)+[!-~]+ だと最長一致になってしまうようで、1行丸ごと対象になってしまます 最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。
837 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:56:16.40 ID:IKZkjZuG.net] http[^\s]+
838 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:02:22.92 ID:BmgakVsI.net] >>819 .をエスケープ
839 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:14:06.14 ID:g9Iw6FTW.net] >>820 >>821 うぉぉ、ありがとうございました!
840 名前:デフォルトの名無しさん mailto:sage [2023/08/13(日) 14:38:57.47 ID:vv6Q6LsS.net] 突然大きな声で叫ぶな
841 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:26:03.91 ID:tG3c9Vi+.net] perl 正規表現で一発変換できませんか "aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい aaa "bbb" "ccc" ddd
842 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:58:40.55 ID:vZ93TkLb.net] 正規表現で my $s = '"aaa \"bbb\" \"ccc\" ddd"'; $s =~ s/(.*)/eval $s/e; 正規表現を使わずに my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';
843 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 14:00:17.67 ID:vZ93TkLb.net] >>825 $s =~ s/(.*)/eval $s/e; ↓ $s =~ s/(.*)/eval $1/e;
844 名前:0824 mailto:sage [2023/08/20(日) 20:08:57.65 ID:tG3c9Vi+.net] 文字列をevalで再度評価させる ありがとうございます、勉強になります ただ文字列にシングルクォートはありません 文字列に2つのパターンがあります hogehoge "aaa bbb ccc ddd" hogehoge "aaa \"bbb \"ccc ddd" s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて tr/\\//d; # 2回処理しています
845 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 20:26:08.36 ID:vZ93TkLb.net] 単純に s/\\//g でええんとちゃうん
846 名前:0824 mailto:sage [2023/08/20(日) 20:59:59.16 ID:tG3c9Vi+.net] >>828 2回処理するのでindexで調べてtr使った方が早いでしょ hogehoge "aaa bbb ccc ddd" hogehoge "eee \"fff\" \"ggg\" hhh" 目的文字列 aaa bbb ccc ddd eee "fff" "ggg" hhh
847 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 21:32:41.19 ID:vZ93TkLb.net] 一発変換したいんじゃないの? s/hogehoge\s+(.+)/eval $1/e
848 名前:0824 mailto:sage [2023/08/20(日) 21:58:11.37 ID:tG3c9Vi+.net] >>830 ありがとうございます s/hogehoge\s+"(.+)".*\n/$1/; これで弾いてるの"以後にコメントがあるかもしれないからです
849 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 20:43:15.01 ID:Lyi1TDoI.net] eval思い付く人すごい、甲子園優勝
850 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:39:46.20 ID:Frb3PbHb.net] >>824 これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では 文字列変換ではなく、printfコマンドを通せば一発だが。 $ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # aaa "bbb" "ccc" ddd
851 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:52:08.69 ID:Frb3PbHb.net] 見落としてたので補足しておくと、>>831 のコメントの件もUnixの書式に則ったものなら大丈夫。 $ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる # aaa "bbb" "ccc" ddd
852 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 01:30:15.60 ID:RW2iO7Jr.net] >>perl 正規表現で一発変換できませんか まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥
853 名前:デフォルトの名無しさん [2023/08/22(火) 02:16:49.08 ID:NJ9SPgik.net] >>833 単にシェルが引数処理してるだけじゃん これで十分だろ echo "aaa \"bbb\" \"ccc\" ddd" #
854 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 12:38:02.82 ID:NJ9SPgik.net] >>831 (perlの)コメントがあっても動作するよ
855 名前:0824 mailto:sage [2023/08/23(水) 09:58:00.37 ID:yShv/GWA.net] >>837 ありがとうございます、勘違いしてました eval評価だからコメントあっても行けますね
856 名前:デフォルトの名無しさん mailto:sage [2023/09/02(土) 20:40:48.54 ID:PozNjemk.net] ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 IPアドレス部分だけ抽出したいです 各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです ※対象データの内xは文字としてのアルファベットのxです \r\nは改行コードです よろしく
857 名前:ィ願いします ●対象データ x\r\n192.168.10.1\r\n0\r\n\r\n ●希望する結果 192.168.10.1 [] [ここ壊れてます]
858 名前:デフォルトの名無しさん [2023/09/02(土) 22:43:12.64 ID:JbZUXP6Y.net] (%d+%.%d+%.%d+%.%d+)
859 名前:839 mailto:sage [2023/09/03(日) 01:48:07.24 ID:BSGxD5eG.net] ありがとうございました
860 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 01:50:43.78 ID:BSGxD5eG.net] ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 コロンとスペースの右側の数字だけ抽出したいです よろしくお願いします ●対象データ abe-gkm: 12 ●希望する結果 12
861 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 06:04:52.16 ID:ldBVlws1.net] 自分で覚える気は一切ないんですね
862 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 14:44:19.10 ID:QHfhMJE9.net] LUA5.1リファレンスマニュアル 文字列操作 milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4
863 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 17:01:33.87 ID:7kfz6vsc.net] 訂正がありました よろしくお願いします ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 最後に現れるコロンの右側だけ抽出したいです ●対象データ ab:e-gkm: 12 ●希望する結果 12
864 名前:デフォルトの名無しさん [2023/09/03(日) 17:20:26.33 ID:ruPOb/mk.net] 訂正がありました よろしくお願いします ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 最後に現れるコロンの右側だけ抽出したいです ●対象データ ab:e-gkm: ::12 ●希望する結果 12
865 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/03(日) 17:22:38.45 ID:7kfz6vsc.net] >>846 は別の人なのでトリップを付けておきます よろしくお願いします
866 名前:デフォルトの名無しさん [2023/09/03(日) 17:42:25.87 ID:ruPOb/mk.net] 訂正がありました よろしくお願いします ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 最後に現れるコロンの右側だけ抽出したいです ●対象データ ab:e-gkm: 121212 ●希望する結果 12
867 名前:デフォルトの名無しさん [2023/09/04(月) 00:12:22.18 ID:SsZQexqW.net] >>843-844 >>846-848 夏休みキッズ達よ、答えられないor嫌なら見なければいい >>845 [^: ]*$
868 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:01:20.01 ID:c5K3sEzk.net] Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数 正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない
869 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:08:00.64 ID:nyO3ndTW.net] >[^: ]*$ こういうの後ろから見るよう最適化されるのかな
870 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 15:41:22.66 ID:zA8RUwS0.net] ややこしい検索は正規表現だけよりも awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
871 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 18:55:45.65 ID:BoKCZaYW.net] 今回のはややこしくはない むしろ簡単
872 名前:デフォルトの名無しさん [2023/09/04(月) 19:08:28.07 ID:8gjbapjk.net] >>849 アホらしすぎて・・・
873 名前:デフォルトの名無しさん [2023/09/04(月) 20:45:35.27 ID:DgpCgO2R.net] >>854 相手の技量は千差万別 自分を基準に考えるからキッズなんだ たとえそれがHello World!レベルであったとしても テンプレ使ってちゃんと質問されているのだから
874 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 20:55:42.10 ID:Tkae+foX.net] >>855 気に入らないレスに絡んでるのは貴方も同じ 嫌なら見るな
875 名前:デフォルトの名無しさん [2023/09/04(月) 20:58:59.14 ID:DgpCgO2R.net] >>856 気に入る気に入らないじゃなくて スレを荒らさないで欲しいって事
876 名前:デフォルトの名無しさん [2023/09/04(月) 21:05:24.79 ID:NKgrLrxG.net] 訂正がありました よろしくお願いします ●Regular Expressionの使用環境 Lua ●検索か置換か? 検索 ●説明 最後に現れるコロンの右側だけ抽出したいです ●対象データ ab:e-gkm: 33 ●希望する結果 12
877 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/04(月) 21:07:00.10 ID:3GWjSEvz.net] >>849 ありがとうございました
878 名前:デフォルトの名無しさん [2023/09/04(月) 21:16:52.45 ID:NTqFdCv7.net] 自演荒らしが捗るなw
879 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 22:23:04.68 ID:0+pR+e5l.net] コロンが無い場合はマッチでよかったのかな? >>851 されない right to leftにするオプションが必要 対象文字列が短ければ大差ない
880 名前:デフォルトの名無しさん [2023/09/06(水) 02:59:30.44 ID:lSkku4oe.net] インフラ屋は性格良い プログラマは性格悪い
881 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 07:21:34.46 ID:yobQfJn+.net] 俺はインフラ屋 性格良いよ
882 名前:デフォルトの名無しさん [2023/09/06(水) 09:14:00.91 ID:UTcPybKQ.net] プログラマは正確悪いというより 無駄な事をしたくないだけっていう人が多い
883 名前:デフォルトの名無しさん [2023/09/06(水) 09:1
] [ここ壊れてます]
884 名前:8:47.39 ID:BQBp+rCO.net mailto: 無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い [] [ここ壊れてます]
885 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:44:01.14 ID:HD7oM5sP.net] 態度と性格を区別できない人々
886 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:45:30.51 ID:Ygn1Ao5e.net] >>866 能書きだけはいっちょまえ
887 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:57:30.15 ID:tVigPql1.net] それがプログラマの性分
888 名前:デフォルトの名無しさん mailto:sage [2023/09/08(金) 08:44:01.58 ID:07e9DMWQ.net] ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね
889 名前:デフォルトの名無しさん mailto:sage [2023/09/11(月) 00:45:50.96 ID:cvO0nzmM.net] ●Regular Expressionの使用環境 サクラエディタ ●検索か置換か? 検索 ●説明 REM半角スペースを検索してREM部分のみに一致させたい ●対象データ REM TEST ●希望する結果 REM
890 名前:870 mailto:sage [2023/09/11(月) 00:53:10.22 ID:cvO0nzmM.net] /REM(?= )/kで出来ました
891 名前:デフォルトの名無しさん [2023/09/13(水) 16:39:29.09 ID:qhl2oEPa.net] ●Regular Expressionの使用環境 javascript ●検索か置換か? 検索 ●説明 ( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです 例でいえば括弧の中が「横浜」の時だけヒットさせたいです ●対象データ 東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい ●希望する結果 だけど横浜は家賃が
892 名前:デフォルトの名無しさん [2023/09/13(水) 16:41:17.76 ID:qhl2oEPa.net] ごめんなさい872の追記です 括弧は半角全角どちらでも対応できるようにしていただけると助かります
893 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 18:37:54.95 ID:3qYEVVGq.net] >>872 [((]\K[^))]*横浜[^))]*+(?=[))])
894 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 20:55:54.73 ID:T8/GYmvT.net] 対象データがそれだけきれいに整っているならこれでいいんじゃないかな [^()()]*横浜[^()()]*(?=[))])
895 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 21:32:58.14 ID:qhl2oEPa.net] >>874-875 ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。
896 名前:デフォルトの名無しさん mailto:sage [2023/09/14(木) 00:22:01.99 ID:L47o5ku7.net] 鬼車は結局Unicode15対応版がリリースされなかったな
897 名前:デフォルトの名無しさん mailto:sage [2023/09/16(土) 22:56:08.84 ID:dIGSEJlt.net] 同じワードの繰り返し(回数指定)を除外する正規表現を教えてください
898 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 07:04:17.16 ID:jNYPDoV+.net] 除外??
899 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 10:23:51.82 ID:ht+84nM7.net] こういうこと? abcxyzacz → bxy
900 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:29:52.53 ID:yn1jo0MJ.net] "にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く \A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま
901 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:33:30.19 ID:yn1jo0MJ.net] 置換後の文字列: $1$2
902 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 15:23:07.94 ID:yn1jo0MJ.net] スマン、\Gの前に(?!\A)を置いてくれ
903 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 16:53:03.56 ID:oNTID2ix.net] 3回連続して出現する単語を削除 //javascript s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'; console.log(s.replace(/(?:(.+)\1{2})/g, '')); #python s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎' print(re.sub(r'(?:(.+)\1{2})', '', s))
904 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:05:16.38 ID:Fm9hMrUa.net] \nを30回以上は非表示するにはどうしたらいいですか
905 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:18:53.47 ID:jNYPDoV+.net] 非表示??
906 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:41:10.52 ID:PjfamyxI.net] \nがn回以上除外で
907 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 22:51:45.08 ID:jyrM2LRG.net] ●Regular Expressionの使用環境 Perl ●検索か置換か? 検索 ●説明 後ろから2つ目の/以降を取得したい ●対象データ /a/bb/ccc/dddd/eeeee/cgi/sample.cgi ●希望する結果 /cgi/sample.cgi お願いします
908 名前:デフォルトの名無しさん mailto:sage [2023/09/18(月) 01:07:38.93 ID:e1xt8o+y.net] .*\K/.*/.*
909 名前:デフォルトの名無しさん mailto:sage [2023/09/23(土) 15:35:56.62 ID:UU1JiicL.net] 何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは 可読性的な観点からでも
910 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 14:32:09.00 ID:w/fMdm7Q.net] 正規表現じゃなく言語表現をなんとかした方がいい
911 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:45:13.07 ID:b6Bm13IE.net] 正規表現じゃなく性器表現とした方がいい
912 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:46:57.59 ID:b6Bm13IE.net] 正規表現じゃなく性器表現とかなんとかにした方がいい
913 名前:デフォルトの名無しさん mailto:sage [2023/09/26(火) 17:43:27.65 ID:WhLFttTP.net] 添削って受け付けてたっけ? 自分が求める結果は得られてるけど、それでいいのかどうか
914 名前:デフォルトの名無しさん mailto:sage [2023/10/03(火) 15:05:59.66 ID:pjWozC8L.net] >>894 You ここで見せちゃいなよ、meが見てあげるよ
915 名前:デフォルトの名無しさん [2023/10/15(日) 05:59:22.52 ID:qeiyy+lM.net] oniguruma Release 6.9.9 Update Unicode version 15.1.0 NEW API: ONIG_OPTION_MATCH_WHOLE_STRING Fixed: (?I) option was not enabled for character classes (Issue #264). Changed specification to check for incorrect POSIX bracket (Issue #253). Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268) Fixed: ONIG_OPTION_FIND_LONGEST behavior > ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求 マッチした開始の位置はstartでなくても良いらしい oniguruma/test/test_options.c x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ) > [[:punct:]] Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}. (PosixPunct is a new addition.)
916 名前:デフォルトの名無しさん mailto:sage [2023/10/15(日) 06:13:36.53 ID:qeiyy+lM.net] > Fixed: ONIG_OPTION_FIND_LONGEST behavior oniguruma/test/test_options.c x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ) 最左最長一致からガチ最長一致になってる
917 名前:デフォルトの名無しさん [2023/10/15(日) 06:27:13.95 ID:qeiyy+lM.net] 間違えた、こっちだった oniguruma/test/test_options.c x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ) // マルチバイト文字には非対応のまま x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ) UTF-32 にエンコードしてから使えばいいのかしら
918 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 08:36:56.63 ID:S3IcPVBq.net] Strawberry Perl https://strawberryperl.com/releases.html 32bit版が出なくなった。64bitに乗り換えよう。(全銀)
919 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 16:11:58.36 ID:8kCGh912.net] >>899 ZIP edition が無い…
920 名前:デフォルトの名無しさん mailto:sage [2023/10/21(土) 14:33:23.21 ID:43n7K7Fq.net] tar.gzで我慢しなさい
921 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 10:19:38.81 ID:zDgIETfO.net] アルファベットのみにマッチする文字クラスを[a-Z]と書けない ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
922 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:34:50.74 ID:vOjtdftv.net] 初心者向けクイズ Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
923 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:42:28.97 ID:BaFdPLsN.net] アンダースコート
924 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:45:28.88 ID:zDgIETfO.net] アンダースロー
925 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 13:20:31.22 ID:y5KdwCim.net] アンダーニンジャ
926 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 15:41:31.84 ID:zDgIETfO.net] ニンジャリバンバン
927 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:20:26.89 ID:dO2GnsiA.net] 正解はスラッシュでした
928 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:49:37.09 ID:zDgIETfO.net] (/w\)
929 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:06:53.46 ID:wzEyUd/K.net] ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで 大文字小文字が変換出来るようにするための順番らしい 並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
930 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:59:27.53 ID:dhg2pdyL.net] どうせ範囲チェックはしないといけないんだから それだったら引き算や足し算で大文字小文字変換できちゃう まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
931 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 18:36:44.19 ID:X00tNW2d.net] 今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど 遅いマシンのことまで考えるならビット演算一択になるんだろうな アルファベットが32文字だったら隙間出来なかったのに SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
932 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 21:57:53.63 ID:27STA2Pg.net] 正規表現は改行の扱いが難しいなあ やらかすときはたいてい改行の処理でミスる
933 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 09:19:33.19 ID:DBguvWIQ.net] . が改行にマッチしないのを失念してってのは何度もやってる
934 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:27.61 ID:ikHnu6pN.net] ●Regular Expressionの使用環境 サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0) ●検索か置換か? 検索 ●説明 キムラタクヤの略称を検索するために (キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました ^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$ 文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください ●マッチする文字列 キク キラク ムラタヤ ●マッチさせない文字列 キム キムラ タクヤ
935 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:37.53 ID:ikHnu6pN.net] ●Regular Expressionの使用環境 サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0) ●検索か置換か? 検索 ●説明 キムラタクヤの略称を検索するために (キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました ^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$ 文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください ●マッチする文字列 キク キラク ムラタヤ ●マッチさせない文字列 キム キムラ タクヤ
936 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 12:08:10.81 ID:oh2mJ3WA.net] ^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
937 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 14:40:34.08 ID:DBguvWIQ.net] 同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる 多くの閲覧者にとっても勉強になるからありたがいことです
938 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 16:00:59.53 ID:G1jsC9Xy.net] じつはその人AIだよ
939 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:01:21.99 ID:ikHnu6pN.net] >>917 ありがとうございます動きました 3語以上の場合はこれでできてますか? ^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
940 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:03:51.95 ID:DBguvWIQ.net] AIと言われても違和感が無いから困る、人間だったほうがいい サクラエディタを少し触ってみたが \r を \c- \n を \c* に書き換えてもマッチした このことは恐らくbregoing.dllの作者氏でも知らないのでは
941 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 18:26:59.70 ID:upaRAmPk.net] >>920 キムクヤにマッチするから駄目だね >>916 のように自分で組み合わせを展開する以外の方法はわからないね
942 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 21:03:12.97 ID:bvA/YDb8.net] 最後で語数チェックすれば? (?<=\S{3})$
943 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 22:35:57.76 ID:8ROMQdip.net] ^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2) ^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3) ^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$ ^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
944 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 08:03:41.39 ID:ztJD977Y.net] 文字数も単語数も拡張性もばっちりです ご指導ありがとうございました
945 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 09:18:56.98 ID:/CeYlFrx.net] > $(?!\1|\2) これもすごい、こんなの思い付かない 私なら(?(1))を使おうとしてグチャる こういうのを作れる人になりたかった、羨ましい限りだ
946 名前:デフォルトの名無しさん [2023/11/02(木) 09:22:55.91 ID:kxWwWLf8.net] >>910 アルファベットが32文字だったら誰も困らなかったはず
947 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 11:56:22.72 ID:YMFW9tw8.net] 各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
948 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 13:01:27.99 ID:eLjTHeK1.net] ^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$ ^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
949 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 19:36:53.03 ID:/CeYlFrx.net] ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
950 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 08:34:37.96 ID:cY7DSC5H.net] ^[キムラ]{1,2}[タクヤ]{1,2}$
951 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 09:08:43.70 ID:PqFUo1lf.net] それはラキクタにマッチするからボツ(==.)
952 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 10:43:13.94 ID:cY7DSC5H.net] ラキクタにマッチしたらダメって条件にはないんだけど‥
953 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:44:22.65 ID:PqFUo1lf.net] 確かに言葉ではそんな条件は書いてないね、曖昧3cm
954 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:50:18.95 ID:zxzLPr4V.net] ^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
955 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:14:21.11 ID:sAJhyk0D.net] ^(?=A)(?=B).*$
956 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:18:03.55 ID:PqFUo1lf.net] >>916 を読めば文字順通りと受け取るのが妥当だね ちなみにもしこのコマンドがあったら簡単に書けた https://www.proxomitron.info/45/help/Matching-Commands.html#TST ^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$ perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理 dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう // \1 に日本語表記での色が代入される blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
957 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 13:00:30.59 ID:RnAsJxc7.net] >>924 ^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$ (?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3) キキムタククク
958 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 18:04:12.94 ID:328LomOy.net] キムラタクヤ人気で🌿
959 名前:デフォルトの名無しさん [2023/11/03(金) 19:14:55.49 ID:3J2AA+3k.net] >>937 他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
960 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:09:52.31 ID:PqFUo1lf.net] 知ってる外部コマンドは使っていいに決まってる 頭の中では質問見た瞬間に出来てたよ
961 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:13:40.11 ID:/gQFYHMn.net] 「課す」を「はたす」って読んでるってマ?🤣
962 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:12:42.60 ID:PqFUo1lf.net] この外部コマンドを考えた方は2004年に亡くなっている https://en.wikipedia.org/wiki/Scott_R._Lemmon 20年前にこのコマンドを実装済みだったのはやばいな perlの正規表現ですらそんなに機能が無かった時代だ
963 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:17:14.08 ID:N1OKG/2k.net] 最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
964 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 08:36:40.13 ID:w1sIftMp.net] (正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
965 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 11:16:01.85 ID:PZuBSK2Q.net] カラクリを簡単に説明しよう 1、 (?:キ?ム?ラ?) で文字順を固定 2、 その他の部分でカッコ内でマッチする文字数の制限をかけている 例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう \1が捕獲した中身は0文字に
966 名前:なる (?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる (?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない 結果的にこれが文字数制限になっている ちなみに正規表現にカウント機能があればもっと簡単に書けていた ( (?:キ$COUNT(x))? (?:ム$COUNT(x))? (?:ラ$COUNT(x))? ) $COUNT(0<x) perlは(?{code})でカウント可能、鬼車もカウント機能を実装済 [] [ここ壊れてます]
967 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 14:47:51.87 ID:Xn6+uSVd.net] perlジジイこのスレでも自演してんのかw
968 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 17:37:08.01 ID:PZuBSK2Q.net] COBOLジジイからperlジジイにランクアップ
969 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:03:00.89 ID:q8heJbgz.net] サクラエディタ // 1 \1(a) // 2 \k<name>(?<name>a) 2は1を名前付き括弧にしただけ 1は実行してもマッチに失敗するだけだが2はエラー これはどちらもエラーになるほうが良い
970 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:07:33.08 ID:q8heJbgz.net] ん?本当にそうか?分からん
971 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 15:52:16.56 ID:q8heJbgz.net] 2がエラーになるのは誤りだ、異論ある? いつもの超優秀な人(AI?)の意見を聞かせて欲しい
972 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 06:59:13.82 ID:j6L5l5bH.net] 異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる この問題に長年気付かないとは考えられないから 本来動くべきサンプルを貼って>>949 の件は終了とする x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK x2("(?:\\1b|(a))+", "aab", 0, 3); // OK x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
973 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 19:00:47.89 ID:j6L5l5bH.net] 回避策 x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
974 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 17:50:43.57 ID:Karf8A+O.net] 文字列の頭に部分一致するパターンなんですが・・・ 「abcdefg」にマッチするパターンですが、 /^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/ と書くしかないですか? 文字列が長大な場合、ちょっと無理なんですが・・・ (文字はアルファベットとは限らず) WindowsのJScriptですが。
975 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:12:27.94 ID:ctqB5947.net] /^abcdefg/
976 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:41:54.66 ID:/mJ+eeiZ.net] 無いんじゃないか? ^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a) とどっちがマシかな
977 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:47:23.08 ID:7i/8qZTv.net] /^m/ にマッチして map だけマッチして欲しくない /^m[^a][^p]/ これだと man にマッチしてくれない どう書けばいいですか
978 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:53:22.83 ID:4tHpE5Jq.net] >>957 否定先読みが使えるなら^m(?!ap)かな?
979 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 15:59:06.48 ID:7i/8qZTv.net] ありがとう
980 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 04:25:56.84 ID:gwXFy+9L.net] 特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?
981 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 06:13:31.18 ID:28WV0iMa.net] \Eが来ると困る
982 名前:デフォルトの名無しさん [2023/11/28(火) 12:33:08.74 ID:vIU65Zk5.net] 正規表現スレがいいと聞いてきました ここがいい正規表現すれですか? $ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"' [abc][] なんで後ろにカッコが来るん? .*に全部マッチするんだから 二個目の[]が来るなんてお菓子にゃん?
983 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:42:04.64 ID:EkqG9ePT.net] perlよく知らんがgとったら消える
984 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:54:45.94 ID:uy7CvN4q.net] 推測だが、 1) .*にabcがマッチする -> [abc] 2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
985 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 14:25:52.10 ID:uy7CvN4q.net] 2回目は$a=""の場合と同じだと思えばいい ヌル文字列でも.*だとマッチするでしょ?
986 名前:デフォルトの名無しさん [2023/11/28(火) 16:18:10.81 ID:vIU65Zk5.net] >>963 gとったら消える。Rubyも同じらしい。 >>964 []が出るってことはなにかにマッチしてるってことでしょ? >>965 それなら最初の.*にもマッチするじゃん? 一回目にマッチしなくて、二回目にマッチする理由がわからんのよ
987 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:18:30.67 ID:JJPCdnVt.net] 仮に2回目でマッチする何かがあったとしても .*はgreedyなんだから1回目で消費してないとお菓子イイ
988 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:20:34.59 ID:JJPCdnVt.net] でもなぁ バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
989 名前:デフォルトの名無しさん [2023/11/28(火) 16:21:19.02 ID:vIU65Zk5.net] $ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"' [abc][] $ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"' [abc][] 後ろに$入れても同じ 行末以降の何にマッチしてんのこれ?
990 名前:デフォルトの名無しさん [2023/11/28(火) 16:22:48.63 ID:vIU65Zk5.net] Rubyのコードも持ってきた。持ってきただけだから意味は知らん。 ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }' [abc] ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }' [abc][]
991 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:44:51.01 ID:wVUnEJO+.net] ググってみたがperlのそういう”仕様”として定着してるみたいだな 引っかかったことなかったわ
992 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:47:59.11 ID:uy7CvN4q.net] >>968 1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは どの正規表現環境でも同じだと思うよ
993 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:49:01.41 ID:CppHkuHl.net] 0文字と一致させたくなければ.*ではなく.+と書けよ
994 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:59:51.73 ID:fB6/42vV.net] >>972 Perlの文字列はNull Terminatedされてないよ /gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ 個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね regex101で試すとRustだけが一般に期待する動作をしてる
995 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 17:02:27.57 ID:fB6/42vV.net] /(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい ^を入れたら当然防げるけど
996 名前:デフォルトの名無しさん [2023/11/28(火) 17:09:04.46 ID:vIU65Zk5.net] >>971 探したけど見つからんかった。 どこにあった? or どうやって探した? キーワードがわからん
997 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:08:10.66 ID:waKUlTL5.net] これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
998 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:30:16.15 ID:mMoqXMUf.net] (ハクション!
999 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 19:16:57.98 ID:6l9rHssS.net] 単に便利だからゼロ幅マッチさせてるん $str =~ s/()/$1,/g; やってみるといいのん
1000 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 13:08:47.77 ID:yvH2v9xT.net] 正規表現検索は失敗しないかぎり終わらないって話では abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅 残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される 残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
1001 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 14:41:21.44 ID:lw8jVmFR.net] そういうもんだと思って使ってたわ それをバグだと思ってる人がいてびっくりぽんや しかしこういうことに疑問を持つ人は今後伸びるで
1002 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 17:53:32.44 ID:AoutXZD6.net] >>980 その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき 1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
1003 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:01:27.70 ID:lw8jVmFR.net] 確かにその通りやな、1度目で消費しきっとるはずや
1004 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:06:42.76 ID:lw8jVmFR.net] 分かったつもりになってるだけで全然分かってへんのがおるから ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
1005 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 20:04:08.42 ID:x7bR/xfi.net] /(.*)$(.*)$((.*)$){999}/
1006 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 22:25:25.39 ID:yvH2v9xT.net] >>985 えーと、つまり ・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能 ・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない てことかな? 2回目以降が発生するかどうかは、、どうなんだろう 前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
1007 名前:デフォルトの名無しさん [2023/12/01(金) 02:37:28.94 ID:07OBAnmr.net] sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね 元はPerlのバグだったのが仕様ってことになったのでは? $ printf 'abc' | sed 's/\(.*\)/[\1]/g' [abc] $ printf 'abc' | sed -E 's/(.*)/[\1]/g' [abc]
1008 名前:デフォルトの名無しさん mailto:sage [2023/12/01(金) 08:09:57.11 ID:RWimeGTM.net] /^\w+|$/[$&]/ これが[abc][]になるのはおかしいと感じないよね? 前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
1009 名前:デフォルトの名無しさん mailto:sage [2023/12/02(土) 00:36:44.31 ID:/f7jnFb0.net] 挙動を仕様書で厳密に定義しているJavaScriptではこうなってた https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace ・1回目のマッチが "abc" すべてを消費する ・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する ただし空文字にマッチした場合、先へ進まなくなることを回避するために 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下) これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
1010 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:24:41.69 ID:Ug9Hn2aN.net] KEEPのKはあるのにPが無い、何故?
1011 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:31:35.71 ID:Ug9Hn2aN.net] (?<=uma)musu(?=me) 柿憎い uma\Kmusu\Pme 柿安い
1012 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 09:57:52.47 ID:8JqB6SG/.net] >>988 思うよ +の後に$を置けば余計にそう思う
1013 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 13:04:54.79 ID:t3u5G9tC.net] $は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
1014 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 14:15:57.63 ID:ayXeZXuA.net] 実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
1015 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:43:26.80 ID:e6Tz3fj/.net] .*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな 正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる $ printf 'abc' | sed -E 's/.*|$/[&]/g' [abc]
1016 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:44:52.66 ID:e6Tz3fj/.net] s/バク/バグ/
1017 名前:デフォルトの名無しさん mailto:sage [2023/12/13(水) 11:48:29.08 ID:wzNHEkEB.net] ただの仕様だよ、あほらし 次スレよろ
1018 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:00:59.04 ID:KMxF6SWS.net] 次スレ https://mevius.5ch.net/test/read.cgi/tech/1702684760/
1019 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:36:31.90 ID:pgUnJUCg.net] 天地無用
1020 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 10:49:04.16 ID:faoSWywL.net] >>998 ほめてつかわす
1021 名前:1001 [Over 1000 Thread.net] このスレッドは1000を超えました。 新しいスレッドを立ててください。 life time: 772日 14時間 59分 3秒
1022 名前:過去ログ ★ [[過去ログ]] ■ このスレッドは過去ログ倉庫に格納されています