1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net] Regular Expressionスレです。 質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。 前スレ Regular Expression(正規表現) Part15 https://mevius.5ch.net/test/read.cgi/tech/1568640311/ 次スレは>>980 宜しく 天ぷら等>>2 以降
452 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:07:09 ID:4sOf+wSV.net] >>441 MSはかつてそういう指摘に応えて使用する用語を変えてきた実績があるよ 一度決めたら二度と変わらないって会社ではない
453 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:11:53 ID:4sOf+wSV.net] >>441 Oracleは日本語を正とせず英語を正としろって立場を採ってるよね 誤訳がありうるってことだし、誤訳によりライセンス内容の整合性がとれなくなったMSの事例もあるね
454 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:25:49 ID:mmXAp8Yt.net] なんだなんだ 「強欲」って用語が指していることを理解してなくて会話がかみ合わなかった週末の人、 数日経ってもまだ「ぼくちゃんまちがってないもんえいごだとこうなんだもん」って駄々こねて80レス位進んでるのか・・・・・ ちょっとした勘違いとかちゃんとした日本語のドキュメントに目を通してなかったとか誰にでもあることなんだから それこそ貧欲って書いてた人みたいに一言間違ってたわwって言うくらいで収まることだと思うんだけどなあ 悪いけどやってること恥の上塗りだよ?
455 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:35:51.78 ID:K5Eu4yGw.net] もう ひんよく と きょうよく でいいよ
456 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:07:33.30 ID:mmXAp8Yt.net] 同一人物のくせに他人のフリとかどんだけ面の皮厚いんだよ・・・とか一瞬思ったけど ID:K5Eu4yGw と ID:nkFK6+7O ID:4sOf+wSV は別人だったのか 見分けついてなくて同一レベルのゴミかと思ってたわごめん
457 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:30:45.62 ID:JtY8aViY.net] 口語だと基本的に最短一致、最長一致、バックトラックしない最長一致って言ってる 欲張りとか強欲とか実際に口に出して言ってる人には出会ったことないわ
458 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:50:11.96 ID:MNnvUB1p.net] (非探索)最長一致 (最)多一致 (最)少一致 どちらも「最長」だと紛らわしさがあるので でも「強欲」で定着しているものをわざわざ言い換える程の事でも無いと思う
459 名前:426 mailto:sage [2022/07/06(水) 00:22:09.50 ID:ToTyGXGb.net] >>428 \x0085を\x{0085}に変えて [\s&&[^\r\n\x{0085}\x{2028}\x{2029}]]でOKでした 積演算&&の有効な使い方を初めて知りました どうもありがとうございました
460 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 02:03:37 ID:7JN09BFV.net] \R*+\K\s
461 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 05:39:49.51 ID:FCzm9xaa.net] 口頭ってことは対面レビューとか他の人と共有するソースコードでの正規表現だよね? そうなると、相手のスキルレベルにもよるけど 「強欲」って単語だけで
462 名前:なく強欲な正規表現自体も避けておくかなあ このスレのうんざりする流れを見てもわかるとおり「強欲」が相手に通じるとは限らないし (強欲な正規表現なんて使ったことがない人のほうが多数派だろうし) 最長一致で事足りるなら多少のパフォーマンス悪化には目をつぶる チャットとかなら「++」みたいな具体例を明示して「強欲」って単語を使うかな ここみたいな正規表現スレならなにも前提を置かなくとも普通に「強欲」で通じるものとして会話するけど・・・ 会話が成り立たなかったうえに間違いを指摘されても「英語だと」「口語だと」「xxxだと」とか延々ゴネる人とは会話したくないなあ いい加減NGしたいからコテつけてくれるとありがたい [] [ここ壊れてます]
463 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 06:39:20.23 ID:5qGkM3IH.net] しかし回答者のレベル低下が酷いな ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな $1,$2の件や強欲のすれ違いについても積極的に事態の収集を図ろうとせず悪化させて悪乗りするとはね
464 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 06:47:28.85 ID:TTp+bFLp.net] 英語名を変えさせたら良い gohyork yorkvary muyork 対応して日本語名もカタカナ表記で ゴヨーク ヨークバリー ムヨーク そういう『名前』としてしまえば解決 一意な名称を与えた方が誤解も少なくなるだろう > 強欲な正規表現なんて使ったことがない人のほうが多数派だろうし それはあまりにもレベルが低すぎじゃね? 知らない者が学ぶべきであって触りすらも学んだことの無い者へ合わせる必要なんて無い
465 名前:298 [2022/07/06(水) 06:53:49.49 ID:ZAN9ui5m.net] >>361 > それ書いてる>>314 には$1なんてどこにも書いて無いのにw つまり、>>314 の「,」があまりに小さくて見えなくて、 (?<=店)[^〒]*?〒\d{3}-\d{4}\s++ これしか書いてなくて、 2行目の$1,$2を省略したと思ったのですw
466 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:02:49.27 ID:5qGkM3IH.net] ここの回答者はそう勘違いしてるのを知ってて何も助言しなかったんだぞ、馬鹿にして笑ってたんだよ このスレは過疎たせいで悪質な初心者が上級者ヅラするようになってしまった
467 名前:298 [2022/07/06(水) 07:06:06.70 ID:ZAN9ui5m.net] 秋葉原店 専門店 住所 〒101-0021 東京都千代田区外神田4丁目3-3 TEL 0570-024-511 ~ ~ で、さらに教えて欲しいのですが、 前回と同じ質問ですが、 店名と住所を抽出したいです。 で、↓を使いたいのですが、 店を抽出キーワードにすると、専門店とか店舗詳細とかの「店」も拾ってしまうのです。 で、データをよくみると、「 秋葉原店」のように店名の前にスペースがあります。 で、 ( )(?<=店)[^〒]*〒\d{3}-\d{4}\s++ と、やってみたのですがダメでした。 どうすればよいでしょうか? (?<=店)[^〒]*〒\d{3}-\d{4}\s++ ←は>>314 さんの教えてくれたヤツ。
468 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:09:45.51 ID:SZC2q9b+.net] これ非包含演算子に粘着してるのと同じやつだろ 粘着気質と承認欲求丸出しのマウンティング気質が全く同じ
469 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:46:05.23 ID:o/55z/m0.net] >>453 再質問来てるぞ > ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな おまえがお手本見せてやれや 回答者をバカにするくらいだから余裕だろ? >>457 >>320 使い方分からないならJSスレか初心者スレ行って聞いたらいい
470 名前:298 [2022/07/06(水) 08:07:45.17 ID:ZAN9ui5m.net] >>459 ↓って英語だからどうやって使っていいのかわかりません。 https://pastebin.com/M6LqV15b
471 名前:デフォルトの名無しさん [2022/07/06(水) 11:44:54.56 ID:MXaUuSJv.net] まず英語の勉強をするべき
472 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 12:10:15.16 ID:c6fRPAAn.net] CSV の正規表現なんて、数千行ぐらい掛かるだろ。 HTTP の正規表現でも膨大だろ 行区切り文字の改行 列区切り文字のカンマ クォート文字のダブルクォーテーション。 クォート文字が無くても、意味が変わらなければ省略できる クォート文字内では、行区切り文字・列区切り文字の効果がなくなり、単なる文字となる。 クォート文字内で、連続した2つのクォート文字を使えば、 クォート文字の効果がなくなり、単なる1つのクォート文字となる もし、クォート文字の対応関係が崩れたらエラー。 クォート文字の数は、必ず偶数個である こんな膨大な条件判断を書けるわけない。 条件判断とか構造があるものは、正規表現では無理。 こういうものは、Ruby などのパーサーを使わないと無理 CSVをawk などで処理している香具師とか、CSVの構造を分かっていないから、 こういう特別な意味をもつ文字が混じると、バグル
473 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 13:40:21.16 ID:gR1YTmZs.net] >>462 なんでCSVのパースする前提になってるんだ? webの店舗情報のテキストをCSVにするのになんでクォート内の対応を気にする必要がある?
474 名前:デフォルトの名無しさん [2022/07/06(水) 15:43:31.34 ID:MXaUuSJv.net] KEИTAはでたらめ
475 名前:462 mailto:sage [2022/07/06(水) 17:15:52.66 ID:c6fRPAAn.net] 行区切り文字の改行、列区切り文字のカンマ、 クォート文字のダブルクォーテーション CSV データ内に、こういう特別な意味をもつ文字が混じると、バグル これらの文字が無ければ、Ruby などのCSVパーサーを使わずに、 awk などで処理しても、バグらない
476 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 17:19:01.24 ID:QeuQIz9d.net] なんか話脱線マウントしまくって会議やコードレビュー下手くそで顰蹙を買いまくってそうな人来てるやん
477 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 17:55:19.63 ID:gR1YTmZs.net] >>465 混ぜなきゃいいのでは
478 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:01:53.46 ID:kQhbtDqq.net] いつも文体一緒だからバレる
479 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:30:39.95 ID:5qGkM3IH.net] >> 298 「店」が無い店もあったからHTMLソースから取り出すようにしたよ ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して 1回目の検索欄 ^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s* </h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$ 1回目の置換欄 うんこ$1,$2 2回目の検索欄 ^(?!うんこ)[^\r\n]*$[\r\n]+ 1回目の置換欄 ( 空欄にして ) 2回の置換が終われば店舗一覧が完成しているはず 1回目の検索欄は長すぎるから2行に分割したよ、1行に繋げてから使って 検索欄や置換欄に記入するときは前後に余計なスペースやタブ文字が紛れ込まないように HTMLの細かい変化にはなるべく対応出来るようにしたけど店舗一覧のページがリニューアルしたら使えなくなるよ
480 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:34:28 ID:5qGkM3IH.net] ミスった 1回目の置換欄 ( 空欄にして ) これは2回目だね
481 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:39:45 ID:5qGkM3IH.net] 全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽 「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて
482 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 23:10:34.54 ID:gFUK7vgi.net] ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw
483 名前:デフォルトの名無しさん mailto:sage [2022/07/07
] [ここ壊れてます]
484 名前:(木) 16:29:53.46 ID:ls1FMHZL.net mailto: そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか [] [ここ壊れてます]
485 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 16:37:27.46 ID:3hUwVJb0.net] 掃除して整形してからやるのがコスパ良いに決まってる 力業いくない
486 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 17:27:59.03 ID:EezL89dt.net] ケースバイケースやろ
487 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 17:45:22.88 ID:QZNfJ5wA.net] 答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発 合ってるか分かり難い場合は間違い難い正規化式で段階踏む
488 名前:デフォルトの名無しさん mailto:sage [2022/07/08(金) 12:52:02 ID:/znuHP85.net] パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。 処理A | 処理B | 処理C Ruby の正規表現では、3種類の改行を、\R と書ける /\r\n|\r|\n/ /\R/
489 名前:デフォルトの名無しさん mailto:sage [2022/07/10(日) 17:44:55.47 ID:0O2dRiW8.net] >possesive ポジティブ
490 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 01:09:47.27 ID:gUwlqT3Y.net] そして誰もいなくなった
491 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 09:09:55.88 ID:L4T2PUf2.net] 民度の低い異常者が常駐してたらそりゃ関わりたくないもん
492 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 11:12:47.12 ID:WasoqaBj.net] 自己紹介乙
493 名前:デフォルトの名無しさん [2022/07/20(水) 06:49:04.62 ID:v4tHM0fs.net] ●Regular Expressionの使用環境 秀丸 ●検索か置換か? 置換 ●説明 同じ文字+間に要らない文字列+同じ文字 を 同じ文字 一つにしたいです ●対象データ [ぬるぽ & ぬるぽ] [ガッ-ガッ] [hoge & hoge] ●希望する結果 ぬるぽ ガッ hoge よろしくお願いいたします。
494 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 07:23:49 ID:iuCM0uSo.net] 説明にない[は何?
495 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 08:35:20.99 ID:jm1i1IHH.net] >>483 すみません希望する結果はこちらでおねがいします [ぬるぽ] [ガッ] [hoge]
496 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 09:04:35.27 ID:Fdf9zFh2.net] テスト \[(.+?)(.*?\1)\](?\2)
497 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 16:27:05.86 ID:f63hBcuy.net] (.+).+?\1 $1
498 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 16:30:30.08 ID:OlkAUELc.net] [ wow & wow]
499 名前:482 mailto:sage [2022/07/20(水) 17:48:38.07 ID:VWdn2Di+.net] >>486 さんの正規表現で上手くいきました ありがとうございました
500 名前:デフォルトの名無しさん [2022/08/28(日) 01:14:30.52 ID:y+9tLdhC.net] 正規表現の先読み・後読み https://zenn.dev/usamik26/articles/regex-lookahead
501 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 07:40:58.02 ID:MbqzPdhg.net] perlでは/.*hoge/より/.*?piyo/の方が圧倒的に速いのか ステップ数は大して変わらなそうなのに
502 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 08:17:37.04 ID:e6Sjxbuq.net] >>490 perlに限らずそりゃそうだろ "hoge...めっちゃ長い文字列..." ってあったら /.*?hoge/ なら最初の hoge でマッチしたと判断できるけど /.*hoge/ だと最後まで見ないと判断できない 最後に hoge ってある可能性があるから
503 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 08:52:32.95 ID:7Mb5USF7.net] >>491 hogeじゃなくてpiyo "hoge...めっちゃ長い文字列...piyo" ってあったら /.*?piyo/ と /.*hoge/ は同じくらいだと期待するでしょ 489のコメントの比較テストを見てなんでそうなるのかなと
504 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 09:11:11.32 ID:dcB5AKwO.net] >>492 そりゃそういうケースもあるけどそうでないケースの方が多いだろ
505 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 10:55:00.88 ID:V92k17Tf.net] 489の記事・コメントを見たけど 「.*hoge.*」 と 「.*?hoge」 の比較をして後者のほうが圧倒的に早いって記述はあったが 490の言ってる比較はどこにも見当たらないようだけど・・・? 492の >hogeじゃなくてpiyo はもっと意味不明だな 「/.*hoge/」 「/.*?piyo/」 の違いで、491は「.*」「.*?」の違いで速さが変わるのが当たり前って話をしてるのに "hoge...めっちゃ長い文字列...piyo"みたいな極端な例を突然出してこられても
506 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:06:13.62 ID:3aiLuiYL.net] マッチする場合はそれほどステップ数は変わらないけど マッチしない場合のステップ数の差は大きいね
507 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:10:20.88 ID:iCw3MfJc.net] (?s:^(?=.*(?:トビラ|280|280|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ))) これって何か間違ってますか?280が消えない時があります
508 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:33:21.57 ID:4oWDpmI8.net] [22][88][00] こういうこと?その消えない時のレス見ないと正確なことは分からんよ 後ろが一致してないのかもだし数値参照かもしれんし
509 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 14:30:01.62 ID:HKThARKH.net] なぜ組み合わせたいのかがよくわからんな 後半のパターン部分を素で書けば良いと思うんだけど、あえて暴言を目視したいスレでもあるんだろうか?
510 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 14:36:53.39 ID:q8tm2XHG.net] 単発のNGの他に連鎖NGとかIDごとNGとかあるだろ わからないなら黙ってろよ
511 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 16:16:08.48 ID:XxcpkpFs.net] ごめん
512 名前:デフォルトの名無しさん [2022/09/04(日) 01:47:12.24 ID:0/i0sC9q.net] GNU grep 3.8 (2022-09-02)から-Pオプションのリンク先がPCRE2になったらしい それ以前は古いPCREだった -Pオプションが機能しないWindows版grepバイナリには関係のない話だけど
513 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 07:42:45.45 ID:pCQ9P7Vy.net] 1 2 あ 10 77 100 150 1000 3桁までの数字のみをする場合 [0-9]{,3}だとダメでした 正規表現チェッカーでいろいろ試しているですが分かりません 200までの数字だとどうしたらいいですか?
514 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 08:41:45.13 ID:x2tuNrOY.net] ttps://www.simple-edition.com/prog_memo/number_range_regexp/ [1-9]|[1-9][0-9]|1[0-9]{2}|200 で範囲を作ったものを ttps://weblabo.oscasierra.net/tools/regex/ ここに代入しても使えませんでした 「正規表現」の意味合いが違うんでしょうか?
515 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 09:08:03.10 ID:MIQciAoV.net] >>503 それだと92000の200にもマッチしてしまうよ インド数字等を気にしないなら[0-9]は[\d]でもOK (?<![0-9])(?:200|[1][0-9]{2}|[1-9][0-9]|[0-9])(?![0-9])
516 名前:デフォルトの名無しさん [2022/09/04(日) 09:46:10.78 ID:ZQZ632xa.net] >>503 [0-9]{1,3} これだと結果でるようだけどそのサイトm値省略不可なのでは 他に | のorも説明ないようなのでダメとか 正規表現文法どこまで対応してるかは動かす環境次第なので質問テンプレートにも入力項目になってんだけど >>1
517 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 10:07:01.01 ID:qlj2b1lm.net] すまない ●Regular Expressionの使用環境 iPhone,a-shellというアプリ ●検索か置換か? 検索 ●説明 フォルダ内にある写真を圧縮するため ●対象データ 1から200などのjpegとかの画像 ●希望する結果 検索してそれをまとめて圧縮
518 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 10:19:49.12 ID:NNtN3+VI.net] まあ案件次第だけど > 200までの数字だとどうしたらいいですか? とかなら\d+で取得してアプリケーション側で弾くのが後の保
519 名前:守を含めて簡単かと思う [] [ここ壊れてます]
520 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 19:48:53.80 ID:aae9uQ50.net] スルーされにくい質問のテンプレと例 ●Regular Expressionの使用環境 PowerShell7.2 ●検索か置換か? 置換 ●説明 文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい ●対象データ 123000444 000123000 1230000000444 ●希望する結果 123-444 000123000 123-444 よろしくお願いいたします。
521 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:02:34.86 ID:BFM47HY2.net] (?<!^)000+(?!$) -
522 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:23:28.22 ID:el3nukes.net] 00000 → 0-0 ?
523 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:37:38.14 ID:G28B9gdh.net] ああ、 00001200030000 を 0-12-3-0 とするのか (>>509 のやつ) 先頭末尾に繋がっている0は無視したい 000012-30000 のか例からだと不明だね
524 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 21:45:26.67 ID:aae9uQ50.net] 508です。 早くもいろいろご回答いただきありがとうございます。 そしてすみません、みなさまのリプを見て自分の考えが足りなかったことに気付きました… 変換は一度だけ、先頭から数えてもっとも近いもののみです。 正しく書き直します、すみません。 スルーされにくい質問のテンプレと例 ●Regular Expressionの使用環境 PowerShell7.2 ●検索か置換か? 置換 ●説明 文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい (先頭から数えて最初の一致のみ) ●対象データ 123000444 000123000 1230000000444 12000045600006 ●希望する結果 123-444 000123000 123-444 12-45600006 よろしくお願いいたします。
525 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:09:54.11 ID:jeF3JQfM.net] >>511 > 先頭末尾に繋がっている0は無視したい こんな条件どこから出てきたんだ?
526 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:20:12.97 ID:GLLSFlxd.net] 「文中(先頭及び文末以外)の0」が連続して3つ以上並ぶ部分 文中(先頭及び文末以外)の「0が連続して3つ以上並ぶ部分」
527 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:24:49.17 ID:clq+OpKM.net] ^([1-9]+)0+(\d+)$ --> $1-$2 でいかがでしょう
528 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:33:07.80 ID:clq+OpKM.net] あ、「ゼロ3つ以上」を満たしてなかった また考えますー
529 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:35:39.26 ID:clq+OpKM.net] ^([1-9]+)0{3,}(\d+)$ --> $1-$2 でしょーか
530 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:46:39.11 ID:7uE/UK4/.net] 010001
531 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:08:19.66 ID:G28B9gdh.net] >>513 > 文中(先頭及び文末以外)の0が の説明と例からだと 「先頭以外」が先頭の0、1文字を指すのか 先頭から続く0の塊を指すのか不明でしょ > 3つ以上並ぶ部分 が強欲なのか?欲張りでいいのか?が不明 >>511 さんの質問だね
532 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:09:06.59 ID:G28B9gdh.net] >>519 訂正、>>510 さんの質問
533 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:10:13.89 ID:aae9uQ50.net] みなさんありがとうございます! できそうな正規表現がありうれしいです。 すみませんが今手元に環境がないため明日動作させて確認します。
534 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:20:09.73 ID:aae9uQ50.net] そして自分でも要件を言葉にできておらず申し訳ありません みなさんに質問いただいて初めて気付きましたが、 先頭及び末尾が0であった場合、そこから連続する0は除外する ができると一番望ましいです。 00001200034000 ↓ 000012-34000 となります。 返信遅くなりすみません。
535 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:44:59.39 ID:G28B9gdh.net] (?<!^)(?>0{3,})(?!$) 未test 最初のマッチだけ置換は以下 https://social.technet.microsoft.com/Forums/ja-JP/ad0f7263-3fd1-4545-b554-e796d27ef948/263682102112398125101248312481?forum=powershellja
536 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 00:51:16.34 ID:4SNfctPQ.net] >>518 あかんすね… ^(0*)((0{0,2}[1-9])+)0{3,}([1-9]\d*)$ --> $1$2-$4 これはどーでしょう?
537 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 05:23:58.73 ID:E5sTi1VY.net] ([1-9])0000*([1-9][0-9]*) $1-$2
538 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 09:12:22.80 ID:Kn3Wl+2J.net] (?<=[1-9])(?>000+)(?!$)(.+)$ -$1
539 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 09:38:59.41 ID:s0UMl1ds.net] (^[^0].*?)0{3,}([^0].*?$) $1-$2
540 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 10:42:18.62 ID:6Qq1IObP.net] ○ >>524 ,525,526 ✕ >>523 ,527
541 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 19:22:12.74 ID:+0SwTq6N.net] 508です。 沢山の案ありがとうございました、本当に助かりました。 一通り試して正しく動くものは沢山あったのですが、 以下の方式で解決させていただきました。 $reg=[regex]'([1-9])0000*([1-9][0-9]*)' $reg.Replace($str,'$1-$2',1) また、上記の案以外もこんな解決方法があるのかととても勉強になりました。 そして自分が要件をまとめられてなかったことにも反省いたしました。 今後はこちらで回答する側になれるよう、再度勉強いたします。 重ね重ね本当にありがとうございました。
542 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 19:57:00.91 ID:b2aEm1i9.net] 回答にある正規表現は置換回数を指定できない置換方法でも大丈夫 置換回数に1を指定する方法でやるなら単に ([1-9])0000*([1-9]) でもいい
543 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 22:22:31.78 ID:+0SwTq6N.net] >530 確かに、教えていただいたこともりもりにしてしまいましたが わざわざ[1-9]のあとに[0-9]を入れている意味がないですね…。 ご指摘ありがとうございます。
544 名前:デフォルトの名無しさん [2022/09/18(日) 12:56:41.18 ID:QaJ1iFM2.net] githubで結構探したんですがそれっぽいのが見つからず、お力お貸しください。 ●Regular Expressionの使用環境 AutoHotKey1.1系 ●検索か置換か? 置換 ●説明 2つのクォーテーションマークに囲まれたパスのうち、1つ目(app.exe)を削除したい。 囲まれたパス同士は半角スペースで接続される。 ●対象データ "D:\Dir_Path\_app.exe" "D:\Dir_Path\_script.ahk" ^^^^^^^^^^^^^^^^^^^^^^^ ●希望する結果 "D:\Dir_Path\_script.ahk"
545 名前:デフォルトの名無しさん mailto:sage [2022/09/18(日) 16:16:05.56 ID:wjpqonb4.net] >>532 https://regex101.com/r/zxuEpo/1
546 名前:デフォルトの名無しさん [2022/09/18(日) 19:20:15.15 ID:/uA/jgNo.net] >>533 ありがとうございますめちゃくちゃシンプルでした!あとこのregexサービスいいですね ".*"\s だと構文エラー吐きました 置換関数内(””の中)で”がうまく扱えないので頑張ってみます。
547 名前:デフォルトの名無しさん mailto:sage [2022/09/18(日) 21:26:30.42 ID:CbZe8FP4.net] "を \" や \x22 に置き換えて試してみてわ
548 名前:デフォルトの名無しさん [2022/09/19(月) 16:41:30.36 ID:4iw9Mtek.net] >>535 ありがとうございます、いけました (ついでに””も削除) \x22.*\x22\s|\x22
549 名前:デフォルトの名無しさん mailto:sage [2022/09/20(火) 02:58:09.09 ID:94I1wBUa.net] 二重引用符のエスケープは重ねて""だな "".*""\s
550 名前:デフォルトの名無しさん mailto:sage [2022/10/29(土) 13:09:46.30 ID:ec13kmtS.net] ●Regular Expressionの使用環境 PCRE2 ●検索か置換か? 検索 ●説明 (..[\0@-g]\0){147}などを高速に検索したい ●対象データ メガ単位のバイナリファイル(リトルエンディアン) ●希望する結果 説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で 一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです 現状PCRE2で検索は出来ていますが、Intel Hyperscanだと util/determinise.h:determinise:162:succ_id 16383 >
551 名前:= state_limit 16383 ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA ng.cpp:addGraph:507:could not compile component 0 with 592 vertices と言われて説明の例に限っては正規表現のコンパイルすら不可能です 32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが 「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです 今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです [] [ここ壊れてます]
552 名前:デフォルトの名無しさん mailto:sage [2022/10/29(土) 19:31:13.26 ID:9Ey1MUJ8.net] >>538 \0@って何? \c@でNULL文字検索の意味ではないの?