[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 02/20 03:08 / Filesize : 262 KB / Number-of Response : 1023
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Regular Expression(正規表現) Part16



1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net]
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降

320 名前:298 [2022/07/01(金) 18:15:22.87 ID:FKzEqydA.net]
>>314
ありがとうございます。しかし、 (?<=店) これにすら食いつきません。

321 名前:298 [2022/07/01(金) 18:58:55.44 ID:FKzEqydA.net]
Notepad++をインストールしました。
で、やりたいことは、
https://www.donki.com/store/shop_list.php?bsns=&pref=13
ここから、べーっとマウスでコピペして、
Notepad++に貼り付けて、店舗名,住所のcsvファイルを作りたいのです。

322 名前:298 [2022/07/01(金) 19:04:57.22 ID:FKzEqydA.net]
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++
これでほぼ出来そうです。 ありがとうございます。

323 名前:298 [2022/07/01(金) 19:10:09.57 ID:FKzEqydA.net]
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++
$1,$2

ちなみに、これって$1,$2という変数を使ってますよね?
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++
この文のドコで代入してるのでしょうか?

324 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 19:16:15.59 ID:TWCq9rfx.net]
テンプレをヤイヤイいうだけの奴わろたわw

325 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 19:27:43.82 ID:omlO1tMt.net]
ページからならjsでやったら?って感じの話しだな
https://pastebin.com/M6LqV15b

326 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 19:30:02.45 ID:23LeTIBQ.net]
xy問題

327 名前:元 298様専用の便利屋 mailto:sage [2022/07/01(金) 19:51:17.10 ID:6Nj9t6DP.net]
住所からアニメイトの同志だと思いご協力させて頂きましたがアニメイトではなくドンキだと分かったので
すみませんがこれ以上ついて行くことは出来ません・・ 短い間でしたがありがとうございました、さよなら

328 名前:298 [2022/07/01(金) 21:06:43.33 ID:FKzEqydA.net]
>>322
どうもです。 了解しました。

.+だと文字が何個あってもいいよ、です。
こういうので、
文字でも記号でも改行でも何個あってもいいよ、はないでしょうか?
あるとすれば、
店「」+住所
を、
,
に置換すればいいだけの話なんだけど。



329 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 22:01:19.33 ID:TkUsKSE8.net]
.(ピリオド)は改行コードを除く任意の1文字にマッチする
つまり.*や.+だと改行のところでストップするということ

330 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 22:28:36.91 ID:oUsXu5GC.net]
ピリオドはmオプションつけると改行にもマッチするやで
mオプションがついてるかは環境と指定したオプションによるやで

331 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 22:36:48.49 ID:TkUsKSE8.net]
mオプションじゃなくてsオプションなのでは?

332 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 22:50:04.22 ID:oUsXu5GC.net]
調べてきた
mオプションはRuby、oniguruma系、Meryはこれのはず
sオプションなのはPerl系
Notepad++/SciTEは専用オプションがある
らしい、やってみて確かめたほうがいいね

333 名前:298 [2022/07/01(金) 23:07:58.13 ID:FKzEqydA.net]
ありがとうございます。では、
店.+東京都
に、mオプションを付けるとするとどう書けばいいのですか?
↓にはそれ系の記載がありません。

https://murashun.jp/article/programming/regular-expression.html
https://

334 名前:userweb.mnet.ne.jp/nakama/ []
[ここ壊れてます]

335 名前:デフォルトの名無しさん mailto:sage [2022/07/01(金) 23:25:18.67 ID:oUsXu5GC.net]
Notepad++のことならGUIのダイアログの左下の右に「.は改行と一致」てのがあるじゃろ

336 名前:298 [2022/07/01(金) 23:40:21.16 ID:FKzEqydA.net]
>>329
ありがとうございます。Notepad++で、「.は改行と一致」にチェックをいれて、
店.+東京都
,
で、次を検索でポチると、
最初の東京都ではなく、最後の東京都、つまりほぼ全文を選択してしまいます。

337 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 00:04:51.39 ID:BdV6t7uW.net]
正規表現の基本は強欲
なるべく長い文字列にマッチしようとする

338 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 09:05:29 ID:mrmEg2+h.net]
> 基本は強欲

20年このスレにいて初めて知りました



339 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 09:58:17.51 ID:At3W7bIA.net]
20年正規表現使ってて強欲すぎて困ったことないの?
※ 用語として強欲はあまりいい意味には使わないから個人的には貧欲の方がいいなぁ

340 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 10:08:22.29 ID:N6Y3zR8M.net]
ひんよく? 貧
どんよく 貪欲

341 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 10:24:47.75 ID:ophljRqK.net]
そんなとっくに概出のこと言われても困ります

342 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 12:38:50 ID:mrmEg2+h.net]
貧欲の動作は考えてみればすごく非効率な気がしますね
10万文字の文章に対して「.*」を使ったら10万文字の末尾まで食ってから戻ってきますからね

343 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 13:18:37.74 ID:At3W7bIA.net]
>>334
すまん、素で間違ってたわ... orz

344 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 15:23:26 ID:+K04BJMF.net]
*+ 強欲 ++ 最大一致させたらバックトラックしない
* 欲張り + 最大一致させた後、残りの式が不一致になったらバックトラックする
*? 無欲 +? 欲張りと逆。最小一致後にバックトラック

バックトラック
条件を満たす範囲で探索
・欲張りは1文字放棄
・無欲は1文字追加
して試行する

345 名前:298 [2022/07/02(土) 18:24:54.77 ID:rrBNdWeF.net]
てか、↓の文法的解説をできる方はこのスレにはいないのでしょうか?
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++

346 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 18:51:12 ID:+K04BJMF.net]
(?<=店) 戻り読み。式(店)と次の文字の「間」の位置に一致。abcに対し(?<=ab)ならbとcの間に一致する。アンカー(^$)と同様
[^〒]*? 「〒」以外の文字に最小一致(無欲)
〒 「〒」の文字
\d{3}-\d{4} 「数字3つ」「-」「数字4つ」
\s++ 「\s」に最大一致(強欲)

347 名前:298 [2022/07/02(土) 18:58:50 ID:rrBNdWeF.net]
>>340
ありがとうございます。
$1に(?<=店)を代入しているのはなんとなく理解できるのですが、住所の$2にはどの部分で代入しているのでしょうか?

348 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 19:30:02.98 ID:UTWJe5+B.net]
[^〒]*?〒は最小量指定子使わないで、[^〒]*〒でよいのでは?
この*は0回以上の「〒以外」の文字にマッチだから、貪欲であっても貪欲でなくても、結局一番初めに出てくる「〒」手前までしかマッチできない。



349 名前:デフォルトの名無しさん [2022/07/02(土) 19:38:03.70 ID:UTWJe5+B.net]
>>336
貪欲のほうがコストが常にかかるかというとそうじゃない。
場合によっては非貪欲のほうが大量にバックトラックが発生して計算コストかかることもある。

350 名前:298 [2022/07/02(土) 19:41:17.46 ID:rrBNdWeF.net]
てか、不思議なことに、
1、検索文字列→ (?<=店)[^〒]*?〒\d{3}-\d{4}\s++   置換文字列→ ,
2、検索文字列→ (?<=店)[^〒]*?〒\d{3}-\d{4}\s++   置換文字列→ $1,$2
で、同じ結果が出るんです

351 名前:298 [2022/07/02(土) 19:42:31.78 ID:rrBNdWeF.net]
つまり、2は文法的に間違ってる、ってことですかね?

352 名前:298 [2022/07/02(土) 19:45:54.43 ID:rrBNdWeF.net]
てか、Notepad++はカシコイから、
置換文字列→ $1,$2
を、
置換文字列→ ,
と、置き換えて処理してるんですかね?

353 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 19:46:39.19 ID:+K04BJMF.net]
面白いから見守るわw

354 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 19:57:48.35 ID:+K04BJMF.net]
>>342
一致しない場合に無駄にバックトラックさせることになるだけなので
[^〒]*+〒
と強欲で良いんじゃね

355 名前:デフォルトの名無しさん mailto:sage [2022/07/02(土) 21:11:04.97 ID:FJKEiIOc.net]
>>348
確かにマッチしない場合にバックトラックの発生を抑えるために強欲にするのはありだと思う。
ただ、PCREとかだと[^〒]*〒の場合、Auto Processが動作して勝手に強欲化するから書かなくてもいいはず。
今回のEditorはしらんけど。

356 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 11:46:22.30 ID:DiSdIFQe.net]
初心者のうちは強欲は使わないほうがいい気がする

そもそも鈍器のページから店名と住所を取り出すだけの正規表現を書く場合にキャプチャしない書き方や
バックトラックを抑制する書き方をする必要はない

「策士策に溺れる」になってるから質問者に何を教えるべきなのかもう一度考えるべし

357 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 12:00:27.48 ID:J9cIk4yD.net]
貪欲禁止って*や+を使うなってことけ?

358 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 12:44:06.06 ID:HH+h1Cia.net]
possessiveのことだろ



359 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 13:50:59.22 ID:J9cIk4yD.net]
手足をもぎ取られた気分や…

360 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 14:32:42.77 ID:nkFK6+7O.net]
>>350
初心者が強欲使わないでいつ強欲の動作を知るの?
それとも初心者はみんな量指定子を持つ環境を使うべきって主張かな?

361 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 15:36:23.88 ID:ZjFQgG61.net]
> 使わないほうがいい気がする
「気がする」でついつい無駄コード書いちゃう強迫性不安障害の人かな?

> 「策士策に溺れる」になってるから質問者に何を教えるべきなのかもう一度考えるべし
底辺コーダーが良く使う言い訳
(俺に分かりやすい) 平易なやり方しか認めない!(`・ω・´)キリッ

362 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 17:56:24.35 ID:DiSdIFQe.net]
正規表現を考えるときには複雑な情報を単純化する作業が必要になるんだがそういう意味では質問者のほうが才能がある
「店」と「東京都」という2つのキーワードさえ見つけられれば目的を果たせることを見抜いていた

それに対して回答者たちは単純だった依頼を複雑化させたあげく質問者を困らせ続けた
戻り読みを正規表現の先頭に置いてキャプチャを回避することが本当に処理量の軽減になっているのかも疑問
鈍器のページからテキストエディタで店名と住所を取り出すだけの作業に正規表現の高速化を考えるのはもはやコント

君らには問題を単純化する能力が足りないからその点を改善せよ

363 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 18:00:06.22 ID:ZjFQgG61.net]
>>356
>>340
店の直後から郵便番号まで、と十分に単純だと思うが君はこれが複雑なものに見えるのかな?

364 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 18:09:59.22 ID:hqJYlR9w.net]
>>356
取り敢えず君は書く文章を改善しよう
殆ど愚痴だよねそれ

365 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 18:20:19.30 ID:K4HcDkkQ.net]
どうしようもないケースを除いて「東京都」なんてのをハードコーディングするのは筋が悪いと言わざるを得ない

366 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 18:23:09.07 ID:BZUl5BA7.net]
それはともかく、キャプチャグループが無いのに気づいてないのを指摘してあげろよ
$1,$2に対応するものがないので両方ともヌルになってる

367 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 18:34:54.70 ID:BC52HWP8.net]
>>344
>>346
不思議だとかカシコイだとか面白すぎるんですけどw
それ書いてる>>314には$1なんてどこにも書いて無いのにw

368 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 19:05:13.97 ID:ur8aI9T4.net]
>>356
>>351,354についての答えが欲しい



369 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 19:53:34.01 ID:RqS+SurZ.net]
文章からして発達障害とかそのボーダーでしょ
鉄道マニアとか特撮マニアに多いタイプのガイジ

370 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 19:57:25.2 ]
[ここ壊れてます]

371 名前:6 ID:THTbKALg.net mailto: >>359
あなたPG気質もわかるけど、
その位置が空欄となる可能性がないのであれば
どのみち47都道府県をORで並べるハードコーディングになるよw
[]
[ここ壊れてます]

372 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 19:58:39.99 ID:BZUl5BA7.net]
351は論外だろ
強欲を貪欲に変えてるし

373 名前:デフォルトの名無しさん [2022/07/03(日) 20:14:59.04 ID:Qz5VC9/y.net]
>>365
正規表現のコンテキストにおいて、強欲と貪欲にどんな違いがあるか教えて

374 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:15:30.32 ID:nkFK6+7O.net]
>>365
正規表現に関してはどっちも同じ
なぜなら元の英語greed(greedy)の直訳だから
辞書引けばわかるとおり、greedは強欲であり貪欲でもある

375 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:29:11.54 ID:BZUl5BA7.net]
言葉尻を捕らえても意味ないぞ
+,*を強欲とは言わん

376 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:37:36.27 ID:BZUl5BA7.net]
greedyは貪欲(欲張り)
Possessiveが強欲

377 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:38:07.23 ID:7Xq6ZsUF.net]
「強欲」と「最長一致」が別物ってことすら理解しないまま変な自説を垂れ流してることに気付いてないんだろうなあ
332あたりの皮肉もまったく通じてないみたいだし

378 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:38:53.41 ID:BZUl5BA7.net]
あれ、>>352で指摘されてるじゃん



379 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:39:33.16 ID:nkFK6+7O.net]
>>368
正規表現を理解してない自慢しなくていいから

380 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:45:47.16 ID:nkFK6+7O.net]
>>369
日本語に於ける欲深さは強欲>貪欲ってこと?

381 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:48:18.70 ID:BZUl5BA7.net]
具体例を挙げないとダメなのか?
ググることさえしないのか?
強欲の表現は
?+
*+
++
{n}+
{n,}+
{n,m}+

382 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:51:34.49 ID:nkFK6+7O.net]
納得いった
possessiveを強欲とした誤訳に基づく誤解だな
possessiveを強欲だと捉えてる人は331を誤りだと捉える、
翻ってgreedy, possessiveで理解してる人は貪欲と強欲が変わって何がおかしいのかすらわからない

383 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 20:53:24.55 ID:DiSdIFQe.net]
単純な話が複雑になってきたがこういうのが良くないんだ、プログラミングや正規表現をするなら特にな
単純な話になる方向にもっていくことを考えるべし

強欲の話を複雑化しようとしてる奴を見ればアホに見えるだろう、誰とは言わんが

384 名前:デフォルトの名無しさん [2022/07/03(日) 20:55:43.09 ID:u4Kf+yAq.net]
>>369
それどこのQiitaに書いてあったん?w

385 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:00:18.88 ID:BZUl5BA7.net]
正規表現では強欲といえば何を想起するのかってのは常識だよ
英語自慢はいいけど日本語も勉強してね

386 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:04:50.41 ID:gASOhw8R.net]
鬼車 欲張り(greedy)/無欲(reluctant)/強欲(possessive)
詳説正規表現第2版 欲張り/非欲張り/強欲量指定子
詳説正規表現第3版 欲張り(greedy)/控え目(lazy)/絶対最大量指定子(possessive)
入門正規表現 欲張り/控えめ/独占的

貪欲???

387 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:06:06.84 ID:nkFK6+7O.net]
常識って偏見の塊でしょ知ってる

388 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:09:06.26 ID:BZUl5BA7.net]
じゃあ、強欲でgreedyを指す日本語の解説をどこか例示してくれ



389 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:15:22.52 ID:nkFK6+7O.net]
そんなもの不要でしょ
国語事典に於いては強欲と貪欲に序列はない
英和辞典に於いてはgreedyは強欲ならびに貪欲
和英辞典に於いては強欲も貪欲もgreedy
むしろpossessiveの方こそ欲張りとか独占的って意味になる
そういう意味では入門正規表現の表記が正しいと言えるかもね

390 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:20:26.16 ID:BZUl5BA7.net]
正規表現に関してはどっちも同じ、正規表現を理解してない
と言った口で正規表現の専門用語じゃなくて日本語として云々と言うか?
強情ッ張りにも程があるな

391 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:32:22.16 ID:nkFK6+7O.net]
>>383
ヘルプで学んだから強欲とか貪欲とか書かれてなかったしね
greedyだのlazyだの辞書引きながら覚えた身からすりゃ貪欲も強欲も同じ意味なのもわかるだろ?
強欲と言えば何を想起するかって正規表現の常識はどこで学んだの?原書とか読まないタイプ?

392 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:33:16.77 ID:JPaw0m1w.net]
>>375
スッキリした
possessiveを強欲と訳した人がいたんだね

393 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:37:15.00 ID:JPaw0m1w.net]
possessiveって「独占欲が強い」って意味だから
含意も伝わる入門正規表現の「独占的」が一番いい訳だと思う

394 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:38:14.39 ID:BZUl5BA7.net]
強欲というのを専門用語にしてるわけだから誤訳と言っても仕方ないだろ
誤訳だから俺だけは強欲と貪欲は同じ取り扱いをするよで世間で通じるとでも思ってるのか

395 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:39:37.19 ID:BZUl5BA7.net]
>>385
他の訳にしてるところもあるのは知ってるが
強欲をいう言葉を出してgreedyのことだと解説してるところは皆無だと思ってる
反例よろしく

396 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:42:08.05 ID:THTbKALg.net]
lookaheadの「先読み」はいいけど、
lookbehindの「後読み」も悪しき訳だよね
「戻り読み」の方が方向が理解しやすい

397 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 21:55:07.74 ID:B7Hb5nx0.net]
possessiveが強欲と訳されてるのは、たぶんJava界隈で「possessive (very greedy)」と表記されていたのが「強欲」と訳されて、『詳説正規表現第2版』でもその訳が採用されて広まったのかな
個人的にはうまい訳だと思うけど、英語から入った人が混乱するのは理解できる

398 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 22:44:39.24 ID:R6EXpQG5.net]
>>379
正規表現技術入門 欲張り/控え目/強欲
正規表現辞典改訂新版 最長一致(longest match)、欲張り、貪欲(greedy)/最短一致(shortest match)、無欲(reluctant)/強欲(possessive)



399 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 22:55:10.77 ID:hD5VDdvY.net]
最長最短でいいわ

400 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 23:12:37.67 ID:RqS+SurZ.net]
各日本語名は鬼雲方式でいいわ
ttps://github.com/k-takata/Onigmo/blob/master/doc/RE.ja

401 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 23:31:21.62 ID:C1pvOjRy.net]
lookahead 未来読み、lookbehind 過去読みなら、分かりやすかった

先読み・後読みの、先・後が分からない

402 名前:デフォルトの名無しさん mailto:sage [2022/07/03(日) 23:46:52.53 ID:C1pvOjRy.net]
greedy, reluctant はよく見るけど、
possessive 強欲は知らない

絶対最大量指定子なら見た事がある

403 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 01:04:08.73 ID:ILSPAQNd.net]
Microsoftとかjavaとか強欲を使ってるね
もし本当に知らないというのなら無知すぎると言わざるをえない

404 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 17:32:20.05 ID:ri3Dm2ZG.net]
日本語で正規表現に関して議論するなら知っておいてほしい気はするけど、
訳語を一つ知らないだけで無知とか言わなくても…

例えばperlreは2011年に「強欲な」が「絶対最大量」の表記に変更されているようだし、
触ってきた言語によっては強欲って訳に馴染みが無いのかも

405 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 18:06:20.41 ID:oo1ug/2U.net]
>>388
ストローマン!ストローマンじゃないか!

406 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 18:31:29.79 ID:5WegoFeO.net]
possesiveを強欲と呼ぶのは明らかな誤訳だし
greedyと勘違いするリスクも低くないんだから使わないほうがいい
同じようにgreedyを強欲と呼ぶのもリスクあるから避けるべきだね

407 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 19:19:19.95 ID:rQV6IDNU.net]
perldoc.jpでは「non-greedy」を「非貪欲、貪欲でない」、「non-possessive」を「強欲でない」としていますね

408 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 20:10:42.89 ID:ckHiziij.net]
「ひんよく」の人なら「きょうよく」と読んでしまいそうだしな
「独占的」がベストだという結論ならそれを広めようと思うがどうだろうか?



409 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 20:35:20.72 ID:PN4eFOxq.net]
貪婪/勉強、逐歩/独占、占有、独吐

食べきった文字を二度と吐き出さない=獨吐

410 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 20:35:46.95 ID:4rkDJ26 ]
[ここ壊れてます]

411 名前:m.net mailto: 強欲: 掴んだら(一致したら)放さない
欲張り: 「なるべく沢山」で一致させる。不一致なら掴んでいた文字を放す
無欲: 条件が一致するまで1文字ずつ追加して最小一致させる

単語の直訳がどうかよりも、欲張り・無欲との関係性や動作(バックトラックの有無)のニュアンスとして強欲の方が適していると思われ
[]
[ここ壊れてます]

412 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 20:50:18.31 ID:oo1ug/2U.net]
強欲からpossessiveを連想するのが難しい以上、
possessiveを強欲とするのが適しているとはとても思えない

413 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 21:21:35 ID:4rkDJ26m.net]
それは英語に「欲張り」と「強欲」のニュアンス違いに相当する言葉が無く
どちらもgreedyになってしまうからpossessiveと置いているだけの話で
逆輸入してあちらさんの言葉に合わせるよりは
より本質的に合った言葉を当て嵌める方が理解しやすいし、訳としても正しい

414 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 21:22:02 ID:5E8qS6xJ.net]
いつまでやってんだ?

415 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 21:26:25.77 ID:oo1ug/2U.net]
昔話の欲張り爺さんは強欲爺だろ?
日本語だって欲張りと強欲に序列なんてないだろ
そも強欲は宗教用語だし

416 名前:デフォルトの名無しさん [2022/07/04(月) 21:29:14.26 ID:CMsCi2w4.net]
?サッカーでボール所有率をポゼッション(Possession)と表現するよ

417 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 21:42:50.78 ID:ckHiziij.net]
正規表現という名前自体も正則表現が正しいとよく言われるが正規表現と呼ばれ続けてるね
一度浸透してしまったら変更するのは容易ではないね
ほとんどの人にとっては強欲か独占的のどちらがいいかなんて「意味の違いなんかどうでもいい!変えるな!」だろうな

独占的 (旧名: 強欲)

というように注釈を付けながら変えるのが理想的だが果たして各方面に受け入れてもらえるのだろうか?

418 名前:デフォルトの名無しさん [2022/07/04(月) 21:51:29.57 ID:CMsCi2w4.net]
ネスレはレギュラーコーヒーに戦いを挑んでないみたいだけど、
インスタントコーヒーに取って代わるべくレギュラーソリュブルコーヒー推しだよね



419 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 22:00:36.67 ID:sR2pocrJ.net]
ネッスルの方がなじみ深い

420 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 22:06:35.42 ID:7wZS5m0B.net]
違いがわかる男の正規表現

421 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 22:10:57.58 ID:at368eXu.net]
ポゼッシブを強欲と呼んでる人がいるのこのスレで初めて知ったよ
強欲の英訳はほぼ100%greed/greedyになるから絶対やめた方がいい

422 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 22:18:25.27 ID:Fzsxp6Q8.net]
>>413
possess v. って単に所有する、っていう意味なのにね

423 名前:デフォルトの名無しさん mailto:sage [2022/07/04(月) 23:33:58.60 ID:Tw6HV9Rf.net]
なにも日常語のpossessiveを強欲と訳しているのではない
「握ること」=「米の球」という誤訳が同じ物🍙を指すことで意訳になるのと同じで、
正規表現においてはpossessiveと強欲と絶対最大(量指定子)という語は定義によって同じ物を指して、対応する用語になっているというだけ
やたら英訳にこだわっている人は、possessiveという用語に対応するキーワードのひとつである強欲を知らずにgreedyと英訳してしまった無知をごまかしているように見える

424 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 00:14:37 ID:Pgzcl5cT.net]
>>415
「米の球」を黒焦げに焼いたらtarballになる、まで読んだ

425 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 10:52:26 ID:K5Eu4yGw.net]
>無知をごまかしているように見える

この人の感受性がおかしいと感じたのは俺だけだろうか、やたら人のことを悪く見ようとしてないか?
知らない人に対する潜在的な恐怖心がこういう発言になるのかな?分からんがみっともないからやめたほうがいい

426 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 11:08:04.06 ID:sc95gC5i.net]
議論は別にすきにしろよと思うが人格否定や揚げ足取りは荒れる元だからやめろ

427 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 11:41:54.88 ID:cG0ybmcU.net]
>>417
そらそこは反論を期待して英訳に固執する人を揶揄してわざと悪し様に言ったところだからな、図星だったなら謝るよ
でもまさか本題には一切触れず蛇足だけに突っ込んで人格の否定までして論点をずらすような真似をされるとは思わなかった、よほど気に障ったのだろうか
あ、反論があるなら本題の方をメインで頼むな、他の人に迷惑でみっともないからね

428 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 12:00:26.75 ID:364oCHD3.net]
>>416
おっと焼きおにぎりの悪口はそこまでだ



429 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 13:10:32 ID:/Cj5WPzT.net]
当て身は打撃のことじゃないって言い張る格ゲープレイヤーみたい

430 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 13:38:26 ID:K5Eu4yGw.net]
その攻撃性と被害妄想的な受け取り方はどうにかならんの?普通に会話すればいいだけだと思うのだが
このレスを読んでも攻撃されてると思うの?

431 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 13:44:47 ID:SfuXrTgV.net]
その精神病を当て擦るような言い方

432 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 16:42:32.77 ID:9eeXBGst.net]
>>ID:K5Eu4yGw
議論で熱くなって中傷が混じるのは褒められないことではあるがある程度は容認出来る
おまえは議論の本題に触れもせず、中傷、人格攻撃だけのレス
この違いが分かる?
中傷したいのなら議論の本題に上手く絡めて、やれ

433 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 17:00:54.47 ID:8BLlx4g8.net]
>>415
>正規表現においてはpossessiveと強欲と絶対最大(量指定子)という語は定義によって同じ物を指して、対応する用語になっているというだけ

それが問題だよねって話をしてるんでは?
正規表現においてpossessiveのことを強欲と呼ぶのは適切ではないという主張に対する反論にはなってないように見えるけど?

434 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 17:21:05.39 ID:hw2faXZs.net]
●Regular Expressionの使用環境
サクラエディタ2.3.2.0(bregonig.dll 4.20 with 鬼雲6.2.0)

●検索か置換か?
検索

●説明
\sの結果にUnicodeのスペースは全て含めたいが
Unicodeの改行(LF,CR,CRLF,NEL,PS,LS)は含めたくない。
(UNICODEの改行は厳密にはVTとFFが含まれると思いますが
https://www.unicode.org/standard/reports/tr13/tr13-5.html
できれば今回はVTとFFは例外で改行ではないスペース扱いにしたいです)

●対象データ
UTF-8テキストファイル
小U+0020迫LF(U+000A)
松U+0009本CRLF(U+000D U+000A)
高U+3000田NEL(U+0085)

●希望する結果
半角スペース
水平タブ
全角スペース
※単純に\sで検索すると都合6箇所マッチしてしまうので、
(サクラエディタが改行コード扱いする)Unicodeの改行(LF,CR,CRLF,NEL,PS,LS)を
マッチ対象から除外して3箇所だけにマッチする正規表現が知りたいです。

435 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 17:22:13.40 ID:9eeXBGst.net]
> possessiveのことを強欲と呼ぶ
飽く迄、英語をベースに日本語へ訳したいワケね
そういう解釈をしてるからおかしく感じるのだろう
日本語の欲張りに対しての強欲に相当する語が無いから英語ではpossessiveを充てている
英語側の単語が貧窮な都合だ

436 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 17:43:33.84 ID:9eeXBGst.net]
>>426
文字集合の積演算
[\s&&[^\r\n\x0085]]
これにPS,LSも含めればいい

437 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 17:56:41.32 ID:4sOf+wSV.net]
>>427
日本語も欲張りと強欲はどちらも欲深いことを言っているだけで、
欲の深さを示してはいないよ
近いと近距離、どっちの距離が離れているかを示せないないのと同じ
さらに言えば
逆に英語では明確に区別された語(greedy?|possessive)を、
明確に区別できない語([貪|強]欲)に置き

438 名前:ゥえたのが問題
直訳・意訳ですらない置きかえ
日本語に対して英語を充てたとそう勘違いしてる?
[]
[ここ壊れてます]



439 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 18:10:02.38 ID:K5Eu4yGw.net]
>英語の人
なんか申し訳ないね、せっかく英語の意味の違いを教えてくれたのにこんなことになってしまって・・代わりに謝るよ、ごめんね
俺も強欲という名前は間違いだと思う、教えてくれてありがとね

440 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 18:23:23.60 ID:9eeXBGst.net]
> 欲張りと強欲はどちらも欲深いことを言っているだけ
そりゃどちらにも「欲深い」の意があるだろう
だがその2つが並んで違いを理解出来無いのならおまえの日本語力に問題がある
普通に日本語を扱える者ならば「強い」を含む側に強い意味合いが込められていると解する
自分が分からなかったからと言ってケチ付けて自己肯定、「俺が悪いんじゃない」するのはみっともない

441 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 18:29:53.51 ID:4sOf+wSV.net]
>>431
そうか、「強」が付いてると強いのか知らなかった
強奪と収奪は強奪の方がより奪えるって理解でいいのかな
勉強になる

442 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 18:41:45.68 ID:KH2ZmSBP.net]
>>427
英語をベースにしないならそれこそrice ballのようにもっと適切な命名があるでしょ

プログラミング分野においてgreedyを貪欲/強欲/欲張りと訳すのが定番化してる中で
正規表現の場合だけは強欲は貪欲とは意味が違うというのが無理筋で悪い命名でしかない
フクロウ本の第3版で変更されてるのも強欲だと違いが分かりにくい/紛らわしいからだと思うよ

いい命名ではないけど貪欲に対して超貪欲とかならまだ賛同できた

443 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 18:41:56.55 ID:4sOf+wSV.net]
ちなみに日本語には無欲と[貪|強]欲の間に[小|少]欲ってのがあって、
こっちは明確に欲が少ないと定義されてるんだが、
普通に日本語を扱える者は「小さい」あるいは「少ない」欲の対義語として
「強い」欲となることに違和感を持たないものかな?
…とここまで書いて気付いたけど、貧と強が欲の深さを表してると思ってたってことか
かわいいね

444 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:04:14.64 ID:K5Eu4yGw.net]
昔は強欲でも困らなかったんだろう、しかし時代は変化していくからな
日本人にとって英語がより身近になれば英語から見ておかしい訳は淘汰されていくだろう

野球のカウントが S B O から B S O の順に変わったのと似てる、野茂以前では S B O で何の不都合も無かった
メジャーリーグを大リーグと呼ぶ訳は英語が分かる人から見てどう思うのか少し気になるw

445 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:04:56.60 ID:TINjq0RZ.net]
>>430
私(415,419)に対する人格攻撃や精神疾患への当て擦りととられる発言まで晒しておいて自身の行為は謝罪しないのな
一般に貪欲も欲張りも強欲もまとめてgreedなのもpossessiveが強欲でないこともあなた以外全員知ってた
その上で用語として定義されたものを訳とみなしたときの気持ち悪さについて議論している
絶対最大の英訳がpossessiveとかそれこそあり得ないだろ?

446 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:05:56.36 ID:9eeXBGst.net]
> 強奪と収奪
「奪う」はどちらも同じ
収は集める意が含まれる
強奪の強は「強引に」の意
ひったくりは収奪よりは強奪
村やビル占拠して人質脅して金品出させるようなのは「集める」ので収奪
収奪だって「奪う」ので「強制」的、強奪ではあるが「集める」方をより強調させた言葉
あと言葉はふわっとしてるもので意味するところはある程度の範囲がある
「奪う」の意が同じなのでどちらでも問題が無い場合もあるだろう
だが
> その2つが並んで違いを理解出来無いのなら
と書いたように両者を用いているのであれば、そこに違いがあって当然なわけで普通はその差異を汲み取れる

447 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:31:46.72 ID:K5Eu4yGw.net]
>>436
いや俺そこまでのことは言ってないと思うのだが
そんなつもりではなかったのでそれ以上に受け取ったなら謝るよ、ごめんね

>絶対最大がpossessive
日本語から英語への翻訳がこれだったら変だと思うね

448 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:45:12.44 ID:4sOf+wSV.net]
>>437
> 強奪の強は「強引に」の意
そういうことまでわかっていながら強欲についは頑なに強いと思ってるその認知はどこから来てるんだろう
大欲じゃいけない理由も知りたい



449 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 19:52:54.12 ID:9eeXBGst.net]
> 強欲についは頑なに強いと思ってるその認知は
>> その2つが並んで違いを理解出来無いのなら
が理解出来無い?
『「欲張り」と「強欲」が併用されている場合』に
どちらが強い意味合いを持つのかは一目瞭然な訳だが
まだ続けるの?

450 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:03:46 ID:9jUwBfIC.net]
SunやMicrosoftが使ってる以上、意味はどうあれ専門用語として取り扱うべきである
俺は嫌だから使わないってのはいいけど
他人が使ってるのをそんな言葉知らんぞ、間違ってると指摘するのは異常人

451 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:05:32 ID:4sOf+wSV.net]
>>440
思い込みじゃなくそうと示された他の資料を欲しい
一目瞭然なら当然どこかしらに示されてるだろうけど、
webの辞書や記事と手元の辞書ではその差を確認できなかったから

452 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:07:09 ID:4sOf+wSV.net]
>>441
MSはかつてそういう指摘に応えて使用する用語を変えてきた実績があるよ
一度決めたら二度と変わらないって会社ではない

453 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:11:53 ID:4sOf+wSV.net]
>>441
Oracleは日本語を正とせず英語を正としろって立場を採ってるよね
誤訳がありうるってことだし、誤訳によりライセンス内容の整合性がとれなくなったMSの事例もあるね

454 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:25:49 ID:mmXAp8Yt.net]
なんだなんだ
「強欲」って用語が指していることを理解してなくて会話がかみ合わなかった週末の人、
数日経ってもまだ「ぼくちゃんまちがってないもんえいごだとこうなんだもん」って駄々こねて80レス位進んでるのか・・・・・

ちょっとした勘違いとかちゃんとした日本語のドキュメントに目を通してなかったとか誰にでもあることなんだから
それこそ貧欲って書いてた人みたいに一言間違ってたわwって言うくらいで収まることだと思うんだけどなあ
悪いけどやってること恥の上塗りだよ?

455 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 20:35:51.78 ID:K5Eu4yGw.net]
もう ひんよく と きょうよく でいいよ

456 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:07:33.30 ID:mmXAp8Yt.net]
同一人物のくせに他人のフリとかどんだけ面の皮厚いんだよ・・・とか一瞬思ったけど
ID:K5Eu4yGw と ID:nkFK6+7O ID:4sOf+wSV は別人だったのか
見分けついてなくて同一レベルのゴミかと思ってたわごめん

457 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:30:45.62 ID:JtY8aViY.net]
口語だと基本的に最短一致、最長一致、バックトラックしない最長一致って言ってる
欲張りとか強欲とか実際に口に出して言ってる人には出会ったことないわ

458 名前:デフォルトの名無しさん mailto:sage [2022/07/05(火) 22:50:11.96 ID:MNnvUB1p.net]
(非探索)最長一致
(最)多一致
(最)少一致
どちらも「最長」だと紛らわしさがあるので
でも「強欲」で定着しているものをわざわざ言い換える程の事でも無いと思う



459 名前:426 mailto:sage [2022/07/06(水) 00:22:09.50 ID:ToTyGXGb.net]
>>428
\x0085を\x{0085}に変えて
[\s&&[^\r\n\x{0085}\x{2028}\x{2029}]]でOKでした
積演算&&の有効な使い方を初めて知りました
どうもありがとうございました

460 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 02:03:37 ID:7JN09BFV.net]
\R*+\K\s

461 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 05:39:49.51 ID:FCzm9xaa.net]
口頭ってことは対面レビューとか他の人と共有するソースコードでの正規表現だよね?
そうなると、相手のスキルレベルにもよるけど
「強欲」って単語だけで

462 名前:なく強欲な正規表現自体も避けておくかなあ
このスレのうんざりする流れを見てもわかるとおり「強欲」が相手に通じるとは限らないし
(強欲な正規表現なんて使ったことがない人のほうが多数派だろうし)
最長一致で事足りるなら多少のパフォーマンス悪化には目をつぶる

チャットとかなら「++」みたいな具体例を明示して「強欲」って単語を使うかな
ここみたいな正規表現スレならなにも前提を置かなくとも普通に「強欲」で通じるものとして会話するけど・・・
会話が成り立たなかったうえに間違いを指摘されても「英語だと」「口語だと」「xxxだと」とか延々ゴネる人とは会話したくないなあ
いい加減NGしたいからコテつけてくれるとありがたい
[]
[ここ壊れてます]

463 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 06:39:20.23 ID:5qGkM3IH.net]
しかし回答者のレベル低下が酷いな
ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな
$1,$2の件や強欲のすれ違いについても積極的に事態の収集を図ろうとせず悪化させて悪乗りするとはね

464 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 06:47:28.85 ID:TTp+bFLp.net]
英語名を変えさせたら良い
gohyork
yorkvary
muyork

対応して日本語名もカタカナ表記で
ゴヨーク
ヨークバリー
ムヨーク

そういう『名前』としてしまえば解決
一意な名称を与えた方が誤解も少なくなるだろう

> 強欲な正規表現なんて使ったことがない人のほうが多数派だろうし
それはあまりにもレベルが低すぎじゃね?
知らない者が学ぶべきであって触りすらも学んだことの無い者へ合わせる必要なんて無い

465 名前:298 [2022/07/06(水) 06:53:49.49 ID:ZAN9ui5m.net]
>>361
> それ書いてる>>314には$1なんてどこにも書いて無いのにw
つまり、>>314の「,」があまりに小さくて見えなくて、
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++
これしか書いてなくて、
2行目の$1,$2を省略したと思ったのですw

466 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:02:49.27 ID:5qGkM3IH.net]
ここの回答者はそう勘違いしてるのを知ってて何も助言しなかったんだぞ、馬鹿にして笑ってたんだよ
このスレは過疎たせいで悪質な初心者が上級者ヅラするようになってしまった

467 名前:298 [2022/07/06(水) 07:06:06.70 ID:ZAN9ui5m.net]
秋葉原店
専門店

住所
〒101-0021 東京都千代田区外神田4丁目3-3
TEL
0570-024-511


で、さらに教えて欲しいのですが、
前回と同じ質問ですが、
店名と住所を抽出したいです。
で、↓を使いたいのですが、
店を抽出キーワードにすると、専門店とか店舗詳細とかの「店」も拾ってしまうのです。
で、データをよくみると、「 秋葉原店」のように店名の前にスペースがあります。
で、
( )(?<=店)[^〒]*〒\d{3}-\d{4}\s++ と、やってみたのですがダメでした。 どうすればよいでしょうか?

(?<=店)[^〒]*〒\d{3}-\d{4}\s++  ←は>>314さんの教えてくれたヤツ。

468 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:09:45.51 ID:SZC2q9b+.net]
これ非包含演算子に粘着してるのと同じやつだろ
粘着気質と承認欲求丸出しのマウンティング気質が全く同じ



469 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 07:46:05.23 ID:o/55z/m0.net]
>>453
再質問来てるぞ
> ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな
おまえがお手本見せてやれや
回答者をバカにするくらいだから余裕だろ?

>>457
>>320
使い方分からないならJSスレか初心者スレ行って聞いたらいい

470 名前:298 [2022/07/06(水) 08:07:45.17 ID:ZAN9ui5m.net]
>>459
↓って英語だからどうやって使っていいのかわかりません。

https://pastebin.com/M6LqV15b

471 名前:デフォルトの名無しさん [2022/07/06(水) 11:44:54.56 ID:MXaUuSJv.net]
まず英語の勉強をするべき

472 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 12:10:15.16 ID:c6fRPAAn.net]
CSV の正規表現なんて、数千行ぐらい掛かるだろ。
HTTP の正規表現でも膨大だろ

行区切り文字の改行
列区切り文字のカンマ

クォート文字のダブルクォーテーション。
クォート文字が無くても、意味が変わらなければ省略できる

クォート文字内では、行区切り文字・列区切り文字の効果がなくなり、単なる文字となる。
クォート文字内で、連続した2つのクォート文字を使えば、
クォート文字の効果がなくなり、単なる1つのクォート文字となる

もし、クォート文字の対応関係が崩れたらエラー。
クォート文字の数は、必ず偶数個である

こんな膨大な条件判断を書けるわけない。
条件判断とか構造があるものは、正規表現では無理。
こういうものは、Ruby などのパーサーを使わないと無理

CSVをawk などで処理している香具師とか、CSVの構造を分かっていないから、
こういう特別な意味をもつ文字が混じると、バグル

473 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 13:40:21.16 ID:gR1YTmZs.net]
>>462
なんでCSVのパースする前提になってるんだ?
webの店舗情報のテキストをCSVにするのになんでクォート内の対応を気にする必要がある?

474 名前:デフォルトの名無しさん [2022/07/06(水) 15:43:31.34 ID:MXaUuSJv.net]
KEИTAはでたらめ

475 名前:462 mailto:sage [2022/07/06(水) 17:15:52.66 ID:c6fRPAAn.net]
行区切り文字の改行、列区切り文字のカンマ、
クォート文字のダブルクォーテーション

CSV データ内に、こういう特別な意味をもつ文字が混じると、バグル

これらの文字が無ければ、Ruby などのCSVパーサーを使わずに、
awk などで処理しても、バグらない

476 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 17:19:01.24 ID:QeuQIz9d.net]
なんか話脱線マウントしまくって会議やコードレビュー下手くそで顰蹙を買いまくってそうな人来てるやん

477 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 17:55:19.63 ID:gR1YTmZs.net]
>>465
混ぜなきゃいいのでは

478 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:01:53.46 ID:kQhbtDqq.net]
いつも文体一緒だからバレる



479 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:30:39.95 ID:5qGkM3IH.net]
>> 298

「店」が無い店もあったからHTMLソースから取り出すようにしたよ
ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して

1回目の検索欄
^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*
</h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$

1回目の置換欄
うんこ$1,$2

2回目の検索欄
^(?!うんこ)[^\r\n]*$[\r\n]+

1回目の置換欄
( 空欄にして )


2回の置換が終われば店舗一覧が完成しているはず


1回目の検索欄は長すぎるから2行に分割したよ、1行に繋げてから使って
検索欄や置換欄に記入するときは前後に余計なスペースやタブ文字が紛れ込まないように

HTMLの細かい変化にはなるべく対応出来るようにしたけど店舗一覧のページがリニューアルしたら使えなくなるよ

480 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:34:28 ID:5qGkM3IH.net]
ミスった

1回目の置換欄
( 空欄にして )

これは2回目だね

481 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 19:39:45 ID:5qGkM3IH.net]
全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽
「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて

482 名前:デフォルトの名無しさん mailto:sage [2022/07/06(水) 23:10:34.54 ID:gFUK7vgi.net]
ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw

483 名前:デフォルトの名無しさん mailto:sage [2022/07/07 ]
[ここ壊れてます]

484 名前:(木) 16:29:53.46 ID:ls1FMHZL.net mailto: そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか []
[ここ壊れてます]

485 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 16:37:27.46 ID:3hUwVJb0.net]
掃除して整形してからやるのがコスパ良いに決まってる
力業いくない

486 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 17:27:59.03 ID:EezL89dt.net]
ケースバイケースやろ

487 名前:デフォルトの名無しさん mailto:sage [2022/07/07(木) 17:45:22.88 ID:QZNfJ5wA.net]
答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発
合ってるか分かり難い場合は間違い難い正規化式で段階踏む

488 名前:デフォルトの名無しさん mailto:sage [2022/07/08(金) 12:52:02 ID:/znuHP85.net]
パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。
処理A | 処理B | 処理C

Ruby の正規表現では、3種類の改行を、\R と書ける

/\r\n|\r|\n/

/\R/



489 名前:デフォルトの名無しさん mailto:sage [2022/07/10(日) 17:44:55.47 ID:0O2dRiW8.net]
>possesive

ポジティブ

490 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 01:09:47.27 ID:gUwlqT3Y.net]
そして誰もいなくなった

491 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 09:09:55.88 ID:L4T2PUf2.net]
民度の低い異常者が常駐してたらそりゃ関わりたくないもん

492 名前:デフォルトの名無しさん mailto:sage [2022/07/16(土) 11:12:47.12 ID:WasoqaBj.net]
自己紹介乙

493 名前:デフォルトの名無しさん [2022/07/20(水) 06:49:04.62 ID:v4tHM0fs.net]
●Regular Expressionの使用環境
秀丸

●検索か置換か?
置換

●説明
同じ文字+間に要らない文字列+同じ文字

同じ文字 一つにしたいです

●対象データ
[ぬるぽ & ぬるぽ]
[ガッ-ガッ]
[hoge & hoge]

●希望する結果
ぬるぽ
ガッ
hoge

よろしくお願いいたします。

494 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 07:23:49 ID:iuCM0uSo.net]
説明にない[は何?

495 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 08:35:20.99 ID:jm1i1IHH.net]
>>483
すみません希望する結果はこちらでおねがいします
[ぬるぽ]
[ガッ]
[hoge]

496 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 09:04:35.27 ID:Fdf9zFh2.net]
テスト
\[(.+?)(.*?\1)\](?\2)

497 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 16:27:05.86 ID:f63hBcuy.net]
(.+).+?\1
$1

498 名前:デフォルトの名無しさん mailto:sage [2022/07/20(水) 16:30:30.08 ID:OlkAUELc.net]
[ wow & wow]



499 名前:482 mailto:sage [2022/07/20(水) 17:48:38.07 ID:VWdn2Di+.net]
>>486さんの正規表現で上手くいきました
ありがとうございました

500 名前:デフォルトの名無しさん [2022/08/28(日) 01:14:30.52 ID:y+9tLdhC.net]
正規表現の先読み・後読み https://zenn.dev/usamik26/articles/regex-lookahead

501 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 07:40:58.02 ID:MbqzPdhg.net]
perlでは/.*hoge/より/.*?piyo/の方が圧倒的に速いのか
ステップ数は大して変わらなそうなのに

502 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 08:17:37.04 ID:e6Sjxbuq.net]
>>490
perlに限らずそりゃそうだろ
"hoge...めっちゃ長い文字列..."
ってあったら /.*?hoge/ なら最初の hoge でマッチしたと判断できるけど /.*hoge/ だと最後まで見ないと判断できない
最後に hoge ってある可能性があるから

503 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 08:52:32.95 ID:7Mb5USF7.net]
>>491
hogeじゃなくてpiyo

"hoge...めっちゃ長い文字列...piyo"
ってあったら /.*?piyo/ と /.*hoge/ は同じくらいだと期待するでしょ
489のコメントの比較テストを見てなんでそうなるのかなと

504 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 09:11:11.32 ID:dcB5AKwO.net]
>>492
そりゃそういうケースもあるけどそうでないケースの方が多いだろ

505 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 10:55:00.88 ID:V92k17Tf.net]
489の記事・コメントを見たけど
「.*hoge.*」

「.*?hoge」
の比較をして後者のほうが圧倒的に早いって記述はあったが
490の言ってる比較はどこにも見当たらないようだけど・・・?

492の
>hogeじゃなくてpiyo
はもっと意味不明だな
「/.*hoge/」
「/.*?piyo/」
の違いで、491は「.*」「.*?」の違いで速さが変わるのが当たり前って話をしてるのに
"hoge...めっちゃ長い文字列...piyo"みたいな極端な例を突然出してこられても

506 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:06:13.62 ID:3aiLuiYL.net]
マッチする場合はそれほどステップ数は変わらないけど
マッチしない場合のステップ数の差は大きいね

507 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:10:20.88 ID:iCw3MfJc.net]
(?s:^(?=.*(?:トビラ|280|280|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ)))

これって何か間違ってますか?280が消えない時があります

508 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 12:33:21.57 ID:4oWDpmI8.net]
[22][88][00]
こういうこと?その消えない時のレス見ないと正確なことは分からんよ
後ろが一致してないのかもだし数値参照かもしれんし



509 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 14:30:01.62 ID:HKThARKH.net]
なぜ組み合わせたいのかがよくわからんな
後半のパターン部分を素で書けば良いと思うんだけど、あえて暴言を目視したいスレでもあるんだろうか?

510 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 14:36:53.39 ID:q8tm2XHG.net]
単発のNGの他に連鎖NGとかIDごとNGとかあるだろ
わからないなら黙ってろよ

511 名前:デフォルトの名無しさん mailto:sage [2022/08/28(日) 16:16:08.48 ID:XxcpkpFs.net]
ごめん

512 名前:デフォルトの名無しさん [2022/09/04(日) 01:47:12.24 ID:0/i0sC9q.net]
GNU grep 3.8 (2022-09-02)から-Pオプションのリンク先がPCRE2になったらしい
それ以前は古いPCREだった
-Pオプションが機能しないWindows版grepバイナリには関係のない話だけど

513 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 07:42:45.45 ID:pCQ9P7Vy.net]
1
2

10
77
100
150
1000

3桁までの数字のみをする場合
[0-9]{,3}だとダメでした
正規表現チェッカーでいろいろ試しているですが分かりません
200までの数字だとどうしたらいいですか?

514 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 08:41:45.13 ID:x2tuNrOY.net]
ttps://www.simple-edition.com/prog_memo/number_range_regexp/

[1-9]|[1-9][0-9]|1[0-9]{2}|200
で範囲を作ったものを

ttps://weblabo.oscasierra.net/tools/regex/

ここに代入しても使えませんでした
「正規表現」の意味合いが違うんでしょうか?

515 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 09:08:03.10 ID:MIQciAoV.net]
>>503
それだと92000の200にもマッチしてしまうよ
インド数字等を気にしないなら[0-9]は[\d]でもOK

(?<![0-9])(?:200|[1][0-9]{2}|[1-9][0-9]|[0-9])(?![0-9])

516 名前:デフォルトの名無しさん [2022/09/04(日) 09:46:10.78 ID:ZQZ632xa.net]
>>503
[0-9]{1,3}
これだと結果でるようだけどそのサイトm値省略不可なのでは
他に | のorも説明ないようなのでダメとか

正規表現文法どこまで対応してるかは動かす環境次第なので質問テンプレートにも入力項目になってんだけど
>>1

517 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 10:07:01.01 ID:qlj2b1lm.net]
すまない

●Regular Expressionの使用環境
iPhone,a-shellというアプリ

●検索か置換か?
検索

●説明
フォルダ内にある写真を圧縮するため

●対象データ
1から200などのjpegとかの画像
●希望する結果
検索してそれをまとめて圧縮

518 名前:デフォルトの名無しさん mailto:sage [2022/09/04(日) 10:19:49.12 ID:NNtN3+VI.net]
まあ案件次第だけど
> 200までの数字だとどうしたらいいですか?
とかなら\d+で取得してアプリケーション側で弾くのが後の保



519 名前:守を含めて簡単かと思う []
[ここ壊れてます]

520 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 19:48:53.80 ID:aae9uQ50.net]
スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい

●対象データ
123000444
000123000
1230000000444

●希望する結果
123-444
000123000
123-444

よろしくお願いいたします。

521 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:02:34.86 ID:BFM47HY2.net]
(?<!^)000+(?!$)
-

522 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:23:28.22 ID:el3nukes.net]
00000 → 0-0 ?

523 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 20:37:38.14 ID:G28B9gdh.net]
ああ、
00001200030000

0-12-3-0
とするのか (>>509のやつ)
先頭末尾に繋がっている0は無視したい
000012-30000
のか例からだと不明だね

524 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 21:45:26.67 ID:aae9uQ50.net]
508です。
早くもいろいろご回答いただきありがとうございます。
そしてすみません、みなさまのリプを見て自分の考えが足りなかったことに気付きました…
変換は一度だけ、先頭から数えてもっとも近いもののみです。
正しく書き直します、すみません。

スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい
(先頭から数えて最初の一致のみ)

●対象データ
123000444
000123000
1230000000444
12000045600006

●希望する結果
123-444
000123000
123-444
12-45600006

よろしくお願いいたします。

525 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:09:54.11 ID:jeF3JQfM.net]
>>511
> 先頭末尾に繋がっている0は無視したい
こんな条件どこから出てきたんだ?

526 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:20:12.97 ID:GLLSFlxd.net]
「文中(先頭及び文末以外)の0」が連続して3つ以上並ぶ部分
文中(先頭及び文末以外)の「0が連続して3つ以上並ぶ部分」

527 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:24:49.17 ID:clq+OpKM.net]
^([1-9]+)0+(\d+)$ --> $1-$2
でいかがでしょう

528 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:33:07.80 ID:clq+OpKM.net]
あ、「ゼロ3つ以上」を満たしてなかった
また考えますー



529 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:35:39.26 ID:clq+OpKM.net]
^([1-9]+)0{3,}(\d+)$ --> $1-$2
でしょーか

530 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 22:46:39.11 ID:7uE/UK4/.net]
010001

531 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:08:19.66 ID:G28B9gdh.net]
>>513
> 文中(先頭及び文末以外)の0が
の説明と例からだと
「先頭以外」が先頭の0、1文字を指すのか
先頭から続く0の塊を指すのか不明でしょ
> 3つ以上並ぶ部分
が強欲なのか?欲張りでいいのか?が不明 >>511 さんの質問だね

532 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:09:06.59 ID:G28B9gdh.net]
>>519
訂正、>>510さんの質問

533 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:10:13.89 ID:aae9uQ50.net]
みなさんありがとうございます!
できそうな正規表現がありうれしいです。
すみませんが今手元に環境がないため明日動作させて確認します。

534 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:20:09.73 ID:aae9uQ50.net]
そして自分でも要件を言葉にできておらず申し訳ありません
みなさんに質問いただいて初めて気付きましたが、
先頭及び末尾が0であった場合、そこから連続する0は除外する ができると一番望ましいです。

00001200034000

000012-34000
となります。
返信遅くなりすみません。

535 名前:デフォルトの名無しさん mailto:sage [2022/09/13(火) 23:44:59.39 ID:G28B9gdh.net]
(?<!^)(?>0{3,})(?!$)
未test
最初のマッチだけ置換は以下
https://social.technet.microsoft.com/Forums/ja-JP/ad0f7263-3fd1-4545-b554-e796d27ef948/263682102112398125101248312481?forum=powershellja

536 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 00:51:16.34 ID:4SNfctPQ.net]
>>518
あかんすね…

^(0*)((0{0,2}[1-9])+)0{3,}([1-9]\d*)$ --> $1$2-$4
これはどーでしょう?

537 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 05:23:58.73 ID:E5sTi1VY.net]
([1-9])0000*([1-9][0-9]*)
$1-$2

538 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 09:12:22.80 ID:Kn3Wl+2J.net]
(?<=[1-9])(?>000+)(?!$)(.+)$
-$1



539 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 09:38:59.41 ID:s0UMl1ds.net]
(^[^0].*?)0{3,}([^0].*?$)
$1-$2

540 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 10:42:18.62 ID:6Qq1IObP.net]
>>524,525,526
>>523,527

541 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 19:22:12.74 ID:+0SwTq6N.net]
508です。
沢山の案ありがとうございました、本当に助かりました。
一通り試して正しく動くものは沢山あったのですが、
以下の方式で解決させていただきました。

$reg=[regex]'([1-9])0000*([1-9][0-9]*)'
$reg.Replace($str,'$1-$2',1)

また、上記の案以外もこんな解決方法があるのかととても勉強になりました。
そして自分が要件をまとめられてなかったことにも反省いたしました。

今後はこちらで回答する側になれるよう、再度勉強いたします。
重ね重ね本当にありがとうございました。

542 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 19:57:00.91 ID:b2aEm1i9.net]
回答にある正規表現は置換回数を指定できない置換方法でも大丈夫
置換回数に1を指定する方法でやるなら単に ([1-9])0000*([1-9]) でもいい

543 名前:デフォルトの名無しさん mailto:sage [2022/09/14(水) 22:22:31.78 ID:+0SwTq6N.net]
>530
確かに、教えていただいたこともりもりにしてしまいましたが
わざわざ[1-9]のあとに[0-9]を入れている意味がないですね…。
ご指摘ありがとうございます。

544 名前:デフォルトの名無しさん [2022/09/18(日) 12:56:41.18 ID:QaJ1iFM2.net]
githubで結構探したんですがそれっぽいのが見つからず、お力お貸しください。

●Regular Expressionの使用環境
AutoHotKey1.1系

●検索か置換か?
置換

●説明
2つのクォーテーションマークに囲まれたパスのうち、1つ目(app.exe)を削除したい。
囲まれたパス同士は半角スペースで接続される。

●対象データ
"D:\Dir_Path\_app.exe" "D:\Dir_Path\_script.ahk"
^^^^^^^^^^^^^^^^^^^^^^^

●希望する結果
"D:\Dir_Path\_script.ahk"

545 名前:デフォルトの名無しさん mailto:sage [2022/09/18(日) 16:16:05.56 ID:wjpqonb4.net]
>>532
https://regex101.com/r/zxuEpo/1

546 名前:デフォルトの名無しさん [2022/09/18(日) 19:20:15.15 ID:/uA/jgNo.net]
>>533
ありがとうございますめちゃくちゃシンプルでした!あとこのregexサービスいいですね

".*"\s だと構文エラー吐きました
置換関数内(””の中)で”がうまく扱えないので頑張ってみます。

547 名前:デフォルトの名無しさん mailto:sage [2022/09/18(日) 21:26:30.42 ID:CbZe8FP4.net]
"を
\"

\x22
に置き換えて試してみてわ

548 名前:デフォルトの名無しさん [2022/09/19(月) 16:41:30.36 ID:4iw9Mtek.net]
>>535
ありがとうございます、いけました
(ついでに””も削除)
\x22.*\x22\s|\x22



549 名前:デフォルトの名無しさん mailto:sage [2022/09/20(火) 02:58:09.09 ID:94I1wBUa.net]
二重引用符のエスケープは重ねて""だな
"".*""\s

550 名前:デフォルトの名無しさん mailto:sage [2022/10/29(土) 13:09:46.30 ID:ec13kmtS.net]
●Regular Expressionの使用環境
PCRE2

●検索か置換か?
検索

●説明
(..[\0@-g]\0){147}などを高速に検索したい

●対象データ
メガ単位のバイナリファイル(リトルエンディアン)

●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです

現状PCRE2で検索は出来ていますが、Intel Hyperscanだと
util/determinise.h:determinise:162:succ_id 16383 >

551 名前:= state_limit 16383
ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded
rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA
ng.cpp:addGraph:507:could not compile component 0 with 592 vertices
と言われて説明の例に限っては正規表現のコンパイルすら不可能です

32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが
「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです
今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています
コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです
[]
[ここ壊れてます]

552 名前:デフォルトの名無しさん mailto:sage [2022/10/29(土) 19:31:13.26 ID:9Ey1MUJ8.net]
>>538
\0@って何?
\c@でNULL文字検索の意味ではないの?

553 名前:デフォルトの名無しさん mailto:sage [2022/10/29(土) 19:42:35.80 ID:ec13kmtS.net]
>>539
文字クラス[\0@-g]なので表記を統一するなら[\x00\x40-\x67]になります

554 名前:デフォルトの名無しさん mailto:sage [2022/10/30(日) 10:24:48.15 ID:dZd+t5oq.net]
スプレッドシートで20221030と入力されている数字を日付の表記?2022/10/30なのか10/30/2022なのかわからないけどDATEDIF関数に使える形に置換する正規表現ってどう書きますでしょうか

555 名前:デフォルトの名無しさん mailto:sage [2022/10/30(日) 11:55:42.97 ID:oF72FRjI.net]
>>541
正規表現では無理。スレチ
DATE関数で日付にかDATEVALUE関数でシリアル値に変換
セルA1の値:20221030
=DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2))
=DATEDIF(DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2)),"2022/11/01","D")

556 名前:デフォルトの名無しさん mailto:sage [2022/10/30(日) 12:28:15.07 ID:S1PTRz+V.net]
>>541
=DATEVALUE(REGEXREPLACE(A1, "^(....)(..)(..)$", "$1/$2/$3"))

>>542
スレチ

557 名前:デフォルトの名無しさん [2022/11/02(水) 14:16:53.69 ID:gx4Z74sz.net]
すいません。
0と正の整数のみにマッチする正規表現はどう書きますか
----
OK
0
1
22
303
999999
----
NG
-3
z55
0.33

558 名前:デフォルトの名無しさん mailto:sage [2022/11/02(水) 14:20:50.51 ID:4jxQNd6r.net]
^\d+$



559 名前:デフォルトの名無しさん [2022/11/02(水) 14:26:53.26 ID:gx4Z74sz.net]
ありがとうございました!

560 名前:デフォルトの名無しさん mailto:sage [2022/11/02(水) 14:39:57.52 ID:Hz9+pCnD.net]
00
00000000
012
003102
とかはええんかC言語だと8進数なんだけど

561 名前:デフォルトの名無しさん mailto:sage [2022/11/02(水) 14:57:45.88 ID:mLb2a5cx.net]
最近は8進数を0oと書くのが主流じゃね?

562 名前:デフォルトの名無しさん mailto:sage [2022/11/02(水) 15:14:09.32 ID:gx4Z74sz.net]
いやよくないのですが。。

563 名前:デフォルトの名無しさん mailto:sage [2022/11/02(水) 22:52:34.87 ID:WMtJS4K4.net]
>>547
なぜC言語?

564 名前:デフォルトの名無しさん mailto:sage [2022/11/03(木) 13:08:35.66 ID:yr3S2O5F.net]
^(?:0|[1-9]\d*+)$

565 名前:デフォルトの名無しさん mailto:sage [2022/11/03(木) 23:35:12.45 ID:gGr9RQjz.net]
A(B(1), C(2)), B(3), C(4), A(D(5))の

A(B(1), C(2))とA(D(5))の両方にマッチする表現できますでしょうか?

566 名前:デフォルトの名無しさん mailto:sage [2022/11/04(金) 00:21:55.02 ID:Rv2RlvZT.net]
A\([BD]\([15]\)(, C\(2\))?\)

567 名前:デフォルトの名無しさん mailto:sage [2022/11/04(金) 00:32:30.76 ID:u3TD418O.net]
>>552
関数名は英数字1文字、ネストされた関数の引数は数字1文字にしてるけどこんな感じでいけるかと
\w\(\w\(\d\)(?:,\s*\w\(\d\))*\)
https://i.imgur.com/8ayodnp.jpg

568 名前:デフォルトの名無しさん mailto:sage [2022/11/04(金) 19:23:25.88 ID:aOu/uEdM.net]
>>553-554
参考になりました
ありがとうございます



569 名前:デフォルトの名無しさん mailto:sage [2022/11/05(土) 19:55:25.05 ID:xnenmrxP.net]
下のようなテキストがあった時、

フシギダネ、たねポケモン。生まれてから、しばらくの間は背中のタネから栄養をもらって大きく育つ。
フシギソウ、たねポケモン。背中のつぼみがふくらみだすと、あまい匂いが漂い始める。
フシギバナ、たねポケモン。雨の降った翌日は、背中の花の香りが強まる。

その行で最初に出てきた「、」だけをTabで置換したいのですが、
正規表現でなんとかできますかね?(´・ω・`)

570 名前:デフォルトの名無しさん mailto:sage [2022/11/05(土) 19:57:13.42 ID:Gow5Zgrm.net]
顔文字が気持ち悪い

571 名前:デフォルトの名無しさん mailto:sage [2022/11/05(土) 19:57:30.67 ID:KyEMh/LJ.net]
マルチラインモードのg無し置換でええのでは?

572 名前:デフォルトの名無しさん mailto:sage [2022/11/05(土) 20:01:38.81 ID:xnenmrxP.net]
すみません。7分で自己解決しました。(´・ω・`)

573 名前:デフォルトの名無しさん mailto:sage [2022/11/06(日) 18:52:14.69 ID:Ju9kLy6l.net]
>>559.replace('(´・ω・`)', '');

574 名前:デフォルトの名無しさん mailto:sage [2022/11/06(日) 18:56:40.82 ID:gpiofWbc.net]
>>560
エスケープしろ

575 名前:デフォルトの名無しさん [2022/12/01(木) 00:48:55.16 ID:7b6m1q/M.net]
師走だ

576 名前:デフォルトの名無しさん [2022/12/01(木) 20:43:42.13 ID:MJwbaGOX.net]
>>556
^(.*?)、(.*)$ → $1¥t$2

577 名前:デフォルトの名無しさん mailto:sage [2022/12/07(水) 17:35:07.95 ID:hI2dpmO3.net]
正規表現はコードを分かりにくくする非常に悪い技術だと思います。
早く廃止され、代替方法が見つかってほしいです。

578 名前:デフォルトの名無しさん mailto:sage [2022/12/07(水) 18:06:34.78 ID:Zr5hf/of.net]
それは思うけどqwertyキーボードですらこの半世紀何も変わってないし、Legacy引き摺る類のUIは余程の転換期でも起こらない限り無理なんじゃないかな



579 名前:デフォルトの名無しさん mailto:sage [2022/12/07(水) 18:23:42.79 ID:IT7suRvF.net]
>>564
わかりやすくて使い物にならないものができあがる予感

580 名前:デフォルトの名無しさん mailto:sage [2022/12/07(水) 18:33:23.28 ID:8ZB5Tvh5.net]
物事の「本質的な複雑さ」を解決しようとしても「その場でぐるぐる回り続ける」ハメになるだけ(どこにもたどり着くことはない)

581 名前:デフォルトの名無しさん [2022/12/07(水) 21:37:36.61 ID:lzjCqHmQ.net]
正規表現を分かりやすい自然言語や仕様記述に変換するサービス作れば解決

正規表現を生成する機能も用意して最適化オプションもつければ有償で十分やっていける

582 名前:デフォルトの名無しさん mailto:sage [2022/12/07(水) 22:46:38.37 ID:0xPH+d9p.net]
>>568
とりあえずそう言うアプリにお前ならいくら払うんだ?

583 名前:デフォルトの名無しさん mailto:sage [2022/12/08(木) 10:58:46.31 ID:c3lwHRlZ.net]
>>564
それはそうなんだけど
徹夜で必死に考えいいアイデアを提供して下さい

584 名前:デフォルトの名無しさん mailto:sage [2022/12/11(日) 15:34:21.97 ID:xFkTi0uS.net]
abc-ABC
abcd-ABC-def
abcde-defghi-ABC
ab-def-ghi-ABC

-ABCより前にハイフンのない-ABCを選択するのに3,4行目を除外する事で出来たのですが直接-ABCを選択するような事って出来ますか? 使うのはpythonです。よろしくお願いします

585 名前:デフォルトの名無しさん mailto:sage [2022/12/11(日) 15:49:22.27 ID:xFkTi0uS.net]
あ、行頭を指定すれば簡単に出来ましたスレ汚しすみませんでした

586 名前:デフォルトの名無しさん mailto:sage [2022/12/26(月) 08:14:24.98 ID:G31tf+Le.net]
質問です

私に全然知識がないのですごい初歩的な質問になるのですが
例えば“テキ”を検索するとして
“仮テキスト”となっているのは除く、
ホワイトリストを付随するような検索をするにはどうすればいいでしょうか?

私が試したもの、
(?<!仮)テキ(?!スト)
↑例えばこれだと“仮テキ”や“テキスト”まで除かれてしまいます
(おそらく「そりゃ当たり前だろ」と思われる事を言ってると思うのですがなにぶん知識がないためご容赦ください)

正規表現を使う場所としてはchmateやFirefoxアドオンなどで使っています

浅学バリバリな質問なのですがどうかご回答よろしくお願いします

587 名前:デフォルトの名無しさん mailto:sage [2022/12/26(月) 08:18:23.33 ID:LqfRRdYe.net]
>>573
知識以前にお前馬鹿そうだから、>>2のテンプレ使って書き直して

588 名前:デフォルトの名無しさん mailto:sage [2022/12/26(月) 10:07:19.58 ID:5uJMWDBy.net]
(?<!仮)テキ|テキ(?!スト)



589 名前:デフォルトの名無しさん mailto:sage [2022/12/27(火) 04:47:48.03 ID:xSShEST7.net]
>>574
すいません、確かにテンプレ使った方が良かったですね…

>>575
ありがとうございます
単純な話だったんですね…

教えて貰って図々しいのですが
長くなってもいいので“仮テキスト”という続いた文字列を含めて
同じ動作をする正規表現はあるのでしょうか?
あった場合教えていただきたいです…

590 名前:デフォルトの名無しさん mailto:sage [2022/12/27(火) 17:03:22.33 ID:G2ophMPv.net]
テキ(?!..(?<=仮テキスト))

591 名前:デフォルトの名無しさん mailto:sage [2022/12/28(水) 01:36:28.87 ID:Ztu+b3Ae.net]
>>577
ありがとうございます
仕組みも分かったため複数指定もでき望んでいた事がやれました
初歩的な事にわざわざお付き合いいただきありがとうございました

592 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 18:17:40.05 ID:HWC94+Gl.net]
正規表現は半年後の自分がメンテできないから嫌なんだわ
特にその時適当に書いて辛うじて動いてるやつなのか会心の出来だったやつなのか一見判らなくて困るんだわ
正規表現に10段階ぐらい完成度のタグを付けたいのだよハイパーテキスト的にな
そういう気の利いて手軽な方法はないのかのう

593 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 19:06:41.81 ID:W/by+W2J.net]
人から貰った正規表現を理解もせずに自分の物にしていないからそんな事が起こる
自分で書いた正規表現なら何年経ってもパッと見りゃ内容解る
と言うか年々理解度が向上するから、見てがっかりして書き直すまである

594 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 19:37:11.07 ID:HWC94+Gl.net]
>と言うか年々理解度が向上するから
若いってええなあ
あと10年もすれば昔の自分の方が頭いいじゃねえか状態になるから今ががんばり時だよ

595 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 19:46:27.85 ID:JPv7+i4s.net]
>>579
コメント付けられる方言もあるがな

596 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 20:16:21.35 ID:Y6+rT86n.net]
>>581
すまんもう60越えとる

597 名前:デフォルトの名無しさん [2022/12/29(木) 21:08:41.79 ID:5pKgQfqK.net]
テスト書かないんだろ

598 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 23:00:20.15 ID:zukJLKA9.net]
そのうち、こうこうしたいと書くとそれに合った正規表現を出力するAIが出て来る
たぶん



599 名前:デフォルトの名無しさん mailto:sage [2022/12/29(木) 23:37:13.29 ID:VQTP+Rjm.net]
>>585
今でもchatGPTで出来る

600 名前:デフォルトの名無しさん mailto:sage [2022/12/30(金) 00:14:09.14 ID:QnG1dvSt.net]
今では正規表現中にコメントが書ける(拡張形式ignore whitespace)ものも多いのでは

601 名前:デフォルトの名無しさん mailto:sage [2022/12/30(金) 01:37:49.63 ID:1dcL6xM/.net]
>>586
あれサラッとでまかせ混ぜてくるから油断ならん
まさに詐欺師の所業よ

602 名前:デフォルトの名無しさん mailto:sage [2022/12/30(金) 05:43:41.86 ID:gQwuuolL.net]
正規表現の高齢化問題
今の子って正規表現に触れる機会あんのかなあ
糞みたいなエスケープシーケンスの概念込みで教えなきゃならんし
授業ではすきっぷやな

603 名前:デフォルトの名無しさん mailto:sage [2022/12/31(土) 09:31:33.47 ID:3UMVip3o.net]
>>585
ここが…

604 名前:デフォルトの名無しさん mailto:sage [2022/12/31(土) 19:47:02.85 ID:yp0KXAnH.net]
字幕ファイルの修正で秀丸を使って
文字列の置き換えしたいと考えています

置換前
00:00:06:09 - 00:00:10:47
おはよう

00:00:11:18 - 00:00:16:02
こんにちは

置換後
00:00:06.090,00:00:10.470
おはよう

00:00:11.180,00:00:16.020
こんにちは

----

対象データ
”xx:xx:xx:xx - xx:xx:xx:xx”
":xx - "を".xx0,"に置き換え
最後の"xx"を"xx0"に置き換え

希望結果
”xx:xx:xx.xx0,xx:xx:xx.xx0”

お願い致します

605 名前:デフォルトの名無しさん mailto:sage [2022/12/31(土) 21:20:45.11 ID:gFIlpiwK.net]
せっかく秀丸スレあるんだからそっちで聞けばいいのに

HmJre.dll V.510
^([0-9:]+):([0-9]{2}) - ([0-9:]+):([0-9]{2})$
\1.\20,\3.\40

606 名前:591 mailto:sage [2022/12/31(土) 22:37:29.30 ID:yp0KXAnH.net]
大晦日のツンデレさんに圧倒的感謝!!
ありがとうございます

607 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 10:29:42.45 ID:vMZ55Vj6.net]
教えてくださいm(__)m

[あああ(いいい)]

のような文字列を

[いいい](あああ)

と置き換える方法はあるでしょうか

608 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 12:23:22.97 ID:gCqYqHxa.net]
[あああ(いいい)]で検索して
[いいい](あああ)で置換する



609 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 12:35:30.42 ID:Gtp9NVd3.net]
テンプレ無視する馬鹿にはその答で十分だわな

610 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 12:40:09.77 ID:k64eH4zi.net]
まあ一例として
s/\[([^\[\]\(\)]+)\(([^\[\]\(\)]+)\)\]/[$2]($1)/

611 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 13:41:53.53 ID:sAqw0ZzI.net]
>>594
https://glot.io/snippets/ggykutt927

import pegs

echo "[あああ(いいい)]".replacef(peg" '[' {@} '(' {@} ')' ']' ","[$2]($1)")

でいける

612 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 18:30:34.43 ID:REieKqQf.net]
文頭や文中にあるauだけをNGするやつ教えて下さい

613 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 18:46:40.14 ID:Edm8Og2O.net]
docomoはいいのか

614 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 18:57:17.14 ID:zEB0n1jD.net]
唐突に「NGする」って一体何の話だ???

615 名前:デフォルトの名無しさん mailto:sage [2023/01/04(水) 18:58:30.08 ID:zEB0n1jD.net]
何かを想定しているなら質問に際して最初にそれを伝えるのが常識だろう

616 名前:デフォルトの名無しさん mailto:sage [2023/01/06(金) 10:01:53.18 ID:+4FzrtmN.net]
>>598
ありがとうございました。
助かりました

617 名前:デフォルトの名無しさん mailto:sage [2023/01/06(金) 10:09:25.96 ID:+4FzrtmN.net]
>>597
感謝です!

618 名前:デフォルトの名無しさん mailto:sage [2023/01/07(土) 13:40:18.10 ID:0HEuBgBZ.net]
JaneStyle等の5ちゃん専ブラのNG設定用に、以下の条件を全て満たす書き方を教えてください。

・1行(改行文字無し)
・半角全角で70文字以上100文字
・文中に「、」または「。」を1文字以上含む



619 名前:デフォルトの名無しさん mailto:sage [2023/01/07(土) 14:35:34.78 ID:bXxrhZUn.net]
>>605
それはここじゃなくて JaneStyleのスレで聞いた方がよくね?

620 名前:デフォルトの名無しさん mailto:sage [2023/01/07(土) 17:50:57.40 ID:IdmDw0D4.net]
>>602
うるせーな死ねよハゲ

621 名前:デフォルトの名無しさん mailto:sage [2023/01/07(土) 19:04:16.19 ID:B7GL4Qwr.net]
JaneStyleでの改行は\s<br>\sか?
実際の対象を見ないと分からないけどたとえばアンカーなんかも無いと分かってるなら
^(?=.*[、。])\s[^<]{70,100}\s$

特定の荒らしか何かを想定しているのかな

622 名前:デフォルトの名無しさん mailto:sage [2023/01/07(土) 19:42:28.54 ID:Zoa7JGj4.net]
アンカータグは当然あるよ
5chならね

623 名前:デフォルトの名無しさん mailto:sage [2023/01/13(金) 18:40:39.04 ID:ZqEJpVNq.net]
そういうことじゃないんじゃないか

624 名前:デフォルトの名無しさん mailto:sage [2023/01/29(日) 18:48:08.66 ID:cz1zZ3tj.net]
>>605
そのままchatgpt で聞いてみたよ


以下の正規表現を使用することで、1行 (改行文字無し)、半角全角で70文字以上100文字、文中に「、」または「。」を1文字以上含む条件を全て満たす文字列を抽出することができます。

ruby
Copy code
^(?=.{70,100}$)(?=.*[、。]).*$
この正規表現は、文字列が70文字以上100文字以下であり、文中に「、」または「。」を1文字以上含むことを保証します。

だってさ

625 名前:デフォルトの名無しさん mailto:sage [2023/01/29(日) 21:21:58.64 ID:O+Wk/2Eo.net]
近頃はみんな

626 名前:デフォルトの名無しさん mailto:sage [2023/01/29(日) 22:30:48.24 ID:9ooogxSi.net]
薄くなったね

627 名前:デフォルトの名無しさん mailto:sage [2023/01/30(月) 01:55:35.57 ID:GlHcGD1J.net]
体裁を整える能力はピカイチだが、それが正しいという保証はないからなあ
ちゃんと使うにはまずその分野の知識が必要というジレンマ

628 名前:デフォルトの名無しさん [2023/01/30(月) 17:50:26.15 ID:gh9uKCuR.net]
正規表現でガチャを回せる投稿サイトを作った話
https://zenn.dev/karugamo/articles/c1ce791689c5b7

https://www.regech.app/



629 名前:デフォルトの名無しさん mailto:sage [2023/01/30(月) 21:13:06.03 ID:TI/BqHZQ.net]
(?!).+

630 名前:デフォルトの名無しさん mailto:sage [2023/02/02(木) 00:14:23.96 ID:fPL322j9.net]
顔文字に見える正規表現を考えたい

(;*~_~*)

631 名前:デフォルトの名無しさん mailto:sage [2023/02/04(土) 22:54:12.69 ID:DlLJLfae.net]
2023-02-04という書式の日付のデータがある時
その行で最初に出てきた-を年にしたい
正規表現でなんて書けばいいですか?

632 名前:デフォルトの名無しさん mailto:sage [2023/02/04(土) 22:57:04.23 ID:DlLJLfae.net]
検索欄に(^.*?)(-)
置換欄に\1年

633 名前:デフォルトの名無しさん mailto:sage [2023/02/05(日) 10:48:30.98 ID:KWvYGjBb.net]
-(.*) → 年$1

634 名前:デフォルトの名無しさん [2023/02/11(土) 16:20:49.02 ID:fAcJ3wf1.net]
●Regular Expressionの使用環境
WindowsのJScript
●検索か置換か?
検索
●説明
下記のような文字列があった場合、
[なんとか]から次の[なんとか]が出てくるまでの複数行を取り出したいんだけど、どうする?
自分はコレしか思いつかなかったんだけ
str.match(/^\[.*\][^\[]*/mg);
もっといい方法ある?

●対象データ(これってAviUtlのexoファイルです。
[424.0]
_name=音声ファイル
再生位置=0.00
再生速度=100.0
ループ再生=0
動画ファイルと連携=1
file=D:\PlayMemories\2023-02-09\C0002.MP4

[424.1]
_name=音量フェード
イン=0.00
アウト=3.00

[424.2]
_name=標準再生
音量=50.0
左右=0.0

635 名前:デフォルトの名無しさん mailto:sage [2023/02/11(土) 17:02:21.81 ID:yc790R16.net]
^\[[^[]*\n(?=\n)

636 名前:デフォルトの名無しさん mailto:sage [2023/02/11(土) 17:47:19.77 ID:4bXfwNL9.net]
str.split('\n\n')

637 名前:デフォルトの名無しさん mailto:sage [2023/02/11(土) 18:25:52.14 ID:G+Atp5X9.net]
空行区切りとは限らない場合、ファイル名に[があるかもしれない場合
str.match(/^\[.*(?:\n(?!\[).*)*\n*/gm)

638 名前:デフォルトの名無しさん [2023/02/12(日) 00:39:26.16 ID:mse6QHvr.net]
>>622-624
できました。すごい。



639 名前:デフォルトの名無しさん mailto:sage [2023/02/12(日) 12:08:20.65 ID:2oU17ty6.net]
[424.0] は、つまり、

行頭が[ で、行末が] の場合だけを、特別な命令と解釈するのだろ

640 名前:デフォルトの名無しさん mailto:sage [2023/02/12(日) 12:34:59.28 ID:PBDCQhni.net]
こういうの非包含が使えたらすごい楽
^\[(?~^\[)

641 名前:デフォルトの名無しさん [2023/02/12(日) 23:00:31.59 ID:mse6QHvr.net]
>>627
正規表現て複雑な入れ子とかの抜き出しもできることは知ってるけど、
その辺の解説書とかページてないのかね。

642 名前:デフォルトの名無しさん mailto:sage [2023/02/14(火) 23:50:28.21 ID:dTCCMwFb.net]
JavaScriptの正規表現で質問です
ある正規表現に合致し、ある正規表現に合致しない、という正規表現は可能でしょうか?
具体的には
任意数は0も含むものとして
任意数の大文字アルファベットのあとに、任意数の小文字アルファベットが続き、その後任意数の数字が続く文字列のうち

643 名前:
小文字のみ、数字のみの文字列を除外したいです(大文字のみのものは合致させたい)

合致例
ABab01
AAA0
aaa012
ABCDE

合致させたくない例
abcde
012345
000aaa
[]
[ここ壊れてます]

644 名前:デフォルトの名無しさん mailto:sage [2023/02/14(火) 23:57:34.39 ID:XRqDNj0i.net]
宿題ですか?

645 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 00:01:55.99 ID:GMMfGDKP.net]
宿題かどうかで正規表現の書き方は変わりませんよね?

646 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 00:52:40.53 ID:F/CuEgLN.net]
できるけど全部正規表現でやらないほうがメンテしやすいぞ

647 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 00:54:24.40 ID:GMMfGDKP.net]
つまりif文で区切るほうが見やすいということですか?

648 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 08:47:44.60 ID:p2xlcd9z.net]
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([0-9]+)?



649 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 10:37:15.75 ID:5uY2Ajym.net]
>>634
ありがとうございます
素直に足し算の発想でやればよかったんですね

650 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 12:54:55.60 ID:q8BaXLdM.net]
ABab

651 名前:デフォルトの名無しさん [2023/02/15(水) 14:01:59.87 ID:N6Rs6EpM.net]
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([a-z]+)?([0-9]+)?
ですかね

652 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 14:05:43.89 ID:VU7epY9U.net]
[A-Z]+[a-z]*[0-9]*|[a-z]+[0-9]+

653 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 14:13:41.85 ID:6puQI1n1.net]
NG例に000aaaがあるということは
000aaaAA
とかもあるわけだよね
そしてこれは順序が違うからマッチさせたダメってことか?

654 名前:デフォルトの名無しさん mailto:sage [2023/02/15(水) 14:30:32.69 ID:u5Kc1xOf.net]
^(?!$|[a-z]+$|[0-9]+$)[A-Z]*[a-z]*[0-9]*$

655 名前:デフォルトの名無しさん mailto:sage [2023/02/16(木) 22:56:05.33 ID:Tpu7Mxzn.net]
正規表現で*ではなく0文字以上n文字以下って指定の仕方どうやるんだっけ
*はセキュリティホールになるから使うなみたいなのをどこかで見たので

656 名前:デフォルトの名無しさん mailto:sage [2023/02/16(木) 23:01:53.04 ID:Tpu7Mxzn.net]
スマンぐぐったらすぐ出てきたわ
ReDoS攻撃というやつだな
正規表現が標準で使える言語でパターンマッチのタイムアウト設定できるやつってあんのかな

657 名前:デフォルトの名無しさん mailto:sage [2023/02/22(水) 02:52:40.50 ID:Lq+l8VAY.net]
勉強になった

658 名前:デフォルトの名無しさん [2023/02/28(火) 19:25:23.88 ID:LpLAZFFY.net]
●Regular Expressionの使用環境
秀丸エディタ

●検索か置換か?
置換

●説明
正規表現で加減算したいです
perlの場合これでできるそうです
検索:columnIndex([\d]+)
置換:columnIndex@{[$1+1]}

●対象データ
columnIndex001 = "aaa";
columnIndex002 = "bbb";
columnIndex003 = "ccc";

●希望する結果
columnIndex002 = "aaa";
columnIndex003 = "bbb";
columnIndex004 = "ccc";



659 名前:デフォルトの名無しさん mailto:sage [2023/02/28(火) 21:40:28.89 ID:k7F1eRIt.net]
perlの置換の式はただのスクリプトとしての演算だからなあ
無理なんじゃね

660 名前:デフォルトの名無しさん mailto:sage [2023/02/28(火) 21:52:42.51 ID:3RvLxpuD.net]
俺だったらエクセルに貼って分解して計算して足し込んでcsvに出力する

661 名前:デフォルトの名無しさん mailto:sage [2023/02/28(火) 22:16:00.68 ID:HPZ5xkxF.net]
秀丸にも専用のスクリプト言語的なのなかったっけ?
それ使えばワンチャンあるが素直に汎用のスクリプト言語使った方が楽かも

662 名前:デフォルトの名無しさん mailto:sage [2023/02/28(火) 22:25:04.50 ID:LpLAZFFY.net]
そうかありがとう
B2&TEXT(C2+1,"000")&D2な感じでエクセルに計算させます

663 名前:デフォルトの名無しさん mailto:sage [2023/03/05(日) 15:30:49.38 ID:kbQORjCn.net]
chmateの名前欄ng正規表現について
ここの正規表現は拡張正規表現だよね?
ワッチョイ消しあぼーんは(?<!\))$だけど、この中の\って何?
それと\(ス[プ|ッ]+ Sd(5f|bf)の中の\って何?

正規表現なら\は直後のメタ文字打ち消しだけど拡張正規表現においては何を意味するの?

664 名前:デフォルトの名無しさん mailto:sage [2023/03/05(日) 16:48:59.22 ID:zxnSBXGX.net]
メタ文字消し
|のことならor

665 名前:デフォルトの名無しさん mailto:sage [2023/03/05(日) 17:13:11.22 ID:/VGFBid9.net]
今まさに書き込もうとしてた。ググったらchmateのNG表記も標準正規表現なんだな
俺が何で拡張正規表現かと勘違いしたかというと、|は標準正規表現では使えないからLinuxなら-Eをオプションに付けて拡張正規表現にする必要があると習ったから
chmateでは|が使えるけどメタ文字打ち消しのバックスラッシュも使うというのはどういう事なの?

666 名前:デフォルトの名無しさん [2023/03/05(日) 22:34:50.68 ID:jasgpIrF.net]
>>642
rubyの3.2は出来ます。

https://www.ruby-lang.org/ja/news/2022/12/25/ruby-3-2-0-released/
Regexpのタイムアウトの導入

667 名前:デフォルトの名無しさん [2023/03/25(土) 11:22:38.54 ID:YDfCdrWh.net]
/~/という書き方のとき以外でスラッシュ/を\エスケープする必要があるケースはありますか?

668 名前:デフォルトの名無しさん [2023/04/17(月) 19:32:17.83 ID:5c7uVWzN.net]
「0」と「1」からなる文字列のうち、「0」と「1」を同数含む文字列にマッチする
正規表現は存在しません。

正規表現よりも強力な検索方法で↑の文字列にもマッチさせることができるようなソフトは
存在しますか?



669 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 19:44:56.00 ID:sl+3Awil.net]
python

670 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 20:33:36.29 ID:waI8rtvz.net]
つらい

671 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 21:06:25.43 ID:z5E2eHg0.net]
https://regex101.com/r/abzBX8/1

672 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 21:29:53.48 ID:W4QVtvW8.net]
JavaScriptで書くかな

673 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 23:02:23.02 ID:HlIFmrYC.net]
正規表現よりも「強力な」検索方法ってどう言う事?
それチェックするだけならBASICだって出来るだろうに

674 名前:デフォルトの名無しさん mailto:sage [2023/04/17(月) 23:14:49.47 ID:aBS+jUDM.net]
あのさあ
>>657を見た後でそんなこと言ってるの?
>>657の末尾に$をつけりゃチェックできるだろうに

675 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 00:49:04.02 ID:HEwUJcz7.net]
https://regex101.com/r/abzBX8/4

676 名前:デフォルトの名無しさん [2023/04/18(火) 01:55:03.99 ID:0xKKyM+T.net]
wwなんじゃこの無意味なやつww

677 名前:デフォルトの名無しさん [2023/04/18(火) 01:55:30.29 ID:0xKKyM+T.net]
全くチェックできてないやんwww

678 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 03:16:09.61 ID:+QStg837.net]
正規表現だけで頑張りすぎる奴はアホ



679 名前:デフォルトの名無しさん [2023/04/18(火) 10:37:46.66 ID:1M+dv0CB.net]
> 「0」と「1」を同数含む文字列にマッチする
これが部分文字列も含むのなら最初の「0111011110001100000…」のところだけでも
で01, 10とか01111000, 111000, 1100, 0011とか011101111000110000とか
他にもあるけどまあ沢山あるわな

こんなんチェックして何の意味があるのか知らんけど

680 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 11:53:15.97 ID:mLPBXdJt.net]
>>661のは01以外の文字が存在してるのを失念してるので、少しだけ修正
^([^01]|0[^01]*?(?1)*?1|1[^01]*?(?1)*?0)++$

681 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 11:55:59.03 ID:mLPBXdJt.net]
あ、すまん
>「0」と「1」からなる文字列のうち
を忘れてた

682 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 12:04:05.08 ID:mLPBXdJt.net]
おまけに>>666は冗長だったしね
^([^01]|0(?1)*?1|1(?1)*?0)++$

683 名前:デフォルトの名無しさん [2023/04/18(火) 12:07:01.90 ID:y8YzUN5p.net]
なぜある範囲の文字列を認識できる正規表現が重用されるのでしょうか?

たとえば、文脈自由文法により生成される文字列を認識できるような検索ソフトは
ないのでしょうか?

684 名前:デフォルトの名無しさん mailto:sage [2023/04/18(火) 12:19:50.17 ID:VZPIsbzr.net]
何故妙な所でわざわざ改行を入れるのでしょうか?

685 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 15:37:27.88 ID:DhCp7Dkf.net]
たとえばHTMLの<title>の直後だけ判定したいときに
マッチしなかったら長いページの最後まで<title>~を探し続けるの無駄だと思うんだけど
<title>のところだけ見終わったら判定打ち切ることってできる?

686 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 17:20:57.30 ID:WqdbOhNP.net]
https://regex101.com/r/xvZeom/1

687 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 18:18:09.16 ID:DhCp7Dkf.net]
>>672
ありがとう!

688 名前:デフォルトの名無しさん mailto:sage [2023/04/19(水) 22:28:52.49 ID:ndERcjBg.net]
>>669
計算量が小さいことが数学的に証明されているから
文脈自由文法は計算量が大きい



689 名前:デフォルトの名無しさん [2023/05/10(水) 15:31:44.13 ID:7WScgW4R.net]
下記の文字列でナンバリングの重複

690 名前:を除去するにはどうすればいいですか?

かまいたちの知らんけど #37 #37 「梅沢富美男とドライブ旅!やりたいこと詰め込んだら喜ぶ、知らんけど」 [GAORA] 2023年05月10日.ts
千鳥の相席食堂 #199 #199 藤岡弘、&藤岡真威人の旅! ’田舎出身&ロケマスター芸人’の千鳥がツッ [スカイA] 2023年05月08日.ts

ナンバリングが同一かどうかを考慮しなければ下記で可能かなと思うのですが、

(#[0-9]{1,})[\S\s]*(#[0-9]{1,})

ナンバリングが同一である場合に除去するってことは可能なのでしょうか?

※「正規表現は、.NET Framework で提供される正規表現の全ての機能が使えます」ってヘルプにあります
[]
[ここ壊れてます]

691 名前:デフォルトの名無しさん [2023/05/10(水) 15:43:18.27 ID:7WScgW4R.net]
[\S\s]* は 改行を考慮してみただけで何でもよかったので、無視してください。

692 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 15:49:49.18 ID:XkmajJ+H.net]
s/(#\d+ )\1/$1/

693 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 15:56:15.66 ID:yXmZBCRQ.net]
#37 #371

694 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:24:45.76 ID:XkmajJ+H.net]
>>678
なんか問題ある?

まあ例は基本形であって\1というものがあるということを教えればいいだけだけどね

695 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:34:36.66 ID:KWVZdtYA.net]
誤爆しないかチェックしたかったんでしょ
そんな噛み付か無くても良かろうよ

696 名前:デフォルトの名無しさん [2023/05/10(水) 16:44:00.86 ID:7WScgW4R.net]
>>677
これでいけそうです、ありがとうございます

\1 の働きが 何か分からないんですが、何て言葉で検索すればいいですか?

697 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:01.37 ID:7WScgW4R.net]
あ、キャプションってやつですかね。
こうなか?

s/(.*)(#\d+ )\2(.*)/$1 $2 $3/

698 名前:デフォルトの名無しさん [2023/05/10(水) 16:52:49.70 ID:7WScgW4R.net]
こうかな



699 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 16:57:22.57 ID:XkmajJ+H.net]
前後を不定長にするとバックトラックの量が半端じゃなくなるよ
数千倍数万倍それ以上の場合数にあっという間になるので
どれほど爆発的に増えるか考えてみてくれ

700 名前:デフォルトの名無しさん [2023/05/10(水) 17:23:53.71 ID:H/PxYykp.net]
正規表現はChatGPTと相性いいなぁ
すげー間違ったことも返されるけど検証もさせられるしやテストケースも生成出来て超便利

701 名前:デフォルトの名無しさん mailto:sage [2023/05/10(水) 18:11:00.72 ID:XkmajJ+H.net]
>>682
悪い
試したらstep数は全然増えなかったね
俺の勘違いか

702 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 00:59:59.60 ID:GLOCdhwM.net]
ハゲとフサの混在からハゲを排除したい

703 名前:デフォルトの名無しさん mailto:sage [2023/05/18(木) 09:45:41.67 ID:HWVU1A6n.net]
replace(/ハゲ/g, 'ヅラ')

704 名前:デフォルトの名無しさん mailto:sage [2023/05/21(日) 18:08:25.80 ID:T9C8dxe0.net]
\Kってどうゆうときに使うんですかね?

705 名前:デフォルトの名無しさん mailto:sage [2023/05/22(月) 23:09:40.07 ID:lUHZhpO8.net]
安心して下さい\Kはいてますよ
$& = はいてますよ

706 名前:デフォルトの名無しさん mailto:sage [2023/05/23(火) 15:16:49.72 ID:5w9lz5Mr.net]
そちらにはいてますか

707 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 21:08:35.92 ID:HxAuQBVD.net]
特定の文字列が2回以上なければ削除したい
$aa=~s/hoge// if $aa!~/.+hoge.+hoge.+/;
正規表現一発で出来ませんか

708 名前:デフォルトの名無しさん mailto:sage [2023/05/27(土) 22:49:21.84 ID:Jh5M5XKC.net]
s/\A(?![\s\S]*(砂沙美魔法少女クラブ)[\s\S]*\1)([\s\S]*)\1([\s\S]*)\z/$2$3/



709 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 06:07:20.35 ID:exFpSO/0.net]
s/(hoge.*hoge)|hoge/$1/
s/hoge.*hoge\K|hoge//
s/hoge.*hoge(*SKIP)(*FAIL)|hoge//

s/(hoge)(.*\1\K)?//
https://regex101.com/r/qoyDnZ/1

710 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 10:23:23.66 ID:fg1fsMga.net]
s/みさおちゃん(?:.*みさおちゃん(*COMMIT))?//

711 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 12:43:42.23 ID:yjwdVP6E.net]
説明不足でした
$aa=~s/.+hoge.+\n// if $aa!~/hoge.+hoge/s;

これなぜにかダメです
$aa=~s/(hoge.+hoge)|[^\n]+hoge[^\n]+\n/$1/s;

712 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 14:47:06.90 ID:6Y81pqVN.net]
ダメなのは左のhogeより先に右の[^\n]+hogeがマッチを始めるから
左が先になるように右に合わせる

713 名前:デフォルトの名無しさん mailto:sage [2023/05/28(日) 15:02:19.22 ID:yjwdVP6E.net]
初歩的でしたね、ありがとうございます

714 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 00:20:37.60 ID:Dm7F+2f1.net]
「-」の無い電話番号に「-」を入れるには?

715 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 07:23:21.12 ID:X455hjkS.net]
国際電話とかあると面戸だね

716 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 08:55:50.76 ID:t6+qFJ/7.net]
>>700
携帯番号以外は不可能じゃないかな

717 名前:デフォルトの名無しさん mailto:sage [2023/05/31(水) 18:03:07.79 ID:wXMZ1Y1H.net]
区切り位置が変わるから全部羅列するしかないね
それも時々更新する必要がある

718 名前:デフォルトの名無しさん mailto:sage [2023/06/02(金) 21:23:49.13 ID:XcfIYH3W.net]
>>701
誰か頑張れ
https://www.soumu.go.jp/main_sosiki/joho_tsusin/top/tel_number/q_and_a-2000apr.html



719 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 16:20:02.62 ID:p6l+hu28.net]
固定電話
https://regex101.com/r/f9rw3E/1

720 名前:デフォルトの名無しさん mailto:sage [2023/06/03(土) 22:05:33.82 ID:vWJZBL5V.net]
愛は行動。言葉だけではダメ

721 名前:デフォルトの名無しさん mailto:sage [2023/06/04(日) 00:25:20.56 ID:FmV4cjgS.net]
もう冷めました

722 名前:デフォルトの名無しさん mailto:sage [2023/06/16(金) 20:08:06.56 ID:BLiKvBT9.net]
Perl v5.38.0-RC1

723 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 00:06:22.30 ID:7IbgNtYk.net]
NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
japan.zdnet.com/article/35205348/

perl-5.38.0-RC1 perlre.pod
metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod

(鬼車) 不在機能群の入れ子 の動作テスト集
github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt

724 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 14:54:23.24 ID:PO9vLDeK.net]
>>708
これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は
使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、
スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを
抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。

https://pastebin.com/V1DVjsQd

725 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:04:09.09 ID:PO9vLDeK.net]
訂正。>709で貼ったコードは正しく動作するががコメントに(ここに貼った際に試行錯誤した
せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。

https://pastebin.com/RQ5uj62f

726 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 15:53:25.97 ID:uv5oAAX5.net]
>>709
URLの「正しい」ってなんですか

https://en.wikipedia.org/wiki/URL#Syntax
https://datatracker.ietf.org/doc/html/rfc3986#appendix-A

727 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:12:09.00 ID:uv5oAAX5.net]
「正規表現を用いた文字列抽出の例」図は「誤った正規表現」の例なんじゃないかなあ
例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう

728 名前:デフォルトの名無しさん mailto:sage [2023/06/18(日) 16:13:51.73 ID:PO9vLDeK.net]
>>711
あなたが示している[1]のsyntax diagram(構文図)[2



729 名前:]にあるように、? はqueryを示す文字で
path( / )以前のドメイン名部分には出てこず、最低限 / の後でなければならないはず。

[1] https://en.wikipedia.org/wiki/URL
[2] https://upload.wikimedia.org/wikipedia/commons/thumb/d/d6/URI_syntax_diagram.svg/1280px-URI_syntax_diagram.svg.png
[]
[ここ壊れてます]

730 名前:デフォルトの名無しさん mailto:sage [2023/06/19(月) 17:12:20.20 ID:a4eWUm7x.net]
>色んな意味でおかしい
同意。本当にこの例をNTTの技術者が作ったの?と思ってしまった。
広報担当の事務員が頑張って作った例だと言われたら納得出来るw

731 名前:デフォルトの名無しさん mailto:sage [2023/06/20(火) 13:11:10.13 ID:AvErps2d.net]
これは、>>712の人も言ってるように「悪い見本」か、あるいは「プレスリリース用にめっちゃ簡略化した例」のどちらかかと思う
個人的には悪い見本の方かと思う
「?」と「ID」の間のスペースとか気持ち悪いし

732 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 01:04:22.29 ID:LPKmcd4s.net]
メールアドレスは誤ったアドレスを発行して運用してるところがあると対応せにゃ仕方ないけど
URLは誰もアクセスできないだけで終わるんだろうな

733 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:01:06.48 ID:FL3bkV8O.net]
質問
ある文字列の中に、4桁の数字が出た場合、文字列を区切るという目的で正規表現を使いたいです
let hoge="....";
hoge.split(/\d{4}/)
しかし上記の正規表現だと、例えば6桁の数字でも区切ってしまうため、これを4桁に限定するためにはどうしたらよいでしょうか?

734 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 02:36:29.87 ID:HRXsYHZK.net]
(?<!\d)\d{4}(?!\d)

735 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 06:20:04.42 ID:FL3bkV8O.net]
ありがとうございます

736 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:00:29.04 ID:8S43aXN3.net]
修正前 .*(..)?
修正後 .*?(.[^z])?

"abcd"を与えて受理される文字列
修正前 ""
修正後 "ab"
受理してもらいたかった文字列 "cd"

URLからIDを取り出すほうは画像に入るようにデフォルメする必要があるから
おかしいURLになるのはやむを得ないと思う

> (?:[&].*)?
ただこれはちょっと気持ち悪い
これがあっても無くても結果は変わらないから付ける必要なかった
正規表現に詳しい人が"&"を単体で文字クラスに入れることはあまりない(たまにはいる)

新技術のアプリを実際に試させてくれないかな?
提供してもらえれば無償でテストするよ

737 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:17:00.34 ID:Z+I+bAqU.net]
「abczは拒否」→「なるほど末尾zは拒否だな」

えー…

738 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 07:38:48.98 ID:SbeXWTV7.net]
書いてないけど前提として完全一致のつもりだったんだろうな



739 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 10:41:38.55 ID:8S43aXN3.net]
jsって完全一致が前提になるオプションってある?
それがあったとしても .*?(.[^z])? はAutoだが

740 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 11:16:26.32 ID:ld9dVlA3.net]
>>723
シングルラインモード(dotAll)で ^ と $ を使えば良いだけでは?

741 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 12:14:35.15 ID:8S43aXN3.net]
^と$を使うつもりなら画像の中でも使うと思う
見やすくするために省いてるだけなのかな?
そうだとしても .*?(.[^z])? はAutoだが

742 名前:デフォルトの名無しさん mailto:sage [2023/06/21(水) 22:34:06.87 ID:g2ig9yOY.net]
ニュー速(嫌儲)で、近頃半角記号を6文字だけとかの書き込みがあります
なんとかNGを作りたいのですがうまく行きません
行頭から記号だけの文字列で4~8文字、って想定でこんなの作ってみたんですが、httpで始まるurlも引っかけてしまいます
^[ -/:-@\[-~]{4,8}

例えばこんなスレなんですが
https://greta.5ch.net/test/read.cgi/poverty/1687352512/

詳しい方、正規表現作ってもらえないでしょうか?

743 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:30:57.52 ID:nJDgsm3N.net]
そういうのは専ブラのNGスレでやるべきだね、ユーザー同士で情報共有にもなるから
正規表現を適用する対象がHTMLでなくdatだったりでユーザーでないと作れない場合もある

記号だけにマッチさせたいなら[!-/:-@\[-`{-~]だが、この前後に付ける正規表現は
お使いの専ブラスレで聞いてくれ

744 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:42:44.65 ID:TTIYA8nl.net]
そこみる限りでは3パターンしかなくない?
何かしらの絵文字とかが化けて出てるだけとか。
(\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)

745 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:08:56.55 ID:L6AKAbfA.net]
726です
726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました
727さんのに変えたら誤動作無く動作しました
^[!-/:-@\[-`{-~]{5,11}

ちなみに、android板に以下のスレを発見しました
しかし、荒らされてて機能して無さそう
他にこっちの方が良いよ、っておすすめのスレはありますかね?

オススメのNGワード
https://egg.5ch.net/test/read.cgi/android/1576334383/

746 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:55:55.92 ID:nJDgsm3N.net]
こちらはそちらが何を使ってるかも分からないので勧めようが無い件
問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う
今のままでは12文字以上記号が続いててもNGになっちゃうね

747 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 13:11:08.52 ID:L6AKAbfA.net]
>>730
chmateなんです

その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました
^[!-/:-@\[-`{-~]{2,11}$

ここがひどいです
https://greta.5ch.net/test/read.cgi/poverty/1687400738/

748 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:46:12.28 ID:vRMLRvgd.net]
方言がひどい記述だけど(PCRE2とbregonig.dllでは大丈夫)

^ ?(((?!&gt;?|&lt;?)[[:punct:]])+|&gt;?|&lt;?){2,} ?$



749 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:53:40.61 ID:vRMLRvgd.net]
>>732
はdatに対してのものだから、mateはどうなのかは知らん
POSIX文字クラスが通っても、&gtとか行頭行末の半角スペースとか無さそうだね

750 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 23:53:09.33 ID:nJDgsm3N.net]
GJ
[[:punct:]] これいいね、覚えとこ
(()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから
++や(?>)を使ったほうがいいかも
正規表現エンジンの内部でも対策はしてると思うけど念のために

751 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 01:33:06.45 ID:gmkpJif8.net]
>>734
+が入ってるのはダメじゃん
除いてくれ
作ってる途中で紛れ込んだものだね

なおbregonig.dllだと
^ ?(?:\p{punct}|&gt;?|&lt;?){4,} ?$
^ ?(?:[[:punct:]]|&gt;?|&lt;?){4,} ?$
でもいけちゃうんだよな
ちょっと不思議

752 名前:デフォルトの名無しさん [2023/06/23(金) 02:02:21.28 ID:qwakAXsj.net]
and検索みたいなのってできない?
今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい

753 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 02:09:08.88 ID:gmkpJif8.net]
>>736
^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)

754 名前:デフォルトの名無しさん [2023/06/23(金) 02:35:28.92 ID:qwakAXsj.net]
>>737
感謝

755 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 12:02:08.17 ID:2Ntzjt3B.net]
[文章]
AAAaiueo111 xxx
aaaaa
AAAkakikukeko xxx
b b b
AAAsasisuseso
ccccc
AAAtatituteto000
ddd123


上記の文章で先頭がAAAの行だけ抜き出して、さらに

756 名前:AAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。

使用するのはサクラエディタの置換機能で、

置換前 AAA(.*)\r |.*\r\n
置換後 $1

で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。
[]
[ここ壊れてます]

757 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:06:42.48 ID:gnUd2/2c.net]
AAAで始まらない1行|先頭のAAA|末尾のxxx

758 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:54:57.82 ID:WBrlaKRC.net]
^AAA|xxx$|^.*\r\n → 削除



759 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 15:20:23.65 ID:2Ntzjt3B.net]
>>740
>>741
ありがとうございます。

760 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 19:05:48.89 ID:zWmLGOhD.net]
^AAA([^\r\n]*?)(?:xxx)?$|^[^\r\n]*(?:\r\n|[\r\n])?
$1

アク菌で書けませんぞテスト

761 名前:734 mailto:sage [2023/06/23(金) 19:21:25.94 ID:zWmLGOhD.net]
>>735
PCRE2では\p{Punct}は存在しないんだね
www.pcre.org/current/doc/html/pcre2syntax.html

[\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど
プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ

> +
言われてみれば+があるのはおかしいw 忘れ物だったのかw

762 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 21:34:05.58 ID:gmkpJif8.net]
>>744
不思議な点は
PCRE2だと、[[:punct:]]で&が先にキャッチされて&gt;のgt;が取り残されてしまうので
|&gt;とあってもマッチしなくなる
bregonig.dllだと
&gt;にキャッチされてマッチする(punctより&gt;が優先される
(PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?)
これはorの記述の順序には関係なく左に(先に)&gt;を書いても結果は同じ

763 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:07:00.56 ID:zWmLGOhD.net]
ここのテストサイトで regex101.com/
^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど
本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない?
それで>>732に要らないはずの先読みを入れてたんだね
これがマッチしないならバグかも知れない
もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから

764 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:09:21.21 ID:zWmLGOhD.net]
あ、&が化けちゃった
^([[:punct:]]|&gt;|&lt;)$ を &gt; にマッチさせて

765 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:31:35.63 ID:gmkpJif8.net]
>>746
今確認したらそのとおりだった
俺は以前一体何をやったんだろう?

766 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:36:28.09 ID:gmkpJif8.net]
今考え付くのは
^(?>[[:punct:]]|&gt;)+
とか
&gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?

767 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:47:37.55 ID:gmkpJif8.net]
さすがに(?>)を使って気づかないわけないから(使った覚えもないし)
恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする

768 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 23:16:11.04 ID:zWmLGOhD.net]
そういうこと俺もあるから分かるわーw
頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに
なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事

間違えた原因は分からないけどとりあえずゆっくり休んでくれw



769 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:27:07.24 ID:X4q59utv.net]
勘違いした理由が分かった
^([[:punct:]]|&gt;)+
これをやると&で切れちゃうんだ
s/([[:punct:]]|&gt;)+//g
をやるとgtが置換されずに残る

末尾に$とか目標物を付ければ切れないんだが
さてどうして切れるのか誰か教えて

770 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:36:09.10 ID:X4q59utv.net]
やっぱ左側が優先なのか
(&gt;|[[:punct:]])
と入れ替えたら切れない

771 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 09:56:18.97 ID:o3ZfF1Sp.net]
>>742 >>741
それだと行頭からxxxだけしかない行の改行が削除できずに残りそうだけどどうだろう
^AAA|^.*\r\n|xxx$ → 削除

772 名前:751 mailto:sage [2023/06/24(土) 11:05:23.89 ID:QPqcCtG1.net]
>やっぱ左側が優先なのか
正解

ただ、同じ正規表現で&;gt;にマッチする環境もあるよ
考えられる中で最長になるマッチを探すエンジン

バックトラックの動きがまだよく分かってないなら>>708のNTTと早大の正規表現や
>>743で使ってる .* と .*? の動きも見直しておいたほうがいいかも
見た目は簡単そうに見えるけど正しくバックトラックの動きを理解してないと作れない
舐めてかかると酷い目に遭う怖いヤツだよ(過去に経験あり)

773 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:10:05.28 ID:QPqcCtG1.net]
あ、NTTと早大のやつは正規表現を^と$で囲ってから動かして

774 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:21:09.38 ID:X4q59utv.net]
>>755
いままで
+や++での強欲のバックトラックが最長を探すのに違いがあるとは思っていなかったよ
最大の最長を探す記述ってのも欲しいな

775 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 16:54:14.04 ID:QPqcCtG1.net]
>最大の最長を探す記述

ちょっと探してみたらPHPのオプションにあった
www.php.net/manual/ja/function.mb-regex-set-options.php
> l 最も長くマッチするものを探す

この処理ってすごく重くなりそうなイメージがあったけどそうでもないのかな

776 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 17:35:54.33 ID:X4q59utv.net]
PHPだけじゃなあ
結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか

777 名前:743 mailto:sage [2023/06/25(日) 11:57:31.39 ID:YeZqv3UB.net]
>> 759
考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか
正規表現むずかしい

>> 740 741 754
改行コードがLFやCRのみの場合に対応してない
最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない
743は両方に対応しているけど740の発想のほうがシンプルで優れてるね
あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう

778 名前:デフォルトの名無しさん mailto:sage [2023/06/27(火) 21:16:47.75 ID:TnfGmDZI.net]
最長一致マッチが有効のとき、下の正規表現は何にマッチすべき?

"abcd" =~ /abc\Kd|abc/;

\Kの前を文字列長に含めるべきか否かを考えて下さい



779 名前:デフォルトの名無しさん mailto:sage [2023/06/28(水) 12:49:16.44 ID:vk3PbjZ1.net]
元より最左ルールに基づいてdよりabcにマッチすべきとはならんやろ

780 名前:761 mailto:sage [2023/06/28(水) 13:05:55.77 ID:m0cBggZC.net]
>>762
ありがとうございます、それは正しい意見だと思います
\Kの前を文字列長に含めるべきかどうかについてはどうお考えですか?
今後の参考にしたいと考えております

781 名前:デフォルトの名無しさん mailto:sage [2023/06/29(木) 11:57:49.56 ID:0JMnG4u5.net]
最長一致する正規表現が有効の場合

1、「abc」「あ」

2、「て゛」「で」

A. 前が長い
B. 同じ長さ
C. 後ろが長い

782 名前:デフォルトの名無しさん mailto:sage [2023/07/02(日) 20:25:06.40 ID:/BVUs+ug.net]
奥が深すぎる

783 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 13:17:43.04 ID:GbtWdAMV.net]
twitter.com/k_takata/status/1676247372731662336
>正規表現技術入門が第2刷増刷

おめでとうございます
bregonig.dllやonigmoにはいつもお世話になってます
vimは知りませんw

784 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 17:43:12.24 ID:SQbV6Whm.net]
JaneStyleであぼーんにつかいたいのですが、

アウアウウー Sa47-runv [106.131.26.222]

47
runv
131.26.222

この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?

785 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 20:37:36.61 ID:GbtWdAMV.net]
Jane Styleの仕様が分からないけどこれでいける?

(?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

786 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:30:05.44 ID:7Yxy824T.net]
>>768
ありがとうございます!
ためしてみたけれど駄目でした。
細かく分析して応用してみます!!

787 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:54:51.51 ID:7Yxy824T.net]
>>768
失礼しました。勘違いをしていて、正しく設定したらこれでいけました!!
大感謝です!&正規表現の勉強になりました!!
リファレンスみてなるほどとうなっています

788 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:55:53.42 ID:gWNyo9yQ.net]
いやそれでいけるでしょ
(?i)はデフォなので要らないけど
ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで
設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか



789 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:26.50 ID:GbtWdAMV.net]
動いて良かった、正規表現の勉強頑張れーw
771さんもありがとう

790 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:33.07 ID:4RAXuAwI.net]
ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから
その正規表現すり抜けするかも

791 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:16:17.63 ID:gWNyo9yQ.net]
(?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ

792 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:21:43.88 ID:7Yxy824T.net]
>>773
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

一応、ご指摘通り改良しておきました!

793 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 00:41:55.61 ID:adSx9MnJ.net]
反対に(?i)ではSaの他にsAにもマッチしてしまうのでは?
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい

794 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 13:06:44.76 ID:xew4KSRK.net]
言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う

795 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 23:28:01.04 ID:chPidFQv.net]
鬼車で(?L)と\g<0>が共存出来ないようだけど

"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"

という修正案で何か問題が起こるか分かる人いません?

例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない

鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288

LだけじゃなくCとIも共存不可でした

796 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 12:38:44.00 ID:dnLGUnq0.net]
>>778
"\g<0>" に取り込むときにはそのまま全て取り入れ、取り出すときに
"L" や "C" や "I" を取り除く方法もあるのでは?

797 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 15:02:36.24 ID:NT/2XwNR.net]
最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った
DFA的な最長だと思ってたのに

798 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 17:56:55.84 ID:dnLGUnq0.net]
最左じゃなくても良いみたい
UTF-8のとき

abc < abc\Kd
ab < あ
で < て゛

"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし



799 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 13:05:06.30 ID:8apozFwM.net]
> ab < あ

マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう

800 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 20:06:05.30 ID:8apozFwM.net]
JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす

801 名前:デフォルトの名無しさん mailto:sage [2023/07/11(火) 10:50:26.27 ID:6DaZenCz.net]
(?L)をマルチ文字対応にするのは無理だけど

>"(?C)a(b|\g<0>)c" がエラーになる

これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!

802 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 19:11:50.96 ID:7AgmN8D3.net]
JAPANを日本、NIPPONをニッポンに、同時に置き換える

JAPAN|NIPPON

日本|ニッポン

803 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 23:55:44.94 ID:OlRmyaph.net]
>>785
サクラエディタ+bregonig.dllでは無理っす

804 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 00:50:54.69 ID:JHf9vJmP.net]
https://www.regular-expressions.info/replaceconditional.html
https://npp-user-manual.org/docs/searching/#substitution-conditionals

805 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 13:30:40.79 ID:lxqistQI.net]
わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。

806 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:19:44.01 ID:nnNpViq+.net]
JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?

807 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:22:35.95 ID:nnNpViq+.net]
0を含めないというのは「0より大きい正の半角数値のみ」という意味です

808 名前:デフォルトの名無しさん [2023/07/15(土) 18:39:49.26 ID:Fs/aULCy.net]
正規表現でやることじゃない



809 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:36.28 ID:vGns6WZO.net]
(?!(?!<[0-9])0(?![0^9]))[0-9]+

00とかあるんだったらダメだけど

810 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:49.29 ID:hche+KD8.net]
>>789
XY問題の臭いがする

その文字列を、正規表現「だけ」を使って評価したい理由でもあるの?

811 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 19:54:00.17 ID:nnNpViq+.net]
>>793
全角文字と半角英字を除外したいんですよ
入力欄にこれらを入力されるとフリーズします

812 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 20:24:42.65 ID:hche+KD8.net]
>>794
「正規表現だけで評価したい理由」になってない

許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)

const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);

813 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:27:34.96 ID:nnNpViq+.net]
すみません
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$

814 名前:デフォルトの名無しさん [2023/07/15(土) 21:44:37.74 ID:Ip1+AB5X.net]
そして半年後…
「誰だよこんなクソプログラム書いたやつ💢」

815 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:52:20.50 ID:G+tF3yG6.net]
滅茶苦茶わかりみ
美しくないプログラムはパッと見てうんざりする

816 名前:デフォルトの名無しさん mailto:sage [2023/07/17(月) 02:00:45.07 ID:MFjOLYv6.net]
改行厨たいさく
[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+

817 名前:デフォルトの名無しさん mailto:sage [2023/07/20(木) 17:25:16.42 ID:OqTU1F4P.net]
>>785
そういうの出来るといいですけどねえ

818 名前:デフォルトの名無しさん mailto:sage [2023/07/21(金) 15:55:34.48 ID:GwV7ay2N.net]
>>784
C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった
C言語をちゃんと勉強しないと無理だな



819 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 00:50:40.93 ID:hdFkAV/t.net]
hage【ZEN123】hoge456789
上記の【】内の全角英数字だけを半角にする
正規表現では無理なパターンの例か

820 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 05:19:55.24 ID:BnGP1dsy.net]
正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので
そういう正規表現環境は既に存在してるかも?
今のテキストエディタでもマクロでなら出来るものがありそう

821 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 09:48:00.20 ID:PHWyKwrY.net]
秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね

822 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 13:07:11.02 ID:BnGP1dsy.net]
秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから
お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも?

本家の最新の鬼車の秀丸エディタからの利用方法
www2.maruo.co.jp/hidesoft/2/x39752_.html

823 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 15:10:19.87 ID:nlZnqujR.net]
>>805
それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw

824 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 16:14:08.28 ID:BnGP1dsy.net]
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる

825 名前:デフォルトの名無しさん mailto:sage [2023/07/24(月) 12:53:06.11 ID:LBGWnldn.net]
> 全角->半角変換 や >>785 の置換に対応

正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感

826 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 00:28:01.42 ID:ijwgoKNu.net]
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな

827 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 01:58:51.32 ID:DaPN/KaH.net]
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう

828 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 02:10:59.59 ID:m8SWwEXi.net]
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた



829 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 16:23:19.14 ID:hmH9EM9U.net]
Onigumoで検索して気持ち悪くなる定期

830 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 20:32:41.26 ID:xNvNUPTs.net]
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!

831 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:44:23.17 ID:slvWQQxm.net]
>>813
^(?=.*正規表現)(?=.*教えて)

832 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:46:27.76 ID:slvWQQxm.net]
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$

833 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:49:39.05 ID:slvWQQxm.net]
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$

834 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:51:07.45 ID:Z2bzRt4C.net]
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ

835 名前:デフォルトの名無しさん mailto:sage [2023/07/30(日) 10:33:11.68 ID:3uyXLeeN.net]
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン

検索: ^
置換: #

選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------

検索: [  \t]+$
置換: (なし)

行末の余計なスペースを削除出来て便利

836 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:48:03.89 ID:g9Iw6FTW.net]
https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。

https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。

837 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:56:16.40 ID:IKZkjZuG.net]
http[^\s]+

838 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:02:22.92 ID:BmgakVsI.net]
>>819
.をエスケープ



839 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:14:06.14 ID:g9Iw6FTW.net]
>>820
>>821
うぉぉ、ありがとうございました!

840 名前:デフォルトの名無しさん mailto:sage [2023/08/13(日) 14:38:57.47 ID:vv6Q6LsS.net]
突然大きな声で叫ぶな

841 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:26:03.91 ID:tG3c9Vi+.net]
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd

842 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:58:40.55 ID:vZ93TkLb.net]
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;

正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';

843 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 14:00:17.67 ID:vZ93TkLb.net]
>>825
$s =~ s/(.*)/eval $s/e;

  ↓

$s =~ s/(.*)/eval $1/e;

844 名前:0824 mailto:sage [2023/08/20(日) 20:08:57.65 ID:tG3c9Vi+.net]
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません

文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"

s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています

845 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 20:26:08.36 ID:vZ93TkLb.net]
単純に

s/\\//g

でええんとちゃうん

846 名前:0824 mailto:sage [2023/08/20(日) 20:59:59.16 ID:tG3c9Vi+.net]
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ

hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"

目的文字列

aaa bbb ccc ddd
eee "fff" "ggg" hhh

847 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 21:32:41.19 ID:vZ93TkLb.net]
一発変換したいんじゃないの?

s/hogehoge\s+(.+)/eval $1/e

848 名前:0824 mailto:sage [2023/08/20(日) 21:58:11.37 ID:tG3c9Vi+.net]
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;

これで弾いてるの"以後にコメントがあるかもしれないからです



849 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 20:43:15.01 ID:Lyi1TDoI.net]
eval思い付く人すごい、甲子園優勝

850 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:39:46.20 ID:Frb3PbHb.net]
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。

$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd

851 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:52:08.69 ID:Frb3PbHb.net]
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd

852 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 01:30:15.60 ID:RW2iO7Jr.net]
>>perl 正規表現で一発変換できませんか

まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥

853 名前:デフォルトの名無しさん [2023/08/22(火) 02:16:49.08 ID:NJ9SPgik.net]
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #

854 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 12:38:02.82 ID:NJ9SPgik.net]
>>831
(perlの)コメントがあっても動作するよ

855 名前:0824 mailto:sage [2023/08/23(水) 09:58:00.37 ID:yShv/GWA.net]
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね

856 名前:デフォルトの名無しさん mailto:sage [2023/09/02(土) 20:40:48.54 ID:PozNjemk.net]
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
 \r\nは改行コードです
よろしく

857 名前:ィ願いします

●対象データ
x\r\n192.168.10.1\r\n0\r\n\r\n

●希望する結果
192.168.10.1
[]
[ここ壊れてます]

858 名前:デフォルトの名無しさん [2023/09/02(土) 22:43:12.64 ID:JbZUXP6Y.net]
(%d+%.%d+%.%d+%.%d+)



859 名前:839 mailto:sage [2023/09/03(日) 01:48:07.24 ID:BSGxD5eG.net]
ありがとうございました

860 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 01:50:43.78 ID:BSGxD5eG.net]
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします

●対象データ
abe-gkm: 12

●希望する結果
12

861 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 06:04:52.16 ID:ldBVlws1.net]
自分で覚える気は一切ないんですね

862 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 14:44:19.10 ID:QHfhMJE9.net]
LUA5.1リファレンスマニュアル 文字列操作
milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4

863 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 17:01:33.87 ID:7kfz6vsc.net]
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 12

●希望する結果
12

864 名前:デフォルトの名無しさん [2023/09/03(日) 17:20:26.33 ID:ruPOb/mk.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: ::12

&#9679;希望する結果
12

865 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/03(日) 17:22:38.45 ID:7kfz6vsc.net]
>>846は別の人なのでトリップを付けておきます
よろしくお願いします

866 名前:デフォルトの名無しさん [2023/09/03(日) 17:42:25.87 ID:ruPOb/mk.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: 121212

&#9679;希望する結果
12

867 名前:デフォルトの名無しさん [2023/09/04(月) 00:12:22.18 ID:SsZQexqW.net]
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい

>>845
[^: ]*$

868 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:01:20.01 ID:c5K3sEzk.net]
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない



869 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:08:00.64 ID:nyO3ndTW.net]
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな

870 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 15:41:22.66 ID:zA8RUwS0.net]
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い

871 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 18:55:45.65 ID:BoKCZaYW.net]
今回のはややこしくはない
むしろ簡単

872 名前:デフォルトの名無しさん [2023/09/04(月) 19:08:28.07 ID:8gjbapjk.net]
>>849
アホらしすぎて・・・

873 名前:デフォルトの名無しさん [2023/09/04(月) 20:45:35.27 ID:DgpCgO2R.net]
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから

874 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 20:55:42.10 ID:Tkae+foX.net]
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな

875 名前:デフォルトの名無しさん [2023/09/04(月) 20:58:59.14 ID:DgpCgO2R.net]
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事

876 名前:デフォルトの名無しさん [2023/09/04(月) 21:05:24.79 ID:NKgrLrxG.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: 33

&#9679;希望する結果
12

877 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/04(月) 21:07:00.10 ID:3GWjSEvz.net]
>>849
ありがとうございました

878 名前:デフォルトの名無しさん [2023/09/04(月) 21:16:52.45 ID:NTqFdCv7.net]
自演荒らしが捗るなw



879 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 22:23:04.68 ID:0+pR+e5l.net]
コロンが無い場合はマッチでよかったのかな?

>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない

880 名前:デフォルトの名無しさん [2023/09/06(水) 02:59:30.44 ID:lSkku4oe.net]
インフラ屋は性格良い
プログラマは性格悪い

881 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 07:21:34.46 ID:yobQfJn+.net]
俺はインフラ屋
性格良いよ

882 名前:デフォルトの名無しさん [2023/09/06(水) 09:14:00.91 ID:UTcPybKQ.net]
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い

883 名前:デフォルトの名無しさん [2023/09/06(水) 09:1 ]
[ここ壊れてます]

884 名前:8:47.39 ID:BQBp+rCO.net mailto: 無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い []
[ここ壊れてます]

885 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:44:01.14 ID:HD7oM5sP.net]
態度と性格を区別できない人々

886 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:45:30.51 ID:Ygn1Ao5e.net]
>>866
能書きだけはいっちょまえ

887 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:57:30.15 ID:tVigPql1.net]
それがプログラマの性分

888 名前:デフォルトの名無しさん mailto:sage [2023/09/08(金) 08:44:01.58 ID:07e9DMWQ.net]
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね



889 名前:デフォルトの名無しさん mailto:sage [2023/09/11(月) 00:45:50.96 ID:cvO0nzmM.net]
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か?
検索

●説明
REM半角スペースを検索してREM部分のみに一致させたい

●対象データ
REM TEST

●希望する結果
REM

890 名前:870 mailto:sage [2023/09/11(月) 00:53:10.22 ID:cvO0nzmM.net]
/REM(?= )/kで出来ました

891 名前:デフォルトの名無しさん [2023/09/13(水) 16:39:29.09 ID:qhl2oEPa.net]
●Regular Expressionの使用環境
javascript

●検索か置換か?
検索

●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです

●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい

●希望する結果
だけど横浜は家賃が

892 名前:デフォルトの名無しさん [2023/09/13(水) 16:41:17.76 ID:qhl2oEPa.net]
ごめんなさい872の追記です
括弧は半角全角どちらでも対応できるようにしていただけると助かります

893 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 18:37:54.95 ID:3qYEVVGq.net]
>>872
[((]\K[^))]*横浜[^))]*+(?=[))])

894 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 20:55:54.73 ID:T8/GYmvT.net]
対象データがそれだけきれいに整っているならこれでいいんじゃないかな
[^()()]*横浜[^()()]*(?=[))])

895 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 21:32:58.14 ID:qhl2oEPa.net]
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。

896 名前:デフォルトの名無しさん mailto:sage [2023/09/14(木) 00:22:01.99 ID:L47o5ku7.net]
鬼車は結局Unicode15対応版がリリースされなかったな

897 名前:デフォルトの名無しさん mailto:sage [2023/09/16(土) 22:56:08.84 ID:dIGSEJlt.net]
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください

898 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 07:04:17.16 ID:jNYPDoV+.net]
除外??



899 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 10:23:51.82 ID:ht+84nM7.net]
こういうこと?
abcxyzacz → bxy

900 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:29:52.53 ID:yn1jo0MJ.net]
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く

\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま

901 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:33:30.19 ID:yn1jo0MJ.net]
置換後の文字列: $1$2

902 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 15:23:07.94 ID:yn1jo0MJ.net]
スマン、\Gの前に(?!\A)を置いてくれ

903 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 16:53:03.56 ID:oNTID2ix.net]
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));

#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))

904 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:05:16.38 ID:Fm9hMrUa.net]
\nを30回以上は非表示するにはどうしたらいいですか

905 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:18:53.47 ID:jNYPDoV+.net]
非表示??

906 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:41:10.52 ID:PjfamyxI.net]
\nがn回以上除外で

907 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 22:51:45.08 ID:jyrM2LRG.net]
●Regular Expressionの使用環境
Perl

●検索か置換か?
検索

●説明
後ろから2つ目の/以降を取得したい

●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi

●希望する結果
/cgi/sample.cgi

お願いします

908 名前:デフォルトの名無しさん mailto:sage [2023/09/18(月) 01:07:38.93 ID:e1xt8o+y.net]
.*\K/.*/.*



909 名前:デフォルトの名無しさん mailto:sage [2023/09/23(土) 15:35:56.62 ID:UU1JiicL.net]
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも

910 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 14:32:09.00 ID:w/fMdm7Q.net]
正規表現じゃなく言語表現をなんとかした方がいい

911 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:45:13.07 ID:b6Bm13IE.net]
正規表現じゃなく性器表現とした方がいい

912 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:46:57.59 ID:b6Bm13IE.net]
正規表現じゃなく性器表現とかなんとかにした方がいい

913 名前:デフォルトの名無しさん mailto:sage [2023/09/26(火) 17:43:27.65 ID:WhLFttTP.net]
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか

914 名前:デフォルトの名無しさん mailto:sage [2023/10/03(火) 15:05:59.66 ID:pjWozC8L.net]
>>894
You ここで見せちゃいなよ、meが見てあげるよ

915 名前:デフォルトの名無しさん [2023/10/15(日) 05:59:22.52 ID:qeiyy+lM.net]
oniguruma Release 6.9.9

Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior


> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求

マッチした開始の位置はstartでなくても良いらしい

oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)


> [[:punct:]]

Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)

916 名前:デフォルトの名無しさん mailto:sage [2023/10/15(日) 06:13:36.53 ID:qeiyy+lM.net]
> Fixed: ONIG_OPTION_FIND_LONGEST behavior

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)

最左最長一致からガチ最長一致になってる

917 名前:デフォルトの名無しさん [2023/10/15(日) 06:27:13.95 ID:qeiyy+lM.net]
間違えた、こっちだった

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)


// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)

UTF-32 にエンコードしてから使えばいいのかしら

918 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 08:36:56.63 ID:S3IcPVBq.net]
Strawberry Perl
https://strawberryperl.com/releases.html

32bit版が出なくなった。64bitに乗り換えよう。(全銀)



919 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 16:11:58.36 ID:8kCGh912.net]
>>899
ZIP edition が無い…

920 名前:デフォルトの名無しさん mailto:sage [2023/10/21(土) 14:33:23.21 ID:43n7K7Fq.net]
tar.gzで我慢しなさい

921 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 10:19:38.81 ID:zDgIETfO.net]
アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか

922 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:34:50.74 ID:vOjtdftv.net]
初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?

923 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:42:28.97 ID:BaFdPLsN.net]
アンダースコート

924 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:45:28.88 ID:zDgIETfO.net]
アンダースロー

925 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 13:20:31.22 ID:y5KdwCim.net]
アンダーニンジャ

926 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 15:41:31.84 ID:zDgIETfO.net]
ニンジャリバンバン

927 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:20:26.89 ID:dO2GnsiA.net]
正解はスラッシュでした

928 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:49:37.09 ID:zDgIETfO.net]
(/w\)



929 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:06:53.46 ID:wzEyUd/K.net]
ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼

930 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:59:27.53 ID:dhg2pdyL.net]
どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど

931 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 18:36:44.19 ID:X00tNW2d.net]
今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな

アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな

932 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 21:57:53.63 ID:27STA2Pg.net]
正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる

933 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 09:19:33.19 ID:DBguvWIQ.net]
. が改行にマッチしないのを失念してってのは何度もやってる

934 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:27.61 ID:ikHnu6pN.net]
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ

935 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:37.53 ID:ikHnu6pN.net]
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ

936 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 12:08:10.81 ID:oh2mJ3WA.net]
^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$

937 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 14:40:34.08 ID:DBguvWIQ.net]
同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです

938 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 16:00:59.53 ID:G1jsC9Xy.net]
じつはその人AIだよ



939 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:01:21.99 ID:ikHnu6pN.net]
>>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$

940 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:03:51.95 ID:DBguvWIQ.net]
AIと言われても違和感が無いから困る、人間だったほうがいい

サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした

このことは恐らくbregoing.dllの作者氏でも知らないのでは

941 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 18:26:59.70 ID:upaRAmPk.net]
>>920
キムクヤにマッチするから駄目だね
>>916のように自分で組み合わせを展開する以外の方法はわからないね

942 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 21:03:12.97 ID:bvA/YDb8.net]
最後で語数チェックすれば?
(?<=\S{3})$

943 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 22:35:57.76 ID:8ROMQdip.net]
^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)

^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$

944 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 08:03:41.39 ID:ztJD977Y.net]
文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました

945 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 09:18:56.98 ID:/CeYlFrx.net]
> $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ

946 名前:デフォルトの名無しさん [2023/11/02(木) 09:22:55.91 ID:kxWwWLf8.net]
>>910
アルファベットが32文字だったら誰も困らなかったはず

947 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 11:56:22.72 ID:YMFW9tw8.net]
各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?

948 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 13:01:27.99 ID:eLjTHeK1.net]
^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$



949 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 19:36:53.03 ID:/CeYlFrx.net]
ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」

950 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 08:34:37.96 ID:cY7DSC5H.net]
^[キムラ]{1,2}[タクヤ]{1,2}$

951 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 09:08:43.70 ID:PqFUo1lf.net]
それはラキクタにマッチするからボツ(==.)

952 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 10:43:13.94 ID:cY7DSC5H.net]
ラキクタにマッチしたらダメって条件にはないんだけど‥

953 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:44:22.65 ID:PqFUo1lf.net]
確かに言葉ではそんな条件は書いてないね、曖昧3cm

954 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:50:18.95 ID:zxzLPr4V.net]
^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?

955 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:14:21.11 ID:sAJhyk0D.net]
^(?=A)(?=B).*$

956 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:18:03.55 ID:PqFUo1lf.net]
>>916を読めば文字順通りと受け取るのが妥当だね

ちなみにもしこのコマンドがあったら簡単に書けた
https://www.proxomitron.info/45/help/Matching-Commands.html#TST

^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$

perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう

// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)

957 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 13:00:30.59 ID:RnAsJxc7.net]
>>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$

(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク

958 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 18:04:12.94 ID:328LomOy.net]
キムラタクヤ人気で🌿



959 名前:デフォルトの名無しさん [2023/11/03(金) 19:14:55.49 ID:3J2AA+3k.net]
>>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw

960 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:09:52.31 ID:PqFUo1lf.net]
知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ

961 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:13:40.11 ID:/gQFYHMn.net]
「課す」を「はたす」って読んでるってマ?🤣

962 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:12:42.60 ID:PqFUo1lf.net]
この外部コマンドを考えた方は2004年に亡くなっている
https://en.wikipedia.org/wiki/Scott_R._Lemmon

20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ

963 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:17:14.08 ID:N1OKG/2k.net]
最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる

964 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 08:36:40.13 ID:w1sIftMp.net]
(正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない

965 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 11:16:01.85 ID:PZuBSK2Q.net]
カラクリを簡単に説明しよう

1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている

例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう

\1が捕獲した中身は0文字に

966 名前:なる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている

ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
 (?:キ$COUNT(x))?
 (?:ム$COUNT(x))?
 (?:ラ$COUNT(x))?
)
$COUNT(0<x)

perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
[]
[ここ壊れてます]

967 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 14:47:51.87 ID:Xn6+uSVd.net]
perlジジイこのスレでも自演してんのかw

968 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 17:37:08.01 ID:PZuBSK2Q.net]
COBOLジジイからperlジジイにランクアップ



969 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:03:00.89 ID:q8heJbgz.net]
サクラエディタ

// 1
\1(a)

// 2
\k<name>(?<name>a)

2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い

970 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:07:33.08 ID:q8heJbgz.net]
ん?本当にそうか?分からん

971 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 15:52:16.56 ID:q8heJbgz.net]
2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい

972 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 06:59:13.82 ID:j6L5l5bH.net]
異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから

本来動くべきサンプルを貼って>>949の件は終了とする

x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK

x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK

973 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 19:00:47.89 ID:j6L5l5bH.net]
回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK

974 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 17:50:43.57 ID:Karf8A+O.net]
文字列の頭に部分一致するパターンなんですが・・・

「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。

975 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:12:27.94 ID:ctqB5947.net]
/^abcdefg/

976 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:41:54.66 ID:/mJ+eeiZ.net]
無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな

977 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:47:23.08 ID:7i/8qZTv.net]
/^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか

978 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:53:22.83 ID:4tHpE5Jq.net]
>>957
否定先読みが使えるなら^m(?!ap)かな?



979 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 15:59:06.48 ID:7i/8qZTv.net]
ありがとう

980 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 04:25:56.84 ID:gwXFy+9L.net]
特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?

981 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 06:13:31.18 ID:28WV0iMa.net]
\Eが来ると困る

982 名前:デフォルトの名無しさん [2023/11/28(火) 12:33:08.74 ID:vIU65Zk5.net]
正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?

$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]


なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?

983 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:42:04.64 ID:EkqG9ePT.net]
perlよく知らんがgとったら消える

984 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:54:45.94 ID:uy7CvN4q.net]
推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []

985 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 14:25:52.10 ID:uy7CvN4q.net]
2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?

986 名前:デフォルトの名無しさん [2023/11/28(火) 16:18:10.81 ID:vIU65Zk5.net]
>>963
gとったら消える。Rubyも同じらしい。

>>964
[]が出るってことはなにかにマッチしてるってことでしょ?

>>965
それなら最初の.*にもマッチするじゃん?
一回目にマッチしなくて、二回目にマッチする理由がわからんのよ

987 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:18:30.67 ID:JJPCdnVt.net]
仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ

988 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:20:34.59 ID:JJPCdnVt.net]
でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ



989 名前:デフォルトの名無しさん [2023/11/28(火) 16:21:19.02 ID:vIU65Zk5.net]
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]

$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]

後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?

990 名前:デフォルトの名無しさん [2023/11/28(火) 16:22:48.63 ID:vIU65Zk5.net]
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。

ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]

ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]

991 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:44:51.01 ID:wVUnEJO+.net]
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ

992 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:47:59.11 ID:uy7CvN4q.net]
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ

993 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:49:01.41 ID:CppHkuHl.net]
0文字と一致させたくなければ.*ではなく.+と書けよ

994 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:59:51.73 ID:fB6/42vV.net]
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ

個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる

995 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 17:02:27.57 ID:fB6/42vV.net]
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど

996 名前:デフォルトの名無しさん [2023/11/28(火) 17:09:04.46 ID:vIU65Zk5.net]
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん

997 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:08:10.66 ID:waKUlTL5.net]
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね

998 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:30:16.15 ID:mMoqXMUf.net]
(ハクション!



999 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 19:16:57.98 ID:6l9rHssS.net]
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん

1000 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 13:08:47.77 ID:yvH2v9xT.net]
正規表現検索は失敗しないかぎり終わらないって話では

abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了

1001 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 14:41:21.44 ID:lw8jVmFR.net]
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで

1002 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 17:53:32.44 ID:AoutXZD6.net]
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき

1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから

1003 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:01:27.70 ID:lw8jVmFR.net]
確かにその通りやな、1度目で消費しきっとるはずや

1004 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:06:42.76 ID:lw8jVmFR.net]
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ

1005 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 20:04:08.42 ID:x7bR/xfi.net]
/(.*)$(.*)$((.*)$){999}/

1006 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 22:25:25.39 ID:yvH2v9xT.net]
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?

2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど

1007 名前:デフォルトの名無しさん [2023/12/01(金) 02:37:28.94 ID:07OBAnmr.net]
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?

$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]

$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]

1008 名前:デフォルトの名無しさん mailto:sage [2023/12/01(金) 08:09:57.11 ID:RWimeGTM.net]
/^\w+|$/[$&]/

これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?



1009 名前:デフォルトの名無しさん mailto:sage [2023/12/02(土) 00:36:44.31 ID:/f7jnFb0.net]
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace

・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
 ただし空文字にマッチした場合、先へ進まなくなることを回避するために
 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
 これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる

1010 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:24:41.69 ID:Ug9Hn2aN.net]
KEEPのKはあるのにPが無い、何故?

1011 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:31:35.71 ID:Ug9Hn2aN.net]
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い

1012 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 09:57:52.47 ID:8JqB6SG/.net]
>>988
思うよ
+の後に$を置けば余計にそう思う

1013 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 13:04:54.79 ID:t3u5G9tC.net]
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない

1014 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 14:15:57.63 ID:ayXeZXuA.net]
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?

1015 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:43:26.80 ID:e6Tz3fj/.net]
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる

$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]

1016 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:44:52.66 ID:e6Tz3fj/.net]
s/バク/バグ/

1017 名前:デフォルトの名無しさん mailto:sage [2023/12/13(水) 11:48:29.08 ID:wzNHEkEB.net]
ただの仕様だよ、あほらし

次スレよろ

1018 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:00:59.04 ID:KMxF6SWS.net]
次スレ
https://mevius.5ch.net/test/read.cgi/tech/1702684760/



1019 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:36:31.90 ID:pgUnJUCg.net]
天地無用

1020 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 10:49:04.16 ID:faoSWywL.net]
>>998
ほめてつかわす

1021 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒

1022 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<262KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef