[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 02/20 03:08 / Filesize : 262 KB / Number-of Response : 1023
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Regular Expression(正規表現) Part16



1 名前:デフォルトの名無しさん [2021/11/03(水) 19:50:01.71 ID:ebAE+z9+.net]
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降

744 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 09:42:44.65 ID:TTIYA8nl.net]
そこみる限りでは3パターンしかなくない?
何かしらの絵文字とかが化けて出てるだけとか。
(\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)

745 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:08:56.55 ID:L6AKAbfA.net]
726です
726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました
727さんのに変えたら誤動作無く動作しました
^[!-/:-@\[-`{-~]{5,11}

ちなみに、android板に以下のスレを発見しました
しかし、荒らされてて機能して無さそう
他にこっちの方が良いよ、っておすすめのスレはありますかね?

オススメのNGワード
https://egg.5ch.net/test/read.cgi/android/1576334383/

746 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 10:55:55.92 ID:nJDgsm3N.net]
こちらはそちらが何を使ってるかも分からないので勧めようが無い件
問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う
今のままでは12文字以上記号が続いててもNGになっちゃうね

747 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 13:11:08.52 ID:L6AKAbfA.net]
>>730
chmateなんです

その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました
^[!-/:-@\[-`{-~]{2,11}$

ここがひどいです
https://greta.5ch.net/test/read.cgi/poverty/1687400738/

748 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:46:12.28 ID:vRMLRvgd.net]
方言がひどい記述だけど(PCRE2とbregonig.dllでは大丈夫)

^ ?(((?!>?|<?)[[:punct:]])+|>?|<?){2,} ?$

749 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 14:53:40.61 ID:vRMLRvgd.net]
>>732
はdatに対してのものだから、mateはどうなのかは知らん
POSIX文字クラスが通っても、&gtとか行頭行末の半角スペースとか無さそうだね

750 名前:デフォルトの名無しさん mailto:sage [2023/06/22(木) 23:53:09.33 ID:nJDgsm3N.net]
GJ
[[:punct:]] これいいね、覚えとこ
(()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから
++や(?>)を使ったほうがいいかも
正規表現エンジンの内部でも対策はしてると思うけど念のために

751 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 01:33:06.45 ID:gmkpJif8.net]
>>734
+が入ってるのはダメじゃん
除いてくれ
作ってる途中で紛れ込んだものだね

なおbregonig.dllだと
^ ?(?:\p{punct}|>?|<?){4,} ?$
^ ?(?:[[:punct:]]|>?|<?){4,} ?$
でもいけちゃうんだよな
ちょっと不思議

752 名前:デフォルトの名無しさん [2023/06/23(金) 02:02:21.28 ID:qwakAXsj.net]
and検索みたいなのってできない?
今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい



753 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 02:09:08.88 ID:gmkpJif8.net]
>>736
^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)

754 名前:デフォルトの名無しさん [2023/06/23(金) 02:35:28.92 ID:qwakAXsj.net]
>>737
感謝

755 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 12:02:08.17 ID:2Ntzjt3B.net]
[文章]
AAAaiueo111 xxx
aaaaa
AAAkakikukeko xxx
b b b
AAAsasisuseso
ccccc
AAAtatituteto000
ddd123


上記の文章で先頭がAAAの行だけ抜き出して、さらに

756 名前:AAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。

使用するのはサクラエディタの置換機能で、

置換前 AAA(.*)\r |.*\r\n
置換後 $1

で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。
[]
[ここ壊れてます]

757 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:06:42.48 ID:gnUd2/2c.net]
AAAで始まらない1行|先頭のAAA|末尾のxxx

758 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 13:54:57.82 ID:WBrlaKRC.net]
^AAA|xxx$|^.*\r\n → 削除

759 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 15:20:23.65 ID:2Ntzjt3B.net]
>>740
>>741
ありがとうございます。

760 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 19:05:48.89 ID:zWmLGOhD.net]
^AAA([^\r\n]*?)(?:xxx)?$|^[^\r\n]*(?:\r\n|[\r\n])?
$1

アク菌で書けませんぞテスト

761 名前:734 mailto:sage [2023/06/23(金) 19:21:25.94 ID:zWmLGOhD.net]
>>735
PCRE2では\p{Punct}は存在しないんだね
www.pcre.org/current/doc/html/pcre2syntax.html

[\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど
プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ

> +
言われてみれば+があるのはおかしいw 忘れ物だったのかw

762 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 21:34:05.58 ID:gmkpJif8.net]
>>744
不思議な点は
PCRE2だと、[[:punct:]]で&が先にキャッチされて>のgt;が取り残されてしまうので
|>とあってもマッチしなくなる
bregonig.dllだと
>にキャッチされてマッチする(punctより>が優先される
(PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?)
これはorの記述の順序には関係なく左に(先に)>を書いても結果は同じ



763 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:07:00.56 ID:zWmLGOhD.net]
ここのテストサイトで regex101.com/
^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど
本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない?
それで>>732に要らないはずの先読みを入れてたんだね
これがマッチしないならバグかも知れない
もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから

764 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:09:21.21 ID:zWmLGOhD.net]
あ、&が化けちゃった
^([[:punct:]]|&gt;|&lt;)$ を &gt; にマッチさせて

765 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:31:35.63 ID:gmkpJif8.net]
>>746
今確認したらそのとおりだった
俺は以前一体何をやったんだろう?

766 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:36:28.09 ID:gmkpJif8.net]
今考え付くのは
^(?>[[:punct:]]|&gt;)+
とか
&gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?

767 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 22:47:37.55 ID:gmkpJif8.net]
さすがに(?>)を使って気づかないわけないから(使った覚えもないし)
恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする

768 名前:デフォルトの名無しさん mailto:sage [2023/06/23(金) 23:16:11.04 ID:zWmLGOhD.net]
そういうこと俺もあるから分かるわーw
頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに
なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事

間違えた原因は分からないけどとりあえずゆっくり休んでくれw

769 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:27:07.24 ID:X4q59utv.net]
勘違いした理由が分かった
^([[:punct:]]|&gt;)+
これをやると&で切れちゃうんだ
s/([[:punct:]]|&gt;)+//g
をやるとgtが置換されずに残る

末尾に$とか目標物を付ければ切れないんだが
さてどうして切れるのか誰か教えて

770 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 00:36:09.10 ID:X4q59utv.net]
やっぱ左側が優先なのか
(&gt;|[[:punct:]])
と入れ替えたら切れない

771 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 09:56:18.97 ID:o3ZfF1Sp.net]
>>742 >>741
それだと行頭からxxxだけしかない行の改行が削除できずに残りそうだけどどうだろう
^AAA|^.*\r\n|xxx$ → 削除

772 名前:751 mailto:sage [2023/06/24(土) 11:05:23.89 ID:QPqcCtG1.net]
>やっぱ左側が優先なのか
正解

ただ、同じ正規表現で&;gt;にマッチする環境もあるよ
考えられる中で最長になるマッチを探すエンジン

バックトラックの動きがまだよく分かってないなら>>708のNTTと早大の正規表現や
>>743で使ってる .* と .*? の動きも見直しておいたほうがいいかも
見た目は簡単そうに見えるけど正しくバックトラックの動きを理解してないと作れない
舐めてかかると酷い目に遭う怖いヤツだよ(過去に経験あり)



773 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:10:05.28 ID:QPqcCtG1.net]
あ、NTTと早大のやつは正規表現を^と$で囲ってから動かして

774 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 11:21:09.38 ID:X4q59utv.net]
>>755
いままで
+や++での強欲のバックトラックが最長を探すのに違いがあるとは思っていなかったよ
最大の最長を探す記述ってのも欲しいな

775 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 16:54:14.04 ID:QPqcCtG1.net]
>最大の最長を探す記述

ちょっと探してみたらPHPのオプションにあった
www.php.net/manual/ja/function.mb-regex-set-options.php
> l 最も長くマッチするものを探す

この処理ってすごく重くなりそうなイメージがあったけどそうでもないのかな

776 名前:デフォルトの名無しさん mailto:sage [2023/06/24(土) 17:35:54.33 ID:X4q59utv.net]
PHPだけじゃなあ
結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか

777 名前:743 mailto:sage [2023/06/25(日) 11:57:31.39 ID:YeZqv3UB.net]
>> 759
考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか
正規表現むずかしい

>> 740 741 754
改行コードがLFやCRのみの場合に対応してない
最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない
743は両方に対応しているけど740の発想のほうがシンプルで優れてるね
あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう

778 名前:デフォルトの名無しさん mailto:sage [2023/06/27(火) 21:16:47.75 ID:TnfGmDZI.net]
最長一致マッチが有効のとき、下の正規表現は何にマッチすべき?

"abcd" =~ /abc\Kd|abc/;

\Kの前を文字列長に含めるべきか否かを考えて下さい

779 名前:デフォルトの名無しさん mailto:sage [2023/06/28(水) 12:49:16.44 ID:vk3PbjZ1.net]
元より最左ルールに基づいてdよりabcにマッチすべきとはならんやろ

780 名前:761 mailto:sage [2023/06/28(水) 13:05:55.77 ID:m0cBggZC.net]
>>762
ありがとうございます、それは正しい意見だと思います
\Kの前を文字列長に含めるべきかどうかについてはどうお考えですか?
今後の参考にしたいと考えております

781 名前:デフォルトの名無しさん mailto:sage [2023/06/29(木) 11:57:49.56 ID:0JMnG4u5.net]
最長一致する正規表現が有効の場合

1、「abc」「あ」

2、「て゛」「で」

A. 前が長い
B. 同じ長さ
C. 後ろが長い

782 名前:デフォルトの名無しさん mailto:sage [2023/07/02(日) 20:25:06.40 ID:/BVUs+ug.net]
奥が深すぎる



783 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 13:17:43.04 ID:GbtWdAMV.net]
twitter.com/k_takata/status/1676247372731662336
>正規表現技術入門が第2刷増刷

おめでとうございます
bregonig.dllやonigmoにはいつもお世話になってます
vimは知りませんw

784 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 17:43:12.24 ID:SQbV6Whm.net]
JaneStyleであぼーんにつかいたいのですが、

アウアウウー Sa47-runv [106.131.26.222]

47
runv
131.26.222

この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?

785 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 20:37:36.61 ID:GbtWdAMV.net]
Jane Styleの仕様が分からないけどこれでいける?

(?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

786 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:30:05.44 ID:7Yxy824T.net]
>>768
ありがとうございます!
ためしてみたけれど駄目でした。
細かく分析して応用してみます!!

787 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:54:51.51 ID:7Yxy824T.net]
>>768
失礼しました。勘違いをしていて、正しく設定したらこれでいけました!!
大感謝です!&正規表現の勉強になりました!!
リファレンスみてなるほどとうなっています

788 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 21:55:53.42 ID:gWNyo9yQ.net]
いやそれでいけるでしょ
(?i)はデフォなので要らないけど
ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで
設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか

789 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:26.50 ID:GbtWdAMV.net]
動いて良かった、正規表現の勉強頑張れーw
771さんもありがとう

790 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:11:33.07 ID:4RAXuAwI.net]
ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから
その正規表現すり抜けするかも

791 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:16:17.63 ID:gWNyo9yQ.net]
(?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ

792 名前:デフォルトの名無しさん mailto:sage [2023/07/06(木) 22:21:43.88 ID:7Yxy824T.net]
>>773
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

一応、ご指摘通り改良しておきました!



793 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 00:41:55.61 ID:adSx9MnJ.net]
反対に(?i)ではSaの他にsAにもマッチしてしまうのでは?
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい

794 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 13:06:44.76 ID:xew4KSRK.net]
言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う

795 名前:デフォルトの名無しさん mailto:sage [2023/07/07(金) 23:28:01.04 ID:chPidFQv.net]
鬼車で(?L)と\g<0>が共存出来ないようだけど

"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"

という修正案で何か問題が起こるか分かる人いません?

例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない

鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288

LだけじゃなくCとIも共存不可でした

796 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 12:38:44.00 ID:dnLGUnq0.net]
>>778
"\g<0>" に取り込むときにはそのまま全て取り入れ、取り出すときに
"L" や "C" や "I" を取り除く方法もあるのでは?

797 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 15:02:36.24 ID:NT/2XwNR.net]
最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った
DFA的な最長だと思ってたのに

798 名前:デフォルトの名無しさん mailto:sage [2023/07/09(日) 17:56:55.84 ID:dnLGUnq0.net]
最左じゃなくても良いみたい
UTF-8のとき

abc < abc\Kd
ab < あ
で < て゛

"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし

799 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 13:05:06.30 ID:8apozFwM.net]
> ab < あ

マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう

800 名前:デフォルトの名無しさん mailto:sage [2023/07/10(月) 20:06:05.30 ID:8apozFwM.net]
JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす

801 名前:デフォルトの名無しさん mailto:sage [2023/07/11(火) 10:50:26.27 ID:6DaZenCz.net]
(?L)をマルチ文字対応にするのは無理だけど

>"(?C)a(b|\g<0>)c" がエラーになる

これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!

802 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 19:11:50.96 ID:7AgmN8D3.net]
JAPANを日本、NIPPONをニッポンに、同時に置き換える

JAPAN|NIPPON

日本|ニッポン



803 名前:デフォルトの名無しさん mailto:sage [2023/07/13(木) 23:55:44.94 ID:OlRmyaph.net]
>>785
サクラエディタ+bregonig.dllでは無理っす

804 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 00:50:54.69 ID:JHf9vJmP.net]
https://www.regular-expressions.info/replaceconditional.html
https://npp-user-manual.org/docs/searching/#substitution-conditionals

805 名前:デフォルトの名無しさん mailto:sage [2023/07/14(金) 13:30:40.79 ID:lxqistQI.net]
わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。

806 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:19:44.01 ID:nnNpViq+.net]
JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?

807 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:22:35.95 ID:nnNpViq+.net]
0を含めないというのは「0より大きい正の半角数値のみ」という意味です

808 名前:デフォルトの名無しさん [2023/07/15(土) 18:39:49.26 ID:Fs/aULCy.net]
正規表現でやることじゃない

809 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:36.28 ID:vGns6WZO.net]
(?!(?!<[0-9])0(?![0^9]))[0-9]+

00とかあるんだったらダメだけど

810 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 18:47:49.29 ID:hche+KD8.net]
>>789
XY問題の臭いがする

その文字列を、正規表現「だけ」を使って評価したい理由でもあるの?

811 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 19:54:00.17 ID:nnNpViq+.net]
>>793
全角文字と半角英字を除外したいんですよ
入力欄にこれらを入力されるとフリーズします

812 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 20:24:42.65 ID:hche+KD8.net]
>>794
「正規表現だけで評価したい理由」になってない

許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)

const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);



813 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:27:34.96 ID:nnNpViq+.net]
すみません
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$

814 名前:デフォルトの名無しさん [2023/07/15(土) 21:44:37.74 ID:Ip1+AB5X.net]
そして半年後…
「誰だよこんなクソプログラム書いたやつ💢」

815 名前:デフォルトの名無しさん mailto:sage [2023/07/15(土) 21:52:20.50 ID:G+tF3yG6.net]
滅茶苦茶わかりみ
美しくないプログラムはパッと見てうんざりする

816 名前:デフォルトの名無しさん mailto:sage [2023/07/17(月) 02:00:45.07 ID:MFjOLYv6.net]
改行厨たいさく
[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+

817 名前:デフォルトの名無しさん mailto:sage [2023/07/20(木) 17:25:16.42 ID:OqTU1F4P.net]
>>785
そういうの出来るといいですけどねえ

818 名前:デフォルトの名無しさん mailto:sage [2023/07/21(金) 15:55:34.48 ID:GwV7ay2N.net]
>>784
C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった
C言語をちゃんと勉強しないと無理だな

819 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 00:50:40.93 ID:hdFkAV/t.net]
hage【ZEN123】hoge456789
上記の【】内の全角英数字だけを半角にする
正規表現では無理なパターンの例か

820 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 05:19:55.24 ID:BnGP1dsy.net]
正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので
そういう正規表現環境は既に存在してるかも?
今のテキストエディタでもマクロでなら出来るものがありそう

821 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 09:48:00.20 ID:PHWyKwrY.net]
秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね

822 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 13:07:11.02 ID:BnGP1dsy.net]
秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから
お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも?

本家の最新の鬼車の秀丸エディタからの利用方法
www2.maruo.co.jp/hidesoft/2/x39752_.html



823 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 15:10:19.87 ID:nlZnqujR.net]
>>805
それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw

824 名前:デフォルトの名無しさん mailto:sage [2023/07/23(日) 16:14:08.28 ID:BnGP1dsy.net]
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる

825 名前:デフォルトの名無しさん mailto:sage [2023/07/24(月) 12:53:06.11 ID:LBGWnldn.net]
> 全角->半角変換 や >>785 の置換に対応

正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感

826 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 00:28:01.42 ID:ijwgoKNu.net]
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな

827 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 01:58:51.32 ID:DaPN/KaH.net]
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう

828 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 02:10:59.59 ID:m8SWwEXi.net]
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた

829 名前:デフォルトの名無しさん mailto:sage [2023/07/25(火) 16:23:19.14 ID:hmH9EM9U.net]
Onigumoで検索して気持ち悪くなる定期

830 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 20:32:41.26 ID:xNvNUPTs.net]
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!

831 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:44:23.17 ID:slvWQQxm.net]
>>813
^(?=.*正規表現)(?=.*教えて)

832 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:46:27.76 ID:slvWQQxm.net]
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$



833 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:49:39.05 ID:slvWQQxm.net]
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$

834 名前:デフォルトの名無しさん mailto:sage [2023/07/29(土) 21:51:07.45 ID:Z2bzRt4C.net]
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ

835 名前:デフォルトの名無しさん mailto:sage [2023/07/30(日) 10:33:11.68 ID:3uyXLeeN.net]
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン

検索: ^
置換: #

選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------

検索: [  \t]+$
置換: (なし)

行末の余計なスペースを削除出来て便利

836 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:48:03.89 ID:g9Iw6FTW.net]
https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。

https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。

837 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 18:56:16.40 ID:IKZkjZuG.net]
http[^\s]+

838 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:02:22.92 ID:BmgakVsI.net]
>>819
.をエスケープ

839 名前:デフォルトの名無しさん mailto:sage [2023/08/12(土) 19:14:06.14 ID:g9Iw6FTW.net]
>>820
>>821
うぉぉ、ありがとうございました!

840 名前:デフォルトの名無しさん mailto:sage [2023/08/13(日) 14:38:57.47 ID:vv6Q6LsS.net]
突然大きな声で叫ぶな

841 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:26:03.91 ID:tG3c9Vi+.net]
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd

842 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 13:58:40.55 ID:vZ93TkLb.net]
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;

正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';



843 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 14:00:17.67 ID:vZ93TkLb.net]
>>825
$s =~ s/(.*)/eval $s/e;

  ↓

$s =~ s/(.*)/eval $1/e;

844 名前:0824 mailto:sage [2023/08/20(日) 20:08:57.65 ID:tG3c9Vi+.net]
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません

文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"

s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています

845 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 20:26:08.36 ID:vZ93TkLb.net]
単純に

s/\\//g

でええんとちゃうん

846 名前:0824 mailto:sage [2023/08/20(日) 20:59:59.16 ID:tG3c9Vi+.net]
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ

hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"

目的文字列

aaa bbb ccc ddd
eee "fff" "ggg" hhh

847 名前:デフォルトの名無しさん mailto:sage [2023/08/20(日) 21:32:41.19 ID:vZ93TkLb.net]
一発変換したいんじゃないの?

s/hogehoge\s+(.+)/eval $1/e

848 名前:0824 mailto:sage [2023/08/20(日) 21:58:11.37 ID:tG3c9Vi+.net]
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;

これで弾いてるの"以後にコメントがあるかもしれないからです

849 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 20:43:15.01 ID:Lyi1TDoI.net]
eval思い付く人すごい、甲子園優勝

850 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:39:46.20 ID:Frb3PbHb.net]
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。

$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd

851 名前:デフォルトの名無しさん mailto:sage [2023/08/21(月) 23:52:08.69 ID:Frb3PbHb.net]
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd

852 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 01:30:15.60 ID:RW2iO7Jr.net]
>>perl 正規表現で一発変換できませんか

まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥



853 名前:デフォルトの名無しさん [2023/08/22(火) 02:16:49.08 ID:NJ9SPgik.net]
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #

854 名前:デフォルトの名無しさん mailto:sage [2023/08/22(火) 12:38:02.82 ID:NJ9SPgik.net]
>>831
(perlの)コメントがあっても動作するよ

855 名前:0824 mailto:sage [2023/08/23(水) 09:58:00.37 ID:yShv/GWA.net]
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね

856 名前:デフォルトの名無しさん mailto:sage [2023/09/02(土) 20:40:48.54 ID:PozNjemk.net]
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
 \r\nは改行コードです
よろしく

857 名前:ィ願いします

●対象データ
x\r\n192.168.10.1\r\n0\r\n\r\n

●希望する結果
192.168.10.1
[]
[ここ壊れてます]

858 名前:デフォルトの名無しさん [2023/09/02(土) 22:43:12.64 ID:JbZUXP6Y.net]
(%d+%.%d+%.%d+%.%d+)

859 名前:839 mailto:sage [2023/09/03(日) 01:48:07.24 ID:BSGxD5eG.net]
ありがとうございました

860 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 01:50:43.78 ID:BSGxD5eG.net]
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします

●対象データ
abe-gkm: 12

●希望する結果
12

861 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 06:04:52.16 ID:ldBVlws1.net]
自分で覚える気は一切ないんですね

862 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 14:44:19.10 ID:QHfhMJE9.net]
LUA5.1リファレンスマニュアル 文字列操作
milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4



863 名前:デフォルトの名無しさん mailto:sage [2023/09/03(日) 17:01:33.87 ID:7kfz6vsc.net]
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 12

●希望する結果
12

864 名前:デフォルトの名無しさん [2023/09/03(日) 17:20:26.33 ID:ruPOb/mk.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: ::12

&#9679;希望する結果
12

865 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/03(日) 17:22:38.45 ID:7kfz6vsc.net]
>>846は別の人なのでトリップを付けておきます
よろしくお願いします

866 名前:デフォルトの名無しさん [2023/09/03(日) 17:42:25.87 ID:ruPOb/mk.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: 121212

&#9679;希望する結果
12

867 名前:デフォルトの名無しさん [2023/09/04(月) 00:12:22.18 ID:SsZQexqW.net]
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい

>>845
[^: ]*$

868 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:01:20.01 ID:c5K3sEzk.net]
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない

869 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 13:08:00.64 ID:nyO3ndTW.net]
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな

870 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 15:41:22.66 ID:zA8RUwS0.net]
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い

871 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 18:55:45.65 ID:BoKCZaYW.net]
今回のはややこしくはない
むしろ簡単

872 名前:デフォルトの名無しさん [2023/09/04(月) 19:08:28.07 ID:8gjbapjk.net]
>>849
アホらしすぎて・・・



873 名前:デフォルトの名無しさん [2023/09/04(月) 20:45:35.27 ID:DgpCgO2R.net]
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから

874 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 20:55:42.10 ID:Tkae+foX.net]
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな

875 名前:デフォルトの名無しさん [2023/09/04(月) 20:58:59.14 ID:DgpCgO2R.net]
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事

876 名前:デフォルトの名無しさん [2023/09/04(月) 21:05:24.79 ID:NKgrLrxG.net]
訂正がありました
よろしくお願いします

&#9679;Regular Expressionの使用環境
Lua

&#9679;検索か置換か?
検索

&#9679;説明
最後に現れるコロンの右側だけ抽出したいです

&#9679;対象データ
ab:e-gkm: 33

&#9679;希望する結果
12

877 名前:845 ◆06.HT2D93O4J mailto:sage [2023/09/04(月) 21:07:00.10 ID:3GWjSEvz.net]
>>849
ありがとうございました

878 名前:デフォルトの名無しさん [2023/09/04(月) 21:16:52.45 ID:NTqFdCv7.net]
自演荒らしが捗るなw

879 名前:デフォルトの名無しさん mailto:sage [2023/09/04(月) 22:23:04.68 ID:0+pR+e5l.net]
コロンが無い場合はマッチでよかったのかな?

>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない

880 名前:デフォルトの名無しさん [2023/09/06(水) 02:59:30.44 ID:lSkku4oe.net]
インフラ屋は性格良い
プログラマは性格悪い

881 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 07:21:34.46 ID:yobQfJn+.net]
俺はインフラ屋
性格良いよ

882 名前:デフォルトの名無しさん [2023/09/06(水) 09:14:00.91 ID:UTcPybKQ.net]
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い



883 名前:デフォルトの名無しさん [2023/09/06(水) 09:1 ]
[ここ壊れてます]

884 名前:8:47.39 ID:BQBp+rCO.net mailto: 無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い []
[ここ壊れてます]

885 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:44:01.14 ID:HD7oM5sP.net]
態度と性格を区別できない人々

886 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:45:30.51 ID:Ygn1Ao5e.net]
>>866
能書きだけはいっちょまえ

887 名前:デフォルトの名無しさん mailto:sage [2023/09/06(水) 09:57:30.15 ID:tVigPql1.net]
それがプログラマの性分

888 名前:デフォルトの名無しさん mailto:sage [2023/09/08(金) 08:44:01.58 ID:07e9DMWQ.net]
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね

889 名前:デフォルトの名無しさん mailto:sage [2023/09/11(月) 00:45:50.96 ID:cvO0nzmM.net]
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か?
検索

●説明
REM半角スペースを検索してREM部分のみに一致させたい

●対象データ
REM TEST

●希望する結果
REM

890 名前:870 mailto:sage [2023/09/11(月) 00:53:10.22 ID:cvO0nzmM.net]
/REM(?= )/kで出来ました

891 名前:デフォルトの名無しさん [2023/09/13(水) 16:39:29.09 ID:qhl2oEPa.net]
●Regular Expressionの使用環境
javascript

●検索か置換か?
検索

●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです

●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい

●希望する結果
だけど横浜は家賃が

892 名前:デフォルトの名無しさん [2023/09/13(水) 16:41:17.76 ID:qhl2oEPa.net]
ごめんなさい872の追記です
括弧は半角全角どちらでも対応できるようにしていただけると助かります



893 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 18:37:54.95 ID:3qYEVVGq.net]
>>872
[((]\K[^))]*横浜[^))]*+(?=[))])

894 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 20:55:54.73 ID:T8/GYmvT.net]
対象データがそれだけきれいに整っているならこれでいいんじゃないかな
[^()()]*横浜[^()()]*(?=[))])

895 名前:デフォルトの名無しさん mailto:sage [2023/09/13(水) 21:32:58.14 ID:qhl2oEPa.net]
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。

896 名前:デフォルトの名無しさん mailto:sage [2023/09/14(木) 00:22:01.99 ID:L47o5ku7.net]
鬼車は結局Unicode15対応版がリリースされなかったな

897 名前:デフォルトの名無しさん mailto:sage [2023/09/16(土) 22:56:08.84 ID:dIGSEJlt.net]
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください

898 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 07:04:17.16 ID:jNYPDoV+.net]
除外??

899 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 10:23:51.82 ID:ht+84nM7.net]
こういうこと?
abcxyzacz → bxy

900 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:29:52.53 ID:yn1jo0MJ.net]
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く

\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま

901 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 14:33:30.19 ID:yn1jo0MJ.net]
置換後の文字列: $1$2

902 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 15:23:07.94 ID:yn1jo0MJ.net]
スマン、\Gの前に(?!\A)を置いてくれ



903 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 16:53:03.56 ID:oNTID2ix.net]
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));

#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))

904 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:05:16.38 ID:Fm9hMrUa.net]
\nを30回以上は非表示するにはどうしたらいいですか

905 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:18:53.47 ID:jNYPDoV+.net]
非表示??

906 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 17:41:10.52 ID:PjfamyxI.net]
\nがn回以上除外で

907 名前:デフォルトの名無しさん mailto:sage [2023/09/17(日) 22:51:45.08 ID:jyrM2LRG.net]
●Regular Expressionの使用環境
Perl

●検索か置換か?
検索

●説明
後ろから2つ目の/以降を取得したい

●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi

●希望する結果
/cgi/sample.cgi

お願いします

908 名前:デフォルトの名無しさん mailto:sage [2023/09/18(月) 01:07:38.93 ID:e1xt8o+y.net]
.*\K/.*/.*

909 名前:デフォルトの名無しさん mailto:sage [2023/09/23(土) 15:35:56.62 ID:UU1JiicL.net]
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも

910 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 14:32:09.00 ID:w/fMdm7Q.net]
正規表現じゃなく言語表現をなんとかした方がいい

911 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:45:13.07 ID:b6Bm13IE.net]
正規表現じゃなく性器表現とした方がいい

912 名前:デフォルトの名無しさん mailto:sage [2023/09/25(月) 15:46:57.59 ID:b6Bm13IE.net]
正規表現じゃなく性器表現とかなんとかにした方がいい



913 名前:デフォルトの名無しさん mailto:sage [2023/09/26(火) 17:43:27.65 ID:WhLFttTP.net]
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか

914 名前:デフォルトの名無しさん mailto:sage [2023/10/03(火) 15:05:59.66 ID:pjWozC8L.net]
>>894
You ここで見せちゃいなよ、meが見てあげるよ

915 名前:デフォルトの名無しさん [2023/10/15(日) 05:59:22.52 ID:qeiyy+lM.net]
oniguruma Release 6.9.9

Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior


> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求

マッチした開始の位置はstartでなくても良いらしい

oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)


> [[:punct:]]

Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)

916 名前:デフォルトの名無しさん mailto:sage [2023/10/15(日) 06:13:36.53 ID:qeiyy+lM.net]
> Fixed: ONIG_OPTION_FIND_LONGEST behavior

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)

最左最長一致からガチ最長一致になってる

917 名前:デフォルトの名無しさん [2023/10/15(日) 06:27:13.95 ID:qeiyy+lM.net]
間違えた、こっちだった

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)


// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)

UTF-32 にエンコードしてから使えばいいのかしら

918 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 08:36:56.63 ID:S3IcPVBq.net]
Strawberry Perl
https://strawberryperl.com/releases.html

32bit版が出なくなった。64bitに乗り換えよう。(全銀)

919 名前:デフォルトの名無しさん mailto:sage [2023/10/20(金) 16:11:58.36 ID:8kCGh912.net]
>>899
ZIP edition が無い…

920 名前:デフォルトの名無しさん mailto:sage [2023/10/21(土) 14:33:23.21 ID:43n7K7Fq.net]
tar.gzで我慢しなさい

921 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 10:19:38.81 ID:zDgIETfO.net]
アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか

922 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:34:50.74 ID:vOjtdftv.net]
初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?



923 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:42:28.97 ID:BaFdPLsN.net]
アンダースコート

924 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 12:45:28.88 ID:zDgIETfO.net]
アンダースロー

925 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 13:20:31.22 ID:y5KdwCim.net]
アンダーニンジャ

926 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 15:41:31.84 ID:zDgIETfO.net]
ニンジャリバンバン

927 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:20:26.89 ID:dO2GnsiA.net]
正解はスラッシュでした

928 名前:デフォルトの名無しさん mailto:sage [2023/10/29(日) 19:49:37.09 ID:zDgIETfO.net]
(/w\)

929 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:06:53.46 ID:wzEyUd/K.net]
ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼

930 名前:デフォルトの名無しさん mailto:sage [2023/10/30(月) 20:59:27.53 ID:dhg2pdyL.net]
どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど

931 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 18:36:44.19 ID:X00tNW2d.net]
今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな

アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな

932 名前:デフォルトの名無しさん mailto:sage [2023/10/31(火) 21:57:53.63 ID:27STA2Pg.net]
正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる



933 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 09:19:33.19 ID:DBguvWIQ.net]
. が改行にマッチしないのを失念してってのは何度もやってる

934 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:27.61 ID:ikHnu6pN.net]
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ

935 名前:デフォルトの名無しさん [2023/11/01(水) 11:38:37.53 ID:ikHnu6pN.net]
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ

936 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 12:08:10.81 ID:oh2mJ3WA.net]
^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$

937 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 14:40:34.08 ID:DBguvWIQ.net]
同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです

938 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 16:00:59.53 ID:G1jsC9Xy.net]
じつはその人AIだよ

939 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:01:21.99 ID:ikHnu6pN.net]
>>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$

940 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 17:03:51.95 ID:DBguvWIQ.net]
AIと言われても違和感が無いから困る、人間だったほうがいい

サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした

このことは恐らくbregoing.dllの作者氏でも知らないのでは

941 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 18:26:59.70 ID:upaRAmPk.net]
>>920
キムクヤにマッチするから駄目だね
>>916のように自分で組み合わせを展開する以外の方法はわからないね

942 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 21:03:12.97 ID:bvA/YDb8.net]
最後で語数チェックすれば?
(?<=\S{3})$



943 名前:デフォルトの名無しさん mailto:sage [2023/11/01(水) 22:35:57.76 ID:8ROMQdip.net]
^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)

^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$

944 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 08:03:41.39 ID:ztJD977Y.net]
文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました

945 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 09:18:56.98 ID:/CeYlFrx.net]
> $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ

946 名前:デフォルトの名無しさん [2023/11/02(木) 09:22:55.91 ID:kxWwWLf8.net]
>>910
アルファベットが32文字だったら誰も困らなかったはず

947 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 11:56:22.72 ID:YMFW9tw8.net]
各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?

948 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 13:01:27.99 ID:eLjTHeK1.net]
^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$

949 名前:デフォルトの名無しさん mailto:sage [2023/11/02(木) 19:36:53.03 ID:/CeYlFrx.net]
ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」

950 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 08:34:37.96 ID:cY7DSC5H.net]
^[キムラ]{1,2}[タクヤ]{1,2}$

951 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 09:08:43.70 ID:PqFUo1lf.net]
それはラキクタにマッチするからボツ(==.)

952 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 10:43:13.94 ID:cY7DSC5H.net]
ラキクタにマッチしたらダメって条件にはないんだけど‥



953 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:44:22.65 ID:PqFUo1lf.net]
確かに言葉ではそんな条件は書いてないね、曖昧3cm

954 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 11:50:18.95 ID:zxzLPr4V.net]
^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?

955 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:14:21.11 ID:sAJhyk0D.net]
^(?=A)(?=B).*$

956 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 12:18:03.55 ID:PqFUo1lf.net]
>>916を読めば文字順通りと受け取るのが妥当だね

ちなみにもしこのコマンドがあったら簡単に書けた
https://www.proxomitron.info/45/help/Matching-Commands.html#TST

^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$

perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう

// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)

957 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 13:00:30.59 ID:RnAsJxc7.net]
>>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$

(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク

958 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 18:04:12.94 ID:328LomOy.net]
キムラタクヤ人気で🌿

959 名前:デフォルトの名無しさん [2023/11/03(金) 19:14:55.49 ID:3J2AA+3k.net]
>>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw

960 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:09:52.31 ID:PqFUo1lf.net]
知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ

961 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 20:13:40.11 ID:/gQFYHMn.net]
「課す」を「はたす」って読んでるってマ?🤣

962 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:12:42.60 ID:PqFUo1lf.net]
この外部コマンドを考えた方は2004年に亡くなっている
https://en.wikipedia.org/wiki/Scott_R._Lemmon

20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ



963 名前:デフォルトの名無しさん mailto:sage [2023/11/03(金) 21:17:14.08 ID:N1OKG/2k.net]
最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる

964 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 08:36:40.13 ID:w1sIftMp.net]
(正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない

965 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 11:16:01.85 ID:PZuBSK2Q.net]
カラクリを簡単に説明しよう

1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている

例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう

\1が捕獲した中身は0文字に

966 名前:なる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている

ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
 (?:キ$COUNT(x))?
 (?:ム$COUNT(x))?
 (?:ラ$COUNT(x))?
)
$COUNT(0<x)

perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
[]
[ここ壊れてます]

967 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 14:47:51.87 ID:Xn6+uSVd.net]
perlジジイこのスレでも自演してんのかw

968 名前:デフォルトの名無しさん mailto:sage [2023/11/04(土) 17:37:08.01 ID:PZuBSK2Q.net]
COBOLジジイからperlジジイにランクアップ

969 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:03:00.89 ID:q8heJbgz.net]
サクラエディタ

// 1
\1(a)

// 2
\k<name>(?<name>a)

2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い

970 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 13:07:33.08 ID:q8heJbgz.net]
ん?本当にそうか?分からん

971 名前:デフォルトの名無しさん mailto:sage [2023/11/05(日) 15:52:16.56 ID:q8heJbgz.net]
2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい

972 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 06:59:13.82 ID:j6L5l5bH.net]
異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから

本来動くべきサンプルを貼って>>949の件は終了とする

x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK

x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK



973 名前:デフォルトの名無しさん mailto:sage [2023/11/06(月) 19:00:47.89 ID:j6L5l5bH.net]
回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK

974 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 17:50:43.57 ID:Karf8A+O.net]
文字列の頭に部分一致するパターンなんですが・・・

「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。

975 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:12:27.94 ID:ctqB5947.net]
/^abcdefg/

976 名前:デフォルトの名無しさん mailto:sage [2023/11/15(水) 18:41:54.66 ID:/mJ+eeiZ.net]
無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな

977 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:47:23.08 ID:7i/8qZTv.net]
/^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか

978 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 14:53:22.83 ID:4tHpE5Jq.net]
>>957
否定先読みが使えるなら^m(?!ap)かな?

979 名前:デフォルトの名無しさん mailto:sage [2023/11/16(木) 15:59:06.48 ID:7i/8qZTv.net]
ありがとう

980 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 04:25:56.84 ID:gwXFy+9L.net]
特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?

981 名前:デフォルトの名無しさん mailto:sage [2023/11/17(金) 06:13:31.18 ID:28WV0iMa.net]
\Eが来ると困る

982 名前:デフォルトの名無しさん [2023/11/28(火) 12:33:08.74 ID:vIU65Zk5.net]
正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?

$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]


なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?



983 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:42:04.64 ID:EkqG9ePT.net]
perlよく知らんがgとったら消える

984 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 13:54:45.94 ID:uy7CvN4q.net]
推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []

985 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 14:25:52.10 ID:uy7CvN4q.net]
2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?

986 名前:デフォルトの名無しさん [2023/11/28(火) 16:18:10.81 ID:vIU65Zk5.net]
>>963
gとったら消える。Rubyも同じらしい。

>>964
[]が出るってことはなにかにマッチしてるってことでしょ?

>>965
それなら最初の.*にもマッチするじゃん?
一回目にマッチしなくて、二回目にマッチする理由がわからんのよ

987 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:18:30.67 ID:JJPCdnVt.net]
仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ

988 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:20:34.59 ID:JJPCdnVt.net]
でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ

989 名前:デフォルトの名無しさん [2023/11/28(火) 16:21:19.02 ID:vIU65Zk5.net]
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]

$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]

後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?

990 名前:デフォルトの名無しさん [2023/11/28(火) 16:22:48.63 ID:vIU65Zk5.net]
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。

ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]

ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]

991 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:44:51.01 ID:wVUnEJO+.net]
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ

992 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:47:59.11 ID:uy7CvN4q.net]
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ



993 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:49:01.41 ID:CppHkuHl.net]
0文字と一致させたくなければ.*ではなく.+と書けよ

994 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 16:59:51.73 ID:fB6/42vV.net]
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ

個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる

995 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 17:02:27.57 ID:fB6/42vV.net]
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど

996 名前:デフォルトの名無しさん [2023/11/28(火) 17:09:04.46 ID:vIU65Zk5.net]
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん

997 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:08:10.66 ID:waKUlTL5.net]
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね

998 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 18:30:16.15 ID:mMoqXMUf.net]
(ハクション!

999 名前:デフォルトの名無しさん mailto:sage [2023/11/28(火) 19:16:57.98 ID:6l9rHssS.net]
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん

1000 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 13:08:47.77 ID:yvH2v9xT.net]
正規表現検索は失敗しないかぎり終わらないって話では

abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了

1001 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 14:41:21.44 ID:lw8jVmFR.net]
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで

1002 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 17:53:32.44 ID:AoutXZD6.net]
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき

1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから



1003 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:01:27.70 ID:lw8jVmFR.net]
確かにその通りやな、1度目で消費しきっとるはずや

1004 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 18:06:42.76 ID:lw8jVmFR.net]
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ

1005 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 20:04:08.42 ID:x7bR/xfi.net]
/(.*)$(.*)$((.*)$){999}/

1006 名前:デフォルトの名無しさん mailto:sage [2023/11/29(水) 22:25:25.39 ID:yvH2v9xT.net]
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?

2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど

1007 名前:デフォルトの名無しさん [2023/12/01(金) 02:37:28.94 ID:07OBAnmr.net]
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?

$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]

$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]

1008 名前:デフォルトの名無しさん mailto:sage [2023/12/01(金) 08:09:57.11 ID:RWimeGTM.net]
/^\w+|$/[$&]/

これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?

1009 名前:デフォルトの名無しさん mailto:sage [2023/12/02(土) 00:36:44.31 ID:/f7jnFb0.net]
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace

・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
 ただし空文字にマッチした場合、先へ進まなくなることを回避するために
 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
 これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる

1010 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:24:41.69 ID:Ug9Hn2aN.net]
KEEPのKはあるのにPが無い、何故?

1011 名前:デフォルトの名無しさん mailto:sage [2023/12/07(木) 23:31:35.71 ID:Ug9Hn2aN.net]
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い

1012 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 09:57:52.47 ID:8JqB6SG/.net]
>>988
思うよ
+の後に$を置けば余計にそう思う



1013 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 13:04:54.79 ID:t3u5G9tC.net]
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない

1014 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 14:15:57.63 ID:ayXeZXuA.net]
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?

1015 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:43:26.80 ID:e6Tz3fj/.net]
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる

$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]

1016 名前:デフォルトの名無しさん mailto:sage [2023/12/10(日) 15:44:52.66 ID:e6Tz3fj/.net]
s/バク/バグ/

1017 名前:デフォルトの名無しさん mailto:sage [2023/12/13(水) 11:48:29.08 ID:wzNHEkEB.net]
ただの仕様だよ、あほらし

次スレよろ

1018 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:00:59.04 ID:KMxF6SWS.net]
次スレ
https://mevius.5ch.net/test/read.cgi/tech/1702684760/

1019 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 09:36:31.90 ID:pgUnJUCg.net]
天地無用

1020 名前:デフォルトの名無しさん mailto:sage [2023/12/16(土) 10:49:04.16 ID:faoSWywL.net]
>>998
ほめてつかわす

1021 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒

1022 名前:過去ログ ★ [[過去ログ]]
■ このスレッドは過去ログ倉庫に格納されています








[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<262KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef