1 名前:nobodyさん [2012/09/19(水) 18:58:43.51 ID:bdgNsY2f] 【正規表現道場の掟】 ・言語不問 ・質問も大歓迎。使用言語を書くのを忘れずに。 正規表現と関係ない話・質問は他スレへどうぞ。 前スレ 正規表現道場 kohada.2ch.net/test/read.cgi/php/1168450843/
139 名前:nobodyさん mailto:sage [2014/02/15(土) 18:56:47.98 ID:???] 正規表現メモ www.kt.rim.or.jp/~kbk/regex/regex.html#NOTINCLUDED 「調整中」 気付いてもらえたのかそうでないのかいまいち分からんす。 このサイトはあんまアテにしないほうが良さそうだ。
140 名前: ◆QzqhRqBYxktP mailto:sage [2014/02/16(日) 14:59:01.14 ID:???] >>125 の疑問点 \K が分岐の先頭にあることで処理速度に遅れが出るかどうか調べる。 また、\K を使わない書き方とどちらが早いか調べる。
141 名前: ◆QzqhRqBYxktP mailto:sage [2014/02/16(日) 15:40:17.27 ID:???] 比較対象追加 ( >>125 ) | (?=ABC) \K ABC
142 名前: ◆QzqhRqBYxktP mailto:sage [2014/02/16(日) 20:56:16.32 ID:???] ( >>125 ) | (?=ABC) \K ... Perl6 正規表現 I dl.dropboxusercontent.com/u/16667824/perl6/AdventCalender/1/5.html
143 名前: ◆QzqhRqBYxktP mailto:sage [2014/02/17(月) 00:27:24.93 ID:???] Perl6::Overview::Rule search.cpan.org/~lichtkind/Perl6-Doc-0.36/lib/Perl6/Doc/Overview/Rule.pod [foo|bar]+ Perl6ではこれが正しい書き方になるらしい。初心者がハマりそう・・罠的な意味で。 先読み、戻り読みは書きにくくなった感が否めない。 文字クラスも加算、減算をしないときでも <> で囲う必要があるのはめんどくさい。 が、新しいオモチャとしては十分楽しめそう。ついでに英語も覚えてしまおう。
144 名前: ◆QzqhRqBYxktP mailto:sage [2014/02/22(土) 00:25:15.35 ID:???] S05 feather.perl6.nl/syn/S05.html > Last Modified: 11 Feb 2014, Version: 174 A05 search.cpan.org/dist/Perl6-Doc/share/Apocalypse/A05.pod > Last Modified: 18 May 2006, Number: 5, Version: 7 perl6ではもはや正規表現ではないという意味を込めて 「regex」 と呼んでるらしい。 perl5の正規表現にあった 「ゴチャゴチャ感」 が綺麗に一掃されてる感がある。 :ratchet があるのは最高だなぁ。
145 名前:nobodyさん [2014/03/01(土) 19:39:32.33 ID:n8n41uDi] anago.2ch.net/test/read.cgi/applism/1393578532/139 anago.2ch.net/test/read.cgi/applism/1393578532/157 この書込の方を正規表現でNGにしたいと思っています。 条件は 最初の行とは限らないが、「・」で初める行がある。何文字かの後、改行 その次の行は空の行 この2セットを正規表現で表すにはどうすればいいでしょうか? .*?・.*?\r\n\r\n としてみましたがダメでした。
146 名前: ◆QzqhRqBYxktP mailto:sage [2014/03/01(土) 20:13:27.84 ID:???] >>145 2chブラウザ用でいいのかな?処理速度重視で作った。 (?:^|<br>)(?>\s*)・(?>[^<]*(?:(?!<br>).[^<]*)*)<br>(?>\s*)<br>
147 名前:nobodyさん [2014/03/01(土) 20:45:21.19 ID:n8n41uDi] >>146 素敵! 神! すっきりしました! テキストじゃなくhtmlに対して正規表現だったのですね、勉強になりました。 ありがとうございました!
148 名前:nobodyさん [2014/03/02(日) 02:32:48.90 ID:2i/vkXtz] htmlに対してとかじゃなくログに合わせろと
149 名前: ◆QzqhRqBYxktP mailto:sage [2014/03/04(火) 19:52:20.08 ID:???] (>>146 ) (?:^|<br>) は分岐のバックトラックが残るから (?><br>|\A) としたほうが良さそう。 この2つは動作が完全なイコールではないので注意が必要、文頭が <br> だった場合に 絶対に \A がマッチ出来なくなるため。これが問題になることはほとんど無いだろうけど。
150 名前:nobodyさん mailto:sage [2014/03/05(水) 08:18:57.21 ID:???] (>>144 ) S05 ttp://perlcabal.org/syn/S05.html >Last Modified: 27 Feb 2014 Jeffrey Friedl ttp://regex.info/ Jeffrey Friedl - 第3版のコード ※ CGIなので直リンは避けたほうが良い。 regex.info/listing.cgi?ed=3&p=all 第2刷に対する正誤表 - 詳説 正規表現 第3版 ttp://www.oreilly.co.jp/books/9784873113593/#errata0 Google Books 詳説 正規表現 ※ 立ち読み可能 ttps://www.google.co.jp/search?tbm=bks&hl=ja&q=%E8%A9%B3%E8%AA%AC%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE
151 名前:nobodyさん mailto:sage [2014/03/13(木) 06:24:42.94 ID:???] ascii抜粋 !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~
152 名前:nobodyさん mailto:sage [2014/03/17(月) 17:00:03.12 ID:???] >>142 >Perl6 正規表現 I ここのサイト主、先読みを理解出来てないな・・。beforeとafterも逆だし。
153 名前:nobodyさん mailto:sage [2014/03/21(金) 12:20:24.42 ID:???] tes
154 名前:nobodyさん mailto:sage [2014/03/22(土) 00:49:43.59 ID:???] windowsXP ショートカットのパス --------- C:\WINDOWS\system32\cmd.exe /k C:\test.pl6 --------- /k は実行後にウインドウを閉じないオプション。 拡張子 pl6 を perl6.exe に関連付けしておく。 test.pl6 にperl6のテストコードを書いて実験する。
155 名前:nobodyさん mailto:sage [2014/03/23(日) 15:15:41.32 ID:???] #!/usr/bin/perl6 my $str; $str := "AAABBBCCC"; say $str.trans( 'A'=>'a', 'B'=>'b', 'C'=>'c' ); say "\n"~$str; ---結果--- aaabbbccc AAABBBCCC
156 名前:nobodyさん mailto:sage [2014/03/26(水) 20:28:04.50 ID:???] ### winXP で文字コードの 『et_EE.ISO8859-1』 を使えるようにする手順 !!! 試すときは仮想マシンを使うこと。環境が壊れて文字化けだらけになるため。 !!! 1、「コントロールパネル」 → 「地域と言語のオプション」 2、「日本語」 や 「日本」 と設定されている所を全て 「エストニア」 に設定する。 3、PC再起動 => perl から et_EE.ISO8859-1 が使用可能になる。 順番が s z t u に変わったことを確認。ただ、 [a-z] で t 以降もマッチするのは変わらず。 [FreeBSD] - 2005/9/3 ( => FreeBSD4.10? ) lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html 正規表現 Part11 toro.2ch.net/test/read.cgi/tech/1363769640/330,325
157 名前:nobodyさん mailto:sage [2014/03/26(水) 22:02:12.05 ID:???] FreeBSD - 2005/9/5 lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html 正規表現 Part11 toro.2ch.net/test/read.cgi/tech/1363769640/330,325 [[ winXPで et_EE.ISO8859-1 を使う ]] 1、「コントロールパネル」 => 「地域と言語のオプション」 2、「日本」 「日本語」 を全て「エストニア」 に変更。 3、PC再起動 perlで s z t u の順になるのを確認。しかし [a-z] が t u 以降にもマッチするのは変わらなかった。 => 順番が変わることによるトラブルを避けるために対策されている? ※ これをやると環境の一部がエストニア語で上書きされ日本語に戻せなくなるので 試すなら 「VM ware」 や 「Virtual PC」 等の仮想マシンで試しましょう。 2005/9/5 に問題報告がされているのでそれ以前にリリースされたFreeBSDを使って試せば 完全に再現出来る可能性大。そして 4.11で再現出来なくなっていれば対策が取られたということになる。
158 名前:nobodyさん mailto:sage [2014/03/30(日) 04:03:56.61 ID:???] --------c:\test.pl----------- use locale; print +(sort grep /[a-z]/i, map { chr } 0..255), "\n"; --------c:\test.pl----------- C:\>perl test.pl aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsSzZtTuUvVwWxXyY C:\>perl -v This is perl 5, version 16, subversion 3 (v5.16.3) built for MSWin32-x86-multi-thread ----------------------------------- ↓これを使わなくても順番が変わった。 use POSIX qw(setlocale LC_ALL); setlocale(LC_ALL, "et_EE.ISO8859-1"); コンパネで「エストニア」と指定しただけで「et_EE.ISO8859-1」は未指定の状態。 ----------------------------------- /[a-z]/i を /\w/ に変えると英字以外の文字も英字の間に 挟まっていることが確認出来る。
159 名前:nobodyさん mailto:sage [2014/03/30(日) 04:24:51.20 ID:???] --------c:\test.pl----------- use locale; # これが無いと順番が変わらない use POSIX qw(setlocale LC_ALL); # コメントアウトしても変化なし setlocale(LC_ALL, "et_EE.ISO8859-1"); # コメントアウトしても変化なし my $abc; $abc = "STU"; $abc =~ s/[A-Z]/hit/g; print $abc."\n"; --------c:\test.pl----------- [結果] hithithit 順番が変わっていれば S にしかマッチしないはずだが3文字すべてに マッチしている。 LC_ALL を LC_CTYPE や、 LANG などに変えたり、test.plを保存するときの 文字コードをutf-8からshift_jisに変えたりしても結果変わらず。 XPsp3+perl5.16.3の環境で S だけにマッチさせる手段は無いと思われる。
160 名前:nobodyさん mailto:sage [2014/03/30(日) 05:25:46.81 ID:???] >>156 「辞書順」はロケールに依存するが「文字コード順」は文字コードに依存する、んじゃね? 文字集合の範囲指定が文字コード順と定義されているなら、 いくらロケール切り替えても文字コード切り替えない限り無意味だろう。 で、文字集合の範囲指定ってどっちだと定義されてるの?
161 名前:nobodyさん mailto:sage [2014/03/30(日) 14:02:22.42 ID:???] >>160 俺はロケールや文字コードの知識はほとんど無いんでよく分かってない。 ↓は winXPsp3 + perl5.16.3 + ロケール = 「日本」 の環境での実験結果。 ・ [ァ-ィ] が ア にマッチするか実験。( 文字コード順ならマッチしないはず ) ---------------------------------------- use locale; if ( "ア" =~/[ァ-ィ]/ ){ print "hit\n"; } else { print "no hit\n"; }; ---------------------------------------- 結果: hit ( マッチしたので文字コード順ではない ) この環境での範囲指定は↓の順みたい。これはshift_jisの並び順とは違う。(これが辞書順?) ---------------------------------------- _0123456789aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZァアィ スセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン ---------------------------------------- 文字コードでなくロケールに依存するという発想は思い付かなかったわ、そっちの線で また実験しながら遊んでみるよ、辞書順とやらも調べてみる。ヒントありがとう。
162 名前:nobodyさん mailto:sage [2014/03/31(月) 00:44:57.15 ID:???] (>>156 ) ついに [a-z] が t 以降にマッチしない動作の再現に成功! et_EE.ISO8859-1 の代わりに et_EE.ISO8859-15 を使ったら再現出来ました! 今まで助言をくれたみなさんありがとう〜。自分一人じゃ絶対無理だった。 ↓こちらの方々にも感謝〜 初心者もOK! FreeBSD質問スレッド その117 toro.2ch.net/test/read.cgi/unix/1380865524/938-954n 詳しい手順はもう少し調べて整理してから載せます。
163 名前:nobodyさん mailto:sage [2014/04/01(火) 22:34:44.19 ID:???] 正規表現道場 in ジオシティーズ akiba.geocities.jp/hp20140401/ とりあえず場所確保。
164 名前:nobodyさん mailto:sage [2014/04/12(土) 17:21:41.17 ID:???] 2ch .scに移転しました。 正規表現道場 Part2 nozomi.2ch .sc/test/read.cgi/php/1348048723/l50 ■ 2ch.netの問題点 ・ 2chscがNGワードになってるので正規表現をスレに貼るのに支障が出る。何より言論統制はイクナイ。 ・ 管理人が今後どう動くか予測が付かない。 自暴自棄になりIPや書き込み履歴を大公開して逃走する可能性すらある。会社IPの人は注意。
165 名前:nobodyさん [2014/04/12(土) 20:53:07.28 ID:kZRku0LV] もうこっちに帰ってくるなよ
166 名前:nobodyさん [2014/04/15(火) 11:21:18.41 ID:qQPWwAKL] 使用しているのはYahoo! Pipesのregexです d.hatena.ne.jp/dacs/20080422/1208868051 ○○/△△&#xd;[□□ という文字列から△△だけを抜き出したくて、色々試してみているのですがどうもうまくいきません ".*/" -> replace -> "" "\&#xd;.+" -> replace -> "" だと思うのですが、何か間違いがあるのでしょうか? ちなみに "[.+" -> replace -> "" も試してみましたがダメでした
167 名前:nobodyさん [2014/04/15(火) 20:38:11.07 ID:CfZz5H/X] Yahoo! Pipesの仕様なんて知らんが 文字列の開始も終わりも指定してないということは .*/で一番最後の/までが対象として消える可能性はある
168 名前:nobodyさん mailto:sage [2014/04/16(水) 10:42:38.10 ID:???] >>167 ありがとうございます、確かめてみます
169 名前:nobodyさん mailto:sage [2014/05/08(木) 02:37:21.25 ID:???] ファイル検索ツールでパスを入力する時、「\」「/」を入れると候補が0になってしまいます d:\\abc\\123\\ のように入力しているのですが、間違っていますか?
170 名前:nobodyさん [2014/05/08(木) 03:20:39.96 ID:Zyar7s4i] そのファイル検索ツールのところで聞けばー
171 名前:nobodyさん mailto:sage [2014/05/22(木) 01:25:49.65 ID:???] sc連投規制中なう。
172 名前:nobodyさん mailto:sage [2014/05/22(木) 14:43:31.27 ID:???] (sc>>212 ) >qr/\"((?:\\[\\\"]|.)*?)\"/ > これはよっぽど自信がないと書けない書き方だ。 今考えると弾たんは単に2文字否定の作り方を知らなかっただけだな・・。 知ってたらこんなあやふやなものを作ろうなんて思わないし。 早さに拘るのに早い正規表現の作り方を知らないというちょっと残念な弾たん。 他の正規表現を見ても正規表現自体のスキルは高くない。 なんでもこなすオールラウンダーだから薄く広くになるんだろうな。 しかしこの程度の正規表現スキルでcpanのモジュール作って大丈夫なんだろうか。 探せばバグが出てきそうな予感。
173 名前:nobodyさん mailto:sage [2014/05/22(木) 15:18:43.78 ID:???] 正規表現のスキル自体とモジュール作成能力には直接的な相関関係はないからなあ・・・
174 名前:nobodyさん mailto:sage [2014/05/22(木) 16:18:04.88 ID:???] (‥ )フーン
175 名前:nobodyさん mailto:sage [2014/05/22(木) 16:49:22.13 ID:???] そういう指摘するだけでモノ作ったり貢献してなさそうなお前はもっと駄目な人間だから安心しろ。 弾はなんだかんだ色々作ってるし色々な方面に貢献してる。
176 名前:nobodyさん mailto:sage [2014/05/22(木) 18:11:53.77 ID:???] 指摘することも立派な貢献だと思いますよ。現に指摘によって処理時間が半分以下になってますし。
177 名前:nobodyさん mailto:sage [2014/05/23(金) 17:54:18.09 ID:???] まだ連投規制が解除されないなう ## m// キャッシュを保持してない状態では空文字列にマッチする。 うっかりするとバグの原因になり得る。
178 名前:nobodyさん mailto:sage [2014/05/23(金) 19:00:28.59 ID:???] .scの連投規制は俺も食らったけど(専ブラだと「書き込めたかも…」で書けてない状態)、 Webブラウザで投稿したらBOT疑惑なのでCapchaしろになってそれで解除できた。 URLを貼りまくって連投規制になった場合は知らん。
179 名前:nobodyさん mailto:sage [2014/05/23(金) 19:22:48.54 ID:???] >>178 俺の場合は「連続投稿は禁止されています。Error!」って出るだけ。 普通に連続投稿が原因で規制食らってるみたいだからもうダメかも分からんね。 人が少ないから自然に独り言みたいになるのにそれで規制されたら ますます人少なくなるなw
180 名前:nobodyさん [2014/05/23(金) 20:03:59.73 ID:Hym2JLxi] たらこテョンねるの話はたらこテョンねるでやれ
181 名前:nobodyさん mailto:sage [2014/05/23(金) 22:52:00.36 ID:???] パールを使った正規表現 omatomen.net/archives/1002062987.html
182 名前:nobodyさん mailto:sage [2014/05/24(土) 02:35:30.04 ID:???] >>2 正規表現メモ (?num) の説明文にある・・ ------------------- (\()?[^()]+(?(1)\)) ------------------- これは (?num) とはまったく関係ない正規表現。ただの条件文。
183 名前:nobodyさん mailto:sage [2014/05/24(土) 15:06:27.80 ID:???] >>182 ---------------------------- (?(R)...) PCREで、再帰的パターンの開始を示します。 <(?:(?(R)\\d++|[^<>]*+)|(?R))*> ---------------------------- 説明文は間違い。これは条件式の条件。\\d は \d の間違い。 perldoc.jp perldoc.jp/docs/perl/5.14.1/perlre.pod (?(condition)yes-pattern|no-pattern) の項目を参照。
184 名前:nobodyさん mailto:sage [2014/05/27(火) 02:44:28.34 ID:???] 詳説 正規表現のAmazon値 (1年前との比較) ・古本 初版 &nbsp;500円 → 1998円 2版 1600円 → 3150円 3版 4000円 → 3709円 ・新品 3版 5184円 Amazon - "正規表現" www.amazon.co.jp/s/field-keywords=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE
185 名前:nobodyさん mailto:sage [2014/05/27(火) 03:16:35.15 ID:???] 文字参照の処理、間違えてますよ > 2ch.net
186 名前:nobodyさん mailto:sage [2014/05/27(火) 03:43:16.09 ID:???] ttp://cpansearch.perl.org/src/DANKOGAI/Unicode-Char-0.02/lib/Unicode/Char.pm ↓ ^ か \A 忘れてね? ------------------------ $method =~ s/.*:://o; ------------------------
187 名前:nobodyさん mailto:sage [2014/05/27(火) 03:49:35.83 ID:???] ---------------------------------------------------------- my ($hex, $name) = ($line =~ /^([0-9A-Fa-f]+)\s+(.*)/); next if $name =~ /[a-z]/; # range, not character ---------------------------------------------------------- 2行目だけ小文字に限定されてる。これで良いのか悪いのかは分からないが。
188 名前:nobodyさん mailto:sage [2014/05/27(火) 14:20:55.14 ID:???] ttp://cpansearch.perl.org/src/DANKOGAI/Lingua-JA-Numbers-0.04/lib/Lingua/JA/Numbers.pm ----- せっかく [eE] と書いてるのに /i = ($num =~ /([+-])?(\d+)(?:\.(\d+))?(?:[eE]([+-]?\d+))?/io); ----- ちゃんと動くんだろうけどアンカー付けないのが気持ち悪い。 $int =~ s/(.*)(.{48})\z/$2/o; ----- これミスでね? [k|g] if ($style =~ /(?:romaji|[k|g]ana)$/){
189 名前:nobodyさん mailto:sage [2014/05/27(火) 14:23:03.78 ID:???] 本人に直接言う勇気がないらしい。まこと残念な人である 皆はこうならぬように
190 名前:nobodyさん mailto:sage [2014/05/27(火) 14:28:03.82 ID:???] 今度は大文字限定。 $ja =~ tr/[G-Z]//d; ITPro: tr///d itpro.nikkeibp.co.jp/article/Reference/20080930/315784/
191 名前:nobodyさん mailto:sage [2014/05/27(火) 14:50:18.14 ID:???] あれ、/o が使われてる。なんでapache logのltsv変換には 使われてなかったんだろう。ああいう時こそ効果的なのに。
192 名前:nobodyさん mailto:sage [2014/05/27(火) 15:43:22.68 ID:???] ■ combined2ltsv.pl の re で /o の有無をタイム計測 /o なし 12724/s /o あり 31689/s /o あり は2.5倍早い。これは報告したほうがいいかも。
193 名前:nobodyさん mailto:sage [2014/05/27(火) 16:02:40.01 ID:???] (>>186 ) これに /o がついてるとなんか笑ってしまうw 余談追加。俺は報告なんかしないんで報告したい人がいたらしてね。 小飼 弾が手負いのうちに容赦なくツッコミを入れておく akiba.geocities.jp/hp20140401/2014/006.html
194 名前:nobodyさん mailto:sage [2014/05/29(木) 03:21:04.45 ID:???] (>>188 ) --------------- use utf8; --------------- \d --------------- 弾たんにならこれで通じるだろう。(確信)
195 名前:nobodyさん mailto:sage [2014/05/29(木) 16:45:47.77 ID:???] 神戸大:オートマトン ttp://kurt.scitec.kobe-u.ac.jp/~kikyo/lec/07/automaton/k5.pdf 行列の次は集合か・・もう忘れたよ・・覚えたことないけど。
196 名前:nobodyさん mailto:sage [2014/05/30(金) 01:37:35.60 ID:???] 関西学院大学: 集合 www.kwansei.ac.jp/hs/z90010/sugaku1/kakuritu/syugo/set.htm とっても分かりやすい。・・あれ?これ大学でやる内容か?中がっ(ry
197 名前:nobodyさん mailto:sage [2014/05/30(金) 01:52:56.08 ID:???] ↑ /hs/ = ハイスクールでした。
198 名前:nobodyさん mailto:sage [2014/05/30(金) 06:37:19.19 ID:???] Q、 perlの正規表現では \A\z == ε である。では、 ??? == φ の ??? は何になるか。
199 名前:nobodyさん mailto:sage [2014/05/30(金) 19:16:27.41 ID:???] if( () =~ "" ){ print "hit\n"; } else { print "no\n"; }; 結果 hit 答え、なし
200 名前:nobodyさん mailto:sage [2014/05/30(金) 21:43:37.74 ID:???] () と "" を比較して no を返す方法はあるか。( φとεの比較 ) () eq "" () == "" "" eq undef "" == undef () eq undef () == undef すべてtrueが返る。
201 名前:nobodyさん mailto:sage [2014/05/30(金) 22:31:10.55 ID:???] 弾たん : perl - にも真偽値は存在する blog.livedoor.jp/dankogai/archives/51268304.html ちなみにブログのトップではGoogle Chromecastをボロクソに叩きつつ、Chromecastへのamazonアフィを 張るというすご技を展開されております。 こういう人相手に>>193 を報告しにいってもスルーされるだけだと思うよ。カネにならないからね。
202 名前:nobodyさん mailto:sage [2014/06/01(日) 03:26:43.94 ID:???] てすてす &
203 名前:nobodyさん mailto:sage [2014/06/01(日) 10:07:29.84 ID:???] >>201 それ、お前向けにカスタマイズされてるだけだろ。
204 名前:nobodyさん mailto:sage [2014/06/01(日) 10:29:53.68 ID:???] こういう陰口叩くやつよりマシ