[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 02/03 08:16 / Filesize : 179 KB / Number-of Response : 834
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

正規表現



1 名前:正規表現 mailto:正規表現 [02/12/06 18:09]
正規表現

2 名前:終了 mailto:終了 [02/12/06 18:27]
終了

3 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/06 18:47]
/\s*終\s*了\s*/

4 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/06 18:51]
oreillyの本読めば全てに限りなく近く分る。よって終了。

5 名前:名無しさん@お腹いっぱい。 [02/12/06 18:52]
板地害

6 名前:名無しだよもん@カラアゲうまうま mailto:sage [02/12/06 19:00]
www.oreilly.co.jp/BOOK/regex/

7 名前:名無しさん@お腹いっぱい。 mailto:netasage [02/12/06 19:05]
釣り合いの取れた括弧にマッチする正規表現を教えてください。

()
((()))
((((()))))
(()())
((())(()()))

8 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/06 19:12]
正規表現ってFAだけで実装してるの?PDAも使うの?

9 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/07 11:36]
>>7
無い。


10 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/07 20:44]
(・)(・)
. .) (
( Y )



11 名前:性器表現 mailto:sage [02/12/07 22:28]
性器表現

12 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/12 22:24]
限界までgrepやればいい気持ち

13 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/12 22:41]
正則表現って訳してる本無かったっけ?

14 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/13 09:51]
詳説正規表現に正則表現という言葉が出てきた気がする

15 名前:はにゃーん☆ ◆ZoWSAKURAw mailto:moe or die [02/12/15 16:08]
>>7
Perl 5.6 以降なら、可能。

#! /usr/local/bin/perl

@kakko = qw[()
())
((()))
(()()))
((((()))))
(()())
((())(()()))];

$regex = qr/[^()]*\((??{$regex})*\)[^()]*/;

foreach (@kakko) {
if(/^$regex$/) {
print "Match: $_\n";
} else {
print "Unmatch: $_\n";
}
}


16 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/16 08:16]
でも、それ正規表現じゃないんじゃないの?
文脈自由文法のクラスでしょ?

17 名前:名無しさん@お腹いっぱい。 mailto:age [02/12/16 12:28]
それ言ったら、今の「正規表現」なんてそもそもの定義から外れちゃうような気がするぞ。


18 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/16 20:24]
数学的文脈におけるいわゆる「正則な表現」だけで括弧の釣り合いにマッチさせるスレはここですか?

19 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/16 20:43]
ここは既に終了したスレです。

20 名前:名無しさん@お腹いっぱい。 mailto:age [02/12/17 03:36]
いやん、正規表現がんばろー。
16>>
拡張正規表現で納得しろ。



21 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/17 04:44]
そもそも正規言語は数をかぞえられないんだから、
拡張正規表現でもないでしょ。

22 名前:名無しさん@お腹いっぱい。 mailto:age [02/12/17 19:24]
拡張正規表現 = 「正規表現」の定義を拡張。;)


23 名前:名無しさん@お腹いっぱい。 mailto:sage [02/12/17 20:22]
>>20
言った方がいいかどうかわからんが
16>>
逆だ

24 名前:名無しさん@お腹いっぱい。 [02/12/21 23:29]
/^(U).\/*&_$&&*_@&(&*@+|@_(@)(?!<>)_##[o-Q](.*O+)&^&%^#)#+#$/


25 名前:おむこさん志望 ◆QtGqCwfDSA mailto:sage [02/12/22 00:23]
いま glibc のマルチバイト回りをやってる人が書いたドキュメント
lc.linux.or.jp/lc2001/papers/dfa-i18n-paper.pdf
lc.linux.or.jp/lc2002/papers/hasegawa0918h.pdf

>>13
オートマトンで有名な本
www.saiensu.co.jp/books-htm/ISBN4-7819-0374-6.htm
には正則表現って書いてあった。

26 名前:名無しさん@お腹いっぱい。 [03/01/06 02:59]
ttp://sorekika.com/dame.jsp?idx=352


27 名前:名無しさん@お腹いっぱい。 [03/01/06 22:41]
question = ( to ) ? be : ! be;
         -- Wm. Shakespeare

28 名前:性器表現 mailto:sage [03/01/11 12:17]


29 名前:山崎渉 mailto:(^^)sage [03/01/15 13:00]
(^^)

30 名前:名無しさん@お腹いっぱい。 [03/02/16 02:34]
質問よいでしょうか・・・
英辞郎の読み仮名を削除したいのですが、
{(←全角です)ではじまり}(←これも全角です)でおわる文字列を
ごっそり置換したいのですが、どう表現すればいいのかよく
わかりません・・・・ おしえてくださいおながいします




31 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/16 02:48]
>>30
処理系は何?

32 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/16 03:05]
>>30
sed "s/{.*}//" < input > output
では駄目かい?

33 名前:名無しさん@お腹いっぱい。 [03/02/16 06:36]
>>32
その解は1行に複数の対が出てきたときに破綻する

34 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/16 12:28]
>>31
入れ子になっていない、かつsedが日本語に対応しているならば
s/{[^}]*}//
というパターンを使うのが楽。

35 名前:30 [03/02/16 13:50]
>>31
Windowsなんですよね・・・xyzzyの置換使おうかと思ってたんですが
あ、Pythonも使い方よくわからないけど(汗汗)入ってます
# Pythonだとどうかくんですかね??

ダメだったらCygwinでも入れてやってみようと思います。
皆様有難う御座います。

36 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/16 14:03]
秀丸の置換使えば?

37 名前:名無しさん@お腹いっぱい。 [03/02/16 14:26]
perlぐらいうごかん?

38 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

39 名前:30 mailto:sage [03/02/16 15:35]
>>34さんの方法で問題なく出来ました。
有難う御座いました。とりあえず、この表現の
意味をきちんと理解しとこうと思います。メモメモ・・・

ところで、>>36さん、何故秀丸?

40 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん



41 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/17 07:44]
BNF使え

42 名前:エディタ何617 mailto:sage [03/02/21 16:46]
pc2.2ch.net/test/read.cgi/software/1040201710/641-643
より移行してきますた。
正規表現の話はこっちでしましょ。
俺には大した知識はないんだが。

>642 :名無しさん@お腹いっぱい。 mailto:[sage] :03/02/21 15:28 ID:esOQbptZ
>なんのために [:alpha:] のような書式があるのかと子一時間

これは知らんかった。
テキストエディタの粋を脱しそうだが。

43 名前:エディタ何617 mailto:sage [03/02/21 16:47]
>643 :名無しさん@お腹いっぱい。 mailto:[sage] :03/02/21 15:31 ID:+tcoIlhs
>>>641
>文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。
>どんなコードでも入力が同一なら出力も同一であるべきじゃないの?

後半はよくわからんが、文字クラスが文字コードに依存するのは当然のことだと思うぞ。

文字 a は a というアルファベットという意味があるわけではなく単なるコード(0x61)なわけ。
テキストエディタでは普段から文字コードなんて考える必要はないんだけど、
正規表現では [a-z] とすると
Shift-JISなら [\x61-\x7A]
EBCDICなら [\x81-\xA9]
というふうに変わってくる。
当然文字コードに依存する。
ここで文字コードに依存せずに認識するとなると、EBCDICの場合
[a-z]=[\x81-\x89\x91-\x99\xA2-\xA9]
になってしまって本来の [\x81-\xA9] にはならなくなってしまう。
そのために 642 のような [:alpha:] なんかが用意されている。
さもなければ文字コード共通正規表現用文字テーブルなんてものが必要になりかねない。

テキストエディタで扱う文字コードとして EBCDIC を例に出すのは適当ではないが。

エディタがしているのは文字コードを認識して表示するということで、
文字コードを変換しているわけではない。
もちろん明示的に変換(文字コードを変更して保存等)すれば変わる。

44 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/21 17:54]
>文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。

そりゃ確かに恥ずかしい。
でも [a-z] という表記が「小文字アルファベットの文字クラスを指定している」ものだと誤解して、
誤用しているほうがもっと恥ずかしい。
「-」を使った表記は文字コード上で連続した複数の文字を意味しているだけだから、
本当に文字クラスを指定しなければならないシーンでは [:lower:] や \l を使うべき。
代表的なエンコーディングでは偶然文字コードが連続しているから
[a-z] で期待した動作になるので常用されているの。

45 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/21 20:46]
[:alpha:] とかってウムラウトがどうたらとかいう話のためにあるのだと思ってた

46 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/21 21:22]
unicode などが本格的に使われ出して
多国語があたり前になったら
[:Japanese:] とか [:Korean:] とか
できるのかな。

47 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/21 21:36]
>>45
その通り。 POSIX ではロケールによって変わるよ。

48 名前:テキ何618 mailto:sage [03/02/21 23:22]
興味があるので誘導されてきました。

ってココは関連Linkないので張るね。
●正規表現最新リンク集2003
ttp://www2.famille.ne.jp/~akio1998/l_grep.html
●正規表現メモ
ttp://www.kt.rim.or.jp/~kbk/regex/regex.html

で向こうのスレでの疑問で思ってたんですが、
| また正規表現の正しい、正しくないってあるのか?
上の引用についてずばり解決してくれる神はおられませんか?
向こうでも思ってたんだけど中途半端な正規化だから文字コードに
依存するって思ってたんですが。

49 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 00:55]
>>44
>本当に文字クラスを指定しなければならないシーンでは
> [:lower:] や \l を使うべき。

つーことは[B-Yb-y]は本当に文字クラスを指定せんといかんシーンでは
 [BCDEFGHIJKLMNOPQRSTUVWXYbcdefghijklmnopqrstuvwxyz]
あるいは
 [^AZaz[:digit:](憶えとらんので略)]
と書かねばならんわけか…

50 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 01:19]
[:alpha:] とかって、実際に実装されてるのあるの?




51 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 01:21]
>>48
ある正規表現が書かれた目的を果たせるかどうかで、正しい正しくないを言うことはで
きるでしょう。ただし目的を果たすといっても厳密でなければならない場合やアバウト
で大丈夫な場合と様々なレベルがあるわけで、ケースに応じて使い分けるのが大人とい
うものです。

それから正規化しているから正規表現というわけじゃないです。ある有限オートマトン
が受理する特定の言語(記号列)を正規言語と呼び、その受理される言語の全ての集合を
正規集合と呼び、その集合を表現する方法を正規表現と呼んでいるのです。文字コード
云々が問題になるのは、SJISやEUCのようなマルチバイトコードで表現された1文字を1
つの記号として認識しない正規表現エンジンがあるからで、またエンジンが認識する場
合でも利用者側が記号としての文字と文字コードとの関係を、[a-zA-Z] と [:alpha:]
のようにゴッチャにしているからです。もっとも後者についてはマルチバイトには依存
しない話ですけれど。

>>49
厳密にはそういうことになります。メンドイのでそこまでする人は少ないでしょうが。

52 名前:エディタ何617 mailto: sage [03/02/22 01:40]
| また正規表現の正しい、正しくないってあるのか?

俺なんかの知識じゃたいしたこと言えないが、現在においては統一的な正しさなんて無いと思う。
ものによって実装が違うから、egrepでは正しくedでは正しくないとかあろうね。
使い手が自分で何をしようとしているのか理解できているかどうかが問題になりそう。

Q「s/[A-z]//g としたら[や^まで消えてしまいました。この正規表現は間違っていますか?」
A「正規表現もパターンマッチの結果も正しいです。ただ、あなたの求めている正規表現ではないでしょう。」

>向こうでも思ってたんだけど中途半端な正規化だから文字コードに
>依存するって思ってたんですが。

エディタは文字コードを勝手に認識してくれるからユーザーが考える必要はないけど、
文字クラスで[a-z]とかやる場合はどうしたって文字というより文字コードを扱うってことになる。
ただ、普通は上に書いたように[A-z]なんてやる奴はいないだろうから、
実質的には文字コードに依存していないかのように扱えるというだけだと思う。

ところで [a-z] として、これがどういう意味であって欲しいんでしょうか?

53 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 03:42]
[a-z]
"a"の文字コードから"z"の文字コードまでの文字コードの文字のことかな

54 名前:テキ何618 mailto:sage [03/02/22 12:14]
>51,52
すまん質問の仕方が悪かった。
上で正規表現の仕様が悪いみたいな雰囲気があったから疑問に
おもったんですが、たとえば「grepの仕様は正しいが、awkの仕様は
間違ってる」みたいな正規表現の仕様上の問題で間違いというのが
あるのかという疑問でした。

>[a-z]
その正規表現で規定されているaのキャラクタからzのキャラクタまで。
文字コードでも文字でもないはずだ。
たとえばProxomitronなら[a-zA-Z]と同じようになるようにキャラクタの
並びが規定されている。

55 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 12:19]
正規表現が実装されているなら
実装の細部がgrepとawkでは異なるというだけで
正しいも正しくないもないんだってば。

56 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 14:34]
全然議論が噛み合ってないなぁ。
「正規表現」(オライリー)の一冊くらい読んでから出直してきて欲しいな。
でなきゃこんなの不毛だよ。

57 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 14:50]
>>51
> それから正規化しているから正規表現というわけじゃないです。ある有限オートマトン
> が受理する特定の言語(記号列)を正規言語と呼び、その受理される言語の全ての集合を
> 正規集合と呼び、その集合を表現する方法を正規表現と呼んでいるのです。文字コード

これが理解できません。

58 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 15:56]
>>[a-z]
>その正規表現で規定されているaのキャラクタからzのキャラクタまで。
>文字コードでも文字でもないはずだ。

「aのキャラクタからzのキャラクタまで」ってのが文字コードそのものだと思うぞ。
「文字コードでも文字でもない」ってのが [:alpha:] なんじゃないの。
[a-z] だけ特殊な意味合いを持って欲しい、なんてことではないでしょう。

>たとえばProxomitronなら[a-zA-Z]と同じようになるようにキャラクタの
>並びが規定されている。

絶対そんな規定されてないよ。
Proxomitronで規定されているのは「大文字小文字を同一視する」ってこと。
だから [a-Z] なんて書いても [a-z] と同等の文字コードの並びとして扱われる。
これは単にProxomitronの性質上、扱う文字列の大文字小文字を区別するより
区別しない方が圧倒的に多いということから独自に規定されたものだろ。

「文字でも文字コードでもない」として扱うためには、エディタ作者なりが
新たな文字の統一コードを規定していろんな文字コードに対応した変換表でも作り、
ユーザーは既存の文字コードの代わりに作者の規定したコードを理解して使うってことになるんじゃないか?

59 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/22 17:34]
形式言語の教科書くらい読んでから来い

60 名前:テキ何618 mailto:sage [03/02/22 23:55]
>55
ですよね、最近そういった話を耳にするんで敏感になってました。
きっぱり否定してくださって助かります。
51氏も分かりやすい説明ありがとうございます。

>58
それが正規表現関係の資料をいくら読んでも必ず「aのキャラクタから
zのキャラクタまで」だったと記憶してます。
逆にコードで表記されてる資料がありましたら、ご提示願えませんか?
# 日本語の資料だとよく文字コードの話もみます。

>「大文字小文字を同一視する」
の実装はどうされているのでしょうか?
まさか一度さきに別に小文字を大文字に書き直して正規表現を当ては
めてから元の小文字に戻すという芸当はされてないと思います。
私は憶測ですが正規表現上で小文字と大文字を同一文字だと規定し
ているように思えます。
# 文字コードレベルだと高とはしご高の関係に近いと思います。

>59
お勧めのありますか?



61 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 00:05]
>>6 くらい通読して出直してから議論してくれよ。でなきゃこんなやりとり無駄だよ。
いや、煽りじゃなくてマジでさ。

62 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 02:10]
>>6の本って目次だけ見ると各ツールの「実装」について述べてる
みたいだけど、正しい「定義」については載ってるの?

63 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 02:15]
規格としては POSIX 1003.2 があるけど、
正しい定義なんてものはないと思う。

64 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 02:50]
>>62
『正しい「定義」』なんてないんだからおまいらの議論は不毛だって言ってんの。
中途半端な知識と思い込みだけの虚しい空論だよ。

65 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 03:32]
>>62
たしかに目次には各ツールの実装についての記述が目立つ。
だが、この本のキモは4章と5章だ。
君が正規表現をある程度自在に扱えるのであれば、
この二つの章を読むだけでも価値はある。
とりあえず話はそれからだ、と思うぞ。


66 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 06:07]
文字クラス中の - が文字コードでの連続を表すか文字としての連続を表すかは実装依存です、
で終了。

67 名前:62 [03/02/23 14:33]
>>63-65
いや、>>66の言うように実装依存だと思ってたから、
正しい「定義」が載ってるなら、読んどこうかと思ったんですが。

>>61の発言を(それまでの流れと併せて)読むと、さも載ってそうなんですが、
目次見たら(-_-)ぁゃιぃ…だったので。


68 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 14:53]
www.opengroup.org/onlinepubs/007904975/basedefs/xbd_chap09.html
規格が「正しい」かどうかは別として…

69 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 15:30]
正規表現の定義ねぇ。どうもどこかの団体がきっちりまとめた規格
のような「定義」を期待してるようだが、このあたりのハナシは計算
機科学色が強いから定義など教科書の数だけある、と言ってみるテスツ。
本質はみな同じのはずだけどナ。
しかも見慣れぬ数学記号飛び交う抽象的な議論になるから、
オライリー本で充足しているヤシにはカルチャーショックだろう。
大学の図書館でも逝け。

70 名前:61 mailto:sage [03/02/23 18:23]
>>67
> >>61の発言を(それまでの流れと併せて)読むと、さも載ってそうなんですが、
> 目次見たら(-_-)ぁゃιぃ…だったので。

漏れの発言を勝手な解釈すんなよ。
正しい「定義」なんて載ってるわけないだろ。正しい「定義」なんてないんだから。



71 名前:61 mailto:sage [03/02/23 18:33]
>>67
ていうかあれだ、「定義」の話じゃなくて「規格」の話をしたいのか?

「定義」の話なら、>>69 の言うように、
計算機科学(の世界だと「正則表現」の方が通りが良いか?)の本でも
紐解いて読んでみるのが良いと思う。

そうでなくて、単に、
文字列バターンマッチに使われる「正規表現」の正しい「規格」の話、
ってことなら、そんなものは無い。
強いて言えば、>>68 くらい。

72 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 18:37]
>>67
「定義」=「決め」でしょ。
その場その場で都合のいいように「定義」するわけだから
「正しい『定義』」なんてのはあるわけがない。

73 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/23 18:39]
>>67
じゃ、まずは「正しい」の定義から始めようか。

74 名前:61 mailto:sage [03/02/23 19:06]
というわけで、このスレは、「ホップクロフト&ウルマンを輪読するスレ」になりますた。

75 名前:62 mailto:sage [03/02/24 03:14]
規格として[a-z]の解釈について正しい定義はあるのか?
っていう議論中に、「コレ読め」と言われたら載ってるように
見えても仕方ないと思うんですがねぇ。

>>6に載ってないから無い」、とは言えんでしょ。
何の為に読めと言ったのか聞いてよろしい?>>61

76 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/24 05:19]
POSIX 1003.2 に厳密に従っていればこれにある通り。
www.linux.or.jp/JM/html/LDP_man-pages/man7/regex.7.html

が、世にある実装は大抵そうでない。

77 名前:名無しさん@お腹いっぱい。 mailto:sage [03/02/24 18:47]
>>76
見た感じ、EBDICでもロケールが英語なら[a-z]は
英小文字のセットとして評価されるべきみたいですな。

78 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/14 03:37]
>>75
全く違う。
そもそも君の話は正しい定義がこの世に存在する事を
前提としている。しかし実際はそのようなものは
ないわけだ。(「正しい」の意味が私の考えている
ものと違うならわからないが)
そのことを理解するために(というか議論のための
基礎知識を得るために)読んでおくべきと 61 は
言いたかったのだと勝手に解釈してみる。

厳密な定義という意味で正しいと言っているなら
計算機科学の教科書をひもといてみるといいかもなあ。

79 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/14 09:29]
>75
そんなマヌケな話を避けられるようになるよ、
とそういう意味で勧めてくだすったんだろう。

80 名前:75 mailto:sage [03/03/15 03:46]
>>78
>そもそも君の話は正しい定義がこの世に存在する事を前提としている。
シテネーヨ。

つーか著名ツールの実装に関する本を読んだ所で、
[a-z]の解釈は〜という議論に決着つくのですか。

1-60までのスレの流れと、>>61の勧めた>>6の内容を
良く見てから出直して下さい。>>78,79



81 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 08:44]
取り合えず読んでみる、と言う選択肢は
意図的に無視されているのだろうか…


82 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 10:24]
もともと [a-z] なんていう表記は、素な正規表現/正則言語にはない。
でもそれじゃ面倒だから - で繋いだ2つの文字の間の文字群を略記する方法が、
及び実装としては単に文字コードを繋ぐ方法がデファクトスタンダードになった。
それを勘違いしたバカが [a-z] は論理的なアルファベットを意味すべきだとか言い始めて
[[:alpha:]] や \l やら \a が導入されるようになったり、変な挙動をする実装もでてきたかもしれん。
でここでPOSIXなんて有名無実なものが定義されたわけだ。
なのにさらにバカが [a-z] の正しい解釈、定義を教えろとかいう。

やれやれだ。

83 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 13:23]
ここは62=75の脳内正規表現を研究するスレになりますた。

# 素直に勉強してから出直せばいいのに。。。

84 名前:62=75 mailto:sage [03/03/15 22:06]
>>82
やれやれとはこっちが言いたい。
[a-z]の解釈が文字コード依存なのは承知済みだっつーの。

>>61のタイミングで論議を不毛と評しつつ、正規表現の本読めと
言われたら、規格か何かが載ってるとしか思えんでしょうが。
著名ツールの実装見たところで、議論の不毛を悟れますか?

85 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 22:43]
少なくとも読めば実装により異なることは察することができたかもね

86 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 22:46]
規格自体を読みたいなら68にリンクがあるし、なんでそう粘着してるんだろうか

87 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 22:51]
なぜに著名ツールの実装しか載っていないと決めつけ
勝手な解釈で話を進めるのだろう?
とにかくおかしな前提と曲解が多い上に粘着だ。

88 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/15 23:53]
もう放置しようよ……。

89 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/16 00:39]
非放置国家 2ch

90 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/17 23:40]
>>87
決め付けてませんが。
>>62で実装以外の内容(具体的に規格など)は
載って無いかと聞いてるんだし。

おかしな前提・曲解・粘着は認めますがね。
で、偉そうに読めとか言った>>61は何処逝ったの?



91 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 01:11]
>>90
> で、偉そうに読めとか言った>>61は何処逝ったの?
読んだら出てくるんじゃねーの?

92 名前:90 mailto:sage [03/03/18 01:29]
とっくの昔に読んでいるんだが…
(立ち読みでざっとだけど)

93 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 01:39]
形式言語系の本は読んだのかYO!

94 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 01:58]
>>92
そんなの読んだうちに入らん。

95 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 02:02]
理屈が通用すると勘違いせず、粘着は放置しましょう

96 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 02:15]
腹が減ってるもんで
こんなのでも食いついてしまうんです。

97 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 02:36]
>>90
君が何を知りたいのか、
おじさんわかんなくなっちゃったよ。
ここらでひとまず
疑問点を整理して箇条書きにしてみないか?

98 名前:名無しさん@お腹いっぱい。 mailto:sage [03/03/18 22:00]
技術系の本を立ち読みしただけで読んだ気になれる人には
何を言っても無駄ではなかろうか。

99 名前:山崎渉 mailto:(^^) [03/04/17 12:30]
(^^)

100 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん



101 名前:名無しさん@お腹いっぱい。 mailto:age [03/04/22 15:32]
『詳説 正規表現 第2版』
ISBN4-87311-130-7
本体価格5,400円

が5月に

102 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

103 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/22 23:53]
>>101
おっ。
ソースどこ?

104 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/23 00:54]
定義うんぬんよりも、便利な方がいい。

というわけで、

(?# (?: (?= (?! (?<= (?<! (?> (?()

105 名前:名無しさん@お腹いっぱい。 mailto:age [03/04/23 16:36]
>>103
オライリーのメルマガ

106 名前:名無しさん@お腹いっぱい。 [03/04/24 11:01]
正規表現(regular expression)の名前の由来はなに?
regularをなぜ正規と略したんだろう?
「正式にきめられていること。正式の規定」という意味の正規では
幾分意味不明なんじゃないだろうか?
むしろregular verb(規則動詞)の意味のregularと捉えるべきで、
「規則表現(法or式)」とでもした方が文字列の規則性を規則的に表現するもの
という意味でより素直で的確なんじゃないだろうか。
ここにはnormal distributionを正規分布と略し日本語としては
意味不明にしてしまったのと同様のセンスの無さが感じられる。

107 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 11:51]
「function」を「関数」と訳すアフォといっしょだろ。


108 名前:名無しさん@お腹いっぱい。 [03/04/24 11:54]
regular に合うような日本語単語を考えると
正規、正則、規則、規律、規則的、整然、合式、本格的、定常、完全、定例
などが挙げられる。
正規に違和感を感じるのは同意。
ただし、規則だと regular より rule の方を感じる。

regular expression を長々と訳すならばオレテキには
規則正しい表現法
となるが、あとはそれをどのように短くするかだ。
正規表現には違和感あるが
規則表現にはさらに違和感ある。
規則正しい生活を規則生活と省略するのに似ている。


109 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

110 名前:名無しさん@お腹いっぱい。 mailto:age [03/04/24 13:46]
わたしは特に違和感ない。

複数の体系の共通項的要素を抽出して、どれをもあつかえる
単一の体系にまとめることをCS的に正規化というでは?



111 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 13:57]
正則表現といわれたほうがシックリするわ。

112 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 14:15]
>>107
「函数」が正解、という主張ならそれは翻訳の問題ではなく
日本の戦後国語教育の問題なわけだが

113 名前:107 mailto:sage [03/04/24 14:55]
>>112
> 「函数」が正解、という主張なら
違う。


114 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 15:38]
>>113
それならそれで108なみ詳細な解説きぼんぬ

115 名前:113 mailto:sage [03/04/24 17:11]
>>114
> それならそれで108なみ詳細な解説きぼんぬ
どきっ!!
い、いやぁ、「function」は普通に訳したら「機能」じゃないかなぁ〜、
なんて思うので。
なんで、「関数」になったのか疑問なので。
やっぱり、かっこいいからかなぁ。


116 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 18:10]
数学方面なら「正則」とするところなのに、情報数学方面では「正規」の方が
定着しているということなのか?

>>115
数学で既に訳語があったからという単純な話なんでは。函数→関数の
書き換えはまた別の話だが。古い先生だと「関数」の表記を絶対使わない人
もいるね。自分も函数の方がいいと思う

117 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 18:38]
中国語が英語から「function」という英単語を輸入するとき
それを「函数」と翻訳した。
函は中国語で「ファン」と発音し「function」の「ファン」に似ているところからきている。
そのあと日本は中国から「函数」という言葉を漢字で記述された文字として輸入した。
そして「函」を「カン」と発音した。
戦後の日本の教育において「函」が教育仕様内の標準的漢字から外れるという理由から
およそ同義で同音の「関」に置き換えられた。

すなわち「function」の「fun」を元にしてその部分は
以下の経緯で「関」に変わった。
英語の「fun」
↓発音の類似性から
中国語の「函」(ファン)
↓同じ文字
日本語の「函」(カン)
↓発音の類似性から
日本語の「関」(カン)

こういう改変に次ぐ改変で「関数」という言葉が生まれた。
もはや「関数」という言葉にはそう表現する適切な理由がない。
情報系の技術屋なら「function」ないし「ファンクション」
と表現すれば良いのだ。どうしても漢字で書きたければ「機能」で良し。
「関数」だなんていい加減な言葉を使うなら
「class」を「学級」とでも表現してくれた方がまだましと言えよう。


118 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 19:37]
函(はこ)の数と意味も掛けてあるから、やはり捨て難い訳ではある

119 名前:名無しさん@お腹いっぱい。 mailto:age [03/04/24 21:06]
>>118
classは「級」でいいはずだけど、「きゅう」ではみじかすぎて
わからんからそのまま「くらす」。

120 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 23:01]
くらす、きさん!!



121 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/24 23:41]
もう「関数」で慣れちゃってるからなぁ。
「機能」と訳したところで
意味がわかりやすくなるわけでもないし。

「正規表現」にしても「関数」にしても
おれにとってはある概念に対するラベルでしかない。

122 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 00:41]
「関数」は一つの名詞なので、
一旦覚えてしまえば
「関数」という訳について不自然さは感じにくい。

でも「正規表現」は「正規」と「表現」の複合語であるから、
正規な表現? という意味不明さはいつまでも残る。

123 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 00:43]
"regular expression" というからには
regular じゃない expression もあるんでしょうか?
たとえばどんなのですか?


124 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 08:08]
>>123
fgrepに書く検索パターン

125 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 11:26]
>>115
プログラミング用語での function は単なる「機能」ではなく、
数学的な(値を返す) function としてのニュアンスが込められているんじゃ
ないのかなあ?

関数型言語ではいうに及ばず、FORTRAN とかでもそんな感じだし、
C だってもともと void 型なんてないし。

# 正規表現と関係ないので sage


126 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 11:34]
「機能」も造語っぽくない?
明治あたりの。

127 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 14:00]
関数が函数の書き換えだと知ったとき、小学校の算数の時間で関数の
説明に「ブラックボックス」という言葉を使っていたのを思い出した。
この書き換えは最悪だと思ったな。

しかし、いくら原語が同じだとしても、関数と機能は日本語としては完全に
別物になってしまっている。function key の function は、やはり「機能」の
意味でないと落ち着かない。

>>122
「正則」は、ほとんど術語としてでしか使われることがないけど、「正規」は
普通の文章でも使われるからね。「正規」と「表現」の結び付きが強くなって
しまう。

128 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 14:00]
expression にしても、「式」とも訳される場合もあって悩ましいことこの上なし

129 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 15:18]
じつは日本語って、語彙が豊富?
まぁ、ほとんど訳語だけど。。。


130 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 16:19]
>>127
> function key の function は、やはり「機能」の意味でないと落ち着かない。

それは「function key」を「関数キー」と読んでる人に言ってくれ。いるのか?

Google で検索しても 163 件しかない上に、関数電卓の「関数キー」
(sin 関数のキーとか) だの「ハッシュ関数のキー」だのばっかりなのだが。




131 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 21:24]
「ファンクションキー」と言ってるのしか聞いたことがないが、この「ファンクション」
は「機能」の意味でないと落ち着かないと言ってるだけだ

132 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/25 22:31]
>>129
自国語で数学的概念を表現できる国は少ないほうだと思われ。
微分、積分、階乗、無理数、有理数、etc...
functionに対する訳で機能と函数で揉めるのは贅沢なことなんじゃないのかなぁ……
ていうか、算数、数学の教科書が日本語だけで完結できること自体、
ほかの国から見ると不思議なことなんじゃないの?

133 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 01:12]
何の話をしてるんだか・・・

134 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 01:48]
では、日本における性器表現についてどうぞ


135 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 02:04]
[まち]んこ

136 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 05:40]
\(藁田\|ワ[ロラ]タ\)

137 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 13:48]
>>135 >>136
こういう日本語の正規表現の使える実装にはどんなのがありますか?

Ruby, 鬼車, jperl, xyzzy, Emacs, あたりは使えると思うけど、ほかには?

138 名前:名無しさん@Vim%Chalice mailto:sage [03/04/26 13:59]
Vim

139 名前:名無しさん@お腹いっぱい。 mailto:yosage [03/04/26 18:15]
perlとかなら
/(ma|chi)nko/i
みたいに i オプションつけることで
大文字小文字を同一視してくれる機能が一般的に普及してますね。
grepとか大抵の性器表現できるツールにはあるみたい。

そこでほしいのが平仮名片仮名同一視。
/[まち][んむ]こ/i
とすれば「マむコ」にも「チンこ」にもマッチしてほしいわけ。
そういう機能がついた性器表現ってどういうツールにございますか?
あと
/ベートーヴェン/i
で検索したら
「ベートーベン」や「べえとおべん」にもマッチしてくれる
ようなのもあるものでしょうか?


140 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 18:53]
>>139
後者は正規表現の範疇ではないような。
前者はあってもよさそうだね。



141 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 19:16]
文字クラスの拡張でしょうか

142 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 20:15]
>>141
日本語用文字クラスってわけね。
しかしそんな日本でしか使えないもんはツールで対応すべきだな。

>>139
>/ベートーヴェン/i
>で検索したら
>「ベートーベン」や「べえとおべん」にもマッチしてくれる

こんなん正規でも正則でもない非正規表現だ。
>>139は正規表現使うのやめた方が幸せになれそうだよ。

143 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 20:25]
>>139 Migemoの辞書をカスタマイズすればできるようになるよ

144 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 21:25]
>>143
そういう問題じゃなかろう・・・

145 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 21:27]
日本語正規表現の使える実装は Ruby, 鬼車, jperl, xyzzy, Emacs, Vim で全てですね?

146 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/26 22:05]
>>145
いいえ。

147 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/27 02:24]
文字クラスとか自分で設定できる正規表現みたいなのが
あればいいんじゃないの。
どうせ perl だって場あたり的に好きなように拡張してるんだから。


148 名前:名無しさん@悩み中 [03/04/28 05:24]
sed ですが、
[[:xdigit:]]\{2\} にマッチする文字列のなかで、
\(61\|75\|6f\) にマッチしないようなものを指定したいとき
どないすればよろしい?


149 名前:148 [03/04/28 05:37]
やっぱり、先に \(61\|75\|6f\) にマッチする奴を退避しておいてから、
[[:xdigit:]]\{2\} にマッチするやつを指定するしかないんかな…


150 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/29 02:16]
誰か、正規表現だけで会話するスレ作ってくれ。




151 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/29 03:26]
/いったい何を会話するというのだ/

152 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/29 04:09]
>>150
それこそ言いだしっぺの法則だろ。正規表現だけで会話したい >>150 が立てれ。

153 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/29 09:51]
駄スレ立てんな。

154 名前:名無しさん@Meadow mailto:sage [03/04/30 10:51]
>>153

$mes153 =~ s/。//;
reverse(split(//, $mes153));
わかた?
結果は、「なんてつたレスだ」




155 名前:名無しさん@お腹いっぱい。 [03/04/30 11:12]
>>154
こうなりますた。
$ perl -e 'quotemeta($var='駄スレ立てんな。'); print reverse(split(//,$var));'
B∧んてぉ洛スμ・


156 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/30 11:29]
>>150

名スレの予感

157 名前:名無しさん@Meadow mailto:sage [03/04/30 14:53]
>>155

jperlじゃないとだめですね。perl用もかきますた。

($var='駄スレ立てんな。') =~ s/立(.+)。/たつ$1/;
while ($var) {
if ($var =~ s/^[\xA1-\xFE][\xA1-\xFE]// or $var =~ s/^.//) {
push(@str, $&);
$var = $';
}
}
print reverse(@str), "\n";


158 名前:名無しさん@お腹いっぱい。 [03/04/30 15:47]
>>156
2chですから、性器表現とこれを用いた強制痴漢ならあちこちに。

159 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/30 21:21]
\hなのはいけないと思います!

160 名前:名無しさん@お腹いっぱい。 mailto:sage [03/04/30 23:49]
\SM(?:性器拡張(?!器具))



161 名前:名無しさん@Meadow mailto:sage [03/05/01 15:28]
>>157
何やってんだろな、漏れ。
($var='駄スレ立てんな。') =~ s/立(.+)。/たつ$1/;
while ($var =~ s/^[\xA1-\xFE][\xA1-\xFE]// or $var =~ s/^.//) {
 push(@str, $&);
}
print reverse(@str), "\n";
で十分だった。この全角文字対応の正規表現は、euc-jpの奴ね。
でもさ、やっぱ正規表現で会話するってむずいよ。>>150よ。



162 名前:名無しさん@お腹いっぱい。 mailto:s/つーか全角空白使ってる時点でダメダメ/sage/; [03/05/01 21:39]
print while s//>>161普通過ぎてつまらん/;

163 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/01 21:48]
>>161
それは正規表現ではなく perl script というのではないだろうか。

164 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/01 21:50]
>>163の的確すぎるツッコミに藁。


165 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/01 21:59]
>>1-164
これら全てが正規表現であることは自明なのであります。

166 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/02 08:30]
Perl正規表現の質問です。

Ascii文字コードは、アルファベット大文字→ちょこっと記号類→アルファベッ
ト小文字の順に並んでるですが、以下のようになるのはなぜですか。なぜ、ア
ルファベット大文字しか出てこない?

$ perl -e 'for(A .. z) {print $_, ", ";}'
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z,


167 名前:名無しさん@お腹いっぱい。 [03/05/02 11:26]
>>166

駱駝本(第二版)の p.103 の脚注 *32 に、

> もし指定された最終値が、マジックによる増加によっては生成できない
> ような値なら、最終値のケタ数を超えない範囲で値を生成する。

と書いてあるけど、違う?


168 名前:名無しさん@Meadow mailto:sage [03/05/02 14:27]
>>167ありがとん。
>マジックによる増加によっては生成できない

というのが分からなかったので、駱駝本(第3版)引いたら、「マジックイン
クリメント:普通の数値と同じようにして、英数字からなる文字列の値に「1
を加える」方法を知っているインクリメント演算子のこと。」だって。Aは、
16進数で41、Zは、5A。5B以下60までは、[、\, ], ^, _, `で、61から小文字。
一つずつインクリメントされて並んでいるが、できないところを見ると、「英
数字からなる文字列」だけをサポートしている演算子なんだね。

第2版の103ページにあたる121ページあたりにも、A .. Zやa .. zの例はある
けど、A .. zはない。


169 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/02 22:35]
文字のインクリメントもちゃんと桁上げされるんよ。

#perl > result.txt
$a = "a";
print ++$a, "\n" while (length $a < 3);

170 名前:169 mailto:sage [03/05/02 22:38]
あ、これじゃ for (A..Z) の説明にはならないな。



171 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/02 22:50]
>>166
全然正規表現じゃなかった・・・。

172 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/04 07:28]
/\x82\xad\x82\xbb\x82\xc1/
sjis


173 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/05 11:59]
>>172
パターンマッチさせる意味は?

174 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/05 18:39]
>>172
1) ネタがないから
2) わし166だので、172に揶揄されて「くそっ」と


175 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/05 18:44]
ちがった、171にバカにされて・・・
      ~~~


176 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/05 19:18]
おまえらみんな(ち|い|う)んぽ。

177 名前:名無しさん@お腹いっぱい。 [03/05/07 16:30]
『詳説 正規表現』を読んでいるようなエキスパートの人に質問です。


「"a" が偶数個、"b" が奇数個含まれる、すべての文字列を表す正規表現」


って分かりますか?

自分は答えを見てもよく分かりませんでした。


178 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/07 17:37]
まずどのような「状態」があるのかを考える。この場合は
 1. aが偶数個、bが偶数個
 2. aが偶数個、bが奇数個
 3. aが奇数個、bが奇数個
 4. aが奇数個、bが偶数個
で初期状態が1でゴールが2となる。
まず最初に1から2に行くには /b/ の1通り。aが来ると4に行く。
4からスタートして1もしくは3を経由し2へ行く最短パターンは /(aa|bb)*(ab|ba)/
以上から /b|a(aa|bb)*(ab|ba)/ が状態2に行き着く最短パターン。←第1段階
次に状態2からスタートして考えると /aa/ で3を経由して2へ戻り、
/bb/ で1を経由して2へ戻り、/ab|ba/ では4へ行ってしまう。
4へ行ってしまった後は先に考えた「2へ行く最短パターン」で帰って来れるので、
2から始まって2に戻るパターンは /aa|bb|(ab|ba)(aa|bb)*(ab|ba)/ となる。
これは0回以上起こり得ることを考慮して第1段階と結合すると
/(b|a(aa|bb)*(ab|ba))(aa|bb|(ab|ba)(aa|bb)*(ab|ba))*/

179 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/07 18:18]
>>177
余裕があれば一度オートマトンに関する本を読んでみて。
www.amazon.co.jp/exec/obidos/ASIN/4320029488/ref=sr_aps_b_1/249-5563000-9397957
の前半はすごくわかりやすいよ。

そこまでしなくても、一度 >>178 たんのいってることを
katsu.watanabe.name/grep/p7.html
みたいな状態遷移図にしてみるといいかも。

180 名前:177 mailto:sage [03/05/07 21:15]
自分がこの問題を見たのは古い UNIX MAGAZINE で、内容を簡単に引用しますと …

偶数か奇数かを調べるには文字の数を2で割った余りが0か1かという
決まった2つを調べればよいため、正規文法で記述することが可能。
なお、この文法では a に関して2つ、b に関しても2つの場合があるので、
2 x 2 = 4 つの記号(状態)を用いる。

A → aB   B → aA   C → aD   D → a
A → bC   B → bD   C → bA   D → aC
A → b                 D → bB

状態 A … a が偶数個で b が奇数個の文字列
状態 B … a が奇数個で b が奇数個の文字列
状態 C … a が偶数個で b が偶数個の文字列
状態 D … a が奇数個で b が偶数個の文字列

以上により答えは

((a|b(aa)*ab)(b(aa)*b)*(a|ba(aa)*b)|b(aa)*b)*((a|b(aa)*ab)(b(aa)*b)*ba|b)(aa)*

となる。

正規表現でうまく表現できない問題に当たったときは、いったん正規文法で記述してから
正規表現に変換すると解決できる場合も多い。




181 名前:長いので分割。 mailto:sage [03/05/07 21:17]
… だそうです。

果たして↑の長い正規表現が >>178 さんの答えと同じものを表しているのかどうか
分かりませんけども。

>>179
有用な本と URL の紹介、ありがとうございました。


それにしても最初にパッと見て「この問題は有限個の状態で表せる」って思いつくかなぁ?
不思議だ。


182 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/07 21:36]
>>181
> それにしても最初にパッと見て「この問題は有限個の状態で表せる」って思いつくかなぁ?
それはパッと見というよりは、冷静に分析してわかるものでしょ。
慣れれば一瞬で分析できるようになるかもしれんけど。

183 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/07 22:50]
>>178,180
それは「aとbだけからなる文字列」について?


184 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 00:00]
>>183 んなもん s/[ab]/[^ab]*&/ すりゃ良いだけじゃん

185 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 03:51]
>>184
それって、正気表現でつか?


186 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 04:49]
>>183 のために [^ab]* をはさみまくってたら、

「長すぎる行があります!」

っておこられたよ・・・


187 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 10:42]
/[^ab]*(b|a([^ab]*(a[^ab]*a|b[^ab]*b))*[^ab]*(a[^ab]*b|b[^ab]*a))([^ab]*(a[^ab]*a|b[^ab]*b|[^ab]*(a[^ab]*b|b[^ab]*a)([^ab]*(a[^ab]*a|b[^ab]*b))*[^ab]*(a[^ab]*b|b[^ab]*a)))*/

188 名前:名無しさん@お腹いっぱい。 [03/05/08 12:54]
>>187
それで baaabaaab がまっちすんの?

189 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:27]
以下のようなデータから、著者の部分(最後の括弧から括弧まで)を
取り除きたいと思います。

木立(こだち)のなかに(夏目弱石)
山の上の芋粥(いもがゆ)(芥川蛇の介)

s/(.+?)$//;

ですとうまくいきません。perl5.6で、文字コードはeucです。
webprog板のPerl初心者スレで聞いたのですが、どうも解決しないのです。
どうしたらよいか教えていただければ幸いです。


190 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:40]
>>189
セイキヒョーゲンの問題ではなくパールの問題っぽいですね。
そっちのスレ行った方がよいかも。
できるなら「うまくいきません」を再現させる
できるだけシンプルなコードを添付してほしいな




191 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:41]
>>189
プログラム技術板にPerlの質問スレがある。webprogに特化したこと以外はそっ
ちの方がいい。

s/([^()]+?)$//;


192 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:44]
Perl の正規表現では ( ) は、後で \1, \2, ... にマッチさせるための
メタ表記だから、括弧そのものにマッチさせたければ \( \) と書かなければ
ならない。(egrep や emacs とは逆)

193 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:44]
>>190
では、Perlスレ行ってきます。って、unix板にはなかったんで、
プログラム板ですね。ありがとございますた。




194 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 13:47]
あれれ板探してたら、2つもレスが。
>>191
それ、jperlなら動くんでしょうが、perl5.6ではだめでした。
>>192
いや、全角括弧なんです。


195 名前:名無しさん@お腹いっぱい。 [03/05/08 13:53]
>>192
それは \x28 や \x29 の場合だけでしょう。
今でてきてるのは \xa1\xca と \x1a\xcb。
ちなみにperlの最短一致は
マッチの先頭位置を後ろにずらす効果がないので注意。

($b="abcabc")=~s/b.*?c$//;
print "$b\n"; # output "a"

189の要望はここで"abca"を出してほしいということで叶わない


196 名前:189 mailto:sage [03/05/08 14:10]
>>195
>perlの最短一致は
>マッチの先頭位置を後ろにずらす効果がない

なるほど。では、>>189のコードは、

木立
山の上の芋粥

を出力してもいいはずですが、何も出力しない(何にもマッチしない)んです。
どうしてですか。よろしければ教えてくらさい。


197 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 14:14]
s/(.+)(.+)$/\1/;

198 名前:189 mailto:sage [03/05/08 14:19]
>>197
これだと、

木立
山の上の芋粥

になってしまいます。求めているのは、

木立(こだち)のなかに
山の上の芋粥(いもがゆ)

です。


199 名前:197 mailto:sage [03/05/08 14:22]
マジ? 手元の Perl 5.005_03 だと求めているのになるのだが・・・

200 名前:189 mailto:sage [03/05/08 14:28]
>>199
すみませ〜ん。
求めているものになりました。いろんなスクリプト混ざり合ってたので
混乱しました。
(.+)が最長一致するから(.+)でいいってことに気づきませんでした。





201 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 14:45]
perlの正規表現と日本語文字列との相性の悪さを
実感する問題だったなあ

202 名前:192 mailto:sage [03/05/08 14:50]
本当に全角だったのか。失礼。だとすると、/(/ が EUC の 2 バイト目と
文字に一致するとは限らないので注意。全角文字の 2 バイト目と次の文字の
1 バイト目がそれぞれ \xa1 と [\xca-\xcb] にマッチする場合があるので、
文字列「検便」\b8\a1\xca\xd8 にも「(」がマッチしてしまう。

日本語 EUC の 1 文字 にマッチさせたいなら、厳密には
(\x8f?[\xa1-\xfe]{2}|\x8e[\xa1-\xfe]|[\x00-\xff])
にマッチさせなくてはならない。

Perl6 の国際化された正規表現が普及して、こんな知識は不要になって
くれれば一番いいのだが…。

203 名前:192 mailto:sage [03/05/08 14:56]
この例の場合、最後の括弧の中は全角ひらがなしか入らないから関係ないけどね。

204 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/08 15:51]
5.8ならuse utf-8; use Encode;して適切なエンコード指定でファイル読み込ませれば解決するぞ。

205 名前:名無しさん@お腹いっぱい。 [03/05/08 21:50]
61.210.205.4/
これなんだろ@@@

206 名前:名無しさん@お腹いっぱい。 [03/05/08 23:46]
WebProg板の「正規表現道場@2ch Part2」はご存知?
pc2.2ch.net/test/read.cgi/php/1038146241/

207 名前:189 mailto:sage [03/05/09 15:02]
>>206
知ってます。最近、書き込み少ないので、こっちにしました。
あっちでは、以前、いろいろ答えてあげてたんですが。
実は、他のやり方ならいろいろ考え付いたのですが、
s/(.+?)$//;
がなぜだめかが知りたくて質問したのでした。
>>195だけがその質問に答えてくれました。そいえば、それも
らくだ本で読んだ覚えあったなぁと。しかし、「最短一致がマッ
チの先頭部分を後ろにずらしてくれない」という理由ですと、
なぜ、「木立(こだち)のなかに(夏目弱石)」が、「木立」
にならないか、いまだに不明です。($b="abcabc")=~s/b.*?c$//;
で$bが'a'になるんだから、そうなってもいいはずですよね。

# でも、3つのスレで「()をエスケープしろ」っていう返事をもらったのにも
# びっくり。漏れは、navi2chなので、半角と全角は一目瞭然ですが、IEで見
# てみたら、たしかに女滋養に見えますた。


208 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/09 15:32]
女滋養(;´Д`)ハァハァ

209 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/09 17:39]
生粋のプログラマーなら日常的に半角全角の違いがすぐ分かる環境を望む。
そうじゃない人はあまり気にしないので女痔用に見えても兵器。


210 名前:名無しさん@Meadow mailto:sage [03/05/09 17:52]
女痔用 (´;。;△;。;)キモ!!!!!!!!!!!!!!!



211 名前:名無しさん@Meadow mailto:sage [03/05/09 21:33]
>>207
漏れは、navi2chでも迷ったっぞい。



212 名前:189=207 mailto:sage [03/05/09 22:20]
>>211
はっきり言っておくんなさい。
たすかに、fontの問題かもすれんですよ。
だかーら、記号類は半角とか全角とか注釈つけとけと…
でもって、半角カタカナなんか問題ない時代になったんだなー、と。


213 名前:名無しさん@お腹いっぱい。 [03/05/11 04:17]
半角か全角かをいちいち説明されないと違いの分からないような
素人さんにはそもそも質問なんかされてないんですよ

214 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 15:57]
189が意図的に使い分けてるという保証もなかったわけだが。

215 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 16:17]
>>214
はじめから euc と断ってたし、
対象テキストデータとか試しに提示したダメコード片を良く見れば、
意図的に使い分けてることは十分想像できたと思うが。
質問の仕方や内容からも半角全角混同してるようなレベルの質問とは思えなかった。

つうか、>>207 は何をいまだにハマってるんだ?
s/(.+?)$//; なら「木立」になるから問題なかろう?

216 名前:191=214 mailto:sage [03/05/11 16:20]
>>215
一応そう想定して答えた。

217 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 16:40]
>>216
釈迦に説法か。スマソ

218 名前:189=207 mailto:sage [03/05/11 18:24]
>>215
いえ、それが、全行出力されちゃうんです。
ちょっと、やってみていただけませんか。(インデントはわざとしません。)
---
while(<DATA>) {
chomp;
s/(.+?)$//;
print "$_\n";
}
__DATA__
木立(こだち)のなかに(夏目弱石)
山の上の芋粥(いもがゆ)(芥川蛇の介)


219 名前:215 mailto:sage [03/05/11 18:36]
>>218
ん〜、なんないよ (5.005_03) 。
5.6 を試す環境が無いので申し訳ないでつが、Perl のバージョンの問題?

220 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 19:16]
>>218
5.6.0 で試したらそのまま出ますた。
これまでの経緯をちゃんと読んでないんだが、 s/([^)]+)$//; じゃダメ?




221 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 19:23]
>>220
それだと、 [^)] の部分は [^\xa1\xcb] なのでダメだと思われ。

>>204 の方法だとうまくいくようになるの?

222 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 21:08]
>>218
5.8.0だと、191の式でうまくいくんだがなぁ。

while(<DATA>) {
chomp;
s/([^()]+)$//;
print "$_\n";
}
__DATA__
木立(こだち)のなかに(夏目弱石)
山の上の芋粥(いもがゆ)(芥川蛇の介)


木立(こだち)のなかに
山の上の芋粥(いもがゆ)

223 名前:189=207 mailto:sage [03/05/11 21:30]
追試どうもです。

>>219
古いマシンに5.005_03(5.005_03 built for i386-linux)もあったのでやっ
てみたら、奇妙なことに。
euc-jp-dos、shift_jis-unix → OK
euc-jp-unix、shift_jis-dos → 行全体が出てくる

v5.6.0 built for MSWin32-x86-multi-threadおよびv5.6.1 built for
cygwin-multiでは、どれでもだめです(行全体が出てくる)。文字コードutf8
にしても同じ。

>>222
こりゃもう5.8にするべきですかね。




224 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/11 21:31]
>>222
いやいや、たまたまうまくいっているように見えるだけでしょ。
>>202 さんのを参考にしる。

225 名前:195 mailto:sage [03/05/12 09:32]
>>218
s/(.*?.)$//;
にしとけ
perlのバグだ
暇ならソースのMINMODあたり追いかけて

226 名前:189=207 mailto:sage [03/05/12 21:13]
>>225
ありがとん。「。」毎に改行入れようとして、s/(.+?。)//;やってみたが、こ
れすらできんかった。結局、perl5.6以上はjperlないから日本語処理を中心に
してる場合は、使えないってことかなぁ。もち、~ohzakiさんとこに書いてあ
るような注意をしたり、半角文字で置き換えたりすれば使えるげど、面どい。



227 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/12 23:01]
>>226
5.8にしてEncodeつかう。

228 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/13 02:04]
>>226
> 結局、perl5.6以上はjperlないから日本語処理を中心にしてる場合は、
> 使えないってことかなぁ。

違うっしょ。

229 名前:189=207 mailto:sage [03/05/13 07:23]
>>227
やってみまつ。
>>228
じゃ、jperlでできるs/.+?[。!?]/$1\n/g;あたり、どやってやる?
めんどいでしょ。




230 名前:189=207 mailto:sage [03/05/13 07:24]
あら、s/.+?[。!?]/$&\n/g;だった。




231 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/13 11:05]
>>229
あぁ、そういう話か。それはその通りですね。

でも、それは 5.8 の Encode とやらを使うと解決するってことなのでは。
っつーか、漏れは 5.8 動かせる環境無いので確認しようがないんでつが、
誰一人として Encode が一体何者なのか説明しようとしないのは何故?

232 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/13 11:39]
>>231
use utf-8; use Encode;
my $ENC = 'euc-jp'; # or 'cp932'
binmode STDOUT, ":encoding($ENC)"; binmode STDIN, ":encoding($ENC)";

普通に標準入出力にアクセスすればOK。スクリプト内に日本語書くときはUTF-8で。
っていうかperldoc嫁

233 名前:名無しさん@お腹いっぱい。 [03/05/14 01:43]
>>232
perl 5.6 では不可能ということか?

234 名前:189=207 mailto:sage [03/05/14 08:50]
>>232
まだ、5.8を試してないんですが、>>232って、euc-jpの端末でeuc-jpのスクリ
プト書いて、perlにutf-8で処理させるってことですね。utfサポートは、5.6
からあるので、mule-ucs+bdfフォントで、emacs上でprocess-coding-system
(inputもoutputも)もutf-8にして、やってみたけどだめですた。

私が問題にしているのは、[](文字クラス)や+?、*?(最短一致)がマルチバ
イトに対応しているかどうかということなのですが・・・


235 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/14 10:15]
>>234 5.6時代から既に対応している

236 名前:189=207 mailto:sage [03/05/14 10:57]
>>235
[](文字クラス)をテストしてみたけど、だめです。
utf-8で以下のスクリプト実行して見れ。jperlではOKですが・・・
---------
while(<DATA>) {
chomp;
while (s/.+?[。!?]//) {
print "$&\n";
}
print;
}
__DATA__
utf-8で処理させて下さいね。5.6でね。utfサポートは、
5.6からあるけど、このスクリプトだめぽ!>>235は、何が
5.6時代から既に対応しているって言ってんの?変だよ。


237 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/14 11:10]
>>236 use utf8; してる?

238 名前:189=207 mailto:sage [03/05/14 11:24]
>>237
してなかったっす。
みなさん、ごめんなさ。


239 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/14 17:10]
perl 質問スレにするなよ。

240 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/15 19:55]
というわけで、これにて終了。
正規表現スレはここまでです。
あれ?




241 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/16 01:42]
単語に「マッチしない」のは
どうやれば? ^\<word\>
じゃないし。


242 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/16 03:07]
>>241
そりを正規表現(だけ)で実現するのは難しいのでは?

普通は、grep なら -v とか、スクリプト言語なら !~ /word/ とかするんじゃないかと。

243 名前:189=207 mailto:sage [03/05/16 08:24]
>>241
perlの拡張正規表現を使えば出来るよ。
/^(?!.*word)/



244 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

245 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/24 22:45]
オ来リーの者じゃありませんが・・・

『詳説 正規表現 第2版』

Jeffrey E. F. Friedl 著
田和 勝 訳

2003年5月発行 -- 5月27日発売
464ページ
本体価格5,400円
ISBN4-87311-130-7

テキストやデータの処理に欠かせない強力なツールとして瞬く間
に普及した「正規表現」。現在ではPerl、Java、VB.NETやC#など
数多くの言語やツールに標準で装備されています。その幅広い可
用性、柔軟性と比類ない強力さにもかかわらず、実際に正規表現
を使いこなすことは難しいです。本書は正規表現の概念を詳細に
掘り下げる一方で、数多くの言語やツールの実例を示しながら、
正規表現についての理解を深める解説書です。第2版では、豊富
な実例を使い、詳しくていねいに解説するスタイルはそのままに、
Perl5.8の新機能に加え、Javaと.NETの正規表現にもそれぞれ独
立した章を設けるなど、全編にわたって大幅に加筆がなされまし
た。正規表現の本質を読み解く決定版です。とくに正規表現を使
いこなしていると自負している人にほど読んでほしい本です。


246 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 00:29]
あれ?今日買ってきたんだけど27日発売だったのね…

247 名前:名無しさん@お腹いっぱい。 mailto:age [03/05/25 00:43]
>>246
つーことで発売記念age

248 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:23]
素数にマッチする正規表現募集。

249 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:38]
>>245
第1版と比較してのレビューきぼんぬ

250 名前:名無しさん@お腹いっぱい。 mailto:半額きぼんぬ sage [03/05/25 03:44]
>>249
> 2003年5月発行 -- 5月27日発売
とあるからまだ無理なのでは



251 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:49]
>>248
正規表現だけでなく、なんかしら言語使ってやればよい。

252 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:56]
>>248
何故敢えて茨の道を行くのか?

253 名前:名無しさん@お腹いっぱい。 [03/05/25 05:07]
>>245
これの第1版買ったのですが、いまいち難しかったです。
もっと易しい本ってないですか?

254 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 05:35]
>>253
Ruby の初・中級者なら、「Ruby Magic―Rubyで極める正規表現」はお勧め。

255 名前:245 mailto:sage [03/05/25 10:21]
>>249
第1版を持ってないので比較は出来ないっす。
# 買おうと思ったら第2版が出ることを知ったので待ったのだ。

ここに特徴や目次が紹介されているので見てもらうとして
  ttp://www.oreilly.co.jp/BOOK/regex2/
  ttp://www.oreilly.co.jp/BOOK/regex2/contents.htm

まえがきから第1版との違いを判断すると
  - Unicodeのちょっとした解説
  - Perl5.003からPerl5.8対応に
  - Java1.4のjava.util.regexと、その他6つの正規表現パッケージの比較
  - .NET framework正規表現の特徴と問題点、M$のドキュメント(貧弱らしい)の補足
のように言語サポートが新しくなった/増えたって感じ。

最初はHTMLのサンプルを少々追加する程度の予定(3ヶ月の見込み)だったみたいだけど、
結局は2年の歳月をかけて全面的に加筆修正することになったそうだ。

難易度は第1版と変わらないのではないかな?
# 読み易くなってるのかもしれないけど。。
>>253の期待には応えられないと思う。
> とくに正規表現を使いこなしていると自負している人にほど読んでほしい本です。
という宣伝文句があるくらいだしね。

>>250
いや、24日に買えたのよ。

256 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 11:05]
今日発売か。
昼休みに買ってくるか。


257 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:10]
>>256さん、どうですた?


258 名前:249 mailto:sage [03/05/27 21:28]
>>255 さんのと、今日立ち読みした感じで、第2版も購入することにしますた。
そういえば、翻訳者 (監訳者) が変わってたんですね。

259 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:29]
sed のタグ付き正規表現についてちょっと教えれ。たとえば、

{________I'm_dreaming_of_a_White_Christmas_}
{_Just_like_the_ones_I_used_to_know__}
{____Where_the_tree_tops_glisten_}

の前後の余計な _ のトリミングをしようと思って
sed 's/{\(_*\)\(.*\)\(_*\)}/{\2}/g'
とやっても意図した結果にならない。\2 をうまくマッチさせる方法は?

まぁこの例なら簡単に逃げられる - たとえば sed 's/{_*/{/;s/_*}/}/' -
わけだが、apache の log とかの簡単なパース(並び替えとかそんな程度)を
タグ付き正規表現でさくっと処理できれば楽でうれしい。よろしく。

260 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:38]
二個目の*がlongest matchしようとして
3個目の*にmatchさせたいであろう_まで持っていってしまうのが原因。

sed -e 's/{_*\(.*[^_]\)_*}/\1/'



261 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 00:59]
'<,'>s@^@//@

262 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 01:03]
最少マッチって perl とか ruby にしかない?
sed, grep 等の伝統的 tool にはないの?

263 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 01:07]
>>262
ないよ

264 名前:名無しさん@お腹いっぱい。 [03/05/28 14:45]
>>262
grepに最小一致の機能があったとして
それの魅力はイッタイ何なのだろうか?


265 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

266 名前:262 mailto:sage [03/05/28 20:42]
確かに sed では使っても grep では使わないかも。
いや、でも後方参照する時に必要なこともありえますね。


267 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/29 10:14]
>>257
昼休みにいきつけの書店にいったが売ってなかったんで。
帰りに別の書店で買った。
でもまだ読んでない…
通勤時間に読むっつーてもあれを毎日持ち歩くのは
重たいしなぁ。


268 名前:名無しさん@お腹いっぱい。 [03/05/30 21:59]
文字列中、丸括弧(全角、半角問わず)で閉じられた部分を取り出す表現を考えているけど、うまくマッチしてくれない。
(丸括弧の中に丸括弧は含まない。Perlの正規表現を使用)

$string = '(22(1)';
if($string =~ /[((]([^()()]*)[))]/){
print $1;
}
else{
print "No match..";
}

この場合は"1"がマッチするのを期待しているのだけど、なぜか"22"の部分がマッチした。
OS(UNIX/WinXP)、Perlのバージョン(5.0/5.8)の異なる環境で同じことを確認したけど、結果は変わらず。
さらに、文字コード(Shift-JIS/EUC)の違いでも、結果は変わらなかった。

"1"をマッチさせる別の表現はないですかね?

# 全角"("の中にどうも半角")"の文字が隠れてるのかなぁ?(あくまでも推測)



269 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/30 22:42]
>>268
おめな、2byte文字と1byte文字が同じに扱われると思ってるらしいな。たぶん、
文系のドキュソだな。しかも、すぐ上で2byte文字コードの話出てたの見てね
えな。こいう、初心者質問は、webprogのPerl初心者スレ逝け。



270 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/05 14:26]
>>268
Perl5.8.0 + UTF8 でやったら 1 になったよ。




271 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:10]
[ ] のなかに '-' と ']' の両方を入れたい場合はどうすればいいのですか?

272 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:20]
>>271
何で?

273 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:29]
>>271
[]-]

274 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/17 23:25]
>>271
!.-[

275 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/03 21:13]
保守

276 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/08 11:49]
regexp ml盛り上がってますね。読んでて楽しい。


277 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/08 14:02]
このスレはいつからまともな人たちをヲチするようになったのですか?

278 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 21:26]
すいません、テキストファイルの中の .bananaなどの単語(行頭ではなく)の先頭が
ドットがあるものだけをgrepで抜き出したいのですが、jp.appleのような単語までひっかかって
しまい上手く絞り込めません。

アドバイスをお願いします!!

279 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 21:54]
>>278
\b?\.\w+?
で、どうじゃろ?

280 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 22:44]
>>279
すいません、なんか上手くいかないです。
ls -laでディレクトリ内の全ファイルを表示して、grepで隠しファイルだけを抽出したかったのですが。



281 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 23:34]
ls -la | grep ' \.'
ではあかんの?


282 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 23:57]
>>281
行のどこかに"."があれるとヒットしてしまうんです

283 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:28]
ls -la | grep '^\.'
こういうこと?

284 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:28]
>>282
とはいえ、"."って、ファイル名にしかでてこないよね?
>>281 をよーくみる。


285 名前:283 mailto:sage [03/07/13 00:30]
間違えた。

ls -1a | grep '^\.'
これか
ls -la | grep ' \.'
これだな。下は余計なものを拾う可能性もあるが。

286 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:31]
ls -d .*
なんてね。


287 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:32]
あ、正規表現スレだった。すまん。

288 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 02:00]
ヤハリココハオモッテタトオリバカバッカリダッタナ(プ

289 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 02:57]
ls -la | awk '$9 ~ /^\./{print $0}' はどうよ。

290 名前:名無しさん@お腹いっぱい。 [03/07/13 11:30]
>>280 ふつーそういうときは ls つかわず findつかえ。
find ./ -type f -name "\.*" -print




291 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 14:36]
(())

292 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 11:38]
>>290 ふつーそういうときは >> つかわず >> つかえ。

293 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 19:04]
backreferenceを前方参照と訳したのはなぜですか?


294 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:19]
後方参照としている訳もあるよ。
まぁ、現在の位置よりも前を参照するという意味では
日本語的には前方参照であってると思う。
ようするに「今いる位置より戻って参照」って意味になるんだから。

んでも、意味を考えて訳すなら「戻って参照」とか、どう?

295 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:32]
>>294
ちょっと前にCスレで話題になったんだけど、Cで「前方参照」といった場合の前方って、
ファイルの終端方向を指す。「ひどい訳語だ」ってことで話は終わったんだけど、
正規表現でも混乱が見られるしなんかいい言葉ないもんかねえ。

日本語では時間を表す文脈で「前」にまるで正反対の意味があるからよくないのだと思う。
「以前」だと過去だし「前進」だと未来だし。

あとこれはすれ違いか? そうだよね。すまん。

296 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:41]
>>279 >>281 >>283 >>284 >>285 >>286 >>287 >>289 >>290

みなさま、ありがとうございます。

シングルクォーテーションに空白が使えたり、
アッパーチルダとハット(キャレット?)の区別を知ったりと、
正規表現の難しさを知りました。

今、「テキストデータ料理学」っていう古い本を読んでいるのですが、
オライリーの正規表現本は買ったほうがいいですか?

(もう2〜3週間前にオライリーのサイトでカタログを注文したのに、
まだ来ない…)

297 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 22:23]
おれは初版も新しいのも持ってるけど、自分の知識に自信がないうちは
お薦めしない。もちろんあったらあったで便利だけど。

やっぱり、「俺、正規表現バリバリだぜーYAH」状態で買って読んで
目からうろこ落ちまくり感を堪能するのがいいんではないかと。

298 名前:名無しさん@お腹いっぱい。 [03/07/14 23:31]
>294
するってえと、正規表現的には日本語で前方参照あるいは後方参照と書いてあったら
どっちもbackreferenceと思えってわけだぁね。
>295
計算機分野だと「前方」という言葉はforwardの訳語というのがあたりめえだと思ってたから、
正規表現関係だと、「前方参照」がbackreferenceのことだっていうのがわかんなくて
難儀したってわけよ。


299 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 23:33]
>>297
>>296は学ぶ意欲を持っているから、今のうちに買っておいて損はないと思う。
むしろ薦める。
オイラリーはハズレが少ないからな。

300 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 23:35]
>>298
俺はperlから入ったから後方参照が当たり前かと思ってた。
他言語使うようになってから吃驚したってわけよ。



301 名前:298 mailto:sage [03/07/14 23:43]
perl5の日本語マニュアルで、「前方参照」を "lookahead assertion"の訳語として
使っているやつがあった。

(?=regexp) 長さの無い、前方参照位置指定子。
(?!regexp) 長さの無い、前方参照否定位置指定子。

英語だと

(?=pattern) A zero-width positive lookahead assertion.
(?!pattern) A zero-width negative lookahead assertion.

わけわかんねぇな(w


302 名前:298 mailto:sage [03/07/14 23:48]
ありゃりゃ?

(?<=pattern) A zero-width positive lookbehind assertion.
(?<!pattern) A zero-width negative lookbehind assertion.

"lookbehind assertion" の訳語って何だ?


303 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 00:32]
「俺の背後に立つな」
デューク東郷の格言だろ。

304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 00:35]
lookahead 見越し
lookbehind 見返り

305 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 01:01]
前後不覚だな。

306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 03:12]
>>296
>オライリーの正規表現本は買ったほうがいいですか?

持ってなくても覚えられるし、
エディタのサーチとか grep とかで実験しながら
感覚的に慣れるのも悪くないんじゃない?

ただし emacs で覚え始めるのはすすめない。
backslash で混乱する。

307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 07:21]
>>297
>>299
>>306
ちょっと大きな本屋に行って立ち読みしてみます。
ありがとうございました〜

308 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

309 名前:名無しさん@お腹いっぱい。 mailto:age [03/07/17 13:35]
>>308
二度と目を覚ますな。


310 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん



311 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/20 21:36]
さげ保守

312 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/27 22:01]
OOはもうすぐ1.1出るけど、MSWORDよりセキュリティ大丈夫かな?
pc2.2ch.net/test/read.cgi/bsoft/1055292975/392


313 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

314 名前:高校生 [03/08/02 17:12]
boo
baa
baz
っていうテキストが例だとして、sedを用いて、
booまたはbaz、っていう正規表現はどうなるの?
rubyやperlならパイプ記号で条件和の表現が出るけど、
同じように書いてもsedに誤解されてしまう。

315 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 17:52]
>>314 ん? \|使えば良いのでは


316 名前:高校生 mailto:sage [03/08/02 18:06]
sed 's/boo\|baa/hoge/g' ./hage.txt
とかだとやっぱりだめなんすよね。
「boo」とかの単語の括り方がよくわからんのです。

317 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 20:53]
GNU sed 4.0.7版 ではそれでもできてるけどな。
sed 's/\(boo\|baa\)/hoge/g' これでどう?


318 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 22:07]
>>317
gsedならできるがsedは食ってくれない。

319 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/03 01:09]
単一の正規表現じゃなきゃいかんの?
sedと決まってるなら
sed -e 's/boo/hoge/g' -e 's/baa/hoge/g'
でいいんちゃう?

置換後の文字列と置換前の文字列の片方とで重なりがある場合
どうするかひとしきりモメたりする ↓↓↓ のがお決まりだな。

320 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/03 09:52]
単一の正規表現でないと記述が冗長で見た目がキモイ、
っていうのはあると思うよ。
おいらはインストール直後のFreeBSDの環境構築をスクリプトに任せたくて、
結局シェルスクリプトにawkな記述を書いて解決した。
カーネルの再構築にしても、/etc/下の記述にしても、要はテキストの置換なわけで。
本当はrubyがFreeBSDの/usr/bin下にあるようなご時世だったら
楽ができるんだけど、そこら辺は個人的な勉強不足だなぁ。



321 名前:名無しさん@お腹いっぱい。 [03/08/13 19:13]
{a,b}上の言語Lが
『aaで開始し、かつ、bbを部分列として含む』という条件を満たす語からなるとき
Lを表す正規表現ってどうなるの?
L=aa(a*b*+bb)* ?

322 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 20:45]
L=aa(a+b)*bb(a+b)*

323 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 22:05]
>>321
*+ ???

324 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:05]
>323
'+'より'|'のほうが普通かな。
L=aa(a|b)*bb(a|b)*

本来的には連接、選択、閉包が表現できればいい。


325 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:08]
L ::= aA
A ::= aB
B ::= aB | bC
C ::= aB | bD
D ::= ε | aD | bD


326 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:34]
.*
何にでもマッチする最強の正規表現です!


327 名前:名無しさん@お腹いっぱい。 [03/08/13 23:50]
>>326
ドットが含まれてなかったらマッチしない罠


328 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:53]
キター

329 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 00:13]
ageてるし、ネタと見た。

330 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 23:29]
>>329
しね!



331 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

332 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

333 名前:名無しさん@お腹いっぱい。 [03/08/28 20:12]
うまづら。

334 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/02 03:30]
ほす。

335 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/14 04:27]
☆湯

336 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 13:49]
[ruby-list:38393] じゃないけど、[a-z] みたいな文字クラスの表現は、
EBCDIC とかだと「意図した通り」には動かないと思うんだけど、
ASCII か ASCII を包含したキャラクタセットという前提で書くべきものなの?

337 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 14:08]
>>336
[:lower:] とかは使っちゃだめ?

338 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 15:34]
>>337
あ、いや、質問が悪かったですね。
範囲指定する文字クラスはどうあるべき (書くべき) か?っていう話です。

ていうか、 re_format(7) を私の拙い英語力で読んでみたところ、
ASCII コードの並びを前提とするような文字クラスの範囲指定は、
portable じゃないからやらない方が良い、ということのようですね。

というわけで、極力 >>337 さんのみたいな文字クラス指定を使った方が良い、と。

339 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/20 10:41]


340 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/08 15:50]
保守



341 名前:名無しさん@お腹いっぱい。 [03/10/12 16:53]
vimで"DEL"という文字列が含む行で、"DEL"以下を削除したい場合はどうしたらいいでしょうか?

342 名前:名無しさん@お腹いっぱい。 mailto:sage :s/DEL.*$/ [03/10/12 17:15]
スレ違い。


Vim6 Part6
pc.2ch.net/test/read.cgi/unix/1058706125/

343 名前:名無しさん@お腹いっぱい。 [03/10/13 01:12]
:%s/DEL.*//


344 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/13 15:10]
>>343
サンクス、すみません。

345 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/18 17:51]


346 名前:名無しさん@お腹いっぱい。 [03/10/21 23:12]
>>343
DELは残したい場合はどうすればいいですか?

347 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/21 23:24]
:%s/DEL.*/DEL/

348 名前:名無しさん@お腹いっぱい。 [03/11/05 11:20]
MS-DOSが使われていた頃に、"mifes"と言うエディターが有った。
そのマニュアルに1頁ほどの正規表現の説明があって、自分は最初に、それで
覚えて使い出した。
使い始めの頃は、何回も間違えたけど、少しづつ慣れてきた。

自分の周りを見ても、プログラマを何年もやっていても正規表現を知らない
人は、結構いる。
一旦、覚えてしまうと非常に便利だと思うんだけど。

349 名前:名無しさん@お腹いっぱい。 [03/11/05 17:48]
正規表現で俺の存在を抹消してくれ。

350 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/05 19:01]
s/俺の存在//g;



351 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/05 20:10]
gsub!(/俺の存在/, "")

352 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/18 18:31]
捕手

353 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/19 01:38]
        rー、
    」´ ̄`lー) \
    T¨L |_/⌒/
     `レ ̄`ヽ〈
       |  i__1
     _ゝ_/ ノ
      L__jイ´_ )
        |  イ
         |  ノ--、           r'⌒ヽ_
        ゝ、___ノ二7  /´ ̄l、_,/}:\
         |ーi |   l_/ /__ィ::.  ゝ~_ィ´:; ,ゝ
        __〉 {      (T´ |1:::.  \_>、};;_」
       'ー‐┘       ! ` ̄''ァ一 、\ ヽ}  ← 保守
               〈` ̄ ̄^`¬ノ .::〔 ̄´
                   1  ヽ   .:::レ  ヽ、
                |_イー-、_;;j|_:.   ゝ、
                __,,,... -- |. {―――‐フゝ、   〉 -- ...,,,__
        _,, -‐ ´       ,r|__ト,    1ニノ ー'´       ` ‐- ,,_
    , ‐ ´         └―'´                     `


354 名前:名無しさん@お腹いっぱい。 mailto:sage [03/11/19 09:17]
>>353
それ捕手じゃなくて投手やっ!www

355 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 19:24]
別のスレからの引用
ps ax |grep '[s]shd'
とやると、grep自身の行にヒットしないそうだけど、なぜ?
sってメタ文字でもなんでもないのに。

356 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 19:30]
なぜって言われても、自明だが。

357 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 19:33]
grep sshd と何が違うの?

358 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 19:35]
あ、ごめん、わかった(w


359 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 19:36]
grep sshd だと、ps の出力に含まれる "grep sshd" の "sshd" がマッチする。

grep '[s]shd' だと、ps の出力には "grep [s]shd" が含まれるが、
この "[s]shd" は、[s]shd にはマッチしない。よね?わかる?

360 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/04 23:59]
なるほど。トリックだな。




361 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/05 10:59]
まあバッドノウハウだとも思うけどナー
www.namazu.org/~satoru/misc/bad-knowhow.html


362 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/05 13:26]
そこまでのものではないと思うけど、
この例だと、頭の中でpsの出力まで加工しちゃうからな(w


363 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/05 20:33]
grep -v grep でええやん。

364 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/30 00:05]
muttのaliasで
    alias keyword Name <mailaddress>
みたいなフォーマットで並んでいるファイルを
    alias keyword <mailaddress> # Name
に整形しようと思い,
    cat alias | sed 's![[:space:]]*alias[[:space:]]*\([^[:space:]]*\)[[:space:]]*\(.*\)[[:space:]]*<\(.*\)>!alias \1 <\3> # \2!' > alias.new
としました.

上手く行くんですが, "#" の位置が行ごとにバラバラなのが気持ち悪いです.

そのファイルで "#" 以前の文字数が一番長いものを調べ, そこに合わせて
その他の行の "#" 以降を持ってくるようにするにはどうすればいいんでしょうか?

365 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/30 00:14]
sedでやれってか?
漏れはへたれなので、Perlなどを使ってしまうが(w


366 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/30 00:28]
>>364
2パスでやれば?

367 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/30 09:20]
  2パス?

368 名前:名無しさん@お腹いっぱい。 mailto:sage [03/12/30 16:05]
>>367
"#" 以前が一番長いのを調べてから、それに合わせて整形し直せば。

369 名前:名無しさん@お腹いっぱい。 mailto:sage [04/01/11 21:57]
>>364
70桁でそろえる場合

sed ':a /.\{70\}\#/!bc; b; :c s/\(.*\)\#\(.*\)$/\1 \#\2/; ta'

亀ですが、こんなんでどうでしょう


370 名前:名無しさん@お腹いっぱい。 mailto:sage [04/01/11 22:21]
決め打ちでいいなら何の苦労もないわけで。



371 名前:名無しさん@お腹いっぱい。 mailto:sage [04/01/14 23:40]
>>369
反則技。gawk で。sed ではどうやっても出来ないような気が……(_ _;)
# sed でできるのか?

{
a=index($0,"#");
if(a>best) {
best=a;
}
c[FNR]=$0
}

END {
for(i=0;i<=NR;i++){
x=index(c[i],"#");
if(x && x<best) {
for (j=x;j<best;j++) {
gsub("#"," #",c[i]);
}
}
print c[i]
}
}


372 名前:名無しさん@お腹いっぱい。 mailto:sage [04/01/15 23:45]
( ´∀`)

373 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/03 10:33]
保守

374 名前:名無しさん@お腹いっぱい。 [04/02/06 18:23]
教えてください。
Windows用のファイルをemacsなんかで開いたとき,最下行に
^Z
という符号が表示されることがあります。
これはいったい何でしょうか?


375 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/06 19:31]
いわゆるeof

376 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/06 21:01]
>>375
ありがとうございます。この符号のあるファイル同士をcatで連結すると,途
中にこの符号が入ってしまいます。この符号をsedでマッチさせて消去したい
のですが,どうすればいいでしょうか。
sed '/^$/d' ではダメでした。


377 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/06 21:09]
>>376
いわゆるeof

378 名前:名無しさん@お腹いっぱい。 [04/02/06 22:38]
EOF符号をsedで消去できますか?


379 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/21 22:59]
grep で使える正規表現を精密に解説したサイトはありますかね?
日本語/英語どっちでもいいのですが。

380 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 00:19]
www.kt.rim.or.jp/~kbk/regex/regex.html



381 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 00:29]
レベル低いなー
378に対して出来るとも出来ないとも言えないのか...


382 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 00:58]
378=381 ですか?

383 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 02:14]
>>378
できるよ。普通に
s/^Z//
とかすればいい。もちろん^ZはEOFの一文字ね。

こんなの試せばすぐわかるだろと思ってたんだが、よく>>376を読むと、
「正規表現は純なテキストであるべきで特殊記号を混ぜるのはイクナイ」
と感じたんだろうな。まあ気持ちはわかるわ。

最近の正規表現拡張では、文字をコードの数値で表現する文法が
入ってたりする方が普通(例えばperlとか)だもんな。

384 名前:338 mailto:sage [04/02/22 02:24]
でね、特殊記号の特別なケースがtab。大昔は\tなんて表現なかったさ。
よく画面上の見た目やハードコピーや雑誌からシェルスクリプトを打ち直して、
tabとspaceの違いで動かないなんてことが時々あったんだよ。

あと勝手にシェルスクリプトを整形されて動かなくなるとか。


385 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 02:52]
>>382
いいえ
>>383
ありがトン!


386 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 02:55]
>>382
381=385 が正解


387 名前:名無しさん@お腹いっぱい。 mailto:sage [04/02/22 16:53]
>>380
ブックマークにいれますた。

388 名前:名無しさん@お腹いっぱい。 [04/03/27 17:05]
[\\w$'-]
これはどういうことなのでしょう?
[\w$'-]
ならわかるのですが..

389 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/27 17:09]
>>388
処理系は何?

390 名前:名無しさん@お腹いっぱい。 [04/03/27 17:20]
>>389
Rubyです
Regexp::compile("\b\d[\d\.]+\d\b|[\w]+|[\\w$'-]+")
scanメソッドで英文を分割してます



391 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/27 17:22]
>>390
ほほう。バグってる悪寒。

392 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/27 17:25]
Regexp::compile("\\b\\d[\\d\\.,]+\\d\\b")
こんなのがあるんですが..

393 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/27 18:30]
>>392
Ruby で "..." の中で '\' を書くときは、'\' でエスケープする必要があるの。
つまり Regexp::compile("\\w") は /\w/ と同じ。

>>390 のだと '\' のエスケープが足りない部分があるように見える。
たとえば、 "\w" は "w" に、 "\b" は "\010" になっちゃう。
ので「バグってる悪寒」と言いました。

394 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/27 18:53]
>>393
なるほど、必死に\\と重ねる正規表現について調べてましたよ
ありがとう


395 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/30 01:42]
perl で質問です。

NOTE note "note" notes

上のような文字列を「book」だけを「note」に置換したいのですが
s/\bnote\b/book/g
のようにすると、ダブルクォートで囲まれているものも置換されてしまうのですが
それを

NOTE book "note" notes

のようにするにはどう表記すればよいのでしょうか?
詳しい方、教えてください。


396 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/30 04:15]
>>395
> NOTE note "note" notes
>
> 上のような文字列を「book」だけを「note」に置換したいのですが

397 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/30 10:07]
>>396
その下の
s/\bnote\b/book/g
ぐらい読んで多目にみてやれ。

>>395
とはいえ、仕様があいまいすぎ。
'note' はどうする? :note: は? "abc note def" は?

398 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/30 10:29]
s/ note / book /g
か?

>>397
> とはいえ、仕様があいまいすぎ。
んだな。

399 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/30 12:34]
>>395
s/(?=[^"])\bnote\b(?=[^"])/book/g;

# こんなんで良いわけないよなと思いつつ・・・

400 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/31 02:02]
>>397

> とはいえ、仕様があいまいすぎ。

すいません、おっしゃるとおりです。
ある単語(note)をある単語(book)に置換したいのですが、
ダブルクォートで囲まれているもの("note")は、その置換からは除外したいのです。

> 'note' はどうする? :note: は? "abc note def" は?

したがいまして、これらはとりあえず想定外で構わないので置換してしまっても構いません。
もう少し昨日の例を詳しく書きますと

NOTE,note"note"notes-note

このようなものでも

NOTE,book"note"notes-book

のようになってくれるのを期待しています。

ただ、"abc note def" これも想定外で構わないのですが
対応が可能であるのなら、私の勉強の為に教えてくださるとありがたく思います。

>>399
ありがとうございます。

>s/(?=[^"])\bnote\b(?=[^"])/book/g;
これを試してみました。
基本的にOKかなと思ったのですが、行頭、行末では置換の対象となってくれませんでした。





401 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/31 02:52]
>>400
補足です。
ここでいう単語とは \w+ で表せる範囲のもので、
アルファベット大文字、小文字も含めて完全に単語の
先頭から末尾までが一致するものです。


402 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/31 07:45]
もっと簡単にできるかもしれないけど、
s/(^|(?<=[^\w"]))note\b|\bnote($|(?=[^\w"]))/book/g;
とかは?

> ただ、"abc note def" これも想定外で構わないのですが

後ろから数えた"の個数が奇数ならマッチしないようにして、
$b =~ s/\bnote\b(?=([^"]*"[^"]*")*[^"]*$)/book/g;
とすれば、"のマッチングが保証できる範囲ではなんとかなるかも。
前からの"の個数でマッチさせようとしたら、
可変長のlook-behindは実装してないらしい。(perl 5.8)


403 名前:名無しさん@お腹いっぱい。 mailto:sage [04/03/31 14:53]
s/"note"/hogehoge/g
s/note/book/g
s/hogehoge/"note"/g
おれならこうしちゃうな。
考えんのめんどい。

404 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/01 01:10]
>>402

ありがとうございました。
たいへん勉強になりました。


405 名前:名無しさん@お腹いっぱい。 [04/04/07 15:07]
質問させてください。

&にはマッチして欲しいのですが、&にはマッチして欲しくないのです。

どのように記述すればよいのでしょう。

お願いします。

406 名前:405 [04/04/07 15:09]
&にはマッチ
&amp;にはマッチしない

でした。すいません。

407 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/07 15:26]
>>405
Perl5 でいい?

408 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/07 15:32]
>>405
/&(?!amp;)/

409 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/11 13:22]
正規表現のおすすめ書って何がありますか?

410 名前:名無しさん@お腹いっぱい。 mailto:sage [04/04/11 14:13]
オライリーのやつ。



411 名前:名無しさん@そうだ選挙に行こう [04/07/11 16:49]
ワイルドカード(DOS)の *.txt って、正規表現だとどう書くの?

412 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/11 20:35]
{(([0-9a-zA-Z]){0,})\.txt}とか半端に返してみるテスト

413 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/11 20:46]
[^\\/]+\.[Tt][Xx][Tx]\z とか (ry

414 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/11 22:41]
foo と bar 両方含む行をマッチさせたいんだけど、
awkでいうところの and演算子
% awk /foo/&&/bar/
が使える、windowsで動くgrepツールなんか教えてください。

#絞込み再検索のないGUIなgrepツールなんかイラネ

415 名前:名無しさん@お腹いっぱい。 [04/07/11 23:39]
>>412,413
. 記号は \ でエスケープになるのですね。.*\.txt でマッチはしました。
助かりました、ありがとうです。

416 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/12 22:46]
>>414

FIND "foo" | FIND "bar"

みたいのじゃ駄目?

417 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/14 00:51]
>>414
|が使えるツールなら、/foo.*bar|bar.*foo/とかで近似できるんじゃないの。
CygwinのGNU grepで試してみた。

> cat foobar.txt
foo
bar
foo foo
foo bar
bar bar
bar foo
> grep -n "foo.*bar\|bar.*foo" foobar.txt
4:foo bar
6:bar foo
>

418 名前:414 mailto:sage [04/07/23 03:17]
なるほど、andをorに展開すればいいのか。
しかし fooかつbarかつbazを検索、つーばあい展開すんのめんどくさいなぁ。

windowsのGUIなgrepツールは、サブフォルダも検索、とかできて
結構便利なのも歩けど、パイプとかorが使えなかったりしてイマイチ。

結局cygwinでawk使ってるけど、これもいまひとつメンドクサイ。
2chのログを検索してるだけなんだが_| ̄|○

419 名前:名無しさん@お腹いっぱい。 mailto:sage [04/07/29 01:12]
>>418
xyzzy の ggrep 辺りがいいんじゃない?

420 名前:名無しさん@お腹いっぱい。 [04/07/30 00:18]
Windows の AWKじゃだめですか?



421 名前:名無しさん@お腹いっぱい。 [04/08/03 09:48]
Perloしかないべ


422 名前:名無しさん@お腹いっぱい。 [04/08/06 22:51]
#から行末までをあらわす正規表現ってどうやればいいんでしょうか。

423 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/06 23:22]
#.*$

424 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/12 15:32]
#[^#]*$

425 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 00:25]
質問があります。

サクラエディタ(正規表現ライブラリ:BREGEXP.DLL)でCソース中のhogehogeをgrepしてた
場合に、コメント化(//)されている行だけは検索結果に表示したくないんですが、
どのような正規表現で検索すればいいでしょうか?


426 名前:名無しさん@お腹いっぱい。 [04/08/24 01:48]
あげ

427 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 01:56]
>>425
そのエディタよく知らないんだけど、Unix で動くの?

428 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 13:36]
スレタイだけ見て、板を確認してないんだと思われ。

429 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 13:43]
それを言うと、このスレ自体板違いな気もしなくはないが。ム板のだけで十分やん。

430 名前:425 [04/08/24 21:24]
UNIX板って知っていて質問をしましたが。
とりあえず、ム板に逝ってみます。



431 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 21:38]
>>430
Unix 用のソフトなの?

432 名前:名無しさん@お腹いっぱい。 mailto:sage [04/08/24 22:51]
>>431
is not UNIX

433 名前:名無しさん@お腹いっぱい。 [04/08/24 23:41]
多分エディタの種類はどうでもよくて、 /\/\*.*\*\/ とか、そんな答えを期待していたと思われ


434 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/05 06:33]
ム板の正規表現もとんと書き込みないから、テストしてみたら
書き込めた。ここもどうなんだか、書き込んでみる。

435 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/06 18:18]
ハハ*.*ハハ

436 名前:名無しさん@お腹いっぱい。 [04/09/07 16:51]
指定文字列A 何か 指定文字列B
という何かにヒットさせるにはどういう正規表現にすればいいですか?

437 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/07 17:18]
>>436
素で答えると「文字列A.*文字列B」だけど?そういう話?

もちろん文字列ABに特殊記号があったらどうするかとか、
.*は最長マッチでいいのとか、いろいろ細かい話はあるけど。

438 名前:436 [04/09/07 17:21]
自分で、
(文字列A).*{2,15}(文字列B)
とかでやってみたんですが、
マッチするのが、
指定文字列A 何か 指定文字列B
がマッチしてしまうので…

何か の部分だけを抽出しようと思ってます。

439 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/07 17:55]
後から取り出したい部分を()で囲む。(.*{2,15})みたいに。

440 名前:436 [04/09/08 01:37]
>>439さんの方法でも結果が変わりませんでした… 処理系が違うからかな?

とりあえず諦めて、
指定文字列A 何か 指定文字列B
をマッチさせて、指定文字列A+1文字目から 何か の文字数だけ切り取ることにします。

ありがとうございました。



441 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/08 02:28]
>>440
で、その処理系が何かを晒すつもりは毛頭無いわけですね?

442 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/08 10:13]
>>441
ハゲには無理

443 名前:436 mailto:sage [04/09/08 11:58]
何度もすいません。

C#です… 改めてやってみると>>439さんの方法でいけました。
group[1]に入ってたんですね。全体しか見てませんでした。

板違いにお騒がせしました。

444 名前:名無しさん@お腹いっぱい。 [04/09/10 00:33]
Perlの場合、

$_ = "いっぱい";
s/い/お/;          # おっぱい
s/い/お/g;         # おっぱお

ということでおk?

445 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/10 02:41]
  _  ∩
( ゚∀゚)彡 おっぱい!おっぱお!
 ⊂彡


446 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/10 15:00:12]
小学生のころ流行ったネタ

447 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/27 06:28:21]
性器表現

448 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/27 09:23:16]
ワロテモータ

449 名前:名無しさん@お腹いっぱい。 mailto:sage [04/09/27 11:29:59]
さんざん概出なのに・・・

450 名前: mailto:sage [04/10/13 14:29:29]





451 名前:名無しさん@お腹いっぱい。 mailto:sage [04/10/13 14:50:43]
.*

452 名前:ウサチャソ mailto:sage bill@microsoft.com [04/10/29 21:49:31]
↑アナルは性器じゃねーよな、とか思ってよく見ると、ドット米。
イボ痔か?

453 名前:名無しさん@お腹いっぱい。 mailto:sage [04/10/30 20:30:37]
>>452
拭き忘れたウンチだよ。きっと!

454 名前:名無しさん@お腹いっぱい。 [04/11/10 15:37:24]
regexp

455 名前:名無しさん@お腹いっぱい。 mailto:sage [04/11/26 21:14:34]
rege*p

456 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/16 23:14:21]
正規表現で複数の単語の中に「/」があるときにヒットさせたいんですが

echo "hoge / hoge" | grep "\</\>"

でだめでした・・。だれか修正をお願いしますorz


457 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/16 23:50:35]
>>456
条件をもっと明確に定義しろ。
マルチすんな。

458 名前:456 mailto:sage [04/12/17 00:16:01]
>>457

複数の単語の中で、"/"のみで構成される単語が存在する場合のみ
ヒットさせたいのです

つまり
a b c / d
上記ようなときで下記のどの事象にもヒットさせたくはないのです
// /a a/ a/a



459 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/17 01:22:18]
>>456
pc5.2ch.net/test/read.cgi/linux/1101654885/957
とこっちと、どっちで続けるのかね。

460 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/17 11:17:13]
まことに勝手ながらこちらで続けさせてください
質問を改めます
やりたいことは
-----------------------
1) echo "/" | grep ......
2) echo "/ a b" | grep ......
3) echo "a b /" | grep ......
4) echo "/a / b/" | grep ......
-----------------------
上ですべてマッチさせて
以下はすべてはじくようにしたいのです
-----------------------
5) echo "//" | grep ......
6) echo "// /// ////" | grep ......
7) echo "/a b/ /c/" | grep ......
-----------------------
上と下の違いは、前後にスペースを含む" / "が存在するか否かです

よって以下のように考えましたが、ヒットしませんでした
echo "a / b"|grep "\</\>"
echo "a / b"|grep "\<\/\>"

どなたか修正をおねがいしますorz




461 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/17 11:22:35]
>>460
grep と言ってもいろいろあるんだが
どの OS のどの grep よ。

462 名前:456 mailto:sage [04/12/17 11:23:16]
↑修正します

修正前)上と下の違いは、前後にスペースを含む" / "が存在するか否かです

修正後)上と下の違いは、単語 / が存在するか否かです

463 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/17 11:27:31]
>>460
> 上と下の違いは、前後にスペースを含む" / "が存在するか否かです
1) と 2) には存在しないようだが。

464 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/17 11:28:10]
>>462
「単語」とは?

465 名前:名無しさん@お腹いっぱい。 [04/12/18 00:00:37]
ブラケットの中でピリオドを入れる時ってメタキャラクタとして扱われますか?

[\w.]

[\w\.]
が同じ動きにになるみたいなんですけど・・・。

ちなみに、パールです。


466 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/18 02:48:16]
>>465
「みたい」じゃなくてテストコードで示してよ。

467 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/18 08:58:34]
どの言語の正規表現がどんな有限オートマトン使ってるという情報って
どこかにありますかねぇ。正規表現コンバータ作ろうかと思ってるのですが。。

NFA、DFAの違いぐらいは詳説正規表現の本でわかるのですが、実装ともなると。
オートマトンの変換に関してはコンパイラの本を参考にしてますが、
やはりかなりつらいものがありますね。たんに字句解析して作った方がいいのかなぁ。

468 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/18 09:16:42]
普通にNFA+DFAでいいじゃん

469 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/21 02:13:26]
オブジェクト指向正規表現の仕様策定はまだですか?

470 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/21 14:44:45]
>>469
聞いたことないな。
何それ?



471 名前:名無しさん@お腹いっぱい。 mailto:sage [04/12/21 19:26:19]
>>469
まかせた。

472 名前:名無しさん@お腹いっぱい。 [04/12/22 19:35:55]
お前らWinの.NETなんだが正規表現の質問をさせてくれ。

RegularExpressions.Regexで下の文字列を検索して<TD>から</TD>に分けたい。

string strHtml = "<TD>a</TD><TD>b</TD><TD>c</TD>"

Regex regex = Regex("<TD>.*</TD>");
MatchCollection matchcollection = regex.Matches(strHtml);

だと最長一致で "<TD>a</TD><TD>b</TD><TD>c</TD>"の1つのコレクション取得。

Regex regex = Regex("<TD>.*?</TD>");

だとやりたい "<TD>a</TD>", "<TD>b</TD>","<TD>c</TD>"の3つのコレクションが取得できる。

.*? の意味をアフォにも分かるように説明してくれ。
.*(任意の0文字以上)が?(あるかないか)だろ。
なんで思った通りに3つのコレクションが取得できるの?

473 名前:472 [04/12/22 19:38:29]
*? つーのは最短一致という便利なキーワードなのか。
つまらん質問失礼しますた。

474 名前:名無しさん@お腹いっぱい。 [05/01/07 22:21:40]
下がってるので、どれ一つ、とんちでも。
rubyでは
/aa+??/ =~ "a" => 0
emacsでは
"aa+??" =~ "a" => nil
さて、こうなってしまうのは、各々がどのようなオートマトンで
解釈されているからでしょうか。

475 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/08 07:36:53]
emacsって最短マッチあんの?

476 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/08 11:15:48]
ありましゅよー
ttp://www.cs.huji.ac.il/support/emacs/elisp-help/elisp-manref/elisp_34.html

でも、{m,n}? の最短マッチはないみたい…。

477 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/11 11:11:46]
最短マッチに対応した grep ってある?

478 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/11 13:31:51]
>>477
grep が最短マッチに対応してるかどうかが問題になるケースってある?

479 名前:名無しさん@お腹いっぱい。 mailto:sage [05/01/30 22:46:31 ]
[^ま]*まってかくのめんどくさい

480 名前:名無しさん@お腹いっぱい。 [05/02/26 05:47:57 ]
あげ



481 名前:名無しさん@お腹いっぱい。 [2005/03/30(水) 02:33:49 ]
up

482 名前:名無しさん@お腹いっぱい。 mailto:ほしゅsage [2005/04/19(火) 17:08:07 ]
正規表現の実装っていろいろあることにやっと気づいた漏れorz

483 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/14(土) 15:12:25 ]
ほしゅ

484 名前:名無しさん@お腹いっぱい。 [2005/05/16(月) 16:51:45 ]
abc xyzをaxbyczにしたいのですが

485 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/16(月) 17:05:02 ]
s/abc xyz/axbycz/g

486 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/16(月) 19:33:57 ]
ワロタ


487 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/16(月) 19:34:25 ]
保守

488 名前:名無しさん@お腹いっぱい。 [2005/05/17(火) 22:45:20 ]
>>484
echo abc xyz |sed -e "s/^/%/; :ll; s/[%]\(.\)\(.*\) \(.\)\(.*\)/\1\3%\2 \4/; tll; s/%//;"

489 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/18(水) 00:13:40 ]
うひょー

490 名前:名無しさん@お腹いっぱい。 mailto:ほしゅsage [2005/05/28(土) 03:19:18 ]
うに厨として、% をめぐる動きに溜息出た…真剣にありがと 何重にも目が覚めた



491 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/05/28(土) 05:32:41 ]
abc xyz でも
abcdefg ABCDEFG でもできるね。すげーや。

492 名前: ◆2fmGY.thDg mailto:sage [2005/06/02(木) 22:17:25 ]
a

493 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/06/04(土) 23:07:23 ]
('A`)

494 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/06/19(日) 02:53:08 ]
Onigurumaを使っているんですが、
あるテキストデータがあります。
----- ここから
END

注釈 ○○○
注意 △△△
補足 ◎◎◎

TITLE
----- ここまで
という部分の、ENDの後の空白行からTITLEの前の空白行の部分(間の行)を削除して、
ENDとTITLEの間は1行だけの空白行にしたいです。
「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
これは私の正規表現の式が間違えているんでしょうか?
(複数行を1度に選択する方法を間違えている???)

495 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/06/19(日) 03:13:31 ]
>>494
つーか、正規表現だけ見せられても判断できないと思うんだけど。
改行処理や文字コードのオプション設定はどうしてるかとかいろいろ情報が足りない。

496 名前:名無しさん@お腹いっぱい。 mailto:ほしゅsage [2005/07/13(水) 09:25:56 ]
素直に、
~s/END(\s*.*?\s*)TITLE/END\n\nTITLE/sg;
じゃダメ?

497 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/07/13(水) 13:15:24 ]
>>496
Oniguruma の質問なわけだが?

498 名前:名無しさん@お腹いっぱい。 mailto:ほしゅsage [2005/07/13(水) 17:54:26 ]
…とは思ったのだが、Perl 互換らしーから、いーかなとw

てか、見つかるのむちゃくちゃ早いなww
事後ながら、oniguruma (ライブラリ)取りに行った

499 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/07/13(水) 19:58:46 ]
>>498
> 見つかるのむちゃくちゃ早いなww
どういうこと?


500 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/07/17(日) 23:17:41 ]
>494
> 「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
> これは私の正規表現の式が間違えているんでしょうか?
> (複数行を1度に選択する方法を間違えている???)

これのどこが、複数行を一度に選択しているの?




501 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/07/19(火) 19:22:13 ]
>>500
ONIG_OPTION_MULTILINE (や REG_NEWLINE や RE_OPTION_MULTILINE など) をセット
しているかどうかで複数行選択できるかどうか変わるので、
そのへんを晒せばもうちょっと状況がわかると思うのだが、
元質問者はもう既にどっかいっちゃったのだろうな。

502 名前:名無しさん@お腹いっぱい。 [2005/09/21(水) 20:57:28 ]
正規表現で
○○ か ○○の場合と言うのはどう表現するのでしょうか?

Cで言う、 || のようなものです。

503 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/21(水) 21:07:45 ]
テンプレに何もないんだなこのスレ。
このあたりで調べろ

www.kt.rim.or.jp/%7Ekbk/regex/regex.html

504 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/21(水) 21:18:44 ]
\(>∀<\) キャー

505 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/21(水) 21:58:13 ]
(;`∇´))))))))))) \(>∀<\) キャー

506 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/21(水) 22:48:45 ]
俺ならこう→「\(○{2}\) か \1の場合」

507 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/21(水) 23:46:20 ]
何気に正規表現本もラッシュだな。


508 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/22(木) 00:19:11 ]
\([^ ]∀[^ ]*\)

AAみたいな正規表現を作りたいが難しい。

509 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/22(木) 02:52:41 ]
つくれてるやん!

510 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/23(金) 23:15:15 ]
∀ がメタキャラになってくれると楽しいかも




511 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/26(月) 20:32:51 ]
дも

512 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/09/28(水) 14:54:06 ]
ネタキャラ


513 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 01:04:17 ]
純粋に興味の問題なんだけど、
「ある文字集合の要素が各1回ずつしか出現しない」という文字列は
正規表現で表現できる?

例えばA, B, Cの文字からなる言語を考えたとすると、
ABC ACB BAC BCA CAB CBAの6つの文字列にマッチする表現っす。

514 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 01:08:23 ]
文字集合の濃度が有限なら
単に | でつなげばいいな。

515 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 02:30:43 ]
いろは歌とか"a quick brown fox..."みたいなのにマッチさせる正規表現、
って書けば説明が早かったかもですね。

>>514
ひらがなの場合で47!個、アルファベットの場合で26!個の文字列を
|でつなぐってことになると思うんですが、やはりこれしか方法ないんですかね。
正規表現の長さは… アルファベットの場合でも約1京テラバイトか… orz

516 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 09:42:38 ]
>>513
[^A]*A[^A]* ではどうよ

517 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 09:53:24 ]
>>516
BBA にもマッチしちゃうんでは。

518 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 09:57:44 ]
>>515
> "a quick brown fox..."みたいなのに
o 2回出てるよ。

実用を考えたら正規表現以外でやった方がいいな。

519 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 19:50:27 ]
いろは歌って内容も傑作だよな。

520 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/09(金) 21:53:37 ]
> o 2回出てるよ。

おお、32年生きてて初めて気が付いたっす。漏れの目はfusianasanさんだ… orz

> 実用を考えたら正規表現以外でやった方がいいな。

そうことになっちゃいますかね。みなさんレスどうもでした。



521 名前:名無しさん@お腹いっぱい。 [2005/12/11(日) 08:09:16 ]
Windowsで正規表現にマッチする文字列のみ(行全体じゃなく)を表示・保存するにはどうすればいいのでしょうか?
xyzzyとかのエディタのgrepでやろうとしたのですが、検索してもよくわかりません。
Rubyとかスクリプト言語を使わないと無理でしょうか?


522 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/11(日) 08:13:57 ]
上すいません。書きこむスレ間違えました。(プログラム板の正規表現スレに書きこんだつもりでした。)

523 名前:名無しさん@お腹いっぱい。 [2005/12/11(日) 11:19:25 ]
ちょうど一回出るんなら何かの順序でソートして文字列が完全一致することをチェックかなあ

524 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 11:16:33 ]
エディターの正規表現で置き換えをしたいんですが・・・
1、2、3、・・・という連番を
(1) (2) (3)というふうに置き換えたいのですが
どうしたらよいでしょうか。

525 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/01(日) 11:57:28 ]
まずは(ry

526 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/01(日) 12:39:56 ]
置換元:[1-9]
置換先:(\0)
で、できるかもよ。

527 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 17:30:57 ]
>>526
だめでした。


528 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/01(日) 19:50:58 ]
置換元:[1-9][0-9]*
置換先:\(\0\)
こんな風にすればできるのかな?
どんな風に駄目だったかわからないけれど。

529 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 20:02:16 ]
>>528
それもやってみましたが、検索はされるのですが、
置き換えが出来ません。(0)となってしまいます。
前回のは(となってしまいます。
エディターだから駄目なのでしょうか。


530 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/01(日) 20:09:51 ]
\0のところを、
\1
$1
にしても同じかな?



531 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 20:13:18 ]
>>530
($1)となってしまいます。


532 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/01(日) 20:17:25 ]
そのエディタの正規表現がreference(\1とか$1とか)をサポートしてないに1票。

533 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 21:27:04 ]
!(^^)!ピンポーンです。
ヘルプを見ていたら、referenceはサポートしていないと出ていました。
他のエディターを探すか、どうしたらいいでしょうか。


534 名前:名無しさん@お腹いっぱい。 [2006/01/01(日) 23:17:07 ]
続きです
結局QXエディタをダウンロードして使いました。
びっくりしたのはWindows上では
正規表現というのは全然一般的ではないんですね。
勉強しようにも正規表現サポート自体が脆弱だったんですね。


535 名前: 【大凶】 3回目 mailto:sage [2006/01/01(日) 23:32:29 ]
ググればなんぼでも出てきます。少し自分で考えなはれ。

536 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/03(火) 22:49:27 ]
まあやることがハッキリ決まってるんなら、
(念の為)対象ファイルのカレントディレクトリのDOS窓を開いてsed、だな。

537 名前:名無しさん@お腹いっぱい。 [2006/01/07(土) 07:00:27 ]

{aaa}[bbb}{ccc}
という文字列から、aaa bbb cccをそれぞれマッチさせてとりだしたいので、

/¥{(.*)¥}¥{(.*)¥}¥{(.*)¥}/

としていましたが、
とりだしたい文字列のなかに、さらに{}がはいっていることがあることが
わかりました。
{aaa}[b{b}b}{ccc}
とか。
それぞれaaa b{b}b cccというかたちでとりだしたいのですが、どうしたものでしょうか。


538 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 10:07:50 ]
>>537
sedはそのままでok

539 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 14:56:41 ]
グループ化用のカッコにエスケープが必要だからsed「では」ダメじゃないの?
Perlならエスケープ不要なので大丈夫。

ところで>>537はテクニシャンだな。
navi2chで円マーク(¥じゃないほう)を表示させやがって…

540 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 15:36:35 ]
>>539
ヒント:}{



541 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 15:46:46 ]
いや、それは分かってるつもりだけど。
sedだと例えば{(aaa)}{(bbb)}{(ccc)}にマッチしちゃいますよってこと。

542 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 17:31:15 ]
>>541
じゃあ不必要な{}()を最初にスペースに変換してからマッチさせたら

543 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/07(土) 18:58:38 ]
そんな必要ない。sedでも>>537のカッコをすべてエスケープすれば良い。
>>538の「sedは」というのが余分だっただけ。

544 名前:名無しさん@お腹いっぱい。 [2006/01/12(木) 05:55:00 ]
郵便番号をPHPで「1234567」から「123-4567」へ整形する正規表現を教えて下さい。

545 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/12(木) 11:06:51 ]
>>544
【PHP】質問スレッドpart32【php】
pc8.2ch.net/test/read.cgi/php/1136276300/

546 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/13(金) 16:59:36 ]
すいません。
--------------------------------
#hogehoge
fugafuga 1
--------------------------------
という風に行頭が#じゃないというのを正規表現で取得したいのですが
「ではない」というのが分かりません。
bashを用いております。
以上 ご助力をお願いいたします。

547 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/13(金) 20:50:59 ]
>>546
grep -v '^#'

548 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/13(金) 21:08:39 ]
>>546
grep '^[^#]'


549 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/13(金) 21:29:57 ]
いつも思うけど、
[^#] 形式だと文字が存在してないときも除外してしまうので
面倒なことあるよね。
ディレクトリリストから
.
..
を除外しようと
[^.][^.].*
を使って一文字のファイル見逃すとか。

550 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/13(金) 21:47:30 ]
>>549
その方が便利なこともある。



551 名前:544 mailto:sage [2006/01/16(月) 17:54:29 ]
ご教授ありがとうございます。
本当に助かりましたっ

552 名前:名無しさん@お腹いっぱい。 [2006/01/22(日) 02:37:32 ]
正規表現の正規表現ってどうかきますか?
ある値が正規表現の構文に沿っているかどうかを調べたいとき。

553 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/22(日) 02:48:16 ]
入れ子があるから正規表現にはならない。
BNFを書けば3型文法に属さないこと分かるでしょ。

554 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 11:22:53 ]
いきなりすんません
2ちゃんねるブラウザ Jane Doe Style で正規表現検索を使おうとしたけど、書き方がいまいち分かりません。
F900i という文字列だけを検索して F900is や F900iT はヒットさせないようにするには、どう書けば良いですか
ぐぐってもいまいちわからないので。。。。

555 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 11:25:48 ]
板違い。

556 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 11:32:56 ]
スマンです。でもスレタイ検索してもほかに質問できそうな場所なかったんけどだめですか。

UNIX 085 正規表現 (553)
プログラム 408 正規表現part2 (102)
プログラマー 283 【Regular】正規表現【Expression】 (36)

557 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 11:36:10 ]
板違い。

558 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 11:49:12 ]


559 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 13:16:13 ]
>>554
Jane Doe Style とやらがどんな正規表現エンジンを使っているかにも
激しく依存する話なので、
まずはそのソフトのスレで聞いてみた方が良いと思う。

560 名前:名無しさん@お腹いっぱい。 [2006/04/15(土) 16:30:37 ]
(・∀・)



561 名前:名無しさん@お腹いっぱい。 [2006/04/18(火) 03:51:57 ]
onigruma... 気になる。名前が怖い。

562 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/18(火) 09:54:32 ]
nekoguruma だったら弱そうだしな

563 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/02(火) 22:56:16 ]
>>562
いろいろ運べそうじゃないか

564 名前:名無しさん@お腹いっぱい。 [2006/05/29(月) 20:29:06 ]
正規表現厨には
grep --color


565 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/31(水) 19:33:06 ]
勉強ついでに554を考えてみた。精度に難がありそうですが、以下でどうだろう?

[^A-Zz-z0-9]*F900i[^A-Za-z0-9]*


566 名前:成瀬 ◆NBGqNARUSE mailto:sage [2006/06/16(金) 03:35:29 ]
>>565
最低限試そう。"F900iS"=~/[^A-Zz-z0-9]*F900i[^A-Za-z0-9]*/ はマッチする。
ヒント: \W \b 否定先読み

567 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/25(火) 12:40:49 ]
...
Doll ←ここから
\=\-\--\-``--`\=`-==\
\=-\=-\``\==`=`--`-=-

Egg
-=-\-=-\-\=-=--\=-=-=\
-=-\-=-=\=-=\=-=-\-=\- ←ここまで

Fruits
...

のときDoll〜Eggの項目まで抽出するにはどうしたらいいですか?
/Doll/,/Fruits/ でおおまかには抽出できるけどもっと正確に抽出したいのです

568 名前:名無しさん@お腹いっぱい。 [2006/08/09(水) 21:11:53 ]
『詳説 正規表現 第3版』 が今月発売されるね。
邦訳版の出版は知らんけど。

569 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/10(木) 13:32:24 ]
情報サンクス。
けど、洋書なら原書のタイトル表記でよろしく。
早とちりして必死で oreilly.co.jp と amazon.co.jp 探しちゃったよー。(←あほ)

570 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/10(木) 21:53:00 ]
>>569
www.oreilly.com/catalog/regex3/index.html

わざわざ、邦訳版の出版は知らんって書いたのになw



571 名前:名無しさん@お腹いっぱい。 [2006/08/18(金) 16:48:08 ]
oraclesqlpuzzle.hp.infoseek.co.jp/regex/index.html
正規表現の問題集らしい

572 名前:名無しさん@お腹いっぱい。 [2006/08/18(金) 17:01:57 ]
>>568
作者宣伝乙、
というのは冗談で、情報ありがと。
日本語版はいつ出るんだろ。

573 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/23(水) 13:58:51 ]
立ち読みとか読んだうちに入らんと思われた。

574 名前:名無しさん@お腹いっぱい。 [2006/08/23(水) 17:31:35 ]
>>177
oraclesqlpuzzle.hp.infoseek.co.jp/regex/regex-4-10.html
こんなのもあるみたいやね

575 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/05(木) 15:46:12 ]
age

576 名前:名無しさん@お腹いっぱい。 [2006/10/16(月) 10:51:27 ]
ageとくか

577 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 01:00:23 ]
質問させてください。

正規表現を用いたgrepをするときに、
文字列"foo"を含まない全ての行にマッチさせるためには
どのように書けばよいのでしょうか。

578 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 01:13:12 ]
-v

579 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 08:26:14 ]
man に書いてあるよ。

580 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 08:26:50 ]
-v オプションを使わずに、正規表現上で「文字列"foo"を含まない」を表す方法を
聞いているんじゃないだろうか?



581 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 09:48:51 ]
(?!foo)

582 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 11:12:35 ]
>>581
今はgrepでの話をしてんだろ。

583 名前:名無しさん@お腹いっぱい。 [2006/10/17(火) 13:02:02 ]
>>577
否定先読み

584 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 13:37:52 ]
>>583
正規表現でできるものか!
先読み、後読み共に否定は貧弱

585 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 18:14:48 ]
「一致しない」はあらゆる箇所にマッチするからね
行単位の処理とは基本的に相容れないし

正規表現でなく、-vのようなメタレベルで対処するのが正解
sedとかでもいいな

586 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 19:17:42 ]
>>585
なんで、.*?(?!xxx) を、xxxが一切含まない行、と解釈してくれないんですかね?

587 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/17(火) 19:55:43 ]
論理的に考えてみればわかるよ

588 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/18(水) 09:59:12 ]
>>587
欲張りマッチだから、xxxが見つかった段階で一文字戻ってマッチにしちゃう?

589 名前:名無しさん@お腹いっぱい。 [2006/10/18(水) 11:10:22 ]
>>586
解釈するわけがない

590 名前:名無しさん@お腹いっぱい。 [2006/10/20(金) 10:45:16 ]
^(?!.*foo)
でできるだろ

pc8.2ch.net/test/read.cgi/tech/1156413899/l100
の1のサイトをよく読め



591 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 10:00:30 ]
正規表現でできることの仕様ってずっとこのままなんですかね。
括弧の対を考慮した表現とかって簡単にならないかな。

592 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 11:17:38 ]
処理系ごとに拡張してあったりするじゃん。

593 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 11:28:08 ]
hp-uxのgrep糞だなw
\< \>が使えん。


594 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 12:07:18 ]
grepツールで、htmlのコメント内を検索対象からはずしてgrepできるツールありますか?
コメントで死ぬほど引っかかって苦労してます。
複数行コメント中の真ん中ぐらいの行に引っかかっても、先頭に<!--がないから
普通のgrepツールだときびしいです。

595 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 12:13:02 ]
sedしかないだろ。


596 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 12:24:01 ]
-- の対応まで見ようとするとつらそうだ。

597 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/24(火) 21:37:54 ]
複数行になると途端にわけわからんくなるな・・・。

598 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/26(木) 05:24:59 ]
改行位置を変換する前処理をしてからやるとか

599 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/26(木) 11:38:24 ]
コメントを
s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g
で取り除いてからgrepすればいいんじゃね?

600 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/03(金) 14:20:22 ]
マルチで済まない。

同じ文字が3文字連続していたら表示したいのだが



601 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/03(金) 15:02:08 ]
>>599
>s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g
この部分はsed?
だったら、その後もgrepなんかせずに、sedだけで完結すればいいじゃん。
awkでも同じく。


602 名前:<sage> [2006/11/10(金) 19:30:45 ]
教えて下さい。

ダブルクオートで囲まれていない、コンマだけを置き換えたいのですが、
正規表現では、どうあらわせばいいのでしょうか?

例:
"aaa, bbb" xxxx, "ccc, ddd" yyyyyy

xxxx, <- このコンマを −> xxxx; とセミコロンにしたいです。

よろ

603 名前:名無しさん@お腹いっぱい。 [2006/11/13(月) 23:01:55 ]
>>602
pc8.2ch.net/test/read.cgi/tech/1156413899/l100
のリンク先嫁


604 名前:<sage> [2006/11/14(火) 15:35:11 ]
>> 603
そのページのどこを読めと?

605 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/22(水) 14:36:47 ]
>>604
ほぼ全部
雑魚には無理な正規表現ってこった

606 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/22(水) 20:49:29 ]
氏ね

607 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/26(日) 13:47:54 ]
>>602

◆関連サイト
正規表現メモ
www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
www.din.or.jp/~ohzaki/regex.htm
Regular Expression(Riue ちゃんの正規表現講座)
www.sixnine.net/regexp/
正規表現パズル
oraclesqlpuzzle.hp.infoseek.co.jp/regex/
詳説 正規表現
www.oreilly.co.jp/books/4873111307/
正規表現プログラミングFAQ
capslockabcjp.kitunebi.com/faq.html

これだけ読めば解決できるが
池沼には無理

608 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/04(月) 14:18:49 ]
アルファベットの文字で構成されるが、「d」は入らない、を
[a-ce-z]以外の書き方で表現する方法はないですか?

もちろん↓はエラーだけど、こんな漢字で書ければいいのだけれど。

[a-z][^c]

609 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/04(月) 19:22:18 ]
a|b|c|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z

610 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/04(月) 22:02:59 ]
>>608
javaならできる



611 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/04(月) 22:08:51 ]
d|i|g|i|t|a|l


612 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/05(火) 09:35:00 ]
>>610
どうやるんだべさ?

613 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 02:45:07 ]
>>612
[[a-z]&&[^d]]
こんな感じだったと思う。


614 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 09:44:34 ]
>>613
うぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉ〜、すげぇ〜。できました!
javaだとこんなのができるのか!
もちろん正規表現標準じゃないので、perlとか秀丸正規表現ではできないかぁ・・・

javaならではの裏技って他に何かあるんですかね?

615 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 12:20:30 ]
>>614
うぉ++


616 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 12:23:51 ]
タイプ数増えてるのは問題ないのかw

617 名前:615 mailto:sage [2006/12/06(水) 12:51:07 ]
>>614
わざわざjavaで試した行動力に感服

強欲マッチといわれる615もためしてみるといい

618 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 13:11:31 ]
java使う人ならタイプ数が増えることが問なさそう

619 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 14:12:54 ]
>>615
うぉ+でいいんじゃないの?なんか違うの?

620 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/06(水) 17:58:50 ]
(+_+;)



621 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/07(木) 02:56:32 ]
>>619

違うよ。++が付いたほうはバックトラックしない。
Perlの (?> ...) と同じ。


622 名前:名無しさん@お腹いっぱい。 mailto:saga [2006/12/16(土) 17:28:28 ]
1〜1000
までの数字から始まって最後が
C]
で終わる正規表現を教えて下さい
m(_ _)m

623 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/16(土) 17:45:19 ]
^[0-9]\{1,4\}[^0-9]*C]$
かな?


624 名前:名無しさん@お腹いっぱい。 mailto:saga [2006/12/16(土) 17:55:45 ]
>>623
駄目でしたorz
正規表現の勉強してきます。
有難うございましたm(_ _)m

625 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/16(土) 19:58:43 ]
^([1-9][0-9]\{0,2\}|1000)[^0-9]*C]$
こうか?


626 名前:名無しさん@お腹いっぱい。 [2006/12/17(日) 00:31:38 ]
タイトル:文字列 の文字列の部分だけを取り出したいのですが、
どのような正規表現にすれば良いのでしょうか?
よろしければ、ご教授を願います。


627 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/17(日) 00:34:12 ]
いろいろ出ているようだけど
[0-9].*C]
ではダメな理由がわからない

628 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/17(日) 00:52:14 ]
>>626
文..

629 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/17(日) 07:34:54 ]
>>627
全然ダメ

0000C
がヒットする

630 名前:名無しさん@お腹いっぱい。 [2006/12/28(木) 11:54:55 ]
初歩な質問ですみませんが
[0-9a-zA-Z]で英数字にマッチするものとなると思うのですが
例えばajgko-jk-s1olのように「-」記号が入っているとマッチしません
どう記述すればよいですか?よろしくお願いします。



631 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 11:57:12 ]
>>630
[-0-9a-zA-Z]

632 名前:630 [2006/12/28(木) 12:01:22 ]
>>631
さんありがとうございます。
しかし上記のように記述しても読み込んでくれません・・・。
こう記述して[-0-9a-zA-Z]{10,10}
「BC-K-o58tB」これを認識してくれません。


633 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 12:09:19 ]
どのアプリ使ってんのよ

634 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 12:10:47 ]
>>632
ちゃんとマッチするけど・・


$ echo 'BC-K-o58tB' | egrep '[-0-9a-zA-Z]{10,10}'
BC-K-o58tB

635 名前:630 [2006/12/28(木) 12:11:07 ]
アプリ?良くわかりませんが言語PHPです。

636 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 12:11:52 ]
ならPHPのスレで聞いた方がいいんじゃね

637 名前:630 [2006/12/28(木) 12:16:40 ]
PHPのスレで聞いたら正規表現に行けと言われました。orz

638 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 14:04:02 ]
無限ループキタ━━━━━━(゚∀゚)━━━━━━ !!!!


639 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/28(木) 21:33:37 ]
PHPだとPOSIX由来の正規表現とPerl互換の正規表現があるけどどっち?
後者を使っているならpreg_match('/[-0-9a-zA-Z]{10,10}/', $str)みたいに
正規表現の前後にスラッシュが必要。

640 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/29(金) 11:07:30 ]
正規表現 part 3
pc8.2ch.net/test/read.cgi/tech/1156413899/




641 名前:名無しさん@お腹いっぱい。 [2007/01/09(火) 23:17:53 ]
始めたばっかりで、3時間かかってもダメです… お助けを。

()で囲まれる任意の文字部分だけをとりたいんですが、
\(..*\) では全然ダメですね… ()もついてくるし。

*****(ABC-_)(123%&)*****(あいう)***

上の例だと、以下の3つを取りたいです。
ABC-_
123%&
あいう

642 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/09(火) 23:43:33 ]
>>641
sed -e "s/(.*)/()/g" でどうよ

643 名前:名無しさん@お腹いっぱい。 [2007/01/10(水) 00:12:39 ]
>>642
Unix版でしたね…
Windows系でのやり方を知りたいです。

644 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/10(水) 00:19:56 ]
>>642
基礎からやり直せ。


645 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/10(水) 01:41:33 ]
>>642
なんか冗長だが...

use strict;
use warnings;
while(<>){
  s{(?:[^(]*)\(([^)]*)\)(?:[^(]*)}{[$1]}g;
  print $_;
}

646 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/10(水) 01:42:28 ]
>>643
Windowsにもsedは移植されてるじゃん。


647 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/10(水) 01:59:51 ]
>>643
板違い。

648 名前:名無しさん@お腹いっぱい。 [2007/01/18(木) 10:55:44 ]
>>641
正規表現でググレカス

649 名前:名無しさん@お腹いっぱい。 [2007/02/07(水) 08:21:33 ]
すみません、以下の正規表現は何にマッチするんでしょうか?
([\011\012\014 -~]+\\|\\(\\cj\\|\n\\)+\\)
処理系はLispです。お願いします。

650 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/08(木) 02:57:00 ]
>>649
LispつかEmacs Lispだろ。先頭に \\ が抜けてないか?

[\011\012\014 -~]+   タブかLFかCRかスペースかASCIIの表示可能文字の繰り返し

\\| または

\\(\\cj\\|\n\\)+  Cjって多バイト文字でいいんだっけ? か改行の繰り返し





651 名前:649 mailto:sage [2007/02/08(木) 15:45:20 ]
>>650
すみません、おっしゃる通り先頭に\\が抜けていました。
なるほど、どうもありがとうございました。

652 名前:名無しさん@お腹いっぱい。 [2007/03/27(火) 16:10:01 ]
コンマはエスケープする必要はありますか?

We are NOVA-TOMO\, right?

653 名前:名無しさん@お腹いっぱい。 [2007/03/27(火) 17:34:57 ]
必要ないと思った。付けても問題ないと思うけど。
むしろ?の方が…
俺詳しくないから何ともいえないけど

654 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 01:44:02 ]
カンマはどの正規表現でもメタ文字じゃないのでエスケープの必要はない。
むしろ >>653のいうとおりで ? が要注意。

grep/sed ならエスケープなしでOK。
egrep/awk/perl その他Perl互換のものなら要エスケープ


655 名前:名無しさん@お腹いっぱい。 [2007/04/21(土) 22:17:17 ]
当方、秀丸を使っております。
“・”で始まる文で、「」で囲まれた文をヒットさせるのにはどうすればよいのでしょうか?
どうしても、「」で囲まれる前の文章もヒットしてしまうのです。

656 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/21(土) 22:55:33 ]
>>655
秀丸とやらはUnixで動くのかい?

657 名前:名無しさん@お腹いっぱい。 [2007/04/21(土) 23:03:01 ]
げ、UNIX版でしたか!
失礼しました。

658 名前:名無しさん@お腹いっぱい。 [2007/05/04(金) 12:21:16 ]
ニフティーのドメイン以外を拾う為に [^nifty]\.com と書くのは間違いのようですが

特定の“文字列”以外を指定するのはどーすりゃいいの?

659 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 12:44:28 ]
否定先読みなどの拡張があればそれを使えばいいが、なくても
それ以外の文字列をすべて列挙すればなんとかなります。


660 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 13:59:38 ]
grep -v '特定の文字列' filename




661 名前:名無しさん@お腹いっぱい。 [2007/05/04(金) 14:35:47 ]
正規表現の話では?

([^n]....|.[^i]...|..[^f]..|...[^t].|....[^y])\.com

これが正解

662 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 14:54:42 ]
nifty.com以外のナントカ.comにマッチさせたいのだから、

([^n].*|n[^i].*|ni[^f].*|nif[^t].*|nift[^y].*)\.com

ではないか?

663 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 14:56:11 ]
無理に正規表現でがんばるより
他の方法を探した方がいい。

664 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 14:58:05 ]
それではniftyhoge.comにマッチしないので

([^n].*|n[^i].*|ni[^f].*|nif[^t].*|nift[^y].*|nifty..*)\.com


665 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 15:58:18 ]
perlならもうちょっと簡単?
perl -ne 'print if /(?<!nifty)\.com/'

grep -v とか否定を使うほうが素直だと思うけど。

666 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 16:31:54 ]
ヒネクレたひとたちばかりいるスレですから

667 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/04(金) 16:44:04 ]
このスレの中くらいは正規表現原理主義でいいじゃないか

668 名前:名無しさん@お腹いっぱい。 [2007/05/05(土) 00:26:33 ]
その為のスレなんだから当然といえば当然だろ


669 名前:名無しさん@お腹いっぱい。 mailto:111111111111111111111111111111111111 [2007/05/21(月) 19:09:39 ]
はふ

670 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/28(月) 22:36:56 ]
-rwxrwxr-x 1 53 53 3504 May 22 2006 index.htm
drwxrwxr-x 4 53 53 4096 May 6 2006 common
drwxrwxr-x 2 53 53 4096 May 22 2006 tmp
drwxrwxr-x 2 53 53 4096 May 22 2006 image

↑から<属性>(-rwxrwxr-x)と<名称>(index.htm)の部分をグループ化で取り出したいのですが、どのようにすればよいのでしょうか?




671 名前:名無しさん@お腹いっぱい。 [2007/05/28(月) 22:48:40 ]
ここは実は分かってない奴しかいねーから無理じゃね?ww

672 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 00:05:12 ]
>>670
グループ化って言うのがよくわからんけど、パーミッションの部分とファイル名の部分だけ取り出したいなら

$ perl -e 'while(<>){ if(/^([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*(.*)$/){ print "$1 $9\n"; }}' < test.txt
-rwxrwxr-x index.htm
drwxrwxr-x common
drwxrwxr-x tmp
drwxrwxr-x image
$

ぐらいからはじめればいい。

673 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 01:44:17 ]
確かにみんなもっとスマートに書けないものかねえ・・・

674 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 02:31:04 ]
^([^\s]+)(.*)([^\s]+)$

$1 $3


675 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 03:06:51 ]
(; ^ω^)

676 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 07:07:47 ]
むしろ正規表現使わないでreaddirとstat使うとこじゃないか?


677 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 15:00:33 ]
$ ls -al | sed -e 's/ \{1,\}/ /g' | cut -d ' ' -f 1,9

cut 使うのは反則?

678 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/30(水) 16:06:37 ]
awk '{print $1,$9}'
で十分では無かろうかと

679 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/01(土) 07:33:23 ]
gawkでJavaソースファイル内の「識別子」単位の置き換えをしようとしていますが,
なかなかうまくいきません.
たとえば,独立して現れる「Stack」は「Queue」に置き換えるが,
「argStack」は別の識別子だから「argQueue」とは置き換えず
そのままにしておくというものです.
Javaの識別子は[_0-9A-Za-z]の文字だけから構成されるとしています.
awk以外の選択肢も含めて,よい方法がありますでしょうか?
最終的には,Javaで置換プログラムを書けばできなくもないとは思いますが,
安直な方法があればお教えください.

680 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/01(土) 08:57:42 ]
\< \> で囲っておくとか。



681 名前:679 mailto:sage [2007/09/01(土) 19:15:56 ]
grepの「-w」は普通にできるのに,いざ置換で同じことをしようとすると
難しいですね.
結局Javaで処理プログラムを書きました.ありがとうございました.

682 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 09:09:36 ]
hogeを含む行のうち^\s*'で始まらないもの
をgrepするのにvimでは
\(^\s*'.*\)\@<!hoge
でできるようなんですが、サクラで
(?<!^\s*'.*)hoge
とするとダメでした。
これをgrepするにはどうすればいいでしょうか?

サクラ(bregexp.dll)の正規表現はPerl5互換だそうなんですが。

683 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 09:53:00 ]
板違い。

684 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 11:08:21 ]
じゃあ
hogeを含む行のうち^\s*'で始まらないもの
にマッチするPerl5正規表現を答えよ。
とします。

685 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 11:28:24 ]
ム板行け。

686 名前:情報工学ばが [2008/01/15(火) 20:48:47 ]
正規表現ってなんですか?

687 名前:情報工学ばが [2008/01/15(火) 20:50:24 ]
はやく!!!
単位がないんです!!

688 名前:情報工学ばが [2008/01/15(火) 20:51:45 ]
お願いします。。。

689 名前:わし [2008/01/15(火) 20:55:01 ]
わしにはわからん。


690 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 01:21:45 ]
>>686
【サルにもわかる正規表現入門】
www.mnet.ne.jp/~nakama/



691 名前:名無しさん@お腹いっぱい。 [2008/01/16(水) 12:24:11 ]
>>690
有難うございました。
おかげで単位取れそうやでー!!
ほな

692 名前:名無しさん@お腹いっぱい。 [2008/01/17(木) 00:37:01 ]
語り手緊急募集中!!

坐禅と見性第54章 片手の他人がたたく拍手の音
life9.2ch.net/test/read.cgi/psy/1192448109/

【仏教】悟りを開いた人のスレ 10 【鬼和尚】
life9.2ch.net/test/read.cgi/psy/1200142232/

【悟りで居る】悟りを開いた人スレ【完全お釈迦様派】
life9.2ch.net/test/read.cgi/psy/1198295563/

萬福寺行った。1.2
love6.2ch.net/test/read.cgi/kyoto/1188809052/

【茶の湯】  大徳寺について  【禅文化】
love6.2ch.net/test/read.cgi/kyoto/1145457556/

臨済宗 大本山天龍寺 2
love6.2ch.net/test/read.cgi/kyoto/1183216094/

【算盤】臨済宗 妙心寺派【金権】十五日は祝聖
love6.2ch.net/test/read.cgi/kyoto/1198725369/

★★臨済宗・癖有り布教師さん★★
love6.2ch.net/test/read.cgi/kyoto/1172800156/

臨済宗国泰寺派について
love6.2ch.net/test/read.cgi/kyoto/1151120179/

臨済宗相國寺派について
love6.2ch.net/test/read.cgi/kyoto/1146749623/

693 名前:名無しさん@お腹いっぱい。 [2008/02/24(日) 13:39:51 ]
2008-03 発売(予定)
「詳説 正規表現 第3版」 (Jeffrey E.F. Friedl 著 / 長尾高弘 訳)
ISBN 978-4-87311-359-3 定価 5,040円


694 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 17:10:30 ]
バイト代が全部本で消えていく・・・

695 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 18:03:30 ]
あるある

696 名前:名無しさん@お腹いっぱい。 [2008/02/26(火) 14:03:08 ]
2/1 XXXXXXXX
2/2〜2/5 XXXXXXXXX
2/7〜2/8 XXXXXXX
2/12 XXXXXXXXXX
2/20〜2/28 XXXXXXXXX

と書かれた行があり 今日より以前の日付の行を削除するにはどうすればいいですか

697 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 15:50:38 ]
それは正規表現の問題か?

698 名前:名無しさん@お腹いっぱい。 [2008/02/26(火) 17:23:03 ]
Cの構造体のようにネストする可能性のあるものを正規表現で抽出するにはどうすればいいでしょうか?

699 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 17:26:13 ]
無理

700 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 21:47:00 ]
>>699
正解



701 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 22:31:20 ]
>>696
日付の切り出しを正規表現でやって、日付の判定以降はプログラムでがんばれ。

702 名前:名無しさん@お腹いっぱい。 [2008/03/06(木) 14:24:40 ]
sedを使って
2007/1/2
2007/1/23
2007/12/2
2007/12/31
のデータを
2007/01/02
2007/01/23
2007/12/02
2007/12/31
にするにはどうすればいいですか



703 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 14:28:44 ]
sed -e 's,/1/,/01/,' -e 's,/2$,/02,'

704 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 17:14:22 ]
>>703
9日近く書き込み無いのによく質問に高速で答えられますね
尊敬するとともに変態だと思います。

705 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 17:15:08 ]
別に何日書き込みがなかろうが関係ない。

706 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 22:36:13 ]
>>704
今時ブラウザでみてる奇特な人かな?

別にこのスレを毎日人手でチェックしてるわけじゃなくて、
専ブラの巡回リストに入ってるだけのことだと思うよ。

まあ、確かに4分でレスするのはちょっとすごいが
よくよく見たら 2007/3/3 とかは変換しない...
ほんとにそれでいいのか? >>702

707 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 23:43:20 ]
>>703もわざとその答えにしたんだろ。
要するに質問の仕方が悪いって事だ。

708 名前:ウサチャソ ◆/0IEZmXnQ6 mailto:sage [2008/03/17(月) 21:53:04 ]
>>702
ゼロサプレス 正規表現
とか
ゼロパディング 正規表現
とかでググってみるといいかモナー
最近sedは使ってないから漏れはやり方知らんw

709 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 14:24:00 ]
どの文字列にもマッチしない正規表現ってどう書くんでしょう?

710 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 16:47:03 ]
(?<=a)a



711 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 09:09:37 ]
空文字列にもマッチしない?

712 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 23:02:47 ]
しないよ
というか自分で試せよ

713 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 00:44:43 ]
710って、aaにマッチするよ
戻り読みの位置が違うんじゃね?


714 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 20:07:35 ]
(?!a)a
こうかな

715 名前:名無しさん@お腹いっぱい。 [2008/06/02(月) 10:30:14 ]
Vimでファイルの中からhttpで始まり、htmlで終るURLを抜きだしたいのですが、
どのようにすれば可能でしょうか?
いろいろと試してはいるのですが、行中の最大にマッチする等なかなかうまくできません。

716 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/02(月) 11:38:21 ]
最短でマッチさせたらさせたで、
ディレクトリのどこかに .html があると破綻する

717 名前:名無しさん@お腹いっぱい。 [2008/06/03(火) 08:27:21 ]
emacs(の置換)と
perlのそれぞれで、

「日本語の文字列」を指定する正規表現が知りたいのですが、
どこを見ればよいでしょうか?

「ASCII文字を含まない文字列」でもOKです。


718 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 13:33:02 ]
>>717
(info "(elisp)Regexp Backslash")
| `\cC'
| matches any character whose category is C. Here C is a character
| that represents a category: thus, `c' for Chinese characters or
| `g' for Greek characters in the standard category table.

というのがあるんだけど、C の説明が無いね。
\cj だった気がするけど、不具合があるかもしれん。

ASCII 以外だと、↓これはいかが?
(info "(elisp)Char Classes")
| `[:multibyte:]'
| This matches any multibyte character (*note Text
| Representations::).


719 名前:名無しさん@お腹いっぱい。 [2008/06/03(火) 14:36:53 ]
>>718

ありがとうございます。emacsのinfoではなく、
elisp infoにあるんですね。

「日本文字にはさまれたascii空白」を検索したかったので、

emacsでは"¥cj ¥cj" でだいたいよさそうです。

(どういうわけか
[:multibyte:]や[:nonascii:]
という指定は
C-u C-s などではうまく動いてくれないようなのですが・・・
(ascii文字の一部にマッチしてしまう)


720 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 14:41:33 ]
>>719
> (どういうわけか
> [:multibyte:]や[:nonascii:]
> という指定は
> C-u C-s などではうまく動いてくれないようなのですが・・・
> (ascii文字の一部にマッチしてしまう)

[[:multibyte:]] としんとだめやよ。



721 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 18:33:15 ]
あ、そういうことか!どもです。

722 名前:名無しさん@お腹いっぱい。 [2008/09/04(木) 15:15:43 ]
ttp://codezine.jp/article/detail/1573
やたら難しいのですが。
詳説正規表現を読めば、解けるようになりますかね?


723 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/09/05(金) 01:34:49 ]
>>722

難しいか? それ。


724 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/09/18(木) 18:37:47 ]
>>722
プログラミングperlの正規表現の解説部分を
読んでもなんとかなるかも(´・ω・`)

725 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/09/28(日) 20:34:23 ]
>>722
詳説正規表現は文字通り「詳説」。
正規表現を使うことが目的の人にはヘビーすぎる。


726 名前:わいきむら [2008/10/20(月) 09:09:22 ]
空の文字クラス'[]'はどういう意味になりますでしょうか?
あと'-'が文字クラスの最後にある場合もダッシュとマッチせよ
という意味になるのでしょうか?

727 名前:わいきむら [2008/10/20(月) 09:12:46 ]
すみませんダッシュじゃなくてハイフンですか

728 名前:船木康博 [2008/10/20(月) 09:14:08 ]
さーてと、
パソコンに於ける衛生面についてカキコして、
とりあえずここらでアクティブソナーにQSYするかなー♪

・VDT症候群に注意。
・腱鞘炎に注意。
・大音量による聴覚障害に注意。

マウスは玉の有り無しで、オスとメスがあるでよ。
光にも種類があるし、トラックボールもあるし。たまには玉の辺りの掃除でもしてやってくれ。
ボタンも林檎の1個や米窓の2個じゃなくて、SUNあたりなら3個あったんじゃねぇかなぁ。
最近じゃあ、ホイールも回転方向以外に左右に振れるのもあるでよ。

最後は、鍵盤だ。雑菌が繁殖して、便所より汚いモノもあるでなぁ。
病気移しちゃあいけねぇで、触らせる相手は自分で判断して制限しろよ。
おいもかはまぐり触った手かもしれねぇし、汁がとんでるかもしれねぇからな。

729 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/21(火) 02:39:30 ]
>>726

中身が空の [] はわからんが、末尾のハイフンはその通り。
範囲指定じゃなくてハイフンそのものとして解釈される。


730 名前:名無しさん@お腹いっぱい。 [2008/10/22(水) 17:48:58 ]
質問させてください。

Fortranのコードから、「subroutine abc()」「 subroutine abs()」のような
サブルーチンの開始行だけをgrepで抽出したくて
grep ^\s*subroutine ./*.f90
と書いたのですが、「 subroutine」で始まる行がマッチしていないようです。
どのようにしたらこれをマッチさせられるか教えてください。

ちなみに、コード内には
「! subroutine abc()」「!subroutine abc()」なども含まれています。



731 名前:730 [2008/10/22(水) 19:23:26 ]
>>730どなたか、ほんとお願いします!!

732 名前:ウサチャソ ◆/0IEZmXnQ6 mailto:sage [2008/10/22(水) 21:00:29 ]
>>730
' とか " で括ってないとか?

話逸れるけど、grep は egrep が一番速いらしいよ。
egrep は「(・∀・)イイ!! 」grep!
なんっつってw

はぁ〜…

733 名前:730 mailto:sage [2008/10/22(水) 21:25:28 ]
>>732そのとおりでした。

grep "^\s*subroutine" ./*.f90
としたらうまくいきました、ありがとうございます。


.....なんでこんなことに.....orz orz orz

734 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/23(木) 03:40:28 ]
「(・∀・)イイ!! 」grep!

735 名前:名無しさん@お腹いっぱい。 [2008/11/08(土) 14:16:27 ]
ムズいなこれ

codezine.jp/article/detail/3039
codezine.jp/article/detail/2676


736 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/11/15(土) 20:26:45 ]
機能的にegrepのが遅そうな気がするけど

737 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/11/19(水) 14:37:34 ]
>>735
正規文法(正規言語)には定義があるけど
正規表現に「数学的に厳密な定義」は存在しないと思うんだけどねー
まあ>>51でがいしゅつだったからどうでもいいや


738 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/04/26(日) 16:15:06 ]
教えていただけますでしょうか。

1(文字列A)文字列B

というものを
(文字列A)文字列B

にするのはどう書けばよいのでしょうか。
文字列A、文字列Bとも長さは不規則です。

739 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/04/30(木) 17:32:03 ]
sed 's/^.//'

740 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/04/30(木) 17:38:33 ]
すみませんが詳しい方のみ回答をお願いします



741 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/04/30(木) 18:41:27 ]
日本語や英語など特定の文字列をgoogle検索のリンクにしたいです。
例えば、「正規表現」という文字列をgoogleのリンクにしたい場合だと、

正規表現(せいきひょうげん、regular expression)とは、
文字列の集合を一つの文字列で表現する方法の一つである。
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
<a href="www.google.co.jp/search?q=%90%B3%8BK%95\%8C%BB">正規表現</a>
(せいきひょうげん、regular expression)とは、
文字列の集合を一つの文字列で表現する方法の一つである。

としたいです。ただし
・繰り返し1語1語適用することで複数の単語をリンク化する
 または一発で複数の単語をリンク化する方法でもいい
・すでにリンクされているものを二重にリンクしない
・タグ内の文字列はリンク化しない
・英語は文章内の単語が完全一致すればリンク化し、
 日本語は部分一致したらリンク化する
・英語の連語には対応しなくていい。
・リンク化したい文字列が「正規」「正規言語」などのように
 「正規」⊂「正規言語」という関係のものは想定しない
使う言語はAWK、Sed、Perlのいづれかとする。

お願いします。

742 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/04/30(木) 19:14:08 ]
その質問は正規表現スレで扱う範囲を越えてます。

743 名前:名無しさん@お腹いっぱい。 [2009/05/18(月) 22:21:54 ]
8桁の10進数を文字列とみなしたとき、
下2桁が"00"でない文字列をヒットしたい。如何すればよいか?

744 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/05/18(月) 22:33:28 ]
[0-9]{6}[1-9]{2}

745 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/05/19(火) 08:56:24 ]
[1-9][0-9]{5}([0-9][1-9]|[1-9][0-9])

746 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/03(水) 22:23:08 ]
正規表現でアルファベット6文字というのはどう書けばいいでしょう?

[A-z][A-z][A-z][A-z][A-z][A-z]

これじゃださいですよね?

747 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/04(木) 09:42:14 ]
[A-z]{6}

748 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/04(木) 09:57:06 ]
[A-z]だと[\]~_`を含むよ。[A-Za-z]{6}にしなはれ

749 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/04(木) 10:22:05 ]
POSIX 正規表現が使えるなら [[:alpha:]]{6} とか。

750 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/04(木) 10:29:36 ]
POSIX文字クラスはロケール依存の罠があるから避けた方が無難と思う



751 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/05(金) 02:21:52 ]
POSIX 文字クラスって [[:isalpha:]] みたいのを言うんじゃなかったっけ?



752 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/05(金) 02:23:34 ]
おっとなんか馬鹿なこと書いてしまった。

[a-z] も locale でどうマッチするかかわったりするよ?


753 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/13(土) 13:28:45 ]
ホント? \w とかなら変わると思うけど、
[a-z] は locale に依らず ASCII コードの範囲になるのでは?

754 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/17(水) 02:14:08 ]
書き込み禁止されてた。

>>753
どのUNIXでもそうなるとは断言できないけど、locale が en_us.UTF-8 とかのときに
a-z が aAbB….yYz な集合になるものもあるよ。

POSIX的には コード順だと定義はしてはいなかったはず。



755 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/17(水) 08:44:18 ]
文字列の範囲はロケールに依存する。例えば、エストニア語のアルファベット
では、s の後に z があり、その後は t、u、v、w、x、y と続くので、[a-z] で
はすべての小文字のアルファベットにマッチしない

756 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/22(月) 05:54:23 ]
うふふ

757 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/25(木) 21:28:07 ]
>>754
それはlocaleの問題でもOSの問題でもないだろ
例えばlgrepはデフォルトがcase insensitiveだし


758 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/26(金) 17:56:44 ]
>>757
問題が理解できてないようだな。君は話に加わらなくて良いよ。

759 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/26(金) 18:09:55 ]
それだけだとかわいそうなので補足すると、
>>754 が言ってるのは case sensitivity の問題じゃないよ。

>>754 のレスの「aAbB….yYz」をよーく目をこらしてみてごらん。
ロケールによってはこういう不思議現象が起こるのよという話。

760 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/13(月) 21:38:46 ]
ジオ落ちててonigurumaのソースが落とせん。
だれかミラー的なもの知らない?



761 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/13(月) 21:50:51 ]
いや、あったは、ミラー。<mirrorservice.orgとか

762 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/09/19(土) 19:50:17 ]
()内の、で区切られたものを
1(あああ、1) → 1(1、あああ)
2(ううう、3) → 2(3、ううう)
3(えええ、1) → 3(1、えええ)
のように入れ替えたいです。
条件は
・括弧は半角全角どちらでも対応。出力はどちらかに統一する。
・(あああ、いいい、ううう)のように3つ以上あるのは無視する

それと、こうやってもうまくいかないのは何故でしょうか?
sed -e 's/(/\(/g' -e 's/)/\)/g' -e 's/、/,/g' test.txt |
sed 's/\(([^,)]*),([^,)]*)\)/(\\2、\\1)/g'

763 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/09/19(土) 19:51:30 ]
こうやれば望みどおりの結果は出たのですが、
汎用性が低いのでもっとちゃんとしたのを作るにはどうしたらいいですか?

#!/bin/awk -f
BEGIN { FS="((|)|\\(|\\)|、| | +)" }
{
{print $1"("$3"、"$2$4")";}
}

764 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/12/05(土) 13:45:25 ]


765 名前:名無しさん@お腹いっぱい。 [2010/06/02(水) 05:32:30 ]


766 名前:名無しさん@お腹いっぱい。 [2010/06/02(水) 17:20:06 ]
arrow3.way-nifty.com/shige/images_pc/RegExp.png
www.codezine.jp/static/images/article/1655/config.jpg
mckyblog.img.jugem.jp/20090724_436625.png
www19.atpages.jp/imagelinkget/get.php?t=v&u=makotowatana.ld.infoseek.co.jp/VBScriptRegularExpressions.png
makotowatana.ld.infoseek.co.jp/text.gif


767 名前:名無しさん@お腹いっぱい。 [2010/09/23(木) 21:58:59 ]
行頭にある>以外の>を置換したいのですが、どのように記述できるでしょうか?


768 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/24(金) 11:09:22 ]
>>767
ヘタレな処理ですみません。動けば正義。
echo '>1>2>3>4>5>' | perl -ne '/^(.)(.*)/; ($a,$b)=($1,$2); $b=~s/>/*/g; print "$a$b\n";'

769 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/10/03(日) 22:07:49 ]
>>767
行頭にもし「>」が複数有れば二ツ目以降を削除する処理と
「>」以外が一文字以上続いてから「>」が一文字以上出現する文字列を
「>」以外が一文字以上続いている部分に置換する。
以上。

770 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/10/10(日) 09:52:22 ]
>>769
性器表現で書けよニダ



771 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/10/11(月) 21:58:34 ]
>>770

^>>+とか[^>]+とか
あえて書くことに意味は無いし、
削除や置換は正規表現では書けない。

文章の表面ではなく、コンテキストを嫁。

772 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/12/12(日) 10:48:21 ]
/RegEx/ - 便利な正規表現、みんなで共有
regex.gkbr.me/

773 名前:名無しさん@お腹いっぱい。 [2011/01/11(火) 08:29:20 ]

EmacsとpTeXを使っています。
pTeXでは日本語の括弧はいわゆる全角で書かないときれいに出ないみたいなので、
「(日本語)」のような表現を一発で「(日本語)」のように変換したいたと思うのですが、
これはどう書けばいいのでしょうか。

(日本語abc)や(Abc日本語)や(Abc日[改行コード]本語)のようなものにも
対応しなければならないような気がします。(abc)のようなのはそのままにしておきたいです。
てことは、 「両端が()で、()のなかにmultibyte文字が1文字でも入っているもの、複数行にも
マッチする」という条件でよさそうなのですが、どうでしょうか。

"([[:multibyte:]]+)"で(日本語)の形のやつまではわかったのですが、
その先に進めません。PerlのスクリプトでもOKですので教えてもらえないでしょうか。



774 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/01/11(火) 15:02:53 ]
>>773
入れ子になった括弧には未対応。
(replace-regexp "(\\([^\\(]*[[:multibyte:]][^\\)]*\\))" "(\\1)")

# pLaTex で otf 使えば大丈夫だったような?

775 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/01/11(火) 17:55:06 ]
ありがとうございます。うまく動くようです。

OTFパッケージの方は実験してみましたがやっぱり()と()は区別しているような・・・

776 名前:名無しさん@お腹いっぱい。 [2011/03/12(土) 12:19:28.18 ]
apacheのmod_rewriteでURLを書き換えたいと思っています。
以下が.htaccessのコードになります。
-------------------------------------------------------------------------
RewriteEngine On
RewriteRule ^([a-z0-9_-]+).htm$ execute.php?id=$1
-------------------------------------------------------------------------

例えば、”moge/test.htm”にアクセスすると”moge/execute.php?id=test”と同じようになるというものです。
ディレクトリにはexecute.phpの他にindex.htmを置きたいと思っているのですが、上のhtaccessを設置すると、”moge/execute.php?id=index”に飛ばされてしまいます。そこで、正規表現で特定の単語(index)を除外するにはどうすればいいのでしょうか?
ご回答お願いします。

777 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/12(土) 14:53:45.34 ]
Rewriteが htmなら

index.html ファイルにする

778 名前:776 mailto:sage [2011/03/12(土) 15:37:35.48 ]
>>777
あ、なるほど
確かにそれでもいけますね
さんくすです

ちなみに正規表現で特定の単語だけ除外っていうのはできないのでしょうか??

779 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/16(水) 20:14:08.75 ]
否定先読みでおk
あとマルチ乙

780 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 11:43:28.27 ]
すっごく基本的なことで申し訳ないんだけど
aaaを含んでいてbbbを含まない行
ってのはどう書くんですか。



781 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 12:00:15.87 ]
それは正規表現だけでやらなきゃだめなのかい?

782 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 12:06:43.95 ]
grepでログの特定行を抽出したくて

783 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 12:20:13.45 ]
grep -v

784 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 12:29:14.56 ]
>>782
GNU grep で grep aaa logfile | grep -v bbb ってのじゃだめ?

785 名前:784 mailto:sage [2011/03/29(火) 12:30:38.86 ]
かぶったか

786 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/03/29(火) 12:47:45.98 ]
ああ、そっか。-v
ありがと

787 名前:名無しさん@お腹いっぱい。 [2011/04/08(金) 01:34:57.59 ]
vimの置換で以下のようなデータを置換したいです
hoge(半角空白*****)\tsage\t

hoge\tsage\t

:%s/ //g だとhogeが ho ge だったりもするので
半角空白が続く\tを\tにしたいです。
どなたかご教示お願いします

788 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/04/08(金) 02:09:54.62 ]
>>787
:%s/ \+\t/\t/g
とか?

本当にやりたいのは gg=G とか Align じゃないの

789 名前: 忍法帖【Lv=11,xxxPT】 [2011/06/22(水) 16:55:34.67 ]
aからz、かつAからZ、かつ0から9、かつその他記号(!"#$...)を含ませたいです。
[a-z&&A-Z&&0-9&&[^a-z^A-Z^0-9]]
とやってみたのですがうまく行きません。(´;ω;`)
どう表現すればいいでしょう。

790 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/06/22(水) 17:10:25.90 ]
.



791 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/06/22(水) 17:38:34.78 ]
>>789
むしろ含みたくない文字を列挙したほうが早いんじゃね?

792 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/06/23(木) 00:03:09.64 ]
>>789
それは印字可能な文字から空白を除いたものなんじゃあないのかい

793 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/07/08(金) 22:03:29.79 ]
肯定条件と否定条件、常にペアで考えたいところです

794 名前:名無しさん@お腹いっぱい。 mailto:sage [2011/08/03(水) 03:28:35.00 ]
>>787

:%s/\(半角空白\**\)//g

・・・ではなくて、Excelでいう所のtrim関数みたいな動作か?

795 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/03/07(水) 21:00:09.49 ]
gsedをターミナルで実行したとき、
丸数字の1〜20が[\x{2460}-\x{2473}]でマッチせず
「無効な範囲の終端」というエラーメッセージが出ます。
何を間違えているのでしょうか。


796 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/03/07(水) 22:36:48.15 ]
>>794
> :%s/ //g
当人がチャレンジした結果がこれだから、タブ区切りの各値をtrimしたいんだろうと思うよ。

> 半角空白が続く\tを\tにしたい
ってことだから>>788でいいと思う。でも>>788の後半は違うと思う。

797 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/03/07(水) 22:41:28.98 ]
このスレ最近見てたと思ってたのに、8月だと…

798 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/03/08(木) 05:24:46.29 ]
>>795の自己レス
よく解らないのだけど、コードでなくそのまんま@からS(文字化けしていたらごめんなさい)
まで、1行ずつの置換行を書き並べたらうまくいきました。
コードだと1行ずつ書いてもダメでした。エラーは出なかったからコード間違えたかな。


799 名前:名無しさん@お腹いっぱい。 [2012/05/27(日) 23:08:25.45 ]
linuxのgrepでgreenとつく単語を検索したいのですが、どういう正規表現を使えばよいのでしょうか

800 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/28(月) 08:03:03.12 ]
>>799
くだらねえ質問はここに書き込め! Part 200
engawa.2ch.net/test/read.cgi/linux/1335349596/



801 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 18:47:33.56 ]
リンゴ 1個
ミカン 2個
イチゴ 1個
スイカ 1個
スイカ 3個
ナシ
トマト
トマト
トマト
パイナップル

802 名前:アップミス失礼しました mailto:sage [2012/11/13(火) 18:51:10.04 ]
リンゴ 1個
ミカン 2個
スイカ 1個
スイカ 3個
イチゴ 2個
トマト 1個
トマト 3個
トマト 5個

リンゴ 1個
ミカン 2個
スイカ 1個 3個
イチゴ 2個
トマト 1個 3個 5個
のように整理したいとき、正規表現で実現可能ですか?

803 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 21:24:23.96 ]
何言ってんだ。

804 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 02:50:13.58 ]
>>802
例えば
sed
toro.2ch.net/test/read.cgi/unix/1085730992/l50

805 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/16(金) 20:13:34.67 ]
リンゴ 1個
スイカ 1個
ミカン 2個
スイカ 3個
イチゴ 2個

元データがこうなってない前提ならできるかもしれない

806 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/16(金) 21:56:43.28 ]
なってても出来ないことはないと思える

807 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/17(土) 00:18:53.21 ]
いや、正規表現どうこうって話じゃないだろ

808 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/17(土) 03:31:10.85 ]
まあ、そうだね

809 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/17(土) 15:01:28.93 ]
出発点になるテキストが規則的であればあるほど作業が楽になる。

810 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/17(土) 16:45:39.64 ]
sedスレで聞いてないね。perlやawkなど、どこか他で見た? ってか、本人どうしたの?



811 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/18(日) 02:35:29.83 ]
釣りだったようだな。

812 名前:802 mailto:sage [2012/11/20(火) 15:26:50.28 ]
いろいろ研究中ですが、釣りじゃありませんw
他のスレにまで投稿すると、マルチで蹴られてしまうからです。

813 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/20(火) 16:03:55.39 ]
マルチは同じ話題が並行して進行するのが問題。
ちゃんと移動すればマルチじゃないよ。

814 名前:名無しさん@お腹いっぱい。 [2012/11/20(火) 18:49:22.20 ]
以下のような文章があったとします。
〜aaa〜bbbaaa〜bbbaaa〜bbb〜
(〜は文字数の定まっていない文字列を表しています。)
ここから、それぞれ最初のaaa〜bbbだけを抽出、真ん中のaaa〜bbbだけを抽出、最後のaaa〜bbbだけをで抽出したい時、どう正規表現で表せばよいのでしょうか?

815 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/20(火) 20:13:44.36 ]
sedじゃだめなのかよ

816 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 02:55:30.50 ]
「aaa」と「bbb」を例えば「【」「】」に置き換えてみると楽かも。
【があって、】以外のものがあるかないかして、】があったとき
が検索パターンってことになるよね。ここまでが正規表現。
その後は、1回目にマッチしたときだけ吐き出す、最後にマッチしたものだけ……
は、何を使うかで変わってくる。

817 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 07:09:17.34 ]
>>816
「【」「】」に置き換えるんじゃなく、「aaa」と「bbb」の例でお願いします。
「【」「】」みたいな1文字じゃなく、「aaa」「bbb」みたいな複数文字なので。
しかも、「aaa」と「bbb」の間に普通の文字としてa bもあります。

818 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 08:20:17.05 ]
こいつ、何もわかってない

819 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 10:34:37.69 ]
perlの正規表現使わないと無理だと思うよ。

820 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:10:04.60 ]
こんな感じかな?
aaa[^b]*\(b\{0,2\}[^b]\+\)*b\{0,2\}bbb



821 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:16:22.41 ]
>>813の直後なのにマルチ

822 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:18:53.62 ]
移動してるからマルチじゃないだろ

823 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:27:34.16 ]
もっとタイムリーに本人出てこないとダレるわ

824 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:41:33.62 ]
>>822
toro.2ch.net/test/read.cgi/tech/1340383120/421

825 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:43:27.15 ]
>>824
おお、なるほど。
そんなところにも正規表現スレあったのか。

826 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 11:48:07.59 ]
マルチか。もう知らん。

827 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 19:22:47.43 ]
別人だと言ってるけど、それにしては似すぎ

828 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 19:39:46.55 ]
こっちの見て書いたんだろ。
別人だとしてもマルチと変わらんな。

829 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 19:53:25.11 ]
ここにもある。なんか、もうやだw

シェルスクリプト総合 その21
toro.2ch.net/test/read.cgi/unix/1352973453/l50

830 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 19:55:53.48 ]
というよりシェルのが大元なのか。まあ、移動すると書いてあるからいいか。



831 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/21(水) 23:32:17.64 ]
こっちの奴は句読点付けてるのな

832 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/22(木) 00:06:51.47 ]
> シェルスクリプトスレより誘導されてきました
って書いてあんじゃん。ってかなんでこっちのスレで話を続けてるのかがわからん。
マルチうざい放置でスルーしよ

833 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/22(木) 00:32:49.10 ]
どっちが偽物とか関係なく、向こうの正規表現スレだけで進行させときゃ済む話だしな






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<179KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef