- 889 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 05:41:07 ID:gGfErR5e0]
- 理解を助ける為に、例えば文字列 "foobarbaz" について、
"|f|o|o|b|a|r|b|a|z|" という具合に、各文字間に仕切り線(これは文字ではない。 あくまで便宜的に表示したもの。この文字列の長さは9である)があるものと思うことにしよう。 この場合、肯定先読み "(?=baz)" ってのは 「"baz" にマッチする(けど、"baz" は取り込みや置換の対象とはしない)」 のではなく、 「その仕切り線に "baz" が続く、そのような仕切り線」にマッチする。 つまり上の例で言えば、7本目の仕切り線にマッチする。 肯定/否定先読みがマッチするのは、「(幅を持った)文字」ではなくて 「(ゼロ幅の)位置(便宜的に"|"で書き表したもの)」なのである。 前読みとか戻り読みとか呼ばれるのも同じ。 肯定戻り読み "(?<=foo)" ってのは、 「"foo" にマッチする(けど、"foo" は取り込みや置換の対象とはしない)」 のではなく、「"foo" に続く仕切り線」にマッチする。 つまり上の例で言えば、4本目の仕切り線にマッチする。 要するにだ、正規表現 "(?=foo)bar"(Proxomitron でいうところの "(^(^foo))bar")ってのは、 「その仕切り線に "foo" が続く、そのような仕切り線と、更にその仕切り線から続く "bar"」 を検索していることになる。 同時に同じ場所に "foo" と "bar" とが存在するわけなどなく、これは絶対にマッチしない。
|

|