[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 02/03 08:16 / Filesize : 179 KB / Number-of Response : 834
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

正規表現



1 名前:正規表現 mailto:正規表現 [02/12/06 18:09]
正規表現

241 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/16 01:42]
単語に「マッチしない」のは
どうやれば? ^\<word\>
じゃないし。


242 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/16 03:07]
>>241
そりを正規表現(だけ)で実現するのは難しいのでは?

普通は、grep なら -v とか、スクリプト言語なら !~ /word/ とかするんじゃないかと。

243 名前:189=207 mailto:sage [03/05/16 08:24]
>>241
perlの拡張正規表現を使えば出来るよ。
/^(?!.*word)/



244 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

245 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/24 22:45]
オ来リーの者じゃありませんが・・・

『詳説 正規表現 第2版』

Jeffrey E. F. Friedl 著
田和 勝 訳

2003年5月発行 -- 5月27日発売
464ページ
本体価格5,400円
ISBN4-87311-130-7

テキストやデータの処理に欠かせない強力なツールとして瞬く間
に普及した「正規表現」。現在ではPerl、Java、VB.NETやC#など
数多くの言語やツールに標準で装備されています。その幅広い可
用性、柔軟性と比類ない強力さにもかかわらず、実際に正規表現
を使いこなすことは難しいです。本書は正規表現の概念を詳細に
掘り下げる一方で、数多くの言語やツールの実例を示しながら、
正規表現についての理解を深める解説書です。第2版では、豊富
な実例を使い、詳しくていねいに解説するスタイルはそのままに、
Perl5.8の新機能に加え、Javaと.NETの正規表現にもそれぞれ独
立した章を設けるなど、全編にわたって大幅に加筆がなされまし
た。正規表現の本質を読み解く決定版です。とくに正規表現を使
いこなしていると自負している人にほど読んでほしい本です。


246 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 00:29]
あれ?今日買ってきたんだけど27日発売だったのね…

247 名前:名無しさん@お腹いっぱい。 mailto:age [03/05/25 00:43]
>>246
つーことで発売記念age

248 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:23]
素数にマッチする正規表現募集。

249 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:38]
>>245
第1版と比較してのレビューきぼんぬ



250 名前:名無しさん@お腹いっぱい。 mailto:半額きぼんぬ sage [03/05/25 03:44]
>>249
> 2003年5月発行 -- 5月27日発売
とあるからまだ無理なのでは

251 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:49]
>>248
正規表現だけでなく、なんかしら言語使ってやればよい。

252 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 03:56]
>>248
何故敢えて茨の道を行くのか?

253 名前:名無しさん@お腹いっぱい。 [03/05/25 05:07]
>>245
これの第1版買ったのですが、いまいち難しかったです。
もっと易しい本ってないですか?

254 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/25 05:35]
>>253
Ruby の初・中級者なら、「Ruby Magic―Rubyで極める正規表現」はお勧め。

255 名前:245 mailto:sage [03/05/25 10:21]
>>249
第1版を持ってないので比較は出来ないっす。
# 買おうと思ったら第2版が出ることを知ったので待ったのだ。

ここに特徴や目次が紹介されているので見てもらうとして
  ttp://www.oreilly.co.jp/BOOK/regex2/
  ttp://www.oreilly.co.jp/BOOK/regex2/contents.htm

まえがきから第1版との違いを判断すると
  - Unicodeのちょっとした解説
  - Perl5.003からPerl5.8対応に
  - Java1.4のjava.util.regexと、その他6つの正規表現パッケージの比較
  - .NET framework正規表現の特徴と問題点、M$のドキュメント(貧弱らしい)の補足
のように言語サポートが新しくなった/増えたって感じ。

最初はHTMLのサンプルを少々追加する程度の予定(3ヶ月の見込み)だったみたいだけど、
結局は2年の歳月をかけて全面的に加筆修正することになったそうだ。

難易度は第1版と変わらないのではないかな?
# 読み易くなってるのかもしれないけど。。
>>253の期待には応えられないと思う。
> とくに正規表現を使いこなしていると自負している人にほど読んでほしい本です。
という宣伝文句があるくらいだしね。

>>250
いや、24日に買えたのよ。

256 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 11:05]
今日発売か。
昼休みに買ってくるか。


257 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:10]
>>256さん、どうですた?


258 名前:249 mailto:sage [03/05/27 21:28]
>>255 さんのと、今日立ち読みした感じで、第2版も購入することにしますた。
そういえば、翻訳者 (監訳者) が変わってたんですね。

259 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:29]
sed のタグ付き正規表現についてちょっと教えれ。たとえば、

{________I'm_dreaming_of_a_White_Christmas_}
{_Just_like_the_ones_I_used_to_know__}
{____Where_the_tree_tops_glisten_}

の前後の余計な _ のトリミングをしようと思って
sed 's/{\(_*\)\(.*\)\(_*\)}/{\2}/g'
とやっても意図した結果にならない。\2 をうまくマッチさせる方法は?

まぁこの例なら簡単に逃げられる - たとえば sed 's/{_*/{/;s/_*}/}/' -
わけだが、apache の log とかの簡単なパース(並び替えとかそんな程度)を
タグ付き正規表現でさくっと処理できれば楽でうれしい。よろしく。



260 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/27 21:38]
二個目の*がlongest matchしようとして
3個目の*にmatchさせたいであろう_まで持っていってしまうのが原因。

sed -e 's/{_*\(.*[^_]\)_*}/\1/'

261 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 00:59]
'<,'>s@^@//@

262 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 01:03]
最少マッチって perl とか ruby にしかない?
sed, grep 等の伝統的 tool にはないの?

263 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/28 01:07]
>>262
ないよ

264 名前:名無しさん@お腹いっぱい。 [03/05/28 14:45]
>>262
grepに最小一致の機能があったとして
それの魅力はイッタイ何なのだろうか?


265 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

266 名前:262 mailto:sage [03/05/28 20:42]
確かに sed では使っても grep では使わないかも。
いや、でも後方参照する時に必要なこともありえますね。


267 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/29 10:14]
>>257
昼休みにいきつけの書店にいったが売ってなかったんで。
帰りに別の書店で買った。
でもまだ読んでない…
通勤時間に読むっつーてもあれを毎日持ち歩くのは
重たいしなぁ。


268 名前:名無しさん@お腹いっぱい。 [03/05/30 21:59]
文字列中、丸括弧(全角、半角問わず)で閉じられた部分を取り出す表現を考えているけど、うまくマッチしてくれない。
(丸括弧の中に丸括弧は含まない。Perlの正規表現を使用)

$string = '(22(1)';
if($string =~ /[((]([^()()]*)[))]/){
print $1;
}
else{
print "No match..";
}

この場合は"1"がマッチするのを期待しているのだけど、なぜか"22"の部分がマッチした。
OS(UNIX/WinXP)、Perlのバージョン(5.0/5.8)の異なる環境で同じことを確認したけど、結果は変わらず。
さらに、文字コード(Shift-JIS/EUC)の違いでも、結果は変わらなかった。

"1"をマッチさせる別の表現はないですかね?

# 全角"("の中にどうも半角")"の文字が隠れてるのかなぁ?(あくまでも推測)



269 名前:名無しさん@お腹いっぱい。 mailto:sage [03/05/30 22:42]
>>268
おめな、2byte文字と1byte文字が同じに扱われると思ってるらしいな。たぶん、
文系のドキュソだな。しかも、すぐ上で2byte文字コードの話出てたの見てね
えな。こいう、初心者質問は、webprogのPerl初心者スレ逝け。





270 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/05 14:26]
>>268
Perl5.8.0 + UTF8 でやったら 1 になったよ。


271 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:10]
[ ] のなかに '-' と ']' の両方を入れたい場合はどうすればいいのですか?

272 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:20]
>>271
何で?

273 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/07 12:29]
>>271
[]-]

274 名前:名無しさん@お腹いっぱい。 mailto:sage [03/06/17 23:25]
>>271
!.-[

275 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/03 21:13]
保守

276 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/08 11:49]
regexp ml盛り上がってますね。読んでて楽しい。


277 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/08 14:02]
このスレはいつからまともな人たちをヲチするようになったのですか?

278 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 21:26]
すいません、テキストファイルの中の .bananaなどの単語(行頭ではなく)の先頭が
ドットがあるものだけをgrepで抜き出したいのですが、jp.appleのような単語までひっかかって
しまい上手く絞り込めません。

アドバイスをお願いします!!

279 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 21:54]
>>278
\b?\.\w+?
で、どうじゃろ?



280 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 22:44]
>>279
すいません、なんか上手くいかないです。
ls -laでディレクトリ内の全ファイルを表示して、grepで隠しファイルだけを抽出したかったのですが。

281 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 23:34]
ls -la | grep ' \.'
ではあかんの?


282 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/12 23:57]
>>281
行のどこかに"."があれるとヒットしてしまうんです

283 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:28]
ls -la | grep '^\.'
こういうこと?

284 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:28]
>>282
とはいえ、"."って、ファイル名にしかでてこないよね?
>>281 をよーくみる。


285 名前:283 mailto:sage [03/07/13 00:30]
間違えた。

ls -1a | grep '^\.'
これか
ls -la | grep ' \.'
これだな。下は余計なものを拾う可能性もあるが。

286 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:31]
ls -d .*
なんてね。


287 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 00:32]
あ、正規表現スレだった。すまん。

288 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 02:00]
ヤハリココハオモッテタトオリバカバッカリダッタナ(プ

289 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 02:57]
ls -la | awk '$9 ~ /^\./{print $0}' はどうよ。



290 名前:名無しさん@お腹いっぱい。 [03/07/13 11:30]
>>280 ふつーそういうときは ls つかわず findつかえ。
find ./ -type f -name "\.*" -print


291 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/13 14:36]
(())

292 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 11:38]
>>290 ふつーそういうときは >> つかわず >> つかえ。

293 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 19:04]
backreferenceを前方参照と訳したのはなぜですか?


294 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:19]
後方参照としている訳もあるよ。
まぁ、現在の位置よりも前を参照するという意味では
日本語的には前方参照であってると思う。
ようするに「今いる位置より戻って参照」って意味になるんだから。

んでも、意味を考えて訳すなら「戻って参照」とか、どう?

295 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:32]
>>294
ちょっと前にCスレで話題になったんだけど、Cで「前方参照」といった場合の前方って、
ファイルの終端方向を指す。「ひどい訳語だ」ってことで話は終わったんだけど、
正規表現でも混乱が見られるしなんかいい言葉ないもんかねえ。

日本語では時間を表す文脈で「前」にまるで正反対の意味があるからよくないのだと思う。
「以前」だと過去だし「前進」だと未来だし。

あとこれはすれ違いか? そうだよね。すまん。

296 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 21:41]
>>279 >>281 >>283 >>284 >>285 >>286 >>287 >>289 >>290

みなさま、ありがとうございます。

シングルクォーテーションに空白が使えたり、
アッパーチルダとハット(キャレット?)の区別を知ったりと、
正規表現の難しさを知りました。

今、「テキストデータ料理学」っていう古い本を読んでいるのですが、
オライリーの正規表現本は買ったほうがいいですか?

(もう2〜3週間前にオライリーのサイトでカタログを注文したのに、
まだ来ない…)

297 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 22:23]
おれは初版も新しいのも持ってるけど、自分の知識に自信がないうちは
お薦めしない。もちろんあったらあったで便利だけど。

やっぱり、「俺、正規表現バリバリだぜーYAH」状態で買って読んで
目からうろこ落ちまくり感を堪能するのがいいんではないかと。

298 名前:名無しさん@お腹いっぱい。 [03/07/14 23:31]
>294
するってえと、正規表現的には日本語で前方参照あるいは後方参照と書いてあったら
どっちもbackreferenceと思えってわけだぁね。
>295
計算機分野だと「前方」という言葉はforwardの訳語というのがあたりめえだと思ってたから、
正規表現関係だと、「前方参照」がbackreferenceのことだっていうのがわかんなくて
難儀したってわけよ。


299 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 23:33]
>>297
>>296は学ぶ意欲を持っているから、今のうちに買っておいて損はないと思う。
むしろ薦める。
オイラリーはハズレが少ないからな。



300 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/14 23:35]
>>298
俺はperlから入ったから後方参照が当たり前かと思ってた。
他言語使うようになってから吃驚したってわけよ。

301 名前:298 mailto:sage [03/07/14 23:43]
perl5の日本語マニュアルで、「前方参照」を "lookahead assertion"の訳語として
使っているやつがあった。

(?=regexp) 長さの無い、前方参照位置指定子。
(?!regexp) 長さの無い、前方参照否定位置指定子。

英語だと

(?=pattern) A zero-width positive lookahead assertion.
(?!pattern) A zero-width negative lookahead assertion.

わけわかんねぇな(w


302 名前:298 mailto:sage [03/07/14 23:48]
ありゃりゃ?

(?<=pattern) A zero-width positive lookbehind assertion.
(?<!pattern) A zero-width negative lookbehind assertion.

"lookbehind assertion" の訳語って何だ?


303 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 00:32]
「俺の背後に立つな」
デューク東郷の格言だろ。

304 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 00:35]
lookahead 見越し
lookbehind 見返り

305 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 01:01]
前後不覚だな。

306 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 03:12]
>>296
>オライリーの正規表現本は買ったほうがいいですか?

持ってなくても覚えられるし、
エディタのサーチとか grep とかで実験しながら
感覚的に慣れるのも悪くないんじゃない?

ただし emacs で覚え始めるのはすすめない。
backslash で混乱する。

307 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/15 07:21]
>>297
>>299
>>306
ちょっと大きな本屋に行って立ち読みしてみます。
ありがとうございました〜

308 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

309 名前:名無しさん@お腹いっぱい。 mailto:age [03/07/17 13:35]
>>308
二度と目を覚ますな。




310 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

311 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/20 21:36]
さげ保守

312 名前:名無しさん@お腹いっぱい。 mailto:sage [03/07/27 22:01]
OOはもうすぐ1.1出るけど、MSWORDよりセキュリティ大丈夫かな?
pc2.2ch.net/test/read.cgi/bsoft/1055292975/392


313 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

314 名前:高校生 [03/08/02 17:12]
boo
baa
baz
っていうテキストが例だとして、sedを用いて、
booまたはbaz、っていう正規表現はどうなるの?
rubyやperlならパイプ記号で条件和の表現が出るけど、
同じように書いてもsedに誤解されてしまう。

315 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 17:52]
>>314 ん? \|使えば良いのでは


316 名前:高校生 mailto:sage [03/08/02 18:06]
sed 's/boo\|baa/hoge/g' ./hage.txt
とかだとやっぱりだめなんすよね。
「boo」とかの単語の括り方がよくわからんのです。

317 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 20:53]
GNU sed 4.0.7版 ではそれでもできてるけどな。
sed 's/\(boo\|baa\)/hoge/g' これでどう?


318 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/02 22:07]
>>317
gsedならできるがsedは食ってくれない。

319 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/03 01:09]
単一の正規表現じゃなきゃいかんの?
sedと決まってるなら
sed -e 's/boo/hoge/g' -e 's/baa/hoge/g'
でいいんちゃう?

置換後の文字列と置換前の文字列の片方とで重なりがある場合
どうするかひとしきりモメたりする ↓↓↓ のがお決まりだな。



320 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/03 09:52]
単一の正規表現でないと記述が冗長で見た目がキモイ、
っていうのはあると思うよ。
おいらはインストール直後のFreeBSDの環境構築をスクリプトに任せたくて、
結局シェルスクリプトにawkな記述を書いて解決した。
カーネルの再構築にしても、/etc/下の記述にしても、要はテキストの置換なわけで。
本当はrubyがFreeBSDの/usr/bin下にあるようなご時世だったら
楽ができるんだけど、そこら辺は個人的な勉強不足だなぁ。

321 名前:名無しさん@お腹いっぱい。 [03/08/13 19:13]
{a,b}上の言語Lが
『aaで開始し、かつ、bbを部分列として含む』という条件を満たす語からなるとき
Lを表す正規表現ってどうなるの?
L=aa(a*b*+bb)* ?

322 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 20:45]
L=aa(a+b)*bb(a+b)*

323 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 22:05]
>>321
*+ ???

324 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:05]
>323
'+'より'|'のほうが普通かな。
L=aa(a|b)*bb(a|b)*

本来的には連接、選択、閉包が表現できればいい。


325 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:08]
L ::= aA
A ::= aB
B ::= aB | bC
C ::= aB | bD
D ::= ε | aD | bD


326 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:34]
.*
何にでもマッチする最強の正規表現です!


327 名前:名無しさん@お腹いっぱい。 [03/08/13 23:50]
>>326
ドットが含まれてなかったらマッチしない罠


328 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/13 23:53]
キター

329 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 00:13]
ageてるし、ネタと見た。



330 名前:名無しさん@お腹いっぱい。 mailto:sage [03/08/14 23:29]
>>329
しね!

331 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

332 名前:あぼーん mailto:あぼーん [あぼーん]
あぼーん

333 名前:名無しさん@お腹いっぱい。 [03/08/28 20:12]
うまづら。

334 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/02 03:30]
ほす。

335 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/14 04:27]
☆湯

336 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 13:49]
[ruby-list:38393] じゃないけど、[a-z] みたいな文字クラスの表現は、
EBCDIC とかだと「意図した通り」には動かないと思うんだけど、
ASCII か ASCII を包含したキャラクタセットという前提で書くべきものなの?

337 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 14:08]
>>336
[:lower:] とかは使っちゃだめ?

338 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/16 15:34]
>>337
あ、いや、質問が悪かったですね。
範囲指定する文字クラスはどうあるべき (書くべき) か?っていう話です。

ていうか、 re_format(7) を私の拙い英語力で読んでみたところ、
ASCII コードの並びを前提とするような文字クラスの範囲指定は、
portable じゃないからやらない方が良い、ということのようですね。

というわけで、極力 >>337 さんのみたいな文字クラス指定を使った方が良い、と。

339 名前:名無しさん@お腹いっぱい。 mailto:sage [03/09/20 10:41]




340 名前:名無しさん@お腹いっぱい。 mailto:sage [03/10/08 15:50]
保守

341 名前:名無しさん@お腹いっぱい。 [03/10/12 16:53]
vimで"DEL"という文字列が含む行で、"DEL"以下を削除したい場合はどうしたらいいでしょうか?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<179KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef