[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 04/08 07:38 / Filesize : 228 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

くだすれPython(超初心者用) その16



1 名前:デフォルトの名無しさん mailto:sage [2013/01/21(月) 16:36:03.35 ]
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますが、お礼は Python の布教と初心者の救済をお願いします。

エラーを解決したいときはエラー表示や環境(バージョン/IDE or command line)を略さずに書き込んで下さい。
騙りが頻発しています。質問する方は一時的なトリップをつけることを検討して下さい。
次スレは >>985 辺りで

前スレ
くだすれPython(超初心者用) その15
toro.2ch.net/test/read.cgi/tech/1350718465/
関連スレ
Pythonのお勉強 Part48
toro.2ch.net/test/read.cgi/tech/1358750040/
【実験台】 Python 3.0 のお勉強 Part 1 【非互換】
toro.2ch.net/test/read.cgi/tech/1235050215/
◆関連リンク
Python の Home Page
ttp://www.python.org/

79 名前:デフォルトの名無しさん mailto:sage [2013/01/29(火) 00:52:35.57 ]
>75
正規表現を2回使ってるけど,1回で目的は実現できると思う.
p = re.compile(ur'(.*?。それは(「.*?である。」))')
として,
L = p.findall(line)
とする.
最短一致".*?"を使うことで1行に
(A。それは「Bである。」)
が複数あってもLには
(A。それは「Bである。」)
のパターンに当てはまる全ての要素が格納される.
でもって,「.*?である。」を半角カッコでくくることでグループのリストが入る.(参考: ttp://d.hatena.ne.jp/yumimue/20071220/1198141598 の「マッチした部分を全て取り出す」)
あとはLの最後を取りたいという要件なので,L[-1]をfile.txtに書けば良い.

以上を踏まえて,こんな感じでどうでしょうか?
# coding: utf-8
import re, codecs
p = re.compile(ur'(.*?。それは(「.*?である。」))')
f = codecs.open('file.txt', 'w', 'utf-8')
for line in codecs.open('a.txt', 'r', 'utf-8'):
  L = p.findall(line)
  if L:
    f.write(L[-1] + '\r\n')
    print L[-1]
f.flush()
f.close()

80 名前:デフォルトの名無しさん mailto:sage [2013/01/29(火) 09:43:15.98 ]
最短マッチの使い方
pattern = ur'(([^。(]+)。それは「([^。]+)である。」)' # 行の全ての (A。それは「Bである。」) にマッチ
last_match = ur'^.*' + pattern # 行の最後に現れるパターンだけにマッチ
first_match = ur'^.*?' + pattern # 行の最初に現れるパターンだけにマッチ
これをfinditerでループを回せばどれでも望みの結果が得られる。






[ 続きを読む ] / [ 携帯版 ]

次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<228KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef