1 名前:デフォルトの名無しさん [2014/01/02(木) 12:52:08.79 ] このスレッドは、他のスレッドでは書き込めない超低レベル、 もしくは質問者自身何が何だか分からない質問を勇気を持って書き込むスレッドです。 へび使いが優しくコメントを返しますが、お礼は Python の布教と初心者の救済をお願いします。 エラーを解決したいときはエラー表示や環境(バージョン/IDE or command line)を略さずに書き込んで下さい。 騙りが頻発しています。質問する方は一時的なトリップをつけることを検討して下さい。 次スレは >>985 辺りで 前スレ くだすれPython(超初心者用) その20 toro.2ch.net/test/read.cgi/tech/1387082467/ 関連スレ Pythonのお勉強 Part49 toro.2ch.net/test/read.cgi/tech/1387528488/ ◆関連リンク Python の Home Page ttp://www.python.org/ ◆長いコードはこういうところにはってください ttp://ideone.com/ ttp://codepad.org/ ttp://pastebin.com/ dpaste.com/ ◆まとめwiki ttp://python.rdy.jp/
70 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 09:36:05.29 ] Pythonでコーディングされてるオープンソースのソフトってどんなのがあるの?
71 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 09:42:19.69 ] 全くありません ゼロです
72 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 09:47:40.52 ] >>70 ja.wikipedia.org/wiki/Python を使っている製品あるいはソフトウェアの一覧 一部 Python で書かれてる的なのも含まれてるので注意
73 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 09:53:04.05 ] Sourceforgeだとこれかな sourceforge.jp/softwaremap/trove_list.php?form_cat=178 (プログラミング言語にPythonを使用しているプロジェクトの一覧)
74 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 10:27:14.21 ] じゃあこんなのも。星 1000 以上 https://github.com/search?l=Python&q=stars%3A%22%3E+1000%22&type=Repositories
75 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 13:26:16.84 ] じゃあ俺も俺も。 https://code.google.com/hosting/search?q=label%3aPython
76 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 16:04:00.58 ] ゴミコードがいくら沢山集まっても、それはゴミの山である ―カーニハン―
77 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 16:27:44.37 ] >>62 pythontutor.com/visualize.html ここにコード書いてステップ実行すると、 1ステップ毎に変数やリストのデータがどのように変化するか表示してくれるので解りやすいよ。 同じリスト内の重複を取り除くのか、2つのリストから差分を除くのか 題意が読み取れなかったけど。リストで順序を保つなら collections.OrderedDict.fromkeys(xs).keys()
78 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 17:40:57.01 ] >>62 import __builtin__ list = ['abc','abcd','bcd','bbt','yyf','zat'] gomi = [] for i in range(len(list)): for j in range(len(list)): if i != j: if list[i] in list[j]: gomi.append(list[i]) break print __builtin__.list(set(list) - set(gomi))
79 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:18:34.03 ] >>62 L = ['abc','abcd','bcd','bbt','yyf','zat'] k = ['abc','bcd'] for i in range(len(L)-1, -1, -1): if L[i] in k: del L[i] print(L)
80 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:21:28.98 ] 含まれるって文字列中にって事だったのか.これで合ってる? src = ["abc", "abcd", "bcd", "bbt", "yyf", "zat"] dst = [x for x in src if all(not x in y for y in src if x != y)] print(dst)
81 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:22:18.95 ] なぜ多くのプロジェクトがPythonの古いバージョンをサポートし続けるのか ストーリー by headless 2014年01月12日 12時55分 developers.slashdot.jp/story/14/01/11/2115245/
82 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:25:49.84 ] not any にした方が効率よかったかも dst = [x for x in src if not any(x in y for y in src if x != y)]
83 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:33:34.51 ] >MozillaのNathan Froyd氏は、Szorc氏の主張はソフトウェアを他の人々に提供する側の視点が欠けていることを指摘している。 >ユーザーがアップグレードを自由に行えるとは限らず、新しいバージョンで削除されたAPIを必要としていることもあるし、 >新しいバージョンで動作するようにコードを修正してテストするのは手間がかかる。 これ何の冗談だよ クソいラピッドリリースをFireFoxに導入しくさってくださりやがりましたMozillaお前がその発言すんのかよ コブラに噛まれて死ね 5回死ね
84 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 18:36:56.81 ] ワロタ
85 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:15:41.16 ] >>82 src = ['abc','abcd','abcd','abcd','bcd','bbt','yyf','zat'] ↑こんな風に重複したものがあると残るからインデックスで比較するのがよさげ dst = [x for i,x in enumerate(src) if not any(x in y for j,y in enumerate(src) if i!=j)] 多重ループ出来るの今日初めて知ったthx
86 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:19:47.69 ] >>81 こっちでやろうや toro.2ch.net/test/read.cgi/tech/1387528488/ >>62 への回答の邪魔になりそうだし
87 名前:85 mailto:sage [2014/01/12(日) 19:25:20.62 ] ごめん間違い、インデックスだけじゃ無理か
88 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:45:10.90 ] dst = [x for i,x in enumerate(src) if not any(x in y for y in src if x!=y) and x not in src[i+1:]]
89 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:46:42.42 ] ideone.com/gMl6bw 関数型?っぽく
90 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:50:50.66 ] >>88 自分のプログラミングレベルだと、その内包表記の詰め込み具合はきつい
91 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 19:52:43.69 ] >>85 リスト要素の重複は、予め取り除いてから篩いに掛けた方がいいかな。 ループの回数も抑えられるし。
92 名前:82 mailto:sage [2014/01/12(日) 20:44:55.26 ] 展開するとこんな感じ dst = [] for x in src: for y in src: if x in y and x != y: break else: dst.append(x) ここのelseは、ifではなく、内側のforに対応するelse。breakで抜けなかった時に実行されます。 結果から重複を取り除く場合は、for y の前に if x in dst: continue で対応。
93 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 22:30:52.10 ] ttp://ideone.com/lRddti os.path.isfileとos.path.existsがうまく行きません 存在しているのにFalseになったり 存在しないのにTrueになったりします なにか勘違いしているところありますでしょうか? python33です
94 名前:93 mailto:sage [2014/01/12(日) 22:41:32.79 ] すいません なんでもなかったです・・・
95 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 23:00:40.74 ] #set(src)の要素のうち、他のどの要素の一部(部分文字列)になっていないもののリスト(順番が変わっちゃうけど) #src = ['abc', 'abcd', 'abcd', 'abcd', 'bcd', 'bbt', 'yyf', 'zat'] #なら dst = ['abcd', 'yyf', 'zat', 'bbt'] dst = [x for x in set(src) if all(x not in y for y in set(src)-set([x]))] 内包表現は書いた本人ですら後で分んなくなることがあるから困るけど好き。
96 名前:デフォルトの名無しさん mailto:sage [2014/01/12(日) 23:16:56.22 ] >>93 パス(fpath)じゃなく数値(a)を渡してる
97 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 00:41:46.88 ] >>92 オリジナル(>>82 )が関数型の内包表記で書かれているんだから、 わざわざ手続き型で書き直すでのはなく、 まず最初は以下のように展開するのがPythonらしいと思ふ dst = [ x for x in src if not any( x in y for y in src if x != y ) ]
98 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 00:51:12.78 ] 繰り返し中での一時オブジェクト生成は、極力排除した方が実行効率良いよ。 # >>62 from collections import OrderedDict unique = lambda xs: OrderedDict.fromkeys(xs).keys() src = unique(['abc', 'abcd', 'abcd', 'abcd', 'bcd', 'bbt', 'yyf', 'zat']) dst = [x for x in src if not any(x in y for y in src if x != y)]
99 名前:62 mailto:sage [2014/01/13(月) 03:07:06.89 ] >>62 です うわこんなにレスをいただいてしまってなんかすみません・・・ 質問の後にmapや再帰?でやってみてたんですが上手く行かず困っていました いただいたレスを一つずつ試して見ます ありがとうございました!
100 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 09:42:32.16 ] 特定のフォルダを五分おきくらいに見て、新たに作成されたファイル名を 把握するっていうサーバー的アプリを作りたいが、監視でCPU100%になるのを 防ぐためには、スレッドという機能を使えばよいのかな? 何をしたいかというと、クライアントPCからサーバーのフォルダにファイルを コピーすることで仕事のトリガーとするシステムを妄想しているのだ WEB系の技術でやるべきものだろうけど、そっち系の知識がゼロなので
101 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 10:03:27.10 ] >特定のフォルダを五分おきくらいに見て、新たに作成されたファイル名を >把握するっていうサーバー的アプリを作りたい で運用に支障がでるほど、負荷がかかるとは思えない サーバ的ってあるけどクライアント的な部分はどいういうものなの >>100 が作ろうとしてるものと、答えようとする人間の想像するものが違ってるくるかもしれないから ディレクトリ内のファイル数とかも含めてもうちょい詳しく書いたほうがいい
102 名前:デフォルトの名無しさん [2014/01/13(月) 10:05:06.45 ] すぐ作れるんだし作ってから色々と試してみる方がいいような
103 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 10:06:01.70 ] >>100 time.sleep で大丈夫だと思うけど そういったシステムなら、ファイルシステムのイベント通知が使える。 watchdogというクロス・プラットフォームなライブラリがあるよ。
104 名前:100 mailto:sage [2014/01/13(月) 10:14:21.71 ] 101読んで、再考 もしサーバってのがサーバ・プログラムのプロセスを指してるんだったら、 シングル・プロセスなサーバのプロセス内でsleepしちゃまずいか。 バックグラウンド・ジョブを想定してた。 でも、トリガにwatchdogは使えるので、後は適当なプロセス間通信の方法調べてがんばって。
105 名前:103,104 mailto:sage [2014/01/13(月) 10:17:43.86 ] 番号間違えた。104の名前欄訂正 100>103
106 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 10:41:12.68 ] >>101 妄想を書いてみる これらを全部PythonとWindowsのバッチファイルでやろうという試み Web系って覚えることが多すぎて自分には無理 (ちなみに自分はただの事務員。金がないからお前が作れと言われた) クライアントPCの仕様 ・リクエスト内容を示すテキストファイルを作る ・Windowsのネットワークドライブ経由、バッチファイルで サーバーのリクエスト受付フォルダに上記ファイルをCOPYする ファイル数など ・クライアントPCは20台くらい、PCごとに一日10リクエストくらい、計200個のファイルを処理 ・リクエストタイミングは不定 サーバーの処理内容 ・データベースを持ち、リクエストに応じ検索・加工をした結果をCSVファイルに吐き出す サーバーで処理した結果の返し方 ・サーバー上にあるクライアントPCごとの返信専用フォルダに結果ファイルを格納 ・クライアントPC操作者は頃合いを見て上記フォルダをエクスプローラで覗き持って行く
107 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 11:13:52.76 ] 妄想ならチラシの裏にでも書いてろ
108 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 16:50:06.40 ] a = 0xd b = 13 を区別する方法ってありますか? 0xdを評価するときに,13になるのでしょうか?
109 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 17:08:17.89 ] ないよ 16進数を理解できてないの?
110 名前:デフォルトの名無しさん mailto:sage [2014/01/13(月) 17:51:31.41 ] >>109 すみません.確かにその通りですね
111 名前:デフォルトの名無しさん mailto:sage [2014/01/14(火) 14:45:18.06 ] pyDevを使ってます 変数名の候補が出てこないんですが どうしたら出るようになりますか? 例えば name = "a" na ↑ここで name が出てほしいんですけど何も出ません
112 名前:デフォルトの名無しさん mailto:sage [2014/01/14(火) 14:52:23.00 ] > To enable code completion, go to Window > Preferences > Pydev > Editor > Code Completion, and check the 'Use Code Completion?' stackoverflow.com/questions/491053/no-code-completion-and-syntax-highlighting-in-pydev PyDev持ってねーから知らんけどこのへんでどうよ
113 名前:111 mailto:sage [2014/01/14(火) 14:53:31.32 ] 自己解決しました すみません
114 名前:デフォルトの名無しさん mailto:sage [2014/01/15(水) 20:10:26.97 ] とりあえずはいろんなデータを分析・解析したり、 必要なデータをすぐにアウトプットできるようなプログラムを作ってみたい とりあえず入門としてPythonスタートブックっていうのを読んでみたんだけど、 次の参考書としておすすめの本ってありますか?
115 名前:デフォルトの名無しさん mailto:sage [2014/01/15(水) 20:11:22.32 ] PythonじゃなくてRの本にすればいい
116 名前:デフォルトの名無しさん mailto:sage [2014/01/15(水) 20:15:15.41 ] Pythonの勉強しておけばあとあといろんな応用がきくかなと…
117 名前:デフォルトの名無しさん mailto:sage [2014/01/15(水) 21:07:20.79 ] NumPyのマニュアルを読めばいいよ
118 名前:デフォルトの名無しさん [2014/01/15(水) 22:57:01.19 ] オレンジ色の本(本の名前失念)
119 名前:デフォルトの名無しさん mailto:sage [2014/01/16(木) 01:58:58.78 ] O'ReillyのPythonによるデータ分析入門
120 名前:デフォルトの名無しさん mailto:sage [2014/01/16(木) 11:34:54.23 ] 全くの初心者で申し訳ないのですが __init__のクラスの初期化って一体何のために必要なんですか?
121 名前:デフォルトの名無しさん mailto:sage [2014/01/16(木) 12:02:34.80 ] インスタンス生成時にそのクラスを使う上で必要なオブジェクトを受け取るため そのクラスを使うほうからしたら、あとになってからこれ要るよって言われるより 最初に言われたほうが書きやすい >>> rq = urllib.request.Request() Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: __init__() missing 1 required positional argument: 'url'
122 名前:デフォルトの名無しさん mailto:sage [2014/01/16(木) 17:29:23.08 ] >>121 ありがとう じっくり考えてみる
123 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 00:57:49.42 ] import sqlite3 con = sqlite3.connect('a.db') with con: ここでロールバックしてwithを抜けるスマートな方法って何かない? 例外を投げてwithの外側で捕捉する方法だと インデントが深くなるからそれ以外でお願いします。
124 名前:123 mailto:sage [2014/01/17(金) 01:02:20.10 ] 書き忘れましたがバージョンは2.6でお願いします
125 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 05:21:27.27 ] 自分でrollback呼んで抜ければいいだろ・・・ 頭固いぞ
126 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 06:26:36.31 ] ロールバックがどうのといってるけど、たぶん質問の本質はそっちじゃないんだと思う Q. withブロックを途中で抜けたい こうでしょ? A. 今のところbreakのような安直な方法はないので 自分でwhileやdefみたいなブロックを作ってください
127 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 06:33:10.03 ] あ、当然インデントが深くなります インデントが深くなるのが嫌ならPythonは使わないことです
128 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 12:35:52.48 ] インデントが深くなるのを抑制する用途にも with は使えるよ。 2.6だと contextlib.nestedが必要かも知れないけど、with に複数のcontext managerを列挙できる。 >with を途中で抜ける 例外を使う。withの外に例外を伝えたくなければ、特定の例外を捕捉するcontext managerを併用する。 @contextlib.contextmanager def pass_exc(*exc_types): try: yield except exc_types: pass class BreakContext(Exception): pass with pass_exc(BreakContext), con: raise BreakContext
129 名前:128 mailto:sage [2014/01/17(金) 12:46:21.22 ] sqlite3.Connectionの__exit__では、例外があったら rollback なければ commit を呼ぶので、 上の例では con を先にするか後にするかで、例外が伝わるかどうかが変わってくる点に注意が必要。 その辺の制御の流れは、少し判り辛いので、 望みの振る舞いをするトランザクションのcontext managerを書き下す方が良いかもしれない。 2.6のwhat's new や PEP343 にトランザクションのcontext managerの実装例が載ってます。
130 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 13:01:07.24 ] 関数はwith の外に置けばインデント深くならないけど、 この場合、例外を使わずrollbackするには明示的に呼ぶ必要があり def do_something(con): return con.rollback() with con: do_something(con) スマートさに欠ける点は、これだとwith抜けるときにcommit()も呼び出される。 rollback直後でinTransactionフラグがfalseになってるから、 データベースにCOMMITは発行されないけど。ここは commitメソッドの実装依存。
131 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 20:18:20.92 ] すみません。教えて下さい。 以下のように3つ関数があって、test1⇒test2⇒test3の順に処理を流したいのですが、 test1でえられたitemをtest2で使えるようにして、test2でえられたlistをtest3の処理の中で使用したいのですが どういう風に記述したらいいでしょうか?初歩的ですみません.. def test1() ... return item def test2() ... return list def test3() # #実行 test1() test2() test3()
132 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 21:20:22.07 ] >>131 def test1() ... return item def test2(i) ... return list def test3(l) i = test1() l = test2(i) test3(l)
133 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 21:26:22.71 ] >>132 神!ありがとうございます!
134 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 21:56:58.90 ] >>133 頑張ってくれ
135 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 22:46:20.73 ] 関数型っぽいの def add(n): return n+1 def multiply(n): return n*10 def divide(n): return n/2 num_list = [1,2,3] added = map(add, num_list) multiplied = map(multiply, added) divided = map(divide, multiplied)
136 名前:デフォルトの名無しさん mailto:sage [2014/01/17(金) 23:53:27.77 ] >>135 プロファイル取ってみればわかると思うけど、 Pythonで関数型っぽいコードは大抵、実行効率が良くないよ。 関数型の概念等はとても有用だけど。関数型の言語に比べると処理系の実装が適してない。 python流(?)に書いた方が保守もしやすく(Pythonでは)効率良い [(x+1)*10/2 for x in [1,2,3]]
137 名前:デフォルトの名無しさん mailto:sage [2014/01/18(土) 00:21:48.56 ] mapとかfilterを上手く使えるとちょっと世界が広がる感じがするよねw いまだにreduceはピンとくる使いどころがわからないけど
138 名前:デフォルトの名無しさん mailto:sage [2014/01/18(土) 01:03:26.08 ] >>137 reduce使った関数合成と、無理やり使ってみた感のある応用例書いてみた。興味あったら、どぞ。 ideone.com/vN8PuJ reduceはリストを順に処理して、最終的にひとつの要素に収束するような処理に用いるのだけど、 Pythonでreduceを使う局面は、普通にforループの手続きで書いた方が良いよ。
139 名前:デフォルトの名無しさん mailto:sage [2014/01/18(土) 02:48:09.02 ] Pythonでもreduceの結果は一つの要素に限らないんじゃないの? 原始帰納関数はすべてfold(reduce)で再実装できるというのがミソ
140 名前:デフォルトの名無しさん mailto:sage [2014/01/18(土) 14:30:44.02 ] >>139 (Pythonの)reduce関数の実装を指してのことならyes 初期値を取れるから、foldのようにも使える。
141 名前:デフォルトの名無しさん [2014/01/19(日) 02:50:12.78 ] 今日の0時のdatetimeを取得したいのですがどうすればいいでしょうか?
142 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 03:30:12.94 ] スクリプト実行中に発生したエラー・例外をloggingでファイルに書き出したいです 検索するとだいたい以下のようなサンプルが出てきます try: ここでエラー発生 except: logging.error(~~) これだとtryでキャッチしている箇所でないとファイルに書き出せません そうではなく、どこでエラーが起きても全てファイルに書き出すにはどうすればいいのでしょうか
143 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 03:44:05.51 ] 全部tryにいれればいいじゃん(いいじゃん)
144 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 04:50:19.59 ] >>141 midnight = datetime.fromordinal(datetime.date.today().toordinal()) >>142 logging用途なら sys.excepthook はどう?
145 名前:144 mailto:sage [2014/01/19(日) 05:10:30.55 ] 訂正 モジュール名忘れてた datetime.fromordianl -> datetime.datetime.fromordinal
146 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 05:26:39.90 ] >>145 ありがとうございました。そのような便利メソッドがあることを知りませんでした。 ドキュメントを読みなおしてみます。
147 名前:デフォルトの名無しさん [2014/01/19(日) 13:41:26.28 ] twitterのAPIを叩くためにpython-twitterを使ってみたんだけど、なぜかエラーが出まくりで、仕様変更で使えなくなってるメソッド がいくつかある模様。 tweepyの方は使いやすいですか?
148 名前:デフォルトの名無しさん [2014/01/19(日) 15:03:05.45 ] 自分はGitHubからDLしたtweepy使ってbot作りました。
149 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 15:36:20.26 ] twython 使ってる
150 名前:デフォルトの名無しさん [2014/01/19(日) 16:55:29.79 ] python-twitterをちゃんとドキュメントに載ってるように書いてるのにエラーが出るとかわけわからんw
151 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 17:42:13.41 ] 解決する気ないんなら自分の日記に書いてくれ
152 名前:デフォルトの名無しさん [2014/01/19(日) 19:47:59.94 ] PythonでCGI書いてるんだが迷宮入りしたプログラミングweb助け hayabusa.2ch.net/test/read.cgi/news4vip/1390125059 Python3って文字列Unicodeだけになったんだっけか デフォルトのエンコーディングutf-8じゃないんじゃねえの これとか参考になんね? stackoverflow.com/questions/9322410/set-encoding-in-python-3-cgi-scripts 違和感
153 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 20:39:56.61 ] コード晒せるだけ晒せよって言わないのはなんかお約束でもあるんだろうか
154 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 20:51:17.88 ] unicodeとutf-8は違うよ
155 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 21:19:15.73 ] 原因がはっきりしたようでめでたい
156 名前:デフォルトの名無しさん mailto:sage [2014/01/19(日) 21:33:38.54 ] 馬鹿には無理
157 名前:デフォルトの名無しさん [2014/01/19(日) 22:10:15.58 ] 2chはしょせん便所の落書き 自分の日記にも書けないようなことを書くとこだよ
158 名前:デフォルトの名無しさん [2014/01/20(月) 00:00:05.16 ] 自分には標準ストリームとかそのあたりの理解が足りないんだけど そのあたりの知識ってどういうところで学んでるの? 書籍とか?
159 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 00:20:28.64 ] 「ふつうのLinuxプログラミング入門」で覚えたけど、 Web上のLinuxやプログラミング言語のマニュアル読めば十分じゃないの
160 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 02:13:11.86 ] >>158 標準入出力(stdin,stdout)等の事?プロセスの開始や環境変数の伝播等 カテゴリ的には「システム・プログラミング」 「POSIX」という共通の規格があるけど、細かい部分ではOS依存になるので、 より深い所に関心があるなら、各OS毎の情報を調べる事になります。 Linuxだとman、WindowsだったらMSDNとかになるのかな。 この辺の情報は、書籍でも大抵はC言語になると思う。
161 名前:デフォルトの名無しさん [2014/01/20(月) 17:35:18.99 ] あ”あ”あ”!! Pythonの正規表現苛つく... 何なんだよ、コレ!? ワケが分からん
162 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 17:40:18.82 ] 無理しないで分相応なツール使ってればいいのに 背伸びしても疲れるだけだぜ
163 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 17:44:10.50 ] Pythonでテキストブラウザ作ってみようと思ったんだけど、 そもそもああいうのはHTMLを一旦読み取ってタグやらを除去してるのか?
164 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 17:55:50.83 ] いや宇宙のどこかからデータを引っ張ってきて表示するだけだよ
165 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 18:00:57.86 ] Pythonの正規表現は引数の順番が他の言語と違ってて時々間違えるけど ワケ分からなくはないだろ
166 名前:デフォルトの名無しさん [2014/01/20(月) 18:15:45.70 ] いや、俺の持ってるPythonの本とか全然詳しく書いてないから、 後方一致だとか、大文字小文字の無視とか訳が分からんかった PHPのpreg_matchみたいな簡単なのあればいいのに 文法が気に喰わん re.compile()した後にsearch()してgroup()して...とか めんどくさい
167 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 18:17:25.84 ] >>163 パーサを作って、タグや属性等はイベント・ドリブンで処理してる。
168 名前:デフォルトの名無しさん [2014/01/20(月) 18:19:12.38 ] >>163 mechanizeってライブラリで簡単にできる例えば <div>あ</div> ← こういう文字列から"あ"だけを取り出すのとか 自分で正規表現かく必要すらない でもPythonからmechanizeを扱うには日本語資料少なすぎて難しいかもしれない rubyからmechanizeを扱うなら資料沢山あるのだけど
169 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 18:21:09.90 ] >>166 正規表現よく使うなら正規表現リテラルのある Ruby のほうが向いてるかも あと Python は re.compile() するのが面倒なら re.search() とかモジュールメソッド呼んでも構わない
170 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 20:05:04.04 ] Pythonのreモジュールでデリミタ変更したいんだけど、どうすればいい? シングルクォート、ダブルクォート以外にしたいんだけど 例えば、 pattern = r"正規表現" r = re.compile(pattern) m = r.search(str) が一般的だと思う
171 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 20:27:29.51 ] r"..." は raw 文字列って言って文字列の一種 r"\n" は バックスラッシュと n の二文字に解釈される 正規表現のデリミタではないよ
172 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 20:42:39.09 ] r"\"" がめんどいから r|"| みたいに書けないかって話だと思う perlやrubyの悪臭がするけど
173 名前:デフォルトの名無しさん mailto:sare [2014/01/20(月) 20:54:00.40 ] 三連クオートのRAW文字列使えばいいだろ pattern = r"""aaa"bbb""" 日本語ドキュメントあるんだし読めよ
174 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 20:57:02.69 ] PHP じゃないかなあと
175 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 21:52:12.29 ] >>172 そう、そういうこと 説明の仕方が悪かったね、ごめん
176 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 23:49:20.74 ] その文字列に、 〇〇以外の文字列が含まれているかどうかってのはどうやって判断すればいいの? 俺が馬鹿なのか全く思いつかない
177 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 23:58:23.09 ] 〇〇の文字列を置換で除去した後に、何か残ってるか調べるのはどう
178 名前:デフォルトの名無しさん mailto:sage [2014/01/20(月) 23:59:47.69 ] 頭がいいと難しく考えすぎることがある。 アホは、○○を検索して見つからなかったら含まれていないと考えるw
179 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 00:31:58.54 ] 単語単位なのか文字単位なのか、 重複する文字を許すかどうかで変わってくると思う。 "lolol".replace("lol", "") # 'ol' re.sub(r"lol", "lolol", "") # '' not re.match(r"^(AAA|BBB|CCC)+$", "CCCBBBAAAd") # True
180 名前:179 mailto:sage [2014/01/21(火) 00:33:53.50 ] ごめん、re.subの引数の順番間違えた re.sub(r"lol", "", "lolol") # '' でした
181 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 11:16:29.47 ] Pythonの正規表現を本やWeb上で調べると、だいたい e = re.compile(pattern) r = e.search(str) if r is None: print("fuck you") else: i = 0 while i >= -: m = e.search(str, i) if m: print m.group(1) i = m.start() +1 と書いてる(後半は自分のやり方)
182 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 11:20:45.13 ] でも、あるサイトで r = re.search(pattern, str, flags) と書いてたんだけど、これでいけるの? 実際実行してみて上手くいったような気がするんだけど、 compileしなくてもいいのなら、連続で正規表現適用させる場合なんか、わざわざ冗長な上の書き方しなくて済むから楽だよね? この下のやり方で問題のある時、デメリットってあるの?
183 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 11:44:47.68 ] >>180 >>> re.sub(r"lol", "", "lolol") 'ol'
184 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 12:51:19.13 ] >>182 コンパイル済み正規表現オブジェクトは、Python2では100個、Python3では512個キャッシュされるので re.search使ったとしても、毎回コンパイルされるわけではない 詳しくは /Lib/re.py のソースコード参照 ループ中で同じ正規表現を何百万回も使う場合など・・・ キャッシュから取り出す処理時間すらも削りたい状況ではcompileを使うべき 速度を気にしないなら可読性の良いre.searchでおk ただしre.searchには、検索範囲を指定する引数はない
185 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 13:45:16.38 ] ディクショナリの順番って何順になるの?
186 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 14:04:58.84 ] >>185 Pythonの実装依存 順番をそろえたいなら for k in sorted(dic.keys())
187 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 14:08:33.01 ] >>184 なるほど 教えてくれてありがと
188 名前:デフォルトの名無しさん [2014/01/21(火) 15:26:29.05 ] py2.7 beautifulsoupでパースできなかった場合、 lに値が入らず下記エラーになります。 if (l == None): といった風に例外処理を書く事は出来るんでしょうか? エラーで処理を止めずに、エラーが出た事を取得したいのですが・・ 分かる方いらっしゃいましたら、お願い致します! f = open("test.html") s = BeautifulSoup(f) l = s.find("a")["href"] TypeError: 'NoneType' object has no attribute '__getitem__'
189 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 16:14:20.71 ] ごめん、また質問させて欲しいんだけど... 正規表現使用して、該当部分を表示するのではなく、 逆に削除して、その部分を抜いて表示したい場合どうすればいい? >>181 で言えば、m.start()やm.end()で該当部分が出てくるけど(例えば123-184)、 その部分を抜いて表示するというやり方しかないのかな?
190 名前:181 mailto:sage [2014/01/21(火) 16:30:30.41 ] 訂正しとく i = m.start()+1じゃダメだね i = m.end()+1じゃないと じゃないと重複が大量に出てきてしまうし、処理速度が極めて遅くなってきそう
191 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 16:44:36.99 ] >>189 置換したいのかな? s = "ab2c45d67e8fg" print(re.sub(r'\d+', '', s))
192 名前:181 mailto:sage [2014/01/21(火) 16:49:41.71 ] >>191 あ、そうか 俺バカだなぁ str = str[0:m.start()-1] + str[result.end()+1:] とかめんどくさいことしてた ま、これでも出来ることは出来るんだけどね どっちが処理速度が早いかは分からんけど なんかPython触ってから他の言語で出来ることを複雑に考えすぎてるのか、混乱してるっぽい とりあえず教えてくれてありがと
193 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 17:09:45.45 ] >>188 たぶんfindで見つからないときNoneが返るんでしょ? a = s.find("a") if a is None: print 'エラーです' else: l = a["href"]
194 名前:デフォルトの名無しさん mailto:sage [2014/01/21(火) 21:06:23.68 ] >>193 あー思い通りにいきました。ありがとうございます。
195 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 02:17:05.01 ] >>183 指摘thx 今度からtypoなくす為に、コピペにします >>185 順序付辞書なら、collections モジュールに OrderedDict もあるよ。こちらは挿入順。
196 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 17:49:26.29 ] HELPです 関数内でループが適用されません 以下のスクリプトを行うと、urlやjavascriptがそれぞれ一つずつしか抽出されません インデントも確認してみたんですが... うpローダーにスクリプトをあげました www.dotup.org/uploda/www.dotup.org4819644.py.html 関数にせずに、それぞれ素で適用させた場合は上手くいくのですが、 そのそれぞれの処理を関数に書いて適用させた際には、結果が一つしか出てきません スコープなのかなぁ? Pythonは良く分かりません
197 名前: 忍法帖【Lv=3,xxxP】(2+0:5) [2014/01/22(水) 17:58:01.18 ] 直リン貼れなかったので、ちょっと自分の忍法帖確認してみます すみません
198 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 18:28:22.22 ] >>196-197 再現可能なサンプルデータぐらい用意したら? URLじゃなくてそのまま食わせられるHTMLね あと、ソース貼るならpastebin.com、codepad.org、ideone.comとかにしてくれ
199 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 18:31:28.15 ] >>196 チラっと見た感じだけど、正規表現パターンが原因でしょ 最初の pattern_url はいいが、残り2つは前後に .+ .* が付いてるから 1回で文字列全体にマッチして終了してしまうよ
200 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 18:33:26.13 ] 他の言語ができるならテストを書きなされ
201 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 18:43:02.73 ] 変に複雑な事してるけど、こんな感じでいいと思うけどなあ results = [] for m in re.finditer(r'''\bhref=['"]?([^"<>\s]+)''', html, flags = re.I): results.append(m.group(1)) if uniq: results = list(set(results))
202 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 20:57:54.65 ] >>196 tagRemoveのre.subを繰り返し呼ぶようなコードだけど、 一度で全て置換されるのでループは不要。 re.subn使えば置換個数を確認できます。
203 名前:デフォルトの名無しさん mailto:sage [2014/01/22(水) 21:47:35.69 ] >>196 です 皆さん、色々とアドバイスありがとうございました
204 名前:デフォルトの名無しさん [2014/01/23(木) 00:17:18.66 ] 直リンク禁止されてるのでscheme部を省いてリンクします コード : pastebin.com/7YqtR23Q 空白行が除去できないのですが、これは自分の正規表現の書き方が悪いからでしょうか? それとも、pythonのコーディングが間違っているからでしょうか? 自分の結果では最初の20行は空白行が続き、21行目に" / "と言う文字が出てきます その後はまた暫く空白行が続きます これらの空白行を全部取り除きたいのですが... もしかしたらこのような面倒くさいやり方ではなく、関数などの利用で一気に除去できるかもしれませんが 検索しても見当たりませんでした アドバイス頂けないでしょうか?
205 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 00:36:54.08 ] Pythonの実行速度、たとえばfor文で何百万回も ループを回すような処理が遅くて困っています。 リスト内包表記とかmap関数とかjoin関数とかで 極力高速化しているものの、Pure Pythonでは 頭打ちの状態です。 CPythonやCython、PyPyなど、実装側で高速化する 方法を検討していますが、これといった決め手に 欠けています。 主な用途はNumPyを併用した科学計算や データの整形など、数値計算寄りです。 サーバアプリのような規模の大きいものではなく、 単一のスクリプトファイルを必要な時に叩くといった やり方がほとんどです。 sys、os、subprocess、numpyは必須。 できればscipyやmultiprocessingも使いたいです。 Mac/Win/Linuxいずれの環境でも実行できる必要が あります。 そして互換性や可読性の都合上、各実装に特化した コーディングは極力避けたいです。 各実装の得手不得手など、ざっくりとした内容で 結構ですのでご意見いただけませんでしょうか?
206 名前:デフォルトの名無しさん [2014/01/23(木) 01:14:19.47 ] そこまでやるなら素直にRubyへ移行したほうが良いです。 そのままゴリ押ししても良いことないです。
207 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 01:16:49.69 ] >>204 正規表現を勉強する 検索ではなく公式のチュートリアルと標準ライブラリにざっと目を通す 2 タブをやめる
208 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 01:51:16.12 ] >>205 cで書け
209 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 02:17:47.09 ] >>205 Cythonで十分だろう なにが不満なんだ
210 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 02:39:36.29 ] >>205 つanaconda accelerate
211 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 03:12:36.80 ] >>205 PyPyは確かにCPythonより計算とか速いこともあるけど一長一短でそれだけな感が Cythonは型指定でC/C++に迫れるけどそもそもCに変換してコンパイルしてるので C/C++で書いたらいいじゃない感、PurePythonコーディングでなければ互換性がないのも… numpy前提なら小手先のマルチプロセスより pyopenclでも使ったほうが次元の違うレベルになるんじゃないかな
212 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 04:28:10.51 ] >>204 ここで質問したのはもう終わりにするの? Regular Expression(正規表現) Part12 toro.2ch.net/test/read.cgi/tech/1387257592/234
213 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 06:54:13.07 ] >>204 空白行を取り除く print("\n".join(x for x in html.splitlines() if x))
214 名前:デフォルトの名無しさん mailto:sage [2014/01/23(木) 06:56:06.28 ] PyPyは注意書きにあるようにPurePythonじゃないとエミュレーションで遅くなるし 俺は速度が必要な時はCython/Cだね Cで書いてCythonでGILを開放しつつ糊付け あとはスレッド作って回す