1 名前:デフォルトの名無しさん mailto:sage [2007/02/23(金) 23:55:42 .net] 腐っても鯛? 騏も老いては駑馬に劣る? 三人の碩学が生み出したスクリプト言語AWKについて語るスレ ◆ 前スレ awkについて語るスレ pc10.2ch.net/test/read.cgi/tech/1023556171/ ◆ 関係スレ シェルスクリプト相談室 pc10.2ch.net/test/read.cgi/tech/1112553783/ AWKでCGI pc10.2ch.net/test/read.cgi/php/1171804314/ 【sed】シェルスクリプト総合@LINUX Part2【awk】 pc10.2ch.net/test/read.cgi/linux/1154578200/ ◆ 参考 The AWK Programming Language (Brian Kernighan): ttp://cm.bell-labs.com/cm/cs/awkbook/index.html GAWK (GNU Projedt): ttp://www.gnu.org/software/gawk/
477 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 16:02:25 .net] perlよりawkの方が速い事ってないじゃん。 今のawkの使い道はワンライナーをコマンドラインのパイプに混ぜる程度でしよ。 俺は、256倍本の長篇スクリプトをいくつか書いたけど、 当時はまだperlなんて使われてなかった。時代が違う。
478 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 18:11:52 .net] >>470 それは偏見だろ autoconfなどの非常に基本的なツールでもPerlが使われているし opensslのようにconfigureの(主にWindows用の)ポータビリティを上げるために Perlを利用しているものもある 言語の適性をわかった上で適材適所で使えばいいんだよ
479 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 21:08:21 .net] 日本国際賞 「米ベル研究所特別名誉技師のデニス・リッチー博士(69)と米グーグル社特別技師のケン・トンプソン博士(67)」 毎日jp - 毎日新聞のニュース・情報サイト mainichi.jp/select/science/news/m20110126k0000m040012000c.html
480 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 21:29:34 .net] >>471 >時代が違う。 時代と言う意味では、最近はデフォで Python が入っていたりするので Perl を使うなら Python を選んじゃうな。 あんまり速さを競う仕事をしていないのと、ワンライナーを書く事が 多いので、awk も絶賛大活躍しているけど。 Perl がフルセットの言語なら awk は DSL みたいな物で、個人的には awk の方が気安く書ける気がする。
481 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 21:57:07 .net] pythonは、コマンドラインで使いにくい。 -cで引数に一応コマンド渡せるけど、インデントの問題があるし、 perlの-pや-nみたいに標準入力のループ渡せないから。
482 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 22:04:34 .net] 質問させて下さい 次のようなテキストがあるとします aaaaa 10 20 10 5 aaabb 5 10 10 10 aaabb 5 5 5 5 aabaa 5 20 20 30 aabbb 10 10 5 5 bbaaa 10 10 10 10 bbbaa 5 10 10 5 bbbbb 10 5 5 30 ここで、aaaaaなどは個人の名前でかつ、3文字目までが姓、4〜5文字目が名前、また数字が出費だとして 各世帯の出費を出力したいと考えています。 aaa 20 35 25 20 aab 15 30 25 35 bba 10 10 10 10 bbb 15 15 15 35 となって欲しい訳です。
483 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 22:18:47 .net] で今考えている方法としては substr($1,1,3) で姓を判定して 同じ姓なら、世帯を加算して行く 違う姓になったタイミングで1つ前の家の家計を print して さらに各出費を初期化する 次の行に移って同じ世帯なら加算 という感じでスクリプトを組みたいんですが根本的なところでやり方が不味いでしょうか?
484 名前:デフォルトの名無しさん mailto:sage [2011/01/25(火) 22:34:21 .net] 連想配列とかじゃ駄目なのか? name[$1] += 1
485 名前:デフォルトの名無しさん mailto:sage [2011/01/26(水) 01:13:08 .net] >>476-477 全て連想配列に溜め込んで、 最後で一気に出力した方が良くないか? >>477 の方法だと、 出力を行う箇所が "姓が変わったとき" と "テキストが終わったとき" に分散してしまう。 { a = substr($1,1,3); b[a] += $2; c[a] += $3; d[a] += $4; e[a] += $5; } END { for (f in e) print f,b[f],c[f],d[f],e[f]; }
486 名前:デフォルトの名無しさん mailto:sage [2011/01/26(水) 20:18:53 .net] >>474 OS(Linux)をデフォだけで使うことはまずありえなくて、 何かしら追加パッケージが必要になるはずだから、 Pythonがデフォで入っている事は実用面で評価対象にはならんと思う。 自分はDebianをメインに使うけど、インストール時にはベースシステムだけを選び、 それにsshdとrubyを追加するのがデフォなんで気にならない。 MacならPython/Rubyともデフォで入ってるから無問題だし、 Winならどちらもデフォじゃ入っていないから同じ。 また日常的なプログラミングに関して、Rubyの場合は以下のようにリスト構造を シェルのパイプライン感覚で書けるのが嬉しい。 hoge_list.select { |x| ....}.sort { |x,y| .... }.map { |x| .... }.inject(n) {|x, i| .... } ブロック(クロージャ)の無いPyton/Perlでは、こういったお気軽な書き方はできない。 だから日常的な活躍度で比較すると、自分の場合は、bash > awk > ruby になる。 基本はbashで、面倒な文字列処理があればawkをワンライナーで埋め込むのがパターン。 で、色々と機能を追加してきてbashプログラミングが重荷に感じられるようになり、 なおかつ汎用性のある(再利用の可能性がある)ツールであれば、一気にrubyに書き換える。 Pythonは本格的な開発であれば(Rubyよりも)優れた面が多々あると思うけど、 (>>475 の指摘も含めて)お手軽さ/お気軽さに限ると(Rubyよりも)使いづらく感じる。 もちろんbashスクリプト(or Makefile)に埋め込むワンライナーであれば、awk がベスト。
487 名前:474じゃないけど mailto:sage [2011/01/26(水) 21:22:28 .net] >>474 と全く同じ意見だわ。 業務で使う事が多いRHELは余計な物はほとんど入れてない。 Python、Perlがデフォで入ってる感じ。 昔、UNIXを扱ってた頃はPerlならデフォで入ってたので、覚えようとしたけど結局身につかず。 sh、sed、awkでがんばってた。
488 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 00:10:46 .net] >>480 デフォで入っているのが嬉しいのは、自分の環境だけでなく、他人の環境でも 使える事が保証されている事だよ。誰かに使ってもらう為のコードを書く時に、 パッケージの追加をお願いしなくて良いのはとても楽。特に、それが仕事で 使われている環境なら尚更。 サポートやトレーニングの仕事をした事がある人なら理解してもらえると思う。
489 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 03:47:36 .net] AWKは、NEC PC-9801のMS-DOSでもうごいた。AWK95.exeは、日本語に対応してない
490 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 05:04:18 .net] AWKの活躍する場面は、やっぱりテキスト処理だと思う。 そのちょっと複雑版として使うならPerlかな。 組み込みライブラリがテキスト処理に特化してるから。 Pythonは正規表現が言語に組み込まれてなかったりと テキスト処理は若干やりにくい印象が強い。 その分、テキスト処理以外なら結構使うけどね。
491 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 05:27:26 .net] >>482 ああ、それ分かるわ。業務マシンとして使う商用UNIX(HP-UX/Solaris/AIX)だと RubyどころかPython/Perlすらデフォじゃ入っていないし、そういった フリーソフトの類いは原則として一切インストール禁止という環境もある。 (Web/MailといったInternet系サーバは別ね。あくまで業務マシン限定の話。) だから商用UNIXユーザは、デフォで入っているツールに長けることになる。 やっぱり本物のUNIXプロを自称するのなら、python/rubyではなくsh/awkだし、 emacs/vimではなくvi、latexではなくroffを選ぶべきだよね。
492 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 06:50:40 .net] >>484 >Pythonは正規表現が言語に組み込まれてなかったりと へ?
493 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 07:07:12 .net] >>486 ん?言語には組み込まれてないだろ?ライブラリとして組み込まれてるだけで。 だから正規表現リテラルとか無いし、importなしには使えない。
494 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 07:10:47 .net] リテラルだと何か良いことあるの?
495 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 07:13:35 .net] 文字列かパターンか区別しやすい。
496 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 07:16:17 .net] あと、マッチングの表記が自然。
497 名前:デフォルトの名無しさん mailto:sage [2011/01/27(木) 09:03:47 .net] >>485 Solaris はデフォで Perl も Python も入ってるよ もちろん入れない事も出来るけど
498 名前:デフォルトの名無しさん mailto:sage [2011/01/28(金) 15:46:44 .net] >>491 それは簡易インストールで用途としてデスクトップあるいはインターネットサーバを 選択した場合の話じゃないのかな。基本システムにperl/pythonは含まれていないはず。 その簡易インストールも含めてデフォであるとするなら、Debianも同じ。 カテゴリでデスクトップを選べば「rubyもデフォ」でインストールされる。(RHLは知らん) 自分は余計な物は入れたくないから基本システムを選んでるけどね。 高可用性を要求される基幹業務システムの場合、自分はHP-UXを扱うケースが多いけど、 デフォでは基本システムを選び事前に設計したパッケージのみを追加するのが鉄則。 なぜならメーカのサポートが受けられない、あるいはあからさまに嫌な顔をされるから。 そんな環境だと、「真にデフォ」なsh/csh/sed/awkが大活躍していたりする。
499 名前:デフォルトの名無しさん mailto:sage [2011/01/28(金) 17:06:59 .net] >>492 Solaris のデフォルトは "Entire Distribution" というパッケージのセットだよ。 インストーラーでデフォルトで選択されているのがこれだし、プリインストール されているのもこれに近いもの。そこには Perl も Python も入ってる。 インストールする際の選択肢で "Core System" を選べば Perl や Python は 入らなかったと思うけど、これをデフォルトと呼ぶのはちょっと無理があると思うわ。 それと、簡易インストールとかカテゴリでデスクトップとか真にデフォと言った物は Solaris には存在しない。Debian は知らん。
500 名前:デフォルトの名無しさん mailto:sage [2011/01/28(金) 20:11:40 .net] Solaris2.6あたりのデフォでPerlは入ってた記憶がある。 15年くらい前のHP-UXだとPerlが入ってなかった記憶が。
501 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 00:42:19 .net] 俺もHP-UXメインだけどPerl入ってないわ
502 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 00:47:55 .net] 確かに、Solarisに慣れていてHP-UX使わされると使いにくいわー
503 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 07:33:12 .net] と言うわけで、UN*Xサーバ管理者の場合はawkを使えるようになっておけば間違いありませんね。
504 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 10:56:30 .net] 環境を選ばないサーバ管理だったら、sh,grep,sed,tr,cut,paste,sort,uniqあたりで。 nawkとgawkの仕様差が結構あるので、awkは使いにくい。
505 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 13:15:51 .net] こういう話題の時にSolarisとかHP-UXは出るのにAIXは出ないイメージ
506 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 13:40:55 .net] 日本男児ならHI-UX、特にHI-UX/WE2だろ。常識やね
507 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 14:15:09 .net] うむ
508 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 16:56:12 .net] いやここはedスクリプトで
509 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 18:47:15 .net] Solarisは、/usr/bin/awk /usr/bin/nawk /usr/xpg4/bin/awk 3つ別々なのが入ってた気がするな。 で、一番まともなのが3番目なので、よそから持ってきたスクリプトは、先頭の#!を 書き換えないといけないという、カオスな状態じゃなかっただろうか。
510 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 19:23:53 .net] >>503 自分アカウントのパスは真っ先に /usr/xpg4/bin/を持ってきてたわ。
511 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 19:25:17 .net] スクリプトを組む時はだいたい nawk を使う 他人のスクリプトを丸パクリする機会が無いのでカオスは感じた事が無い
512 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 19:32:53 .net] >>505 話の流れが>>497 >>498 なので、可搬性が問題なんだよ。
513 名前:デフォルトの名無しさん mailto:sage [2011/01/29(土) 19:39:08 .net] ウチは RHEL と Solaris だけ考えれば良いから、awk で問題がある時は Perl か Python で済ますわ
514 名前:デフォルトの名無しさん mailto:sage [2011/01/30(日) 05:43:19 .net] #!/usr/bin/env [gn]*awk だろ常考
515 名前:デフォルトの名無しさん mailto:sage [2011/02/01(火) 10:39:45 .net] shebang行に /usr/bin/env 書くのってあんま良いと思えないんだよなあ 複数の引数の扱いとか、環境変数をそこまで信用して良いものなのかとか あと /usr/bin/ に env があることは本当に保証できるのかとか /bin/sh を書いたほうが良いんじゃないかって思ってしまう
516 名前:デフォルトの名無しさん mailto:sage [2011/02/01(火) 11:45:20 .net] この話題も定番だな。前スレの558-564でもやってたぞ。とりあえず結論だけを引用しとくわ。 >調べてみたら#!にインタープリタの引数を2つ以上与えたときの >挙動はOSによって違うようだった。 > >FreeBSD4.2: 2つ以上あっても渡る(/usrbin/env gawk -f foo) >Linux(2.6.8): 空白を含めて1つの引数として渡る(/usr/bin/env "gawk -f" foo) >Soraris(5.8): 2つめ以降の引数は無視(/usr/bin/env gawk foo) > >結局/usr/bin/env使った書き方はgawkのインストール位置の差を >吸収しようとしてるんだろうが、動作はOSによっててんでばらばら >なのであまりお勧めできないということだろうか。
517 名前:デフォルトの名無しさん mailto:sage [2011/02/02(水) 00:12:39 .net] ruby 界隈でも流行ってるな 意味も判らず「おまじない」と称して使ってるうちに 都市伝説化していくんだな
518 名前:デフォルトの名無しさん mailto:sage [2011/02/03(木) 22:33:59 .net] なぜ gawk には tr が無いのだ tr("A-Z","A-Z")とかしたいぞ
519 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 03:31:02 .net] つ Python
520 名前:デフォルトの名無しさん [2011/02/04(金) 09:10:06 .net] >>512 BEGIN { hankaku="0 1 2 3 4 5 6 7 8 9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z " zenkaku="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" } { for (i=0; i<length(hankaku); i+=2) { gsub(substr(hankaku,i+1,1),substr(zenkaku,i+1,2)) } }
521 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 09:20:39 .net] それだとtr('ab', 'ba')がうまくいかないんだよなぁ。
522 名前:デフォルトの名無しさん [2011/02/04(金) 09:54:40 .net] 同じ事じゃん
523 名前:デフォルトの名無しさん mailto:sage [2011/02/04(金) 19:22:21 .net] 汎用的に1つ作っとけばいいじゃん
524 名前:デフォルトの名無しさん mailto:sage [2011/02/05(土) 20:23:34 .net] >514みたいなベタ打ちじゃなくて A-Zあ-ん こういう表記で置換する方法ある?
525 名前:デフォルトの名無しさん mailto:sage [2011/02/05(土) 20:37:26 .net] >>518 tr 使えば?
526 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 03:05:39 .net] tr コマンドって環境によってマルチバイトの扱いが違わね?ウチの場合 Ubuntu10.04に入ってるtr(GNU coreutils)7.4はどうやら2文字扱いにしちゃうらしいが MacOSX10.5に入ってるtr(バージョン判らんがman見るとBSD系ぽい)は1文字扱いにしてくれた
527 名前:デフォルトの名無しさん mailto:sage [2011/02/06(日) 05:00:06 .net] UNICODE = 文字数 mbcs = バイト数
528 名前:デフォルトの名無しさん mailto:sage [2011/02/07(月) 08:10:44 .net] んーと、どゆこと? gnome-terminalはユニコード設定のはずなんだが… 他にやらなきゃいけないことがあるってこと?
529 名前:デフォルトの名無しさん [2011/02/09(水) 23:11:37 .net] awk++使ってる人いる? awk.info/?doc/dsl/awkplusplus.html
530 名前:デフォルトの名無しさん mailto:sage [2011/02/10(木) 14:20:51 .net] 最近、awkの存在を知りました。 いろんな言語を触っては挫折・・・触っては挫折・・・を繰り返していました。 awkは何となくマスター出来そうな気がします。 これから頑張ります!! 256倍の本を今は読んでおります。
531 名前:デフォルトの名無しさん mailto:sage [2011/02/16(水) 02:02:44 .net] gawkでフィールドをソートして表示したいんだが {split($0, a);asort(a);for(i=1;i<NF;i++){printf("%s%s", a[i], FS);}printf("%s\n", a[NF]);} よりもスマートな方法ある? $1〜$NFが入った特殊配列みたいなのがあったらうれしいのだが。
532 名前:デフォルトの名無しさん mailto:sage [2011/02/16(水) 07:22:58 .net] >>525 $iとか書けるし代入もできるから $1〜を保存しなくていいのなら、後半は for(i=1;i<=NF;i++){$i=a[i]} print と書けばちょっと短くなるな。
533 名前:デフォルトの名無しさん mailto:sage [2011/02/16(水) 12:11:40 .net] >>526 なるほど、そうできるのか。ありがとう。
534 名前:デフォルトの名無しさん mailto:sage [2011/02/17(木) 01:07:36 .net] www.kt.rim.or.jp/~kbk/gawk-3.1/ に置いてあった win32用gawkがいつの間にか公開停止になっていた。 wn32のgensubが使
535 名前:ヲて日本語が扱えて、 かつexeのみで稼動するのでインストール不要なのが便利で 公私にわたって愛用していたので、非常に悲しい・・・ [] [ここ壊れてます]
536 名前:デフォルトの名無しさん mailto:sage [2011/02/17(木) 02:14:57 .net] www.vector.co.jp/soft/win95/util/se376460.html ↑とは違うの?
537 名前:デフォルトの名無しさん mailto:sage [2011/02/18(金) 11:30:36 .net] それは少し古い. gawk-mbcs-win32-20090920.zip が手元にあるので必要なら再配布するが?
538 名前:528 mailto:sage [2011/02/19(土) 01:36:10 .net] >>530 もし私に言ってくれているのであれば、 exeのみだけど2009/11/24版が手元にあるので、 これを使い続けようと思う。ありがとう。
539 名前:デフォルトの名無しさん mailto:sage [2011/02/19(土) 08:18:59 .net] 俺の手元に、gawk-mbcs-win32-20091124.zip があった。 欲しい人がいて、かつ再配布に問題無いという事がわかればどっかにうpするが。 しかしなんで配布やめちゃったんだろね。 どこからか拝借したコードとかのライセンス問題なのかな?
540 名前:デフォルトの名無しさん [2011/02/19(土) 22:51:02.65 .net] AWK++によるオブジェクト指向入門 ja.wikibooks.org/wiki/AWK%2B%2B%E3%81%AB%E3%82%88%E3%82%8B%E3%82%AA%E3%83%96%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%88%E6%8C%87%E5%90%91%E5%85%A5%E9%96%80 awk++は面白そうだけど、現実にはawkでOOをやる人はほとんどいないだろう。 そもそもawk使いはOOを理解できない高齢者がほとんどだし。 でも、gawkがデフォルトでOOに対応すればawkでオブジェクト指向する人も増えるかもね。
541 名前:デフォルトの名無しさん mailto:sage [2011/02/19(土) 23:05:51.24 .net] >>533 デフォでインストールされるawkでできる範囲のことしかやらないよ
542 名前:デフォルトの名無しさん mailto:sage [2011/02/20(日) 00:59:51.51 .net] 同感。>デフォでできる範囲 長めのスクリプトを書いた事があったのでOOあると便利と思うけど わざわざインストールするならperl、ruby、pythonがあるしなぁ
543 名前:デフォルトの名無しさん mailto:sage [2011/02/22(火) 10:31:51.00 .net] awkで書かれたawk++ってないの?
544 名前:デフォルトの名無しさん mailto:sage [2011/03/02(水) 23:14:41.35 .net] gawkで平仮名・カタカナの部分を抜き出したいと思ってます。 例えば「awkについて語るスレ」だったら "について" "るスレ" を変数に入れたいのですが、いい方法ありますでしょうか?
545 名前:537 mailto:sage [2011/03/02(水) 23:17:39.07 .net] 「について」と「るスレ」はそれぞれ別の変数に入れたいと思っています
546 名前:デフォルトの名無しさん mailto:sage [2011/03/02(水) 23:27:45.29 .net] アルファベット以外の部分だったら、アルファベットをFSに指定してwhileで回せばいいけど、 漢字も抜くのは難しいな。 それに、事実上変数は無限に生成するって事か。
547 名前:デフォルトの名無しさん mailto:sage [2011/03/02(水) 23:58:57.50 .net] matchの第2引数に/[あ-んア-ン]+/を持ってくるとか?
548 名前:デフォルトの名無しさん [2011/03/03(木) 13:28:46.50 .net] $0,$1...$NFを壊してもいいんだったら、私ならこうします。 gsubの検索文字鉄には正規表現を使用することができるから、 ひらがなとカタカナ以外の文字をスペースに置き換える。 gsub(/[^ーぁ-んァ-ン]/," ") ひらがなとカタカナ以外の文字は半角スペース2つに置き換わる。 あとはNFを見て表示したいように処理する。 注意すべきは、Windows版の新しいバージョンのものでは、 正規表現として、ひらがなを ぁ-ん で、カタカナを ァ-ン で 指定できないものがあります。 たしかマルチバイト拡張で壊された。
549 名前:537 mailto:sage [2011/03/03(木) 14:28:35.14 .net] >541 まだ試してませんが、欲する文字以外を消してゴニョゴニョすればいけそうです。 >539-540さんもありがとうございました。
550 名前:デフォルトの名無しさん [2011/03/03(木) 19:41:21.36 .net] BEGIN { str = "デンコ漢字ばんざい元気abcdeだから" c = split(str, a, "[^ーァ-ンぁ-ん]") for (i = c; i>=1; i--) { if ( a[i] !~ /^$/ ) { print a[i] } } }
551 名前:デフォルトの名無しさん mailto:sage [2011/03/03(木) 19:44:47.65 .net] ボケかました 4行目は普通に for ( i = 1; i <=c; i++) { でOK。
552 名前:デフォルトの名無しさん mailto:sage [2011/03/03(木) 22:55:52.84 .net] cを残さなくとも for (i in a){if (a[i]) print a[i]} で間に合うような。
553 名前:デフォルトの名無しさん mailto:sage [2011/03/04(金) 01:04:03.52 .net] for-inだと順序が保障されないんじゃなかったっけ?
554 名前:デフォルトの名無しさん [2011/03/04(金) 08:34:52.75 .net] for ( i = 1; i in a ; i++) って書き方もできるよ
555 名前:デフォルトの名無しさん [2011/03/07(月) 14:14:11.11 .net] a1 a1 a1 a2 a2 a3 b1 b1 b1 b1 c1 d1 d2 d2 .... のように、フィールド数がバラバラで、フィールドが一致する場合もあれば 一致しないデータがあるのですが、重複を a1 a2 a3 b1 c1 d1 d2 のようにまとめあげるにはどうしたらよいでしょうか? さすがにググってコピペという訳にもいかず。。。
556 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 14:31:25.16 .net] >>548 いろいろやり方はあると思うが awk '{j=0;delete a;for(i=1;i<=NF;i++){if(!a[$i]++){$(++j)=$i}}NF=j;print}'
557 名前:デフォルトの名無しさん [2011/03/07(月) 14:53:42.21 .net] ありがとうございます。 それぞれ、4つ重複データのあったものは3つに、2つのものは1つにと減ったのですが それ以上減ってません。同じコマンドを繰り返しかけてみたのですが、変化はなかったです。 a1 a1 a1 a1 b1 b1 b1 ...の部分が a1 a1 a1 b1 b1 にはなったという意味です。 もう少しおつきあいいただけないでしょうか。。。
558 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 15:06:41.15 .net] 手元では一つになるけどなぁ。原理はわかるだろうからあとはがんばれ。 行ごとにフィールドの添字についてループするのと連想配列で出現チェックがキモ。 % cat hoge.txt a1 a1 a1 a2 a2 a3 b1 b1 b1 b1 c1 d1 d2 d2 % awk '{j=0;delete a;for(i=1;i<=NF;i++){if(!a[$i]++){$(++j)=$i}}NF=j;print}' hoge.txt a1 a2 a3 b1 c1 d1 d2
559 名前:デフォルトの名無しさん [2011/03/07(月) 15:14:33.26 .net] 0610005C13Rik 0610005C13Rik 0610005C13Rik 0610007C21Rik 0610007C21Rik 0610007C21Rik 0610007C21Rik 0610007C21Rik こういう感じの文字列なんですが a1とかb1で例えても大丈夫だったですか?
560 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 15:38:11.62 .net] 空白で区切られた文字列ならなんでもいいが、そのレベルの質問が 出るようじゃもうすこし基礎を勉強しないとだめかもなぁ。
561 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 15:50:13.69 .net] シングルクオーテーション使用のサンプルで問題ないと言う事は〜 UNIX環境なのかな〜
562 名前:デフォルトの名無しさん [2011/03/07(月) 15:58:11.87 .net] Mac OSXのターミナルを使ってます。 >>551 はそのままうまく動きました。 いま昇順で手動で作業してますが、まだzを抜けることができません。 もう手がつりそうです
563 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 16:04:33.75 .net] 一行野郎を分解してスクリプトに組み直して弄れば動作確認出来ると思う
564 名前:デフォルトの名無しさん [2011/03/07(月) 16:21:10.50 .net] いまwまできました。もうだめです。 一応、ファイルをおいてみます。。。 www5.puny.jp/uploader/download/1299482386.zip パスは1234です。
565 名前:デフォルトの名無しさん mailto:sage [2011/03/07(月) 17:18:15.93 .net] まだやってるのか〜 ファイルの ^M が問題みたいだから CRLFのファイル形式に変換して上の一行野郎で問題ないみたいだったよ。
566 名前:デフォルトの名無しさん [2011/04/19(火) 03:07:46.46 .net] #複数行の入力中、先の行の11カラム目にOUTが含まれているかつ次の行の11カラム目にINが含まれている2行が揃った時、2行を出力 $11~/OUT/{ prev=$0; } $11~/IN/{ if(prev!=""){ print prev; print; } prev=""; }
567 名前:デフォルトの名無しさん [2011/04/19(火) 15:55:50.78 .net] # 7.awk NR >= 2{ if($0 ~ /^>'=+/){ if($0 ~ /~$/){ print "A"; }else{ print "NAA"; } }else if($0 ~ /^>\^(Q=)+/){ if($0 ~ /~~$/){ print "B"; }else{ print "NAB"; } }else{ print "NAC"; } } 7.txt 3 >'======#======~ >^Q=Q=Q=Q=Q=Q=Q=Q=~~ >'===#====~ NAA NBB NAA となる。何で? A B A となってほしいのに・・・gawk 3.1.7です・・
568 名前:デフォルトの名無しさん mailto:sage [2011/04/19(火) 16:30:51.01 .net] 俺の手元のgawk 3.1.7では期待通りの結果になるなあ。 行末がらみだと改行コードが違ってたり見えない空白が 入ってたりというのがよくあるので確認してみ。
569 名前:デフォルトの名無しさん mailto:sage [2011/04/19(火) 16:32:43.45 .net] >>560 あと /^>'=+/ ってキャプチャとかしてるわけじゃないから+は無駄じゃないか。
570 名前:デフォルトの名無しさん [2011/04/19(火) 16:45:20.75 .net] >>561 ありがとうございました。改行コードをunix形式にしたら出来ました。 今後ともよろしくお願い致します。
571 名前:デフォルトの名無しさん [2011/04/19(火) 17:00:39.34 .net] >>559 INがあるときにしかprevがクリアされていないから、OUTが出現した以降に 複数行が経過してもINが出現するとprintされるスクリプトになっているよ。
572 名前:559 mailto:sage [2011/04/20(水) 01:08:11.06 .net] okwave.jp/qa/q6672025.html とかの入力をイメージしてたもので... $11~/OUT/{ prev=$0; } $11~/IN/{ if(prev!=""){ print prev; print; } } $11!~/OUT/{ prev=""; }
573 名前:デフォルトの名無しさん [2011/05/01(日) 16:22:39.39 .net] okwave.jp/qa/q6660984.html #2列目の項目がdisk1〜4まで不足部分が埋まるようにし、不足していた部分の1列目には前の時間、3列目には0で埋めたい BEGIN{ dt=prevDt="00:00:00"; } NF>=3{ dt=$1; tgt=$2; n=$3; } NF==2{ tgt=$1; n=$2; } { gapDisp(prevTgt,tgt); disp(dt,tgt,n); prevDt=dt; prevTgt=tgt; } END{ gapDisp(tgt,"disk1"); } function disp(dt,tgt,n){ print dt, tgt, n; } function gapDisp(disk,endDisk, cnt) { for(cnt=add(getNo(disk)); cnt!=getNo(endDisk); cnt=add(cnt)) disp(prevDt, sprintf("disk%d", cnt), 0); } function add(cnt){ return ((++cnt>4)?(1):(cnt)); } function getNo(disk){ sub(/disk/,"",disk); return disk; }
574 名前:デフォルトの名無しさん mailto:sage [2011/05/01(日) 19:40:09.87 .net] BEGIN { reset() } NF == 2 { $3 = $2; $2 = $1; $1 = last_t } { last_t = $1 } { if ($2 < last_disk) { p(); reset() } last_disk = $2 } { n[$2] = $3 } { for(i in n) { if (i >= $2) { t[i] = $1 } } } END { p() } function p() { for (i = 1; i <= 4; i++) { d = "disk" i print t[d], d, n[d] } } function reset() { for (i = 1; i <= 4; i++) { d = "disk" i t[d] = t["disk4"] n[d] = 0 } }
575 名前:デフォルトの名無しさん [2011/05/03(火) 14:58:05.53 .net] 間違ってるよ しかも長くて美しくないよ
576 名前:デフォルトの名無しさん mailto:sage [2011/05/03(火) 15:13:19.32 .net] okwave.jp/qa/q6711117.html ...こんな感じかねぇ? awk -f sum.awk データ | sort ----- sum.awk ----- $1!~/商店名/{ tbl[$1 "," $2]+=$3; } END{ for(key in tbl){ split(key, item, /,/); print item[1], item[2], tbl[key]; } } -----
577 名前:デフォルトの名無しさん mailto:sage [2011/05/03(火) 15:33:28.80 .net] >>566 NF==3 { disp(); for(i=1;i<=4;i++) { disk_time[i]=$1 disk_val[i]=0 } disk_val[substr($2, 5, 1)]=$3 } NF==2 { disk_val[substr($1, 5, 1)]=$2 } END{ disp() } function disp() { for(i=1;i<=4;i++) { if(i in disk_time) printf("%s disk%d %s\n", disk_time[i], i, disk_val[i]) } }