1 名前:デフォルトの名無しさん mailto:sage [2007/02/23(金) 23:55:42 .net] 腐っても鯛? 騏も老いては駑馬に劣る? 三人の碩学が生み出したスクリプト言語AWKについて語るスレ ◆ 前スレ awkについて語るスレ pc10.2ch.net/test/read.cgi/tech/1023556171/ ◆ 関係スレ シェルスクリプト相談室 pc10.2ch.net/test/read.cgi/tech/1112553783/ AWKでCGI pc10.2ch.net/test/read.cgi/php/1171804314/ 【sed】シェルスクリプト総合@LINUX Part2【awk】 pc10.2ch.net/test/read.cgi/linux/1154578200/ ◆ 参考 The AWK Programming Language (Brian Kernighan): ttp://cm.bell-labs.com/cm/cs/awkbook/index.html GAWK (GNU Projedt): ttp://www.gnu.org/software/gawk/
616 名前:デフォルトの名無しさん mailto:sage [2011/06/03(金) 23:58:11.26 .net] >>606 あちゃ!そうでした。$で戻るのは文字列だった。 その仕様書読んでると、NFを拡張したとき、元々なかった所はuninitialized valueになるってあったので。 >>607 それでいいんだけど、PIとかで参照できたらもっといい、と思ったのです。 >>608 数値計算のために、CのDBL_EPSILONの代わりになる定数が欲しいなと。 任意の精度で丸められる関数もないですし。
617 名前:デフォルトの名無しさん mailto:sage [2011/06/04(土) 09:41:48.63 .net] DBL_EPSILONが>>608 の(1)〜(3)のどれかわからない? 数値計算の基本なんだが。
618 名前:デフォルトの名無しさん [2011/06/10(金) 21:49:33.34 .net] 変数名など、自前であっても規則を意識している方いますか? awkだと、C風が一般的なのでしょうか? 一番最初がVBAだったので、長い名前と省略が混ざってしまって 自分でイライラしています。 みなさんの、通常の変数はこう、配列はこう、定数はこう、文字型はこう・・・ というものを参考にしたいです。
619 名前:デフォルトの名無しさん mailto:sage [2011/06/10(金) 22:10:28.97 .net] >>611 システムハンガリアンを採用するかどうか悩むほど大きなものをawkで書いたことが無い
620 名前:かあた mailto:sage [2011/06/13(月) 18:37:34.88 .net] 、5なわやあふぉt( ())
621 名前:デフォルトの名無しさん mailto:sage [2011/06/15(水) 21:51:26.93 .net] >>611 遅レスだが、型_内容の説明_名前みたくしてる。名前が一文字だとそのままだけど。 グローバル変数とローカル変数のどっち弄ってるのか分かりやすいように、ローカル変数は必ずlで始めるようにしてる。 d_per_shouhizei = 5.0とかね。
622 名前:デフォルトの名無しさん [2011/06/20(月) 18:37:26.17 .net] gawkでBINMODEを設定すればバイナリーの入出力ができるのはわかるのですが、 入力されたバイナリーを16進ダンプして表示するにはどうしたらよいでしょうか? od等の外部コマンドを使う意外に方法があればお教えください。
623 名前:デフォルトの名無しさん mailto:sage [2011/06/20(月) 19:17:07.50 .net] printf("%02x\n", $1);
624 名前:天使 ◆uL5esZLBSE mailto:sage [2011/07/05(火) 00:15:13.83 .net] 二度と話かけんなよ お前らってどうみてもゴミだよな
625 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 14:04:55.24 .net] ゴミんなさい
626 名前:デフォルトの名無しさん mailto:sage [2011/07/14(木) 23:55:15.84 .net] >>595 gawk4.0.0でa[0][0]=1も可能になったじゃないか
627 名前:デフォルトの名無しさん mailto:sage [2011/07/30(土) 19:46:15.81 .net] 超初心者の質問で申し訳ありません。以下のようなデータを aaa 10 bbb 20 ccc 30 aaa 30 bbb 30 aaa 15 ccc 30 ddd 20 以下のようにまとめたいのですが、どうしたらいいでしょうか? aaa 55 bbb 50 ccc 60 ddd 25
628 名前:デフォルトの名無しさん mailto:sage [2011/07/30(土) 19:53:38.97 .net] ddd 20 ではないかと思うがこんな感じかな awk '{a[$1]+=$2} END {for (b in a) {print b " " a[b]}}' | sort
629 名前:デフォルトの名無しさん mailto:sage [2011/07/30(土) 23:15:27.52 .net] Gawk4ならPROCINFO["sorted_in"]の設定で最後のsortが要らなくなる
630 名前:620 mailto:sage [2011/07/30(土) 23:22:20.03 .net] >621 ありがとうございます!うまくいきました。
631 名前:デフォルトの名無しさん mailto:sage [2011/07/31(日) 15:24:48.76 .net] gawkはもう別言語なイメージ。普段mawk使ってると
632 名前:デフォルトの名無しさん mailto:sage [2011/08/16(火) 22:48:21.64 .net] ここって生きてますか?
633 名前:デフォルトの名無しさん mailto:sage [2011/08/18(木) 01:56:26.63 .net] 生きてますん
634 名前:デフォルトの名無しさん mailto:sage [2011/08/19(金) 00:53:44.39 .net] 生きていることを願って質問を。 WIN32のEXE一つで、下のTEST.AWKがマトモに動くAWKを探しています。 これら以外にありますか? hinadori.atnifty.com/~wills/program/gawkm115.zip my.vector.co.jp/servlet/System.FileDownload/download/http/0/376460/pack/win95/util/text/awk/gawk-mbcs-win32-20051223.zip?ds my.vector.co.jp/servlet/System.FileDownload/download/http/0/80308/pack/win95/util/text/awk/mw32r27.lzh?ds Cygwin版も試したのですがダメでした。 TEST.AWK { gsub("[0-9]","x",$0) ; gsub("ソ","ソ",$0) ; gsub("T","T",$0) ; print } TEST.DAT アイウエオカキクケコサシスセソ ココココサフサコココココ ココココサフサココココ ココココサフサコココココ ココココサフサコココココ サフサフサフサフサフサ ココココサフサコココココ ココココサフサココココ ココココサフサコココココ ココココサフサコココココ サフサフサフサフサフサ
635 名前:627 mailto:sage [2011/08/19(金) 01:00:20.60 .net] TEST.DATは、空白が入っています。 専ブラのポップアップをコピペして下さい。
636 名前:デフォルトの名無しさん mailto:sage [2011/08/19(金) 06:26:54.92 .net] ウチに帰ってから調べてみるよ
637 名前:デフォルトの名無しさん mailto:sage [2011/08/19(金) 11:02:41.54 .net] >>627 −628 cygwinのawk(GNU Awk 3.1.8)で動くけど、どうなるはずがどう動かないと言っている? >627のtest.datなら、当然「ソ」だけが変換されるけど。
638 名前:デフォルトの名無しさん mailto:sage [2011/08/19(金) 11:55:06.25 .net] (CygwinならUTF8じゃないとうまく動かないけど)Shift JISで動作させたいってことかな? 事前にTEST.DATをnkf -wに通したら駄目かな。
639 名前:629 mailto:sage [2011/08/19(金) 21:59:57.43 .net] >>627 スクリプトもDATもSJISで試したけど、上記3つのうち、gawk-mbcs-win32-20051223.zipはダメだったよ。 1行目がこんなんなる。 アxxエオカキクxコサxxxソ 手持ちの GNU Awk 3.1.7(windows special Nov 24 2009) で、--ctype=SJISやっても同じ結果になるね。 スクリプト、DATをUTF-8にして、--ctype=UTF8やってリダイレクトしたファイルは正常な結果が出るよ。 リダイレクトしないでコマンドプロンプトに表示させると化けるけど。
640 名前:デフォルトの名無しさん mailto:sage [2011/08/19(金) 23:18:25.14 .net] EUCなら半角カナもうまくやってくれるんだが…
641 名前:デフォルトの名無しさん [2011/08/24(水) 08:07:37.54 .net] gawkはガンガン機能を拡張してるけど、 そろそろOOP対応してくれないかな。 awk++とかあるけど、標準でOOPできれは便利。
642 名前:デフォルトの名無しさん mailto:sage [2011/08/24(水) 22:44:37.24 .net] > OOP ...もはやawkでやる意味が無いw 他にいくらでもある別の言語でいいじゃん
643 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 01:14:17.45 .net] awkに在ると便利かもと思うのは参照値くらいかな 配列や関数への参照を値として取り出し格納したり 逆にその値から元の配列にアクセスしたり元の関数を呼んだり出来ると 相当に複雑なデータ構造が表現可能になる、それこそOOPっぽいことも可能だし でもあんまりややこしいことやるならPerlでいいから必須ではないね
644 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 02:28:23.99 .net] > 関数を呼んだり 変数の値を関数名として var = "sage"; @var(); ってできるけど、それとは違うのん?
645 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 04:07:56.67 .net] およ、もうあるのかw 最近のawkは分からねえ…ってことは、配列への参照を使って入れ子の配列とか既に作れちゃったりするのか?
646 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 10:56:54.36 .net] 配列の配列は作れるよ。gawk4なら。
647 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 19:51:33.84 .net] (´_ゝ`)フーン
648 名前:デフォルトの名無しさん [2011/08/25(木) 20:52:51.07 .net] class human { property name property sex property age method new(x, y, z) { name = x sex = y age = z } method say() { printf("私は%s。%d歳の%sです。\n",name, age, sex) } } class japanes
649 名前:e : human { property name property sex property age method say() { printf("私は%s。%d歳の%sです。国籍は日本です。\n", name, age, sex) } } BEGIN { alice = human.new("アリス", "女", 11) taro = japanese.new("太郎", "男", 15) yuka = japanese.new("由佳", "女", 18) alice.say() taro.say() yuka.say() } [] [ここ壊れてます]
650 名前:641 [2011/08/25(木) 20:58:10.41 .net] >>635 code.google.com/p/lawker/source/browse/fridge/lib/bash/awk%2B%2B/ これを使えばこの程度のOOPはどうにかできる。 本当にこの程度でいいからOOPに対応してほしい。 使う人はほとんどいないと思うが、全くできないのも困る。
651 名前:デフォルトの名無しさん mailto:sage [2011/08/25(木) 22:07:53.46 .net] それは最早awkである必要が全く無い
652 名前:デフォルトの名無しさん mailto:sage [2011/08/26(金) 06:00:04.19 .net] function Human(self,name,sex,age) { self["property___name"] = name self["property___sex"] = sex self["property___age"] = age self["method___say"] = "Human___say" } function Human___say(self) { printf "私は%s。%d歳の%sです。\n", self["property___name"], self["property___age"], self["property___sex"] } function Japanese(self,name,sex,age) { Human(self,name,sex,age) self["method___say"] = "Japanese___say" } function Japanese___say(self) { printf "私は%s。%d歳の%sです。国籍は日本です。\n", self["property___name"], self["property___age"], self["property___gender"] } function methodcall(obj,methodname, m) { m = obj["method___" methodname] @m(obj) } BEGIN { Human(alice, "アリス", "女", 11) Japanese(taro, "太郎", "男", 15) Japanese(yuka, "由佳", "女", 18) methodcall(alice,"say") methodcall(taro,"say") methodcall(yuka,"say") }
653 名前:デフォルトの名無しさん mailto:sage [2011/08/26(金) 06:01:35.02 .net] ごめん一部genderになってるからsexに直しといて とりあえず、こんな感じでgawk4でもOOP自体は出来るよって話
654 名前:デフォルトの名無しさん [2011/08/27(土) 15:07:17.61 .net] >>644 なるほどねー とても勉強になります でも、やっぱりOOP用の構文が使えればベストですね そのほうがわかりやすいと思います
655 名前:デフォルトの名無しさん mailto:sage [2011/08/27(土) 15:58:44.09 .net] やっぱ別言語使うべきだろ
656 名前:デフォルトの名無しさん mailto:sage [2011/08/27(土) 16:10:36.72 .net] 本当に欲しいんなら、gawkのMLにこうすればOOP実現できることを発見したんだけど、 これの糖衣構文を用意してくれって投稿するといいんじゃね switchも実装されてるし、欲しい人が居ると分かれば付けてくれるかもよ
657 名前:デフォルトの名無しさん mailto:sage [2011/08/27(土) 16:25:08.65 .net] #! /usr/bin/env python # -*- coding: utf-8 -*- class human: def __init__(self, name, sex, age): self.name = name self.sex = sex self.age = age def say(self): print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。") class japanese(human): def __init(self): super(human, self).__init__(self) def say(self): print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。国籍は日本です。") if __name__ == "__main__": alice = human("アリス", "女", 11) taro = japanese("太郎", "男", 15) yuka = japanese("由佳", "女", 18) alice.say() taro.say() yuka.say()
658 名前:デフォルトの名無しさん mailto:sage [2011/08/27(土) 16:26:25.23 .net] pythonで書いてみると、 >>641 と比べると特にわかりやすいわけでもないけど >>644 よりはわかりやすい
659 名前:デフォルトの名無しさん mailto:sage [2011/08/27(土) 16:53:49.92 .net] そりゃawkはOOPLではないからな あくまでシェルのお供でいいと思うんだ そしてそこに高度なOOP機能は要るとは思えない どちらかと言えばフィールド抽出とかをもっと便利にすべきだよ
660 名前:デフォルトの名無しさん mailto:sage [2011/09/17(土) 15:34:39.29 .net] cygwin以外でgawk4.0をwindowsで使おうと思ったら、バイナリはどこで入手できもうすかね?
661 名前:デフォルトの名無しさん mailto:sage [2011/09/17(土) 16:28:58.78 .net] cygwin で駄目な理由が分からないから教えられない。
662 名前:デフォルトの名無しさん mailto:sage [2011/09/18(日) 08:02:36.95 .net] >>652 つwww.klabaster.com/progs/gawk32.zip
663 名前:デフォルトの名無しさん mailto:sage [2011/09/19(月) 13:00:55.06 .net] >654 さんくすこ >653 awkの実行形式だけ入手すれば良いようにしたいのさ。
664 名前:デフォルトの名無しさん mailto:sage [2011/09/19(月) 14:01:43.39 .net] バイナリ互換のWindowsなのに、cygwinてexeをもってくだけじゃ使えないの?
665 名前:デフォルトの名無しさん mailto:sage [2011/09/19(月) 16:07:37.39 .net] 物によっては使えたような気がする。 cygwin1.dllだっけ?にパスが通ってれば大体使えたような気がする。
666 名前:デフォルトの名無しさん mailto:sage [2011/09/19(月) 17:00:12.76 .net] 結構沢山のdllが要るよ コマンドによるけど
667 名前:デフォルトの名無しさん mailto:sage [2011/10/24(月) 01:55:49.24 .net] 教えてください。英語得意な人 www.gnu.org/s/gawk/manual/gawk.html#Array-Sorting-Functions の asort(), asorti()で使うユーザー定義の比較関数について 3番目の引数とPROCINFO["sorted_in"]に設定するのと違うのか同じなのか? それと www.gnu.org/s/gawk/manual/gawk.html#String-Functions に書いてある3番目の引数の説明("descending"とか)が両立してんの?
668 名前:デフォルトの名無しさん mailto:sage [2011/10/24(月) 11:34:13.18 .net] www.gnu.org/s/gawk/manual/gawk.html#Array-Sorting-Functions As with PROCINFO["sorted_in"], this argument may be the name of a user-defined function, .... www.gnu.org/s/gawk/manual/gawk.html#String-Functions The third argument can also be a user-defined function name .... 第三引数の値と同名の関数が定義済みならそれを利用するとか、 そういう方法で区別してるんじゃないの
669 名前:デフォルトの名無しさん mailto:sage [2011/10/24(月) 13:33:04.59 .net] >>659 比較関数の与え方はPROCINFO["sorted_in"]の場合と同じってことだろ。 自分で定義した関数の名前でもいいし、11.2.1.2に書いてあるようにすでに用意 されている@〜を使ってもいい。
670 名前:デフォルトの名無しさん mailto:sage [2011/11/14(月) 21:59:05.28 .net] 個人的には、GAWKにはあと、Cで書いた関数の呼び出しというか GAWKで呼ぶ関数をCで書ける機能が欲しいと思ってるんだけど、 ここ見る限り世間的にはあんまり需要ないんかねぇ。 まぁ、それやるくらいならGAWK自体に変更を加えて再コンパイルしろってことかもしれないけど。
671 名前:デフォルトの名無しさん mailto:sage [2011/11/15(火) 01:44:31.01 .net] PとかR使え言われると思う。
672 名前:デフォルトの名無しさん mailto:sage [2011/11/15(火) 01:58:32.43 .net] >>662 ttp://www.gnu.org/s/gawk/manual/html_node/Dynamic-Extensions.html じゃダメ?将来的にさらに拡張される可能性はあるみたいだけど
673 名前:デフォルトの名無しさん mailto:sage [2011/12/09(金) 00:35:09.18 .net] 最近awkcardを知って座右に置いてるのだが、日本語版って存在するのだろうか。
674 名前:デフォルトの名無しさん [2011/12/22(木) 16:57:35.32 .net] ttp://gauc.no-ip.org/awk-users-jp/blis.cgi/DoukakuAWK_271 ここに書いてある通りにしても日本語に翻訳されません どうしてですか? 環境は LinuxMint12 、 GNU Awk 3.1.8 です
675 名前:デフォルトの名無しさん mailto:sage [2011/12/22(木) 18:01:49.60 .net] >>666 その通りにやったと言うのなら、何故poファイルを提示しないのかね、ダミアン君。
676 名前:デフォルトの名無しさん mailto:sage [2011/12/22(木) 18:07:45.38 .net] >>667 poは作成しましたし、moも所定のディレクトリにあります。 poは自分で編集しても、そのサイトの内容をコピペしてもダメでした。 $ cat gettext.po #: gettext.awk:10 msgid "********** Count Prime Number **********" msgstr "========== 素数を数える ==========" #: gettext.awk:14 msgid "2 is a prime number." msgstr "2 は素数です。" #: gettext.awk:24 msgid "%d is a prime number.\n" "" msgstr "%d は素数です。\n" $ ls ja_JP/LC_MESSAGES/ gettext.mo
677 名前:デフォルトの名無しさん mailto:sage [2011/12/22(木) 18:10:02.43 .net] 結果はこの通りです。 $ LC_ALL=ja_JP gawk -f gettext.awk 10 ********** Count Prime Number ********** 2 is a prime number. 3 is a prime number. 5 is a prime number. 7 is a prime number.
678 名前:デフォルトの名無しさん mailto:sage [2012/01/12(木) 13:56:36.33 .net] ずいぶんawkから離れていて久しぶりに使ったら nawkに日本語のバグがあることにしばらく気づかなかった substr()でutf-8のテキストを切り出すとおかしな値になる gawkでは直っている
679 名前:デフォルトの名無しさん mailto:sage [2012/01/12(木) 19:50:49.28 .net] そもそもUTF-8に対応してたっけ
680 名前:デフォルトの名無しさん mailto:sage [2012/01/13(金) 00:28:07.37 .net] ttp://blog.livedoor.jp/corbie/archives/cat_94960.html 残念ながら、シフトJIS、UTF-8両方で正常に動作しそうなWindows版gawkは候補の中にありませんでした。
681 名前:デフォルトの名無しさん mailto:sage [2012/01/13(金) 07:52:50.95 .net] Linuxでは普通に動くが…
682 名前:デフォルトの名無しさん mailto:sage [2012/04/29(日) 21:07:39.93 .net] ファイル名が"*.txt"の一覧を取得するとき、"\.txt"でマッチさせると、任意の一文字.(ドット)と解釈されてしまうんですが、いい方法無いでしょうか?
683 名前:デフォルトの名無しさん mailto:sage [2012/04/29(日) 22:04:14.36 .net] GNU Awk 3.1.7だとドットにマッチしたけどそもそもawkの話? 具体的にコマンドがほしいな
684 名前:デフォルトの名無しさん mailto:sage [2012/04/29(日) 22:08:23.01 .net] 昭和の頃覚えたアセンブラとC言語 これがあったから いまだに自分が損な業界で飯を食ってる
685 名前:デフォルトの名無しさん mailto:sage [2012/04/29(日) 22:36:10.83 .net] >>676 そこからjavaに行ってスマホアプリ開発ならもう一花咲いたかもしれませんねw
686 名前:デフォルトの名無しさん mailto:sage [2012/04/29(日) 23:09:38.43 .net] 馬鹿には無理
687 名前:674 mailto:sage [2012/04/30(月) 18:07:43.22 .net] >>675 ls | awk '{ if( match($0,"\.txt") > 0) print $0 }' ↑会社のサーバ上でこんな感じのことやろうとしてたんですが、 「gawk: 警告: エスケープシーケンス `\.' は `.' と同等に扱われます」 とメッセージが出力され、ドットが任意の一文字?と解釈されて困っていましたが、 自己解決しました。(自宅のLinuxPCで動作確認しました。GAWK3.1.7及び4.0.1) "\.txt"では無くて、".txt"で良かったんですね。 お騒がせしました。 もしかしたら、会社のサーバ(RHEL)のGAWKが古くて解決できてないかもしれませんが。
688 名前:デフォルトの名無しさん mailto:sage [2012/04/30(月) 20:27:16.48 .net] >>679 match() の第二引数に文字列を与えた場合は事前に正規表現への型変換が行われるが、 その際にエスケープが外れて /.txt/ と同等になってしまう、 ということかと。 つまり "\\.txt" とするか、 正規表現の /\.txt/ を与えればよい。 The GNU Awk User's Guide にもこの現象についての説明はあるが、 ~ !~ 演算子についてしか触れられていない。 ttp://www.kt.rim.or.jp/~kbk/gawk-30/gawk_5.html#SEC32
689 名前:デフォルトの名無しさん mailto:sage [2012/05/24(木) 00:27:31.74 .net] gawk4.0.2付属の原版ではmatchの説明にもその辺触れられてるね。 www.gnu.org/software/gawk/manual/html_node/String-Functions.html#String-Functions 誰かこのバージョン日本語化してないかな。
690 名前:デフォルトの名無しさん mailto:sage [2012/07/12(木) 02:26:40.35 .net] FIFOな感じの先入れ先出しのバッファには何使えばいい? というか、 Arrayで、たとえばA[3] からA[8]までのデータをA[1]からA[6]に動かすには何が一番早い? できれば配列は1つしか使いたくないのだが、無理だろうか…
691 名前:デフォルトの名無しさん mailto:sage [2012/07/12(木) 09:23:22.92 .net] 速さを求めるなら毎度全要素ずらすより、読み出し位置と書き込み位置の添字持って 管理した方がたいてい速い
692 名前:デフォルトの名無しさん mailto:sage [2012/07/12(木) 10:14:32.78 .net] awkには連想配列しかないしな
693 名前:デフォルトの名無しさん mailto:sage [2012/07/14(土) 14:35:06.22 .net] リングバッファで何とかなるならリングバッファかな
694 名前:デフォルトの名無しさん mailto:sage [2012/07/14(土) 22:27:17.73 .net] >>682 BEGIN{ QMAX=3 QTopPos=0;QTailPos=0;QNum=0; deQ(); enQ("1");deQ(); enQ("a");enQ("b");enQ("c");enQ("x");deQ();deQ();deQ();deQ(); } function enQ(PushVal){ if (QNum+1 > QMAX){print "おなかいっぱい"; return;} nextPos = (QTopPos+1) % QMAX; queue[QTopPos] = PushVal; QTopPos=nextPosQNum++; } function deQ(){ if (QNum < 1){print "からっぽ"; return} QNum--; TailVal=queue[QTailPos] QTailPos = (QTailPos +1) % QMAX; print TailVal; return TailVal; }
695 名前:686 mailto:sage [2012/07/14(土) 22:54:06.64 .net] ↑の結果はこんな感じ。 >からっぽ >1 >おなかいっぱい >a >b >c >からっぽ >>685 の書いているリングバッファ実装です。 enqueue,dequeue回数が多いならリングバッファで良いと思う。 大抵の場合はQMAXに大きな値を設定すれば事足りるハズだけど 上限が決定できない等の事情があればdelete arrayを使った単純な配列管理かな。 ただ添え字が数値上限を超えない様な工夫は必要だね。
696 名前:デフォルトの名無しさん mailto:sage [2012/07/15(日) 21:09:36.15 .net] リングでも上限を定めると入力ストリームの上限が不明な場合まずいことになるので、現在は A=入力Array,C一時保管,i,k,n,p k=1;C[0]=0; for(i=1;i<=A[0];i++){n=0;while(k<i && A[k++]=C[n+=1]);if(n){ delete C[C[0]+1];C[0]-=n;p=0;while(C[p+=1]=C[n+=1]);}p=1; while(match(substr(A[i],p),re)){p+=RSTART-1;n=substr(A[i],p,RLENGTH); if(k<i){A[k++]=n;}else{C[C[0]+=1]=n;};p+=RLENGTH;}};n=1; while(A[k++]=C[n]){delete C[n++];};A[0]+=C[0]-1;C[0]=0; を使っている。 re=regexpとして、Array Aに一致するデータがあれぼそれを取得、結果をArray Aに出力、A[0]に合計が記載。 これ以上(コードサイズ、ある程度の速度、メモリの使用量を極力少なく)という条件で最適化できるだろうか… だれか頼む。 入力と出力先が同じでも、別でも作動するコードなら尚のこと良いのだが…
697 名前:デフォルトの名無しさん mailto:sage [2012/07/17(火) 00:02:18.87 .net] これはひどい デバッグも拡張も無理じゃね
698 名前:デフォルトの名無しさん mailto:sage [2012/07/17(火) 22:03:00.62 .net] 基本的に一度作って後は必要に応じてコピペだがらな。他には function grep( o, re, p, B, this, a ){ B[0]=0;if(o~"-v"){while((getline v < p)>0){if(!match(v,re))B[B[0]+=1]=v;}return B[0];}; if(o~"-o"){while((getline v < p)>0){a=v;while(match(a,re)){B[B[0]+=1]=substr(a,RSTART,RLENGTH); a=substr(a,RSTART+RLENGTH);}};return B[0];};while((getline v < p)>0){if(match(v,re))B[B[0]+=1]=v;}return B[0]; } なんかも良く使う。grep("-o","pattern","/var/log",data);みたいな感じで。前のはagrep("-v",pattern,B,C)の一部分。 日ごろのメンテでちょっとした手作業じゃめんどいの組むときに、ほぼ数分で組みあがるのが楽なんだよ。 サブプロセスとしてgrep呼び出すのがコストかかる時とか、perlが破損した状況でのリカバリースクリプトとして組んだのが元だけど。 カーネルさえ生きていれば後はawkバイナリ流し込めば使え、shが半分死んでいてもなんとか動くし。
699 名前:686 mailto:sage [2012/07/21(土) 23:12:03.74 .net] >>688 BEGIN{ QMAX=9007199254740991 QTopPos=QTailPos=QNum=0; hitTop=0; A[++z]="hoge"; A[++z]="1 2 3 4 5"; A[++z]="fuga"; A[0]=z; for(i=1;i<=A[0];i++){ p=1; while(match(substr(A[i],p),/[0-9]+/)){ p+=RSTART-1; enQ(substr(A[i],p,RLENGTH)); p+=RLENGTH; } if(QNum>0){ while(QNum && hitTop<i)A[++hitTop]=deQ(); }else{ delete A[i]; } }; if(QNum>0) while(QNum)A[++A[0]]=deQ(); for(z=1;z<=A[0];z++)print "A[" z "]:" A[z]; }
700 名前:686 mailto:sage [2012/07/21(土) 23:44:24.03 .net] 691の続き ちなみに、A[1]〜A[A[0]]をgrepして結果はA[1]〜A[?]に戻すスクリプトね。 複数件マッチする事があるので未処理行を上書きしないようにキュー使ってる。 function enQ(PushVal){ if (QNum+1 > QMAX){print "Queue Overflow"; exit;} nextPos = (QTopPos+1) % QMAX; QBody[QTopPos]=PushVal; QTopPos=nextPos QNum++; } function deQ(){ if (QNum<1){print "Illigal dequeue"; exit;} QNum--; TailVal=QBody[QTailPos]; delete QBody[QTailPos]; QTailPos=(QTailPos +1) % QMAX; return TailVal; } リングバッファの上限超えたら終了させてるけど>>688 の実装も上限超えたらバグるし許して。 計ってないけどループがない分早い筈。コードサイズはお察し。 メモリはA[]にデータ抱えてる時点でアウトな感じだけどA[]を適宜消すようにしといた。 出力先を別にしたいならA[]にdeQ()せず別変数にすればおk。 これで良い?
701 名前:688 mailto:sage [2012/07/22(日) 09:36:17.43 .net] >QMAX=9007199254740991 ワロタwww 俺のも確かにwhile(C[p+=1]=C[n+=1]);の部分で保持してるのすべて消費分だけ上に移動させてるのが無駄なので そのループが無い分は確かに早いはず。 あと、恥ずかしながら尋ねたいのですが、俺>>688 の実装で上限超えたらバグるをkwsk なんか見落としてたのか今更ながら心配になってきた。 昔作ったやつなんで、結構な頻度使ってきたのだが今までバグに気づかなかった しかしデータをメモリ上に展開するからどうしても上限が出てくるな… awkで10GBぐらいの扱う時はgetlineでなんとかなるけど、やはりメモリマップやポインタが使えたら便利だよなぁ パッチ作ったら需要あるかな?
702 名前:デフォルトの名無しさん mailto:sage [2012/07/22(日) 11:41:46.83 .net] >>693 691、ちょっと訂正。無駄にキュー使う分、元スクリプトから劣化してた。 > p+=RSTART-1; >- enQ(substr(A[i],p,RLENGTH)); >+ if(hitTop+1<i){ >+ A[++hitTop]=substr(A[i],p,RLENGTH) >+ }else{ >+ enQ(substr(A[i],p,RLENGTH)); >+ } > p+=RLENGTH; あと、良く考えたら出力先を別にするなら、そもそもキュー不要。 バグってのは687で数値上限云々と書いたとおり、 ”C[0]+=1”がawkの整数の精度誤差なし演算可能上限を考慮していないだけ。 どのawkも多分そうだと思うけど、手元の環境下での実行結果↓ C:\>gawk --version GNU Awk 3.1.7(windows special Nov 24 2009) C:\>gawk "BEGIN{print 9007199254740990+1}" nul 9007199254740991 C:\>gawk "BEGIN{print 9007199254740991+1}" nul 9007199254740992 C:\>gawk "BEGIN{print 9007199254740992+1}" nul 9007199254740992 実際は(hddやメモリが先に死ぬので) 一行でこれだけ正規表現がhitする事は事実上無いし、 仮に発生しても検索結果が潰れるだけで、気付かない筈。
703 名前:688 mailto:sage [2012/07/22(日) 13:39:49.16 .net] >9007199254740992 理論上、8192ペタバイトの同じデータ[aaa...]でregexp="."とすれば、発生するな… IEEE 754の52bit制限だから、これ以上のでかい数字扱うならbig numbert対応のライブラリか, "bc -q" |& で動かすか、xgawk、dnawkあたり使うべきだなぁ 昔誰かがbignumのawkスクリプト書いて放流していた覚えがあるのだが、 ググッても見つからん。手元にあるのはビット演算のやつだけだわ いつかそれだけのデータをメモリ上に保持できるマシンを扱ってみたいものだ…
704 名前:デフォルトの名無しさん mailto:sage [2012/08/03(金) 02:35:23.75 .net] awkってabsとかacosなどの基本的な算術関数が用意されてないんですね 今後も実装されることはないんでしょうか? パイプでサクッとつないでワンラインで処理するのに重宝してたんですが・・・ 代わりとなると、何使うのがよろしいですか? できればperlは使いたくないです(どうしても好きになれない
705 名前:デフォルトの名無しさん mailto:sage [2012/08/03(金) 06:48:38.25 .net] absは自分で書けばいいし、acos(x)はatan2(x, √(1.0 - x*x))と書けるから、 どちらも基本的ではないと判断して組み込みじゃないんだと思うけど。 PythonかRubyでいいんじゃない? ワンライナー向きではないけど。
706 名前:デフォルトの名無しさん mailto:sage [2012/08/03(金) 07:37:24.41 .net] >>696 ライブラリ(?)を拾って来ては?
707 名前:デフォルトの名無しさん mailto:sage [2012/08/03(金) 11:48:03.19 .net] >>696 必要な関数値を計算するだけのプログラムをCで作っておいたら?
708 名前:デフォルトの名無しさん [2012/08/03(金) 20:21:59.43 .net] 昔それでベクトル演算して遊んだな
709 名前:デフォルトの名無しさん mailto:sage [2012/08/04(土) 09:23:47.83 .net] Rubyはそこそこワンライナーも書ける感じがする、awkやPerlほどじゃないけどね Pythonは流石にコード起こさないと辛いことが多いが
710 名前:デフォルトの名無しさん mailto:sage [2012/08/04(土) 10:27:49.07 .net] awkでmatlabみたいなベクトル演算できるようにしてほしい
711 名前:デフォルトの名無しさん mailto:sage [2012/08/04(土) 16:48:36.10 .net] awkでクラスを使えるようにしてほしい
712 名前:デフォルトの名無しさん mailto:sage [2012/08/04(土) 17:06:19.06 .net] awkで全ての魔法少女を救ってほしい
713 名前:デフォルトの名無しさん mailto:sage [2012/08/04(土) 17:08:30.07 .net] awkさんは魔女
714 名前:本田 mailto:sage [2012/08/05(日) 07:21:28.03 .net] Awk++ awk.info/?doc/dsl/awkplusplus.html OO in AWK++ The awk++ language provides object oriented programming for AWK that includes: classes class properties (persistent object variables) methods inheritance, including multiple inheritance lawker.googlecode.com/svn/fridge/lib/bash/awk++/version21/awkpp21.zip
715 名前:デフォルトの名無しさん mailto:sage [2012/08/05(日) 09:56:26.63 .net] デバッグ大変過ぎて死ぬる $ cat witch.awkpp class Witch { var spell method new() { spell = "mahalic mahalita" } method perform() { print spell } } class Samantha : Witch { method perform() { print "twitch" } } BEGIN { # wife = Witch.new() エラー要因行 wife = Samantha.new() wife.perform() } $ gawk -f awkpp -r witch.awkpp gawk: -:10: () エラー要因行 gawk: -:10: ^ syntax error gawk: -:10: () エラー要因行 gawk: -:10: ^ 表現の char '?' は不正です。
716 名前:デフォルトの名無しさん mailto:sage [2012/08/22(水) 00:09:49.86 .net] size: 656 byte, supports -o -v option. Array A and B can be the same (NEW) function xagrep( o, re, A, B, this, a, i,k ){ k=0;B[0]=A[0];if(o~"-v"){for(i=1;i<=A[0];i++){if(!match(A[i],re)) B[k+=1]=A[i];}B[0]=k;return k}; if(o~"-o"){B[B[0]+1]=0;for(i=1;i<=A[0];i++){a=A[i];if(i==k){i=i-B[B[0]+1]+1;B[B[0]+1]=k;k=B[0]+2; while(i<=B[B[0]+1]){B[i++]=B[k];delete B[k++];}i=B[B[0]+1];k=i;B[B[0]+1]=0;}while(match(a,re)){ if(i>k){B[k+=1]=substr(a,RSTART,RLENGTH);}else{B[B[0]+1+(B[B[0]+1]+=1)]=substr(a,RSTART,RLENGTH); k++}a=substr(a,RSTART+RLENGTH)}}if(i<k){i=k-i;k=B[0]+1;B[0]=i+B[B[0]+1];while(i<B[0])B[i+=1]=B[k+=1]; while(i<k)delete B[i+=1];}return B[0]}for(i=1;i<=A[0];i++){if(match(A[i],re))B[k+=1]=A[i];}B[0]=k;return k; } これ以上削れるところ無いかな? 高速化+サイズ優先で、変数はできるだけ使う数を少なくとの条件で