- 1 名前:デフォルトの名無しさん mailto:sage [2007/02/23(金) 23:55:42 .net]
- 腐っても鯛? 騏も老いては駑馬に劣る?
三人の碩学が生み出したスクリプト言語AWKについて語るスレ ◆ 前スレ awkについて語るスレ pc10.2ch.net/test/read.cgi/tech/1023556171/ ◆ 関係スレ シェルスクリプト相談室 pc10.2ch.net/test/read.cgi/tech/1112553783/ AWKでCGI pc10.2ch.net/test/read.cgi/php/1171804314/ 【sed】シェルスクリプト総合@LINUX Part2【awk】 pc10.2ch.net/test/read.cgi/linux/1154578200/ ◆ 参考 The AWK Programming Language (Brian Kernighan): ttp://cm.bell-labs.com/cm/cs/awkbook/index.html GAWK (GNU Projedt): ttp://www.gnu.org/software/gawk/
- 879 名前:デフォルトの名無しさん [2018/01/08(月) 11:00:30.57 ID:szpKYJOz.net]
- お疲れ様でした
- 880 名前:デフォルトの名無しさん [2018/01/12(金) 00:18:25.22 ID:8Bbkgawk.net]
- IDがgawkなので来ました
- 881 名前:デフォルトの名無しさん mailto:sage [2018/01/17(水) 10:09:56.59 ID:MoHAEd1l.net]
- AWKって基本的にUnicodeには対応してるんだよね。
GNUにしろBSDにしろ。
- 882 名前:デフォルトの名無しさん mailto:sage [2018/01/17(水) 17:52:56.47 ID:MoHAEd1l.net]
- 置換函数の第二仮引数に[バックスペース][置換対象の文字列]みたいにしたい時は
gsub(/foo/, "\\\\&", $n) ってしないといけないんだね。 gsub(/foo/, "\\bar", $n) が foo -> \bar だったんで foo -> \foo は gsub(/foo/, "\\&", $n) でいいと思って半時程嵌った。
- 883 名前:デフォルトの名無しさん mailto:sage [2018/01/18(木) 07:25:24.80 ID:eRgrS92p.net]
- >>863
それ勧告に従っただけだと思うが。 www.ietf.org/rfc/rfc4180.txt
- 884 名前:デフォルトの名無しさん [2018/03/09(金) 13:30:21.59 ID:Yd19z7Tx.net]
- ある行に 20 と 34 とはいってる
この行ごと除外したいけど・・・
- 885 名前:デフォルトの名無しさん mailto:sage [2018/03/09(金) 14:33:06.31 ID:X3i0O3oy.net]
- grep -v ' 20 と 34 '
- 886 名前:デフォルトの名無しさん [2018/03/09(金) 21:38:00.87 ID:3i0y1Him.net]
- こうかな
gawk "$0!~/20|34/{print}"
- 887 名前:デフォルトの名無しさん mailto:sage [2018/03/09(金) 23:45:36.30 ID:Ejthnyow.net]
- AWK プログラムの基本構造となっている「パターンとアクションの対」のうち、
アクションが省略されている場合は入力行がそのまま出力される。 またパターンが単一の正規表現である場合は、その正規表現と $0 との照合が行われる。 gawk '!/20と34/' gawk '!/20|34/'
- 888 名前:デフォルトの名無しさん [2018/03/10(土) 21:39:17.88 ID:NqpdHf3N.net]
- こぴぺしてやってみたけど 両方消えちゃうんだよね
20 と 34があった場合 出力しない 片方でもあれば 出力する awk '!/01 / && !/03 /' これも両方消えてる・・
- 889 名前:なんか日本語がおかしいな。 mailto:sage [2018/03/11(日) 06:07:55.06 ID:rsmr5+n0.net]
- >>877
「20 と 34 を両方含む時だけ出力しない。片方だけの場合は出力する。」 そう言いたいのか? gawk '!(/20/&&/34/)'
- 890 名前:デフォルトの名無しさん [2018/03/11(日) 10:58:35.24 ID:tN+YLJlR.net]
- ありがとう
()はきがつかなかった・・
- 891 名前:デフォルトの名無しさん [2018/05/23(水) 20:10:48.40 ID:Au5e7VGg.net]
- 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』 0VDE5
- 892 名前:デフォルトの名無しさん [2018/06/08(金) 22:00:41.48 ID:W8HYHVfd.net]
- split関数より$0へ代入したほうが速いage
- 893 名前:デフォルトの名無しさん mailto:sage [2018/06/27(水) 16:43:15.93 ID:tzYH0Nnw/]
- そんなわけないw
- 894 名前:デフォルトの名無しさん [2018/07/04(水) 22:29:02.55 ID:gFgZc5FG.net]
- 02P
- 895 名前:デフォルトの名無しさん mailto:sage [2018/07/05(木) 16:52:56.22 ID:AeL6VB/V.net]
- 0VDE5
- 896 名前:デフォルトの名無しさん mailto:sage [2018/09/11(火) 09:26:39.50 ID:196Ukd9B.net]
- シェルスクリプト書いててどうしようもないときだけ使ってる
- 897 名前:デフォルトの名無しさん mailto:sage [2018/12/02(日) 13:44:27.64 ID:jISJOvCb.net]
- AWKって重いと勝手に思ってたけど下手にシェルで制御構文作るより早いね
尤もWSLでやってるのでforkの時間とかそういう問題かもしれないが。
- 898 名前:デフォルトの名無しさん mailto:sage [2018/12/02(日) 14:22:41.55 ID:Bx+z5yQP.net]
- >>886
重いと言ってもC比だからな。 今時の超大富豪言語PythonやRubyとなら同程度でもおかしくはない。 Cygwinのshが重かったのはご存じの通りforkが原因だ。 気になるならVirtualBox等でlinux環境を構築してその上でテストしてみればいい。
- 899 名前:デフォルトの名無しさん [2018/12/22(土) 02:10:55.36 ID:V7w17XLB.net]
- gawk4にて配列の配列に存在する全要素数を
カウントする関数を作ったんですが、 もっと早いコードにならないでしょうか? どなたかヒントをください。お願いします。 function count_array(arr, n, i) { for (i in arr) { if (isarray(arr[i])) count_array(arr[i], n); else n[0]++; } return n[0]; }
- 900 名前:デフォルトの名無しさん mailto:sage [2018/12/22(土) 02:57:46.65 ID:kZtDaodg.net]
- length(arr) でダメなの?
- 901 名前:デフォルトの名無しさん [2018/12/22(土) 20:12:58.98 ID:VPYzPSxJ.net]
- 886です。
ダメなんです。 BEGIN { a[1] = 1; a[2][1] = 21; a[2][2] = 22; a[3] = 3; a[4][1][1] = 411; a[4][2] = 42; a[4][3][2][1] = 256; for (i = 0; i < 9; i++) b[i] = i; c["foo"]["corge"] = "grault"; c["foo"]["bar"] = "garply"; c["baz"]["corge"] = "waldo"; c["baz"]["quux"] = "fred"; print "length(a) = " length(a); print "length(a) = " length(b); print "length(a) = " length(c); print "count_array(a) = " count_array(a); print "count_array(b) = " count_array(b); print "count_array(c) = " count_array(c); } length(a) = 4 length(b) = 9 length(c) = 2 count_array(a) = 7 count_array(b) = 9 count_array(c) = 4 再帰を使う以外に方法があれば、 と思い質問した次第です。
- 902 名前:デフォルトの名無しさん [2018/12/22(土) 21:58:49.47 ID:b6CiPLFa.net]
- 要素を追加するときに
ノード毎に集計値が必要ならそれぞれのノード毎の集計値を保存しとけばいい そうすれば集計しなおす必要ない 超速いハズ 集計しないからな
- 903 名前:デフォルトの名無しさん [2018/12/22(土) 22:19:10.29 ID:b6CiPLFa.net]
- こういった集計値がほしいのは分かる
aho(9) ┣aho1(5) ┃┣aho11(3) ┃┃┣aho111(1) ┃┃┗aho112(1) ┃┗aho12(1) ┗aho2(3) ┣aho21(1) ┗aho22(1) lengthでは、きっとこんな感じでしかとれない aho(2) ┣aho1(2) ┃┣aho11(2) ┃┃┣aho111(n/a) ┃┃┗aho112(n/a) ┃┗aho12(n/a) ┗aho2(2) ┣aho21(n/a) ┗aho22(n/a)
- 904 名前:デフォルトの名無しさん mailto:sage [2018/12/22(土) 23:48:44.15 ID:omdhpVTe.net]
- >>890
lengthは、配列aの要素に配列があると要素としての配列の 中の要素数まではカウントしない、やりたいのは要素としての配列に 含まれる要素もカウントしたい、ということか。 function count_array2(arr, cnt, i) { n=0; for (i in arr) { if(isarray(arr[i])){ cnt+=length(arr[i]); } else n++; } return n; } だと a[1] = 1; a[2][1] = 21; a[2][2] = 22; a[3] = 3; a[4][1][1] = 411; a[4][2] = 42; a[4][3][2][1] = 256; a[4][3][3][2] = 257; みたいなのでうまくいかない(1番目と2番目の添え字(?)が同じ)。 arr[i][j]...と続ければ(最初にlength(arr)で続ける深さを決めて) いけるように思うが、だったら再帰するのが素直か。
- 905 名前:デフォルトの名無しさん [2018/12/23(日) 00:54:43.50 ID:quoNoaXg.net]
- 886です。889さんこんな感じでしょうか?
BEGIN { addnode(a, "1-1", "start"); addnode(a, "1-2", "done"); addnode(a, "1-3", "result"); addnode(a, "1-4", "print"); addnode(a, "2", "count"); addnode(a, "3-1-1", "return"); for (i in a[1]) print "a[1][" i "] = " a[1][i]; print "a[2] = " a[2]; print "a[3][1][1] = " a[3][1][1]; print "\n_ele_sum = " _ele_sum; } function addnode(arr, i, val, p) { ct = split(i, list, "-"); switch (ct) { case 1: arr[list[1]] = val; break; case 2: arr[list[1]][list[2]] = val; break; case 3: arr[list[1]][list[2]][list[3]] = val; break; default: } _ele_sum++; } a[1][1] = start a[1][2] = done a[1][3] = result a[1][4] = print a[2] = count a[3][1][1] = return _ele_sum = 6
- 906 名前:デフォルトの名無しさん [2018/12/23(日) 01:05:13.25 ID:quoNoaXg.net]
- 886です。
pとか関係ないパラメータ入れてしまってごめんなさい。 addnode(a, "1-5-1", "connot"); これができません。 a["5"]がスカラーだと言っています。
- 907 名前:デフォルトの名無しさん [2018/12/23(日) 01:15:19.57 ID:quoNoaXg.net]
- 訂正a["1"]["5"]がスカラーの文脈だと言っています。でした
- 908 名前:デフォルトの名無しさん [2018/12/23(日) 01:41:32.84 ID:quoNoaXg.net]
- 886です
for (i in a[1]) print "a[1][" i "] = " a[1][i]; でa[1][5][1]が引っかかっていたようです。 自爆でした。すみません。
- 909 名前:デフォルトの名無しさん [2018/12/23(日) 02:59:04.54 ID:quoNoaXg.net]
- 886です。
親ノード毎?に保存する方法がまだわかりませんが、 明日以降考えます。 みなさん、ご協力ありがとうございました。
- 910 名前:デフォルトの名無しさん [2018/12/23(日) 08:49:07.73 ID:S8HMq/6c.net]
- gawk4でとにかく速いのが良いならcで拡張関数作るのが良いかと(反則?)
flatten_array_typed関数(4.1.4はflatten_array関数)でawk_flat_array_t構造体のメンバ変数countに要素数が入りますので 要素がAWK_ARRAYなら再帰するように処理すれば出来上がり APIの使い方は extension\rwarray.cとか https://www.gnu.org/software/gawk/manual/html_node/Flattening-Arrays.html#Flattening-Arraysを参考に gawkだけでやる場合、もし配列の要素数が10万とか100万あるのなら、関数の引数を出来るだけ減らして 関数内からグローバル変数を直接参照したほうが速くなると思います
- 911 名前:デフォルトの名無しさん [2018/12/23(日) 11:20:10.63 ID:qffc/3mK.net]
- もともと添え字がすべて文字列で保存する仕様というのはしってはいたが
多次元配列はaho[i,j]という形式にして工夫して使えということらしいな awkで多次元配列なんか使ったことないから知らんかったわ とういワケでにその形式で多次元配列をlengthでとると>>888で取得したい値になる 当然といえば当然 特定の次元の列だけのとりかたはよくわからん とれんのかコレ www.kt.rim.or.jp/~kbk/gawk-30/gawk_12.html#SEC119 Using Numbers to Subscript Arrays 配列について重要なのは、配列の添え字は常に 文字列として扱われるということである。 配列の添え字に数字を使った場合、それは添え字付けに使われる前に 文字列に変換される www.kt.rim.or.jp/~kbk/gawk-30/gawk_12.html#SEC121 Multi-dimensional Arrays 多次元配列とは、配列要素の指定を複数の添字の並びによって行う配列である。例え ば二次元の配列は二つの添字を必要とする。 一般的な(awkも含めた大多数の 言語では) 二次元配列の要素に対する参照は grid[x,y]このよ うに行う。 (gridは配列の名前) セパレータには組み込み変数SUBSEPに格納 されている値が使われる。
- 912 名前:デフォルトの名無しさん mailto:sage [2018/12/23(日) 11:43:46.94 ID:7N3pX2Wi.net]
- >>900
それを踏まえて>>888で > gawk4 とわざわざことわっているんじゃないの?
- 913 名前:デフォルトの名無しさん [2018/12/23(日) 22:29:12.74 ID:qffc/3mK.net]
- まず入力から多次元配列を読込む処理でも作ってみるか
できるのかがよく分からん コレがすんなりできないとコレ自体が使えるシロモノにならなそうだしな テストデータは作ってみた https://ideone.com/Sir0IE awkのこの多次元配列についてほかのとこで書いてあるの読んでみると 色々と面倒なことがおきるはのは分かった 特に問題がおきそうなのは一度配列やスカラーで要素を追加すると、 その配列やスカラーを変えて上書きする場合明示的にそれを削除しないと上書きして使えない きっとなノードを削除するときはその要素゙から辿って一番深いとこから再帰的に削除しないと残骸が残る cのメモリリークと同じことが起きると推定される いまいちこの多次元配列に使い道があるのかどうかが分からない
- 914 名前:デフォルトの名無しさん mailto:sage [2018/12/23(日) 23:32:19.00 ID:nM/PpEMV.net]
- lispが最適
awkは不適
- 915 名前:デフォルトの名無しさん [2018/12/24(月) 01:01:19.83 ID:ivcUrO89.net]
- https://ideone.com/PFBwQU
どうにかして動的に配列を構成できないか調べてみたが やりかたが分からん >>894の質問してるのが書いた方法で 一旦多次元配列を読む込むようにはしてみた 質問してるのが欲しいといってる要素の数は 結局入力の行数と同じになる
- 916 名前:デフォルトの名無しさん [2018/12/24(月) 01:07:37.50 ID:ivcUrO89.net]
- https://ideone.com/zTUFL2
switch分のcaseが1つ少なかったから追加しといた
- 917 名前:デフォルトの名無しさん [2018/12/24(月) 09:11:50.63 ID:PbNokzxn.net]
- >>902
> きっとなノードを削除するときはその要素゙から辿って一番深いとこから再帰的に削除しないと残骸が残る delete a は a[1][2] や a[3][4][5] などの子配列含む配列a全体の使用メモリをまとめて "再利用" にまわす 一部の要素を残しておきたい事情が無ければ、delete a[1][2]; delete a[3][4][5]; ... のように子配列を個別に deleteする必要は無い たとえば下の(2)は多次元配列bが多次元配列aの使用済みメモリを再利用するので 終了間際のメモリ使用量は(1)(2)どちらも同じになるが、(2)の delete a を消すと倍程度に増える (1) BEGIN{for(i=1; i<=1000000; i++){a[i%10][i]=i}} (2) BEGIN{for(i=1; i<=1000000; i++){a[i%10][i]=i} delete a; for(i=1; i<=1000000; i++){b[i%10][i]=i}} メモリ再利用の仕組みはThe GAWK Manualには書いていないけどAharon Robbinsが↓で回答している https://groups.google.com/forum/#!topic/comp.lang.awk/CKwoes0_63U
- 918 名前:デフォルトの名無しさん [2018/12/24(月) 15:58:51.02 ID:ivcUrO89.net]
- なるほど
ありがとう きっと再利用されるから 気にせず放置でいいのか
- 919 名前:デフォルトの名無しさん [2018/12/24(月) 17:27:46.25 ID:8PLVwc4u.net]
- >>904 886です。ありがとうございます。動的とはこんな感じでしょうか?
一度作って、削除するという変な仕様ですが。 BEGIN { a[1] = "foo"; a[2][1] = "bar"; a[2][2] = "baz"; a[3] = "qux"; a[4][1][1] = "quux"; a[4][2] = "corge"; for (i = 1; i < 5; i++) { meta_ar_init(b, i); clone(b[i], a); } } function meta_ar_init(ar, init_num) { ar[init_num][1] = ""; delete ar[init_num][1]; } function clone(lhs, rhs, i) { for (i in rhs) { if (isarray(rhs[i])) { lhs[i][1] = ""; delete lhs[i][1]; clone(lhs[i], rhs[i]); } else lhs[i] = rhs[i]; } }
- 920 名前:デフォルトの名無しさん [2018/12/27(木) 20:01:48.39 ID:pQqvXPza.net]
- よく分からんが
例えばそれで>>904の入力データなんかを読み込めたりするのか >>905のswitchだと事前に何次元かわかってないと読み込めない 何次元になるか不明な入力データの場合 どうやれば格納できるかよくわからんんかった
- 921 名前:デフォルトの名無しさん [2018/12/27(木) 22:46:53.38 ID:X7jxTwwp.net]
- >>908の「一度作って、削除する」というのは
https://www.gnu.org/software/gawk/manual/gawk.html#Arrays-of-Arrays ここの一番下のsplitがエラー吐く例の回避策で、配列の要素を最初から配列扱いすることはできないから 予め次階層にダミー要素をぶら下げておき、本命を格納し終えたらダミーは消すって意味かな 自分で書いたらこんなんなったけど、いちおう何次元でも格納できそう https://ideone.com/83ykKF#stdin
- 922 名前:デフォルトの名無しさん [2018/12/30(日) 03:28:21.38 ID:5ft+KBa+B]
- すごいけど配列の値が書いてないので
BEGIN { array_entry(a, "1-2-3", 48) array_entry(a, "1-2-4-6", 667) array_entry(a, "3-1", 0) array_entry(a, "4", 6) array_entry(a, "5-1-2-3-4-5", -128) process_array(a, "a", "do_print", 0) }
function array_entry(a, val, ele , step, b, n) { n = split(val, b, /-/) if (n == 1) { a[val + 0] = ele; return } if (step == n - 2) { a[b[step + 1]][b[n]] = ele; return } a[b[step + 1]]["dummy"]; if (step + 1 < n) { array_entry(a[b[step + 1]], val, ele, step + 1) delete a[b[step + 1]]["dummy"] } }つづく
- 923 名前:デフォルトの名無しさん [2018/12/30(日) 03:29:15.30 ID:5ft+KBa+B]
- function do_print(name, element) {
printf("%s = %s\n", name, element); } function process_array(arr, name, process, do_arrays, i, new_name) { for (i in arr) { new_name = (name "[" i "]"); if (isarray(arr[i])) { if (do_arrays) @process(new_name, arr[i]); process_array(arr[i], new_name, process, do_arrays); } else @process(new_name, arr[i]); } } これでいけそう?
- 924 名前:デフォルトの名無しさん [2018/12/31(月) 02:46:41.48 ID:20SukTdNU]
- ちゃんと書いてみました。
https://ideone.com/rdeTvE
- 925 名前:デフォルトの名無しさん mailto:sage [2019/01/01(火) 00:00:01.96 ID:7rl7mk2H.net]
- 2019年もawkのお世話になります
- 926 名前:デフォルトの名無しさん mailto:sage [2019/01/02(水) 18:12:37.70 ID:0+aicLseW]
- すげー
- 927 名前:デフォルトの名無しさん [2019/01/05(土) 08:05:13.61 ID:1ixBisDID]
- どなたか教えてください
Windows10-32bit,MinGW(msys無し),gawk4.2.1 for win32 bin/src(ezwinports), Shift_JISの環境で builtin.c を書き換えてビルドしました。 書き換えた内容はprintf/sprintfのマルチバイト文字列整形関連です。 ビルド後、期待通りに動きますが、実行ファイルサイズが4.8MBもあります。 上記のソースディレクトリでcmdを起動して mingw32-make mingw32 とタイプしました。 出来上がった gawk.exe のファイルサイズは正常なのでしょうか? また、上記環境ではできませんが configure は必要ですか? よろしくお願いいたします。
- 928 名前:デフォルトの名無しさん mailto:sage [2019/02/05(火) 18:58:36.44 ID:9Z2hbdGL.net]
- 60くらいの教授が40年くらい前にAWKでアセンブラ作ったとか言ってたんだけど
当時に既にあったということと当時から小規模なコンパイラなら作れるくらい高性能だったことに驚いた
- 929 名前:デフォルトの名無しさん mailto:sage [2019/02/05(火) 19:10:49.73 ID:dIIT7BCG.net]
- アセンブラをコンパイラとは呼ばないが
- 930 名前:デフォルトの名無しさん [2019/02/06(水) 10:31:17.59 ID:+qagyc5o.net]
- aho
- 931 名前:デフォルトの名無しさん mailto:sage [2019/02/06(水) 13:09:33.86 ID:j4QdsmCl.net]
- asort、asortiがよくわからなかったので試した結果
# a a[5] ="a5" a[1] ="a1" a[3] ="a8" # asort(a,as) as[1] ="a1" as[2] ="a5" as[3] ="a8" # asorti(a,asi) asi[1]=1 asi[2]=3 asi[3]=5 なんだそういうことだったのかとわかった
- 932 名前:デフォルトの名無しさん mailto:sage [2019/02/06(水) 17:39:23.37 ID:+3VpeZVh.net]
- >>917
思わず "assembler by awk" でググって The Amazing Awk Assembler by Henry Spencer を ダウンロードしちゃったじゃないか。
- 933 名前:デフォルトの名無しさん mailto:sage [2019/02/23(土) 17:41:13.06 ID:Y0E0nwid.net]
- awkでファイルがあるかどうかの判別は、どのようにしたらよいのでしょうか?
具体的にはBEGINの中で getline a < "/dev/stdin"; fn = a".txt" と任意のファイル名を作った後、そのファイルがあるかどうかを確認したいんです。 もしファイルがすでにあったら処理は終了、無ければ以後の処理をそのファイルにリダイレクトする、という感じです。
- 934 名前:デフォルトの名無しさん mailto:sage [2019/02/24(日) 00:16:02.91 ID:Cwr1i6xY.net]
- if(getline<fn!=-1)exit
とか?
- 935 名前:デフォルトの名無しさん mailto:sage [2019/02/24(日) 11:45:53.93 ID:FuDjIOWV.net]
- >>923
できました!ありがとうございます!!
- 936 名前:デフォルトの名無しさん [2019/03/21(木) 08:10:09.34 ID:pGDO/F2C.net]
- 答えが出ないなんで?
#!/usr/bin/awk -f BEGIN{ print game(10, 24); } function game(coin,depth, i,j){ if(memo[coin,depth]){ return memo[coin,depth]; } if(coin == 0){ return 0; } if(depth == 0){ return 1; } win = game(coin + 1, depth - 1); lose = game(coin - 1, depth - 1); memo[coin,depth] = win + lose; }
- 937 名前:デフォルトの名無しさん mailto:sage [2019/03/21(木) 09:51:18.96 ID:WMaCNtBE.net]
- 最後の memo[coin,depth] = win + lose はそのまま関数の戻り値として
return しなければならないが、それを忘れている。 さらに、正しい答えが返らない原因が 2 点。 関数定義の引数名間違い: i,j → win,lose。 if(depth == 0) と if(coin == 0) の判定を行う順序が逆。
- 938 名前:デフォルトの名無しさん [2019/03/21(木) 14:19:16.55 ID:pGDO/F2C.net]
- >>926
ありがとうございます。 そっか。returnがいるんですね。 perlだと最後はreturn省略可能だけどawkは省略不可みたい。 あと、引数名も間違っていました。 正しい答え出ました!
- 939 名前:デフォルトの名無しさん mailto:sage [2019/03/21(木) 21:25:33.68 ID:ZeSQsBE1.net]
- それぐらいの処理は、Ruby で作れ!
- 940 名前:デフォルトの名無しさん mailto:sage [2019/03/21(木) 23:54:47.78 ID:7AyLRSvD.net]
- オーク英雄物語 〜忖度列伝〜
https://ncode.syosetu.com/n8418ff/1/ 👀 Rock54: Caution(BBR-MD5:0be20a4887bc3d3353f527d3636c44e3)
- 941 名前:デフォルトの名無しさん mailto:sage [2019/04/01(月) 17:01:28.78 ID:nwflCE8J.net]
- >>928
awkの方がいいときもある installしなくていい タスクマネージャでみているとrubyよりメモリを食わない時もある 融通の利く配列が超便利 通信、Hash、sortなど使いまくる時はrubyのほうがいいけど
- 942 名前:デフォルトの名無しさん [2019/04/01(月) 17:12:08.21 ID:Tc5+6fel.net]
- いや、Perlだ。
理由 俺が慣れてるから。
- 943 名前:デフォルトの名無しさん mailto:sage [2019/04/01(月) 22:48:54.89 ID:0AqZLgzF.net]
- Perlはまぁ慣れ以外に使う意味はあまり見出せない。
- 944 名前:デフォルトの名無しさん mailto:sage [2019/04/02(火) 04:44:16.86 ID:3dIjgbOm.net]
- 漏れは、Windows 10・WSL・Ubuntu 16.04 だけど、
sudo apt install ruby だけで、Ruby 2.3 が入った 2.4 以降の新しい書き方さえしなければ、動く Perl, Python は、最初から入っているけど
- 945 名前:デフォルトの名無しさん mailto:sage [2019/04/02(火) 10:00:50.55 ID:USFH8Mum.net]
- >>933
死ね
- 946 名前:デフォルトの名無しさん mailto:sage [2019/04/02(火) 10:29:57.68 ID:egwP5Lwa.net]
- Perl脳だとdieなどと言いたがるんかね。
- 947 名前:デフォルトの名無しさん [2019/04/02(火) 12:24:56.71 ID:exqjvsIl.net]
- Perl die好き
- 948 名前:デフォルトの名無しさん mailto:sage [2019/04/02(火) 12:34:58.56 ID:m0agfZtU.net]
- w
- 949 名前:デフォルトの名無しさん [2019/04/17(水) 15:16:55.69 ID:bLXqfCqA.net]
- GNU AWK 5.0がリリース。8年ぶりのメジャーバージョンアップ。正規表現ライブラリが
GLIBCからGNULIBへ移行、名前空間が実装 2019年4月17日 https://www.publickey1.jp/blog/19/gnu_awk_508glibcgnulib.html UnixやLinuxにおいてsedやgrepなどと並んでよく知られているツールの1つがawk(オーク) です。このawkのGNUプロジェクトによる実装の最新版「GNU AWK 5.0」(gawk 5.0)の リリースが発表されました。 2011年にリリースされたGNU AWK 4.0から8年ぶり、直前のバージョンでとして2017年10月に リリースされた4.2.0からは約1年半ぶりとなります。 AWKはいわゆるスクリプティング言語の一種。変数や関数、制御文など基本的な構文を備え、 テキストファイルを効率的に処理できるのが特徴です。 GNU AWK 5.0の新機能としては、printfの%aおよび%Aの書式がPOSIX標準に準拠したこと、 正規表現のルーチンが、長年にわたってメンテナンスされてきたGLIBCからGNULIBに 置き換わったことなど。 また、識別子に非英語文字を使うためのドキュメント化されていなかったオプションなどは 削除され、ソースコードはC99環境が想定されるようになっています。 そして新たに名前空間が実装されています(詳細はマニュアルを参照とのこと)。
- 950 名前:デフォルトの名無しさん [2019/04/17(水) 17:19:50.38 ID:fsOEjVgH.net]
- sedとawkで簡単にできることを
他の方法でやってるアホを見ると優越感に浸れるよな
- 951 名前:デフォルトの名無しさん mailto:sage [2019/04/17(水) 21:27:37.50 ID:Cw3S472M.net]
- 5.0.0じゃなくて4.3.0でいいじゃんって更新内容だな・・・
- 952 名前:デフォルトの名無しさん mailto:sage [2019/04/17(水) 23:57:17.65 ID:t5VcExa0.net]
- 今時っぽく定期的にメジャーバージョンアップしていく作戦?
そろそろAWKCARD印刷してみようかな…
- 953 名前:デフォルトの名無しさん [2019/04/18(木) 00:37:48.90 ID:y8/6ebia.net]
- >>939
簡単な変換なのにWindowsとかでいきなりExcelでやろうとしちゃう人を見るとそこまでせんでも良いじゃないかとは思ってしまうな。 まあ日頃Windowsで事務処理的な事している人からすればそれ以上最良で分かりやすい環境はないんだろうけどな。 なんでもかんでもそれでやろうとして余計に分かりづらく複雑になってうまく行かずにハマっているのを見ると哀れに感じる。
- 954 名前:デフォルトの名無しさん mailto:sage [2019/06/01(土) 01:13:44.70 ID:QInzSHhj.net]
- こういう記法ができることを知らず、気づくのに数年かかった
正規表現比較のifで変数を使える、gsubなどで変数を使える txt=”aabbcdefg1234” x=”^” substr{$0,1,1} ”+” if {txt 〜 x}print ”ok” y=substr{$0,1,1} z=substr{$0,2,1} gsub{y,z,$0} (半角だと書き込みエラーになるので全角に変換)
- 955 名前:デフォルトの名無しさん mailto:sage [2019/06/01(土) 01:15:01.39 ID:QInzSHhj.net]
- >>943
あれ変換おかしい {} → ()
- 956 名前:デフォルトの名無しさん mailto:sage [2019/06/01(土) 05:25:56.80 ID:cEFw76xP.net]
- ふふふ知ってた。
- 957 名前:デフォルトの名無しさん mailto:sage [2019/06/05(水) 00:27:37.11 ID:/Z5C9xDG.net]
- The AWK Programming Language (の邦訳本) から入ったので知ってはいるけど、
エスケープ文字を考慮してコードを書くのが面倒なので極力避けてるな。 文字列が正規表現へ「型変換」されるときの振舞いについて、本には一応書いてある。
- 958 名前:デフォルトの名無しさん [2019/06/08(土) 18:14:03.76 ID:QbmZ5eQJn]
- user's guide 〜Regular Expressions
・Using Dynamic Regexps 結構前からある。 内部的には文字列定数を正規表現として使うために 2回目のスキャンが必要らしい。
- 959 名前:デフォルトの名無しさん [2019/06/11(火) 21:06:31.25 ID:+TF2B1JOC]
- どうせ廃れるぜ。この言語はよ。あばよ
- 960 名前:デフォルトの名無しさん [2019/06/12(水) 18:34:22.16 ID:yp7o1TZla]
- AWK / GAWKにて
UTF-8の文字列表示長さって、どうやって求めるのですか? たとえば、 str="abcdeあいうえお" 半角を 1 とすると str の表示長さは 15
また、キャラクタ数と表示長さを1つスクリプトで 併用したいときはどうすればよいのでしょうか?
分かる方、教えてください。よろしくお願いいたします。
- 961 名前:デフォルトの名無しさん [2019/06/12(水) 18:49:25.69 ID:KWGtdn6vZ]
- 私はこうしてます。
mfi.sub.jp/_html_awk/gawk_blength.html
- 962 名前:デフォルトの名無しさん [2019/06/12(水) 19:07:09.50 ID:kkOQizBgZ]
- >>950
ありがとございます。 助かります。
- 963 名前:デフォルトの名無しさん [2019/06/12(水) 22:16:17.50 ID:wOmIo+3+t]
- ごめんこっちの方が良かった。
UTF-8なので使い方は違うけど ASCII/128個と半角カナ/63個以外は、長さ2で計算するので 表示長さだと思ってください。
https://ideone.com/97R395
- 964 名前:952 [2019/06/12(水) 22:41:15.99 ID:CfhwF05wL]
- 忘れてました。
ideoneのstdin 文字化けしてるわけじゃないから。 ランダムに文字打ち出してるだけです。
- 965 名前:デフォルトの名無しさん [2019/06/13(木) 13:49:33.22 ID:FlIZ7NjL1]
- こちらもどうぞ
bsubstr(string, start, length) 指定位置(表示長さ単位)から指定表示長さの文字列を切り出す関数 文字化けする箇所はスペース充填 Shift_JISでもUTF-8でも可
https://ideone.com/3295sA
- 966 名前:デフォルトの名無しさん [2019/06/13(木) 18:18:48.64 ID:+trsIn9cI]
- よろしければこちらもどうぞ。
sformat(fw, prec, string) sprintf("%*.*s", fw, prec, string)の替わりに さっき作ったからバグがあるかもしれません。
https://ideone.com/TN7Ka4
- 967 名前:デフォルトの名無しさん [2019/06/14(金) 02:38:34.74 ID:8YLuNO2w7]
- 眠い、帰ってきて見直したらダメダメでした。
sformat()改良しました。 見てくれてるかな
https://ideone.com/VvxBzq
- 968 名前:デフォルトの名無しさん [2019/06/14(金) 14:13:28.99 ID:rib6nibVS]
- bsubstr()も見直した。
やっぱりダメダメだった。
https://ideone.com/7vqqVO
- 969 名前:デフォルトの名無しさん [2019/06/19(水) 04:52:26.36 ID:tVNS+22r.net]
- 【出資】松本卓朗 人工知能詐欺【注意】
https://rio2016.5ch.net/test/read.cgi/rikei/1560859403/
- 970 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 05:07:43.82 ID:1ALBmyOB.net]
- AWKが巨大なテキストファイルを処理できないみたいな話を知ってる方いらしゃいますか。
大体1.4GiBくらいのファイルをAWKで編集しようとすると「ファイルの空きがない」みたいなエラーが出るので。
- 971 名前:デフォルトの名無しさん [2019/06/30(日) 12:11:04.21 ID:QU2Ls1X6.net]
- UNIXというかまともなPIPE実装されてるOSならそんなことはないが
WINDOWSとかいうアホなOSだと出るだろうね
- 972 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 12:19:57.44 ID:pDzbN/vc.net]
- 「ファイルの空きがない」っていうメッセージは "No space left on device" の事?
- 973 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 15:28:11.21 ID:o/HVRPYj.net]
- >>960
コマンドラインでリダイレクト使ってればそうかも知れんが スクリプト内で出力先を指定してたらわからんぞー
- 974 名前:デフォルトの名無しさん mailto:sage [2019/06/30(日) 21:02:48.49 ID:1ALBmyOB.net]
- >>960
なるほど。
- 975 名前:デフォルトの名無しさん [2019/06/30(日) 21:56:09.12 ID:HbSturrb.net]
- >>959
改行コードの違いにより全体が長い一行と認識されてしまい・・・なんて事はないか? あ、でも、ファイルの空きがないってのは出力先の空き容量が足りないってことかな?
- 976 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 01:34:15.60 ID:2smzn43h.net]
- >>961
そうです。 でもファイルシステムとしては全く余裕がある状態なんです。
- 977 名前:デフォルトの名無しさん [2019/07/01(月) 02:30:15.69 ID:jjSXuURg.net]
- なんだろうね。作業用ファイルが作られるパーティションの空きが足りないとかかな?
- 978 名前:デフォルトの名無しさん mailto:sage [2019/07/01(月) 02:35:44.08 ID:KfVaWYci.net]
- 64bit版か32bit版かで違わないか
1.4GBは入力で出力も同じなのかはるかに小さいのか 出力が速すぎることはないのか、ゆっくり出力するようにしたらどうか
- 979 名前:947 mailto:sage [2019/07/01(月) 07:19:02.17 ID:2smzn43h.net]
- >>966
すいません。これが原因でした。 AWKは全く悪くありませんでした。ご迷惑&&スレ汚し、大変失礼しました……。
|

|