awkについて語るスレ $2

[表示 : 全て最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 05/09 15:53 / Filesize : 63 KB / Number-of Response : 255
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

awkについて語るスレ $2

1 名前：デフォルトの名無しさん mailto:sage [2007/02/23(金) 23:55:42 ]: 腐っても鯛？騏驎も老いては駑馬に劣る？
三人の碩学が生み出したスクリプト言語AWKについて語るスレ

◆ 前スレ
awkについて語るスレ
pc10.2ch.net/test/read.cgi/tech/1023556171/

◆ 関係スレ
シェルスクリプト相談室
pc10.2ch.net/test/read.cgi/tech/1112553783/
AWKでCGI
pc10.2ch.net/test/read.cgi/php/1171804314/
【sed】シェルスクリプト総合@LINUX Part2【awk】
pc10.2ch.net/test/read.cgi/linux/1154578200/

◆ 参考
The AWK Programming Language (Brian Kernighan)：
ttp://cm.bell-labs.com/cm/cs/awkbook/index.html

GAWK (GNU Projedt):
ttp://www.gnu.org/software/gawk/
51 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 16:57:51 ]: PerlもRubyもPythonも使うけど、特定のカラムだけに興味があるケースは
無意識にawkを使うこともある。

perl -a とか cutしてpasteとかもあるけど。
52 名前：デフォルトの名無しさん [2007/09/19(水) 18:19:27 ]: >>49 環境によらず入っているということですね。

>>50　そうですね。
なぜawkなのか、
一般的にはどういう時にawkが使われるのか、
というのがイマイチ自分のなかで分かっていないのです。

>>51 少し勉強した限りでは、確かにカラムの取り出しはawkが便利なのかもと思いました。
53 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 19:55:33 ]: >>52
シェルスクリプトの中で、貧弱なシェルの計算能力を
補うために、ツールボックスの一つとして使われることが多い。

ので、シェルスクリプトを書く機会が多いのなら、やっておいて
損は無いと思うが、フットプリントが多少デカイこととやや移植性に
欠けることを気にしなければ、別にPerl使ったっていいわけだ
（どうせ今なら大抵は使えるだろうし、awkにしても一応Posix標準だが
色々変種がある）。

ま、単に便利なスクリプト言語が欲しいだけなら、今更awkをやる意味は
ほとんどないだろう。
フィールド分割だけならperl -aでawkの真似ができるしな。
54 名前：デフォルトの名無しさん [2007/09/19(水) 20:06:52 ]: >>53 丁寧なお返事ありがとうございます。
シェルの計算の補助ですか。
シェルスクリプトを書く機会は多少はあるので、多少は覚えておこうと思います。
55 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 21:00:04 ]: awkとperｌ、処理速度はどっちが速いんだろ？
ってオマエが試せって言われそうだけどふと思ったんで書いてみた。
56 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 22:17:45 ]: awkは処理系多いからなぁ
何の処理かにもよるだろうし
57 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 23:45:00 ]: どちらも得意とする単純なテキストのフィルタリング処理なら、
I/O速度で制限されるのでどちらでも(或いはsedを持ち出しても)大して変わらないと思う。

awkの真骨頂は一行野郎にあると思う私は、こんなのをよく書き捨てる。
--
awk 'BEGIN {print 1+2*3-4;}'
ls -l /tmp|awk '$5>0'
ls -l |awk '{sum+=$5;} END{print sum;}'
58 名前：デフォルトの名無しさん mailto:sage [2007/09/19(水) 23:51:16 ]: PerlにたいするAwkの現実的メリットはメモリ消費が少ないことくらいで
これは今の計算機では微々たる問題だ。
ESRのArt of UNIX Programmingを立ち読みしたら
Awkがメモリ節約のために仕様を制限したことが
早期に競争力をなくした理由と論じていた。
バッドな言語設計の見本って感じで、ちと不愉快だった
59 名前：デフォルトの名無しさん mailto:sage [2007/09/22(土) 02:28:36 ]: >>57
俺も時々やる。
その時は便利！と思って.cshrcとかにalias登録するけどすぐに忘れて同じ内容を手打ちしてたりする
その挙句にこれは便利！と思って.cshrc開くと既に登録してあるという…
60 名前：デフォルトの名無しさん mailto:sage [2007/09/22(土) 09:21:37 ]: >>59
全俺が共感した。
61 名前：デフォルトの名無しさん mailto:sage [2007/09/24(月) 12:01:33 ]: （.cshrcを.bashrcに置き換えて）　俺も同じ経験がある。
62 名前：デフォルトの名無しさん mailto:sage [2007/09/28(金) 00:37:50 ]: 「一行野郎」は名訳
63 名前：デフォルトの名無しさん mailto:sage [2007/09/28(金) 01:20:24 ]: むかし、「読書するプログラマ」をよんで、awkで会計をするのがかっこ良いと
おもってました。
でも確定申告をする身になったらEXCELを使っている。

「エンジニアのための事務作業 sed awk grep そしてTex」なんて書籍があれば食いつくのに...
64 名前：デフォルトの名無しさん mailto:sage [2007/09/28(金) 02:53:12 ]: awkで会計用スクリプトを書くより、会計のしくみを理解することの方が
俺には遥かに難しい
65 名前：デフォルトの名無しさん mailto:sage [2007/09/28(金) 14:47:04 ]: Perlだけど、これは？
www.moge.org/okabe/temp/balance/
66 名前：デフォルトの名無しさん mailto:sage [2007/10/02(火) 02:19:46 ]: Perl はコード一目見て俺がcore吐きそうになる
67 名前：デフォルトの名無しさん mailto:sage [2007/10/02(火) 07:50:30 ]: 任意に core が吐けたら便利だよな。日記代わりになる。
68 名前：デフォルトの名無しさん mailto:sage [2007/10/02(火) 08:00:10 ]: >>67
体型維持のために余儀なくされている人もいたようです。
指を喉に入れるようにするので、俗に言うげろだこが指にできます。
69 名前：デフォルトの名無しさん [2007/10/03(水) 23:18:59 ]: awkってなんでPerl風に正規表現置換できるようにならんの。独自拡張でもいいんだけどな。
70 名前：デフォルトの名無しさん mailto:sage [2007/10/04(木) 02:48:29 ]: >>69
ん、くわしく。

Perlのメタ文字を使いたいというのとは違うの?
#使えんわけだが
71 名前：デフォルトの名無しさん mailto:sage [2007/10/04(木) 21:53:48 ]: awkはDFAでperlはNFAだっけか?
72 名前：デフォルトの名無しさん mailto:sage [2007/10/05(金) 02:45:00 ]: >>71
オリジナルではね。
中にはNFAを使っているawkもある。mawkとか。
73 名前：デフォルトの名無しさん [2007/11/22(木) 06:36:33 ]: xgawkで多倍長整数を使いたいんですが、
printf( "%ld\n", num );
では桁数は増えても精度は上がってないようです。
型宣言するにはどうするのでしょうか
74 名前：デフォルトの名無しさん mailto:sage [2007/11/22(木) 07:17:23 ]: >>73
多倍長整数を実装するのに個別の精度を上げてどうする。
75 名前：デフォルトの名無しさん mailto:sage [2007/11/22(木) 07:34:48 ]: xgawkは多倍長整数あるんですよね？
で、rubyのように無宣言で使えるかと思ったらそうではないらしいので、
どうするのかと。

home.vrweb.de/~juergen.kahrs/gawk/XML/xmlgawk.html
いまこのへん見てるんですが
76 名前：デフォルトの名無しさん mailto:sage [2007/11/22(木) 08:47:49 ]: MPFR,多倍長整数ではなく実数かな。
ググって見つけました。
www.kt.rim.or.jp/~kbk/zakkicho/zakkicho7.html#D060126

golf.shinh.org/p.rb?Factorial
実はこれやってるんですが。
あとはdllのパスが分かれば・・・
77 名前：デフォルトの名無しさん mailto:sage [2007/11/26(月) 21:13:28 ]: >>76
「あなごる」の xgawk は MPFR 積んでないと思うが・・・。
78 名前：デフォルトの名無しさん mailto:sage [2007/11/29(木) 08:00:03 ]: そうですか
どちらにしても実数って事はやっぱ無理な気がしました
79 名前：デフォルトの名無しさん mailto:sage [2008/01/04(金) 07:28:20 ]: sedみたいに、パターン部分を行番号で指定出来ませんか？
80 名前：デフォルトの名無しさん mailto:sage [2008/01/04(金) 09:32:19 ]: >>79
awk 'NR == 79 {print;}'
ってこと? それとも、
awk 'FNR == 79 {print;}'
ってこと?
81 名前：デフォルトの名無しさん mailto:sage [2008/01/04(金) 14:24:54 ]: >80
はじめsedみたいに 10,35{ みたいな感じに書いてダメだったので; }
普通に比較式書くんですね。10<=NR&&NR<=35{ で出来ました; }
ありがとうございます。
82 名前：デフォルトの名無しさん mailto:sage [2008/01/05(土) 00:50:26 ]: >>81
もう少し sed らしくしたいなら、
10==NR, NR==35 { print }
なんてのもあり
83 名前：デフォルトの名無しさん mailto:sage [2008/01/14(月) 09:02:50 ]: awk はオプションなしだとワンライナーのコードを書くことになると思いますが
実際 awk のワンライナーってどんな時に使いますか？
あまり見たことがなくて…
84 名前：デフォルトの名無しさん mailto:sage [2008/01/14(月) 09:45:08 ]: >>83
UNIXでは多くのファイルや出力が欄区切りテキストの形式になっているから
その場使い捨てワンライナーが本来の使い方なんだけど、
他のOSだと BEGIN を main 代わりに使うようなのばっかになるかもね。
85 名前：デフォルトの名無しさん mailto:sage [2008/01/14(月) 09:46:06 ]: >>83がsedをどう使っているのか気になる。
sedスクリプトファイルとか作って、スクリプトの引数に処理対象のファイルを渡してたりするのかな。
86 名前：デフォルトの名無しさん mailto:sage [2008/01/14(月) 10:18:29 ]: よく書く一行野郎。
--
du -sk /tmp/* | awk '{sum += $1;} END {print sum / NR;}'
# まぁ、duってのは今思いついただけで、実際にduの出力の平均を取ることはないけどね。
--
paste foo bar | awk '($1 - $2) > 1e-3 || ($1 - $2) < -1e-3 {print NR, $0;}'
# 一致を見るだけならdiffでいいけど、近似を見るには使えないんで。
87 名前：デフォルトの名無しさん mailto:sage [2008/01/15(火) 18:34:44 ]: >>85
sedは単体の命令を見て「置換」「行の切り捨て」みたいな用途が
パッと見て思い付くので疑問は沸かないんです。

awkはひとつひとつの命令を見ても
普通にスクリプト言語の命令としか思えないので
「コード書くならともかく、ワンライナーでどう使うの？」と
疑問をもってしまうんです。

>>86
う～ん、結構複雑になりますね。
それだと私ならターミナルに書かずに
コードに起こしてしまいそうです。

でも、パターンとフィールドを上手く使えば
色々出来る気がしてきました。
例をありがとうございます。
88 名前：デフォルトの名無しさん mailto:sage [2008/01/15(火) 18:59:18 ]: あ、コード書きそうなのは後者です。
平均とか合計みたいなモノには良さそうですね。
89 名前：デフォルトの名無しさん mailto:sage [2008/01/15(火) 19:28:50 ]: 今日書いた一行野郎。
--
awk '{for (ic = 1; ic <= NF; ++ic) {if (max < $ic) max = $ic;}} END {print max;}'
--
これも全フィールドに拡張しているだけで、単に最大値を得ているだけだね。
90 名前：デフォルトの名無しさん [2008/01/22(火) 16:52:32 ]: よく書く一行
du -k|awk '$1 > 10000'
でかいデレクトリをさがす
91 名前：デフォルトの名無しさん mailto:sage [2008/01/29(火) 23:34:51 ]: 俺がよく書く一行野郎
$ awk 1 > hoge.sh
92 名前：デフォルトの名無しさん mailto:sage [2008/01/31(木) 12:58:14 ]: >>91
それに何の意味が?
cat > hoge.shでも事が足りそうだが。
93 名前：デフォルトの名無しさん mailto:sage [2008/01/31(木) 18:48:07 ]: >92
Windowsにawk入れてた時に、こんなヘンな癖が付いてしまった。
94 名前：デフォルトの名無しさん [2008/02/02(土) 12:38:28 ]: すみません、初心者ですがawkに関するｽﾚがここしかなかったので。
↓のソースを書いていただいたのですが、いったいどうすれば使えるのでしょうか？
ちなみに、これはフォルダ内のWinrar形式ファイルのリカバリレコードが付いているか否か
リストを一括で出力するものです。
よろしこ
**************
コマンドラインだけどunrar lt sample.rarの出力利用してリストを作るだけ
使い方はパイプでawkに渡して処理unrar lt *.rar | gawk -f rr.awk
awkなんか入ってないだろうから当然そのままじゃ動かない

rr.awk
#!/usr/local/bin/gawk

BEGIN {$rr=0; printf "%-30s\t%s\n", "FileName", "RecoveryRecord";}

{if($1=="Solid" && $2=="archive"){
for(i=3;i<=NF;i++) printf "%-30s ",$i;printf "\t";getline;getline;
if($0=="Recovery record is present"){printf "Yes / ";
for(;;){getline;if($0=="Data header type: RR"){getline;printf "%sbyte\n",$2;break;}}
}else printf "No\n";}}
95 名前：デフォルトの名無しさん mailto:sage [2008/02/02(土) 13:01:48 ]: それを動かすにはまず gawk をどこかから入手する。
96 名前：デフォルトの名無しさん mailto:sage [2008/02/02(土) 17:48:45 ]: >>94
>↓のソースを書いていただいたのですが、

書いた人に聞く。

と答えると、わけのわからん理由を言ってごねるだろうから、
先に言っとくと、そんな見苦しい言い訳するな。

どうせ答えたって、今度は○○がわかりませんとか言い出すんだろ？
どっかからgawkを落として展開しろよ。全く、一生ググってろよカス
"C:\Program Files\WinRAR\UnRAR.exe" lt *.rar | "gawkのフルパス" -f rr.awk
97 名前：デフォルトの名無しさん mailto:sage [2008/02/10(日) 19:16:33 ]: すいません、あるテキストを{print $1,$2}として抽出して

aaa 1
aaa 2
aaa 3
bbb 1
bbb 2
ccc 1
ccc 4
...

とまではできたんですが、並んでいるデータをそれぞれ、

aaa 6
bbb 3
ccc 5

と集計したいんですが、どのようにすればいいでしょうか？
98 名前：デフォルトの名無しさん mailto:sage [2008/02/10(日) 19:28:07 ]: awk '{count[$1] += $2;} END{for (aaa in count) {print aaa count[aaa]}}'
あとはソートすればいいはず
99 名前：97 mailto:sage [2008/02/10(日) 20:22:03 ]: >98さん、ありがとうございます！
情けないのですが、今まで便利なツールに頼っていて全然コマンドについて理解できていなかったので困っていました。
実はメールログで送信者がどれだけの通数を送信してるかを確かめるためにコマンドでできないか、で>97でつまづいていました。
何とか途中までできたんですが、非常にスーパーエレガントな1行コードでして…。

質問ついでで申し訳ないのですが、
(aaa in count) {print aaa count[aaa]}
のaaaについてはどう解釈すればいいのでしょうか？
100 名前：デフォルトの名無しさん mailto:sage [2008/02/10(日) 20:33:27 ]: >>99
bashとかのforとかと同じで適当な文字列ならなんでもいいです．例に出てきたaaaなんかにするからややこしくなってすみません．
for(hoge in list) {...}
で配列listのキーを片っ端からhogeに入れてループするって意味になるはずですよ．
101 名前：デフォルトの名無しさん mailto:sage [2008/02/10(日) 20:36:22 ]: 98じゃないけど

awk '{count[$1] += $2;} END{for (i in count) {printf "%s %i\n", i, count[i]}}'

こうやって書けばしんせつじゃね？
データの中のaaaとloopカウンターのaaaを同じ名前にするのは意地悪だと思うよ
102 名前：デフォルトの名無しさん [2008/02/10(日) 20:37:23 ]: 101です。すまんonz
103 名前：≠98 mailto:sage [2008/02/10(日) 20:39:44 ]: あー、みんな書いているから私の書いたのは大幅に削るか。
そのENDブロック内は、
for (制御変数 in 連想配列) {...;}
というパターン。

その前段のcount[$1] += $2は一行目のとき
count["aaa"] += 1と解釈される。以下同様に。
このcountが連想配列として使われているということ。
104 名前：デフォルトの名無しさん mailto:sage [2008/02/10(日) 20:42:05 ]: >>101
…反省してます

いや，ほら，ついいつものクセで…ごめん
105 名前：97 mailto:sage [2008/02/10(日) 20:52:15 ]: いえいえいえいえ…そういう意味じゃなくて教わっていながらすいませんです。
上記で書いたとおり便利ツールに頼り切ってて殆ど知らない私が悪いのですが…。
今一生懸命3byte程度の脳みそで勉強してるんですが、2日目で挫折しそうで質問させて貰いました…。

たとえばログには
Feb 9 22:44:40 localhost postfix/qmgr[1936]: 345C48C0154: from=<use1@example.com>, size=556, nrcpt=1 (queue active)
と必ず出ます。で、
1,生ログをそのまま処理するのが怖い（大きなファイル）ので、日付でログを抽出して別ファイルへ保存。
2,grepで nrcpt=と抽出して、さらにgrep -vで除外するドメインを指定して抽出
3,そしてsedでnrcpt=を削除して
4,ここで>97のように$7と$9を並べたところで脳みそのバッファエラーを起こしました。

この処理の方法もエレガントなことは分かっていますが、恥は承知でお伺いした次第です…。
106 名前：デフォルトの名無しさん mailto:sage [2008/02/13(水) 07:31:34 ]: gsubで[.*]を置き換えるにはどうすればいいでしょうか？
107 名前：デフォルトの名無しさん mailto:sage [2008/02/14(木) 02:38:02 ]: >>106
それはリテラルとして扱ってということかい?
なら全部エスケープすればいいと思うが何か問題があるの?
108 名前：デフォルトの名無しさん mailto:sage [2008/02/16(土) 01:08:44 ]: awkで現在時刻からn分前から以降のログだけを抜き出したいんですが、どうすればいいでしょうか…。
02 15 12:34:56 xxxxxxxxx
02 15 13:45:01 xxxxxxxxx
...
...
...
とかの形式なので、strftime()とかで現在とログの時刻を比較して抜き出す、とかを試したんですがダメでした…
109 名前：デフォルトの名無しさん mailto:sage [2008/02/16(土) 01:49:16 ]: >>108 これで駄目かな？(一応 gawk 3.0.4 では動いた)
BEGIN{
n=5
basetime=strftime("%m %d %H:%M:%S", systime()-60*n)
}
{
chktime=substr($0, 1, 14)
if(chktime >= basetime) print
}
110 名前：デフォルトの名無しさん mailto:sage [2008/02/16(土) 02:23:28 ]: >109

ありがとうございます…素直に目が鱗でした…。

> chktime=substr($0, 1, 14)

なんですね…
perlが使えない環境なので、これが分かればいろいろ流用効くので助かりました。
ありがとうございます。もうちょっと精進します。。。
111 名前：デフォルトの名無しさん mailto:sage [2008/02/18(月) 18:58:36 ]: >>29
昨年6月に「AWKを256倍使うための本」が本屋の書棚にあったので買いました。
奥付に
1993年8月21日初版発行
2007年5月9日　第1版第16刷発行
と書かれています。
112 名前：デフォルトの名無しさん mailto:sage [2008/02/18(月) 22:32:44 ]: >>111
いつのレスにレスしてんだ（ｗ

ﾓﾚも買ったけど、まだ大きな本屋で見かけるね。
113 名前：デフォルトの名無しさん mailto:sage [2008/02/19(火) 02:59:17 ]: >2007年5月9日　第1版第16刷発行

本屋の棚で眠り続けてたってわけじゃないのかw
114 名前：デフォルトの名無しさん mailto:sage [2008/02/24(日) 00:57:13 ]: 目が鱗に一致する日本語のページ約 1,920 件中 1 - 20 件目 (0.24 秒)
115 名前：デフォルトの名無しさん mailto:sage [2008/02/24(日) 01:00:56 ]: メガ鱗
116 名前：デフォルトの名無しさん mailto:sage [2008/03/28(金) 21:53:28 ]: sed, awk, ruby を使う。
それぞれ適材適所で使うけど、
「sed だけ」「awk だけ」で済ませられると、
不思議な喜びを感じる。
117 名前：デフォルトの名無しさん [2008/03/30(日) 14:05:33 ]: >>116
うち、AIX使ってるんでksh+sed+awk+perlだな。
rubyが標準でインストールされてる環境ってあんまないと思う。
118 名前：デフォルトの名無しさん mailto:sage [2008/03/30(日) 16:22:26 ]: 古いサーバだとPerlすら入ってない事があるからawkは重宝する。
119 名前：デフォルトの名無しさん mailto:sage [2008/04/06(日) 10:26:45 ]: 最近のgawkがネットワークにも使えると知ってちょっと驚いたｗ
カーニハンの本レベル（とか256倍）しか知らない人って多いと思う。
120 名前：デフォルトの名無しさん [2008/04/06(日) 12:44:41 ]: ノーマルのawkでXMLを字下げしたりしてうまく表示させるにはどうすればいいのかな・・・
121 名前：デフォルトの名無しさん [2008/04/06(日) 17:09:18 ]: sedだけで書けると、俺って頭イイかもって思う。

#!/bin/sed -f
122 名前：デフォルトの名無しさん mailto:sage [2008/04/06(日) 17:16:17 ]: 文字列の単純な置換だけならawkより簡単に書けるんだけど。
awkに固執しないで臨機応変にsedを使うって意味でなら要領がいいという意味で賢いけど。
# awkで書いた方が簡単なことをsedで頑張って書いたのだとしたら、その意味では頭悪いなw
123 名前：デフォルトの名無しさん mailto:sage [2008/04/06(日) 17:34:45 ]: awkからsystemでsed呼ぶことは時々あるｗ
124 名前：デフォルトの名無しさん mailto:sage [2008/04/06(日) 18:49:04 ]: >>24
awkって表計算のような処理に特化してますよね。
その点が非常にユニークというか事務処理の言語だな、と。
visicalc(1979)awk(1977)ですからawkのほうが若干古いんですが、
表計算はセルに直接式を書くという発想が新しかった。うむむ。
125 名前：デフォルトの名無しさん mailto:sage [2008/04/06(日) 19:26:56 ]: VisiCalcの考案者Dan Bricklinによるアイデアの説明
ttp://www.danbricklin.com/history/saiidea.htm

Danの電卓がHPじゃなくてTIなのが意外な感じ。
The idea for the electronic spreadsheet came to me while I was a student at the Harvard Business School, working on my MBA degree, in the spring of 1978.
Sitting in Aldrich Hall, room 108, I would daydream.
"Imagine if my calculator had a ball in its back, like a mouse..." (I had seen a mouse previously, I think in a demonstration at a conference by Doug Engelbart, and maybe the Alto).
And "..imagine if I had a heads-up display, like in a fighter plane, where I could see the virtual image hanging in the air in front of me.
I could just move my mouse/keyboard calculator around, punch in a few numbers, circle them to get a sum, do some calculations, and answer '10% will be fine!'"
(10% was always the answer in those days when we couldn't do very complicated calculations...)
126 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 02:52:10 ]: はじめましてgawkの質問です
お手すきの時にでもご解答頂けましたら助かります

2chでお話していただいた方からgawkを教えて頂きました
正規表現でマッチした部分がいくつあっても全ての箇所を1アクションで保存できる優れものです
当方、言語は全く知らないので先ほどまでテスト実行しては驚いていました
この優れものを今後末永く使っていきたいのですが
下記の事項をググって見たのですがわかりませんでした
どなたかわかる方おられましたら教えて下さい

私のやりたいこと
・EUCを読み込んでS-JISを出力
・既存のテキスト末尾に追加書き込み保存
（教えて頂いたスクリプトは上書き保存なので出力先の内容が消えてしまいます）

気長に待っていますので何卒よろしくお願い致します
127 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 03:10:31 ]: >>126
前者はawkでやるべきことではない。iconv, nkfなどそれ専用のツールがある。
後者も必ずしもawkは不要。コマンドラインが使える環境なら普通にできる。
例えば、Unix系なら cat append.txt >> original.txt で既存のファイルに追加できる。
DOS系でも、type append.txt >> original.txt でできる。
要は、awkのいいところはそれ単体でなんでもできる(或いはできない)ことではなく、
コマンドライン環境で力を発揮するツールであること。

例えば、正規表現でマッチした文字列を置換するだけならテキストエディタでもできる。
あーそうそう、エディタがあれば文字コードの変換もそれだけでできる。
所謂テキストエディタを使ったことがないなら、一度(正規表現検索機能、
文字コード変換機能のある)テキストエディタを触ってみるといいかもしれない。
128 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 03:32:54 ]: >>127さん
>>126です
お疲れのところ早々のご解答誠にありがとうございます
コンバートは別のツールで行う
DOS環境ではtype append.txt >> 出力先ファイル名で追加書き込み
了解しました
エディターは秀丸エディターを使っています
コンバートは出来るのですが検索でマッチした文字列は1箇所ずつコピーなんです
sakuraエディターで一括コピーや切り取りが出来ると教えてくれた方もいてたのですが
sakuraエディターは試したことが無いんです
詳しくありがとうございました
129 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 03:56:33 ]: AAA.txtを開き”東京(.+?)号室”を検索する
マッチした複数箇所を一括でコピーしてTEST.txtにペーストする

BBB.txtを開き”東京(.+?)号室”を検索する
マッチした複数箇所を一括でコピーしてTEST.txtの末尾にペーストする

CCC.txtを開き”東京(.+?)号室”を検索する
マッチした複数箇所を一括でコピーしてTEST.txtの末尾にペーストする

よろしくお願いします
130 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 04:02:07 ]: >>127は結局awkの解答はしないのになんでしゃしゃり出てきたの？
できないじゃん
131 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 06:48:34 ]: >>130
質問に具体性がないから一般論を書いただけだけど。

>>129
awk '/東京(.+?)号室/ {print > "TEST.txt";}' AAA.txt
awk '/東京(.+?)号室/ {print >> "TEST.txt";}' BBB.txt
以下同様に。
132 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 12:02:34 ]: >>131
レスありがと
gawk '/東京(.+?)号室/ {print > "TEST.txt";}' AAA.txt
gawk '/東京(.+?)号室/ {print >> "TEST.txt";}' BBB.txt
ファイル名、ディレクトリ名、またはボリューム　ラベルの構文が間違っています。
gawk3.16では使えない？
133 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 13:29:56 ]: >>132
DOSのコマンドラインの使い方は他所で聞いてくれ。
134 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 13:38:24 ]: 役所の窓口みたいな対応だな。
135 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 13:43:47 ]: DOSのコマンドラインについては多くを知らないんだよ。
136 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 16:36:42 ]: DOSの場合は空白を含む場合シングルクォートじゃダメだからな。
ダブルクォートで括って中のコードは
シングルクォートか、エスケープしてダブルクォート入れるか。

一番簡単なのは、ワンライナーでもファイルに起こしてしまうこと。
gawk -f myscript.awk AAA.txt
とやってしまえば、シングルクォートとかダブルクォートとか気にする必要はない。
137 名前：デフォルトの名無しさん mailto:sage [2008/04/07(月) 18:22:15 ]: >>132
二つ問題がある。
gawkの正規表現では.+?というのは使えない。
cmd.exeでは、シングルクォートを引数を
くくるのに使えない。

なんかよくわからんが、perlでテキストを丸飲みしてから
処理すればいいんじゃないのか？
138 名前：デフォルトの名無しさん mailto:sage [2008/04/12(土) 19:00:42 ]: VisiCalc といえば、出始めの頃に TRS-80 用を Radio Shack で見せてもらったんだけど、学生だった私には価値がわからなかったなぁ。
まぁ、これに限らず、『なんでこんなコマンドやオプションがあるんだ？』ってのは多い。
使い方じゃなく、なぜそれがあるのかを包括的に解説した本や web site ってありますか。(たとえば多くの unix コマンドを網羅しているとか)
139 名前：デフォルトの名無しさん mailto:sage [2008/04/12(土) 19:01:22 ]: ああ、スレ違いだった。ごめんごめん。
140 名前：デフォルトの名無しさん mailto:sage [2008/04/12(土) 19:58:47 ]: なんという誤爆
141 名前：デフォルトの名無しさん mailto:sage [2008/05/06(火) 02:42:04 ]: >>132 もう居ないかな。gawk3.1.6 + nkf2.0 使用@cmd.exe

C:\work>type aaa.txt (※EUCなので化ける事を確認)
､ﾛ､ｲ､ﾛ､ｲ
ﾅ・�ｹ貍ｼ
ﾅ・�｣ｲｹ貍ｼ
ﾅ・�｣ｱ｣ｰｹ貍ｼ
ﾅ・�､ﾛ､ｲｹ貍ｼ
ﾅ・�､ﾕ､ｬｹ・ﾅ・ﾕ､ｬｹ貍ｼ
ﾅ・�｣ｳｹ貍ｼ､ﾈﾅ・�｣ｵｹ貍ｼ

C:\work>nkf -Es AAA.txt
ほげほげ
東京号室
東京２号室
東京１０号室
東京ほげ号室
東京ふが号
東ふが号室
東京３号室と東京５号室

C:\work>nkf -Es AAA.txt| gawk "/東京.*号室/{print $0}"
東京号室
東京２号室
東京１０号室
東京ほげ号室
東京３号室と東京５号室

既出の通り文字変換nkf(>>127) 正規表現の制約で条件変更(>>137)
実際に使う場合はこんな感じでバッチ作るとか。
C:\work>nkf -Es AAA.txt| gawk "/東京.*号室/{print $0}" >>TEST.txt
142 名前：141 mailto:sage [2008/05/06(火) 02:56:02 ]: と、方法を書いておいてアレだけど、
秀丸使ってるならgrepの実行で検索するファイルに(現在の内容)で
検索結果からファイル名と行番号を除去するのでもできそうな気がする。
盛大にスレ違いだけど。
143 名前：デフォルトの名無しさん mailto:sage [2008/05/06(火) 14:28:43 ]: >>142さん
ありがと
まだ思うようにできていないんだ
参考になるよ感謝です
144 名前：デフォルトの名無しさん mailto:sage [2008/06/16(月) 01:50:26 ]: ひでえｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
145 名前：デフォルトの名無しさん mailto:sage [2008/06/16(月) 01:50:57 ]: すまん誤爆
146 名前：デフォルトの名無しさん [2008/06/25(水) 02:17:58 ]: 質問です！

以下のファイルhogeからawkで、価格を抜き出して合計値を出したいと思っています。
ファイルの内容は、書籍名と価格です。価格は一番後ろの数字になります。

----------------------
$ cat hoge
それいけ！あんぱんまん 1000
メタボリックを撃退せよ 1000
下流社会 1000
上流社会と下流社会日本のこれから 1000
論文 2008 日本の抱える問題 1000
論文 2007 日本の抱える問題過去問題集 1000
----------------------

難しいのが、書籍名の2008や2007などの数値が含まれていることや空白が含まれていることです。
1行目の場合2列目が価格になりますが、2行目の場合4列目が価格となります。

このように一番最後の列（価格）を取得し、合計値を計算するにはどうすればよいでしょうか？

ご教示お願いいたします。
147 名前：デフォルトの名無しさん mailto:sage [2008/06/25(水) 02:28:00 ]: awk '{x+=$NF}END{print x}' hoge
148 名前：デフォルトの名無しさん mailto:sage [2008/06/25(水) 09:33:15 ]: xじゃなくてsumとかにしようよ。
149 名前：デフォルトの名無しさん mailto:sage [2008/06/25(水) 13:36:51 ]: 一行野郎は手数（打数）重視なんじゃまいか
150 名前：デフォルトの名無しさん mailto:sage [2008/06/25(水) 15:27:28 ]: 難しいってマニュアル読めば最後の要素を指すものが何か書いてあると思うが
151 名前：デフォルトの名無しさん mailto:sage [2008/06/25(水) 16:09:13 ]: 読んでたら他人になんか聞きません。

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef