『コンパイラ・スクリプトエンジン』 相談室 2
at TECH
[1からを表示]
50:デフォルトの名無しさん
02/05/22 00:21
>>48
最低限の構文は必要かと。
むちゃくちゃ楽なのは確かだけど。
あとはマクロで構文唐。
51:デフォルトの名無しさん
02/05/22 00:31
まあ下手な構文作るよりかはLISPのS式にしとく方がましだな。
52:38
02/05/22 00:31
>>47
構文解析とかは中田(?)氏の本を読んでできるようにはなりました。
再帰下降法だけだけど。
53:デフォルトの名無しさん
02/05/23 03:29
>38
FORTHは?
と言ってみるテスト。
54:MIND
02/05/23 14:09
>>53
処理系を作る人にはやさしいけど、応用系を作る人にはどうかな?
と呟いてしまう今日この頃。
55:デフォルトの名無しさん
02/05/23 14:24
まだyaccがはやいなんていってる馬鹿いるね
56:デフォルトの名無しさん
02/05/23 15:42
>>55
うっさいハゲ
57:デフォルトの名無しさん
02/05/23 16:23
>>55
パーサー担当は君に決定!
58:デフォルトの名無しさん
02/05/23 17:02
LISPで決まり。
ところで、GCの無いLISPって理論的に可能でしょうか。
59:デフォルトの名無しさん
02/05/23 17:06
可能
無限にメモリを消費し続けてください
60:デフォルトの名無しさん
02/05/27 05:40
保守age
61:デフォルトの名無しさん
02/05/29 01:31
保守しる!
62:デフォルトの名無しさん
02/05/29 23:47
もりあがらないね
63:デフォルトの名無しさん
02/05/29 23:49
どうやって中間言語に翻訳しなおすのですか?
64:HELP!あ〜にゃにゃにゃ〜にゃ〜
02/05/30 01:04
Yaccのソースが見つからないのれす。
65:逝って良しの1
02/05/30 01:15
構文解析器だけは作りたくないです。
66:デフォルトの名無しさん
02/05/30 01:24
>>65
再帰下降なら楽じゃん。
67:デフォルトの名無しさん
02/05/30 03:00
>>64
GNU bison ならすぐ見つかるだろ。
68:デフォルトの名無しさん
02/05/30 04:39
>>64
森氏のkmYaccならVectorで検索すれば有るんじゃない?ソース付きで。
この人のcppとmakeは自分なりに手直しして未だに使わせてもらってる。
69:デフォルトの名無しさん
02/05/30 05:06
どうしても関数の実装ができません。あとcontinueとbreakも。
70:デフォルトの名無しさん
02/05/30 11:08
>69
Cマガの2000年5月号をよめばわかります。
71:64
02/05/30 12:29
>>67
GNUは生理的に嫌なので。すんまへん。
>>68
ウヲ。すごいでつなこの人。ありがとうございます。
72:デフォルトの名無しさん
02/05/31 01:41
>>71
そういうやつは生理的に氏ね!
73:デフォルトの名無しさん
02/05/31 22:45
>>72
GNU のソースが生理的に嫌いだってのは、分からんでもない。あのインデントは
読みたくないよ。(というわけで GNU indent 通して整形してから参照してる俺)
74:デフォルトの名無しさん
02/05/31 23:22
>>73
むしろライセンスの方じゃないの。
75:デフォルトの名無しさん
02/05/31 23:53
>>74
73 の皮肉と諧謔を込めた文意を読み取れ。
76:デフォルトの名無しさん
02/06/01 00:21
75=73
77:デフォルトの名無しさん
02/06/01 04:16
>>68
ちなみにこの人、LSI-Cコンパイラの作者な。
yaccもcppもmakeもその一部。
78:68
02/06/01 13:53
ワシは厨房なんで高度な皮肉も
宗教じみたライセンスも理解できんので
避けてるのです。生理的に。用途違うかな。
>>77
普段LSI-C試食版使ってるので、cppで気づきました。
LSI-Cは一人の天才プログラマが作ったって噂があったけど、
本当だったんですな。あこがれます。
79:真68
02/06/01 16:48
↑どうでもいいけど68書いたの俺な。あんた64じゃない?
>>77
知っている。今はLSI JAPANの取締役らしいな。
bisonのジェネレータが出力するソースは見にくくて吐き気がするが、
kmyaccのは綺麗で分かりやすい。実用にも問題無いし、学習用にもお勧め。
俺はbisonから完全に乗り換えたよ。テーブルの小ささに惚れた。
80:64
02/06/01 19:58
スマソ回線切って首吊ってきます。
81:73
02/06/03 16:39
>>76
はずれ(w
>>78
> 宗教じみたライセンスも理解できんので
GPL は理解しておいて損はないと思うよ。
俺は GPL の趣旨には賛同しないので、自分が公開するソフトのライセンスは
GPL にしない。でも GPL で公開されているソフトには有用なモノも多いし、ライ
センスを理解して使えば GPL に汚染されずに旨い部分だけ頂ける。
(ちなみに個人的には BSD、仕事絡みではクローズドな人です)
82:デフォルトの名無しさん
02/06/03 17:46
>ライセンスを理解して使えば GPL に汚染されずに旨い部分だけ頂ける。
この辺のところを、もう少し詳しく教えて( ゚д゚)ホスィ
83:64
02/06/03 23:01
82に禿尿。readlineとかガリガーリ使っていきたいヨー
84:デフォルトの名無しさん
02/06/04 04:10
LL(1)文法の
Fisrt Follow Directorの計算アルゴリズムが良くわからん。
オーム者コンパイラ(中田育男 8刷 p85)
誰かわかりやすく教えてくれ。
85:.
02/06/04 04:15
URLリンク(www.aa.wakwak.com)
86:
02/06/05 01:17
>>84
過去ログ。
87:デフォルトの名無しさん
02/06/06 23:29
ageeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee
88:デフォルトの名無しさん
02/06/07 11:22
以前、Cで数十行で書かれた小さいBASICインタプリタを見たことあるん
だけど、検索しても、どうしても見つかりませんでした。
知ってる人いますか?
89:デフォルトの名無しさん
02/06/07 11:28
>>88
7行スレのことか?
90:デフォルトの名無しさん
02/06/07 13:20
>>88
Expert Cに載ってる奴じゃない?
URLリンク(www.ioccc.org)
91:デフォルトの名無しさん
02/06/10 16:08
>90
これ、VC6でコンパイル通らないんだけど、何だったらできる?
92:デフォルトの名無しさん
02/06/11 00:42
C++の構文解析、
struct C {
C (f)(); /*Cを返す関数f*/
C(); /*コンストラクタ*/
};
というので、{}のなかの 'C'
まで読んだ時点でそれがclass-nameかdeclaratorかどうやって判断しているの?
ひとつだけの先読みではわからないですよね。LALR(1)とかいうのとはちがうのですか?
93:デフォルトの名無しさん
02/06/11 02:37
>>92
URLリンク(www.y-adagio.com)
94:デフォルトの名無しさん
02/06/11 02:44
>>92
読んだ時点で判断してるわけないと思うが。
そこは意味解析で判断する部分。
構文解析の段階だと
C();
は「戻型が省略された関数C」とでも解析されるんだろう。
structの定義('}')が終わった段階で、
初めて意味解析が走ると考えたほうが自然。
95:デフォルトの名無しさん
02/06/11 03:48
>>94
struct の } 終わってから解析って、そりゃ構文解析でほとんど何もやってない
に等しい気が……。struct C の段階で「C」を型名としてシンボルテーブルに登
録しておいて
C (f)();
→ 識別子 '(' 識別子 ')' '(' 識別子 ')' ';'
ぐらいにバラしてスタックに積んでおき、この段階で意味解析に掛けると思う。
構造体の宣言が終わらなくても ';' 単位でばらせば、十分に解析可能だよね。
少なくとも型名やら名前空間やら、必要な情報は事前に出てるわけだし。
(そうでもない?)
96:デフォルトの名無しさん
02/06/11 05:05
'C'まで読み込んだ段階では判定できないから
適当な中間の非終端記号を入れて判定を遅延させて、
十分読み込んだところで判定を確定する、という話じゃないの?
97:96
02/06/11 05:07
>95 と内容被ってた(鬱)
98:92
02/06/12 00:57
とりあえず全部identifierとして読んでおけばいいんですね。
Cの場合、構文解析の段階でtypedefとenumを辞書引きすればよさそう(試してない)
だったので、C++もその延長でいけるかとおもっていたのです。
LALR(2)でならそれでもいけるかな?
99:デフォルトの名無しさん
02/06/12 14:01
>>98
C は型名と変数名は異なる名前空間で定義されるから(型名と重複する変数名
を定義可能)、その方針でやる場合には
型名を読み込んだ
→ 字句解析側に、次にアルファベット列が来たら identifier を返すように設定
と、構文解析・字句解析での情報のやりとりが必要になるかと。
100:92
02/06/12 23:04
>>99
typedef名だけは型名と変数名の両方に登録されるようなので、
typedef t int;
int t();
なんてのはエラーにしないといけない(?)のでどっちにしても
意味解析でも構文解析じみたことはしなければいけないみたいですね。
101:100
02/06/12 23:05
typedef t int ×
typedef int t ○
102:デフォルトの名無しさん
02/06/16 01:17
最適化するのにポインタって邪魔ですか?
103:デフォルトの名無しさん
02/06/16 01:21
邪魔。
104:デフォルトの名無しさん
02/06/16 01:32
っですよねー。
三項になりましたサンクコ
105:デフォルトの名無しさん
02/06/16 01:40
オブジェクトやメモリを参照することを禁止したポインタなら邪魔にならない。
106:デフォルトの名無しさん
02/06/18 03:52
1+a+2 を逆ポーランドで表現した
1a+2+ というデータだけがここに有るとして、これを
3a+ にうまく変形出来ないだろうか。
107:デフォルトの名無しさん
02/06/18 04:00
>>106
出来る。
108:デフォルトの名無しさん
02/06/19 00:19
>>106
URLリンク(buri.sfc.keio.ac.jp)
の図で言うと * と / が演算子の結合度が同じかつ親子なので、
a を a / d で置き換えてよい。
今考えたんで合ってるかどうか分からんけど。
109:age
02/06/20 01:05
age
110:デフォルトの名無しさん
02/06/21 02:17
保守汁
111:デフォルトの名無しさん
02/06/24 11:39
昨日LAOXのBOOK館でドラゴンブックの邦訳を買ったDQNを目撃した人はいませんか?
それが私です。
ついでにもう一冊、と、
原田賢一『コンパイラ構成法』共立出版、374頁、1999
を買っちゃいました。こちらはDQNの私でもわかりやすく例を挙げて、
C言語ライクの言語を構築する方法を説明してありました。
112:デフォルトの名無しさん
02/06/25 01:16
DQN がドラゴンブック買うかよチクショー。
113:コンパイラ構成法
02/06/25 03:49
おもわず検索してソースだけget。
114:棄教者 ◆witdLTi2
02/06/25 07:47
>>113
あ。ほんとだ。
正誤表とソースがげtできる!
カムサハムニダ。
115:デフォルトの名無しさん
02/06/30 20:21
保守
116:デフォルトの名無しさん
02/07/07 23:12
やっと前スレが埋まったね。
117:質問
02/07/07 23:43
どうしてこのスレはもりあがらないんですか?
118:デフォルトの名無しさん
02/07/07 23:49
kmyaccとflexを組み合わせて使うことは可能なんですか?
119:デフォルトの名無しさん
02/07/08 00:24
生理的に可能
120:デフォルトの名無しさん
02/07/08 00:31
ありがとう
カムサハムニダ
121:デフォルトの名無しさん
02/07/08 01:12
ちうか、今の時代、構文解析なぞを勉強するのはあまり意味がない
気もするのだが... まだLALRとかが発明される前なら研究の
対象にはなっただろうが、今はyaccが使えればいいじゃん、と思う。
122:デフォルトの名無しさん
02/07/08 01:13
antlrの使い方がわかればなおよい。
と言ってる俺はyaccしか使えません首吊ってきます
123:棄教者 ◆witdLTi2
02/07/08 08:21
>>121
yaccの文法はわかっても即コンパイラ・スクリプトが書けるとは限らないという罠。
124:デフォルトの名無しさん
02/07/08 08:35
>>121
いや〜、でも憶えないとコンフリクトの理由が分からなくて困ることとかない?
でも、なにも知らないところからだったら yacc 憶えた後の方が理解が早いので
手順として先に yacc は賛成。
125:デフォルトの名無しさん
02/07/08 10:10
>>121
コンパイラ・コンパイラの段階から自作できるようになって、初めて一人前。
126:デフォルトの名無しさん
02/07/08 10:39
コンパイラ・コンパイラ・コンパイラはどうやって作るんですか?
127:
02/07/08 11:02
>>126
コンパイラ・コンパイラと一緒。
* (コンパイラ・コンパイラ)・コンパイラ
* (YACC のコンパイラ)・コンパイラ
* (C のコンパイラ)・コンパイラ
128:デフォルトの名無しさん
02/07/08 14:19
>>126
作る必要はありません。
129:デフォルトの名無しさん
02/07/08 16:40
>>126
コンパイラ・コンパイラ・コンパイラの段階から自作できるようになって、初めて神。
130:デフォルトの名無しさん
02/07/09 03:40
[コンパイラ]n ・ コンパイラの段階から自作できるようになって、初めて神。
131:ふわふわ名無しさん
02/07/09 04:16
結局のところ、コンパイラ・コンパイラさえ作れれば神。
証明↓
132:デフォルトの名無しさん
02/07/11 03:28
⊂(ΦωΦ)⊃フフフ・・・・
133:棄教者 ◆witdLTi2
02/07/11 16:15
>>131
テユーカ、一番すごいのはダイレクトにマシンコードを吐き出すコンパイラをハックする人だと思う。
134:デフォルトの名無しさん
02/07/11 18:45
再帰下降ってみんなもう使ってないの?
135:デフォルトの名無しさん
02/07/11 20:44
>>134
JavaCCが、再帰下降のパーサを生成する。
WebGainが音信不通なんでどうなることやら。
136:デフォルトの名無しさん
02/07/17 00:05
昔のインタフェースの特集記事に色々とあったな
137:デフォルトの名無しさん
02/07/22 00:34
while文を使ってfor文を定義したいのですが、
for(ex1;ex2;ex3){s;}
は
ex1;
while(ex2){
s;
ex3;
}
と書こうと考えますた。
なんですが、前から順番に構文解析していく場合
sを先に評価してex3を評価するなんてことをどうやって実現するのでしょうか?
ジャンプ命令を使ったりしてどうにかするのでしょうか?
教えてください。
138:
02/07/22 00:38
>>137
「定義したい」とはどういう意味だ?
139:デフォルトの名無しさん
02/07/22 00:38
ブロック終端でのjumpの前の時点でex3を評価すればいいじゃん
140:デフォルトの名無しさん
02/07/22 00:55
>>139
つまりsを読んだ後、ex2の前にjumpする前にex3を評価するってことですよね?
でも前から解析していく際にex3はどのようにしておけばよいのでしょう。
プログラム書くときにex3のところをどうやって書けばいいのかが・・・考えてるんですけど
分からないんです・・・
141:デフォルトの名無しさん
02/07/22 00:59
>>140
ハァ?
それじゃfor()はどうやって実現してるんだよ?
142:
02/07/22 01:12
>>140
もしかして、構文木とか作らずに、字面のまま実行してたりする?
143:デフォルトの名無しさん
02/07/22 01:16
>>142
恥ずかしながらそうです。。。
144:デフォルトの名無しさん
02/07/22 01:18
それじゃ、構造化言語を作るのは無理だろ。
145:デフォルトの名無しさん
02/07/22 01:23
>>144
そうですか。。。
出直してきます。レスくれた方ありがとうございました。
146:よ
02/07/22 01:31
continueに対応できない罠
とかいう問題じゃなかったか…
147:デフォルトの名無しさん
02/07/22 02:24
URLリンク(www.combo.org) これなんかもおもしろそう.
148:デフォルトの名無しさん
02/07/22 03:53
別に構文木を作らなくても、構造化言語のコンパイラは作れる。
というか、作ったことがある。
出力コードの最適化は難いし、jumpの塊になるけど、breakや
continueもちゃんと対応できた。
149:デフォルトの名無しさん
02/07/22 11:00
>>148
> 別に構文木を作らなくても、構造化言語のコンパイラは作れる。
不可能じゃないだろうが、for ループがネストすることを考えると、ジャンプ用の
ラベルの振り方とか面倒そうだ。(それって、結局、構文木を作ってるのと手間
変わらんのでは?)
150:デフォルトの名無しさん
02/07/29 04:09
字句解析をする際に予約語と予約語でない名前とを区別するにはどうするべきなんでしょうか?
つづりを切り出し照合せよなどと本には書いてあったのですが、意味がよく分かりません。
ハッシュ法を使って何とかするのでしょうか?
151:デフォルトの名無しさん
02/07/29 05:24
>>150
とりあえず単語切り出すところまではできてるとして、後は
static const char *keywords[] = {
"if", "else", "while", ..., NULL
};
int is_keyword(const char *s)
{
int i;
for (i = 0; keywords[i] != NULL; ++i)
if (strcmp(s, keywords[i]) == 0)
return 1;
return 0;
}
とか。キーワード数が増えたら、ベタな線形検索やめてハッシュや二分木を
使った方が良いかもしれんが、たかだか数十程度なら気にしなくて良い。
152:ろうひ男爵
02/07/29 09:44
>>150
c言語+asmのマクロを展開するプログラムを作って、
当初は普通の検索(線形検索)で90秒かかった処理が、
ハッシュ(チェイン法)を使って15秒になったよ。
でも、そのときの登録語数が3万単語位なので、
cコンパイラ部分だけで使うくらいの語数(変数合わせて千単語ぐらい)だと、
それほど性能の差は無いと思うよ。
ちなみに、2本木の方が実装は難しいかも。
153:デフォルトの名無しさん
02/07/29 10:36
gperfつかっとけ
154:デフォルトの名無しさん
02/07/29 12:13
2本木ってなに?
155:ろうひ男爵
02/07/29 12:22
すまん、2分木の事。
あと、90秒かかったのが5秒になったの間違えです。
156:デフォルトの名無しさん
02/07/30 01:44
2本木なんて初めて聞いたよ
157:ろうひ男爵
02/07/30 04:41
>>156
すまんのう
158:デフォルトの名無しさん
02/07/30 04:48
>>157
ろうひ男爵、いいかんじのひとだね。
159:デフォルトの名無しさん
02/07/30 23:38
後学のため自前でスクリプトコンパイラを作ってみようと思い、
再起下降構文解析とかBNFとかLAL(1)等の解説されているページをみてまわっています。
a -> a b
b -> c
c -> X
このような一直線な処理は簡単にできる気がするのですが、
a -> a b|c
b -> X
c -> Y
のようにorが入るとたちまちパニックです。
上記の場合bの処理でfalseが帰った場合、
取得したトークンをスタック等に積んでおいて、
cでそのスタックを参照するというような仕組みになるんでしょうか?
それとももっとエレガントな仕組みがあるのでしょうか?
実は全くトンチンカンな事いっちゃってるんでしょうか?
つべこべ言わずYaccで仕組み覚えろモルァ!でしょうか?
160:デフォルトの名無しさん
02/07/30 23:56
>>159
まだコードやアルゴリズムを考える段階にないと思われ。
URLリンク(cspt1.ict.ru.ac.za)
ここにコンパイラ作りの基礎を書いた本一冊文のドキュメントがある。
LL文法の範囲内しか扱ってないけれど最初に手を着けるにはこれぐらいでいい。
161:棄教者 ◆witdLTi2
02/07/31 08:42
>>159
Yaccを使いこなせるようになった方が手っ取り早いです。
yacc/lex プログラムジェネレータ on UNIX
五月女健治著
テクノプレス
ISBN4-924998-14-1
162:デフォルトの名無しさん
02/07/31 13:58
>>159
自前で作らなきゃいやなの?
163:159
02/07/31 14:39
>>160
もっと基礎や概念みにつけるべきということですね。
英語はかなり苦手ですが、いい機会なので昼休み等に読んでいこうと思います。
>>161
昨日Yacc/Lex関係の本を探してみたのですが、
Flaxの本しかありませんでした(買いませんでした)
教えていただいた本を探してみようと思います。
(そういえばネットで買えるとこがありましたよね)
>>162
仕事には全く関係ないというか、完全に興味本位です。
あとオブジェクト指向を勉強してたとき感じたのですが、
自分の知らない技術理解すると、今までやってきたことを
違った視点で見れたりするじゃないですか。
そういうのも狙ってます。
(再起下降構文解析とかみててビビビときましたね)
164:デフォルトの名無しさん
02/07/31 14:48
>>161
LL の方が
エラー回復が楽
先読みするトークン数を容易に増やせる
って利点もあるから、俺は両方やることを推奨したい。ま、お勉強としては
手書きのパーサーも悪くないっしょ。
165:デフォルトの名無しさん
02/07/31 20:00
下の文法のパーサをつくれたらLALR(2)パーサジェネレータを名乗っていいですか?
//term
a
b
c
//non-term
START:
E;
E:
C a a|
D a b;
C:
A;
D:
B;
A:
a;
B:
a;
166:デフォルトの名無しさん
02/07/31 20:03
>>165
実際にLR表作ってみたら?
167:デフォルトの名無しさん
02/07/31 20:07
>>166
できてるっぽいんですが、goto表をここに貼ってみればいいですか?
168:デフォルトの名無しさん
02/07/31 21:22
貼っていい?
169:デフォルトの名無しさん
02/08/02 00:48
イっていい?
170:高速化
02/08/07 02:49
インテルのコンパイラでコンパイルするだけで高速化しました。
無料体験版があります。
URLリンク(www.xlsoft.com)
171:デフォルトの名無しさん
02/08/07 03:02
ハッシュはどこら辺を参考にすればいいんでしょうかねぇ。
172:デフォルトの名無しさん
02/08/15 00:22
『コンパイラ構成法』を読みながらlex/yaccを勉強しているのですが、
URLリンク(216.239.51.100)
でダウンロード出来るであろうソースコードが相手先サーバーが動いていないか何かで、ダウンロード出来ません。
正誤表はグーグルキャッシュでゲットできたのですが。
ソースコードお持ちの方、どこかのアップローダに上げていただけませんか?
173:棄教者 ◆witdLTi2
02/08/15 15:30
>>172
いま、鯖がdjみたいですね。
このまえはぼくもダウソできたので。
しばらくしたらもう一度渡来してみたらどうよ。
この本は親切で分かりやすい本です。おすすめです。
わからないところや面白い本はドラゴンブックで補充するとさらに良いでしょう。
174:ろうひ男爵
02/08/17 05:29
>>171
'0'-'9' を 0-9
'@' を 10
'A'-'Z' を 11-36
'_' を 37
'a'-'z' を 38-63
それ以外を 0
にする文字変換テーブルを作り(chartbl[256])、
ハッシュ表(hashtbl[256])を256だとすると、
hashtbl[chartbl['最初の文字']+chartbl['真ん中の文字']+hashtbk['最後から2番目の文字']+chartbl['最後の文字']]
でハッシュ値が収得できるよ。
175:デフォルトの名無しさん
02/08/27 16:01
インタープリターの勉強したいんですが、どこかに参考コードとか、
いい本ありませんか?
176:ろうひ男爵
02/08/27 16:38
どういった用途に使います?>>175
中間言語に落として、ゲームやツールに組み込む単純なスクリプト言語なら、
LL(1)が良いと思います。
それ以上に簡単な物の方がよいのでしたら、
構文解析もほとんど考えなくても良い言語にしたら簡単なんじゃないのでしょうか?
使用用途にもよりますが、以下ぐらいなら簡単に作れるのではないでしょうか?
命令を組み込みの物だけにする、
関数を使えなくする、構造化も出来なくする(手続き言語の古いMS-BASICみたいにする)
変数は$マークから始まるとか、特殊記号にする
算術計算式などを、別扱いにするか、専用の命令を作り、ADDとかにしする。
それでも、バックパッチぐらいは必要ですけど。
LLなら、そこまで難しくはないけど、
yaccとlexを使い、LALRって方法でも簡単に出来ますよ。
177:デフォルトの名無しさん
02/08/27 16:53
>>176
用途というか、PerlやHSPを使ってるうちに、どうやってコンパイラや
スクリプトが動くんだろうと思って、すごく簡単なものでもいいから作れたら
勉強がてらやるのもおもしろいかなーと漠然と思ったんです。
コンパイラに関してはぜんぜん知らなかったので、すこしWEBを見て
LL(k),LR(k)について勉強しましたが、言ってる事は理解できても
それをどうやってコードにしようと悩んでしまって。なにかコードがあれば
みながら勉強することができるのですが・・・言語はJAVAかCかPERLか、VB
くらいしか使えないので、どれかでやろうと思っています。
何かインタープリター系の本でコードが載っていて、いい本かなにかありますか?
お願いします。ちなみにUNIX系使えないのでYACCとかできません・・・
178: ◆JAPH9PWA
02/08/27 17:42
Macは知らないけど、Windowsならyaccあるよ
URLリンク(hp.vector.co.jp)
179:デフォルトの名無しさん
02/08/27 17:49
JavaCCで、構文と構文の隙間を埋めるような
柔軟な構文を定義する方法を教えてください。
Perlでいうところの (.*?) みたいなものが欲しいんです。お願いします。
180:デフォルトの名無しさん
02/08/27 18:07
URLリンク(www.tokumaru.org)
ここのコンパイラソースコードは参考にはならない?
181:ろうひ男爵
02/08/27 18:37
>>177
でしたら、
コンパイラ構成法 原田 賢一 共立出版株式会社 ISBN: 4320029224 6,500円
が一番分かりやすいのですが、yaccとlexが必要です。
コンパイラの仕組み 情報科学こんせぷつ〈8〉 朝倉書店 ; ISBN: 4254127081
も物量的に少ないので読みやすいですが、消化不良のところが出てきます。
しかし、1日から一週間で読めると思います。
あと、インタープリタとコンパイラの違いは大きくないので、
ここのスレッドに色々質問すると良いかもしれません。
どちらにしろ、コンパイラ関連の本は難解な物が多く、
いろいろなアルゴリズムを理解していることが前提となったりするので、
軽くアルゴリズムの本を読んでおいた方がためになりますよ。
アルゴリズムを1冊ですますには、以下の本が良いと思います。
定本Cプログラマのためのアルゴリズムとデータ構造 近藤嘉雪 技術評論社
簡単なアルゴリズムの本は
C言語アルゴリズム+徹底入門 柏原正三 技術評論社
が読みやすいです。
182:デフォルトの名無しさん
02/08/27 18:40
金出す前にこれでも読んどけ。
URLリンク(www.hayalab.cs.ritsumei.ac.jp)
183:Aoki
02/08/27 19:12
実行速度が速いSmalltalkを実装するための技法をいろいろ教えて下さい。
184:デフォルトの名無しさん
02/08/27 20:03
>>179
JavaCCは少し使ったことがあるんで、答えられるようなら答えますけど、
Perlは知らないんで、質問の意図がわからないです。
185:179
02/08/27 20:28
<ALL:~[]> /* Perlの(.*)相当だと思うのですが… */
void this () : {} {
( "{" this() "}" )+ )|(s = getAll() { println(s) } )
}
が、期待通りの動作をしてくれません。
左の構文を優先させたいのです。お願いします。
186:179
02/08/27 20:35
具体的には、(asdf()asdf((asdf)asdf))
みたいなのをパーズしたいと思ってます。
asdfの部分は、それが構文そのものを含む時以外は、
全ての文字を処理したいのです。
187:デフォルトの名無しさん
02/08/27 20:46
<ALL:~[]*>
すみませんこっちでした。
188:184
02/08/27 21:43
まだようわからんけど、{asdf{}asdf{{asdf}asdf}}が無理やりパースできるようにしてみた。
解釈が間違えてたらごめん。
TOKEN :
{
<ALL: (~["{","}"])+>
}
void Input() : {} {
foo()
}
void foo() : {
String s;
} {
( LOOKAHEAD(2) "{" ( foo() )* "}" )+
| (s = getAll() { System.out.println(s); } )
}
String getAll() : {
Token t;
} {
t = <ALL>
{ return t.image; }
}
189:179
02/08/27 21:58
ありがとうございます。参考にします。
190:デフォルトの名無しさん
02/08/28 05:15
パスカルやCはLL?LR?どっちを使ってるの?最近のはやいコンパイラは
みんなLRかな?
191:デフォルトの名無しさん
02/08/28 09:24
最近のflexはスレッドセーフなCコードを吐くようになったのか。
%option reentrant
192:デフォルトの名無しさん
02/08/28 10:06
>>182のリンクはいいリンクだ
193:デフォルトの名無しさん
02/08/28 10:13
>>190
パスカルはLL(1)じゃないの?
194:デフォルトの名無しさん
02/08/28 10:58
PascalはLL(1)でもパースできるように設計されているだけであって、
コンパイラがどうしているかは別。
195:棄教者 ◆witdLTi2
02/08/28 13:04
>>182のリンク先にあるコンパイラのソースコードの解説、
これってWEBを使って吐き出されたのかなぁ。
スレとは関係ないのでsage
そういえば TeX とか WEB とか Knuth なスレってあったっけ?
196:デフォルトの名無しさん
02/08/28 13:41
Texスレはなぜかビジネスソフト板で見たような気がする。
Knuthスレはないんじゃないかな?
>>182のリンク先にある
URLリンク(www.hayalab.cs.ritsumei.ac.jp)
の元のコードってどこにあるの?ないぞ
197:デフォルトの名無しさん
02/08/28 16:32
knuthが作ったWEB言語って何?気になるんだけど
198:デフォルトの名無しさん
02/08/28 22:53
>>197
Knuthが提唱した文芸的プログラミングの実装、かな?
ドキュメントの中にソースコードを埋め込む形を取ることで、ソースとドキュメントの
間の不整合や、ドキュメント無きコーディングを避けるっていうものらしい。
コンパイルのためにはドキュメントの中からソースを抜き出してコンパイラに渡す
プログラムが必要になる。
で、Knuth自身が作った、TeXドキュメントからPascalプログラムを抜き出してコンパイルする
システムがWEBシステムの筈。
詳しくは
URLリンク(www.google.com)
でも見れ。
199:デフォルトの名無しさん
02/08/28 22:54
>>195
TeX総合スレ@数学板
スレリンク(math板)
200:棄教者 ◆witdLTi2
02/09/02 13:04
>>111
原田本を今読んでいるところですが、気になった箇所があるので皆さんにお伺いします。
p.164下から11行目
> $p_m$ にアドレス $m+n$ の領域を割り付ける.
とあるのは
> $v_m$ にアドレス $m+n$ の領域を割り付ける.
ではないでしょうか。
ちなみに正誤表
URLリンク(www.hara.cs.keio.ac.jp)
で確認したところ、掲載されていませんでした。
いきなり原田先生にメールして自分が間違っていたら恥ずかしいので、
2CHのハッカーの皆さんに確認してからメールをしようと思います。
201:棄教者 ◆witdLTi2
02/09/02 13:04
テユーカ200get
202:棄教者 ◆witdLTi2
02/09/02 16:12
>>182
p.15 の BNF の説明
> Backus Nauer Form Backus Nauer Form (BNF) では、....
って the Jargon File には
Backus-Naur Form / Backus Normal Form って書いてあるんですけど。。。
Nauer って who?
203:デフォルトの名無しさん
02/09/02 16:33
ドイツ語綴り->Nauer
英語綴り->Naur
だったと思う。
204:棄教者 ◆witdLTi2
02/09/02 17:15
グーグルすると
backus naur form で日本語限定だと213件, 言語非限定だと約20700件ヒット。
backus nauer form で日本語限定だと9件, 言語非限定だと253件ヒット。
おまけに「スペリング修正候補 backus <b>naur</b> form」として修正を勧告される。
205:棄教者 ◆witdLTi2
02/09/02 17:16
×backus naur form で日本語限定だと213件
○backus naur form で日本語限定だと215件
206:デフォルトの名無しさん
02/09/03 21:12
インタープリタの仮想機械に興味を持ち、調べています。
調べてみた JVM、CRI、Python はいずれもスタックマシンのようでしたが、レ
ジスタマシンと比較して何かメリットがあるのでしょうか。
207:デフォルトの名無しさん
02/09/03 22:29
Forthハッカーの伝統。
というのは半分冗談だけど、中間コードが簡単/短くできるからじゃないんですか。
コンパイラも作りやすいし。
208:デフォルトの名無しさん
02/09/04 00:53
詳しくは知らんけど、インタープリタの仮想機械では、
レジスタのアクセスがメモリをアクセスするのと同じ。
パイプラインとかハードウェアで実装する場合の利点が
いかせられないからだと思う。
209:
02/09/04 02:05
>>206
仮想マシンで最もコストが高いのが、コードのフェッチとデコード。
スタックマシンなら、コードも短いしオペランドも要らない。
210:デフォルトの名無しさん
02/09/04 11:34
>>207-209
ありがとうございました。
まとめると、ネイティブコードまでコンパイルするのでなければ、レジスタマ
シンでも結局はメモリへのアクセスを行うことになるので、スタックマシンに
対する利点はなく、むしろコードが短くなる分だけスタックマシンの方が速度
的に有利、というところですかね。
211:ろうひ男爵
02/09/04 12:20
>>210
たしかに、
ネイティブコードへ最適化する場合、レジスタマシンの方が有利ですよね。
広域レジスタとローカルレジスタを割り当てたりした方が最適化しやすいですからね。
一方、インタプリタの場合、おっしゃるとおり
レジスタマシンと言っても結局メモリアクセスされるので、
スタックマシンに対するメリットはないですね。
それだったら、簡単に設計でき、
なおかつコードが短くなるスタックマシンの方が有利でしょう。
自分的には出力されたコードがレジスタマシンの方が読みやすいので、
レジスタマシンを使ってます。(インタプリタですが)
212:デフォルトの名無しさん
02/09/04 14:39
つーかJITコンパイル等でチューニングを詰めていくと
結局どっちも速度的に大差ないという話。
213:デフォルトの名無しさん
02/09/04 21:04
スタックの一部をレジスタにマップする最適化は比較的簡単だから
ネイティブコードでも結構速くなる。
ネイティブコードのみをがりがりチューニングしたければ、中間コードは
3つ組や4つ組がわかりやすいかも。
214:デフォルトの名無しさん
02/09/05 10:00
インタープリタの初歩なら、石田晴久訳のUNIXプログラミング環境の
後半のhocを一通りやってみるのが近道じゃないかな。
215:デフォルトの名無しさん
02/09/05 14:22
スタックマシンでのコンパイルがよくわからない〜
216:デフォルトの名無しさん
02/09/06 01:30
ちとスレ違いですが、JITの勉強にお勧めの良書教えてくれませんか?
217:デフォルトの名無しさん
02/09/06 02:16
>>216
詳しくはないけど、良書どうこういうより、
JITについて書かれている本を探すの自体が大変だと思う。
一応、参考URLを貼り付けておく。
shuJIT
URLリンク(www.shudo.net)
218:デフォルトの名無しさん
02/09/07 15:01
コンパイラの理論と実現ではC--という小さなCの処理系を作ってるけど
それのソースコードがわけわからんとです。
構文木の構造体が
struct TREE{
int val;
struct TREE *left;
struct TREE *right;
}
で、
maketree(int a,TREE *b,TREE *c)という関数で構文木を作るんですが、
あるところでmaketree関数のパラメータのbにint型を渡してるんです。
型が合わないからエラーがでると思うのですが、なにか僕が大きな間違いをしてるんでしょうか
219:デフォルトの名無しさん
02/09/07 19:27
>>218
sizeof(int) == sizeof(void*) を仮定していて、
int の即値を格納しようとしているとか?
220:218
02/09/08 11:15
>>219
構文木関係の部分だけ抜き出してコンパイルしてみると、
BCCではエラーがでました(TREE *型にint型は渡せない。と言っておられました)、
clは警告文だけでした。それにちゃんと動きました。
うーむ、やはり即値を渡しているのか。。。
221:デフォルトの名無しさん
02/09/09 17:06
>>218
宣言してない関数の戻り値をそのまま渡してるとか?
それかNULL代わりに0渡してるんじゃない?
こんなんだったらどっちでも昔の名残だね。
222:218
02/09/09 21:26
>>221
なにしろANSIで定められる前のCなので古めかしいところは多いです
たとえば、
func(a,b){
int a;
int b;
}
とか。。。
それと、bには字句解析で得たリテラルを渡してるようです
(TREE *)にキャストしてやることで問題は回避できました。
223:デフォルトの名無しさん
02/09/11 23:39
>>222
それを書くなら、こうだろう。
func(a, b)
int a;
int b;
{
...
}
> それと、bには字句解析で得たリテラルを渡してるようです
正攻法としては union 使うように書き換えちゃえ、かな。
224:デフォルトの名無しさん
02/09/21 12:17
LALR(K)パーサジェネレータのお勧めってありますか?
googleでlalr(k)てしたところいくつか見つかったのですが。
225:デフォルトの名無しさん
02/09/21 13:28
>>224
yacc以外でってこと?
といっても他はyaccの他言語用ぐらいしかしらないけど。
226:デフォルトの名無しさん
02/09/21 14:09
>>225
いやそうでなく k >= 2 という意味でお願いします。
227:デフォルトの名無しさん
02/09/22 19:47
URLリンク(www.cminusminus.org)
これはよいです。
228:デフォルトの名無しさん
02/09/25 09:46
>>227
面白そうですね
簡単に説明してもらえませんか?
229:
02/09/25 10:05
>>228
自分で読む気はないのか?
230:デフォルトの名無しさん
02/09/25 11:26
Cより低級な、簡単なアセンブラとしてのC--ってことでは?
231:デフォルトの名無しさん
02/09/25 21:44
氷魚さんの作ったやつ?
232:デフォルトの名無しさん
02/09/25 22:01
>>231
だれそれ?電波固定?
233:デフォルトの名無しさん
02/09/25 22:09
コンパイラとかじゃなく、ファイルを読む道具としてyacc&lexを
使っているのですが、入力した数値で要素数が定義されてるよう
な場合どうしたらよいでしょうか?
要素数 - 要素...
4 4 4 2 2
5 0 1 0 2 3
2 0 3
という形式です。
int_array
: /* empty */
| integer
| int_array integer
;
では、全部一気に読んでしまうので・・・。(低レベルでスマン・・・。)
234:デフォルトの名無しさん
02/09/26 03:13
>>233
int_array
: /* empty */
| one integer
| two integer integer
| three integer integer integer
(略)
;
とするとか…
イヤスギ
235:デフォルトの名無しさん
02/09/26 03:43
int_list: /* カラ */
| integer
| int_list integer
;
int_array: integer int_list
;
ダメか?
236:棄教者 ◆KIKYO7cg
02/09/26 08:48
-----------------yacc------------
%token NUM
%%
lines : /* empty */
| line lines
;
line : index elements '\n' ;
index : number ;
elements : /* empty */
| number elements
;
number : NUM ;
%%
------------------lex-------------
[0-9]+ { yylval = atoi( yytext ); return NUM; }
[ \t] { /* 空白は捨てる */ }
でどうよ。
237:233
02/09/27 01:01
レス下さった方々ありがとうございます。
>>234
ちょっと無理です・・・。^^;
>>235
最初の要素は良いのですが残りはすべてint_list integerに一致して
しまうようです。
>>236
233の例では行けると思いますが、実はこの形式を出力するツールは
一つではなくて、それらの間で改行の位置というのは統一されていな
いのです。というわけで、できれば改行フリーでなんとかしたいと
思ってるのですが・・・。
うーん、そもそも読み込んだ値を利用したり、繰り返しの回数を制限
するのはyaccで定義できる構文の概念を逸脱しているんでしょうか・
・・。 今回はyaccの使用はやめてlexだけに留めるべきかもしれませ
んね。(その辺ご存知の方いましたら後学のため教えていただきたい
です。)
238:デフォルトの名無しさん
02/09/27 01:04
>>237
atoiでいいじゃん。
「何回繰り返す」とかはセマンティクスの部類に入るから、
yacc使うのはお門違い。
239:デフォルトの名無しさん
02/09/27 01:09
>>237
ドラゴンブックにはそういうの(個数の検査とか)は構文では解決でけん
と書いてあった気がします。
240:デフォルトの名無しさん
02/09/27 01:19
>>233
正攻法は単に数値のリストとして、リストに含まれる文字コードチェックに
利用を限ってしまうのがいいんじゃないかな?
考えてみるのは面白そうだけど、
仕事となると、むきになってやっても費用対効果がなさそうだし・・・
241:デフォルトの名無しさん
02/09/27 22:01
ギコBasic新しく作り直してみた
URLリンク(page.freett.com)
242:241
02/10/01 09:30
まだギコBasicのスレが残ってるのに気づかなかった・・・スマソ
243:デフォルトの名無しさん
02/10/17 18:25
ANTLRの使い方を日本語で解説してあるウェブページありませんか?
244:デフォルトの名無しさん
02/10/19 07:54
ガイツュシ
245:デフォルトの名無しさん
02/10/19 21:12
STLスレから出張。
これ URLリンク(spirit.sourceforge.net) どうなん?
246:デフォルトの名無しさん
02/10/19 23:06
>>245
すげー。びびった。久々に驚嘆したハックだ。
247:デフォルトの名無しさん
02/11/05 22:08
ふふ
248:デフォルトの名無しさん
02/11/07 02:31
以下のような構文を作ります。データを定義しているフォーマットです。xmlとかcvsみたいな物です。
ここから木の様に情報を取り出したいと思ったのですが、上手くパーサを作れません。
tokenizerは簡単に出来るのですが、どうすれば良いですか。rubyでやってます。
object hoge
caption='hogehoge'
val=0
object fuga
caption='fugafuga'
object aaa
caption='aaa'
end
object bbb
caption='bbb'
end
object ccc
caption='ccc'
end
end
end
249:ねこま
02/11/07 02:39
インデントレベルだけで解釈できれば簡単そう
250:デフォルトの名無しさん
02/11/07 02:46
トラバースと逆の手順。
各ノードは子供と親のリンクを持つ。
<でノードを生成、現在処理中のノードへの参照を
親への参照として新規ノードへ設定。
その後で親に子として新規ノードへの参照を設定。
処理中のノードの参照として新規ノードを指させる。
>でシングルタグか開始タグか終了タグかを判断し
親に戻るかどうかを決める。
戻る時には処理中のノードの参照として
親を指させる。
こっちにドキュメントを置いてます。
サンプルソースはC++。
ソース玉は整理してないんで乱雑にメモテキストとか
テストデータが散らかっててちょっと気が引ける。
URLリンク(sourceforge.jp)
こういうドキュメントが欲しいとか
掲示板に投げておけばそのうち対処するかも。
251:デフォルトの名無しさん
02/11/07 02:55
>>248
rubyじゃできないな。
252:デフォルトの名無しさん
02/11/07 03:22
手抜き実装で考え方だけ。言語も適当。
loop
token w = Tokenizer.next();
if w == 'object' then
currNode := currNode.pushNewNode( Tokenizer.next());
continue;
end if
if w == 'end' then
currNode := currNode.parent();
if currNode is null then break;
continue;
end if
Tokenizer.skip();
currNode.pushNamedValue( w, Tokenizer.next());
end loop
Node というクラスはツリーのノードを表す。
各ノードは子ノードとして、object か namedValue を持つことができる。
pushNewNode は object 子ノードとして追加して、その新規子ノードを返す。
引数はノードの名前を表す。
pushNamedValue は namedValue 子ノードとして追加する。戻り値はなし。
第一引数は値の名前、第二引数は値の中身。
253:デフォルトの名無しさん
02/11/07 04:33
今ちょっと色々調べてたんですけど、色々とヒント有り難うございます。
一週間前にはかけらすらないような事趣味でやり始めて分かったんですが構造を持つ
ファイルフォーマットってコンパイラ作成のような視点が必要なんですね。
さすがにインデントでは無理だってすぐ分かりましたが、xmlに近いことは
気づきませんでした。そう言えばxmlと似てますね。
内部データ構造を持つファイルフォーマットのパーサーの解説の一般的なドキュメント
希望>250
254:デフォルトの名無しさん
02/11/07 07:52
schemeで書くとこんな感じなんだが
(define (hoge-read s)
(let loop ((x s) (stack '()))
(if (pair? x)
(case (car x)
((object)
(loop (cddr x) (cons (list (cadr x) (car x)) stack)))
((end)
(if (null? stack)
(error "Syntax-error - Corresponding 'object' is required :"
s))
(if (pair? (cdr stack))
(loop (cdr x)
(cons
(cons (reverse (car stack)) (cadr stack))
(cddr stack)))
(loop (cdr x) (reverse (car stack)))))
(else
(loop (cdddr x)
(cons
(cons (list (car x) (caddr x)) (car stack))
(cdr stack)))))
(if (and (pair? stack) (pair? (car stack)))
(error "Syntax-error - 'end' is required :" s)
stack))))
255:デフォルトの名無しさん
02/11/07 07:52
;テスト
(define hoge-read-test-data '(
object hoge
caption = "hogehoge"
val = 0
object fuga
caption = "fugafuga"
object aaa
caption = "aaa"
end
object bbb
caption = "bbb"
end
object ccc
caption = "ccc"
end
end
end
))
(hoge-read read-tag-test-data)
=>
(object
hoge
(caption "hogehoge")
(val 0)
(object
fuga
(caption "fugafuga")
(object aaa (caption "aaa"))
(object bbb (caption "bbb"))
(object ccc (caption "ccc"))))
256:デフォルトの名無しさん
02/11/07 08:20
(中身的に変んないけど)Cに変換すると
scmobj_t hoge_read(scmobj_t s) {
scmobj_t x = s;
scmobj_t stack = nil;
tail_recursive_loop:
if (pairp(x)) {
if (car(x) == make_symbol("object")) {
stack = cons(list2(cadr(x),car(x)),stack);
x = cddr(x);
goto tail_recursive_loop;
} else if (car(x) == make_symbol("end")) {
if (nullp(stack))
return error("Syntax-error - Corresponding 'object' is required :",s);
if (pairp(cdr(stack))) {
x = cdr(x);
stack = cons(cons(reverse(car(stack)),cadr(stack)),cddr(stack));
goto tail_recursive_loop;
} else {
x = cdr(x);
stack = reverse(car(stack));
goto tail_recursive_loop;
}
} else {
stack = cons(cons(list2(car(x),caddr(x)),car(stack)),cdr(stack));
x = cdddr(x);
goto tail_recursive_loop;
}
} else if (pairp(stack) && pairp(car(stack)))
return error("Syntax-error - 'end' is required :",s);
return stack;
}
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4934日前に更新/200 KB
担当:undef