- 532 名前:デフォルトの名無しさん mailto:sage [2008/02/03(日) 12:37:16 ]
- 本の感想サイトから書名とレビューを抜き出して表示するプログラムを作るとします。
表示は「とにかく一覧として表示されればいい(新着が存在することを明示しなくていい)」とします。 昨日抽出したとある本のデータのハッシュは以下の通りでした。PStoreで保存します。 book = {'title'=>書籍名, '著者'=>著者名, 'review'=>['面白かった。','まあまあだと思った。']} で、今日アクセスしてHTMLをスキャンした結果が today = {'title'=>書籍名, '著者'=>著者名, 'review'=>['面白かった。','まあまあだと思った。']} という、昨日と中身同じな未更新の内容でした。相手のHTMLには最終更新日などの情報はありません。 1) ハッシュの上書きの特徴を利用し、強制的にbook.update(today)してbookを今日の結果として表示させる 2) reviewの中身を比較して違いがあった場合のみbook.update(today)とかしてbookを表示する 2通りの手段があると思うんですが、2ってもしかして比較に時間かかったりしますか。 プログラム的には「差分が存在した場合のみ変数を更新」というのがいいような気はするんですが。 サイトから抜き出した要素がある日突然減ってることはありません(今日はtitleが無いとか)。
|

|