読者です 読者をやめる 読者になる 読者になる

nokogiriとMechanizeでスクレイピングその2

Ruby

前回の続き
nokogiriとMechanizeでスクレイピングその1 - moyashidaisuke's diary


文字コードをちゃんと設定してないせいか、\nがたくさん出てる。=>gsubで無理やり置換しました。

now_updated = div.inner_text.gsub('\n', '')


class指定で取得するときに、div.class の形式だと部分一致で取れる。
div[@class="class"] だと完全一致になる。
Nokogiri の基本(翻訳版)


スクレイピングスクリプト自体はほぼこれで完成。
残りは、サーバーにのっけて定期的に実行し、どこか(メールとかTwitterとか)に連携する。