nokogiriとMechanizeでスクレイピングその2
前回の続き
nokogiriとMechanizeでスクレイピングその1 - moyashidaisuke's diary
文字コードをちゃんと設定してないせいか、\nがたくさん出てる。=>gsubで無理やり置換しました。
now_updated = div.inner_text.gsub('\n', '')
class指定で取得するときに、div.class の形式だと部分一致で取れる。
div[@class="class"] だと完全一致になる。
http://www.engineyard.co.jp/blog/2012/getting-started-with-nokogiri/
スクレイピングのスクリプト自体はほぼこれで完成。
残りは、サーバーにのっけて定期的に実行し、どこか(メールとかTwitterとか)に連携する。