tDiaryのHTMLを分割するスクリプト
ほとんどHTreeを使う練習のようになってしまったが、divのclassとかを見るようにできたし、そこそこまともになった。今のところdiv.section、div.comment、div.trackbackbodyを切り出している。脚注はリンク元のdiv.sectionのためのファイルに入れるようにしたけど、検索結果のリンク先を考えると、脚注も別のファイルになるようにしたほうが良いのかもしれない。
追記(2004-07-13): もっとスマートなやり方はありそうだけど、まあだいたい動いているのでこれで良いことにする。作ったスリプトはこれ → split_tdiary.rb(そのうち消えるかも)。