コメントspamフィルタ

投稿者 akira 2004-09-23 15:00:00 GMT

いやな日記のコードをそのままいただいた。次に何かあったときにでもno_referer2を参照するようにしてみよう。

tDiaryのHTMLを分割するスクリプト

投稿者 akira 2004-07-11 15:00:00 GMT

ほとんどHTreeを使う練習のようになってしまったが、divのclassとかを見るようにできたし、そこそこまともになった。今のところdiv.section、div.comment、div.trackbackbodyを切り出している。脚注はリンク元のdiv.sectionのためのファイルに入れるようにしたけど、検索結果のリンク先を考えると、脚注も別のファイルになるようにしたほうが良いのかもしれない。

追記(2004-07-13): もっとスマートなやり方はありそうだけど、まあだいたい動いているのでこれで良いことにする。作ったスリプトはこれ → split_tdiary.rb(そのうち消えるかも)。

makerss.rbとtdiary_style.rb

投稿者 akira 2004-07-10 15:02:00 GMT

RDFの出力がきれいになるようなのでCVSからmakerss.rb(Revision: 1.13)とtdiary/tdiary_style.rb(Revision: 1.7)を取り出して2.0.0の環境に上書きしてみた。良さげ。

Estraier + tDiary 2

投稿者 akira 2004-07-10 15:00:00 GMT

昨日の続き。

tDiaryがはくHTMLをHTreeに食わせて、本文、ツッコミ、トラックバックに分けた形でHTMLを再生成するスクリプトを書いた。で、それをEstraierに食わせてインデックスを作るようにしてみた。こうするとセクションごとにマッチするので、多分、より分かりやすい結果になるのじゃなかろうかと。

おおむね良好に動いているのだが、どうも検索結果の件数がマッチした断片を含む日の日記から分割されたファイルの数でカウントされてしまうみたいで、実際よりも大きな数値が表示される*1。うーん、なんでだろ。

追記: よく考えるとsqueezeプラグイン(のようなの)であらかじめ分割されたHTMLを生成できたほうが楽そうだし確実そう。squeezeプラグインを見るとパッとは理解できなそうなんだけど、そういうことって簡単にできるものなんだろうか。

追記(2004-07-12): カウントが違ってしまう件は、どうやら生のHTMLファイルと分割後のHTMLファイルの同期がうまくとれていなかったためのようで、インデックスの更新をかけると現象が出なくなった。

*1 たとえば検索の結果、ある日の日記のツッコミ部分がひっかかったする。そして、その日の日記が本文二つ、ツッコミ、トラックバックから構成されていたとすると、前述のスクリプトで分割した後のファイル数は四つになる。このとき、検索結果として表示されるのは一つのエントリだけなのだが、なぜか検索結果に表示されるカウントは四になってしまう。

tDiary 2.0.0

投稿者 akira 2004-06-26 15:00:00 GMT

バージョンアップしてみる。

makerssプラグイン 1

投稿者 akira 2004-06-14 15:00:00 GMT

新しく作られたRDF出力プラグイン。Anonymous CVSでも取れるようになったので早速使ってみる。

output_rdfについてはWikiStyleとかでうまく動かないという話をちょくちょく聞いたのだけど、makerssだとどうだろうか。

tb.rb置き忘れ

投稿者 akira 2004-06-13 15:00:00 GMT

いつだったかtDiaryをバージョンアップしたときにtb.rbを置き忘れていたらしく、しばらくtrackbackできない状態だったみたい。

ping.rb

投稿者 akira 2004-06-08 15:00:00 GMT

ただのにっきを見て入れてみた。

tDiary 1.5.7とカテゴリキャッシュ

投稿者 akira 2004-05-13 15:00:00 GMT

ちょっと出遅れたがtDiaryを更新してみた。カテゴリまわりがかなり使い易くなっている。

が、キャッシュの関係で過去の日記に含まれるカテゴリ表示されない。日記を更新するたびにキャッシュが更新されるらしいことはすぐわかったが、すべての日記をいちいち更新していくのもなんだなあとgoogleにたよったところ今日のなんでやねんを経由してふぇみにん日記へ。解決。

tdiary.vim

投稿者 akira 2004-02-03 15:00:00 GMT

使ってみた。良さげ。

basic認証以外の設定にしているときには~/.curlrcに認証まわりのオプションを書いておくと良いのかな。