だめな人の前をメザシを持って移動中
だめな人の前をメザシを持って移動中のDVDが出てる。昨年くやしい思いをしたやつ。この前WOWOWで再放送していたのとは内容に違いがあるのだろうか。
MM/Memo
tdiary.ishinao.netを読んで、そうかもなあと思いMM/Memoを使いはじめた。
よく使うフレーズ
丁稚な日々を読んで「自分マイニング」してみたのだけど短い語ばかり(「ソフトウェア」とか「たのだけど、」とか :-)でなんとなくいまいち。形態素解析して文節区切りにすると違った結果になるかなと思ってやってみた。
検索してCaboChaを見付け、そこからたどってYamCha、TinySVMといったソフトウェアをインストールする。
実際にやってみると文節だとまだ短くて、というかやはりそれだけでは面白い結果にはならず、たとえば「この」とか「その」とかが上位にくる。もともとCaboChaは係受けを見付けてくれるソフトウェアなので、その辺の情報からうまく文を切り分けると良いのかなと考えてはみたが、パパッとできることではなさそうなので断念。
替わりに分割された文節を二つとか三つとか繋げてカウントしてみた。
そうした結果を見ると堂々のトップは「end」……というのはおいといて、文節三つでカウントした結果は定形文ばかりでイマイチだったが、文節二つの結果だと「ことにした」「いうこと(で|に)」「今のところ」「そういえば」「ことができる」「ことになる」「ここのところ」「思う」「気になる」がトップ10、これに「よくある」「気がする」などと続くのが見てとれる。これは自分にとっては少しばかり面白い結果だ。
そこでもう一度、文節一つの結果を見直してみると「ことが」「ことに」「ことを」がそろって上位にきていることが分かる。これはちょっと注意すべきかもしれない。「ちょっと」も同様に上位にあったりする。そうしてみると「自分マイニング」の結果で出てきた「たのだけど」も要注意であろうか。
この種のことを行う便利ツールがあると面白そうだが……というとやはり某氏の顔が思い浮かぶ。まあ、何かありそうではあるが。
JLC Diary
佐渡秀治のOSSジャーナルによるとJLC Diaryが正式にオープンとのこと。mhattaさんの八田真行のスクラップブック(β版)だけでなくまつもとさんのMatz日記(linux.com分室)がある。


