Lucene調査中

ワーカホリックかもしれない自分は、プロジェクトターゲットで使用しているNamazuのドキュメントハンドリングの面倒を解決するために、他の全文検索エンジンを探してみた。
ちょっと古いらしいが、日本語全文検索エンジンソフトウェアのリストなんてものを見つける。Luceneってのが、Javaネイティブだし、文書単独で追加削除も可能だから、今回の目的にぴったりな気がする。とりあえず問題となりそうなのは日本語ハンドリングの難なのだが、Senという、ChaSenJavaで実装したような形態素解析エンジンがあって、それを組み合わせれば問題ない様である。つうことで月曜日に提案書書くかな。
にしても、未だに対応ソフトウェアが、TurboLinux6.5、Apache1.3.26ってのは止めてほしいな。対応するTomcatは4.1.30になったことだし、せめてTurboLinux10、Apache1.3.29にして欲しいところ。