namazuとか使わずに高速に検索する方法ってないかな?
perlで一個ずつファイルを開いて正規表現ってやってると、
多分、IO周りでやたら遅くなりそうなんだよね。
(まだ試してないからわからんけど)
かといって、メタ情報をどっかに持たせてなんて器用なことできんしなぁ。
そもそも、mecabもchasenも使えないから、それすらも自前になるが・・・
(それがコンパクトで自前に作成できるなら研究者がやれると思う)
全ファイルをくっつけて適当に正規表現で検索かなぁ・・・
なんかスマートじゃないなぁ・・・
No comments:
Post a Comment