2005-06-06 PDFBOXのソース見るの飽きた 卒研 もうPDFのテキスト化はXPDFのPDFtoTEXTをJavaからコマンドで呼び出すことにしますた。 これで次は形態素解析について考えることができる。 形態素解析もFREEのがあったらそれを使って解析するつもりっす。あとはWikipediaをデータベースにいれる形式でダウンロードできるらしいから 中身をみて使えるかどうか調べる予定