利用Lucene MoreLikeThis 实现“相关你可能感兴趣的”推荐栏

MoreLikeThis是Lucene的一个相似搜索组件。
用它可以很简单的实现“相似推荐”栏功能,如 用户浏览一本书,下方(或右侧)推荐用户 书名、作者或关键字 相似的其他书籍。

事例代码如下:

首先,列出所有书籍,然后逐一打印每一本书的“相似图书”列表

public class MoreLikeThis {
	public static void main(String[] args) throws Throwable {
		String indexDir = System.getProperty("index.dir");
		FSDirectory directory = FSDirectory.open(new File(indexDir));
		IndexReader reader = IndexReader.open(directory);
		IndexSearcher searcher = new IndexSearcher(reader); // 为相似搜索准备的searcher
		int numDocs = reader.maxDoc(); // 所有图书
		MoreLikeThis mlt = new MoreLikeThis(reader); // 相似搜索组件登场
		mlt.setFieldNames(new String[] { "title", "author" }); // 找“标题”和“作者”相似的
		mlt.setMinTermFreq(1); // 默认值是2,建议自己做限制,否则可能查不出结果
		mlt.setMinDocFreq(1); // 默认值是5,建议自己做限制,否则可能查不出结果
		for (int docID = 0; docID < numDocs; docID++) {
			System.out.println();
			Document doc = reader.document(docID); // 逐一过所有图书
			System.out.println(doc.get("title"));
			Query query = mlt.like(docID); // 准备相似搜索了
			System.out.println(" query=" + query);
			TopDocs similarDocs = searcher.search(query, 10); // 开搜,做多10个结果
			if (similarDocs.totalHits == 0)
				System.out.println(" None like this"); // 只要结果不为空,就按这个打印出来
			for (int i = 0; i < similarDocs.scoreDocs.length; i++) {
				if (similarDocs.scoreDocs[i].doc != docID) { // 记着把自己排除掉哦
					doc = reader.document(similarDocs.scoreDocs[i].doc);
					System.out.println(" -> " + doc.getField("title").stringValue());
				}
			}
		}
		searcher.close();
		reader.close();
		directory.close();
	}
}

猜你喜欢

转载自tonylian.iteye.com/blog/1935138
今日推荐