LUCENE搜索算法剖析及优化研究
作者:
任树怀
上海外国语大学图书馆
上海200083
关键词:
Lucene
搜索算法
向量空间模型
TF-IDF
离散随机最优化
摘要:
介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径。并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能。
上一篇:基于动态数据的经济学领域研究热点分析
下一篇:基于ERU的图书馆用户信息行为数据采集方法研究——以复旦大学图书馆为例