12

现在的位置:首页 > 杂志导读 > 2014 > 12 >

LUCENE搜索算法剖析及优化研究

作者: 任树怀    上海外国语大学图书馆 上海200083

关键词: Lucene 搜索算法 向量空间模型 TF-IDF 离散随机最优化

摘要:

介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径。并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能。

上一篇:基于动态数据的经济学领域研究热点分析
下一篇:基于ERU的图书馆用户信息行为数据采集方法研究——以复旦大学图书馆为例

版权所有 ©《图书馆杂志》编辑部  沪ICP备05008872号