基于词袋模型的关联数据融合算法改进研究
作者:
田野
张静蓓
上海财经大学
上海外国语大学图书馆
关键词:
词袋模型
BOW
关联数据融合
实体链接
实体消歧
摘要:
词袋模型是一种最原始且普遍适用的关联数据融合算法,但是该算法中关键词匹配未利用自身语义以及语料库不足等现象,造成实体链接准确率不高。本文提出使用知识库作为背景,利用语义扩展和循环迭代来增强实体消歧的速度和准确率。该算法分为两个过程,首先对关联数据集进行初步的语义融合,然后在此基础上,利用本文提出的语义循环迭代词袋(s-i-BoW)算法实现实体的消歧与链接。实验通过与基于传统词袋算法的关联数据融合进行了对比,证明了本文提出的语义循环迭代词袋算法具备更优的关联数据融合效果。
上一篇:区域性公共图书馆联盟建设思考——以“中三角”(湘鄂赣皖)公共图书馆联盟为例
下一篇:巴克兰德的图书情报学思想及其主要贡献