基于自动标引的自然语言检索方法研究

学会简介

/ Society

上海市图书馆学会是依法登记成立的由本市图书馆工作者，支持本学会工作的科研、教学、生产、设计等各类图书馆、情报信息机构以及相关企事 ...

学会动态

/ Dynamic

学术交流

/ Communication

06

现在的位置：首页 > 杂志导读 > 2016 > 06 >

作者: 王丹杨晓蓉马健中国农业科学院农业信息研究所农业部农业信息服务技术重点实验室

关键词: 转换、自动赋予标引词的主题词、同义词、近义词、相关词和网罗词完成标引词的概念控制自动标引的一般方法有基于字符串匹配的分词方法基于理解的分词方法和基于统计的分词方法基于字符串匹配的分词方法是按照一定的策略将待分析的汉字串与词典中的词条进行匹配匹配成功则给出一个标引词按照扫描方向的不同可分为正向匹配和逆向匹配按照不同长度优先匹配的不自动标引自然语言检索方法

摘要：

自从自然语言进入计算机检索系统以来,就因其不受不同职业、不同知识背景、不同检索经验的影响等特点受到终端用户的青睐。由于中文文献的标题是中文文献内容的集中体现,它反映了文献的中心思想。本文介绍的自然语言检索方法,限定在文献标题层面进行主题标引。该方法的基本思想是用自动标引方法分别对检索系统中数据库的文献标题和用于检索的自然语言进行自动赋词标引,对给定的关键词进行概念控制,即词义转换,形成最终标引词;然后,用向量空间模型对数据库的索引数据进行＂或＂运算检索,形成命中文献集合B,对B集合中的每篇文献标题再进行自动标引,形成的标引词与用于检索的自然语言标引词进行相似度计算,根据B集合中的每篇文献的相似度进行排序,把最符合检索要求的文献最先呈现给用户。此方法是一种简便、实用的自然语言检索方法。

上一篇：利用WeiPHP开源框架实现微信图书馆
下一篇：小世界理论研究的可视化分析

学会简介

学会动态

学术交流

06

基于自动标引的自然语言检索方法研究

作者: 王丹 杨晓蓉 马健 中国农业科学院农业信息研究所 农业部农业信息服务技术重点实验室

摘要：

作者: 王丹杨晓蓉马健中国农业科学院农业信息研究所农业部农业信息服务技术重点实验室