admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:把文字转换成语音)

文摘索引型数据库和全文数据库区别

文摘索引型数据库和全文数据库的最大差别就是前者结果只提供题录和文摘等二次文

献信息,后者除可提供二次文献信息外,还能提供作者原文的一次文献信息。

1检索途径存在着差异

检索途径存有主题、分类及除此之外的作者、号码等其它辅助途径,通过数据库设置

的检索字段充分反映检索途径的同时实现。相同的数据库根据检索的实际须要设置检索字

段。

全文数据库设置的检索字段一般较文摘索引型数据库少,如springer-link只设全文、

文摘、作者、题名4个检索字段。有些全文数据所设字段如出版物日期只是起限制检索结

果的作用,不具备真正的检索意义。文摘索引型数据库设置检索的字段较多,且每个字段的

检索能在命令检索指令中独立执行。文摘索引型数据库由于收录的文献众多,一般不采用

简单的浏览途径。有的数据库提供分类途径,但其分类一般遵循全景式的细致的学科等级

体系,较之全文数据库的浏览分类导航系统严谨。

2收录于文献的原则和目的相同,数据库拉艾的促进作用相同

全文数据库以为用户提供利用一次文献为主要宗旨,其数据库商必须和著者或出版单

位商谈著作使用权问题,只有双方达成协议签署合同,并履约支付著作权报酬才能使用文献

原文而收录数据库。

3检索技术的运用不尽相同3.1检索原理的相同

文摘索引型数据库是以记录组织文献,处理每一条记录依据基于文献内容的特征属性

和文献外表的特征,如题名、主题词、作者等等。它们构成了记录的一个个字段,是

典型的结构化的线性的数据,模式直观,不易处置,彰显传统的布尔检索、截词检索和边

线检索等功能。

全文数据库主要通过运用对整个文本信息的分析,利用将全部文本划分为主题紧凑的

不同子段,用不同的关键字特征标注各子段的文本切分技术和计算机自动进行全文自动抽

词标引来处理原始文献的。全文检索技术能体现关键词在子段和全文出现的频率和分布,

处理的是典型的非结构化的非线性的数据。

3.2主题检索特征相同

文摘索引型数据库在提供自然语言的同时,一般都有自己的主题词表反映数据库中各

检索词之间的关系,依据主题词表对文献进行主题标引,对每篇文献给出若干个主题词。数

据库提供自然语言检索的同时,也提供规范的在线主题词表让用户选择,以便准确全面地检

索出所需信息。虽然具体检索实施时,也存在各种不理想的问题,但相比只提供自然语言检

索应是一进步。

全文数据库通常没自己的主题词表,主题检索靠不提规范的自然语言同时实现。采用

自然语言主要就是基于检索最终用户的大众化,最小好处就是防止了人工标引的随意性、

繁杂性,提升了处置数据的效率,节约了成本。但其实质上就是把检索词和数据库文献中的

关键词或撷取文献的标题、全文展开直观字型上的对照相匹配,有的全文数据库和计算机

积累的同一词、近义词和有关词汇相匹配。大部分全文数据库采用的前一种方法,这种仅

仅基于字型而非主题概念语义关系的一致,不仅无法充分反映广为存有于自然语言中的同

义词、近义词之间的关系,也无法充分反映基于概念的词与词之间的等级依附于关联关系。

用户不但无法消解检索词的歧义性,也无法根据自己的须要展开缩检扩检或作有关检索。

3.3输出格式的不同

全文数据库对原文的表明及浏览通常使用相同的特定格式,在初次检索前往往必须特

别注意浏览读写并加装浏览器以便采用。有的提供更多通用型格式,如springer-link数据

库原文表明使用pdf格式或htm格式。有的数据库甚至使用独立自主研制开发的专用浏

览器,如cnki系列数据库原文使用caj格式。

文摘索引型数据库其输出结果比较简单,没有专用特定的格式。


本文标签: 数据库 检索 文献 全文 提供