首页 > 学术百科

数字图书馆考试重点

题型：

填空题（20个20分）

选择题（8个8分）

名词解释（5个20分）

简答题（5题40分）

论述题（12分）

数字图书馆考试重点

1. 国内外数字图书馆联盟项目

东北饲料多变量变送器

国外工程项目	国内工程项目
美国数字图书馆首创计划一期	超星数字图书馆
美国数字图书馆首创计划二期	CNKI数字知识库
美国记忆	百度文库
美国国家科学数字图书馆	CALIS项目
G8全球数字图书馆联盟	国家数字图书馆工程项目
联机计算机图书馆中心-OCLC
IBM数字图书馆计划
Google数字图书馆计划

2. MARC和DC

MARC机读编目格式标准（英语：MAchine-Readable Cataloging，缩写：MARC），是一种图书管理的通讯格式标准，用以让图书馆或出版商之间作目录信息交换用途。MARC标准源于美国国会图书馆于1970年代开发的目录格式。虽然说是标准，但其实MARC是各国的机读编目格式标准的一个大集合，每个国家依然有自己的格式标准。

DC(Dublin Core) 是数字图书馆中使用的一组简单的包括15个“核心元素”的元数据元素集合，主要用于描述数字对象、馆藏管理和元数据交换。这15项元数据不仅适用于电子文献目录，也适用于各类电子化的公务文档目录，产品、商品、藏品目录，具有很好的实用性。

3. 数据压缩的含义和类型

数据压缩是指在不丢失信息的前提下，缩减数据量以减少存储空间，提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织，减少数据的冗余和存储的空间。数据压缩包括有损压缩和无损压缩。

4. 主要的存储设备；（磁盘阵列、光盘塔、光盘库、磁带机、磁带库、光盘网络镜像服务器）

萨哈林（1）硬盘阵列由于它的访问速度非常快，所以它主要用于数据的实时共享，还可以用于小型的VOD点播系统。

（2）CD-ROM光盘塔的光驱访问速度相比于硬盘来说，速度慢了一些，而且光驱数量有限，数据源很少，所以供同时使用的用户数量也很少，但是由于光驱的价格很低，作为低端产品，它还是能够适用于一些用户的要求。

（3）CD-ROM光盘库的数据访问速度与CD-ROM光盘塔速度差不多，但是它所能提供的数据量更大些。

（4）磁带机是我们最常用的数据备份设备，按它的按带方式可分为人工加载磁带机和自动加载磁带机两大类。人工加载磁带机在换磁带时需要人工干预，只能备份一盘磁带，所以只适用于备份数据量较小的中小型企业选用（通常为8GB、24GB和40GB）；自动加载磁带机则可在一盘磁带备份满后，自动卸载原有磁带，并加载新的空磁带，适用于备份数据量较大的大、中型企业选用。

（5）磁带库是像自动加载磁带机一样的基于磁带的备份系统，它能够提供同样的基本自动备份和数据恢复功能，但同时具有更先进的技术特点。它的存储容量可达到数百PB（1PB=100万GB），可以实现连续备份、自动搜索磁带，也可以在驱动管理软件控制下实现智能恢复、实时监控和统计，整个数据存储备份过程完全摆脱了人工干涉。

（6）光盘网络镜像服务器是继第一代的光盘库和第二代的光盘塔之后，新开发出的一种可在网络上实现光盘信息共享的网络存储设备。光盘镜像服务器有一台或几台CD-ROM驱动器。网络管理员可通过光盘镜像服务器上的CD-ROM驱动器将光盘镜像到服务器硬盘中，也可利用网络服务器或客户机上的CD-ROM驱动器将光盘从远程镜像到光盘镜像服务器硬盘中。

光盘网络镜像服务器不仅具有大型光盘库的超大存储容量，而且还具有与硬盘相同的访问速度，其单位存储成本（分摊到每张光盘上的设备成本）大大低于光盘库和光盘塔，因此光盘网络镜像服务器已开始取代光盘库和光盘塔，逐渐成为光盘网络共享设备中的主流产品。

5. 基于内容的信息检索含义，图像内容检索的特征p112；

基于内容的信息检索是通过对信息的模式识别和分析理解，从中抽取信息的有关内容特征并加以标示和组织，用户以此作为检索的依据，完成信息数据库中存储信息的匹配，从而实现信息的直接定位和查。多媒体数据类型、特征描述不同，其检索技术方法也会有区别。

基于内容的图像检索是把图像的可视特征如颜、形状、纹理、区域等作为图像的内容进行匹配、查。

6. 跨语言信息检索主要技术（有翻译技术和优化技术，将检索技术和翻译技术结合）p117

跨语言信息检索有三种公认的主要翻译技术：机器翻译技术、基于词典的方法、基于平行或比较语料库的方法。一般而言，上述三种方法并不是孤立存在的，在构建实际系统时常常会综合利用。

第一、机器翻译技术。对于CLIR，机器翻译技术是一种显然的选择。实现跨语言检索系统最直接的方法是将机器翻译系统应用于检索过程中。具体来说有两种方法：一种方法是将用户的查询翻译为与文档相同的语种；另一种方法是将文档翻译为与查询相同的语种，然后再用单语种的信息检索系统进行检索。

第二、基于词典的方法。基于词典的方法主要是利用双语词典，将用户提交的提问式翻译成目标语种，然后进行检索。双语词典是跨语言信息检索系统中的基本资源，Lisa Ballesteros采用双语字典的方法达到了90%的单语检索的效果。在提问式翻译中，机器翻译方法不一定比基于词典翻译方法好。Ballesteros和Croft在报告中指出，基于词典翻译方法胜过流行的商业性机器翻译系统。

第三、基于语料库的方法。语料库是将同一信息或同一主题的信息用两种或多种语言进行描述，并由人工或计算机建立不同语种间信息联系的集合，来源于对单词用法的统计。基于语料库的方法从大规模的语料入手，从中抽取所需的信息，自动构建与应用有关的翻译技术。根据所使用的语料库的类型，基于语料库的方法可分为基于平行语料库的方法和基于比较语料库的方法。

跨语言信息检索优化技术歼-12主要有三类：查询扩展、检索反馈技术、消除检索词义性。

第一、查询扩展。查询扩展指的是利用计算机语言学、信息学等多种技术，把与原查询相关的词语或者与原查询语义相关联的概念添加到原查询，得到比原查询更长的新查询，然后检索文档，以改善信息检索的性能，解决信息检索领域长期困扰的词不匹配的问题，以

弥补用户查询信息不足的缺陷。目前关键词查询扩展技术按照其扩展词的来源不同主要有全局分析、局部分析、基于关联规则的和基于用户查询日志的查询扩展技术等几种。

第二、检索反馈技术。在跨语言信息检索中，通过一次检索往往得不到想要的结果目的文献，这时就需要通过检索结果中反馈的信息对提问式检索方法或翻译方法进行改进。特别是当用户和信息系统进行交互式检索文献时，适当的用户反馈相当重要，大量的实验也表明使用检索反馈技术可以极大地改善系统。

第三、消除检索词多义性。无论什么语种，一词多义现象都是普遍存在的。对查询来说，确定查询中检索词的确切含义是查询扩展的基础对于被检索信息来说，明确信息中出现的检索词的含义是提高检索准确率、确定信息相关性的关键。可以利用一种词的共现技术来消除词的多义性，以明确其含义。词的共现技术，就是若两个有一定关联的词共同出现在某一篇文献或者文献的某一个部分，就可以非常容易确定其含义的技术。

7. 数字图书馆的主要特征；

当前数字图书馆在网络环境下呈现出六大特征：信息资源数字化、信息内容动态化、信息组织智能化、信息服务网络化、信息利用共享化、信息服务的知识化。

8. 互操作协议OAI，Z39.50？

OAI全称为OAI-PMH（Open Archives Initiative Protocol for Metadata Harvesting）。由美国数字图书馆联盟（DLF）、网络信息联盟（CNF）等组织于1999年提出的一个应用框架。其最初目的是为了解决电子期刊的预印本的互操作和元数据收割（metadata harvesting）问题。

Z39.50是一个美国国家标准，基于ISO的OSI（开放系统互联）参考模型的应用层协议，目的是为了信息系统的开放互联，将个系统的不同数据库软件，不同数据描述格式、访问方式建立一个抽象、通用的用户视图，将各个系统的具体实现映射到抽象模型上，使不同的系统在一个相互理解的、标准的通信平台上进行交互，满足互操作的需要。

9. RDF的含义和作用；

资源描述框架(Resource Description Framework,简称RDF)是一个用于表达关于万维网(World Wide Web)上的资源的信息的语言。

它专门用于表达关于Web资源的元数据，比如Web页面的标题、作者和修改时间，Web文

档的版权和许可信息，某个被共享资源的可用计划表等。

10. 美国首创计划一期、二期主要内容？

美国数字图书馆首创计划一期研究的重点集中在三个方面：

第一，发展数字信息收集、储存和组织的技术和手段；

第二，研制通过internet进行信息检索的技术；

第三，优化数字信息处理过程的用户界面。

美国首创计划（DLI-2）在DLI-1的基础上，从多方面促进数字图书馆的研究与发展，从纵深领域扩大了数字图书馆的应用领域。

11. Web2.0和Library2.0；

Web2.0 是相对Web1.0 的新的一类互联网应用的统称。Web1.0 的主要特点在于用户通过浏览器获取信息。Web2.0 则更注重用户的交互作用，用户既是网站内容的浏览者，也是网站内容的制造者。

图书馆2.0是一个能够让图书馆快速地反应市场需求的运作模式。

图书馆2.0是web2.0在图书馆的应用，但更多的借鉴了基于web2.0的理念，以读者和用户为中心，使读者可以参与到图书馆的建设中来。例如：添加OPAC书目、撰写书评等。

12. 知识服务

知识服务是以互联网信息进行搜索查询为基础，为用户提供有用的信息和知识。

一般知识服务可以提供：新闻摘要、问答式检索、论坛服务、博客搜索、网站排名、情感计算、倾向性分析、热点发现、聚类搜索、信息分类等服务。

1 识服务是用户目标驱动的服务；top300

2 知识服务是面向知识内容的服务；

3 知识服务是面向解决方案的服务；

4 知识服务是贯穿为用户解决问题工程的服务。

13. 数据挖掘和关联规则；

数据挖掘(Data Mining)，就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。

关联规则：同时满足最小支持度和最小可信度的规则称为关联规则，即S（A→B）>min_sup且C（A→B）>min_conf成立，规则A→B称为关联规则。

戏迷ok网

14. 个性化服务和移动服务概念；

图书馆的个性化信息服务，就是指以用户为本，根据用户的层次和需求的差异，针对不同的用户，采取不同的服务方式，提供不同的信息服务。

本文发布于:2024-09-23 20:21:10，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/213553.html

上一篇：新概念二64课同步练习题

下一篇：oaipl

标签：信息检索图书馆技术服务用户数字光盘

留言与评论（共有 0 条评论）