信息资源检索

1、因特网的信息资源与服务存在许多误解:(1)认为因特网无所不包、无所不能。所有信息均可在网上到;(2)认为因特网上到的、下载下来的信息都是正确的;(3)认为因特网可以完全取代其他媒体或信息渠道;(4)认为因特网上的信息无太多利用价值,仅限于聊天、菜谱、各种发烧友俱乐部等非正式、娱乐性信息,缺乏严肃类信息。
网络流量统计2、网上有什么样的信息:政府信息(来源过最大的是美国)、科研信息、教育信息、文化信息、休闲娱乐信息(被称为是网上最成功的领域)
3、因特网信息资源的特点:无限性和广泛性、多样性、廉价性、共享性、新颖性、无序性
4、因特网上信息资源的种类:Web信息资源、Telnt、FTP信息资源、用户组信息资源(用户通信、服务组是因特网上最受欢迎的信息交流形式)、RSS信息资源
5、超文本传输协议HTTP、超文本标记语言HTML、通用资源定位程序
URL(URL又称信息资源的统一定位或统一资源定位器)URL包括3部分:所使用的传输协议、服务器名称、该服务器上定位文档的全路径名;
冬瓜去皮机
6、浏览器是一种应用于WWW的网络软件,它是运行在用户计算机上的客户程序。浏览器分为3类:行式浏览器、文本浏览器、使用图形界面的浏览器。
7、评价的标准:目的、范围、内容
8、围绕网站内容的方面:准确性、权威性、新颖性、独特性、可靠性、链接、图形和多媒体设计、信息的展示与设计、可操作性
扫把头9、评价方法:定性评价(即按照一定的评价标准对被评站点的各方面特征、质量作出主观评判。)定量评价(即利用数量分析方法,对调查统计数据进行分析,进而做出较系统、客观的评判。)
10、因特网信息资源检索的特点:检索范围大、检索效率高、检索工具强大、信息冗余大
11、使用关键词检索网络资源的优点是:(1)检索简单易行、利于上手(2)检索到的信息较新,时效性好(3)可以达到较高的检全率(4)符合检索语言的文献保障原则和用户保障原则
12、基于关键词检索的缺点:关键词语言难以反映词间的相关关系;分散主题,影响查准率;自动标引无法完全解决标引不一致的问题。
13、检索工具的功能通常包括:布尔检索、截词检索、位置检索、加权检索、字符串检索、限制检索、概念检索、模糊检索、深入检索
因特网信息检索工具的工作原理:网络资源目录的工作原理相对简单,一般是由人工发现、抓取、辨别网上信息,依靠编目、标引人员的知识,按照图书分类、学科分类或其他分类依据,建立主题树分层目录,将采集、筛选后的信息分门别类地放入各大类或子类下面。
一个完整的搜索引擎应具备如下5部分:搜索器、搜索引擎数据库、索引器、检索引擎和用户接口
14、计算机检索模型包括:布尔模型、向量空间模型、概率模型、扩展布尔模型
15、因特网检索工具的性能评价:收录范围、检索功能、检索效率、检索结果的处理和展示、用户界面设计
16、检索功能直接影响信息检索的检全率、检准率、检索的灵活性、方便性及检索速度,是评价与选择因特网信息检索工具的核心指标。
17、检全率:对于一项检索,实际检出的真正相关的文件数目(r)与所有应该被检出的文件数目(R)的比率,r/R即为检全率。
18、检准率:对于一项检索,如果检出的文件数是n,其中与本次检索真正相关的文件是r,那么检准率就是r/n。
宿主化19、搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜
集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
20、通用搜索引擎:Google谷歌(Google会自动以AND逻辑连接;Google也支持OR逻辑操作;Google不支持截词符的使用)百度、天网、搜狗、网易等
21、目录型网络检索工具概念:因特网上的目录型检索工具一般称为网络目录(Web Directory),又称分类站点目录、专题目录或主题指南、站点导航系统等。它是由网络开发者将网络资源收集后,以某种分类法进行组织整理,并和检索法集成在一起的信息查询方式。网络目录一般是通过引导网络用户的查询概念(而不是确切的词条)来帮助用户到所需的网络信息。
22、网络资源目录一般采用人工或半自动方式采集和存储网络信息。
23、一个网络资源目录到底有几层,取决于多种因素:其一与使用的目录有关;其二取决于所选的类目;其三与主题有关。
制作奖章24、网络资源目录使用的分类法:(1)主题分类法(2)学科分类法(3)图书分类法(4)分面组配法
25、主题分类法一般设置12-18个一级主题类目,层次一般是4级。Yahoo!就是应用了主题分类法,它将网络资源按内容分为14个大类。
26、“网络指南针”采用的分类法之一便是学科分类法,其一级类目共分58个学科。
27、分面分类法的原理是首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目。
28、网络资源目录介绍:Yahoo!、Galaxy、The WWW Virtual Library、Google网页目录、Dmoz
29、网络资源目录主要适用于:(1)用户进行较宽泛的主题浏览和检索。(2)当用户尚未形成很精确的检索概念时,采用主题指南作为检索起点非常有效。
30、元搜索引擎是一种基于搜索引擎的网络检索工具。
挂链
31、元搜索引擎的分类:桌面元搜索引擎、All-in-One式元搜索引擎、并行检索式元搜索引擎
32、并行检索式元搜索引擎是将多个搜索引擎集成在一起,提供一个统一的检索界面,用户发出检索请求后,提问式被同时分别提交、发送给多个独立搜索引擎,同时检索多个数据库,最终输出的检索结果是经过聚合、去重之后反馈的多个独立搜索引擎查询结果的综合。33、在选择、使用各元搜索引擎时应注意其在以下几方面的特点:(1)所集成搜索引擎的数量和名称(2)检索提问的输入及处理(3)其他检索选项(4)检索结果的处理
34、常用的桌面元搜索引擎:飓风搜索通、网际狂搜
35、Dogpile,是老资格的元搜索引擎之一,目前可检索多达26个搜索引擎和类信息资源,具体对应如下:WWW资源:Alta V ista\Bay9\Direct Hit\……
Usenet资源:Deja
FTP资源:Fast FTP Search
拍卖信息:Go To
音频资源:Astraweb,AudioGalaxy,MP3Board
36、TBIR:基于文本的图像检索技术;CBIR:基于内容的图像检索技术
37、用来帮助图像分析、标引的Web文档内容包括:(1)图像的文件名及其网址(2)图像的替代文字(3)图像周围的文字(4)图像所在页面的标题(5)图像的超链接(6)图像所在网页彼此间的链接
38、图像的内容特征,主要采用的是图像的颜、纹理、及其形状特征。
39、OCLC FirstSearch:是由美国OCLC创建的,是一个非营利、成员制的联机计算机图书
馆服务和研究机构,也是世界上最大的文献信息服务机构之一。
40、OCLC自建的数据库有以下7个:(1)WorldCat世界上最大的、每日更新的书目数据库。
(2)ArticleFirst提供15000多种学术期刊中论文的书目信息
(3)ContentsFirst提供15000多种学术期刊的目次页和馆藏信息(4)FastDoc是一个全文数据库,包括来自1000种期刊、杂志的90万篇文章(5)NetFirst是一个权威、可靠的Internet信息资源指南、目录(6)PaperFirst提供世界范围内各种学

本文发布于:2024-09-25 07:18:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/195680.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检索   信息   资源
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议