信息检索课程重点整理

信息检索课程重点整理
一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。特征:预先性、实用性、时效性、可传递性、共享性。
传递渠道:1、非正式过程(表现为个人的行为特征。对话、通信、演讲、授课);2、正式过程(表现为文献流通。借助文献系统进行正式交流)。
文献概念:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。也可以称为固化在一定载体上的知识。必须含有知识、记录方式、载体。
资料概念:固化在一定的实物或载体上的知识。
二、信息的类型:
1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。P4
2、按信息载体的出版编辑特点划分:十二大文献源。P5
3、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。P6
4、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。
5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。
三、信息检索的定义及类型p2
信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者 是包含用户所需事实与消息的文献的过程。它包括三个方面: 数据检索、事实检索、文献检索。三者中以文献检索为主。数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
四、文献检索的定义及类型p3
定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。
类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。
间接检索:是通过检索工具的指导再查原始文献而获取所需信息。系统、全面:滞后。
五、检索工具定义、具备条件及类型
检索工具是按一定的学科、主题等进行搜集 整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
具备条件:(1)对所收录的文献的各种特征(包括外部特征和内容特征)要有详细的描述。 2)每条描述记录(即款目)都标明有可供检索用的标识。(3)全部描述记录科学地组织成一个有机的整体。(4)具有多种必要的检索手段。
类型:按检索方法划分:手工检索工具、机械检索工具。
按报道的学科范围:综合性检索工具、专业性检索工具。
按出版形式:全面性检索工具、单一性检索工具。
著录的形式:目录、题录、文摘、索引。P9
第二章、网络
一、网络基本术语
TCPTransmission Control Protocol,传输控制协议)将文本分成包(数据包) ,再加上特别信息,使数据可以准确无误的地发送到接收方的计算机上。
IPInternet Protocol,网际协议)在数据包上标上特别的信息(接收主机的IP地址),到目的地后,系统自动将IP地址去掉,再利用TCP检查数据是否完整,如有丢损则要求发送方重新发送被丢损的数据包。
POP3 (Post Office Protocol) ,表示邮局协议。允许用户访问接收邮件的主机,并取走存放在上面的邮件。
POP邮件服务器
FTPFile Transfer Protocol(文件传输协议)的缩写,它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某个文件拷贝到网络上的某台计算机上,或是把网络上某台计算机上的文件拷贝自己计算机上。
HTTP:超文本传输协议。
IP地址:在Internet上的每一台计算机主机都必须有唯一的地址,以保证Internet上所有的计算机和网络能够被互相传送信息而不被混淆,以数字表示,称为IP地址。为确保IP地址在整个网上的唯一性,该地址一般由Internet网络信息中心统一分配。
域名系统DNS,按域名系统定义的名字称为域名。域名和IP地址的联系前者是名称,面对用户操作;后者是主机地址,主要供电脑识别用的,IP 地址共有32位,这么多数字不便于我们记忆,就对应取了域名便于人们的使用,域名和IP地址间是一一对应的,可通过域名服务器进行转换。P54
HTML (超文本标记语言)
HTTP (超文本传输协议)
URL(统一资源定位器) 格式:协议: //主机地址[: 端口号]/子目录/文档名
EMAIL地址组成:用户名@邮件服务器域名。
FTP TCP/IP 协议组中的协议之一,简单的说,FTP就是完成两台计算机之间的拷贝,从远程计算机拷贝文件至自己的计算机上,称之为下载(download文件。若将文件从自己计算机中拷贝至远程计算机上,则称之为上载(upload文件。文件传输工具。
二、搜索引擎的分类
按检索机制分:分类目录式搜索引擎、全文搜索引擎、元搜索引擎
按搜索的内容分:综合性搜索引擎、专门搜索引擎
三、搜索引擎的工作原理
搜索引擎是指通过“网络机器人”(网络信息挖掘系统)在网际某一空间、某一领域中寻和发现有用或相关的信息,并在此基础上建立检索数据库,通过简单友好的界面提供给用户查询的工具。
三大功能:在因特网上漫游收集信息(人工的,自动的两种);对收集到的信息标引并建立或更新数据库;提供检索服务接待用户访问。P65
第三章、图书
索引语言定义与类型:
作为一种通讯工具,索引需要有一种用来描述文献特征的检索标识,以将文献信息的产生者、加工者、检索者在文献特征的识别上彼此联系起来,以便取得能共同理解、实现思想交流的语言,这种语言就叫索引语言。
按结构原理分:
分类语言:体系分类语言、组配分类语言
描述语言:标题词叙词单元词关键词(非规范化语言)
代码语言
引文语言
定义:体系分类法是一种直接体现知识分类的等级标识系统,它对概括文献信息内容及其外
表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。它提供某学科、专业的集中文献。
类型:《中图法》《科图法》《资料法》《人大法》
中图法:5大部22大类。索书号=分类号+作者号
联合目录:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所收藏的书刊统计目录。反映几个图书馆藏书的情况,某一种书刊见于何处,藏于何馆,便于查借阅。www.calis.edu/          P24
馆藏目录:是图书馆或信息资料部门所收藏的全部书刊的统计目录。
公共检索目录:各图书馆的网上公共可检索目录OPACOnline Public Access Catalog),即一个基于网络的书目检索系统,提供本馆书目信息的检索服务。
课题检索——检索步骤 P20
1)分析检索课题
2)选择检索方法
常用法:要求查全----用顺查法;
要求快、新----用倒查法;
掌握了课题的发展阶段特点-用抽查法
追溯法:查全率、查准率较低,易误检漏检
综合法:优点是当检索工具缺期、缺卷时,也能连续获得所需年限以内的文献资料。
3)选择检索工具P9
一般结构:1、使用说明:是检索工具编制着为检索工具检索者提供的必要指导。包括编辑内容、著录标准、代号说明和使用方法。2、目次表:检索工具的正文一般按分类方法组织编排,在检索工具前有详简不等的分类目次表。为使用者提供分类途径的检索。3、正文:正文部分是检索工具的主体部分。4、辅助索引:为用户提供多种途径的检索,从而提高检索效率。5、附表:是检索工具内容的必要补充,包括摘用刊物的种类,各种缩写,文字转
译,术语和文献入藏单位代号等。
4)确定检索途径
主题途径(要求特性检索)、分类途径(要求族性检索)、著者途径 、序号途径 、书名途径
5)查文献线索
6)获取原文
a、到本单位的图书馆或资料部门去查 b 、从国内图书信息机构,由近及远地获取;c、给著者写信获取;d、从文摘、索引等检索工具出版机构获取;e、网上查询,查全文期刊数据库、搜索引擎、电子期刊等;f、通过商业机构获取。
计算机检索的基本技术(P31)
1、布尔逻辑检索+*-2、截词检索 3、字段限制检索 (field limiting)
检索效果评价(P25
1查全率、查准率的定义以及两者之间的关系
    被检索出的相关文献的数量 
查全率=—————————————— %
    总文献中所有相关文献的数量 
    被检索出的相关文献的数量
查准率=——————————————%
     被检索出文献的数量
查全率与查准率两者是互逆的关系
优化检索策略的方法
1、如果检索结果太多,可缩小检索范围,提高查准率。①使用逻辑非剔除无关内容; ②使用规范词、下位类主题词,提高检索词专指度; ③限定检索字段; ④限定文献外表特征,
如语种、时间等; ⑤将AND算符改为更严格的位置算符。
2、如果检索结果太少或为0,可扩大检索范围,提高查全率。①少用AND,多用OR ②使用主题词的同义词、近义词、上位类词; ③使用截词符,以检出所有词干相同的词; ④将限制严格的位置算符改为不太严格的位置算符; ⑤选择更合适的数据库。
检索表达式:作者单位=北京大学*作者=王少华*刊名=首都经济贸易大学学报*关键词=(人力资源管理+人才资源管理)* =2000
文献著录形式
1)期刊
例如: 袁庆龙,候文义.Ni-P 合金镀层组织形貌及显微硬度研究[J].太原理工大学学报,200132(1)51-53
2)图书(专著)
例如:刘国钧,王连成.图书馆史研究[M].北京:高等教育出版社,197915-1831
3)论文集
例如:孙品一.高校学报编辑工作现代化特征[C].中国高等学校自然科学学报研究会.科技编辑学论文集(2).北京:北京师范大学出版社,199810-22
4)学位论文
例如:张和生.地质力学系统理论[D].太原:太原理工大学,1998
5)专利文献
例如:姜锡洲.一种温热外敷药制备方案[P].中国专利:8810560781983-08-12
6)国际、国家标准
例如:GB/T 16159—1996,汉语拼音正词法基本规则[S].北京:中国标准出版社,1996
第五章特种文献
专利定义、类型、专利三性
专利定义:由个人或单位将自己的发明创造向专利局提出申请,经专利局审查核实,发明人
在法律规定的时间和区域内,对其发明享有独占权,即专利权,在该期限内若有人未经允许而采用此项专利,属于侵权。  

本文发布于:2024-09-23 10:20:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/433068.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检索   文献   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议