第一章
绪论
1、情报:指传递着的,有特性效用的知识。特性:知识性:指情报的本质是知识;传递性:指知识只有经过传递才能成为情报;效用性:指流动着的知识并不都是情报,只有那些能满足需要的流动的才可称之为情报。2、文献:(1)定义:为记录一切人类知识信息的载体。记录有信息或知识的一切载体均为文献。(2)基本要素:①知识内容;②记录符号;③物质载体;④记录手段;例如:一张没有任何知识内容的白纸;一盒空白录音磁带不能称为文献,一副名画是文献; 3、信息资源:是可利用的信息,相对于其他非资源型信息,信息资源具有有限性、人工性、有序性、积累性4个特性。
4、信息、知识、情报、与文献的关系
①包含关系:信息包含知识,知识包含情报;
②转化关系:文献是记录有知识的载体;
③交叉关系:情报与文献之间存在交叉关系;
5、按文献的载体形式不同,可把文献信息分为手写型、印刷型、微缩型、声像型和机读型5种类型。
①手写型:指雕版印刷印刷发明之前的古代文献和今天没有正式付印的手写文稿如古代甲骨文、金文、钟鼎文、竹木简、拓片和现在的手稿、日记、书信、账簿、公文会议记录等;
②印刷型:以印刷、复印、打印等为记录手段而产生的一种文献;
③微缩型:包括微缩胶卷、微缩平片、微缩卡片、和全息胶片等;
④声像型:包括唱片、录音带、幻灯片、电影胶卷、录像带、电视片、激光唱盘。多媒体学习工具的等;
⑤机读型:包括联机型、光盘型、网络型。
6、按文献的出版形式不同,可以把文献信息资源划分为图书、期刊、报纸、特种文献(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料和技术档案)等11种类型。
(1)科技图书:
①主要特点:主题鲜明突出,内容系统完整,成熟稳定,但编辑、出版周期稍长,传递速度偏慢,所揭示的内容一般只是反映2~3年以前的研究水平。
②检索工具:超星数字图书馆、我校馆藏图书目录、北大方正数据库、书生(之家)读吧、馆藏图书馆、中数图网。
③识别特征:ISBN(国家标准书号);2007年1月1日以前的ISBN号由10位数字分为4段组成,即:地区或语种号——出版商代号——书名号——校检号。
④、识别图书的依据主要有:书名、著者、出版地、出版社、出版时间、总页数、ISBN号等。
(2)、期刊
①主要特点:内容新颖,出版周期,信息含量高,是传递科技信息、交流学术思想最基本
的文献形式,也是信息检索中利用率最高的文献源,科研利用率为60%~70%。②检索工具:维普的《中文科技期刊数据库》、中国知网《中国期刊全文数据库》、万方《数字化期刊》。③识别特征:Ⅰ、ISSN(国际标准刊号):ISSN号由8位数字分两段组成前七位是期刊号,末位是校检号;Ⅱ、CN(国内统一刊号):它由地区号、报刊登记号和《中国法》分类号组成。④、识别期刊的依据主要有:期刊名称,期刊出版年、卷(从创刊年开始编号1年一卷)、期,ISSN号;(3)、科技报告国际上著名的科技报告为美国政府的四大报告:PB(美国商务部国家技术情报服务局)、AD(美国国防技术情报中心)、NASA(美国国家航空和航天局)、DOE(美国能源部)。检索工具:中国知网《国家科技成果数据库》、万方《中国科技城数据库》。(4)、专利文献缩写ZL,标准文献缩写GB;(5)、 学位论文:检索工具:中国知网《中国优秀博士论文全文数据库》、万方《中国 学位论文数据库》、欧美的在PQDD《美国博士论文数据库》。
(6)、会议文献:检索工具:中国知网《中国重要会议论文全文数据库》、万文《中国会议论文全文数据库》。
7、文献的加工深度不同,可以把文献信息资源划分为零次文献、一次文献、二次文献和三次文献。
①零次文献:指未经出版发行或未进入社会交流的最原始的文献。(主要以口头形式、报告形式出现)
如:私人笔记、工程图样、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。
②、一次文献:指以作者本人的生产实践、教学实践与科学研究成果为基本素材撰写并公开发表文献(研究型学位论文)。
如:期刊文件、科技报告、会议论文、专利说明书、技术标准以及部分学位论文等。
③、二次文献:对一次文献进行整理、加工的产品,即把大量的、分散的、无序的一次文献一定的方法进行加工、提炼、整理、简化,组织成为系统的便于查的文献。(如Google /百度等搜索引擎)
④、三次文献:综述性学位论文;
如:各种述评、综述或进展性出版物,以及百科全书、字(辞)典、手册、年鉴等参考工具书。
8、特种文献:是指科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料和技术档案这8种类型的文献。
第二章
信息检索的基础知识
1、
信息的分类组织法
(1)
分类语言的特点:系统性、科学性
(2)
适用于学科性、系统性强的课题的检索,即族性检索
(3)
常用的分类法有:
①《中国图书馆分类法》:简称《中图法》,针对图书分类
A、其基本结构是:将全部知识分为马列主义思想、哲学、社会科学、自然科学与综合性图书5个基本部类,在社会科学下又展开9个基本大类,在自然科学下展开10个基本大类,总共22个大类,由22个字母(除了L、M、W、Y的大写字母)组成。
B、
其标记符号(即分类号)采用汉语拼音字母与阿拉伯数字相结合的混合制号码。如:经济类的为F,计算机为TP,电气专业为TM等。
C、
是我国图书馆最通用的一部分类法。
②《杜威十进制分类法》:简称《杜威法》(DDC),是当今世界上影响最大、应用最广的一部大型分类法。
③《国际专利分类法》:简称IPC,是当今世界上最重要的、使用最为广泛的一种专利分类法。IPC的标记符号(即分类号)采用英文大写字母和阿拉伯数字混排的形式,由部号、大类号、小类号、主组号5个等级的分类号组成。
2、
信息的主题组织法
(1)
属于专指性检索,适合研究对象、手段、方法、方面确定的课题检索,即特性检索,也适用于交叉学科、新兴学科、化学科。
(2)
主题组织法的依据是主题法,分为标题词法、单元词法、叙词法和关键词法。其中关键词法为非规范化语言。
(3)
非规范化语言有:关键词语言、题名语言、全文语言、引文语言。
3、
信息检索的概念及类型
(1)
广义:包括信息的存储和检索
狭义:仅指信息的检索
(2)
信息检索根据检索对象不同,可分为文献检索、事实检索和数据检索
①
文献检索:以文献为检索对象,查某一主题、某一著者、某一机构等的有关文献, 以及这些文献的出处和收藏单位等。是信息检索中最重要的、使用最多的一种。
检索的结果是不确定的,而是提供与之相关的一些文献,供用户参考,因此是相关性检索。
②
事实检索:是以事实为检索对象,查某一事物(事件)的性质、定义、原理、以及发生的时间、地点、过程等。
完成事实检索主要借助于字典、词(辞)典、百科全书等参考工具书或各种事实型数据库和全文数据库等;检索的结果是确定的,因此为确定性检索。
③
数据检索:是以特定的数值型数据为检索对象,查某一数值、某一计算公式、某一图表、某一物质分子量及分子式等。
完成数据检索主要借助于年鉴、图录、图谱等参考工具或各种数值型数据库等,结果是确定的,因此为确定性检索。
4、
计算机信息检索系统一般由数据库的字段、记录、文档等组成。
5、
手工检索系统按对文献揭示的程度可分为目录型检索工具、题录型检索工具、文献型检索工具。(会判断)
属于目录型检索工具的有:《全国新书目》、《全国总书目》、馆藏目录等
属于题录型检索工具的有:《全国报刊索引》、《中文科技资料目录》等
属于文献型检索工具的有:《中国学术期刊文摘》、《中国社会科学索引》等
6、
信息检索途径:分类途径、主题途径、著者途径、题名途径、号码途径、其他途径
7、
信息检索算符
(1)布尔逻辑检索算符,常用的有3种:与、或、非;优先执行顺序:非、与、或
与:缩小检索范围,提高查准率
或:扩大检索范围,提高查全率
非:缩小检索范围,提高检索专指度
(2)减少检索词输入量,节省机时,同时扩大检索范围,保证查全率,可使用截词检索算符(按截词位置可分为前截词、后截词、前后截词和中间截词)
8、
分析信息需求的主题内容
(1)
出信息需求的主题概念并明确其逻辑关系
(2)
出隐形主题概念
(3)
出核心概念,排除无关概念和重复概念
9、
编写检索提问式
10、衡量信息检索效果的指标:查全率和查准率
11、提高信息检索效果的主要措施
(1)提高查全率的措施
① 降低检索词的专指度,可从索引或检出的文献种选一些上位词和相关词进行检索
② 增加检索词,用同义词、近义词及相关词等进行逻辑“或”检索
④
调节检索式的网罗度,删除某些不甚重要的概念组面
⑤
采用族性检索,即用分类目录或分类号检索
⑥
在文摘字段或任意字段中进行检索
⑦
增加检索途径,将主题、分类、篇名等途径联合使用
⑧
增加检索相关的数据库
(2)提高查准率的措施
①
提高检索词的专指度,可使用下位概念词或专指性较强的词
②
用逻辑“与”连接相关概念组面的检索词,以进一步限定主题词概念范围
③
用逻辑“非”排除一些无关的概念
④
将检索词限制在篇名和叙词字段中,并指定邻接和优先关系
⑤
利用信息的外部特征限制输出的检索结果,包括限制输出信息的类型、语种、出版时间等