是表达一系列概括文献情报内容的概念及其相关关系的概念标识系统。作为一种专门的人工语言,它的作用是在标引过程中用来描述文献的内容特征(或外表特征 ),从而形成 检索标识;在检索过程中用来描述检索提问,从而形成检索标识。这种检索标识(提问标识)需要用语言形式来表达,这种特殊的语言就称为情报检索语言,简称为检索语言或标引语言
报检索语言按组配方式划分
先组式检索语言 后组式检索语言 先组散组式语言
情报检索语言构建基础 概念逻辑 知识分类 术语学基础
概念的内涵 指概念所反映的事物的本质属性的总和,是概念质的表现
概念的外延 指概念所反映的对象的范围,是概念量的表现
内涵和外延的关系 反变关系
概念逻辑 是一种科学思维方法,运用它能揭示事物的本质属性,及各种事物之间的联系与区别
情报检索语言种类(分类)
1,按规范化程度分:非规范化语言(标题法,体系分类法),规范化语言(单元词,关键词,组配分类法)
2,按组配方式划分:先组式检索语言,后组式检索语言
3,按构成原理划分:分类法语言,主题法语言(标题法,单元词法,氙词法,关键词法),代码检索语言 ,引证关系追溯法 ,引文索引
叙词(Descriptors) 是一些以概念为基础的,经过规范化和优选处理的,具有组配功能,并能显示词间语义关系和动态性的词和词组,维护国家五大安全
叙词表的构成 由一个主表和若干辅表构成
叙词的性质 叙词的概念性,叙词规范法,叙词的优选处理,叙词的组配,叙词的语义关系,动态性
叙词法的特点 直接性(也称直观性),专指性,适应性,排列客观性,相对集中性
(
叙词表(Thesaurus) 也称主题词表(subject headings) 它是将文献标引人员或用户的自然语言转换成规范化名词术语的一种术语控制工具,是概括各门或一门学科领域术语。并由语义相关,旅性相关的术语组成的规范化动态词典 自动标引( automatic indexing) 也称计算机辅助标引。 是根据文献内容,依靠计算机系统全部地或部分地自动给出标引符号的过程
标引 就是在主题分析的基础上,以一定的检索语言作为依据,将信息资源中具有检索意义的特征转换成相应的检索标识。并将其组织或表达信息资源内容特征的集合的过程
标引原理 在信息的储存和检索过程中,为使信息在用户和系统间有效传递,各种检索系统使用专门的语言体系来描述信息的内部特征,同时要求用户系统依此构造检索提
问式来进行检索
加权标引表达方式
1,星号加在主题词前(反对主题词加权)
2 星号加在主题词和副主题词之前(对主题词和副主题词同时加权)
3 星号加在主题词和副主题词之前(对主题词加权)
标引划分
1,依文献的不同检索方法划分:主题标引,分类标引
2,依内容单元选择方式划分:整体标引(也称概括标引或浅标引),全面标引(也称深标引),重点标引(也称对口标引),分析标引
3,依所用标识受控程度划分:受控标引,自由标引,混合标引又称半控标引
4,依标引的自动化程度划分:人工标引,自动标引
5,依标引的 实施方式划分:集中标引,分散标引
6,依标引结果是否恰当划分:过度标引,过粗标引,适度标引
标引深度 指对一篇文献情报内容进行周详标引的程度,或者说标引一篇文献的主题数量,简单的表述是给予一篇文献的检索标识数量
标引等级 指将文献中的主题内容根据主要、次要按等级划分,分为三个等级,及一级概念标引,二
级概念标引,三级概念标引
标引等级和标引深度关系 等级决定深度
根据标引等级,标引深度分为 浅标引和深标引
参照系统 1,“用代”参照 2,“离分”参照 3“相关”参照
同义关系
用次 see 将款目词指引到主要叙词和次要叙词
代项X 将主要叙词成次要叙词的款目列出
属分关系 属次 see under 将某次要叙词归入主要叙词
分项 XU 将某主要叙词下位译列出
相关关系 参项:see 将某主次叙词参见另一主要,次要叙词
被参项 将某主次叙词被参见另一主要,次要叙词
:
标引等级划分标准
1,一级概念标引,也称主要标引,指揭示文献主要论点的标引,反应的是文献的核心概念,具体包括:(1),反映文献主要论点或作者研究目的的内容,占篇幅≥2/3
(2),有创新的实验研究或诊疗方法手段
(3),重点讨论的专指性内容
2,二级概念标引,也称次要标引,指揭示文献次要概念的标引,(1),文献讨论的次要重点占篇幅<1/3
(2),被讨论的实验方法或诊疗技术
(3),主要标引词的限定词
(4),特征词
3,三级概念标引,也称不要标引,仅在文献中被提到,但未加讨论的概念。(1),文中提到但未加讨论的常
规技术,
(2),为实验方法提供的条件
(3),未加讨论的表格中列出的各种 多项 同类概念
加权标引 指一种采用打星号的方式区分主要、次要标引的方法,即为所标引的主题词确定IM词和NIM词的过程
目的:突出文献重点,划分标引等级
-
主题标引基本流程
文献主题分析提炼主题概念———————>查表选词,转换主题概念—————>填写标引工作单————>标引结果审核
标引深度的控制 主题词加权
主题概念转换的类型 直接转换 分解转换
叙词语言 也称叙词法,是主题法中出现较晚的一种检索语言类型,以自然语言记忆为基础,以概念组配为基本原理,基本构成要素是叙词
医学主题结构模式中的4个范畴面
范畴面名称 因素名称 对应主题词的类别
主体面 主体因素 主题词
通用面 通用因素 副主题词
特征面 特征因素 特征词
位置面 位置因素 地理和机构名称主题词
概念组配 指用能够确切表达复合概念词构成成分的各个主题词的组配来表达复合概念含义的一种方法,其组配结果不着重于字面上是否与自然语言的复合词形相符
组配 在标引过程中将两个或两个以上的主题词按照一定的逻辑关系加以组织,以表达文献的一个复合专指概念叫组配
组配优先级 先组主题词>主—副组配>主—主组配
概念相交 即同级词组配:这是在两个或两个以上具有概念交错关系的同级主题词之间进行的逻辑推演,组配结果所形成的新概念,是原来两个概念的种概念
概念限定 即方面词组配,指由一个表示事物的叙词与另一个表示事物某个属性或某个方面的叙词所进行的组配,方面组配应以文献中论述的事物作为主体因素进行标引。其结果表达一个专指的概念
概念组配的方法 概念限定 概念相交 概念限定
主题词种类 主要叙词 次要叙词 副主题词(限定词) 入口词(款目词)
主要叙词 包括主要主题词,地理主题词,特征词,出版类型,类目词等
次要叙词 91年起停止使用
副主题词 用于标引,编目和联机检索以限定主题词。即强调主题词表示的概念的某些专指的方面
入口词(entry terms) 也称款目词。指引标引者查规范化主题词的记忆。一般是主题词的缩写和代用形式,包括同
义词,近义词,缩写,不同的拼音形式及代用形式
主题词的款目结构 是注释字顺表的基本结构单元。包括起目作用的主题词,必须考虑参照和主题词|副主题词组配参照,树状结构号,注释系统和参照系统5部分
主题词表(subject headings=叙词表theaurus) 是将文献标引人员或用户的自然语言转换成规范化名词术语的一种术语控制工具,是概括各或1门学科领域术语,并由语义相关,族性相关的术语组成的规范化的动态词典
参照系统有3种 “用待”参照-——揭示“等同关系” “属分参照”——揭示“等级关系” “ 相关参照”——揭示“相关关系”
医学主题词树状结构表 在检索语言的发展史上被誉为主题分类-题化编制技术的重大发展,由于它的分类分级像一颗倒挂的树,从树干分到树枝,层层划分,逐级展开
C类主题词标引规则
1,先组词标引,一般的先组词形式,:器官疾病型,器官有机体疾病型,特定疾病名称,各种综合症,动物疾病主题词(猪疾病)
2,组配标引 ,如果没有器官-疾病先组词,可用两种组配标引(1)“*器官”+“上位器官疾病”
(2)“*器官”+“上位器官疾病”
3分别标引原则和三的原则 当一篇文献同时论述多种疾病的三个以内无论各疾病间的关系如何,均可分别标引,并根据内容加权;三个以上,同类疾病,归上位词并加权,不同类疾病,选择<=3个加权标引
,
副主题词“代谢”
1,含义,有器官,细胞或用有机体和疾病主题词组配,表明某生化变化和代谢,等化学物质组配,表明其分解代谢过程,对于合成,生物 合成,对于酶学,药代动力学和分泌,则用相应副主题词
2,组配模式 1(化学物质)/ *代谢 (器官)(疾病)/代谢 专指代谢主题词
2(酶)/ *代谢 (器官)(疾病)/*酶学
3,标引细则,1,“/代谢”是“/分析”“/化学”“分离和提纯”“药代动力学”等几个相关词中最常用的一个副主题词,与内源性化学物质组配,表明疾病或药物或生理因素导致含量变化用模式。(1)也包括化学物质的结构变化,与外源性化学物质组配,生物化学过程用“/代谢”,物理化学过程用“药代动力学”,
2,同义词很多,注意转换,如结合,破坏,裂变,转变,降解,掺入,调动,释放,储存,传输,转代,利用,摄取等,以及像水解,氧化,去甲氧化,脫羟化,完化,酯化,羟化等在活体内的参与过程,也可用代谢
汽车电子调节器
3,下位词较多,eg。“/酶学”“/分解”“/血液-尿-脑脊髓液”“
/生物合成”用模式(3)
4,传染病的化学或生物化学均组配“/代谢”
标引深度的影响因素,
1,标引深度与检索效率。标引深度与检索效率是一种互逆相关性。
家传秘方2,标引深度与标引或效益。标引深度与标引成本成正比
3,标引深度与被标引文献,被标引文献的价值与标引深度应一致,
4,标引深度与检索工具,标引深度适应检索工具或检索系统用户的检索要求,
5,标引深度与情报检索语言,情报检索语言的类型与标引深度有关联
误码率
6,标引深度与文献分析,标引深度取决于文献分析
关键词 指出现在文献的,对表征文献主题内容,具有实际意义的词
,
树状表将MeSH主题词分为15大类,114个亚类
A:ANATOMY解剖
B:ORGANISMS有机体
C:DISEASES疾病
D:CHEMICALS AND DRUGS 化学制品和药物
E:ANALYTICLS.DIAGNOSTIC.&THERAPEUTIC TECHNIGUES AND EQUIPMENT 分析,诊断和技术的技术和设备
F:PSYCHIATRY AND PSYCHOLOGY精神病学和心理学
G:BIOLOGICAL SCIENCES生物科学
注释符号
主题词义注释
GEN 仅用于泛指的,概括的,总论性的文章,最好用专指主题词
SPEC 仅用于专业或学科,不用于组配词
= 等于或……的同义词
组配注释
no qualify 不得组配任何副主题词
only/ 仅可组配下列副主题词
do not use / 不可组配下列副主题词
SPEC qualify 仅能使用可与专业(学科)组配的副主题词
All qualify 仅能使用可与专All类组配的副主题词
coord with 组配或与……组配
Interval+ 与……组配
标引规则注释
TN 《技术札记》及其编号
Manual 《标引手册》及其所引用的章节号
中华整形美容论坛
+with number 如Manual 23.26+ 指《标引手册》的23章26节及其所属各小节
policy 标引总方针
其他注释符号
IM 通常用作IM词
NIM 通常用作NIM词
IM or NIM 用作IM词还是NIM词取决于文章的倾向度或是重点
DF 标引工作单或联机所用缩写或缩略形式
编目注释 一般在标引注释后有一个明显的空格分开,并冠以“CATALOG”
树状结构表作用
1,用以确定该主题词的族系属性
2,是标引人员和检索人员选择专指性主题词的依据
3,可以满足族性检索的要求
4,可作为制定检索策略的依据
5,勤查树状表可以逐渐加深标引人员对医学领域知识的了解
6,提高联机检索效率
7,可以满足生物医学科学未来进展的长远需要
特征词(check Tags) 缩写为“TG” 是一种标识的概念,在生物医学文献主题标引中是指标引工作单中所设置的代表某些特殊概念的词组
副主题词(sub headings) =限定词 (Qualifiers) 指明主题词所讨论的重点课题的自然范畴或通常发生的