国家社科基金项目
基于本体和知识集成实现中文叙词表的升级、共享和动态完善 (项目编号05CTQ001)
成果简介
曾新红研究馆员
深圳大学图书馆
2007年11月26日
项目目标
•为中文叙词表的升级、共享和动态完善
logistic模型
提供一种富有生命力的、可同时满足人
扎那米韦
的需求和M2M(Machine to Machine)需求的解决方案,将叙词表的网络化发
深
圳
企业供求
大
学
图
书
•都是知识组织系统(KOS )的高端形式
–通过不同类型的语义关系进行组织和结构化
•表现形式不同
亚当斯密–叙词表主要供人使用
•知识粒度粗细不同
–叙词表规定只含用代属分参关系–本体可定义更具体的词间关系
深圳大学图书叙词表的价值
•叙词表是严格的受控词表,作用:
•通过词间关系明确词义,有助于标引人员及用户正确选择叙词。
•通过词间关系将叙词联结成语义网,便于计算机处理与扩大检索途径。
•通过词间关系可以区别各词在语义网中的功能与作用,并于进行用词控制及系统语义控制。
蚕豆剥壳机
•几十年研究历史,积累了丰富的理论和实践经验。•一百多部综合或专业中文叙词表,是我国图书馆界的宝贵财富。
•在网络环境下,对叙词表的需求和机遇前所未有,其价值远超folksonomy 等松散的知识组织形式。
•例如:叙词表可以在自由文本搜索引擎中作为一种查询扩展资源使用(有时称为“search thesauri ”)
深圳大学图书叙词表的困境及发展趋势
•叙词表面临的困境:
–依靠专业人士理解和使用,访问困难,对检索者不可见;无法满足机器对机器的要求。–更新速度慢。
深海异种•发展趋势
–寻一种变通的方式使受控的叙词表可以被检索者更快捷、更容易、更直观地利用。
–系统间的协作意味着叙词表可以更容易嵌入到诸如图书馆自动化系统、数字图书馆系统、目录管理系统、搜索引擎和入口网站等应用系统中。
•形式化(实现M2M (machine to machine ))、网络化(实现共建共享)是让传统的中文叙词表焕发新生的最佳途径。
深圳大学图书构建中文本体的意义
•本体的作用
–语义Web 的核心
–支持各种基于本体的研究和应用
•从零开始构建困难,演化维护同样困难。单靠机器学习来构建还达不到实用要求,机器辅助人工修订比较现实。
•利用已有知识组织系统构建本体事半功倍,已成趋势。(如UMLS ,NCI 等)•国内关于中文本体构建的实践较少,网上中文本体匮乏。