平台以“全国师范院校图书馆联盟”部分参建馆馆藏方志资源为基础,集成包括纸质、电子和数字资料,力求厘清方志在所有参建馆的收藏情况以及获取资源的途径,通过分期建设,打造统一的方志资源发现、资源数据化、数字人文研究素养教学以及学者研究平台,为用户提供基于平台的学习、研究、交流和教学环境()。 一、平台数据结构
试水接头平台底层数据应用关联数据技术,可以将方志资源中的数据、事实和其他知识点进行细粒度描述,利用机器能够理解的编码方法和技术手段,重新组织方志书目数据,使图书馆的数据从封闭、静态、专业性强的MARC格式中解放出来,在Web上提供一致、开放和标准的开放数据服务,这样的书目数据才能被搜索引擎抓取,被第三方程序调用,方便地与互联网上的数据关联、融合。
复用美国国会图书馆的BIBFRAME2.0书目数据模型,即“作品-实例-单件”3层模型结构,设计方志本体模型。
cpich BIBFRAME2.0核心模型
二、平台数据(还在持续加工)
1、平台收录数据机构(还在更新中…):
北京师范大学 (20764)
上海师范大学 (18580)
陕西师范大学 (10284)
沈阳师范大学 (9337)
以下相同数量为仅标注购买电子资源,故各馆数据量相同
东北师范大学 (9141)
内蒙古师范大学 (9141)
安徽师范大学 (9141)
感应门制作河南师范大学 (9141)
浙江师范大学(抗石击涂料4741)
2、平台全文OCR数据
平台通过委托加工(OCR)方志资源1600多种,目前正在上线中,准备开放一部分供参建馆作为训练数据集,提供用于标注和可视化工具展示的基础数据。一期通过关联版本元数据,提供160种左右OCR全文,供参建馆作为训练集数据,后续还将上线全文资源。
三、一期平台功能(主要基于资源发现)
氟橡胶成分分析(说明:平台页面布局可能会随着功能的改进而工字扣有所改变)
1、多途径分面细化检索
一般检索时,平台可以从标题关键词、责任者、朝代、地域等分面细化限定检索结果。