西藏风自记纸数字化建设成果

气象科学《西藏科技》2021年1期(总第334期)
西藏风自记纸数字化建设成果
薛改萍次珍*次仁
(西藏气象信息网络中心,西藏拉萨850000)
摘要:基于气象资料信息化管理和大规模数字化普遍应用的要求,纸质气象资料的数字化、信息化建设速度 加快,其建设成果在积极应对气候变化、服务地方社会经济发展和建设一个现代化气象业务管理体系上将起到 积极作用。文章介绍西藏E L型电解风向风速自记纸纸张扫描、基于软件的数据自动处理生成和数据质量检查、数据集制作等建设工作过程。
关键词:历史纸质气象资料风向风速自记纸数字化成果
西藏气象局在近10年的时间里,在中国气象局预 报与网络司的精心统一协调组织和具体领导下,共开 展了8期气象历史观测数据资料数字化业务建设工 作,对大部分纸质观测资料开展了图像扫描、图像文 件整理、基于软件的数据生成和成果上报等多项数字 化业务建设项目。由于气象业务面向现代化发展和 服务经济社会的需求,特别是超长序列数字化气象资 料在应对气候变化、精准精细提供预报预测气象服务 及清洁能源建设开发和利用方面具有基础性数据支 撑作用,为持续提升全区气象观测资料数据信息化
处 理水平,西藏气象档案馆对13个风自记观测站历史资 料进行数字化采集处理[1]。
1风向风速自记观测纸的馆藏现状、数字化意义
1.1现状与意义
西藏共有13个风自记观测站,最早观测时间从 1954年6月开始,由于其中相当部分的纸张已有不同严 重程度的图纸变质、笔迹模糊、纸张过度磨损等情况。
为更好更高质量的数据保护、拯救、妥善保存及 有效利用,需要将所有自记观测纸扫描,并通过专用 软件将纸张上的风向风速记录转为数据,最后形成的 数字产品将为西藏高原长年风的气候研究、经济社会 建设和服务提供基础数据。
1.2数字化建设内容
根据中国气象局《山洪地质灾害防治气象保障T.程》(以下称山洪项目)2019年项目实施方案明确要求,需开展西藏历史纸质气象资料数字化建设工作。本研 究旨在西藏自治区共13个风自记观测站丨954—2010 年共计134913万张[I)E L型电解风自记纸进行图像 扫描、数字化和质量审核,并最终生成标准的数据集产品。
2数字化技术解决方案
2.1数字化建设技术思路
西藏自治区气象信息网络中心在中国气象局技 术组的统一组织和技术指导下顺利开展了这项建设 工作,需要完成西藏13个站的E L型风自记纸的馆藏 统计、扫描提取有效数据以及制作数据集工作,并按 照项目建设技术组统一制定的相关技术解决规范和 质量标准上报数字化建设成果。
2.2图像文件扫描与文件处理
2.2.1扫描设备。扫描设备选用柯达i3200E,扫描的 分辨率为300dPi,采用彩底片扫描,该设备具备扫 描容量大、速度快,图像清晰的特点。存储后图像文 件为JPG格式。
2.2.2图像资料借阅。由于自记观测纸属于观测原 始记录,在资料扫描借阅时,原始记录依据馆藏档案 借阅规定不能被借出气象档案馆,所有图像资料文件 扫描和数据提取必须在西藏气象档案馆内进行,并按 照档案管理制度有关规定办理借阅登记手续,完成后 按照原有装订的顺序将资料恢复原状,及时归还。同时档案管理人员还一定要再次进行检查核对,确保借 出的档案资料收回后真实无误。
2.2.3图像文件预处理。首先需要对E L型风自记纸
*通讯作者50
《西藏科技》2021年1期(总第334期)
按照“风自记纸预处理技术规定”对扫描的风自记图 像文件纸进行预处理,按照气象档案馆风自记资料详 细准确地登记资料档案种类、版面规格、站名、站号、年、月、换上前和换下后使用时间是否完整,是否正 确,有无出现缺测、备注和数量(有效记录面的页数)。扫描模式参数的正确设置是根据扫描资料纸张状况 和根据需要提取的扫描资料数量来确定,主要包括设 置扫描资料模式和设置扫描资料分辨率。笔迹不清 楚的、有多种不同颜笔迹的,设置扫描分辨率为 150dPi,笔迹清晰可辨的,设置该扫描分辨率为300dPi。对纸质有破损或纸质脆化厉害的资料要及 时进行详细备注,扫描时还要特别注意安全保护。
象纸2.2.4图像处理。为保证已扫描好的图像清晰可靠使 用,要提前对扫描好的所有图像进行预处理,避免出现 图像重页、错页、漏页、扫描完后黑屏、页面不齐、倾斜、模糊等图像问题,要充分利用图像扫描处理软件及时 除去扫描过程中的一些图像杂乱点和脏点。同时要进 行图像偏差调整处理,图像与中间水平线夹角不能大 于3度,在视觉感上基本没有偏斜角度为准。
2.3质量检查
2.3.1图像文件检查。检查图像文件质量分为人工 质量检查和应用程序质量检查两个部分。人工质量 检查主要是检查扫描图像是否清晰、有无任何歪斜、颠倒、扭曲或变形情况,黑边和污点是否需要处理,文 件命名是否和自记纸标记时间一致等。应用程序质 量检查主要检查扫描一个图像文件的完整性,看有没 有错误的重命名、漏扫等一系列问题1。
2.3.2数据质量检查。对数字化完的数据质量必须 进行检查,其结果要有详细备注,备注的主要内容包 括编写数据集质量检查报告,包含图像扫描文件检查 情况、数据提取及问题处理情况、数据集质量文档制 作流程说明等[3]。
3数字化成果-数据集
按照中国气象局相关技术标准规定,数字化的最 终成果要制作为标准数据集,数据集主要包括:气象 数据集实体存档文件)、元数据实体文档(metadata)、说明解释文档(如crip<ion)、附加说明文 档(docitm enfcs)、readme_t xt文件 ]。
E L型电接风向风速自记纸数据提取结果文件包 括:图像预处理后提取图像文件jpg文件)、风自记迹 线文件(gal迹线文件)、提取效果数据文件(png文 件)、数据库提取文件(db文件)、风自记纸分钟数据提
气象科学
取文件(Fm文件)、小时数据提取文件(F件)共6 类文件。
按照规范要求,必须用四级标志目录来存储代表 文件与数据上报B录。
XX_YYYYMM[-CCn](—级目录:数据省份代码 _年月,年月为报送时间;CCn为每年重报标识,n为每 年重报次数)
Iliii(二级目录:区站号代表区域和站点编号)
Pic(三级目录:小时图像文件和小时跟踪数据文 件)
Y Y Y Y(四级目录:代表年份)该目录下同时存放 jpg文件和gal文件
Fm(三级目录:分钟风数据文件)
Fh(三级目录:小时风数据文件)
BZ(三级目录:备注数据文件)
FZJ-IIiii.db(数据库文件)
数据集清单见表1。
表1西藏E1,型电解风自记纸扫描图像文件数据集清单
数据集名称资料年代台站数文件数数据量
西藏E L型电解
风向风速自记纸
扫描图像文件数
1954—2010年131********GB 据集
4结束语
项目建设成果将对全区气象档案馆馆藏历史资 料由于有不同程度的变质、字迹模糊、纸张磨损等情 况有一个质的保护、拯救及保存,进一步提高西藏自 治区基础气象观测资料业务的规范化、信息化和现代 化建设水平,成果所产生的数字化基础气象资料将更 便于信息化条件下的资料管理和普遍应用,能有效地 帮助提高基础气象观测资料在相关业务和科研的使 用效益,在应对气候变化和建立现代气象资料业务体 系起到积极作用。
参考文献
[1] 王小宁,夏巧利.陕西省风和气温自记纸数字化建 设成果[J].陕西气象,2015(02):35-37.
[2] 张聪娥.陕西省历史高空气象观测记录表数字化 成果[J].陕西气象,2014(2):36-38.
[3] 文芳一,谭斐,王超球,等.广西区高空探测记录表 数字化建设工作探析[J].气象研究与应用,2012,33(4): 78-79.
编校辛霞霞
51

本文发布于:2024-09-21 20:39:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/352625.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:扫描   数据   气象   资料
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议