分布式存储在专科医院PACS系统的应用研究

第38卷第5期   计算机应用与软件
Vol 38No.52021年5月 
ComputerApplicationsandSoftware
May2021
分布式存储在专科医院PACS系统的应用研究
袁骏毅1 尤丽珏2
 潘常青1
(上海市胸科医院(上海交通大学附属胸科医院) 上海200030)
(上海交通大学医学院附属瑞金医院卢湾分院 上海200020)
收稿日期:
2020-05-14。上海市经信委人工智能创新发展专项(2019-RGZN-01081);上海交通大学转化医学交叉研究基金项目(ZH2018ZDA28)。袁骏毅,正高工,主研领域:医疗信息化。尤丽珏,高工。潘常青,硕士。
摘 要  充分利用新兴的分布式存储技术,改善专科医院由于影像量较大导致调阅缓慢的现象,提升临床工作效率。以上海市胸科医院为研究背景,评估合理的存储容量配置,实施基于分布式存储的PACS系统,选取上线前后的情况作为对照组和观察组,实证分析应用效果。研究结果表明,分布式存储架构相比较原有的集中式存储,对于小文件数量多且容量大的CT、MR、PET等影像,下载速度显著提升约106%~179%。随着医院便民服务举措的深化,检查影像的电子化调阅延伸到患者手机,建设高效稳定的分布式存储,有助于智慧医疗和互联网医院的蓬勃发展。
关键词  分布式存储 PACS系统 下载速度 负载均衡
中图分类号 TP3    文献标志码 A    DOI:10.3969/j.issn.1000 386x.2021.05.005
APPLICATIONRESEARCHOFDISTRIBUTEDSTORAGEIN
PACSSYSTEMINSPECIALIZEDHOSPITAL
YuanJunyi1 YouLijue2
 PanChangqing
11
(ShanghaiChestHospital/ShanghaiChestHospitalShanghaiJiaoTongUniversity,Shanghai200030,China)
(LuwanBranchHospitalofRuijinHospital,ShanghaiJiaoTongUniversitySchoolofMedicine,Shanghai200020,China)
Abstract  Tomakefulluseoftheemergingdistributedstoragetechnologytoimprovethephenomenonofs
lowaccessduetothelargeamountofpicturesinspecializedhospitalsandimprovetheclinicalefficiency.TakingShanghaiChestHospitalastheresearchbackground,reasonablestoragecapacityallocationwasevaluated,PACSsystembasedondistributedstoragewasimplemented,andthesituationbeforeandafterthelaunchwasselectedasthecontrolgroupandtheobservationgroup,andtheapplicationeffectwasempiricallyanalyzed.Experimentalresultsshowthatcomparedwiththeoriginalcentralizedstorage,thedistributedstoragearchitecturesignificantlyimprovedtheclinicaldownloadspeedofCT,MR,PETandotherimageswithlargenumberofsmallfilesandlargecapacityby106%-179%.Withthedeepeningofthehospital sconvenienceservice,theelectronicretrievalofexaminationpicturesextendstopatients'mobilephones,andtheconstructionofef
ficientandstabledistributedstorageisconducivetothevigorousdevelopmentofintelligentmedicaltreatmentandInternethospitals.
Keywords  Distributedstorage Picturearchivingandcommunicationsystems Downloadspeed Loadbalancing
0 引 言
医疗影像是循证医学证据链的关键环节,对临床
医生的诊断和手术方案起到了重要的影响[
1]
。医生需要高效地调阅到检查影像,确保患者得到及时有效的
。随着医学技术的创新和医技检查的增多,影像
数据日益呈现快速的增长趋势,影像的读取性能成为
医院信息管理者面临的难点问题[2]
。医院通常在存储
上投入了较大的成本,然而很多架构规划偏重于满足
容量的要求,使用效果未达到最佳[3]
。近年来,分布式技术广泛应用于海量数据的任务处理,Essa等[4]
第5期   
袁骏毅,等:分布式存储在专科医院PACS系统的应用研究
33
 出:采用智能负载分配的分布式存储有助于实现大容量数据的安全管理和高效利用。
上海市胸科医院是一家学科特鲜明、以心肺手术为主的三级甲等专科医院,
2019年放射科、超声科等医技检查41.2万人次,随着院内原有影像归档和通信系统(
PictureArchivingandCommunicationSystems,PACS)中影像的不断累积,调阅速度日趋缓慢。因此,医院实施基于分布式存储的P
ACS项目,以满足影像调阅的性能需求。本文通过实施前后的数据对比,验证分布式存储的应用效果,为利用信息技术手段优化临床工作提供借鉴参考。
1 现状分析
PACS的主要作用是采集、传输和处理医技检查所
产生的医学影像,实现全院的数字化存储和共享[
5]
。PACS实时采集设备的影像数据,在医技工作站上进行相应处理,剔除部分无用的序列,标记关键帧,归类存储到信息机房。医学影像采用符合国际标准I
SO12052的影像通信格式(
宁波px事件
DigitalImagingandCommunicationsinMedicine,DICOM)。医技科室的医生在检查报告系统(
RadiologyInformationSystem,RIS)书写检查结论时,以及临床医生在电子病历系统(ElectronicMedicalRecord,EMR)中查看检查报告时,均需要从PACS里调阅相关
影像资料[6]
湖北理工学院人文社科部
。PACS体现了医院无纸化胶片的应用水
平,其运转效率直接影响到临床诊断和后续措施,
是保障医疗质量的基础[7]
医院PACS始建于2006年,其文件容量至2015年仅有63.77TB,至2019年底已达到245.83TB,呈井喷式增长,如图1和图2所示。PACS作为大容量数据对象的信息系统,在性能上承担着较大的压力,调阅成为临床使用者不满意的矛盾聚焦点,主要体现如下:①随着精密设备如264排CT的投入使用,以往单个患者的影像大小约250MB,现已增长到近800MB,每次调阅从以前的10~20秒上升到40~60秒,临床感受度非常差,时有投诉;②专科医院专注于有限的病种,检查报告的质量要求较高,书写检查结论时需对比本次及历年的影像,由于总容量已超越单台存储的上限,历年图像存在于近线存储设备中,应用软件寻址效率受
到架构制约[8]
;③医院网络为万兆主干、
千兆到桌面,重点科室如放射科的P
C采用全闪存硬盘,网络和PC的调整手段已非常有限。因此,信息中心面临着较大的压力,应用新技术和成熟稳妥的方式提升PACS性
能的需求相当迫切。
图1 2009年—2019
年影像文件容量
图2 2009年—2019年影像文件数量
2 分布式技术
围绕着快速访问和大容量存储的目标,PACS分为
集中式和分布式两种存储模式[9]
。集中式存储以阵列
叠加和外部软件寻址为特征,可靠性较高但横向扩展不易;分布式存储是面向多节点的新兴存储技术,依赖于分布式文件系统,数据分散在网络互连的多台独立
设备[10],每台设备作为一个节点,多个节点构成通信
和传输的网络,集合成为整体从而对外提供存储服务。分布式文件系统将数据管理任务均衡地分布到每个存储节点上,达到各司其职和彼此协同的目的。分布式技术提升了存储的模块化横向扩展能力,
具有高并发访问和大规模扩容能力,同时有效降低了升级维护硬
件的成本,已成为存储领域的应用发展方向[11]
。集中
式和分布式对比见表1。
表1 集中式和分布式存储技术对比
类型
指标集中式存储分布式存储读写性能
写入
效率
写入路径短,耗时较少
写入路径及耗时略长
读取效率
单台读取路径短,级联多台设备存在寻址的时间损耗文件控制副本读取,性能随容量呈
现线性增长经济
成本
存储成本需合理分配快速盘
和低速盘比例,成本较高
使用通用的X86硬
件,
价格相对低廉软件成本
软件通常必须配套同品牌的设备
软硬件松耦合,成本具有竞争力
34   
计算机应用与软件2021年
续表1
类型
指标集中式存储分布式存储技术稳定
技术
刘桂苏成熟
技术发展相对成熟升级方便可定制,新特性推出较快负载均衡
依靠自带Raid磁盘平衡,多套设备间无法互相分摊
多台设备同步副本冗余,彼此分摊压力 
此前,国内一般采用进口的存储分布式文件系统,主要有Ceph、Hdfs等,两者均为成熟的开
源代码,具有较好的可维护性和可扩展性,属于强容错能力的企业级对象存储生态环境,研发人员进行调优及外围功能的扩展
[12]
。然而,此方式也存在一些局限:①适合高
吞吐量的大文件存储,对于数量较大的小文件的读取优势并不明显,高并发和随机读取的应用场景较为受限。②国外的开源代码具有成本低廉性,但是不可避免存在较高的黑客攻击概率
[13]
。健康数据作为国家
基础性战略资源,生物样本更是信息安全的重点关注内容,若存在安全漏洞,将产生较大的数据泄密风险。因此,近些年部分科研机构和存储厂商,自主研发国产化专用代码的分布式文件系统,以便更安全、可靠地保护医疗行业的数据。
3 投入评估
由于PACS存储容量较大,若一次性更换原有集中式存储,则总成本(TotalCostofOwnership,TCO)十分昂贵,项目推进必须考虑投入产出比。IT项目的价值体现在无形资产的隐性回报,通过提高工作效率和降低劳动成本反映,需要从有效性等方面进行综合考量
[14]
。本文使用广泛应用的动态投入产出模型,即面
临T
CO投入的线性规划方案,存在着受扰动的非线性影响(考虑原有未到报废期资产的保值),数学模型的目标函数如下:
S(x)=saAi+sbBi+scCi
(1)
式中:S(x)为产出量;Ai为新增资产的单项投入;Bi为原有资产的单项价值;Ci为消耗后用于扩大再生产的投资;sa、sb、sc分别为单位周期的原有资产、新增资产和剩余资产的价值产出系数;i代表不同的检查类型,i=1,2,…,n。
为简单而不失同质化,假定:①S(x)形成的产能满足PACS需求;②IT项目投入并不直接导致再生产,即Ci=0
;③不同检查的存储占比不同,权重值总和等于1。通常2至6个月内影像调阅频率较高,术后随访等后期调阅相对较少。因此,本文使用新投资Ai的命中率来表示整体有效度,函数表达式为:
RHit=∑n
i=1
λiMi/(Mi+Ni
)(2)
式中:Mi代表周期内新投资的使用数;Ni代表原有投资的使用数;λi代表不同检查类型的权重。
命中率越大代表了投资的有效性越高,根据最佳
投入产出模型的统计结果[15]
,当接近0.92时,性价比
达到较优状态。
以I2B2信息抽取评估法为参考依据,结合医院现有检查的应用分类,可分为放射科、超声科、导管室和
核医学等实体类型[
16]
。通过对2006年至2019年PACS数据进行分析,按类型分布情况见图3
。在式
(2)的近似取值计算中,特征函数的权重∑n
j=1
λj=1
。由分布数据可得知,j∈(1,4),λ1=0.9187,λ2=0.0216,λ3=0.0121,λ4=
0.
0476。图3 2006年—2019年PACS数据分布权重
以1个月的检查调阅情况为基准,将2019年12月的17.71万次调阅数据导入计算集,迭代分析命中率,结果如图4所示。根据评估计算结果显示,S(x)的首次投资最佳期为10个月,参考2019年的数据量,约为50TB。
图4 投入评估的迭代计算
4 实施架构
基于项目投资建设评估,在保留原有350TB集中
第5期   
袁骏毅,等:分布式存储在专科医院PACS系统的应用研究
35
 式存储的基础上,医院于2020年3月投入使用50TB的碧海分布式存储,放置在安全隔离区(DemilitarizedZone,DMZ)。该存储的文件系统并不基于开源软件,由上海交通大学背景的团队自主研发,具有完全的独立知识产权,可在线扩展到1024个节点。PACS整体架构如图5所示。影像的上传下载采用文件传输协议(FileTransferProtocol,FTP),在部分场景支持优化定制的开发工具包(SoftwareDevelopmentKit,SDK)。检查仪器采集的影像数据,以FTP方式上传至分布式存储。检查报告工作站和临床医生工作站调阅时,先从DMZ的RIS、EMR数据库读取患者资料、检查结论等结构化数据项,然后发出影像下载请求。DICOM网关内置统一的影像寻址排序规则,先至分布式存储下载,若不到再被分配至集中式存储下载。面向互联网业务的掌上医院等移动应用通过网闸、防火墙设备,以S
DK接口获取并实时生成云胶片。管理后台设有定时任务,当分布式存储使用量即将到达上限时,计划任务会自动将影像以多线程流媒体方式转储到集中式
存储。
图5 PACS系统的分布式存储架构
5 实证分析
选取2020年1月原有集中式存储的影像交互情况作为对照组,2020年3月应用分布式存储架构的影像交互情况作为观察组。提取DICOM网关记录的客户端请求日志,交互速度=请求完成时间-请求开始时间。纳入及排除标准:①纳入调用IP为医生工作站的记录;②排除返回状态为失败的错误记录;③排除请求起始间隔大于600s的异常记录。两组样本在交互例数、文件个数、文件容量、网络基础等方面的差异均无统计学意义,具有可比性,如表2所示。
表2 样本数据统计
对照组检查
类型
影像种类上传
下载检查/例
影像个
数/万
影像容
量/GB
检查
/例
影像个
数/万
影像容
量/GB
放射
科类
CT
196421058.174370.111773459734.4537936.43MR146868.6888.17
7638
336.05542.15DR
67361.50215.49123143.23897.06超声
科类彩超
6648
0.92
13.75
14727
1.98
广水四中
32.51
导管室类DSA4060.7374.5629074.94573.56
核医学类
PET1250144.69268.89
3121373.26620.76
观察组检查
类型影像种类上传
下载
检查
/例影像个
数/万
影像容
量/GB
检查
/例
影像个
数/万
影像容
量/GB
放射
科类
CT203411088.324410.2018319210217.2339341.97MR150171.5791.40
8286
373.21578.01DR
69891.58246.65130823.45955.31超声
科类彩超
6922
0.97
14.29
15318
2.17
36.20
导管室类DSA4380.7876.9931285.34634.43
核医学类
PET1319159.51281.743743448.74755.07
主要观测两方面指标:平均上传时间(UP)和平均下载时间(DN),下标1、2分别表示对照组和观察组。使用S
PSS23.0软件进行统计分析,分步式存储应用后的效果见表3
。表3 应用后效果对比(x±s)
影像种类上传
下载
UP1/sUP2
/sT值P值
DN1/sDN2
/ST值P值永磁同步电动机
CT
60.44±16.1763.08±15.78-0.17>0.0548.02±17.5019.54
±8.198.19<0.001
MR
52.97±12.3155.29±11.61-0.13>0.0542.25±13.1220.17
±5.626.64<0.001
DR
4.99±0.295.09±0.25-0.27>0.05
4.02±0.343.37
±0.304.81<0.05彩超
1.00±0.100.98±0.090.51>0.05
1.01±0.111.11
±0.15-1.94>0.05DSA
14.03±2.3014.41±2.14-0.23>0.056.80±3.375.73
±1.215.80<0.01
PET
63.91±17.2468.02±16.31-0.24>0.0561.84±18.3922.46
±10.03
10.28<0.001
36
    计算机应用与软件2021年
  由数据分析可以得出:①上传速度无显著差异(P值大于0.05),表明分布式存储并不会导致归档加速或延迟;②下载速度有着显著差异,分布式存储有着明显的优势,单次下载包含的文件多且容量大的CT、MR、PET最为显著(P值小于0.001),提升速度106%至179%之间,包含文件不多但文件容量较大的DR、DSA则较为显著(P值小于0.05),提升20%左右;
③对于文件个数和容量均不大的彩超,无论是上传还是下载,分布式与集中式存储的差异并不明显(P值大于0.05)。需要指出的是,由于检查影像归档为后台自动进程的异步上传,使用者并不会体验到上传速度的变化,而单次调阅的下载速度,则直接影响到使用者的感受度。由此可见,分布式存储的应用对于临床带来了明显优化的使用效果。
6 结 语
随着医疗仪器精密度的提高和检查覆盖范围的变宽,专科医院普遍面临着PACS影像容量急速增长的现象。分布式存储在多并发情况下的高吞吐特性,可以更好地解决资源利用率低、调阅速度缓慢等问题。本文通过医院PACS存储的建设情况,进行了投入的规划评估,对比了实施前后的影像上传及下载速度;依托于高效稳定的分布式存储,显著加快了临床检查影像的调阅速度,提高了医生的工作效率。在后续工作中,医院将逐步增加分布式存储容量,以满足日益增多的电子胶片调阅需求。随
着互联网医院的建设,新兴信息技术和医疗业务应用的充分融合,已成为医院信息化重点发展的方向。
参考文献
[1]陈彬彬.PACS系统中医学图像的交互式异地存储系统探究[J].科学技术创新,2019(28):88-89.
[2]蒋鹏,李新献.移动医学影像系统的建设[J].电子技术与软件工程,2019(10):12.
[3]魏立勇.PACS在医学影像科的应用探讨[J].影像研究与医学应用,2019,3(9):65-66.
[4]EssaYM,HemdanEE,El MahalawyA,etal.IFHDS:Intel ligentframeworkforsecuringhealthcarebigdata[J].JournalofMedicalSystems,2019,43(5):11-23.
[5]朱巧巧.医院PACS系统的构建与发展研究[J].江苏卫生事业管理,2020,31(
2):215-217,220.
[6]袁骏毅,陈璨.基于ESB的医院统一移动支付平台应用研究[J].中国医疗设备,2020,35(3):101-103,119.[7]丁炎丽.PACS RIS系统在放射科质量管理中的应用效果[J].中国乡村医药,2020,27(6):61-62.[8]李丹,叶廷东.“异地多活”分布式存储系统设计和实现[J].计算机测量与控制,2020,28(4):211-216.
[9]金天骄.分布式存储取代集中式存储可行性分析[J].邮电设计技术,2019(10):84-87.
[10]TebbiA,ChanTH,SungCW.Linearprogrammingboundsfordistributedstoragecodes[J].AdvancesinMathematicsofCommunications,2020,14(2):333-357.
[11]SharmaR,Karimi GhartemaniM.AddressingabruptPVdis turbances,andmitigatingnetloadprofile srampandpeakde mandsusingdistributedstoragede
vices[J].Energies,2020,
13(5):1-21.
[12]桑杰,许雪姣,刘硕,等.基于国密算法的分布式加密存储研究[J].数据通信,2020(1):9-12.
[13]王梦童,邵培南.Ceph分布式存储系统拟态防御设计[J].信息技术,2020,44(2):43-48,57.
[14]万晓榆,罗焱卿,袁野.数字经济发展的评估指标体系研究———基于投入产出视角[J].重庆邮电大学学报(社会
科学版),2019,31(6):111-122.
[15]蒋训林.我国信息产业的投入产出分析[J].全国流通经济,2019(34):125-127.
[16]李飞,朱艳辉,王天吉,等.基于医疗类别的电子病历命名实体识别研究[J].湖南工业大学学报,2018,32(4):
67-72. 
(上接第31页)
[8]JoshiR,CastelloteGP.Acomparisonandmappingofdatadistributionserviceandhigh levelarchitecture[EB/OL].
(2006)[2019-09-23].https://www.rti.com/hubfs/
docs/Comparison Mapping DDS HLA.pdf.
[9]DowningC.DemonstratinginteroperabilityusingconnextDDS[EB/OL].(2018-12-20)[2019-09-23].https://
www.rti.com/blog/i itsec 2018 demonstrating interoperability using connext dds.
[10]Real TimeInnovations.Modeling,simulationandtraining(MS&T)[EB/OL].[2019-09-23].https://www.rti.
com/industries/aerospace defense/training simulation.
[11]DeckerMJ,SwartzK,CollardML,etal.Atoolforeffi cientlyreverseengineeringaccurateUMLclassdiagram
[C]//2016IEEEInternationalConferenceonSoftwareMa intenanceandEvolution(ICSME).IEEE,2016:607-609.[12]ParkY,MinD.DevelopmentofHLA DDSwrapperAPIfornetwork controllabledistributedsimulation[C]//20137th
InternationalConferenceonApplicationofInformationand连轧
CommunicationTechnologies.IEEE,2013:1-5.
[13]ParkY,MinD.DistributedtrafficsimulationusingDDS communicationbasedHLAforV2X[C]//2015SeventhIn ternationalConferenceonUbiquitousandFutureNetworks.
IEEE,2015:450-455.

本文发布于:2024-09-22 03:56:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/8924.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分布式   影像   应用
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议