碎纸机拼接复原问题

标准化的条状纸带的采集模板(1)、用于将采集模板(1) 上的条状纸带转换为数字图像并
保存原始的图像文件的扫描仪(2) 和对所述的图像文件进行处理使已被破碎的文本信息
恢复原样的计算机(3) 构成。
2. 如权利要求1 所述的恢复系统,其特征在于:所述采集模板(1) 是长方形,其上沿径
向均匀设置有用于镶嵌条状碎纸的矩形槽(4)。
3. 如权利要求2 所述的恢复系统,其特征在于:所述采集模板(1) 的宽和高分别是
200mm 和5mm,其长是300mm、100mm 或50mm。
4. 如权利要求2 所述的恢复系统,其特征在于:所述矩形槽(4) 的长和高分别是200mm
和0.5mm,其宽是2.2mm、3.2mm 或4.2mm。
5. 如权利要求2 或3 或4 所述的恢复系统,其特征在于:所述矩形槽(4) 是采用红
或绿的PMMA 有机玻璃制成,且其角度误差小于0.001 度。
6. 如权利要求5 所述的恢复系统,其特征在于:所述扫描仪(2) 是CanonScan 3200 型
扫描仪。
7. 一种应用权利要求1 所述恢复系统进行纸质条状碎片恢复的方法,其特征在于,该
方法包括以下步骤:
1) 碎片整理,根据条状碎纸的长度和宽度对其进行分类,选择与其尺寸适配的采集模
板(1) 和矩形槽(4),将其展平固定在适配的矩形槽(4) 中,得到固定有条状碎纸的采集模
板(1) ;
2) 信息扫描,使用扫描仪(2) 扫描固定有条状碎纸的采集模板(1),并将扫描所得数字
图像以BMP 格式进行保存;
3) 信息恢复,通过计算机(3) 上安装的碎纸拼接软件,对上步所得的数字图像进行处
理,使得已经被破坏的文本信息得以恢复,最后以BMP 格式进行保存;
所述采集模板(1) 是长方形的,其上均匀设置有用于镶嵌条状碎纸的矩形槽(4)。
8. 如权利要求7 所述的恢复方法,其特征在于:步骤2) 中扫描固定有条状碎纸的采集
模板(1) 时,该采集模板(1) 的直角边与扫描仪(2) 面板的直角边要完全契合,防止出现倾
斜,且一次性可以扫描多个该采集模板(1)。
9. 如权利要求7 或8 所述的恢复方法,其特征在于,对扫描所得的数字图像的处理过程
是:
a、二值化处理
对扫描所得的数字图像进行二值化处理,通过选取合适的阈值,将条状碎纸和采集模ppva
板(1) 有效地区分出来,即:设原始图像为f(x,y),二值化后的图像为g(x,y),则:
其中,Th 为图像的阈值;
b、去噪处理
二值化后的图像为g(x,y),噪声信号为n(x,y),去噪后的图像为e(x,y),则:
e(x,y) = g(x,y)-n(x,y) ;
c、碎片有效区域分割处理
由于扫描得的数字图像中包含有若干条随机排放顺序的条状碎纸,必须先将其独立分
割出来,通过图像投影的方法,设统计图像每一列白点数Li,其中i = 1,...n ;
通过确定的条状碎纸起始位置,沿着各个条状碎纸的边沿将其从整幅图像中分割出
来,并将其归一化,设置成标准化的条状纸带;
d、信息增强处理
采用图像增强的方法,即对图像进行腐蚀和膨胀运算,增强条状纸带中文字的信息量,
具体是设二值化图像为F,其连通域为x,结构元素为S,当一个结构元素S 的原点移动到图
像坐标(x,y) 处时,记为Sxy,则:
腐蚀运算:
膨胀运算:
e、条状碎纸拼接处理
采用相似度匹配的方法,对凌乱次序的条状碎纸进行拼接,即根据每张条状碎纸图像
的左、右边列处的信息,计算它与其他条状碎纸图像的左、右边列的相关性,根据最大相关
性的原则,将各个条状碎纸拼接在一起,最终得到的图像就是要恢复的原始文本信息,具体
是设每张纸带图中右列信息为Pici_R,右列信息的均值为左列信息为Pici_L,左列
信息的均值为C 为图像的相关系数,则:
最终得到完整的恢复后的原始文本信息。
碎纸机纸质条状碎片恢复系统及纸质条状碎片恢复方法
技术领域
[0001] 本发明属于图像处理以及信息复原技术领域,具体涉及一种碎纸机纸质条状碎片
恢复系统,本发明还涉及利用该恢复系统进行纸质条状碎片恢复的方法。
背景技术
[0002] 碎纸机在销毁办公文件的方式,为满足大多数政府机构、企业、等的保密需要而被
广泛应用。然而,在某些情况下,如错将重要的公司文件当做废弃文件处理成碎片的废纸;
被犯罪嫌疑人利用碎纸机销毁的与犯罪相关的各种文本文件,又需要将已经被破碎的文本
信息重新恢复。
[0003] 事实上,由于碎纸机的碎纸效果一般是以毫米(mm) 为单位的,破碎后所得到的往
往是碎状、条状、段状等效果。因此面对大量的、细小的、破碎的纸片,人们根本就无从下手,
因此,提供一种使得已被破碎的纸张恢复,得到其文本信息的技术十分必要。
发明内容
[0004] 本发明的目的是提供一种碎纸机纸质条状碎片恢复系统,以解决已被破碎的文件
的恢复问题。
[0005] 本发明的另一目的是提供利用上述恢复系统进行纸质条状纸片恢复的方法,同样
达到解决已被破碎的文件的恢复的问题。
[0006] 为达上述目的,本发明所采用的技术方案,一种碎纸机纸质条状碎片恢复系统,该
系统由用于将条状碎纸整理成标准化的条状纸带的采集模板、用于将采集模板上的条状纸
带转换为数字图像并保存原始的图像文件的扫描仪和对所述的图像文件进行处理使已被
破碎的文本信息恢复原样的计算机构成。
[0007] 本发明特点还在于,
[0008] 其中采集模板是长方形,其上沿径向均匀设置有用于镶嵌条状碎纸的矩形槽。
[0009] 其中采集模板的宽和高分别是200mm 和5mm,其长是300mm、100mm 或50mm。
[0010] 其中矩形槽的长和高分别是200mm 和0.5mm,其宽是2.2mm、3.2mm 或4.2mm。
[0011] 其中矩形槽是采用红或绿的PMMA 有机玻璃制成,且其角度误差小于0.001
度。
[0012] 其中扫描仪是CanonScan 3200 型扫描仪。
[0013] 本发明所采用的另一技术方案是,一种进行纸质条状碎片恢复的方法,该方法包
括以下步骤:
[0014] 1) 碎片整理,根据条状碎纸的长度和宽度对其进行分类,选择与其尺寸适配的采
集模板和矩形槽,将其展平固定在适配的矩形槽中,得到固定有条状碎纸的采集模板;
[0015] 2) 信息扫描,使用扫描仪扫描固定有条状碎纸的采集模板,并将扫描所得数字图
像以BMP 格式进行保存;
[0016] 3) 信息恢复,通过计算机上安装的碎纸拼接软件,对上步所得的数字图像进行处
理,使得已经被破坏的文本信息得以恢复,最后以BMP 格式进行保存;
[0017] 所述采集模板是长方形的,其上均匀设置有用于镶嵌条状碎纸的矩形槽。
[0018] 本发明特点还在于,
[0019] 步骤2) 中扫描固定有条状碎纸的采集模板时,该采集模板的直角边与扫描仪面
板的直角边要完全契合,防止出现倾斜,且一次性可以扫描多个该采集模板。
[0020] 对扫描所得的数字图像的处理过程是:
[0021] a、二值化处理
[0022] 对扫描所得的数字图像进行二值化处理,通过选取合适的阈值,将条状碎纸和采
集模板有效地区分出来,即:设原始图像为f(x,y),二值化后的图像为g(x,y),则:
[0023]
[0024] 其中,Th 为图像的阈值;
[0025] b、去噪处理
[0026] 二值化后的图像为g(x,y),噪声信号为n(x,y),去噪后的图像为e(x,y),则:
[0027] e(x,y) = g(x,y)-n(x,y) ;
[0028] c、碎片有效区域分割处理
[0029] 由于扫描得的数字图像中包含有若干条随机排放顺序的条状碎纸,必须先将其独
立分割出来,通过图像投影的方法,设统计图像每一列白点数Li,其中i = 1,...n ;
[0030]
[0031] 通过确定的条状碎纸起始位置,沿着各个条状碎纸的边沿将其从整幅图像中分割
出来,并将其归一化,设置成标准化的条状纸带;
[0032] d、信息增强处理
[0033] 采用图像增强的方法,即对图像进行腐蚀和膨胀运算,增强条状纸带中文字的信
息量,具体是设二值化图像为F,其连通域为x,结构元素为S,当一个结构元素S 的原点移动
到图像坐标(x,y) 处时,记为Sxy,则:
[0034] 腐蚀运算:
[0035] 膨胀运算:
[0036] e、条状碎纸拼接处理
[0037] 采用相似度匹配的方法,对凌乱次序的条状碎纸进行拼接,即根据每张条状碎纸
图像的左、右边列处的信息,计算它与其他条状碎纸图像的左、右边列的相关性,根据最大
相关性的原则,将各个条状碎纸拼接在一起,最终得到的图像就是要恢复的原始文本信息,
具体是设每张纸带图中右列信息为Pici_R,右列信息的均值为左列信息为Pici_L,
左列信息的均值为C 为图像的相关系数,则:
[0038]
[0039] 最终得到完整的恢复后的原始文本信息。
[0040] 本发明的有益效果是:
[0041] 1、能够有效恢复我国保密等级为一般销毁处理级别和部分秘密级别的文本信息,
并能有效恢复德国保密等级为第一级、第二级和部分第三级级别的文本信息;
企业国有产权转让管理暂行办法[0042] 2、本发明提供的一种碎纸机纸质条状碎片恢复系统及其方法,能够有效处理办公
场所常用的A4、16K、B5 等纸张类型被破碎后的重新恢复、获取文本信息;
[0043] 3、通过简单的操作流程使得信息恢复变得很容易。
附图说明mgs1
[0044] 图1 是本发明碎纸机纸质条状碎片恢复系统的硬件连接结构示意图;
[0045] 图2 是本发明恢复系统中采集模板的结构示意图;
[0046] 图3 是本发明恢复发方法中对扫描所得的数字图像进行处理的流程示意图。
[0047] 图中,1、采集模板;2、扫描仪;3、计算机;4、矩形槽。
具体实施方式
[0048] 下面结合附图及实施例对本发明作进一步说明:
[0049] 为了将已被破碎的碎纸机纸质碎片重新恢复,以得到原始的文本信息,本发明采
用的技术方案是:碎纸机纸质条状碎片恢复系统包括碎纸信息采集和碎纸信息处理两个部
分,采集部分由采集模板1 和扫描仪2 构成,将纸质的条状破碎信息转换成数字图像;处理
部分将采集到的数字图像通过相应的处理算法在计算机3 上进行自动恢复,将已经破碎的
文本信息重新恢复出来。其中,采集模板1 按照尺寸要求,将若干条已经破碎的条状碎片

定到相应位置上,通过该模板可以将散乱的、扭曲的碎片设置成标准化的条状纸带,以便进
行扫描和后续处理。扫描仪2 使用普通家用型的扫描仪,将模板以及上面的条状破碎信息
转换成分辨率很大的数字图像,并保存成原始的图像文件。在计算机3 上,通过编写好的处
理算法对扫描获得的数字图像进行处理,将若干已经破碎的文本信息重新组合在一起,恢
复其原本的模样,并将其以文件的形式保存在计算机3 上。
[0050] 我国的碎纸机行业的安全保密等级标准:OAS20368。按照其保密等级分为:绝
密( 碎纸效果:1.9×1.9mm-0.8×12mm,纸屑面积:≤ 10m m2,碎纸形状:沫状)、机密( 碎
纸效果:1.9×15mm-2×16mm,纸屑面积:≤ 32m m2,碎纸形状:粒状)、秘密( 碎纸效果:
3×30mm-4×30-80mm,纸屑面积:≤ 320mm2,碎纸形状:段状),一般销毁处理( 碎纸效
果:1.9mm-4mm,纸屑面积:≤ 1740m m2,碎纸形状:条状)。同期,进口碎纸机按照德
国保
密等级标准:DIN32757,一级保密( 条状:6.3-12mm),二级保密( 条状:3.9-5.8mm/ 粒状
6-10.5×40-80mm),三级保密( 条状:1.9mm/ 粒状3.9-6×25-53mm),四级保密( 粒状:
1.9-2×15mm),五级保密( 粒状:0.78×11mm),六级保密( 粒状:1×5mm)。
[0051] 基于以上因素,本实施例提供的碎纸机纸质条状碎片恢复系统,如图1 所示,由用
于将条状碎纸转化成标准化的条状纸带的采集模板1、用于将采集模板1 上的条状纸带转
换为数字图像并保存原始的图像文件的扫描仪2 和对所得的图像文件进行处理使已被破
碎的文本信息恢复原样的计算机3 构成。
[0052] 为了避免在整理过程中,零散、扭曲的纸质碎片在扫描时产生倾斜畸变,并提高扫
描的效率,使用采集模板1 可以同时固定20 ~ 30 张碎片,本实施例所提供的采集模板1
的材质选用普通的PMMA 有机玻璃,颜为红或绿,形状为长方形板型材,角度误差小
于0.001 度,如图2 所示,在采集模板1 上等间隔地挖出一系列相同尺寸的矩形槽4,使条
状碎纸能够刚好内嵌在这些矩形槽4 中,采集模板1 分为三种规格,第一种是:长300mm
、宽
200mm、高5mm 的长方形模板,第二种是:长100mm、宽200mm、高5mm 的长方形模板,第三种
是:长50mm、宽200mm、高5mm 的长方形模板。
[0053] 同时,考虑到所处理的条状碎片( 条状碎纸) 大小有所不同,以及条状碎片( 条状
碎纸) 存在毛刺边缘等问题,经过反复测试,确定矩形槽4 的尺寸也分为三种规格,即第一
种是:宽度2.2mm、高度0.5m ;第二种是:宽度3.2mm、高度0.5m ;第三种是:宽度4.2mm、高
度0.5m,这三种矩形槽4 的长度与采集模板1 的宽度相同,即都是200mm。
[0054] 该碎纸机纸质条状碎片恢复系统中使用的扫描仪2,本实施例选用的是日本佳能
公司的CanonScan 3200 型扫描仪,其基本参数包括,扫描元件:CCD,最大幅面:A4,光学分
辨率(dpi) :1200×2400,彩深度( 位) :48,接口:USB 2.0,类型:家用型,扫描速度:15
秒(600dpi),扫描介质:图片,文字,照片,光源:冷阴极管,支持操作系统:Windows 2
000 专
业版/WindowsXP 家庭版/ 专业版/Windows Vista 家庭版/ 专业版,电源电压:220 ~ 240V,
电源频率:50/60Hz,工作温度:5 ~ 35乌兹别克斯坦电影,工作湿度20% -80%,存储温度:-20 ~ 60存储
湿度10 ~ 90%。
[0055] 而计算机3 则选取通用型个人PC 机即可。
[0056] 利用上述恢复系统进行纸质条状纸片恢复的方法,主要是依靠安装在计算机3 中
的碎片恢复软件读取扫描图像,并对图像进行分割,将各个条状碎片( 条状碎纸) 转换成标
准化的纸带,按照其相关性进行拼接,最终复原成原始的文本信息,并将结果以图片的格式
存储在计算机3 上。
[0057] 其具体实施步骤是:
[0058] 步骤一,碎片整理,即按照碎片的尺寸对其进行分类,根据条状碎纸的长度选择第
一类( 长度300mm),第二类( 长度100mm),或第三类( 长度50mm) 的采集模板1,再根据

状碎片( 条状碎纸) 的实际宽度,选择不同的矩形槽4 的尺寸,即:第一类( 宽度2.2mm),
第二类( 宽度3.2mm),或第三类( 宽度4.2mm),将条状碎片( 条状碎纸) 固定到相应的矩
形槽4 内,固定时需要展平每张碎片,尽量避免出现褶皱、缺损等问题。一个采集模板1 一
次可以固定20 ~ 30 张碎片,扫描完毕后,该采集模板1 可以重复使用。通过采集模板1 使
用可以将大量散乱的、扭曲的碎片设置成标准化的条状纸带以便进行信息识别。
[0059] 步骤二,信息扫描,即使用扫描仪2 得到数字图像,扫描仪2 的分辨率设置为最大
值,在放置模板时,要将模板的直角边与扫描仪2 面板的直角边之间完全契合,以避免出现
可能的倾斜问题。扫描仪2 可以一次处理多个模板,进而提高工作效率。将扫描仪2 输出
的数字图像以BMP 格式保存。
[0060] 步骤三,信息恢复,即在计算机3 上,通过编写碎片恢复软件对扫描获的数字图像
进行处理,对文本信息重新恢复,并将恢复的结果保存为BMP 格式文件放在计算机3 上。
[0061] 其中,碎纸拼接软件对扫描所得的数字图像的处理过程如图3 所示,
[0062] 1、二值化处理( 图像二值化)
[0063] 由于碎片的边缘上存在许多不规则的毛刺,这些干扰对信息辨识和恢复影响很
大,首先对图像进行二值化处理,通过选取合适的阈值,将碎片和模板有效地区分出来,即:
设原始图像为f(x,y),二值化后的图像为g(x,y)。
[0064]
[0065] 其中,Th 为图像的阈值。
[0066] 2、去噪处理( 图像去噪)
[0067] 由于二值化后的图像存在较多的噪声点,这些噪点对于之后的碎片识别会有很糟
的影响,所以,需要对整幅图像进行去噪处理,将分布散乱的白噪点去除掉。即:设二值化
后的图像为g(x,y),噪声信号为n(x,y),去噪后的图像为e(x,y),则:
[0068] e(x,y) = g(x,y)-n(x,y)。
[0069] 3、碎片有效区域分割处理( 图像分割)
[0070] 由于扫描得的数字图像中包含有若干条随机排放顺序的碎片,必须先将其独立分
割出来。通过图像投影的方法,设统计图像每一列白点数Li,其中i = 1,...n。
[0071]
[0072] 通过确定的碎片起始位置,沿着各个碎片的边沿将其从整幅图像中分割出来,并
将其归一化,设置成标准化的条状纸带。
[0073] 4、信息增强处理( 图像增强)
大浴女 小说[0074] 由于图像扫描、去噪等处理使得分割之后的文字信息存在一定的缺损,因此,采用
图像增强的方法,即对图像进行腐蚀和膨胀运算,增强纸带中文字的信息量。设二值化图像
为F,其连通域为x,结构元素为S,当一个结构元素S 的原点移动到图像坐标(x,y) 处时,
记为Sxy。
[0075] 其中:
[0076] 腐蚀运算用表示,其定义为:
[0077] 该公式说明,S 对F 进行腐蚀是所有S 中包含于F 的点Sxy 的集合的平移;
[0078] 膨胀运算用表示,其定义为:
[0079] 该公式说明,S 对F 进行膨胀是所有位移点Sxy 的集合。
[0080] 5、碎片拼接处理( 图像匹配)
[0081] 采用相似度匹配的方法,对凌乱次序的碎片进行拼接。即:根据每张纸带图像左、
右边列处的信息,计算它与其他纸带图像左、右边列的相关性,根据最大相关性的原则,将
各个纸带拼接在一起,最终得到的图像就是要恢复的原始文本信息。设每张纸带图中右列
信息为Pici_R,右列信息的均值为左列信息为Pici_L,左列信息的均值为C
为图像的相关系数。
[0082]
[0083] 通过以上步骤和处理过程,实现对已被碎纸机破碎的条状碎片( 条状碎纸) 的整
理、识别,最后使其文本信息得以恢复。
[0084] 透过上述碎纸机纸质条状碎片恢复系统及利用该恢复系统进行纸质条状纸片恢
复的方法,能够有效恢复我国保密等级为一般销毁处理级别和部分秘密级别的文本信息,
并能有效恢复德国保密等级为第一级、第二级和部分第三级级别的文本信息。而且能够有
二阶低通滤波器
效处理办公场所常用的A4、16K、B5 等纸张类型被破碎后的重新恢复、获取文本信息。通过

本文发布于:2024-09-21 22:44:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/3649.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:条状   恢复   碎片   碎纸
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议