cbz汇编_CBZ和DjVu:PDF的开源替代品

cbz汇编_CBZ和DjVu:PDF的开源替代品
cbz汇编
最近,我发现我的曾曾祖⽗在20世纪之交写了两本书:⼀本是关于航⾏的,另⼀本是关于他担任职业 。 这些书吸引了⼀些听众,但由于它们是我家族历史的⼀部分,因此我想保留每本书的数字副本。 但是,我想知道哪种便携式⽂档格式最适合这种⼯作?
我很早就决定不要使⽤PDF。 该格式虽然适⽤于印前检查,但似乎注定是不间断的功能膨胀,并且会产⽣难以内省和编辑的⽂档。 我想要⼀种具有类似功能的更智能格式。 我想到了两个:漫画档案和DjVu。
漫画档案
顾名思义,漫画是⼀种最常⽤于的简单格式。 您可以在和等⽹站上看到漫画档案的⽰例。
漫画档案库的最⼤功能也是它的最弱之处:它是如此简单,⼏乎是⼀种约定,⽽不是⼀种格式。 实际上,漫画档案只是扩展名
为.cbz,.cbt,.cb7或.cbr的ZIP,TAR,7Z或RAR档案。 它没有⽤于存储元数据的标准。
但是,它们很容易创建。
创建漫画档案
1. 创建⼀个包含图像⽂件的⽬录,然后重命名图像,使它们具有固有顺序:
$ n=0 && for i in *.png ; do mv $i `printf %04d $n`.png ; ((n+=1)); done
2. 使⽤您喜欢的存档⼯具存档⽂件。 以我的经验,最好地⽀持CBZ。
$ zip comicbook.zip -r *.png
3. 最后,使⽤适当的扩展名重命名该⽂件。
$ mv comicbook.zip comicbook.cbz
试题研究
⽣成的⽂件应在⼤多数设备上打开。 在Linux上, 和都可以打开CBZ⽂件。 在Android上, 和可以打开它们。
解压缩漫画档案
从漫画档案中恢复数据也很容易:只需取消存档CBZ⽂件。
由于您喜欢的存档⼯具可能⽆法将.cbz扩展名识别为有效的存档,因此最好将其重命名为其本机扩展名:
$ mv comicbook.cbz comicbook.zip
$ unzip comicbook.zip
DjVu
(发⾳为“déjàvu”)是AT&T于20年前开发的⼀种更⾼级的格式。 这是⼀种具有⾼级压缩技术的数字⽂档格式,可以在您可能没有意识到的更多应⽤程序中查看,包括 , ,在线 , Firefox 器扩展, ,Android上的以及开源,Sourceforge上的跨平台查看器。
您可以在阅读有关DjVu的更多信息并到⽰例.djvu⽂件。
中国免疫学杂志DjVu具有⼏个吸引⼈的功能,包括图像压缩,轮廓(书签)结构以及对嵌⼊式⽂本的⽀持。 使⽤免费和开源⼯具很容易进⾏内部检查和编辑。
安装DjVu
开源⼯具链是 ,您可以在发⾏版的软件存储库中到它。 例如,在Fedora上:
波罗的海三国$ sudo dnf install djvulibre
创建⼀个DjVu⽂件
时间统计法.djvu是已被编码为DjVu⽂件的图像。 .djvu可以包含⼀个或多个图像(存储为“页⾯”)。
要⼿动⽣成DjVu,可以使⽤以下两种编码器之⼀: c44⽤于⾼质量图像, cjb2⽤于简单双⾊调图像。 每个编码器接受不同的图像格式:c44可以处理.pnm或.jpeg⽂件,⽽cjb2可以处理.pbm或.tiff图像。
如果需要预处理图像,可以在终端中使⽤ ,使⽤-density选项定义所需的分辨率:
$ convert -density 200 foo.png foo.pnm
然后,您可以将其转换为DjVu:
$ c44 -dpi 200 foo.pnm foo.djvu
如果图像很简单,例如⽩页上的⿊⾊⽂本,则可以尝试使⽤较简单的编码器进⾏转换。 如有必要,请先使⽤Image Magick将其转换为兼容的中间格式:监狱法全文
$ convert -density 200 foo.png foo.pbm
然后将其转换为DjVu:
$ cjb2 -dpi 200 foo.pbm foo.djvu
您现在有了⼀个简单的单页.djvu⽂档。
创建多页DjVu⽂件
尽管单页DjVu很有⽤,但鉴于DjVu有时具有出⾊的压缩效果,它最常⽤作多页格式。
假设您有许多.djvu⽂件的⽬录,则可以使⽤djvm命令将它们捆绑在⼀起:
$ djvm -c pg_1.djvu two.djvu 003.djvu mybook.djvu
与CBZ存档不同,捆绑映像的名称对其DjVu⽂档中的顺序没有影响,⽽是保留了您在命令中提供的顺序。 如果您有先见之明以⾃然的排序顺序(001.djvu,002.djvu,003.djvu,004.djvu等)命名,则可以使⽤通配符:
$ djvm -c *.djvu mybook.djvu
处理DjVu⽂档
使⽤djvm编辑DjVu⽂档很容易。 例如,您可以将页⾯插⼊到现有的DjVu⽂档中:
$ djvm -i mybook.djvu newpage.djvu 2
在此⽰例中,页⾯为newpage。djvu成为⽂件mybook.djvu中的新页⾯2。
您也可以删除页⾯。 例如,要从mybook.djvu删除第4页:
$ djvm -d mybook.djvu 4
设定轮廓
您可以将元数据添加到DjVu⽂件中,例如⼤纲(通常称为“书签”)。 若要⼿动执⾏此操作,请创建带有⽂档轮廓的纯⽂本⽂件。 DjVu ⼤纲以类似的结构表⽰,带有开头的书签元素,后跟书签名称和页码:
(bookmarks
("Front cover" "#1")
("Chapter 1" "#3")
("Chapter 2" "#18")
("Chapter 3" "#26")
价调基金)
括号定义轮廓中的级别。 ⼤纲当前只有顶级书签,但是任何部分都可以通过延迟其右括号来包含⼦部分。 例如,为第1章添加⼀个⼩节:
(bookmarks
("Front cover" "#1")
("Chapter 1" "#3"
("Section 1" "#6"))
("Chapter 2" "#18")
("Chapter 3" "#26")
)
⼤纲完成后,保存⽂件,并使⽤djvused命令将其应⽤于DjVu⽂件:
$ djvused -e '' -s mybook.djvu
打开DjVu⽂件以查看轮廓。
嵌⼊⽂字
如果要存储要创建的⽂档的⽂本,可以将⽂本元素( djvused术语中的“隐藏⽂本”)嵌⼊DjVu⽂件中,以便Okular或DjView之类的应⽤程序可以选择⽂本并将其复制到⽤户剪贴板中。
这是⼀个复杂的操作,因为要嵌⼊⽂本,必须⾸先拥有⽂本。 如果您可以访问良好的OCR应⽤程序(或转录打印页⾯的时间和精⼒),则可能会有该数据,但是必须将⽂本映射到位图图像。
⼀旦有了每⾏(或者,如果愿意,每个单词)的⽂本和坐标,就可以为每个页⾯编写⼀个带有块的djvused脚本:

本文发布于:2024-09-20 23:36:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/646992.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:PLC期末试卷7
标签:图像   具有   书签   功能   漫画   存档   轮廓   档案
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议