我们平时熟知常用的文档格式最多的,当数 excelword 或者 ppt 之类了。

好用不,肯定是好用的很,可以说有钱的使 Office ,没钱的使 WPS ,不用争选谁都行,基本上能做到各取所需、物尽其用,如此相安无事、万事大吉。

不过总有老革命遇到新问题的时候,偏偏就存在着这么一种文档格式 pdf ,偏偏就有人喜欢不能被随便编辑的 pdf 格式,而又非要想方设法地去做些文档内容的改动,您说这得吃多少才能撑成这样。

比如,有位小伙伴就问我了,能不能将两份 pdf 文档给拼接上,最后形成一份包含两份内容的 pdf 文档。

我想了一想,发现手头上的这些个 office 之类的软件都只能打开查看 pdf 文档,好像并没有可以修改编辑的功能啊。

这问题一提出来,结果就是不管是外国月亮更圆的 Office 也好, 还是打着国产旗号的 WPS 也罢,都无用武之地,成了中看不中用的摆设了。


要说 pdf 能不能编辑,那肯定能啊,要不怎么创建生成的?

问题是,要想编辑修改 pdf ,需要购买专门编辑 pdf 文档的软件。

你想要拥有这样的功能,那就得付费!

可是人生在世,事情总有个万一,万一我就想编辑一下 pdf 又不想花钱,这可怎么整?

你要是有钱任性,后面的话就当我没说哈,直接扫那个二维码,微信支付宝花呗啥的您随意。

要是你口袋空空比脸还干净,那我劝你还是耐着性子接着听我吹。

其实吧,我主要是给小白们脱贫来着,看用什么好办法才能达成拼接 pdf 的目的。


使用开源工具软件

在这里先给小伙伴们介绍一款我们小白都用得起的开源软件 PDFsam

GitHub 链接:https://github.com/torakiki/pdfsam


PDFsamJava 编写,主要是用来分割、合并或旋转既有 pdf 文件的,官方个人版免费开源,对我们小白的荷包非常友好。

虽然它有官网 pdfsam.org ,但是我还是建议大家到 GitHub 的 Release 页面上下载。

下载页面:https://github.com/torakiki/pdfsam/releases

当前版本 4.2.7 ,找那个带 msi 后缀的,可以直接在 Windows 下安装使用。


安装

和平常的程序安装并无两样,一路耐可斯特即可。

安装步骤中有一步可选语言,建议选择简体中文,这也是开源软件的好处之一,支持多语言。


使用

安装完成后我们打开 PDFsam ,界面上呈现给我们的是几大功能模块,一般能用到的有分割、合并、旋转等等。

目前我们只想要合并两个 pdf 文档,所以选择合并那个模块来试试看。


进入合并模块后,我们点击添加按钮添加需要加工的两个文档,我们可以看出软件支持同时合并多个文档。


往下滚动界面,在下方的合并设置中,PDFsam 默认输出结果放在了当前目录中,并以 PDFsam_merge.pdf 来命名导出文件,当然你也可以改成你喜欢的名字。

最后按下左下角的运行按钮,不一会儿就可以得到合并后的文档了。


此处我以网上新民晚报的部分 pdf 内容页为例,来演示合并后的效果。

合并前的单页报纸。


合并后的两页报纸。


效果OK,完美完成任务!

当然这款开源软件还不止是合并拼接这一单纯功能,至于其他一些诸如分割等等功能也是值得我们仔细研究了解的。

不过它是用 Java 写成的,这个我就不懂了,所以我在网上找了找有没有 VB 写的可实现功能的程序代码。


另一位大神的 VB 程序

当我尝试看看是不是能自己通过 VB 代码来实现 pdf 拼接功能时,还真查找到了一位大神的代码。

项目链接:https://github.com/Brad-Skidmore/MergePDF


代码功能只有一个,就是实现多个 pdf 拼接。

不过它同时也提供批处理命令行支持,也就是可以通过命令行方式来操作文档的拼接。

虽然功能可以实现,但是它需要事先安装 Acrobat PDF ,也就是可用于编辑 PDF 文档的那套软件。

原理就是它调用了其中的组件来获得编辑文档的功能。


我从 GitHub 克隆了大神的代码,打算研究一下,可惜下载后根本无法正常打开项目,总是报窗体加载错误,具体原因不明。

经过我嘁哧咔嚓一番修补改动,嘿,终于将项目成功修复了!

界面文字也被我修改为中文,方便理解。


程序功能没啥问题,只是它最最关键的还是前面说的它离不开 Acrobat PDF 库的支持。


如果单纯将这个程序放到没有安装 Acrobat PDF 库的系统中,那它就无法正常工作了。

就像下面这样,会出错。


嗯,缺点显而易见,与之前介绍的开源软件相比,看样子扩展性不咋地哈,只能说仅供参考,学习学习它的代码还行。

在此仅提供新修正的可执行文件供大家使用。


MergePDF.7z(67.8K)

下载链接:https://pan.baidu.com/s/1HLvl9F98Ypa8L20KD9EvBQ

提取码:

输入阅读密码,解锁隐藏内容...



★扫码关注公众号, 发送【000876】获取阅读密码


写在最后

有的小伙伴可能会说,网上有很多拼接 pdf 文档的软件,还有不少在线提供此功能的网站,为什么没提到呢?

其实我在查找资料的时候也注意到了,此类软件或站点真的是多如牛毛、五花八门,不仅多,而且功能丰富并且强大。

不过,很多场景下,有可能不允许我们直接通过这些方式使用它,我们有时需要考虑的不仅仅是功能的实现,比如应该考虑信息安全方面的问题。

当你上传文档时,是否事先考虑过文档泄露或被他人非法篡改或利用的风险呢?

还有一些网上下载的软件,也有可能包含病毒木马后门广告之类的隐患。

基于此,我个人感觉还是自己写代码比较靠谱,如因水平所限,那么请出大神开源代码也是可行的,毕竟能看到代码有没有加料嘛。

如此一来,不仅可以保证安全地实现所需功能,同时也可以学习到新东西,可谓一举两得啊!


扫码关注@网管小贾,阅读更多

网管小贾的博客 / www.sysadm.cc



暂无评论

登录并提交评论

© 2020-present 网管小贾 | 微信公众号 @网管小贾
许可协议:CC-BY-NC 4.0 | 转载文章请注明作者出处及相关链接