灌水王 发表于 2022-12-9 11:48:19

批量将下载的公众号文章html转pdf,合并pdf文件

最近用python写了个html转换工具html2pdf.exe https://wwk.lanzouf.com/iSpV90fbtpqh,代码如下:

def to_pdf():
    import pdfkit
    htmls = []
    for root, dirs, files in os.walk('.'):
   for name in files:
      if name.endswith(".html"):
       print(name)
       try:
      pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
       except Exception as e:
      print(e)

工具依赖wkhtmltopdf,先从https://wkhtmltopdf.org/downloads.html 下载,然后将wkhtmltopdf.exe加入环境变量,直接运行html2pdf.exe,导出的pdf文件在pdf目录:


然后用这个pdf合并工具 https://wwn.lanzouf.com/irAGD089czyj 将所有pdf合成一个文件,比如我将莫言老师的所有文章合成了一个pdf文件,看文章方便多了:


华都水晶 发表于 2022-12-9 11:48:36

按步骤来做了,但是打开第一个exe程序就闪退了。

灌水王 发表于 2022-12-9 11:49:14

网页上图片较多时,加载有延迟的所有图片,转成Pdf后,图片都无法显示,不知如何解决

hunian881z 发表于 2022-12-9 11:49:35

这个可以有,可以单独现在某一篇,也可以批量下载。我在CSDN下载就用过这种方法

灌水王 发表于 2022-12-9 11:50:18

好东西,值得收藏

ilyforever 发表于 2022-12-9 11:50:42

感谢楼主分享

灌水王 发表于 2022-12-9 11:51:12

谢谢楼主

灌水王 发表于 2022-12-9 11:51:57

非常好的分享,把软件wkhtmltopdf.exe加入环境变量有什么需要注意的吗?

readychen 发表于 2022-12-9 11:52:48

谢谢楼主的分享

灌水王 发表于 2022-12-9 11:53:17

收藏了,感谢楼主分享。我还需要好好钻研一下

灌水王 发表于 2022-12-9 11:53:25

这个我感觉还是蛮好的。
页: [1]
查看完整版本: 批量将下载的公众号文章html转pdf,合并pdf文件