批量将下载的公众号文章html转pdf,合并pdf文件
最近用python写了个html转换工具html2pdf.exe https://wwk.lanzouf.com/iSpV90fbtpqh,代码如下:def to_pdf():
import pdfkit
htmls = []
for root, dirs, files in os.walk('.'):
for name in files:
if name.endswith(".html"):
print(name)
try:
pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
except Exception as e:
print(e)
工具依赖wkhtmltopdf,先从https://wkhtmltopdf.org/downloads.html 下载,然后将wkhtmltopdf.exe加入环境变量,直接运行html2pdf.exe,导出的pdf文件在pdf目录:
然后用这个pdf合并工具 https://wwn.lanzouf.com/irAGD089czyj 将所有pdf合成一个文件,比如我将莫言老师的所有文章合成了一个pdf文件,看文章方便多了:
按步骤来做了,但是打开第一个exe程序就闪退了。 网页上图片较多时,加载有延迟的所有图片,转成Pdf后,图片都无法显示,不知如何解决 这个可以有,可以单独现在某一篇,也可以批量下载。我在CSDN下载就用过这种方法 好东西,值得收藏 感谢楼主分享 谢谢楼主 非常好的分享,把软件wkhtmltopdf.exe加入环境变量有什么需要注意的吗? 谢谢楼主的分享 收藏了,感谢楼主分享。我还需要好好钻研一下 这个我感觉还是蛮好的。
页:
[1]