pip install PyMuPDF |
#批量将PDF文件转为图片 |
import fitz |
import glob |
import os |
image_path = "图片\\" #存放图片的文件夹 |
PDFfiles = glob.glob( "PDF文件\\*.pdf" ) #获取所有pdf文件的文件名 |
for PDFfile in PDFfiles: #遍历所有PDF文件 |
PDFdoc = fitz. open (PDFfile) #读取PDF文件 |
folder_name = PDFfile.split( "\\")[-1].split(" .")[ 0 ] #按源文件名新建文件夹 |
for pg in range (PDFdoc.pageCount): #根据PDF的页数,按页提取图片 |
page = PDFdoc[pg] |
#增强图片分辨率 |
zoom_x = 3 #水平方向 |
zoom_y = 3 #垂直方向 |
mat = fitz.Matrix(zoom_x, zoom_y) |
pix = page.getPixmap(matrix = mat) |
#按原PDF名称新建文件夹并按顺序保存图片 |
if not os.path.exists(image_path + folder_name): #判断文件夹是否已存在 |
os.makedirs(image_path + folder_name) #不存在则新建,存在就跳过这行 |
pix.writeImage(image_path + folder_name + "\\{}.png" . format ( str (pg + 1 ))) #按PDF中的页面顺序命名并保存图片 |